|
|
Методы прогнозирования дефолтов клиентов в условиях массового потребительского кредитования ("Банковское кредитование", 2006, N 4)
"Банковское кредитование", 2006, N 4
МЕТОДЫ ПРОГНОЗИРОВАНИЯ ДЕФОЛТОВ КЛИЕНТОВ В УСЛОВИЯХ МАССОВОГО ПОТРЕБИТЕЛЬСКОГО КРЕДИТОВАНИЯ
Рост потребительского кредитования намного опережает другие направления банковского бизнеса, однако кредитные риски банков еще не поддаются корректной оценке и прогнозированию. В данной статье приводятся методики, позволяющие предвидеть дефолты клиентов в условиях массового потребительского кредитования.
Бум потребительского кредитования в России
В условиях устойчивого макроэкономического подъема в России наблюдается бум потребительского кредитования. Однако при всех положительных чертах такого явления нельзя не замечать его опасности в плане финансовых рисков. Эта сфера кредитования намного опережает другие направления банковского бизнеса. По данным специалистов Ассоциации российских банков даже при сегодняшних 70-процентных темпах роста этого вида услуг существующий спрос населения на них удовлетворяется только на 15%. Это значит, что потребительское кредитование не только выгодный, но и опасный бизнес, или, как считают многие специалисты, "бомба замедленного действия". Действительно, кредитные риски банков пока не поддаются корректной оценке и прогнозированию. Поэтому через 1 - 2 года возможно, что очередной банковский кризис произойдет из-за массовых отказов погашения потребительских кредитов, все предпосылки для этого имеются [8]. Так, в одном из своих интервью председатель Правления Сбербанка А. Казьмин заявил о том, что многие банки (и Сбербанк в том числе) уже истратили 75% своих средств на потребительское кредитование. Его это очень беспокоит, поскольку такие банки становятся весьма чувствительными к различным негативным явлениям, особенно к экономическому спаду. Главной проблемой банков при массовом потребительском кредитовании населения является присущая этому бизнесу неопределенность. Кому давать кредит и на каких условиях? Как отличать ответственных клиентов от мошенников? Такие вопросы возникают из-за асимметричности информации, когда банк имеет гораздо меньше сведений о клиенте, чем тот способен о себе сообщить [5]. Это значит, что клиент может утаить негативные данные о себе и тем самым обмануть банк. Заметим, что эта неопределенность принимает для банка денежное выражение. Последнее Соглашение Базельского комитета (Basel II) рекомендует использовать при кредитовании подход IRB, основанный на внутренних рейтингах (Internal Raitings-based Approach) в следующем виде:
- построение внутренних кредитных рейтингов; - оценка кредитоспособности заемщиков и присвоение им рейтингов; - вычисление для каждого заемщика вероятности его дефолта; - оценка задолженности заемщика в момент его дефолта; - оценка доли невозвращенных активов при дефолте; - срок погашения задолженности. Отметим, что в описанном порядке вопрос прогнозирования дефолта заемщика в прямом виде не отражен, что было бы крайне необходимо. Действительно, полученные оценки дефолтов заемщиков (в том числе и на основе внутренних рейтингов) характеризуют их поведение в прошлом, поэтому механически проецировать "старые" оценки на будущее совсем не корректно. Это значит, что при выдаче очередного кредита полученные на основе исторических данных о поведении заемщиков оценки их дефолтов надо прогнозировать, что требует соответствующего математического инструментария. В случае недостатка или полного отсутствия информации о клиенте при оценке риска невозврата им кредита можно сравнивать его поведение с поведением других клиентов со сходными характеристиками, которые ранее пользовались услугами этого банка. Разумеется, такая групповая оценка дефолта должна прогнозироваться, и, если в экономике страны за время прогноза не произойдет существенных изменений, прогноз дефолта данного заемщика будет вполне достоверным. В условиях ограниченной статистической информации о клиентах собирать у банков - членов бюро кредитных историй (БКИ) только негативную информацию о заемщиках и предоставлять в БКИ лишь позитивную информацию о них по усмотрению банка является недопустимой роскошью, так как при этом теряется огромный и очень важный пласт сведений о клиентах. Негативная информация о клиентах является однобокой и неполной даже в силу того, что обратившихся в банк дисциплинированных людей всегда намного больше, чем недисциплинированных. С точки зрения математических методов оценки дефолтов клиентов, и положительная, и негативная информация о конкретном человеке не только одинаково важны, но и необходимы. Оценка дефолта заемщика только по одной неблагоприятной информации о нем (как это приходится делать сейчас) с математической точки зрения абсолютно некорректна и поэтому бессмысленна. Таким образом, использование оценок дефолтов клиентов без их прогноза нецелесообразно, ибо это ведет к серьезным ошибкам. Поэтому в данной статье рассмотрены и рекомендованы к внедрению методы практической математики в области прогнозирования ХСП (характеристик случайных процессов), описывающих дефолты заемщиков.
Практические методы прогнозирования дефолтов клиентов в условиях массового потребительского кредитования
Известно, что для прогнозирования дефолтов клиентов необходимо сначала получить предварительные оценки случаев их неплатежей на основе имеющихся данных о прошлом поведении. В одной статье невозможно рассмотреть и методы оценки дефолтов клиентов, и методы прогнозирования этих оценок, поэтому займемся только методами их прогнозирования. Разумеется, существуют также способы оценки дефолтов клиентов в самых различных условиях, о чем многократно сообщалось в ведущих российских банковских журналах [1 - 9]. 1. Методы прогноза по функциям распределения в условиях ограниченной исходной информации. Известно, что исчерпывающей характеристикой любого случайного процесса является его функция распределения (ФР). Это значит, что если у исследователя имеются реализации, например, времени до дефолта клиента или реализации финансовых потерь кредитора от дефолта клиента, то построение соответствующей ФР становится возможным. Если тех или других реализаций много, то ФР строится очень легко по общеизвестным методам математической статистики. В зависимости от желания исследователя ФР может быть построена в интегральном (кумулятивном) виде или в дифференциальном (плотностном) виде. Прогноз времени до дефолта клиента осуществляется по максимуму плотности соответствующей ФР. Но в реальной действительности большого количества реализаций (тем более по одному клиенту) практически не бывает, что требует для оценки и прогноза дефолта клиента использовать специальные методы построения ФР. Построение ФР по малым выборкам возможно с помощью иного, принципиально отличающегося от классического, подхода, основанного на использовании априорной информации в виде, например, пределов существования ФР, которые в данном случае известны. То есть при построении ФР времени до дефолта клиента - это закрепленные в договоре сроки кредита, а при построении ФР финансовых потерь кредитора от дефолта клиента - это размер выданного кредита. Важную роль играет то, что данная случайная величина здесь не возводится в некий абсолют, ей не приписывается бесконечная плотность распределения, а считается, что она - не единственно возможная (хотя и наиболее вероятная), и по соседству с ней могла возникнуть другая случайная величина, то есть в некоторой окрестности наблюдаемой случайной величины ее плотность не равна нулю. Поэтому на наблюдаемом значении случайной величины строится не дельта-функция, а некоторая непрерывная функция, называемая "функцией вклада", или ядром. К. Фукунага и Парзен исследовали теоретические и практические аспекты построения ФР по малым выборкам и предложили 6 видов ядер. В бывшем СССР методы построения ФР по малым выборкам разработали В.В. Чавчанидзе и В.А Кусмишвили, а позднее и другие ученые. Рассмотрим теперь практическое применение описанного метода. Пусть количество реализаций n = 0. Казалось бы, говорить о построении какой-то ФР нет смысла. Однако это не так. Отсутствие реализаций случайной величины говорит о том, что в данном случае не отдается предпочтения ни одной реализации, что, в свою очередь, говорит о наличии равномерного распределения с параметрами: - средние выборочные M1 = T/2, M2 = Q/2, где M1 - среднее время до дефолта клиента; M2 - средние финансовые потери кредитора от дефолта клиента; T - срок кредита; Q - максимум финансовых потерь кредитора от дефолта клиента; - плотности вероятности дефолта f(t) = 1/T или f(q) = 1/Q, где t, q - текущее время или финансовые потери; - интегральные ФР F(t) = t/T, F(q) = q/Q. Описанный случай отсутствия статистической информации о клиенте (n = 0) известен среди специалистов как 50% на 50% (fifty-fifty). Для снижения неопределенности в этом случае целесообразно строить ФР дефолта клиента, привлекая для этого данные о других клиентах с похожими характеристиками. В результате получаем ФР дефолта для группы клиентов с одинаковыми характеристиками. Эту ФР можно использовать и для прогноза дефолта клиента, о котором нет никакой предварительной информации. При наличии таких данных для прогноза дефолта этого клиента можно построить ФР по одной его реализации (n = 1), по двум реализациям (n = 2) и т.д. Опуская детальные математические выкладки, которые можно найти в [1, 6], запишем общее выражение для построения экспериментальной ФР дефолта клиента при ограниченной исходной информации о нем с использованием метода прямоугольных вкладов:
n f (x) = [1 / (n + 1)][f (x) + SUM пси (x)], n 0 i=1 xi
где f (x) - плотность распределения дефолта клиента по n n реализациям; f (x) - плотность распределения дефолта клиента при n = 0; 0 пси - функция "прямоугольного вклада" с основанием d и xi точкой x в центре основания; i x - время до дефолта или финансовые потери кредитора. Возможно применение для построения ФР дефолтов клиентов и других известных методов из этой группы, таких, как "Метод снижения неопределенности", "Метод Фишбейна", "Метод Джонсона" и др. [1, 6]. Проведенное моделирование с использованием критерия согласия Мизеса показало, что при n = 1 вероятность выявления вида ФР Р = 0,25; при n = 3 Р = 0,6; при n = 8 Р = 0,9 и т.д. 2. Метод адаптивной фильтрации. Если исследователь использует в качестве прогнозирующей функции модель суммы наблюдений, то коэффициенты при наблюдениях (их также называют "весами") целесообразно находить методом адаптивной фильтрации. Поиск оптимальных весов наблюдений - это градиентный метод крутого спуска. Суть его заключается в выборе начальной точки и движении к минимуму ошибки прогноза за счет итерационных уточнений весов наблюдений. Опуская промежуточные выкладки [1, 6], имеем:
W' = W + 2kдельтаX,
где W', W - скорректированный и существующий вектор весов наблюдений; k - "обучающая" константа; дельта - ошибка прогноза; X - вектор наблюдений. 3. Метод использования закона распределения Пуассона. Известно, что в принципе дефолт клиента является редким случайным событием. В то же время в математике есть закон распределения Пуассона, который также называется законом редких событий. Учитывая то, что дефолт одного клиента не зависит от дефолта другого, применение для прогноза дефолтов закона распределения Пуассона возможно и корректно, особенно при прогнозе количества дефолтов среди ряда заемщиков одного банка. Закон Пуассона табулирован, что облегчает расчеты прогнозируемых значений дефолтов клиентов. Аналитическое выражение закона Пуассона имеет вид:
k -лямбда Р(Д = к) = (лямбда e ) / k!,
где Р(Д = к) - вероятность возникновения k дефолтов Д; лямбда - интенсивность появления дефолтов. Пусть, например, лямбда = 0,5. Тогда вероятность отсутствия дефолтов (для к = 0) Р = 0,6065, вероятность одного дефолта (для к = 1) Р = 0,3033, для к = 2 Р = 0,0758, для к = 3 Р = 0,0126, для к = 4 Р = 0,0016 и для к = 5 Р = 0,0002. Заметим, что сумма вероятностей всегда равна 1. Прогноз дефолтов клиентов осуществляется по дискретной ФР Пуассона. 4. Метод движущейся средней. В случае стационарности протекающих дефолтных процессов для прогноза можно использовать метод движущейся средней в виде:
S = (1/n)(X + X + ... + X ), t+1 t t-1 t-n+1
где S - прогнозируемое значение; t+1 X - имеющиеся реализации дефолтов; t n - количество используемых реализаций в движущейся средней. 5. Метод полиномов. В определенных ситуациях для прогноза дефолтов клиентов можно использовать метод полиномов. Запишем общие выражения для прогноза при различных количествах имеющихся наблюдений n:
n = 1 S = X , t+1 t
n = 2 S = 2X - X , t+1 t t-1
n = 3 S = 3X - 3X + X и т.д. t+1 t t-1 t-2
6. Методы экспоненциального сглаживания. Экспоненциальное сглаживание (ЭС) означает сглаживание наблюдений с весами, экспоненциально падающими от последнего наблюдения к первому. Впервые методы ЭС использовал Браун (R.G. Brown) для поиска подводных лодок противника [11]. В методах ЭС используется предположение, что прогнозируемое значение некоторой функции может быть выражено рядом Тейлора. Члены ряда Тейлора выражаются формулами ЭС 1, 2, ... порядка. Выражение метода ЭС для любого количества наблюдений имеет вид:
2 S = альфаX + альфа(1 - альфа)X + альфа(1 - альфа) X + t+1 t t-1 t-2
3 + альфа(1 - альфа) X + ... t-3
На практике наиболее часто используется метод ЭС 1-го порядка, который имеет вид:
S = альфаX + (1 - альфа)S , t+1 t t
где S - предыдущий прогноз. t Центральным моментом при работе по этому методу является выбор постоянной ЭС в диапазоне 0 <= альфа <= 1. Наилучшим способом поддержания оптимального значения постоянной ЭС при прогнозе является автоматическое управление, когда на каждом шаге прогноза рассчитывается новое значение этой величины. Можно также использовать следящий сигнал, по величине которого имеет смысл судить об эффективности осуществляемого прогноза. 7. Метод автокорреляции. Этот метод использует корреляционную функцию процесса, значения которого прогнозируются. Наилучшим прогнозом здесь является текущее значение случайного процесса, взятое в масштабе exp(-альфаt):
S = альфаX exp(-альфаt), t+1 t
где t - заданный период прогноза; альфа = 1/T, где T - время корреляции процесса. 8. Методы авторегрессии. Теоретической основой методов прогноза на основе уравнений авторегрессии (АР) являются труды А.Н. Колмогорова, который показал, что любое будущее значение несингулярной случайной последовательности может быть представлено линейной комбинацией ее предыдущих членов. Ученый показал, что ошибка прогноза в этом случае имеет предел, и нашел выражение для этого предела [12]. Анализ процесса прогноза с помощью уравнений АР, на первый взгляд, показывает, что детализация уравнения АР позволит более точно описать и прогнозировать характеристики исследуемого случайного процесса. Однако увеличение числа переменных в уравнении АР неминуемо приводит к тому, что прогноз становится зависимым от еще большего числа условий, и, таким образом, уравнение АР дает все более многовариантную картину развития процесса. Выбор же варианта прогноза остается за рамками уравнения АР. Поэтому на практике чаще всего используются уравнения АР 3-го порядка, к тому же известно, что прогноз в основном зависит от 2 - 3 предыдущих наблюдений. Уравнение АР 3-го порядка для прогноза дефолтов клиентов имеет вид:
S = a + a X + a X + a X , 4 0 1 1 2 2 3 3
где a - постоянный член уравнения АР; 0 a , a , a - коэффициенты при наблюдениях X , X , X . 1 2 3 1 2 3 9. Комплексные методы прогноза. В настоящее время разработано много методов прогноза характеристик случайных процессов (ХСП). Однако результаты прогноза этими методами не всегда удовлетворяют нас по точности, периоду прогноза и др. Причиной этого является то, что в реальной действительности обрабатываемые случайные процессы не всегда соответствуют требованиям, предъявляемым к ним со стороны методов прогноза. Поэтому в принципе ни один отдельно взятый метод прогноза не может полностью решить проблему прогнозирования характеристик различных случайных процессов. Это породило идею объединения отдельных методов прогноза в некоторую систему, которую далее будем называть прогнозирующей системой (ПС), способной давать устойчивый и приемлемый по точности прогноз в широком диапазоне изменений ХСП. По структуре и принципам организации прогноза ПС напоминает трехслойный перцептрон Ф. Розенблатта [10]. Эффективность комплексирования прогнозов покажем на примере двух прогнозов. Пусть мы имеем два несмещенных одношаговых прогноза, которые получены по n наблюдениям, и пусть дисперсии 2 2 ошибок этих прогнозов равны соответственно сигма и сигма . 1 2 Комплексный прогноз может быть получен линейной комбинацией этих прогнозов с весами К и (1 - К) соответственно, чем обеспечивается несмещенность комплексной оценки. Дисперсия ошибки комплексного прогноза будет иметь вид:
2 2 2 2 2 сигма = K сигма + (1 - K) сигма + 2роKсигма (1 - K)сигма , c 1 2 1 2
где ро - коэффициент корреляции между ошибками прогноза 1-м и 2-м методами. Условие минимума ошибки прогноза имеет вид:
2 дельтасигма / дельтаK = 0, 2
или в развернутом виде для К:
2 2 2 K = (сигма - pосигма сигма ) / (сигма + сигма - 2pосигма сигма ), 2 1 2 1 2 1 2
2 2 pо < 1, сигма > сигма . 2 1
При ро = 0, то есть при отсутствии связи между 1-м и 2-м методами прогноза:
2 2 2 K = сигма / (сигма + сигма ). 2 1 2
Подставляя в приведенные выражения конкретные числовые значения, легко можно убедиться в том, что комплексный прогноз всегда дает существенный выигрыш в точности, имеет меньшую дисперсию ошибки прогноза. T Если имеется не два, а m прогнозов Z = (Z , Z , ... , Z ) и 1 2 m они являются несмещенными, то комплексный прогноз можно получить комбинацией этих прогнозов:
T Z = K Z, K
T где K = (K , K , .., K ) - веса различных прогнозов. 1 2 m
Дисперсия ошибки комплексного прогноза минимизируется путем определения весов различных прогнозов по методу обратных матриц:
-1 T -1 K = (A 1) / (1 A 1),
T T где A = M(yy ); y = X1 - Z, 1 = (1, 1, .., 1); M - знак математического ожидания; X - вектор прогнозируемого сигнала; y - ошибка прогноза. Проведено обширное математико-статистическое моделирование работы ПС и на ее основе показана эффективность комплексирования прогнозов. Качество прогноза на основе ПС оценивалось по следующим основным критериям: - средняя ошибка прогноза; - дисперсия ошибки прогноза; - коэффициент расхождения Г. Тейлора или относительная ошибка прогноза; - коэффициент Дарбина-Уотсона для оценки степени корреляции между ошибками прогноза отдельными методами и др. Моделируемая ПС состояла из следующих методов прогноза: - Метод ЭС 1-го порядка; - Метод линейной АР по одному прошлому значению процесса; - Метод линейной АР по двум прошлым значениям процесса; - Метод нелинейной АР 2-го порядка; - Метод движущейся средней; - Метод автокорреляции по трем прошлым значениям процесса. В качестве комплексных методов прогноза в ПС использовались: - средняя арифметическая прогнозов; - средняя геометрическая прогнозов; - средняя квадратическая прогнозов; - средняя гармоническая прогнозов; - средняя взвешенная прогнозов; - средняя регрессионная прогнозов; - средняя арифметическая нескольких комплексных прогнозов; - средняя взвешенная нескольких комплексных прогнозов. В целом показано, что средняя ошибка комплексного прогноза равна нулю. В 73 случаях из 100 комплексный прогноз лучше прогноза отдельным методом, а в остальных случаях комплексный прогноз не хуже.
Выводы
1. Главной проблемой любого кредитора является присущая процессу кредитования неопределенность, масштабы которой растут в условиях массового потребительского кредитования, что может привести к очередному банковскому кризису. 2. Предложено большое количество проверенных моделированием методов прогноза, внедрение которых в процесс массового потребительского кредитования дает количественную информацию о будущем поведении заемщиков, что снизит уровни неопределенности указанного процесса.
Литература
1. Готовчиков И.Ф. Математические методы оценки банковских рисков в условиях ограниченной статистической информации // Бизнес и банки. 2001. N 1-2. 2. Готовчиков И.Ф. Обзор математических методов прогнозирования ХСП // Бизнес и банки. 2001. N 10. 3. Готовчиков И.Ф. Кредитные истории в экономике России // Банковские услуги. 2003. N 6-7. 4. Готовчиков И.Ф. Математические методы обработки кредитных историй // Финансы и кредит. 2003. N 18. 5. Готовчиков И.Ф. Методы снижения асимметричности информации от кредитных историй заемщиков // Оперативное управление и стратегический менеджмент в коммерческом банке. 2003. N 5. 6. Готовчиков И.Ф. Концепция количественной оценки банковских рисков на основе построения ФР финансовых потерь // Банковские технологии. 2005. N 11. 7. Готовчиков И.Ф. Комбинированные способы оценки банковских рисков // Банки и технологии. 2004. N 5. 8. Готовчиков И.Ф. Комплексная скоринговая модель экспресс-оценки финансового состояния клиентов // Банковские технологии. 2006. N 1. 9. Готовчиков И.Ф. Практические методы экспресс-оценки финансового состояния физических и юридических лиц // Банковское кредитование. 2005. N 3. 10. Готовчиков И.Ф. Прогнозирование финансово-экономических характеристик коммерческих банков // Банки и технологии. 2006. N 1. 11. R.G. Brown, Smoothing, Forecasting and Prediction of Discrete Time Series, N.Y. Prentice Hall, 1963. 12. Колмогоров А.Н. Интерполирование и экстраполирование стационарных случайных последовательностей // Изв. АН СССР, сер. "Математика". 1941. Вып. 1. N 5.
И.Ф.Готовчиков К. т. н., независимый эксперт Подписано в печать 04.08.2006
——————————————————————————————————————————————————————————————————
————————————————————
——
(C) Buhi.ru. Некоторые материалы этого сайта могут предназначаться только для совершеннолетних. |