Главная страница перейти на главную страницу Buhi.ru Поиск на сайте поиск документов Добавить в избранное добавить сайт Buhi.ru в избранное


goБухгалтерская пресса и публикации


goВопросы бухгалтеров - ответы специалистов


goБухгалтерские статьи и публикации

Вопросы на тему ЕНВД

Вопросы на тему налоги

Вопросы на тему НДС

Вопросы на тему УСН


goВопросы бухгалтеров, ответы специалистов по налогам и финансам

Вопросы на тему налоги

Вопросы на тему НДС

Вопросы на тему УСН


goПубликации из бухгалтерских изданий


goВопросы бухгалтеров - ответы специалистов по финансам 2006


goПубликации из бухгалтерских изданий

Публикации на тему сборы ЕНВД

Публикации на тему сборы

Публикации на тему налоги

Публикации на тему НДС

Публикации на тему УСН


goВопросы бухгалтеров - Ответы специалистов

Вопросы на тему ЕНВД

Вопросы на тему сборы

Вопросы на тему налоги

Вопросы на тему НДС

Вопросы на тему УСН




Статья: Оценка вероятности банкротства предприятий-заемщиков на основе кластерного анализа ("Экономический анализ: теория и практика", 2007, N 18) Источник публикации "Экономический анализ: теория и практика", 2007, N 18



"Экономический анализ: теория и практика", 2007, N 18

ОЦЕНКА ВЕРОЯТНОСТИ БАНКРОТСТВА ПРЕДПРИЯТИЙ-ЗАЕМЩИКОВ

НА ОСНОВЕ КЛАСТЕРНОГО АНАЛИЗА

Оценка вероятности банкротства предприятий-заемщиков является одной из приоритетных задач кредитных организаций. От достоверности оценок вероятности банкротств индивидуальных предприятий зависит качество управления кредитным портфелем в целом, объем резервов, формируемых под возможные потери по ссудам, и устойчивость самой кредитной организации. Работая с крупными клиентами, банки имеют возможность строить и оценивать достаточно сложные модели кредитного риска и получать надежные оценки вероятности банкротства. Это связано в первую очередь с тем, что крупные компании чаще всего имеют котируемые на рынке ценные бумаги, такие как акции и облигации. Котировки этих ценных бумаг содержат в себе большое количество информации о вероятности банкротства предприятия. Крупные предприятия предоставляют как минимум ежеквартально детальную бухгалтерскую отчетность, на основе которой также строятся оценки вероятности банкротства. Кроме того, большинство крупных предприятий уже много лет участвует в кредитных отношениях. Банками накоплен достаточно большой статистический материал, содержащий объемы и условия полученных предприятием кредитов, информацию о своевременности процентных платежей и просрочкам по ссудам. Все это позволяет достаточно эффективно управлять кредитным портфелем, включающим крупные предприятия. Однако большинство коммерческих банков России работает с мелкими и средними предприятиями-заемщиками, а также с физическими лицами. Мелкие предприятия не имеют котируемых ценных бумаг, многие из них обладают правом вести упрощенную бухгалтерскую отчетность. Кредитная история большинства мелких и средних предприятий ограничена несколькими годами. Отсутствие достаточного количества информации о деятельности таких предприятий осложняет процесс оценки кредитного риска. Однако панельная структура данных, зачастую превалирующая в кредитных организациях, позволяет проводить глубокий риск-анализ, не взирая на отсутствие длинной кредитной истории каждого конкретного заемщика.

Панельные данные представляют собой матричную структуру, в которой каждому объекту ставится в соответствие определенный набор характеристик. В данной статье под объектами понимаются заемщики кредитной организации. Соответствующие характеристики могут быть как числовыми, например прибыль/убытки, полученные предприятием в течение нескольких последних лет, объем собственных средств, количество занятых сотрудников, так и качественными: отрасль экономики, регион России, форма предприятия и другие. Представляется наиболее вероятным, что схожие по своим характеристикам предприятия будут иметь одинаковую вероятность банкротства. В то же время задача определения степени "схожести" объектов не тривиальна, особенно если набор характеристик велик, а сами характеристики разноплановы. Такие подгруппы "схожих" предприятий позволяет выделить кластерный анализ.

Кластерный анализ предприятий. Цель и подходы

Целью кластерного анализа является разделение всего множества объектов исследования на классы - подгруппы объектов, обладающих сходными характеристиками. Оптимальное количество подгрупп, на которые должны быть разделены объекты, также определяется непосредственно в ходе реализации алгоритма кластерного анализа. Одним из наиболее существенных для оценки кредитного риска на основе кластерного анализа является положение, что схожие предприятия (предприятия, попавшие в одну и ту же подгруппу - кластер) имеют одинаковую вероятность банкротства.

Существуют два основных подхода к кластерному анализу. Первый - жесткий кластерный анализ - предполагает отнесение каждого объекта к одному единственному кластеру. При втором подходе - нечетком кластерном анализе - каждому объекту ставится в соответствие некое распределение вероятностей принадлежности объекта различным кластерам.

Жесткий кластерный анализ

Целью жесткого кластерного анализа является разбиение объектов исследования на подгруппы схожих по своим свойствам объектов. Каждый объект может принадлежать одной и только одной подгруппе.

Жесткий кластерный анализ проводится в несколько этапов. На первом этапе определяются числовые характеристики объектов исследования. На втором этапе оценивается схожесть объектов. На третьем этапе объекты разбиваются на подгруппы согласно их схожести.

Числовые характеристики объектов исследования. Пусть имеется n различных объектов исследования. Применительно к анализу кредитного риска это могут быть предприятия - заемщики кредитной организации. Каждый из объектов характеризуется различными признаками, число которых d. Каждому признаку ставится в соответствие определенная числовая характеристика. Признаки могут быть как количественными, так и качественными. В зависимости от свойств каждого признака числовые характеристики определяются различными способами.

Так, если признаки количественные, то сама величина, характеризующая значение признака, и является его числовой характеристикой. Например, если признаком является доходность предприятия за прошлый год, ее значение и будет выступать числовой характеристикой признака. Однако масштаб различных числовых характеристик может быть несопоставим. Например, доходность предприятия измеряется в процентах (долях единицы), тогда как размер активов измеряется в сотнях, тысячах и даже миллионах рублей (или других денежных единицах). Поэтому все числовые признаки должны быть приведены к единой шкале. Значение каждого признака должно быть стандартизировано и нормировано так, чтобы данный признак имел нулевое среднее значение и единичную выборочную дисперсию на множестве объектов исследования.

Для каждого объекта исследования i и его количественного признака j рассчитывается стандартизированное значение признака.

~

x - m

ij j

x = --------,

ij сигма

j

где x - стандартизированное значение j-го признака для i-го

ij

объекта;

m - среднее значение j-го признака;

j

сигма - стандартное отклонение значений j-го признака;

j

~

x - нестандартизированное значение j-го признака для i-го

ij

объекта.

В случае если признак является качественным, числовая характеристика может определяться несколькими способами. Рассмотрим, например, случай, когда признак характеризует правовую форму предприятия. Допустим, что среди исследуемых предприятий находятся (1) акционерные общества открытого типа, (2) акционерные общества закрытого типа, (3) общества с ограниченной ответственностью и (4) товарищества. Тогда каждому объекту ставится в соответствие порядковый номер, соответствующий верному описанию правовой формы данного предприятия (например, общества с ограниченной ответственностью получают порядковый номер три). Затем каждому порядковому номеру ставится в соответствие число из интервала [0, 1], которое и будет числовой характеристикой данного объекта по этому признаку.

r - 1

ij

x = -------,

ij M - 1

j

где x - стандартизированное значение j-го признака для i-го

ij

объекта;

r - порядковый номер (ранг), присвоенный объекту i по j-му

ij

признаку;

M - максимальный ранг, присвоенный какому-либо объекту по

j

j-му признаку.

Числовой характеристикой качественного признака может служить не только единственное число, но и целый вектор. Длина этого вектора соответствует количеству различных значений признака (в приведенном примере длина вектора равна четырем). Все координаты вектора равны нулю за исключением той, которая соответствует верному описанию правовой формы предприятия. Значение этой координаты - единица. В приведенном примере обществу с ограниченной ответственностью ставится в соответствие вектор [0, 0, 1, 0]. Преимущество данного способа присвоения числовых характеристик качественным признакам заключается в том, что исследователь может судить о разнообразии значений признака непосредственно по длине соответствующего ему вектора.

Таким образом, все множество объектов исследования можно представить в виде матрицы характеристик, координаты столбцов которой соответствуют признакам, а координаты строк - объектам исследования.

X = (x ),

ij

где i = 1... n; j = 1... d.

В развернутом виде матрица характеристик имеет вид

- ¬

¦x ... x ... x ¦

¦ 11 1j 1d¦

¦... ... ... ... ...¦

¦x ... x ... x ¦

X = ¦ i1 ij id¦.

¦... ... ... ... ...¦

¦x ... x ... x ¦

¦ n1 nj nd¦

L -

На следующем этапе необходимо определить степень "схожести" объектов исследования на базе сопоставленных числовых характеристик.

Меры схожести объектов исследования. Для определения степени схожести объектов исследования необходимо ввести меру расстояния между объектами. Чем меньше "расстояние", тем выше "схожесть". Существует несколько способов измерения расстояния между объектами.

1. Расстояние Манхеттена. В качестве меры расстояния между двумя объектами i и i' используется сумма модулей разности их характеристик.

d

L (i, i') = SUM |x - x |.

1 j=1 ij i'j

2. Расстояние Евклида. В качестве меры расстояния между двумя объектами i и i' используется квадратный корень из суммы квадратов разности их характеристик.

________________

/d 2

L = /SUM (x - x ) .

2 \/ j=1 ij i'j

3. Расстояние Минковского. Данная мера расстояния между объектами является обобщением расстояния Евклида для более высоких степеней.

________________

/d q

L (i, i') = q /SUM |x - x | .

3 \/ j=1 ij i'j

4. Корреляционное расстояние. Для определения корреляционного

расстояния между объектами i и i' необходимо в первую очередь

рассчитать коэффициент корреляции между объектами p . Тогда

ii'

корреляционное расстояние рассчитывается следующим образом:

1 - p

ii'

L (i, i') = --------.

4 2

Корреляционное расстояние стремится к нулю, если характеристики объектов обладают высокой положительной корреляцией. Расстояние стремится к единице, если корреляция между характеристиками объектов высокая и отрицательная. В случае если корреляция между характеристиками объектов отсутствует, корреляционное расстояние равно 1/2.

При использовании данных мер объекты будут более схожи, чем меньше расстояние между ними. Однако первая мера расстояния - расстояние Манхеттена - менее чувствительна к отдельным ошибкам при определении числовых характеристик объектов и к случайным исключениям. Например, пусть имеется два объекта, обладающих всеми одинаковыми характеристиками за исключением одной. И пусть разность значений этой характеристики объектов больше единицы. Тогда при измерении расстояния Евклида объекты окажутся гораздо дальше друг от друга, чем при измерении расстояния Манхеттена. Если допустить далее, что это несоответствие характеристик ошибочно, то, используя расстояние Евклида, можно прийти к ложным выводам и отнести объекты к разным подгруппам вместо одной и той же подгруппы. При анализе большого объема данных, с каким приходится работать кредитным организациям, нельзя не учитывать операционные риски. Риск допущения некоторого числа ошибок при анализе достаточно велик, поэтому необходимо использовать такую меру расстояния между объектами, которая позволит уменьшить степень влияния ошибок и получить верный результат даже при их наличии. Поэтому в работе предлагается использовать расстояние Манхеттена как меру схожести между объектами.

Если значимость различных характеристик объектов для исследования не одинакова, в меру расстояния между объектами могут быть введены весовые коэффициенты, придающие больший вес более существенным характеристикам. Например, взвешенное расстояние Манхеттена будет иметь вид:

d

SUM дельта |x - x |

Вз j=1 j ij i'j

L (i, i') = -----------------------.

1 d

SUM дельта

j=1 j

где дельта - вес j-й характеристики.

j

(Взвешенное) расстояние Манхеттена должно быть рассчитано для каждой пары объектов исследования.

На следующем этапе на основе полученных оценок расстояния между объектами объекты разбиваются на подгруппы - кластеры.

Методы разбиения объектов на подгруппы - кластеры. Одним из наиболее часто используемых методов разбиения на кластеры является метод K-means.

K-means метод.

Для реализации метода K-means необходимо в первую очередь выбрать число подгрупп K, на которые будет разделено все множество объектов. Затем процесс разбиения на кластеры проходит в несколько шагов.

1. Выбираются K объектов, которые становятся центрами кластеров. Существует несколько способов выбрать начальные центры кластеров. С одной стороны, объекты, являющиеся центрами кластеров, могут быть выбраны случайным образом. С другой стороны, объекты могут быть выбраны таким образом, чтобы расстояние между ними было наибольшим. Если же исследователю доступна дополнительная информация о том, какими особенностями должны обладать объекты, принадлежащие различным кластерам, центры кластеров могут быть выбраны исходя из этой информации.

2. Каждый объект ставится в соответствие одному кластеру таким образом, чтобы расстояние от этого объекта до центра кластера было наименьшим.

3. Рассчитываются новые центры кластеров. Каждый новый центр кластера представляет собой некий искусственный объект, характеристики которого есть средние значения характеристик объектов, входящих в этот кластер.

4. Объекты перераспределяются по подгруппам с новыми центрами. Процесс (2 - 4) итерируется.

5. Оптимизационным критерием является минимум суммы дисперсий расстояний между объектами, входящими в один кластер.

K

min SUM Var(L(i, i )).

k=1 k

Метод K-means достаточно эффективен, однако он имеет ряд недостатков. Во-первых, применение этого метода возможно, только если можно рассчитать среднее значение характеристик объектов. Если же характеристики являются качественными, метод не применим. Во-вторых, количество кластеров K должно быть заранее задано. Метод не позволяет определить оптимальное количество подгрупп. В-третьих, K-means метод не применяется для определения невыпуклых кластеров. Кроме того, метод не устойчив к ошибкам и случайным выбросам, а также не способен игнорировать шумы в данных. Этот недостаток является основным, когда объектами являются предприятия-заемщики, а целью анализа - оценка кредитных рисков. При анализе кредитных рисков необходим более устойчивый метод. Таким методом является метод разбиения вокруг медиодов (Partitioning around medoids, PAM).

Метод разбиения вокруг медиодов (PAM).

Разбиение объектов на кластеры вокруг медиодов проходит в несколько этапов.

1. На первом этапе случайным образом выбираются K объекты, которые будут служить медиодами - центрами кластеров.

2. Каждый объект исследования относится к одному из K кластеров. Объект i относится к кластеру k, если расстояние от данного объекта до медиода k является наименьшим из расстояний от данного объекта до медиодов.

*

k = arg min L (i, i ),

i k 1 k

*

где k - номер кластера, к которому принадлежит объект i;

i

i - порядковый номер объекта, являющегося медиодом

k

кластера k.

3. Рассчитывается значение функции затрат как среднее расстояние между каждым объектом и центром соответствующего кластера.

1 n

CF = - SUM L (i, i ).

n i=1 1 *

k

i

4. Оптимальный набор медиодов находится на минимуме функции затрат. Минимум функции ищется на всем множестве допустимых комбинаций по K объектов из общего числа n объектов.

*

I = (i , i ... i ) = arg min CF ,

1 2 K i ,i ...i

1 2 K

*

где I - множество порядковых номеров объектов - центров

кластеров, доставляющее минимум функции издержек.

Этап 4 является заключительным этапом разбиения объектов на кластеры.

Производя описанный анализ, мы опираемся на предположение, что количество различных кластеров K известно. Однако в большинстве случаев это не так, и задача нахождения оптимального числа кластеров также требует решения.

Оптимальное число кластеров

Для определения оптимального числа кластеров в первую очередь для каждого объекта исследования i рассчитывается его силуэт s(i):

b(i) - a(i)

s(i) = ----------------,

max(a(i), b(i))

где a(i) - среднее расстояние между объектом i и остальными объектами, входящими в один и тот же кластер, что и объект i;

b(i) - среднее расстояние между объектом i и остальными объектами, входящими в другие кластеры.

Если силуэт s(i) примерно равен единице, то объект i хорошо поддается классификации и находится в верно сопоставленном кластере. Если силуэт s(i) равен нулю, то объект i лежит между двумя кластерами. Если силуэт s(i) равен минус единице, то объект i плохо классифицирован. Данный объект либо отнесен к неверной подгруппе, либо не может быть отнесен ни к одной из выделенных подгрупп.

-

¦~= 1, объект хорошо поддается классификации;

s(i) < ~= 0, объект лежит между двумя кластерами;

¦~= -1, объект плохо поддается классификации.

L

После определения силуэта каждого конкретного объекта рассчитывается среднее значение силуэта по всей базе данных:

_ 1 n

s = - SUM s(i).

K n i=1

*

Оптимальное количество кластеров K находится на максимуме

среднего значения силуэта базы данных:

* _

K = arg max s .

K K

Таким образом, в ходе жесткого кластерного анализа достигаются следующие результаты:

1) определяется оптимальное число подгрупп, на которые должны быть разбиты объекты исследования;

2) выделяется оптимальный набор медиод - центров кластеров;

3) объекты исследования группируются вокруг медиод. В результате каждый объект исследования оказывается единственным образом сопоставленным одному из кластеров.

Жесткий кластерный анализ может, однако, не дать положительных результатов, если объекты исследования настолько разнообразны по своим характеристикам, что каждый из них не может быть отнесен лишь к одному единственному кластеру. В таком случае необходимо применять нечеткий кластерный анализ <1>.

     
   ————————————————————————————————
   
<1> Rose K., Gurewitz E., Fox G.C., 1990, Statistical Mechanics and Phase Transitions in Clustering, Physical Review Letters, pp. 65, 945 - 948.

Нечеткий кластерный анализ

При нечетком кластерном анализе каждому объекту исследования ставится в соответствие набор вероятностей попадания данного объекта в каждый из рассматриваемых кластеров <2>.

     
   ————————————————————————————————
   
<2> Оптимальное количество кластеров определяется так же, как и при жестком кластерном анализе.

Пусть p - вероятность, с которой объект i принадлежит

ik

кластеру k. Тогда функция затрат может быть рассчитана следующим

образом:

n K

CF = SUM SUM p L (i, i ), (1)

i=1 k=1 ik 1 k

где i - порядковый номер объекта - центра k-го кластера.

k

Для каждого объекта i сумма вероятностей попадания в каждый из кластеров равна единице.

K

SUM p = 1, для любого i = 1, 2... n. (2)

k=1 ik

Оптимальный набор вероятностей определяется на максимуме энтропии распределения вероятностей при ограничениях на функцию затрат (1) и при условии (2).

Энтропия распределения вероятностей рассчитывается как

n K

H(p) = -SUM SUM p log p .

i=1 k=1 ik 2 ik

Решение находится методом множителя Лагранжа и имеет вид

exp(-гамма x L (i, i ))

1 k

p = ---------------------------,

ik K

SUM exp(-гамма x L (i, i ))

k=1 1 k

где гамма - множитель Лагранжа. При увеличении

гамма распределение по кластерам становится более четким. Если

значение параметра гамма равно нулю (гамма = 0), каждый объект

равновероятно может принадлежать каждому из кластеров. Так, если

значение этого параметра стремится к бесконечности

(гамма --> бесконечность), каждый объект с вероятностью 1

принадлежит одному-единственному кластеру и полученный результат

совпадает с результатом жесткого кластерного анализа.

Проблема оценивания вероятности банкротства предприятий достаточно сложна. Существует множество факторов как регистрируемых, так и нет, влияющих на эту вероятность. Характеристики предприятий-заемщиков сильно различаются между собой. Поэтому для анализа кредитного риска более оправданно использование нечеткого кластерного анализа. Нечеткий кластерный анализ позволяет системе оценки риска быть более гибкой, мгновенно регистрировать малейшие различия между предприятиями и их кредитным качеством.

Расчет вероятности банкротства предприятий на основе

выделенных кластеров

В ходе кластерного анализа все объекты исследования - предприятия-заемщики - разбиваются на подгруппы схожих предприятий. С большой долей уверенности можно предположить, что схожие предприятия обладают одинаковой вероятностью банкротства на фиксированном временном промежутке. Для получения оценок вероятности банкротства на базе кластерного анализа необходимо использовать полную базу данных заемщиков, включающую как предприятия-банкроты, которые когда-либо были заемщиками кредитной организации и не выполнили своих обязательств по кредиту, так и устойчивые предприятия.

Предприятия, попавшие в один и тот же кластер, считаются принадлежащими к одной и той же группе риска и обладают одинаковой интенсивностью банкротств. Понятие интенсивности банкротств является ключевым при анализе кредитного риска.

Интенсивность банкротств определяется как вероятность банкротства предприятия в течение единичного интервала времени. Для целей кредитных организаций за единичный интервал времени наиболее удобно принять один месяц. Это наиболее подходящий временной интервал для анализа кредитного риска предприятий малого и среднего бизнеса, а также физических лиц. Отчетность о деятельности предприятий поступает в кредитные организации не чаще чем один раз в месяц, и судить об изменении кредитного качества заемщика можно лишь по истечении следующего месяца. Процентные платежи по кредитам начисляются в среднем также ежемесячно. Любая просрочка платежа отражается на балансе кредитной организации один раз в месяц. Кредитоспособность физических лиц зависит от их доходов - заработной платы, получаемой ежемесячно. Таким образом, единичный интервал длиной в один месяц является наиболее приемлемым для оценки кредитного риска.

Рассмотрим один из кластеров k. Пусть в этом кластере

находится N предприятий, из которых N - предприятий банкротов и

b

(N - N ) предприятий, сохранивших устойчивость на дату проведения

b

анализа. Наивная оценка вероятности банкротства, равная отношению

предприятий банкротов к общему числу предприятий в данном

кластере, является неверной. При таком подходе не учитывается

время, в течение которого каждое конкретное предприятие сохраняло

устойчивость, прежде чем объявило дефолт. Для получения

достоверных оценок вероятности банкротства необходим развернутый

подход, основанный на интенсивности банкротств, при котором

вероятность банкротства представляется как функция от времени.

Пусть лямбда - параметр интенсивности банкротств, постоянный

k

для всех предприятий кластера k. Пусть также временной интервал от

даты проведения анализа до банкротства заемщика есть случайная

величина, подчиненная экспоненциальному закону распределения <3>.

Тогда вероятность того, что компания объявит дефолт в течение T

периодов, может быть рассчитана как

P = F (T) = 1 - exp(-лямбда T).

T exp k

     
   ————————————————————————————————
   
<3> Плотность вероятности распределения экспоненциального -лямбдаx закона задана как f(x) = лямбдаe для всех x >= 0. Математическое ожидание есть E(x) = 1 / лямбда, дисперсия - D(x) = 2 1 / лямбда . См. Соколов Г.А., Чистякова Н.А. "Теория вероятностей: Учебник" / М.: "Экзамен", 2005, с. 404. На следующем этапе необходимо найти оценку параметру интенсивности лямбда . Каждому предприятию i в кластере k ставится k в соответствие длина временного интервала, выраженная в месяцах, от момента выдачи кредита данному предприятию до даты проведения анализа в случае устойчивых предприятий и до даты банкротства в случае предприятий-банкротов. В дальнейшем будем называть эти временные интервалы "показатель времени жизни" предприятия. Для многих предприятий соответствующие показатели времени жизни будут совпадать. Пусть выделяется m различных показателей. Далее для каждого из m различных показателей выбираются соответствующие им t предприятия. Так, пусть показателю t соответствует N предприятий, t из которых N - банкроты. Тогда оценка вероятности банкротства b предприятий подгруппы k в течение временного промежутка t с момента выдачи кредита есть t t P = N / N . t b Используя эту оценку, рассчитывается интенсивность банкротств t лямбда : k t лямбда = -ln(1 - P ) / t. k t t Заметим, что лямбда - это вероятность банкротства в течение k одного временного интервала, рассчитанная с использованием данных о компаниях, которые были заемщиками кредитной организации в течение t периодов. Оценки интенсивности банкротств рассчитываются для каждого из m показателей времени жизни. В случае если количество предприятий, попавших в кластер k, недостаточно для того, чтобы рассчитать интенсивность банкротств для каждого из m показателей (к примеру, имеется только одно предприятие, которое было заемщиком банка три месяца и обанкротилось, оценка вероятности банкротства P равна единице, и 3 соответствующая интенсивность не определена), необходимо агрегировать предприятия для дальнейшего анализа. Все предприятия, значение соответствующего показателя времени жизни которых лежит в определенных границах, относятся к одной подгруппе. Например, к одной подгруппе могут быть отнесены предприятия, время жизни которых меньше одного года. В качестве показателя времени жизни, соответствующего каждой подгруппе, выбирается медиана показателей времени жизни предприятий, входящих в данную подгруппу. Интенсивность банкротств, соответствующая всему кластеру k, есть среднее значение оценок интенсивностей, полученных на уровне разных показателей времени жизни предприятий: 1 t лямбда = - SUM лямбда . k m t k Оценка вероятности банкротства предприятий проводится на базе существующего кластерного деления. Пусть предприятия-заемщики анализируются на основе нечеткого кластерного анализа. Предприятия разбиты на K кластеров. p - вероятность того, что предприятие i ik принадлежит кластеру k. Заметим, что жесткий кластерный анализ, при котором каждому предприятию ставится в соответствие один- единственный кластер, представляет собой частный случай нечеткого кластерного анализа, когда для каждого предприятия одна из вероятностей p равна единице, тогда как остальные вероятности ik равны нулю. Поэтому предложенный алгоритм можно использовать как в случае нечеткого, так и в случае жесткого кластерного анализа. Пусть лямбда - оценка частоты банкротств, соответствующая k кластеру k. Вероятность банкротства зависит от временного промежутка, на котором она рассчитывается. Пусть t есть длина временного промежутка, выраженная в месяцах, для которого рассчитывается вероятность банкротства. Оценка вероятности того, что предприятие i объявит банкротство в течение временного интервала t - P (t), рассчитывается следующим образом: i - ¬ ¦ K ¦ P (t) = 1 - exp< -t SUM p лямбда >. i ¦ k=1 ik k¦ L - Полученная вероятность далее может быть использована для вычисления величины ожидаемых потерь по кредиту, для определения группы риска заемщика, для расчета объемов резервов, которые кредитной организации необходимо создать при выдаче этого кредита, а также для проведения портфельного анализа, оценки общего риска портфеля, ожидаемых потерь, расчета VaR и других показателей. Оценка кредитного риска предприятий в условиях ограниченности информации является одной из приоритетных задач кредитных организаций. В статье предлагается алгоритм оценки вероятности банкротства предприятий на основе кластерного анализа. Оценка вероятности банкротства предприятий-заемщиков проходит следующим образом. На основе имеющейся базы данных заемщиков (как устойчивых компаний, так и предприятий-банкротов) выделяются подгруппы (кластеры) схожих предприятий. Для каждого отдельного кластера оценивается параметр интенсивности банкротств в единицу времени. Для каждого предприятия-заемщика вероятность банкротства в течение определенного промежутка времени рассчитывается на основе показателя интенсивности банкротств соответствующего кластера. Разбиение предприятий на кластеры необходимо регулярно обновлять с учетом новой информации о заемщиках, их экономическом состоянии и финансовой устойчивости. Частота обновления зависит от притока новой информации. Например, если кредитная организация расширяет деятельность так, что число заемщиков удваивается в довольно короткие сроки, перерасчет состава и характеристик кластеров должен производиться не реже чем один раз в месяц. С другой стороны, если приток новых клиентов незначителен по сравнению с уже имеющейся базой данных заемщиков, перегруппировка кластеров может проводиться один раз в полгода. Литература 1. Годин Д.Б. Математические методы управления в условиях неполной информации. - М.: Советское радио, 1988. 2. Колоколова О.В. Оптимизационное моделирование кредитного портфеля // Сборник статей "Актуальные проблемы развития современной экономики России", Рос. экон. акад., Москва, 2004. С. 46 - 50. 3. Соколов Г.А., Чистякова Н.А. Теория вероятностей. Учеб. / М.: Экзамен, 2005. 4. Энциклопедия финансового риск-менеджмента / Под ред. А.А. Лобанова и А.В. Чугунова - 2-е издание, переработанное и дополненное. - М.: Альпина Бизнес Букс, 2005. 5. Bailey K.D. Cluster Analysis // Sociological Methodology, 1975. Vol. 6, p. 59 - 128. 6. Hartigan J.A., Wong M.A. Algorithm AS 136: A K-Means Clustering Algorithm // Applied Statistics, 1979. Vol. 28. No. 1, p. 100 - 108. 7. Kaufman L, Rousseeuw P.J. Finding groups in data, an introduction to cluster analysis. Brussels: John Wiley & Sons; 1990. 8. Rose K., Gurewitz E., Fox G.C. Statistical Mechanics and Phase Transitions in Clustering // Physical Review Letters, 65, 1990, p. 945 - 948. 9. http://www.statsoft.com/textbook/stcluan.html. О.В.Колоколова Российская экономическая академия им. Г.В. Плеханова Подписано в печать 21.09.2007 ————





Прокомментировать
Ваше имя (не обязательно)
E-Mail (не обязательно)
Текст сообщения:



еще:
Статья: Технология эмулирования баз данных в электронных таблицах на примере инвестиционного анализа ("Экономический анализ: теория и практика", 2007, N 18) Источник публикации "Экономический анализ: теория и практика", 2007, N 18 >
Статья: Правильный Интернет ("ЭЖ-Юрист", 2007, N 37) Источник публикации "ЭЖ-Юрист", 2007, N 37



(C) Buhi.ru. Некоторые материалы этого сайта могут предназначаться только для совершеннолетних.