Курсовая работа: Статистический анализ банковской деятельности. Исследование моделей оценки кредитных рисков
Таблица 13. Canonical Discriminant Function
Coefficients
|
Function |
|
|
1 |
SCHET |
,528 |
SROK |
-,140 |
HISTOR |
,315 |
ZAIM |
-,145 |
CHARES |
,186 |
TIMRAB |
,133 |
VZNOS |
-,240 |
FAMIL |
,248 |
PORUCHIT |
,372 |
INIZAIMI |
,262 |
(Constant) |
-3,288 |
|
|
|
Точность
распознавания дискриминантным анализом выше, чем кластерным. Но результаты по-прежнему
остаются неудовлетворительными.
Дерево
классификаций является более общим алгоритмом сегментации обучающей выборки
прецедентов. В методе дерева классификаций сегментация прецедентов задается не
с помощью n-мерной сетки, а путем последовательного
дробления факторного пространства на вложенные прямоугольные области (рис .1).
Рис.1.
Дерево классификации
На
первом шаге разделение выборки прецедентов на сегменты производится по самому
значимому фактору. На втором и последующих шагах в отношении каждого из полученных
ранее сегментов процедура повторяется до тех пор, пока никакой вариант последующего
дробления не приводит к существенному различию между соотношением положительных
и отрицательных прецедентов в новых сегментах. Количество ветвлений (сегментов)
выбирается автоматически.
В рассмотренной методике
также не дается ответ, насколько кредит хорош или плох. Метод не позволяют
получить точную количественную оценку риска и установить допустимый риск.
Нейронные
сети NN используются при определении кредитоспособности юридических лиц, где
анализируются выборки меньшего размера, чем в потребительском кредите.
Наиболее успешной областью их применения стало выявление мошенничества с кредитными
карточками. Нейронные сети выявляют нелинейные связи между переменными, которые
могут привести к ошибке в линейных моделях. NN позволяют обрабатывать прецеденты
обучающей выборки с более сложным (чем прямоугольники) видом сегментов (рис. 2).
Форма сегментов зависит от внутренней структуры NN Формулы и коэффициенты
модели риска на основе NN лишены физического и логического смысла.
Рис.2.
Сегменты разделения «хороших» и «плохих» объектов в NN
Нейросеть
— это «черный ящик», внутреннее содержание которого (так называемые веса
нейронов) не имеет смысла в терминах оценки риска. Такие методики не позволяют
объяснить, почему данному заемщику следует отказать в кредите. NN-модели классификации обладают низкой
стабильностью (робастностью).
В
основе технологии data mining лежат алгоритмы поиска закономерностей
между различными факторами в больших объемах данных. При этом анализируются
зависимости между всеми факторами; но, поскольку даже при небольшом числе факторов
количество их всевозможных комбинаций растет экспоненциально, в data mining применяются алгоритмы априорного отсечения слабых
зависимостей [1]. Говоря терминами анализа кредитоспособности, data mining на основе данных о выданных кредитах выявляет те факторы,
которые существенно влияют на кредитоспособность заемщика, и вычисляет силу
этого влияния. Соответственно, чем сильнее определенный фактор влияет на
кредитоспособность, тем больший балл ему присваивается в методике скоринга. Чем
больше данные держателя кредитной карты похожи на данные «кредитоспособного
гражданина», тем больший лимит по кредиту он может получить, тем лучшие условия
ему могут быть предоставлены
Главное
преимущество методик на основе data mining заключается
в том, что они могут работать на малых выборках. При больших выборках их
точность, робастность и прозрачность недостаточны В них также не дается ответ,
насколько кредит хорош или плох Метод не позволяет получить количественную
оценку риска, установить допустимый риск, назначить цену за риск и выявить
вклады факторов и их градаций в риск
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 |