КЛАСТЕРИЗАЦИЯ ДАННЫХ ПО КРЕДИТНЫМ ЗАЯВКАМ В ТРОИЧНЫЙ ВЕКТОР

В. М. Гиниятуллин, Э. А. Габитова

Аннотация


На текущий момент для принятия решения по выдаче кредита большинство банков исполь-
зуют скоринговые системы, в основе которых лежит присвоение баллов по каждой из харак-
теристик потенциального заемщика и последующая оценка кредитоспособности путем опре-
деления суммы набранных баллов. На примере одного из банков выявлено, что скоринговая
система дает заметное количество ошибочных решений. В связи с этим актуальным является
вопрос снижения уровня невозврата кредитных средств. Для этого необходимо найти сильные
и слабые стороны текущих моделей для дальнейшего анализа результатов специалистами по
кредитным рискам. В статье описано исследование текущей скоринговой системы с помощью
многослойного персептрона, реализующего функции троичной логики. В качестве исходных
данных для исследовательской работы взяты обезличенные сведения по заявкам клиентов
банка по продукту «Кредитная карта» за период с 2010 по 2017 гг. Основываясь на этих дан-
ных, построена обучающая выборка из 27552 обучающих пар (входных переменных и выход-
ных значений). Из них в 47 % случаев было принято положительное решение по заявке, а в
53 % клиенту было отказано. В одном из свободно распространяемых инструментов для рабо-
ты с нейронными сетями построен и обучен многослойный персептрон. Проверка работы
персептрона на тестовой выборке показала, что величина ошибки не превышает 1 %, что
говорит о том, что полученная сеть адекватна существующему алгоритму скоринга. Показано,
что подмена непрерывной функции активации — гиперболический тангенс в скрытом слое
нейросети – на пороговую трехзначную позволяет кластеризовать входные данные по потен-
циальным заемщикам банка, причем подавляющее большинство записей группируются всего
в два кластера. Выявление наиболее значимых характеристик при принятии решения по выда-
че кредита по текущему алгоритму скоринговой системы предложено произвести с помощью
оценки полученных при обучении нейросети весов скрытого слоя. Показано, что максималь-
ное значение матрицы весов соответствует наиболее значимому параметру.


Полный текст:

PDF

Литература


Что такое скоринг и как он работает

[Электронный ресурс]. Режим доступа: http://

hcpeople.ru/credit_scoring.

Рыбальченко Ю.С. Скоринг как

инструмент оценки и минимизации кредит-

ного риска // Молодой ученый. 2017. № 35.

С. 37–40.

Akhmetshin R.M., Giniyatullin V.M.

Identification of Structures of Organic

Substances by Means of Complex-Valued

Perceptron // Optical Memory & Neural

Networks (Information Optics). 2012. Vol. 21,

№ 1. P. 11–25.

Арсланов И.Г., Дмитриев Г.Ю.,

Гиниятуллин В.М., Зайцева А.А. Прогнозирование

химических соединений с ком-

плексом необходимых свойств // Башкирский

химический журнал. 2015. Т. 22, № 2.

С. 80–85.

Multiple Back-Propagation [Электронный

ресурс]. Режим доступа: http://mbp.

sourceforge.net.

Werbos P.J. Beyond Regression: New

Tools for Prediction and Analysis in the

Behavioral Sciences. Ph.D. thesis, Harvard

University, Cambridge, MA, 1974.

Гордиенко П.В. Стратегии контрасти-

рования // Нейроинформатика и ее приложения:

тез. докл. 5 Всеросс. семинара,

–5 октября 1997 г. / Под ред. А.Н. Горбаня.

Красноярск: Изд-во КГТУ, 1997. С. 69.

Гиниятуллин В.М. Троичная логика в

нейросетевом базисе // Теоретико-методологические

проблемы естественнонаучных

методов в гуманитарных науках: матер.

Междунар. науч.-практ. конф. 2014.

С. 318–325.

Расшифровываем чёрный ящик ней-

ронных сетей [Электронный ресурс]. http://

www.xn-c1adanacpmdicbu3a0c.xn-p1ai/

article_news?id=893.

Гиниятуллин В.М., Скрыпин А.Р.,

Тайсин Р.Р. Линейная разделимость функций

троичной логики // Актуальные проблемы

науки и техники — 2015: матер. VIII Междунар.

науч.-практ. конф. молодых ученых.

С. 116-119.


Ссылки

  • На текущий момент ссылки отсутствуют.