Автор работы: Пользователь скрыл имя, 08 Мая 2015 в 16:28, курсовая работа
Постоянное совершенствование систем кредитования населения в условиях роста конкуренции между банками по праву может считаться для банка важнейшим условием формирования его репутации и престижности в качестве универсального кредитного учреждения, а также является дополнительным источником дохода от реализации кредитных операций с физическими лицами.
Следовательно, анализ кредитоспособности заемщика и методы оценки кредитоспособности физических лиц, в частности кредитный скоринг, который будет рассмотрен в данной курсовой работе, является весьма актуальной темой на сегодняшний день.
Введение…………………………………………………………………………..3
Скоринг как метод оценки кредитного риска………………………………….4
1.1 Понятие «скоринг», его цели и задачи…………………………………….4
1.2 Обзор и сравнение методов и подходов к созданию скоринговой модели..5
1.2.1 Линейный дискриминантный анализ……………………………………5
1.2.2 Многофакторная логическая регрессия…………………………………6
1.2.3 Кластерный анализ………………………………………………………..6
1.2.4 Деревья решений………………………………………………………….7
1.3 Построение скоринговой инфраструктуры……………………………….7
2 Понятие «Data Mining» и анализ его методов и стадий……………………8
2.1 Понятие «Data Mining»…………………………………………………… 8
2.2 Анализ стадий и методов Data Mining……………………………………8
3 Характеристики набора данных кредитного скоринга и выбор метода построения его модели………………………………………………………..10
3.1 Характеристика набора данных………………………………………….10
3.2 Кластерный анализ набора данных……………………………………...11
4 Проведение анализа кредитного скоринга физических лиц в аналитической платформе Deductor 5.3………………………………………………………14
4.1 Импорт текстового файла………………………………………………...14
4.2 Кластеризация набора данных алгоритмом k-means……………………19
Заключение…………………………………………………………………….29
Список источников……………………………………………………………30
Федеральное государственное бюджетное
образовательное учреждение
высшего профессионального образования
“УТВЕРЖДАЮ”
Зав. кафедрой "Информационные технологии"
_______________________ БАТИЩЕВ В.И.
“ ” 2014 г.
КУРСОВАЯ РАБОТА
студента
на тему: Оценка кредитоспособности физических лиц методом кредитного скоринга
по дисциплине Интеллектуальные информационные системы
Принял к исполнению
Студент IV-АИТ-7
Нефёдова Алина
26 декабря 2014 года 26 декабря 2014 года
Самара 2014г.
СОДЕРЖАНИЕ
Введение…………………………………………………………
Скоринг как метод оценки кредитного риска………………………………….4
1.1 Понятие «скоринг», его цели и задачи…………………………………….4
1.2 Обзор и сравнение методов
и подходов к созданию
1.2.1 Линейный дискриминантный
1.2.2 Многофакторная логическая регрессия…………………………………6
1.2.3 Кластерный анализ…………………………………
1.2.4 Деревья решений………………………………………………………….
1.3 Построение скоринговой
2 Понятие «Data Mining» и анализ его методов и стадий……………………8
2.1 Понятие «Data Mining»…………………………………………………… 8
2.2 Анализ стадий и методов Data Mining……………………………………8
3 Характеристики набора данных
кредитного скоринга и выбор
метода построения его модели……
3.1 Характеристика набора данных……
3.2 Кластерный анализ набора данных……………………………………...11
4 Проведение анализа кредитного скоринга физических лиц в аналитической платформе Deductor 5.3………………………………………………………14
4.1 Импорт текстового файла…………………
4.2 Кластеризация набора данных алгоритмом k-means……………………19
Заключение……………………………………………………
Список источников……………………………………………………
Приложение 1………………………………………………………………….31
ВВЕДЕНИЕ
Постоянное совершенствование систем кредитования населения в условиях роста конкуренции между банками по праву может считаться для банка важнейшим условием формирования его репутации и престижности в качестве универсального кредитного учреждения, а также является дополнительным источником дохода от реализации кредитных операций с физическими лицами.
Следовательно, анализ кредитоспособности заемщика и методы оценки кредитоспособности физических лиц, в частности кредитный скоринг, который будет рассмотрен в данной курсовой работе, является весьма актуальной темой на сегодняшний день.
Целью курсовой работы является создание скоринговой модели кредитоспособности заемщика с использованием методов кластерного анализа Data mining.
Задачами курсового проекта являются:
Исходными данными курсовой работы является набор данных «Определение кредитоспособности заемщиков с помощью кредитного скоринга», состоящий из 1000 потребительских кредитов от немецкого банка.
Проведение непосредственного анализа и оценки кредитоспособности физических лиц будет осуществляться при помощи аналитической платформы Deductor 5.3.
1 СКОРИНГ КАК МЕТОД ОЦЕНКИ КРЕДИТНОГО РИСКА
В банковском менеджменте при оценке кредитоспособности заемщика наиболее популярным методом является кредитный скоринг. Кредитный cкоринг - это система оценки кредитоспособности физического лица, базирующаяся на численных статистических методах.
По сути, скоринг выявляет общий кредитный балл заемщика посредством его оценки по ряду характеристик, признаков. Признаки имеют различные удельные веса и затем суммируются в интегральный показатель – общий кредитный балл. Получается своеобразная сумма определенных критериев, необходимая для получения интегрального показателя. Интегральный показатель сравнивается с определенной числовой границей, которая представляет собой линию безубыточности для банка. Кредит доступен тем клиентам, интегральный показатель которых выше или равен этой линии.
В результате скоринга конкретного кредитополучателя формируется анализ потенциального заемщика, делающий доступным следующие операции:
Использование системы кредитного скоринга помогает банку достичь следующих результатов:
Кредитный скоринг определяется двумя задачами:
1.2 Обзор и сравнение подходов к созданию скоринговых моделей
1.2.1 Линейный дискриминантный
Дискриминантный анализ – метод, основывающийся на поиске различий (дискриминации) между наблюдаемыми объектами по определенным критериям.
В скоринге объектами являются сами кредитополучатели,
признаками - их характеристики, а классами
являются статусы заемщика (кредитоспособный\
В результате анализа строится функция:
D(x) = w0 + w1x1 + w2x2+…+wnxn , (1)
где D — класс заемщика;
w0 — константа;
wn — коэффициенты дискриминантной функции;
xn —характеристики заемщика.
С помощью этой модели, зная характеристики заемщика, можно с определенной степенью вероятности оценить его принадлежность к одному из классов.
1.2.2 Многофакторная логистическая регрессия
Принцип построения уравнения логистической регрессии аналогичен предыдущему принципу предыдущей функции:
log(p/(1-p)) = w0 + w1x1 + w2x2+…+wnxn , (2)
где р - вероятность невозврата кредита,
w - весовые коэффициенты,
х - характеристики клиента.
В результате уравнение логистической регрессии дает оценку вероятности неудачного кредита. Если в скоринговой системе установлены границы значений подобной вероятности для разделения двух классов объектов, то такая система автоматически будет выдавать вывод о допустимости или недопустимости выдачи кредита.
1.2. 3 Кластерный анализ
Кластерный анализ - это метод, содержащий в себе образование кластеров (групп, классов) между объектами анализа по набору характеристик (X1, X2 ,… Xm).
В скоринговых системах можно выделить два класса (кластера): "кредитоспособные заемщики" и "некредитоспособные заемщики". В кластерном анализе также возможно рассчитать расстояние между кластерами и выделить центроиды каждого кластера.
Таким образом, формулируется основной принцип работы данного вида анализа: у каждого объекта рассчитывается расстояние до каждого из классов, и какой-либо конкретный заемщик начинает оноситься к тому кластеру, расстояние до которого является минимальным.
1.2.4. Деревья решений
Метод деревьев решений подразумевает под собой классификацию объектов посредством систематического разделения облака признаков X1, X2 ,… Xm на прямоугольные участки. Сначала дробление по наиболее важному призанку. Затем – повторное дробление до того момента, пока не возникнет существенного различия между объектами противоборствующих классов по сравнению с исходными группами. Количество разветвлений, признаки ветвления и границы значения признаков в узлах деревьев решений определяются автоматически.
1.3 Построение скоринговой инфраструктуры
Скоринг заключается не только в построении скоринговых моделей, но и в реализации скоринговой инфраструктуры. Например, во многочисленных Data mining продуктах выходные данных анализа выборки или статистики сохраняют в виде программного кода, а затем его используют в информационных системах банка. Следовательно, скоринговой системой выступает индивидуально разработанное программное обеспечение, посредством которого рассчитывают интегральную сумму взвешенных характеристик объекта (заемщика), основываясь на исходной выборке. Скоринговой картой называется как раз набор этих характеристик, которые утверждены банком, а также баллы, соответствующие каждой характеристке.
Скоринговых карт в банках по традиции столько, сколько и кредитных продуктов, так как наборы характеристик для каждого разные. Например, под приобретение недвижимого имущества требуется одна карта, а под покупку автомобильного средства - другая. Никто не запрещает использовать одну карту для всех продуктов, но это неудобно как для банков, так и для самих клиентов.
2 ПОНЯТИЕ DATA MINING И АНАЛИЗ ЕГО МЕТОДОВ И СТАДИЙ
2.1 Понятие «Data Mining»
Сущность технологии Data Miningзаключается в «раскопке», поиске среди огромного количества исходных данных неясных, но нужных и значимых в практической области работы закономерностей и общих правил.
Эти правила нельзя определить стандартными средствами обработки информации, но они по обыкновению оказываются очень полезными в практическом применении.
Data Mining основывается на принципе шаблонов, называемых «паттернами» (patterns), которые и являются теми закономерностями, присущими исходным наборам данных (выборкам).
Цель обнаружения правил состоит в том, чтобы формализовать их в такой форме, которая отразила бы все процессы искомых данных, а на основании полученных результатов построить прогнозную модель.
2.3 Анализ стадий и методов Data Mining
Уникальность технологии Data Mining состоит в применении и математических средств, и новинок в области информатики. Data Mining использует формализованные методы, но в то же время и неформальные, сочетает в себе количественный и качественный анализ данных.
Data Mining включает следующие методы:
Data Mining может организоваться двумя или тремя стадиями:
Первая стадия. Свободный поиск.
На данной стадии система определяет паттерны посредством исследования искомого набора данных, а также поиска неявных правил и закономерностей условной и ассоциативной логики, а также трендов и колебаний.
Вторая стадия. Создание прогнозной модели на основе полученных результатов от выявления правил и закономерностей.
На данной стадии происходит предсказание неизвестных значений и прогнозирование развития процессов. Основные задачи второй стадии: классификация и прогнозирование.
В зависимости от серьезности и структуры проекта, иногда вносят также и стадию валидации, идущую за первой стадией. Суть валидации в том, чтобы перепроверить качественность найденных правил, их достоверность.
Информация о работе Оценка кредитоспособности физических лиц методом кредитного скоринга