Разработка проекта управления рисками кредитования заемщиков – физических лиц
Для оценки и анализа кредитных рисков заемщиков физических лиц в ПАО «ВТБ 24» предлагается использовать логико-вероятностную (ЛВ) теорию риска с группами несовместных событий (ГНС), которая отвечает требованиям соглашения «Базель II» к методам количественной оценки кредитных рисков и резервирования. ЛВ-теория риска с ГНС превосходит существующие скоринговые методики по точности, устойчивости и прозрачности, снижает кредитные потери банка и повышает его конкурентоспособность. Кредитование является основным видом деятельности банков. Каждый банк индивидуален, так как обслуживает различных клиентов в разных районах и регионах, отраслях и сферах банковских услуг, и должен иметь ЛВ-модели кредитного риска физических и юридических лиц, построенные на собственной статистике. Индивидуальности банков способствует также конкуренция. В настоящее время на рынке имеются скоринговые методики и программные продукты для оценки кредитного риска на основе линейного и квадратичного дискриминантного анализа, нейронных сетей и data mining. ЛВ-теория кредитного риска с ГНС разительно отличается от распространенных скоринговых методик и имеет следующие особенности: использование логического сложения событий вместо арифметического сложения баллов или других показателей; - адекватная логическая формулировка сценария кредитного риска; - применение базы знаний по кредитам в виде системы логических уравнений вместо традиционной базы данных; - построение логической и вероятностных моделей кредитного риска; - определение вероятностей событий с учетом ГНС и формулы Байеса; - корректная формулировка целевой функции для идентификации модели риска по статистическим данным; - использование специальных логических Software. - абсолютная прозрачность в оценке и анализе риска кредита, множества кредитов банка и самой модели риска; - возможность управлять кредитным риском, изменяя асимметрию распознавания хороших и плохих кредитов, число параметров и градаций, описывающих кредит. Оценка и анализ кредитных рисков состоят из двух частей: 1) построение модели кредитного риска по статистике банка, вычисление атрибутов риска множества кредитов банка и анализ кредитной деятельности банка; 2) оценка риска кредита заемщика, вычисление атрибутов риска и анализ риска кредита. Логико-вероятностная модель кредитного риска имеет следующие достоинства: - в два раза большая точность в распознавании хороших и плохих кредитов; - в семь раз большая робастность (устойчивость классификации кредитов); Изложим основные положения ЛВ-теории риска неуспеха: Описание кредита. Кредит описывается параметрами, каждый из которых имеет градации. На практике число параметров может быть до 40, а число градаций в параметре - до 30. Например, кредиты физических лиц в одном из банков описывались следующими признаками (параметрами) и их градациями (табл. 21). Параметр успешности кредита - Y(2 градации). Параметры кредита: Z-l - срок кредита (4 градации); Z2 - сумма кредита (6); Таблица 21 - Параметры и градации кредитов физических лиц
Z3 - цель кредита (3); Z4 - кредитная история в банке (3); Z5 - владение пластиковыми картами банка (4); Z6 - жилищные условия (3); Z7 - наличие дорогостоящего имущества (3); Z8 - возраст заемщика (3); Z9 - должностной уровень (4); Z10 - стабильность занятости (время работы в указанной компании) (4); Zn - доход по месту работы (5); Z12 - количество неработающих в семье (3). Представление статистики банка по кредитам. Статистические данные по кредитам банка рассматриваются как база данных (БД). Однако в ЛВ-теории риска база данных должна быть преобразована в базу знаний (БЗ). Значения параметров, имеющих непрерывные значения (срок, сумма кредита, возраст и т.д.), разбиваются на интервалы, которым присваиваются номера или градации (параметры 1, 2, 8, 10, 11). То есть целые и дробные значения параметров и параметра эффективности кредита заменены дискретными значениями (градациями). Данные по кредитам ПАО «ВТБ 24» представляются в табличном виде (табл. 22).
Таблица 22 - Представление статистики по кредитам в виде табличных БД и БЗ
В строках находятся кредиты i = 1, 2,..., N. В столбцах таблицы находятся параметры кредита Z1,..., Zj,..., Zn. В свою очередь параметры имеют градации Zjr, r = 1, 2,..., Nj, j = 1, 2,..., n, находящиеся в клетках таблицы. В последнем столбце находится параметр эффективности кредита Y, имеющий две градации: градация 1 («хороший», кредит возвращен) или градация 0 («плохой», кредит не возвращен). Таким образом, в таблице выделяются конечные и счетные множества кредитов, параметров для описания кредита и градаций для каждого параметра. Параметры и градации рассматриваются как случайные величины или события-параметры и события-градации, приводящие с определенной вероятностью к неуспеху кредита. События-градации для каждого параметра образуют ГНС, для которой используются неклассические правила теории вероятностей и формула Байеса. События-параметры и события-градации обозначим логическими переменными и будем применять к ним правила логического исчисления. В итоге мы получаем систему логических уравнений с левой и правой частями, или систему логических высказываний, или табличную базу знаний. С каждой логической переменной левой и правой части БЗ свяжем вероятности ее истинности и ложности. Наибольшее возможное число разных событий-кредитов равно произведению чисел градаций N1, N2,..., Nj,..., Nn в параметрах, описывающих кредит. Число кредитов в статистике банка должно быть не меньше 20 х n, где n - число параметров для описания кредитов. Сценарий риска неуспеха кредита является адекватным, ассоциативным и формулируется для всего множества возможных событий (разных кредитов). Неуспех кредита происходит, если возникают какое-либо одно, два или все инициирующие события-параметры. Заметим, что ни одна из известных скоринговых методик не использует такой сценарий риска. Структурная модель кредитного риска, представленная на рис. 8, описывает многокомпонентную систему из множества кредитов, отдельных кредитов, параметров кредита и градаций параметров.
┌────────────────────┐ ┌──────────────────────────────┤ Множество кредитов ├────────────────────┐ │ └─────────┬──────────┘ │ │ │ │ ▼ ▼ ▼ ┌─────┴────┐ ┌────┴─────┐ ┌────┴─────┐ │ Кредит 1 │... ┌──────────┤ Кредит i ├───┐... │ Кредит N │ └──────────┘ │ └─┬──────┬─┘ │ └──────────┘ │ │ │ │ ┌───────────────┘ │ │ └──────────────┐ │ │ │ │ ▼ ▼ ▼ ▼ ┌───────┴────┐ ┌──────────┴──┐ ├───────────┐ ┌────┴─────────────────┐ │ Параметр 1 │... │ Параметр j │...│Параметр n │ │Параметр успешности Y │ └────────────┘ └┬────┬──┬────┘ └───────────┘ └──┬──┬────────────┬───┘ ┌─────────────────────────┘ │ │ ┌─────────┘ │ │ ▼ ┌──────────┘ ▼ ▼ ▼ ▼ ┌─────────┴────┐ ┌──────────▼───┐ ┌─────┴─────┐ ┌────────┴─┐ ┌──────┴───┐ ┌────┴──────┐ │ Градация 1 │...│ Градация r │...│Градация Nj│ │Градация 1│...│Градация r│...│Градация Nj│ └──────────────┘ └──────────────┘ └───────────┘ └──────────┘ └──────────┘ └───────────┘ Рис. 8. Структурная модель (граф-модель) кредитного риска
Она соответствует сценарию риска неуспеха кредита и описанию кредита с помощью градации параметров. Структурную модель риска называют еще граф-моделью риска. События-параметры и итоговое событие связаны логическими связями «Или». События-градации для каждого события-параметра составляют ГНС. Событиям-параметрам и событиям-градациям поставлены в соответствие логические переменные с теми же идентификаторами. Логическая переменная Zj равна 1 с вероятностью Рj, если параметр j привел к неуспеху, и равна 0 с вероятностью Qj = 1 - Pj в противном случае. Логическая переменная Zjr, соответствующая градации r параметра j, равна 1 с вероятностью Pjr и равна 0 с вероятностью Qjr = 1 - Pjr. Вектор Z(i) = (Z1..., Zj,..., Zn) описывает объект z из таблицы. При задании объекта z вместо логических переменных Z1,..., Zj,..., Zn подставляются переменные Zjr для градаций признаков именно этого объекта i. Используется логическое сложение событий. Логическая функция (Л-модель) риска неуспеха кредита: Y = Z1 v Z2 v... v Zj v... v Zn. (4) Л-модель риска неуспеха кредита после ее ортогонализации: Y = Z1 v Z2Z1 v Z3Z2Z1 v... (5) В-модель (В-полином) риска неуспеха кредита: P = P1 + P2Q1 + P3Q1Q2 +... (6) «Арифметика» В-модели риска такова, что для события Y величина риска находится в пределах [0,1] при любых значениях вероятностей инициирующих событий-параметров. Схема классификации кредитов приведена на рис. 9.
│ «Хорошие» кредиты │ «Плохие» кредиты │ ──┼────────────┼──────────────────────────┼────────────────┼───────────────────┼─ │ │ │ │ │ 0 Pmin Pad Pmax 1
Рис. 9. Схема классификации кредитов
Риск кредита вычисляется на вероятностной модели кредитного риска, если известны вероятности событий-градаций. Последние определяются при идентификации ЛВ-модели кредитного риска по статистическим данным банка. При решении задачи идентификации вычисляется также допустимый риск Pad по заданному коэффициенту асимметрии распознавания хороших и плохих кредитов. Задача идентификации В-модели риска сформулирована следующим образом. Заданы: таблица статистических данных о кредитах, имеющая N кредитов, из которых Ng хороших и Nb плохих кредитов, и В-модель риска (3). Требуется определить: вероятности Pjr, r = 1, 2,..., Nj, j = 1, 2,..., n событий-градаций и допустимый риск Pad, разделяющий кредиты на хорошие и плохие. Целевая функция: максимизация числа корректно классифицируемых кредитов: F = Nbb + Ngg, ─► MAXPir (7) где Ngg, Nbb - соответственно числа кредитов, классифицируемых как хорошие и плохие и статистикой, и В-моделью (совпадающие оценки). Из выражения (4) следует, что точность В-модели риска в классификации хороших Еg и плохих кредитов Еb и в целом Еm равна: Eg = (Ng - Ngg) / Ng, (8) Eb = (Nb - Nbb) / Nb; Em = (N - F) / N. Допустимый риск Pad определяется при заданном отношении некорректно классифицируемых хороших и плохих кредитов из-за неэквивалентности ущерба при их неправильной классификации: Egb = (Ng - Ngg) / (Nb - Nbb). (9) Задача идентификации является нелинейной задачей оптимизации и решается алгоритмическим итеративным методом с использованием моделирования Монте-Карло или градиентов. Прозрачность риска кредита и результатов оценки и анализа кредитной деятельности банка обеспечивается вычислением вкладов параметров и градаций в риск кредита, в средний риск всего множества кредитов банка и в точность (целевую функцию) модели кредитного риска. Вклады определяются вычислением разности между значениями характеристик после идентификации ЛВ-модели и значений этих характеристик при придании соответствующим вероятностям событий-градаций нулевых значений. Таким образом, на каждом уровне структурной модели риска вычисляются следующие характеристики (атрибуты) кредитного риска: 1) количественные оценки риска градации параметра кредита: - вероятность неуспеха для кредита; - относительная вероятность неуспеха среди градаций параметра; - вероятность-частота в множестве кредитов; - вклад в точность модели риска; 2) количественные оценки риска параметра кредита: - средняя вероятность неуспеха; - структурный вес и значимость в модели риска; - вклад в риск кредита; - вклад в средний риск множества кредитов; 3) количественные оценки риска кредита: - риск неуспеха; - возможные потери; - цена за риск; - вклад в риск множества кредитов; 4) количественные оценки риска множества кредитов: - допустимый риск; - средний риск; - коэффициент асимметрии распознавания хороших и плохих кредитов; - средние потери; - допустимые потери; - число кредитов; - число опасных кредитов; - энтропия рисков опасных кредитов. Эти атрибуты полностью определяют риск и используются для управления кредитной деятельностью банка. По результатам анализа атрибутов риска градаций, параметров, кредитов и множества кредитов возможно оптимизировать саму модель кредитного риска для повышения ее точности с определением оптимального числа параметров, градаций в каждом параметре и асимметрии распознавания хороших и плохих кредитов. ПАО «ВТБ 24» может использовать простую формулу для цены (процента) за риск кредита: Ci = Cad + k (Prisk - Pad), (10) где Сi - стоимость i-го кредита; Cad - цена за допустимый риск; k - коэффициент. Технология построения и использования ЛВ-модели кредитного риска включает в себя ряд операций. 1. Табличное «стандартное» представление статистических данных о кредитах. 2. Построение сценарной и структурной моделей кредитного риска. 3. Определение событий-параметров и событий-градаций. 4. Определение групп несовместных событий (ГНС). 5. Дискретизация распределений случайных событий-градаций. 6. Построение логической модели кредитного риска. 7. Ортогонализация логической модели кредитного риска. 8. Построение вероятностной модели кредитного риска. 9. Идентификация (оптимизация) В-модели кредитного риска по статистике банка с учетом ГНС и формулы Байеса. 10. Выбор коэффициента асимметрии распознавания хороших и плохих объектов. 11. Определение допустимого кредитного риска. 12. Вычисление количественных атрибутов риска для градаций, параметров, кредита и множества кредитов. 13. Анализ кредитной деятельности банка по значениям атрибутов риска. 14. Управление кредитной деятельностью банка с назначением оптимального числа параметров, градаций в каждом параметре и асимметрии распознавания кредитов. Рассмотрим варианты представленной методики: 1. ПАО «ВТБ 24» представляет статистические данные по выданным ранее кредитам. Файл со статистикой в обезличенном виде создается банком самостоятельно, затем архивируется и отправляется по e-mail. Обновление статистики и построение новой ЛВ-модели кредитного риска проводятся периодически через 1-4 квартала. Форма обезличенного файла по статистике кредитов банка: N n N1, N2,..., Nn Y1 Z11 Z21... Zn1 Y1 Y12 Z22... Zn2 .................... YN ZN2 ZN2... ZNn, где N - число кредитов; n - число параметров; N1, N2,..., Nn - число градаций в каждом параметре; Y11, Y2,..., YN - признак успешности кредита (1 - «хороший»; 0 - «плохой»); Z11,..., ZNn - значение градаций параметров. Данные ПАО «ВТБ 24» служат для обучения ЛВ-модели риска. Числа хороших и плохих кредитов подсчитываются по файлу автоматически. Также подсчитываются числа одинаково описанных кредитов и устанавливается, какие градации параметров не используются для описания кредитов. Это позволяет контролировать данные заказа 1 и результаты обучения ЛВ-модели риска. Для кредитного риска юридических лиц категории клиентов представляются в виде градаций 1, 2, 3,... параметра «Категория клиента». Этот параметр располагается в последнем столбце таблицы, и для него вычисляются дополнительные атрибуты риска. Построение В-модели кредитного риска банка занимает время до 12 часов. Определяются атрибуты риска для градаций, параметров и множества кредитов, а также показатели качества (атрибуты) модели риска: ее точность и асимметрия распознавания. Для юридических лиц для «категорий клиентов» вычисляются дополнительно следующие атрибуты: частота категорий во всех кредитах, в плохих и хороших кредитах, а также среднее значение риска кредитов для категорий. Это позволяет оценить адекватность разделения клиентов на категории.
|