Рубрика «скоринг»

В условиях когда большая часть заявок на кредит рассматривается автоматически, мониторинг становится особенно важным. Всё ли работает в штатном режиме, как меняются ключевые показатели, какие изменения нужно внести, чтобы добиться нужного результата?

В статье я расскажу, как мы мониторим кредитный конвейер с помощью Power BI, какие отчеты и метрики используем для оценки качества выдач.

Ключевые показатели внутри дня

Мониторинг работы кредитного скоринга в Power BI - 1
Читать полностью »

Рассмотрим, как работают алгоритмы в банковском скоринге, какие метрики используются и какие параметры заемщика влияют на то, выдадут кредит или нет. В статье описывается прошедший конкурс с kaggle по предсказанию вероятности дефолта и приводятся влияющие на риск дефолта параметры.

Ошибка первого и второго рода

Цель банка – заработать деньги. Первый риск, с которым сталкивается кредитная организация — дать кредит заемщику, который допустит дефолт. Дефолт может иметь разным причины, от финансовых трудностей заемщика, и заканчивая фродом.

Для банка это — ошибка первого рода.

Но если банк будет вести жесткую политику, и никому не выдает кредиты, даже тем, кто вернул бы деньги, то банк не заработает на процентах. Отказ в кредите ответственному заемщику – ошибка второго рода.

Для оценки качества принимаемых алгоритмом решений, используется коэффициент Джини (GINI). В экономике и в Data Science коэффициент Gini имеет разную интерпретацию. Для кредитного скоринга он рассчитывается, как

GINI = 2 ROC AUC — 1

Для оценки банковского скоринга используется стандартная ROC AUC кривая!

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk - 1
Читать полностью »

Как выяснили РБК из ходатайства ООО «Дабл» (работает под брендом Double Data), в 2019-м году ВКонтакте называет автором пользовательской базы данных соцсети управляющего директора ВК Андрея Рогозова. Предположительно, что одновременно Павел Дуров, основатель и бывший глава ВК, больше не считается создателем базы, Читать полностью »

Глава Visa в России Екатерина Петелина, рассказала, «Ведомостям», что платёжная система и бюро кредитных историй (БКИ) «Эквифакс» запустили совместный сервис по оценке кредитоспособности россиян. Союз с БКИ позволил платёжной системе обойти собственные же ограничения: «Visa не знает, кому принадлежат карты», — напомнила Петелина, — только 16-значный номер, Читать полностью »

МегаФон (контролирующий акционер группы Mail.ru) и Mastercard анонсировали «мобильный финансовый маркетплейс», передал корреспондент RNS с презентации на Mobile World Congress 2019 в Барселоне. Ожидается, что платформа заработает до конца 2019 года. Content-Review.com выяснил у оператораЧитать полностью »

В прошлой статье мы рассмотрели алгоритм скоринга, основанный на резких ускорениях и торможениях. Результаты скоринга по такому алгоритму слабо коррелируют с вероятностью ДТП. В этой статье мы обратимся к более продвинутым алгоритмам анализа стиля вождения, основанным на значениях скорости, оборотов двигателя и показателях акселерометра.

Как устроен скоринг в индустрии каршеринга. Часть 2. Определить агрессивного водителя за 5 секунд - 1
Читать полностью »

Каршеринг, несмотря на свою молодость, — одно из самых активно развивающихся направлений в автобизнесе России. С момента запуска первой компании прошло 5 лет, и сегодня на рынке работают более 25 операторов, специализирующихся на краткосрочной аренде. С развитием каршеринга накапливаются данные о пользователях, и вот уже у каршеринга, как у банков, появляется некая система скоринга клиентов. Она также опирается на возраст, пол, стаж вождения, однако здесь рассматривается не история ваших кредитов, а история поездок. Одной из целей такого скоринга, помимо платежеспособности, валидации водительского удостоверения, штрафов, является предсказание вероятности ДТП для конкретного водителя.

Как устроен скоринг в индустрии каршеринга. Часть 1. Обзор популярных инструментов на реальных данных - 1

В этой статье мы разберем логику работы алгоритмов скоринга пользователей каршеринга, которые будут опираться только на возраст и стиль вождения. Помимо этих параметров, и для получения более точных результатов, могут быть использованы — социальный статус, поездки с детьми, активность в социальных сетях и информация с камеры в салоне автомобиля. Однако, сегодня остановимся на двух базовых — возраст и стиль вождения.

Отметим, что в статье мы продемонстрируем логику работы скоринга на примере водительской активности 50 000 пользователей и 260 000 поездок. Все данные были анонимизированны. Кроме того, мы использовали данные по 220 ДТП, совершенных с Москве и МО.
Читать полностью »

«Коммерсант», со ссылкой на подтверждение госкорпорации «Ростех», рассказал о создании совместного предприятия Газпромбанка, «Ростеха», USM Holdings Алишера Усманова и подконтрольного предпринимателю «МегаФона». Сотовый оператор внесёт в СП часть пакета Mail.ru Group (MRG) — 5,23% экономической и 58,87% голосующей доли в интернет-холдинге. Принадлежащие MRG соцсети Читать полностью »

Национальное бюро кредитных историй (НБКИ) на «легальной и прозрачной основе», по описанию представителя Mail.ru Group, получило доступ к данным о пользователях «ВКонтакте», передал РБК, сославшийся на 3 источника на рынке данных. Один из них утверждает, Читать полностью »

Интересный факт: в 1912 году итальянский статистик и демограф Коррадо Джини написал знаменитый труд «Вариативность и изменчивость признака», и в этом же году «Титаник» затонул в водах Атлантики. Казалось бы, что общего между этими двумя событиями? Всё просто, их последствия нашли широкое применение в области машинного обучения. И если датасет «Титаник» в представлении не нуждается, то об одной замечательной статистике, впервые опубликованной в труде итальянского учёного, мы поговорим поподробней. Сразу хочу заметить, что статья не имеет никакого отношения к коэффициенту Джини (Gini Impurity), который используется в деревьях решений как критерий качества разбиения в задачах классификации. Эти коэффициенты никак не связаны друг с другом и общего между ними примерно столько же, сколько общего между трактором в Брянской области и газонокосилкой в Оклахоме.

Коэффициент Джини (Gini coefficient) — метрика качества, которая часто используется при оценке предсказательных моделей в задачах бинарной классификации в условиях сильной несбалансированности классов целевой переменной. Именно она широко применяется в задачах банковского кредитования, страхования и целевом маркетинге. Для полного понимания этой метрики нам для начала необходимо окунуться в экономику и разобраться, для чего она используется там.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js