Главная

Ловись, рыбка: как использовать «озеро данных» в банке. Опыт ВТБ

2017-08-24 в 15:14, admin, рубрики: Блог компании ВТБ, втб, данные, информация

Вы идете в банк за кредитом на развитие бизнеса, на покупку авто или на другие цели. Давать или не давать – в каждом случае специалисты банка решают этот вопрос индивидуально, принимая во внимание кредитную историю клиента, размер его дохода и другие факторы. Казалось бы, система кредитования давно настроена и исправно работает. Можно ли придумать что-то новое в этом отношении? Мы в рознице ВТБ отвечаем на этот вопрос утвердительно. Исследования подтверждают: данные о клиентском поведении, которые имеются в распоряжении банка, задействованы далеко не полностью, и в этом направлении использование IT дают очень хороший эффект!

Ловись, рыбка: как использовать «озеро данных» в банке. Опыт ВТБ - 1

Как мы интегрируем IT в бизнес и какие преимущества получают клиенты – читайте под катом.

В 2016 году для розничного направления Группы ВТБ мы реализовали первый этап крупного проекта по обработке и анализу клиентской информации. Благодаря этому проекту наши клиенты стали получать персональные предложения, основанные на анализе их поведения в прошлом. На первом этапе мы собрали и используем до 60% данных, и результаты превзошли все ожидания. Большинство клиентов охотно приняли индивидуальные предложения и, что самое главное – остались довольны. Значит, идея избирательного подхода сработала, система функционирует на «отлично».

Сейчас на очереди второй этап – запуск новой платформы DataResearchPlatform на основе DataLake («озера данных»), которая в перспективе должна охватить 99,9% всех имеющихся в банке данных о клиентской активности.

Почему DataLake?

Как и все современные решения в области Big Data, наша новая платформа DataResearchPlatform построена на основе «озера данных». Почему мы выбрали именно эту технологию? DataLake хорош тем, что позволяет хранить огромные объемы «сырых» данных в их первоначальном формате. Эти данные могут использоваться как угодно: сопоставляться, смешиваться, организовываться по различным критериям. В отличие от стандартного хранилища данных, данные DataLake доступны аналитикам сразу в полном объеме и со всеми исходными связями. Это дает больше возможностей для поиска самых неожиданных вариантов их использования, но для этого нужны соответствующие технологии и инструменты.

Клиентская информация обрабатывается с использованием интеллектуального анализа данных data mining. Благодаря этому специалисты банка могут проверять свои гипотезы о клиентском поведении и его влиянии на платежеспособность, а также разрабатывать новые предсказательные модели.

Есть и другие «фишки», которые мы планируем получить при работе с DataLake:

вырастить собственных пользователей профилей DataArchitect и DataScientist в корпоративной среде;
получить отличный опыт в глубинном анализе данных;
полностью пересмотреть и улучшить системы управления информацией о клиентах (CRM);
научиться точнее предсказывать риск для каждого конкретного клиента.

Когда система налажена, банк может брать самые современные удочки и отправляться на рыбалку на свое «озеро». И можно не сомневаться: каждый раз улов будет превосходный, и им захочется поделиться с клиентами. Благодаря глубокому анализу клиентского поведения, банк может предлагать заемщикам специальные предложения, лучшие кредитные условия и индивидуальные (более лояльные) процентные ставки по кредитам.

Как работает DataResearchPlatform?

До того, как было принято решение перейти на DataLake, в ВТБ уже существовало хранилище данных, поэтому первое, что мы сделали – интегрировали с ним новую платформу.

Кроме этого, на первом этапе мы работали над отладкой технологической среды для моделирования: были отработаны механизмы обновления всего установленного ПО и расширен кластер Hadoop. Также было важно выработать новые подходы к работе пользователей, поскольку новая платформа накладывает определенные требования к разграничению доступа к данным.

В итоге нынешняя версия DataResearchPlatform развернута на 12 узлах BDA объемом до 288 ТБ (в планах ее расширение до 18 узлов до конца года). Платформа работает на основе экосистемы Hadoop, технологий OpenSource и промышленных Enterprise-решений. Она базируется на программно-аппаратном решении Oracle BigData Appliance. Для работы с данными используются аналитические инструменты SAS HPDM, SAS EG, Python, R.

Пользователи профиля DataArchitect и DataScientist получили полностью безопасный доступ к данным, а объемы данных были расширены. Теперь в DataResearchPlatform уже собирается практически вся информация о клиентской активности, которая имеется в распоряжении банка. Ее в любой момент можно «выловить» из «озера» и использовать во благо клиента.

Рабочая команда проекта: члены правления ВТБ24 — А.Соколов и С.Русанов.

Автор: tashanov

Источник