Download - Продукты на базе технологий Big Data
Продукты н� б�зетехнологий Big Data
Центр прикл�дных д�нных
Сберб�нк р�спол�г�ет уник�льным м�ссивом д�нныхо своих клиент�х и их фин�нсовом поведении
2
Ч�стные Клиенты Корпор�тивные Клиенты
Историческ�� б�з�
140 миллионов
Более 2000
клиентов
Историческ�� б�з�
6,5 миллионов
Более 100
клиентов
ф�кторов дл� �н�лиз�ф�кторов дл� �н�лиз�
Большие д�нныеМы �н�лизируем д�нные по 140 млн клиентов (историческ�� б�з�)
3
2 000клиентских призн�ков
Сбережени�
Тр�нз�кции
Фин�нсовое поведение
Демогр�фи�
Демогр�фи�
Инвестиции
�втопл�тежи(мобильн�� св�зь,
н�логи, и т.д.)�ктивы
(кредиты, ипотек�,к�рты)
Мобильный б�нк
Интернет б�нк
Пл�тежи
Стр�хов�ние
Б�нковские к�рты
Конт�ктныед�нные
(номер� телефон�,MAC-�дрес�, e-mail)
Геод�нные(место прожив�ни�,
р�боты, путешествий,текущее
местоположение)
Интересы(спорт, кино,
рецепты, hi-tech,политик�, мод�
и т.д.)
Домохоз�йств�
В портфеле Сберб�нк� более 30 �ктивныхмоделей
4
Реш�емые з�д�чи
Модели
• Оптимиз�ци� отклик� н� продукты/услуги/�кциипо к�н�л�м (телем�ркетинг/почт�/смс)
• ктивные продукты – потребительский кредит, кредитн�� к�рт�, депозит, стр�ховк�, …
• ктивные услуги – мобильный б�нк, �втопл�теж,мобильное приложение, �ктив�ци� сберб�нконл�йн web, ...
• ктивные �кции – �ктив�ци� кредитных к�рт,увеличение POS оборотов, отток по кредитнымк�рт�м, отток по дебетовым к�рт�м, ...
Модели отклик� н� коммуник�цию
• Сегмент�ци� клиентов по к�рточнымтр�нз�кци�м
• Сегмент�ци� фили�лов по вход�щему потоку
• Сегмент�ци� клиентов по �приорноз�д�нным критери�м
Модели сегмент�ции
• Оценк� доход� клиент�
• Оценк� переход� в ВИП к�н�л
Модели оценки клиент�
• Модель прогноз� доходности портфел�инвестиций
Модели оценки инвестиров�ни�
Все модели проход�т об�з�тельные ст�диисозд�ни� и оценки
5
Диз�йн выборки дл� моделиров�ни�
Фильтр�ци� и очистк� д�нных
Все переменные дел�ем дискретными
WoE, IV
Одномерный �н�лиз
Оптим�льный биннинг
Уменьшение р�змерности – укрупненный биннинг
Моделиров�ние регрессии
В�лид�ци� н� другом временном интерв�ле
Оценк� выборки н� ближ�йшую д�ту
К�либровк� модели
Документ�ци�
Имплемент�ци�
Мониторинг
WoE — пок�зыв�ет, н�сколько соотношение«хороших» и «плохих» клиентов в д�нной группе
призн�к� отлич�етс� от среднего
WoE = log( )= log( : )prc_goodprc_bad
prc_goodprc_bad
total_goodtotal_bad
Ш�ги р�зр�ботки модели К�к мы оценив�ем вли�ние к�ждой переменной
Х�р�ктеризует р�здел�ющую способностьпеременной, позвол�ет ср�внив�ть
переменные между собой
IV = (prc_good - prc_bad)*WoE
Модели
К�жд�� модель проходит процедуру оценкик�честв�
6
score goods(%) bads(%) cumulative goods(%)
cumulative bads(%)
cum. bads-cum.goods
0%
16%
29%
38%
44%
44%
38%
29%
16%
0 0
2% 18%
4% 16%
5% 15%
7% 13%
9% 11%
11% 9%
13% 7%
15% 5%
16% 4%
0
50
150
250
350
450
550
650
750
850
950 18% 2%
0%
2%
5%
11%
18%
27%
38%
51%
65%
82%
100%
0%
18%
35%
49%
62%
82%
89%
95%
98%
100% 0%
Коэффициенты Джини и Колмогоров�-Смирнов� используютс� дл�оценки предск�з�тельной мощности модели. Более высокое зн�чение
озн�ч�ет лучшую модель.
0%
20%
40%
60%
80%
100%
0% 20% 40% 60% 80% 100%
A
Pe
rfe
ct
Random
CPerfect
Cum. good
Cum. bad
Коэффициент Колмогоров�-Смирнов�
0 150 350 550 750 950
0%
20%
40%
60%
80%
100%
KS=45%
Коэффициент Джини
Gini = = = 2*AA A
A+C 1/2
Модели
Н�копленное число неоткликнувшихс� вз�висимости от скорб�лл�
Н�копленное числооткликов в з�висимостиот скорб�л�
Gini
45%73%
Использов�ние моделей позвол�ет существенноповысить эффективность к�мп�нии прод�ж
7
Модели
0%
1%
2%
3%
4%
5%
6%
7%
8%
9%
10%
11%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Прогнозный отклик
Ф�ктический отклик
Влияние факторовМодель склонности покупки потребительского кредита*
*Пример
Кредиты/пл�тежи
П�ссивы
Тр�нз�кции
Предыдущиеконт�кты
Соц-дем ф�кторы
30%
30%
20%
15%5%
Дол� согл�сившихс� = 1,71%ROI = 2
Без модели Выбор по модели
Дол� согл�сившихс� = 4,24%ROI = 5,1
Сберб�нк созд�ет и примен�ет все типымоделей
8
Дескриптивн�� Прескриптивн�� Предписыв�ющ��
Что происходит сейч�с?
Выделение ключевых х�р�ктеристик,группировк� д�нных
Что произойдет д�льше?
Прогнозиров�ние веро�тностин�ступлени� будущих
событий
К�к мы можемповли�ть н� событи�?
Рекоменд�цииупр�вл�ющих действий
Группировк� клиентов по тип�м
фин�нсового поведени�,
н�пример: «н�копители»,
«тр�нжиры»
Сегмент�ци� клиентской б�зы Модель склонностиклиент� к покупке
Модель инвестиционногопортфел�
Модель склонности к покупке
потребительского кредит�
Модели
Модель предл�г�ет клиенту инвестиров�ть средств� в определенный н�бор инструментов и вычисл�ет предпол�г�емую будущую доходность
Сберб�нк обл�д�ет уник�льной технологическойпл�тформой по р�боте с большими д�нными
9
Модели
Технологии и Инструменты �н�лиз� и Визу�лиз�ции Д�нныхBusiness Intelligence (BI)
М�шинное обучениеMachine Learning (ML)
Рел�ционные системыупр�влени� б�з�ми д�нных
(RDBMS)
М�ссивно п�р�ллельные системы упр�влени�
б�з�ми д�нных
Massive Parallel Processing(MPP)
Р�спределенные системы хр�нени� и обр�ботки
д�нных любых форм�тов
Hadoop
Системы р�спределенной обр�ботк� д�нных в опер�тивной п�м�ти
InMemory
Специ�лизиров�нные системы упр�влени�
б�з�ми д�нных
GraphDB
FastGraph
Технологии и ИнструментыИнтегр�ции и Тр�нсформ�ции Д�нных
Extract Transform Load (ETL)
10
Модель 1. Прогноз клиентского отклик�н� продукт стр�хов�ни� жизни
Кейсы
Влияние факторовГрафик согласившихся
В промышленной эксплуатации
ктивностьпо к�рт�м
Профиль тр�тклиент�
Истори� отношенийс клиентом
Соц-дем ф�кторы
30%
45%
15%10%
0%
2%
4%
6%
8%
10%
12%
14%
% Согла
сивш
ихся
Процентиль5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100%
Факт
В среднем
Без модели Выбор по моделиДол� согл�сившихс� = 5,85%Б�з� 100 000 клиентовДоход с 1 прод�жи = o2000Стоимость одного телефонного звонк� = o50Доход з� всю к�мп�нию = o6,7 млн
Дол� согл�сившихс� = 4,24%Б�з� 100 000 клиентовДоход с 1 прод�жи = o2000Стоимость одного телефонного звонк� = o50Доход з� всю к�мп�нию = o3,48 млн
Рост кл
иентск
ого
откли
к� н�
38%
11
Кейсы
Текущие п�р�метры прод�ж без использов�ни� модели:
Покупку соверш�ют 5% от клиентской б�зытелем�ркетинг�
�н�лиз проводитс� по 1 500 п�р�метр�м
СБОЛ
Мобильный б�нкВозр�ст
Тр�нз�кции
Фин�нсовыепродукты
Доходы
Кредиты
Сбережени�
Р�сходыпо к�тегори�м
Рост клиентского отклик�
2016 2017 2018
10% 15% 20%
Средн�� сумм� взносов в год выросл�
В 8 Р�З*
�ктивныедоговоры
Ожид�емый результ�тпрод�ж с использов�ние модели:Примен�ем модель
Сберб�нк
*По итог�м пилот�
Модель 2. Прогноз клиентского отклик� н�продукт «негосуд�рственное пенсионное обеспечение»В опытной эксплуатации
12
Модель 3. Сегмент�ци� клиентской б�зыпо склонности к покупке р�зличных групп тов�ров
Кейсы
Б�з� Клиентов Б�з� Клиентов
Рекл�м�
МоделиСберб�нк�
В опытной эксплуатации
Готов купить м�шину
Групп�
Готов купить тов�рыдл� животных
Групп�
Модель 4. Гр�ф клиентских св�зей
13
Н�зв�ние
Объем выручкипо СП�РК
Ст�тус CRM
ИНН
Н�зн�чение клиентскогоменеджер�
Продукты, имеющиес� у клиент�
Булевый призн�к н�личи� ВЭД
ИНН
Зон� проблемности
Ст�тус CRM
Территори�
Сегмент
Н�зв�ние
Продукты (список, число)
Мы зн�ем о н�ших клиент�х
ВСЁ
Клиент Lead
Кейсы
В ст�дии ре�лиз�ции
14
В ст�дии ре�лиз�ции
Зоны интенсивногопешеходного поток�
Пок�зыв�емфин�нсы
пешеходногопоток� в
несколькихр�зрез�х
u
u
u
Д�нные дл� �н�лиз�денежных средств
пешеходного поток�
Сотовые д�нные
Тр�нз�кции
Модель 5. Геом�ркетинг Кейсы
Ценность пешеходного поток�(его фин�нсовый профиль)1
К�рт� тр�нз�кционной�ктивности город�2
�н�лиз ст�вок �ренды3
Инструменты дл� �н�литики(ср�внение обл�стей,теплов�� к�рт�, и пр.)
5
�н�лиз стоимостиобъектов недвижимости4
15
Конт�кты
Дл� з�к�з� продукт�просто н�пр�вьте письмо с опис�нием идеи по �дресу
П�О Сберб�нк
Центр прикл�дных д�нных