Продукты на базе технологий big data

15
Продукты н бзе технологий Big Data Центр приклдных днных

Upload: igor-bardintsev

Post on 15-Apr-2017

110 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Продукты на базе технологий Big Data

Продукты н� б�зетехнологий Big Data

Центр прикл�дных д�нных

Page 2: Продукты на базе технологий Big Data

Сберб�нк р�спол�г�ет уник�льным м�ссивом д�нныхо своих клиент�х и их фин�нсовом поведении

2

Ч�стные Клиенты Корпор�тивные Клиенты

Историческ�� б�з�

140 миллионов

Более 2000

клиентов

Историческ�� б�з�

6,5 миллионов

Более 100

клиентов

ф�кторов дл� �н�лиз�ф�кторов дл� �н�лиз�

Page 3: Продукты на базе технологий Big Data

Большие д�нныеМы �н�лизируем д�нные по 140 млн клиентов (историческ�� б�з�)

3

2 000клиентских призн�ков

Сбережени�

Тр�нз�кции

Фин�нсовое поведение

Демогр�фи�

Демогр�фи�

Инвестиции

�втопл�тежи(мобильн�� св�зь,

н�логи, и т.д.)�ктивы

(кредиты, ипотек�,к�рты)

Мобильный б�нк

Интернет б�нк

Пл�тежи

Стр�хов�ние

Б�нковские к�рты

Конт�ктныед�нные

(номер� телефон�,MAC-�дрес�, e-mail)

Геод�нные(место прожив�ни�,

р�боты, путешествий,текущее

местоположение)

Интересы(спорт, кино,

рецепты, hi-tech,политик�, мод�

и т.д.)

Домохоз�йств�

Page 4: Продукты на базе технологий Big Data

В портфеле Сберб�нк� более 30 �ктивныхмоделей

4

Реш�емые з�д�чи

Модели

• Оптимиз�ци� отклик� н� продукты/услуги/�кциипо к�н�л�м (телем�ркетинг/почт�/смс)

• ктивные продукты – потребительский кредит, кредитн�� к�рт�, депозит, стр�ховк�, …

• ктивные услуги – мобильный б�нк, �втопл�теж,мобильное приложение, �ктив�ци� сберб�нконл�йн web, ...

• ктивные �кции – �ктив�ци� кредитных к�рт,увеличение POS оборотов, отток по кредитнымк�рт�м, отток по дебетовым к�рт�м, ...

Модели отклик� н� коммуник�цию

• Сегмент�ци� клиентов по к�рточнымтр�нз�кци�м

• Сегмент�ци� фили�лов по вход�щему потоку

• Сегмент�ци� клиентов по �приорноз�д�нным критери�м

Модели сегмент�ции

• Оценк� доход� клиент�

• Оценк� переход� в ВИП к�н�л

Модели оценки клиент�

• Модель прогноз� доходности портфел�инвестиций

Модели оценки инвестиров�ни�

Page 5: Продукты на базе технологий Big Data

Все модели проход�т об�з�тельные ст�диисозд�ни� и оценки

5

Диз�йн выборки дл� моделиров�ни�

Фильтр�ци� и очистк� д�нных

Все переменные дел�ем дискретными

WoE, IV

Одномерный �н�лиз

Оптим�льный биннинг

Уменьшение р�змерности – укрупненный биннинг

Моделиров�ние регрессии

В�лид�ци� н� другом временном интерв�ле

Оценк� выборки н� ближ�йшую д�ту

К�либровк� модели

Документ�ци�

Имплемент�ци�

Мониторинг

WoE — пок�зыв�ет, н�сколько соотношение«хороших» и «плохих» клиентов в д�нной группе

призн�к� отлич�етс� от среднего

WoE = log( )= log( : )prc_goodprc_bad

prc_goodprc_bad

total_goodtotal_bad

Ш�ги р�зр�ботки модели К�к мы оценив�ем вли�ние к�ждой переменной

Х�р�ктеризует р�здел�ющую способностьпеременной, позвол�ет ср�внив�ть

переменные между собой

IV = (prc_good - prc_bad)*WoE

Модели

Page 6: Продукты на базе технологий Big Data

К�жд�� модель проходит процедуру оценкик�честв�

6

score goods(%) bads(%) cumulative goods(%)

cumulative bads(%)

cum. bads-cum.goods

0%

16%

29%

38%

44%

44%

38%

29%

16%

0 0

2% 18%

4% 16%

5% 15%

7% 13%

9% 11%

11% 9%

13% 7%

15% 5%

16% 4%

0

50

150

250

350

450

550

650

750

850

950 18% 2%

0%

2%

5%

11%

18%

27%

38%

51%

65%

82%

100%

0%

18%

35%

49%

62%

82%

89%

95%

98%

100% 0%

Коэффициенты Джини и Колмогоров�-Смирнов� используютс� дл�оценки предск�з�тельной мощности модели. Более высокое зн�чение

озн�ч�ет лучшую модель.

0%

20%

40%

60%

80%

100%

0% 20% 40% 60% 80% 100%

A

Pe

rfe

ct

Random

CPerfect

Cum. good

Cum. bad

Коэффициент Колмогоров�-Смирнов�

0 150 350 550 750 950

0%

20%

40%

60%

80%

100%

KS=45%

Коэффициент Джини

Gini = = = 2*AA A

A+C 1/2

Модели

Н�копленное число неоткликнувшихс� вз�висимости от скорб�лл�

Н�копленное числооткликов в з�висимостиот скорб�л�

Gini

45%73%

Page 7: Продукты на базе технологий Big Data

Использов�ние моделей позвол�ет существенноповысить эффективность к�мп�нии прод�ж

7

Модели

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%

11%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Прогнозный отклик

Ф�ктический отклик

Влияние факторовМодель склонности покупки потребительского кредита*

*Пример

Кредиты/пл�тежи

П�ссивы

Тр�нз�кции

Предыдущиеконт�кты

Соц-дем ф�кторы

30%

30%

20%

15%5%

Дол� согл�сившихс� = 1,71%ROI = 2

Без модели Выбор по модели

Дол� согл�сившихс� = 4,24%ROI = 5,1

Page 8: Продукты на базе технологий Big Data

Сберб�нк созд�ет и примен�ет все типымоделей

8

Дескриптивн�� Прескриптивн�� Предписыв�ющ��

Что происходит сейч�с?

Выделение ключевых х�р�ктеристик,группировк� д�нных

Что произойдет д�льше?

Прогнозиров�ние веро�тностин�ступлени� будущих

событий

К�к мы можемповли�ть н� событи�?

Рекоменд�цииупр�вл�ющих действий

Группировк� клиентов по тип�м

фин�нсового поведени�,

н�пример: «н�копители»,

«тр�нжиры»

Сегмент�ци� клиентской б�зы Модель склонностиклиент� к покупке

Модель инвестиционногопортфел�

Модель склонности к покупке

потребительского кредит�

Модели

Модель предл�г�ет клиенту инвестиров�ть средств� в определенный н�бор инструментов и вычисл�ет предпол�г�емую будущую доходность

Page 9: Продукты на базе технологий Big Data

Сберб�нк обл�д�ет уник�льной технологическойпл�тформой по р�боте с большими д�нными

9

Модели

Технологии и Инструменты �н�лиз� и Визу�лиз�ции Д�нныхBusiness Intelligence (BI)

М�шинное обучениеMachine Learning (ML)

Рел�ционные системыупр�влени� б�з�ми д�нных

(RDBMS)

М�ссивно п�р�ллельные системы упр�влени�

б�з�ми д�нных

Massive Parallel Processing(MPP)

Р�спределенные системы хр�нени� и обр�ботки

д�нных любых форм�тов

Hadoop

Системы р�спределенной обр�ботк� д�нных в опер�тивной п�м�ти

InMemory

Специ�лизиров�нные системы упр�влени�

б�з�ми д�нных

GraphDB

FastGraph

Технологии и ИнструментыИнтегр�ции и Тр�нсформ�ции Д�нных

Extract Transform Load (ETL)

Page 10: Продукты на базе технологий Big Data

10

Модель 1. Прогноз клиентского отклик�н� продукт стр�хов�ни� жизни

Кейсы

Влияние факторовГрафик согласившихся

В промышленной эксплуатации

ктивностьпо к�рт�м

Профиль тр�тклиент�

Истори� отношенийс клиентом

Соц-дем ф�кторы

30%

45%

15%10%

0%

2%

4%

6%

8%

10%

12%

14%

% Согла

сивш

ихся

Процентиль5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100%

Факт

В среднем

Без модели Выбор по моделиДол� согл�сившихс� = 5,85%Б�з� 100 000 клиентовДоход с 1 прод�жи = o2000Стоимость одного телефонного звонк� = o50Доход з� всю к�мп�нию = o6,7 млн

Дол� согл�сившихс� = 4,24%Б�з� 100 000 клиентовДоход с 1 прод�жи = o2000Стоимость одного телефонного звонк� = o50Доход з� всю к�мп�нию = o3,48 млн

Рост кл

иентск

ого

откли

к� н�

38%

Page 11: Продукты на базе технологий Big Data

11

Кейсы

Текущие п�р�метры прод�ж без использов�ни� модели:

Покупку соверш�ют 5% от клиентской б�зытелем�ркетинг�

�н�лиз проводитс� по 1 500 п�р�метр�м

СБОЛ

Мобильный б�нкВозр�ст

Тр�нз�кции

Фин�нсовыепродукты

Доходы

Кредиты

Сбережени�

Р�сходыпо к�тегори�м

Рост клиентского отклик�

2016 2017 2018

10% 15% 20%

Средн�� сумм� взносов в год выросл�

В 8 Р�З*

�ктивныедоговоры

Ожид�емый результ�тпрод�ж с использов�ние модели:Примен�ем модель

Сберб�нк

*По итог�м пилот�

Модель 2. Прогноз клиентского отклик� н�продукт «негосуд�рственное пенсионное обеспечение»В опытной эксплуатации

Page 12: Продукты на базе технологий Big Data

12

Модель 3. Сегмент�ци� клиентской б�зыпо склонности к покупке р�зличных групп тов�ров

Кейсы

Б�з� Клиентов Б�з� Клиентов

Рекл�м�

МоделиСберб�нк�

В опытной эксплуатации

Готов купить м�шину

Групп�

Готов купить тов�рыдл� животных

Групп�

Page 13: Продукты на базе технологий Big Data

Модель 4. Гр�ф клиентских св�зей

13

Н�зв�ние

Объем выручкипо СП�РК

Ст�тус CRM

ИНН

Н�зн�чение клиентскогоменеджер�

Продукты, имеющиес� у клиент�

Булевый призн�к н�личи� ВЭД

ИНН

Зон� проблемности

Ст�тус CRM

Территори�

Сегмент

Н�зв�ние

Продукты (список, число)

Мы зн�ем о н�ших клиент�х

ВСЁ

Клиент Lead

Кейсы

В ст�дии ре�лиз�ции

Page 14: Продукты на базе технологий Big Data

14

В ст�дии ре�лиз�ции

Зоны интенсивногопешеходного поток�

Пок�зыв�емфин�нсы

пешеходногопоток� в

несколькихр�зрез�х

u

u

u

Д�нные дл� �н�лиз�денежных средств

пешеходного поток�

Сотовые д�нные

Тр�нз�кции

Модель 5. Геом�ркетинг Кейсы

Ценность пешеходного поток�(его фин�нсовый профиль)1

К�рт� тр�нз�кционной�ктивности город�2

�н�лиз ст�вок �ренды3

Инструменты дл� �н�литики(ср�внение обл�стей,теплов�� к�рт�, и пр.)

5

�н�лиз стоимостиобъектов недвижимости4

Page 15: Продукты на базе технологий Big Data

15

Конт�кты

Дл� з�к�з� продукт�просто н�пр�вьте письмо с опис�нием идеи по �дресу

[email protected]

П�О Сберб�нк

Центр прикл�дных д�нных