Михаил Хохлов «Математическая модель для...

Post on 16-Jun-2015

15.603 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

DESCRIPTION

Научно-технический семинар «Яндекс.Пробки: прогнозируем ситуацию на дороге» в московском офисе Яндекса, 13 декабря 2012 Михаил Хохлов, разработчик инфраструктуры Яндекс.Пробок, Москва.

TRANSCRIPT

Яндекс.Пробки: прогнозируем ситуацию на дороге

Михаил ХохловРазработчик

3

4

5

6

???

Входные данные

Постановка задачи

Методы решения

Оценка качества

Математика

9

20 км/ч

Способ получения данных

35 км/ч 15 км/ч

10

Данные от пользователей

10

Время

Скорость

120

100

80

60

40

20

0

11

Данные от пользователей

11

Время0

Скорость

Итерационное сглаживание

1212

Итерационное сглаживание

10:009:40 9:50 10:10

1313

1414

Время проезда Скорость

Случай #1 10 сек. 36 км/ч

Случай #2 100 сек. 3,6 км/ч

Среднее 55 сек. (~ 7 км/ч) ~ 20 км/ч

Случай #1100 метров

36 км/ч

Случай #2100 метров

3,6 км/ч

1515

Время проезда Скорость

Случай #1 10 сек. + 10 сек. 36 км/ч

Случай #2 100 сек. + 10 сек. 6,5 км/ч

Случай #3 10 сек. + 100 сек. 6,5 км/ч

Случай #4 100 сек. + 100 сек. 3,6 км/ч

Среднее 110 сек. (~ 7 км/ч) ~ 13 км/ч

100 метров 100 метров

? км/ч

20 км/ч 20 км/ч

16

Предсказать время проезда по каждому участку дороги через 15–30–45–60 мин, наблюдая времена проезда сейчас и имея историю таких наблюдений в прошлом.

Постановка математической задачи

18

Физическое моделированиеПотоковые моделиИмитационные модели

Машинное обучениеАвторегрессияK ближайших соседей

Методы решения

19

Имитационные модели

20

Потоковые модели

21

Поток от плотности

22

Поток от плотности

23

Метод авторегрессии

23

Прогноз:

24

Метод авторегрессии

24

Минимизируемые критерии:Сумма квадратов подразумевает нормальное распределение ошибок, очень чувствительна к выбросам.Сумма модулей менее чувствительна к выбросам, но гораздо вычислительно сложнее.

Выбор предикторов:Геометрические соседи могут включать в себя много лишних ребер (например, в центре Москвы).Топологические соседи могут упустить что-то важное (например, проспект и дублер).Автоматический выбор предикторов выглядит перспективно.

25

LARS

25

Процедура регуляризации LARS.

26

Метод k ближайших соседей

26

Картина пробок #1

27

Метод k ближайших соседей

27

Картина пробок #2

28

Метод k ближайших соседей

28

Картина пробок #3

29

Прогноз:

Метод k ближайших соседей

29

3030

Оценка качества

Задача сравнить:

Разные математические модели.

Дороги с разным количеством данных.

Дороги с разной степенью загруженности.

3131

Оценка качества

3232

Оценка качества

3333

Оценка качества

34

Граф дорог

Граф дорог —100GbИстория наблюдений — десятки Tb

35

Метод k ближайших соседей

Метод авторегрессии

40

Наш прогноз

+12…15%

Маршрут безучета пробок

Статистикапробок

Пробки намомент выезда

Провидец

Качество

Разработчик

Спасибо

Кандидат физико-математических наук

Михаил Хохлов

top related