Методы машинного обучения в физике элементарных...

49

Upload: andrey-ustyuzhanin

Post on 20-Jul-2015

157 views

Category:

Science


7 download

TRANSCRIPT

Page 1: Методы машинного обучения в физике элементарных частиц
Page 2: Методы машинного обучения в физике элементарных частиц

Андрей Устюжанин

Методы машинного обучения в физике элементарных частиц

27 октября 2014

Page 3: Методы машинного обучения в физике элементарных частиц

Из чего сделана наша вселенная?

Универсальные законы?

Что такое антиматерия? темная материя?

Как перейти от законов микро-мира к законам макро-мира?

3

Вопросы «на миллион»

Page 4: Методы машинного обучения в физике элементарных частиц

Гипотезы → Эксперименты → Законы

4

F=ma

E=mc2

Стандартная модель

Суперсимметричная модель частиц (SUSY)?

Гравитоны?

Page 5: Методы машинного обучения в физике элементарных частиц

Экспериментальная наука «тогда»

5

Page 6: Методы машинного обучения в физике элементарных частиц

Эксперименты «сегодня»

6

Page 7: Методы машинного обучения в физике элементарных частиц

Эксперименты и ускорители в ЦЕРНе

7

Page 8: Методы машинного обучения в физике элементарных частиц

Детекторы экспериментов

8

Page 9: Методы машинного обучения в физике элементарных частиц

Заголовок (не длинней одной строки)

9

Page 10: Методы машинного обучения в физике элементарных частиц

A simulated SUSY event in ATLAS

10

high pT muons

high pT jets of hadrons

missing transverse energy

p p

Page 11: Методы машинного обучения в физике элементарных частиц

«Событие» в физике частиц (event)

Единица данных - событие (event)

Идеально, если представлено набором векторов импульсов и набором типов частиц. минимум погрешности

На практике содержит «реконструированные» траектории, кластеры энергии, зафиксированные калориметрами, описывается величинами содержащими ошибки (несовершенно!):

– разрешение датчиков – изоляция траекторий – углы – …

11

Page 12: Методы машинного обучения в физике элементарных частиц

12

1 событие - 150 Kb

1 год ~ 10 Pb

Генерация событий

Page 13: Методы машинного обучения в физике элементарных частиц

Проверка гипотез

Глазами физика

– набор данных описывается вектором переменных (x1, x2, …, xn)

– для фона и сигнала распределения различны

– при условии, что есть событие нужно с заданной степенью достоверности (discriminating power) сказать - является ли оно фоном или сигналом (предполагается возможность ошибки)

Свойства решающего правила (discriminator):

– Эффективность: вероятность корректного определения сигнальных событий

– Вероятность «мисидентификации»: вероятность определить сигнал как фон

– Чистота (purity): доля правильно определенного сигнала

13

Page 14: Методы машинного обучения в физике элементарных частиц

H0 - (null hypothesis) нулевая гипотеза (в выборке только фон)

H1 - альтернативная гипотеза (в выборке содержится сигнал + фон)

α - уровень достоверности, вероятность отклонить H1, при том, что она истинна (ошибка первого рода)

– α = 1 - эффективность

β - вероятность отклонить H0, при том что она истинна (ошибка второго рода)

– β = вероятность мисидентификации

Глазами статистика

14

Page 15: Методы машинного обучения в физике элементарных частиц

События проверки гипотез

15

For each event we measure a set of numbers: ( )nx,,x=x …1!

x1 = jet pT x2 = missing energy x3 = particle i.d. measure, ...

x follows some n-dimensional joint probability density, which depends on the type of event produced, i.e., was it ,ttpp→ …→ ,g~g~pp

xi

x jE.g. hypotheses H0, H1, ... Often simply �signal� (s), �background� (b)

( )1H|xp!

( )0H|xp!

Page 16: Методы машинного обучения в физике элементарных частиц

Выбор оптимальных ограничений

16

In particle physics usually start by making simple �cuts�:

xi < ci xj < cj

Maybe later try some other type of decision boundary:

H0 H0

H0

H1

H1 H1

Page 17: Методы машинного обучения в физике элементарных частиц

Разделение по переменным

17

Page 18: Методы машинного обучения в физике элементарных частиц

Выборка событий

18

To search for events of a given type (H0: ‘signal’), need discriminating variable(s) distributed as differently as possible relative to unwanted event types (H1: ‘background’)

Count number of events in acceptance region defined by ‘cuts’

Expected number of signal events: s = !s !s L

Expected number of background events: b = ! b !b L

!s, !b = cross section for signal, background

‘Efficiencies’: !s = P( accept | s ), !b = P( accept | b )

L = integrated luminosity (related to beam intensity, data taking time)

Page 19: Методы машинного обучения в физике элементарных частиц

Открытие бозона Хиггса

19

Page 20: Методы машинного обучения в физике элементарных частиц

Открытие бозона Хиггса

19

Page 21: Методы машинного обучения в физике элементарных частиц

Лемма Неймана-Пирсона

20

Page 22: Методы машинного обучения в физике элементарных частиц

Открытие?!

21

Page 23: Методы машинного обучения в физике элементарных частиц

Статистическая значимость гипотезы

22

подробности: http://www.pp.rhul.ac.uk/~cowan

http://bit.ly/1tZlZci

Page 24: Методы машинного обучения в физике элементарных частиц

«In Monte-Carlo we trust!»

23

Page 25: Методы машинного обучения в физике элементарных частиц

Background events

24

This event from Standard Model ttbar production also has high pT jets and muons, and some missing transverse energy.

→ can easily mimic a SUSY event.

Page 26: Методы машинного обучения в физике элементарных частиц

25

Analysis Value Chain

Get datasets (Real, MC, ...)

Pre-selection

testtrain

Pre-processing (e.g., add variables)

Event selection

cut-based

MVA-based

Counting/fitting

Systematics Estimation

Signifiсance Estimation

В поисках лучшей выборки…

Page 27: Методы машинного обучения в физике элементарных частиц

25

Analysis Value Chain

Get datasets (Real, MC, ...)

Pre-selection

testtrain

Pre-processing (e.g., add variables)

Event selection

cut-based

MVA-based

Counting/fitting

Systematics Estimation

Signifiсance Estimation

В поисках лучшей выборки…

Page 28: Методы машинного обучения в физике элементарных частиц

Возможности улучшения

26

more powerful algorithms (e.g. BDT, Deep Neural Networks)

improved features (e.g. «isolation» variables or particle identification)

complex training scenarios (e.g. n-folding, ensembling, blending, cascading)

https://tech.yandex.ru/education/m/shad/talks/1423/ https://tech.yandex.ru/education/m/shad/talks/1878/

Page 29: Методы машинного обучения в физике элементарных частиц

27

Алгоритмы, реализацииСемества алгоритмов:

– Boosted Decision Trees (BDT)

– Artificial Neural Network (ANN)

– Support Vector Machine (SVM)

– Clustering, Bayesian Networks, ...

Реализации

– TMVA (60+ algorithms)

– NeuroBayes

– python scikit-learn

– R packages

– Private (Matrixnet, predict.io)

– XGBoost, …

Page 30: Методы машинного обучения в физике элементарных частиц

Цена точности

How do I check quality of event discriminating function?

– Overfitting?

– Correlations?

– Relevance of figure of merit to analysis significance?

How do I deal with complexity?

– Estimate influence of model parameters

– Extra computation

– Organization (cross-checks, collaboration)

28

Page 31: Методы машинного обучения в физике элементарных частиц

Переобучение

29

training sample independent validation sample

If decision boundary is too flexible it will conform too closely to the training points → overtraining. Monitor by applying classifier to independent validation sample.

Page 32: Методы машинного обучения в физике элементарных частиц

Figure-of-Merits Land

Area under ROC

Likelihood

Misclassification

False Positive, False Negative

Punzi measure

30

SpS+B

, SpB, · · ·

Efficiency flatness?

Page 33: Методы машинного обучения в физике элементарных частиц

31

OverfittingDecision Tree Underfitting RandomForest

Number of iterations

Training set accuracy

Test set accuracy

Performance (ROC, Learning curve)

Page 34: Методы машинного обучения в физике элементарных частиц

Не только физика

Page 35: Методы машинного обучения в физике элементарных частиц

33

Page 36: Методы машинного обучения в физике элементарных частиц

Не только физика

34

Online triggers and DAQ

Offline simulation and processing

Data storage architectures

Resource management and provisioning

Data analytics

Networks and connectivity

Page 37: Методы машинного обучения в физике элементарных частиц

Другие задачи

Оптимизация разбиения файлов по дискам и лентам

Предсказание аномалий в поведении детектора

Предсказание ресурсов/времени расчета задач

35

Page 38: Методы машинного обучения в физике элементарных частиц

Классификатор без корреляций

36 http://arxiv.org/abs/1410.4140v1

Page 39: Методы машинного обучения в физике элементарных частиц

Определение равномерности

37 http://arxiv.org/abs/1410.4140v1

Page 40: Методы машинного обучения в физике элементарных частиц

Воспроизводимость эксперимента

Page 41: Методы машинного обучения в физике элементарных частиц

Источники сложности

Физика

Работа с данными

Стратегия анализа (http://bit.ly/SqDDE4)

Шаги анализа

Командное взаимодействие

39

Page 42: Методы машинного обучения в физике элементарных частиц

Индикаторы сложности

‘Каким способом я сгененировал график 13?’

‘Новый студент хочет воспользоваться моделью, опубликованной мной 3 года назад, но я не могу воспроизвести ни одного графика’

‘Я думал, что использую те же параметры, но у меня получаются другие результаты!?I’

‘Где взять события, отобранные предыдущей версией моих скриптов?’

‘Оно работало еще вчера!’

‘Зачем я это сделал?’

40

Page 43: Методы машинного обучения в физике элементарных частиц

Экосистема для экспериментов

Программная среда для поддержки экосистемы совместной исследовательской работы над общими задачами и данными, позволяющая:

выполнять численные эксперименты над большими объемами данных

получать воспроизводимые результаты,

использовать единообразные критерии качества.

41

Page 44: Методы машинного обучения в физике элементарных частиц

42

NativeLibraries

Language modules

IntermediateData objects

Analysis code

Source data/

metadata

Black-box

XGBoost

TMVA

scikit-learn

Основные компоненты

Page 45: Методы машинного обучения в физике элементарных частиц

Текст перед кодом:

self.rsp.removeHeader("Transfer-Encoding");

Заголовок (не длинней одной строки)

43

Page 46: Методы машинного обучения в физике элементарных частиц

Заключение

44

Page 47: Методы машинного обучения в физике элементарных частиц

Заключение Вместо заключения

совместные исследовательские работы с ЦЕРНом

развитие нового направления

практика в Яндексе

45

Bs ! µ+µ�

Bs ! 4µ⌧ ! 3µB ! K⇤µ+µ�

· · ·

http://arxiv.org/abs/1410.4140v1

Page 48: Методы машинного обучения в физике элементарных частиц

Андрей Устюжанин

Руководитель совместных проектов Яндекс-ЦЕРН

[email protected]

Спасибо!

Page 49: Методы машинного обучения в физике элементарных частиц

«…rejecting the background-only hypothesis in a statistical sense is only part of discovering a new phenomenon. One’s degree of belief that a new process is present will depend in general on other factors as well, such as the plausibility of the new signal hypothesis and the degree to which it can describe the data. Here, however, we only consider the task of determining the p-value of the background-only hypothesis; if it is found below a specified threshold, we regard this as “discovery”»

47 From Cowan et al., EPJC71(2011) 1554