機械学習を実際のビジネスに適用する - amazon s3通常のcrowdflowerの例...

34
機械学習を実際のビジネスに適用する Lukas Biewald Proprietary and Confiden6al - Do Not Distribute FEBRUARY 8, 2017

Upload: others

Post on 25-Apr-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

機械学習を実際のビジネスに適用する Lukas Biewald

Proprietary and Confiden6al - Do Not Distribute

FEBRUARY 8, 2017

Page 2: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

CrowdFlower

Page 3: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

Proprietary and Confiden6al - Do Not Distribute

Page 4: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

最初の仕事 (2004)

Proprietary and Confiden6al - Do Not Distribute

Page 5: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

ガートナーのハイプ・サイクル

機械学習

Page 6: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

ベンチャーキャピタル投資

Proprietary and Confiden6al - Do Not Distribute

Page 7: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

データ科学投資

Page 8: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

大きな勝利

Proprietary and Confiden6al - Do Not Distribute

Page 9: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

自律走行車

9

Page 10: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

機械学習プラットフォーム

Proprietary and Confiden6al - Do Not Distribute

Page 11: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

機械学習を活用するCrowdFlower顧客

Proprietary and Confiden6al - Do Not Distribute

Page 12: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

オンラインショッピング検索の関連性

Proprietary and Confiden6al - Do Not Distribute

Page 13: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

顧客サポートチケット

Proprietary and Confiden6al - Do Not Distribute

Page 14: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

ソーシャル メディア リスニング

Proprietary and Confiden6al - Do Not Distribute

Page 15: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

コンピュータビジョン

Proprietary and Confiden6al - Do Not Distribute

Page 16: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

機械学習はアルゴリズムだけではありません

Proprietary and Confiden6al - Do Not Distribute

AI = TD + ML + HITL Training Data トレーニングデータ

Human-in-the-loop 人間参加型 アルゴリズム

Page 17: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

アルゴリズムは人よりスマートではありません…

Page 18: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

アルゴリズムは人よりも忍耐強い

Page 19: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

Facebookのトレーニングデータ

Proprietary and Confiden6al - Do Not Distribute

Page 20: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

グーグル翻訳のトレーニングデータ

Proprietary and Confiden6al - Do Not Distribute

Page 21: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

オンラインショッピング検索のトレーニングデータ

Proprietary and Confiden6al - Do Not Distribute

Page 22: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

自律走行車のトレーニングデータ

Proprietary and Confiden6al - Do Not Distribute

Page 23: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

機械学習にはトレーニングデータが必要

Proprietary and Confiden6al - Do Not Distribute

0%

2%

4%

6%

8%

10%

12%

14%

N 2N 4N

Erro

r Rat

e

Page 24: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

アルゴリズムはまだ間違う...?

Proprietary and Confiden6al - Do Not Distribute

0%

2%

4%

6%

8%

10%

12%

14%

N 2N 4N

Erro

r Rat

e

Page 25: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

時には99%の精度は素晴らしいです…

Proprietary and Confiden6al - Do Not Distribute

Page 26: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

時には99%の精度は致命的です…

Proprietary and Confiden6al - Do Not Distribute

Page 27: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

時にはアルゴリズムを改善するのは簡単

27

0%

10%

20%

30%

40%

50%

60%

70%

Baseline 12-May 13-May 14-May 15-May

Acc

urac

y アルゴリズムの精度

Page 28: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

時にはアルゴリズムを改善するのは難しい

28

0%

10%

20%

30%

40%

50%

60%

70%

80% 12

-May

14-M

ay

16-M

ay

18-M

ay

20-M

ay

22-M

ay

24-M

ay

26-M

ay

28-M

ay

30-M

ay

1-Ju

n

3-Ju

n

5-Ju

n

7-Ju

n

9-Ju

n

11-J

un

13-J

un

15-J

un

17-J

un

19-J

un

21-J

un

23-J

un

25-J

un

27-J

un

29-J

un

1-Ju

l

3-Ju

l

5-Ju

l

Acc

urac

y アルゴリズムの精度

Page 29: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

人間参加型

アルゴリズム

アウトプット

信頼度が高い

Page 30: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

人間参加型

信頼度が高い アルゴリズム

人間

アウトプット

Page 31: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

人間参加型

信頼度 アルゴリズム

人間

学習

アウトプット

Page 32: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

通常のCrowdFlowerの例

Proprietary and Confiden6al - Do Not Distribute

トレーニング データ 人間参加型 機械学習

MicrosoO Azure ML

初期400,000件の サポートチケット

毎日200,000件の新規

サポートチケット

40%は自動化 60%は人が参加

Page 33: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

米国の郵便局 (1982)

Page 34: 機械学習を実際のビジネスに適用する - Amazon S3通常のCrowdFlowerの例 Proprietary and Confidenal - Do Not Distribute トレーニング データ 機械学習

ありがとうございました!!

Lukas Biewald @L2K

Proprietary and Confiden6al - Do Not Distribute