人工知能(ai)がもたらす 新しい社会ai).pdf ·...

44
人工知能(AI)がもたらす 新しい社会 山口高平 慶應義塾大学理工学部 1

Upload: others

Post on 20-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

人工知能(AI)がもたらす 新しい社会

山口高平

慶應義塾大学理工学部

1

AIの歴史

1956年 ダートマス会議(チェス、定理証明) 探索、推論

1960年~ 第一次AIブーム(単なる期待、Toy Problem)

1970年~ 冬の時代(機械翻訳無理!基礎研究は継続)

1980年~ 第2次AIブーム(知識の時代、 国プロ、産業化、AIベンチャー)

1995年~ 再び冬の時代へ(基礎研究は継続):

インターネットの時代へ

2

AIの現在 ①コンピュータの高速化

②記憶装置の大容量化

③ネットワーク広帯域化

④ソフトウェアのオープン(無料)化

に支えられ,

AI要素技術(探索,推論,学習,知識)は進歩

2010年~ 第3次AIブーム?

AI要素技術の進化と統合(周辺関連技術含む)

による 特化された,でも強力なAI の登場

探索型AI・知覚型AI・知識型AI 3

(1) 探索型AI

4

2012.2 AI囲碁 Zen

囲碁はまだまだ!

2012.1 第1回電王戦 故米長元名人vs.

ボンクラーズ

1997 AIチェス Deep Blue

AIがプロに迫る&超える

5

10 120 10 220 10 360

※巨大数の例 RSA公開暗号鍵サイズ 1024bit 21000= (210)100=10300

6

電王戦

1 2012 ボンクラーズ 1-0 米長邦雄永世棋聖 一番勝負

2 2013 コンピュータ 3-1

(1引分) プロ棋士 五番勝負(団体戦)

3 2014 コンピュータ 4-1 プロ棋士 五番勝負(団体戦)

4 2015 コンピュータ 2-3 プロ棋士 五番勝負(団体戦)

第1回

Final 第3回

第2回

ボナンザ(保木邦仁氏開発)の評価関数

• 各駒の価値(駒割り) • 王、他の駒2つの位置 • 王、隣接した味方の駒、他の味方の駒3つの位置 • 隣接しあった駒2つの位置関係 • 竜馬飛角桂香の利き上にいる駒の種類

→5万棋譜データを与え、機械学習を実行し、プロの指し手 パターンを学習した結果、棋力が格段に上昇した。 さらに、新手と呼ばれるパターンも見出した。

7

チェス選手権はフリースタイルの時代へ

混成チーム2 アマチュア+AI

混成チームⅠ プロ+AI

AI プロ

8

Chess Metaphors: Artificial Intelligence and the Human Mind

9

48チーム参加 (人、コンピュータ、人+コンピュータ) 優勝:ZackSチーム Zackary Stephen(統計学修士,24歳,1381) Steven Cramton(予備校講師,28歳,1685) 使用ソフト:Shredder 8,Fritz 8,Junior 7,Gambit Tiger (※レーティング:初心者800, 中級者1500, 日本チャンピオン2300, グランドマスター 2500, 世界チャンピオン2800)

By Diego Rasskin-Gutman Translated by Deborah Klosky MIT Press (2012)

(2) 知覚型AI & Deep Learning

10

無人運転(パターン認識) 2012年 ネバダ州免許

2013年 カリフォルニア州免許

掃除(計画)

11

機械学習(ベイジアン、SVM、Deep Learning により運転操作の学習 入力 ①LIDAR(レーザー光を使ったレーダー) ②カメラ画像 ③GPS 出力 ①アクセル ②ブレーキ ③ハンドル操作 2015.4 100万マイル以上走行して、交通事故11件 (人が運転する車がグーグルカーに衝突)

BCG Press Release 2015.1.19 http://www.bcg.co.jp/documents/file180099.pdf

2035 年には完全自動運転車が 新車販売台数の 10%、約 1,200 万台、

部分自動運転車が 15%、約 1,800 万台へ

12

制限付きボルツマシン

13

1980年代のNNの課題:多段にすると誤差拡散。過学習によりロバストネスが低い。 ボルツマシン(BM):統計力学的な(熱)エネルギーの取り扱い 制限付きボルツマシン(RBM):V(入力層)とH(隠れ層)V間の結合のみ。 同層の結合はない ユニット:確率論的二値ユニット RBMの学習:入力層データを再現できるように、ユニット結合係数wij値を調整する。 自動符号化:隠れ層を少なくすると情報圧縮となる。 多層化:一つのRBM学習終了後に上位に重ねていく→上位ユニットが抽象度の高い特徴となる。

w:weight

自動符号化(原画像と復元画像) G. E. Hinton, A. Krizhevsky & S. D. Wang: Transforming Auto-encoders, ICANN11 (2011)

14

原画像

復元画像

Quoc V. Le, Marc’Aurelio Ranzato, Rajat Monga, Matthieu Devin, Kai Chen, Greg S. Corrado, Jeffrey Dean, and Andrew Y. Ng:

Building High-level Features Using Large Scale Unsupervised Learning, ICML2012

15

Youtube 3日間、1000万 部位画像、人と猫の識別器

Error Rate

16

ILSVRC (ImageNet Large Scale Visual Recognition Challenge)

DNN (Deep Neural Network)の進展

2012年:教師無しデータによるPre Training 2013年:Rectifier, Dropoutによる教師有りで直接、 巨大ニューラルネットを学習。 CNN(Convolution Neural Net)主流。 2014年:短期記憶可能なニューラルネット(LSTM: Long Short Term Memory)。RNN(Recurrent Neural Net.ループを含むようなニューラルネット)が注目。 ・表現学習(特徴量自動生成) ・マルチタスク学習 (類似タスクからターゲットタスクの精度改善)

・マルチモーダル学習(画像キャプション自動生成)

17

http://googleresearch.blogspot.jp/2014/11/a-picture-is-worth-thousand-coherent.html

18

画像キャプションの自動生成

(3) 知識型AI

19

20

2003年 QA Challenge !(1) IBM PIQUANT

• 2003~ IBM,PIQUANT プロジェクト

(Practical Intelligent Question Answering Technology)

★閉じた問題ではなく、事前に分からないクイズに解答する という開いた悪構造問題に挑戦

深い論理形式分析と浅い機械翻訳ベースのアプローチを統合

この難しい問題にチェレンジするには、AI技術が未熟で、

マシンパワーも不足して、大きな成果はあげられずに終わる。

21

2011年 QA Challenge ! (2) IBM Watson

・IBM Deep Question Answering Project(ジョパディで,ワトソンがチャンピオンに挑戦して勝利)

Open-Domain Question Answering

PIQUANTから時代が進み,

技術が成熟、マシンパワーが拡大

22

IBM Watsonシステム構成

★大規模知識の獲得(100万冊,2億ページ)

百科事典、辞書、シソーラス、ニュース記事、著作物などを情報源。自動的にコーパスを拡大。 ★徹底した質問文解析:LAT(Lexical Answer Type)と重要語抽出 ★突出した一つのAI技術ではなく,言語理解,情

報検索,不確実性推論,仮説生成,仮説統合とランキング、機械学習,知識表現(オントロジー),構造化データなど,100以上の従来AI技術(20年前の技術もある)の集大成 ★精度、確信度、速度を考慮したAIインテグレーション ★計算力:並列計算による計算パワー ★展開性: 医療、金融、行政、マーケティングにも適用可能

23

NII 東大ロボットプロジェクト 2021年東大入試合格を目指して

http://21robot.org/

24

東ロボくんの各教科アプローチ • 国語:含意関係認識。評論の問題で、設問に合致する選択肢を選ぶ問題がよく

出題されるが、設問文で指定された本文から、選択肢を選ぶ根拠となる部分を抽出し、その根拠部分と選択肢を比較照合し、最もよく「含意する」選択肢を選ぶ手法を開発したところ、50%程度の精度を達成できた。(名古屋大学佐藤研究室)

• 世界史・日本史:情報検索と新しい含意関係認識の統合。Wikipediaや教科書にあるテキストt1を事実と仮定し、問題文にあるテキストt2が事実であるか否かを判

断する含意関係認識問題について、文の意味を集合間関係の代数式で表現し、その集合間関係を論理演算や機械学習で認識する手法を開発中。

• 英語:発音や文法などの短文問題は70%程度、読解や会話文の長文問題は30%

程度の正答率。長文問題に対して、粒度の異なる語句の類似度判定、事実性の判定、述語項構造解析と照応解析(主語特定とイベント参照)、映画スクリプトから対話自然性判定解析、ConceptNet5を利用した常識推論などの課題に取り組んでいる(NTT-CS研等との共同研究)。

• 数学:自然言語解析と論理と数式処理の統合を目指しており、日本語で記述された問題文と同等のZF (Zermelo-Fraenkel)表現を一階述語論理式に変換し、限量子消去 (quantifier elimination: QE)などを含む数式処理を適用して問題を解く。QE は、二次関数、不等式・領域の問題、平面図形の問題など、多くの入試問題

を解くことができる.ただ数学でも、問題文を読んで式を立てる過程が課題である(富士通研究所との共同研究)。

25

200 93.1 95(52) 50.5(41.0)

150 60.2 69(62) 54.2(45.9)

100 45.9 49(42) 51.9(44.7)

100 47.1 40(57) 46.9(51.9)

100 50.4 55(41) 51.9(47.2)

100 40.8 52(58) 56.1(55.2)

100 47.2 44(56) 48.2(56.1)

100 38.1 17(33) 34.3(42.2)

100 32.7 31(39) 49.0(48.3)

900 422.0 386(365) 47.3(45.1)

53.6(47.7)

49.7(46.2)

受験番号 氏名 116-5004E 東ロボクン イチゴウ

科目 満点 全国 平均点

本人得点 (昨年)

本人偏差値 (昨年)

英語

国語(現文+古文)

国語(現代文)

数学I・数学A

数学Ⅱ・数学B

世界史B

日本史B

政治・経済

物理

文系7科目コース

文系3教科偏差値

理系3教科偏差値

東ロボくん 代ゼミ全国センター模試成績(2014.11)

26

Web上で公開され,相互に連結し合っているRDFデータ

これまで多く研究されてきた抽象的な概念構造が

現実的な有用性を生むには依然高いハードルがある

具体物であるインスタンスの記述をしたRDF(Linked Open Data)の

データベースを公開・共有し合うべきという風潮が高まっている

2007年5月

2008年5月

2011年9月

LODの普及

27

Linked Data Cloud

メディア

地理

政府

生命科学 クロスドメイン

出版物

ユーザー生成

コンテンツ

295のデータセット、310億を超えるトリプル 28

日本語Wikipediaオントロジー http://www.wikipediaontology.org/

29

統合人工知能

30

オントロジー人型ロボットNAO と子供達・シニア

31

QA 体操教示

慶應義塾大学 人工知能・ビッグデータ研究開発センター 多重知能を実現する次世代AIを目指して

話して

見て

聞いて

観て

考えて 動いて

言語知識 システム

音声対話 システム

人認識 システム

物体認識 システム

多重知識 推論システム

動作計画 システム

実時間機械学習+一括機械学習 (Bayesian Net, SVM, Deep Learning)

感情認識 システム

喫茶店業務代行と小学校授業実践

32

知能実践アプリケーション開発プラットフォーム PRINTEPS

33

SWモジュールの分類

•ロボット動作:移動,モノを持つ,片付ける

•画像・センサー:物体検出,人数検出,年齢認識 •対話:音声合成,音声認識,発話者認識 •知識:ロボット,顧客,喫茶店モデル構築 •感情:喜怒哀楽などの推定

•機械学習:テキストマイニング,前処理,後処理

34

小学校授業実践アプリ

教師の ワークフロー

ロボットの ワークフロー

社会科教材 オントロジー

日本語Wikipedia

オントロジー

マルチメディア 身振り

興味関心の向上

知識の教示 35

動画 オントロジー

PRINTEPSによる授業実践

• 場所…横須賀市立鶴久保小学校 図書室

• 日時…2015年1月28日 3時限(10:35~11:20)

• 対象児童…5年生4クラス合同(計113名)

36

37

ロボットカフェ

人と機械(AI)の協働

38

Race Against the Machine

米国では,ここ数年, 会計士,税理士の需要が8万人減少 高度コンピュータ による大量失業時代?

アンドリュー・マカフィー MITスローン・スクール、 デジタル・ビジネス・センター 主任リサーチサイエンティスト

39

The Future of Employment (1) Carl Benedikt Frey and Michael A. Osbome, Oxford Univ.

• コンピュータに代行困難な重要要素 ①Creativity (創造性、創意工夫) ②Dexterity(手先の器用さ) ③Social Intelligence (社交性)

ルーチンワーク的な仕事は、AIに置き換えられていく可能性が大きい

40

The Future of Employment (2) Carl Benedikt Frey and Michael A. Osbome, Oxford Univ.

41

 ■コンピューターに奪われる職種

確率 職種

99% ローン貸し付け

96% 受付係

94% 法律事務員

92% 小売販売員

89% タクシー運転手

84% 警備員

81% コック(ファーストフード)

77% バーテンダー

58% 個人向けアドバイザー

11% 記者

7.4% 音楽家

0.4% 小学校教師

 出所:オックスフォード大学     「The Future of Employment」

知能は形式知だけ? ガードナー:多重知能説に基づく知能モデル

言語的 知能

数理的 知能

対人的 知能

個人内 知能

音楽的 知能

空間的 知能

身体 知能

技術的 (学校) 知能

芸術的 知能

人格的 (感情) 知能

42

AI

AIの課題 • Deep Learning による知覚処理の進歩 →意味処理はまだ遠い。 →文脈バイアス、信号と記号の相互運用性

• 特徴量自動学習:知覚レベルで成功。 →知識レベルで領域オントロジー自動構築

• 生活体験と結びつく常識の自動構築

• 変化対応能力:規模変化、タスク変化 に追従してほしい(マルチタスク)

• マルチモーダル

• ELSI:モラルとメタ知識

43

44

AIの将来

画像認識

音声認識

動作学習

大きなハードルが存在 対話学習

知識学習

画像切出し

言語学習

プログラム生成

現状できつつある領域