chapter2 intelligent agent(知的エージェント)

Post on 07-Jul-2015

449 Views

Category:

Technology

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

輪講で発表した Stuart Russell, Peter Norvig, "Artificial Intelligence: A Modern Approach"の2章のスライドです.

TRANSCRIPT

Chapter 2知的エージェント

稲谷 壮一郎|Soichiro Inatnai

東京農工大学 大学院工学府 情報工学専攻 情報工学専修 1年

中川研究室所属

Artificial Intelligence - Modern Approach

1はじめに

本章では,

1) 知的なエージェントが何をするか,

2) どのように環境に適応するか,

3) どのように評価するか,

4) どうやってエージェントを設計するか

について検討する.

2知的エージェント

エージェントとは,ある環境でセンサで知覚し,ある環境に対してエフェクタを通して動作するもの.

Environment環境

Percepts知覚

Actions動作

図1 一般的なエージェントのモデル図

Sensorsセンサ

Agentエージェント

Effectorsエフェクタ

3知的エージェント

ロボットをエージェントと考えると…

図2 H社のASIMO

センサ カメラ(視覚) 赤外線センサ(床面) 超音波センサ

エフェクタ 様々なモーター(関節各部)

環境物理的な現実空間

4本書の目的

ある環境で「うまくやる」( = do a good job of acting)エージェントを設計すること.

Q.「うまくやる」って何?

A. 何を意味するか定義して,「うまくやる」エージェントを設計する方法について学ぶ.( の部分を考える)

Sensorsセンサ

Agentエージェント

Effectorsエフェクタ

5どのように動作すべきか

合理的エージェント(rational agent)

⇒ 合理的に正しい動作をするエージェント.

「エージェントが最も成功する動作=正しい動作」

エージェントの成功は

”いつ,どのようにして“決定するの?

6エージェントの評価

性能尺度(performance measure)

… エージェントがどれくらい成功したかを客観的に評価する基準

例:汚れた床を掃除するエージェントの場合

8時間ごとに片付けたゴミの量

使われた電気の量

発生した騒音 etc

7合理的と全能(omniscience)

全能のロボットなら, 合理的な選択ができるか?

できる.だが,全能を実現することは不可能.

① 周りを見渡して車がいないことを確認.

② 横断歩道を横切る.

③ 空から飛行機のドアが落ちてきて潰される.

合理性は,分かっていることから

予測できる成功に関係している

不合理?

これは合理的な行動か?

8「合理的である」とは

どんなときも「合理的である」ことは, 4つの事柄に依存する.

成功の度合を定義する性能尺度.

エージェントが知覚したもの全て.(この完全な知覚の履歴を知覚系列と呼ぶ.)

エージェントが環境について知っていること.

エージェントがとることのできる動作.

9理想合理的エージェント

知覚系列のすべてに対して,知覚系列 と エージェント自身が持つ組込み知識に基づいて,性能尺度を最大にする動作を選択する.

合理性において,有用な情報を得るために動作をすることは重要.

① ②

- リスクの軽減

- 性能尺度の拡大

道路を渡るときは左右を見る.

知覚系列を持たない時計は合理的か(?)

10知覚系列から動作への理想的マッピング

どんな 知覚系列 に対しても,それに応じて

エージェントが取るべき動作を特定できる.

理想的エージェントを設計できる.

例:知覚 x に対する平方根 z のマッピング

知覚(Percept) x 動作(Action) z

1.0 1.00000000

1.1 1.04880884

1.2 1.09544511

1.3 1.14017542… …

11自律性(Autonomy)

エージェントの動作が完全に 組込み知識 に

基づいていて,知覚に注意を払う必要がないとき,

自律性 に欠けるという.

行動が自分自身の経験に基づいてなされるときに限り,

そのシステムは 自律的 である.

× 経験をほとんど持たない時は,

設計者が知識を与えなければデタラメに動作する.

12エージェントの構造

エージェントプログラム

… エージェントの知覚から動作へのマッピングを実現する関数

エージェント=アーキテクチャ+プログラム

エージェントを設計する前に,

エージェントの性質を理解する必要がある.

知覚 Percept

ゴール Goal

動作 Action

環境 Environment

13エージェントの構造

エージェントタイプ

知覚 P 動作 A ゴール G 環境 E

医療診断システム

症状,所見,

患者の応答質問,テスト,治療

健康な患者,

コストの最小化

患者, 病院

衛星画像解析システム

異なる強度のピクセル,

シーンのカテゴリの

印字

正しいカテゴリ化

人工衛星からの画像

部品移動ロボット

異なる強度のピクセル

部品を掴み,

箱に分類

部品を正しい箱に

入れる

部品を載せたベルトコ

ンベア

対話英語教師タイプされた単語列

練習問題,

示唆,

訂正の印字

学生のテストの点を最大にする

学生の集合

14エージェントプログラム

骨格プログラム(skeleton program)

1. 新たに知覚を得ると内部情報を更新(記憶).

2. 知覚に基づき最良の動作を選択(マッピング).

3. 選択した動作の情報も内部に記憶.

エージェントプログラムが入力として得られる知覚は一つだけ?

ゴールや性能尺度は, 骨格プログラムに含まれない.

15エージェントプログラムのタイプ

単純反射エージェント

記憶を持つ反射エージェント

ゴール主導エージェント

効率主導エージェント

単純低信頼

複雑高信頼

16単純反射エージェント

現在の状態 に適合するルールを見つけて,そのルールに見合う動作を行う

例:前の車が減速した ブレーキを踏む

単純なため,適用できる範囲がとても狭い.

条件-動作ルール(condition-action rule)

17単純反射エージェント

エージェント(Agent)

センサ

エフェクタ

環境

条件-動作ルール 今すべき動作は?

今の世界は?

18記憶を持つ反射エージェント

内部状態(internal state) を用いることで,単純反射エージェントの適用範囲を広げたもの.(内部状態を持つ反射エージェントとも呼ぶ) 時間の経過とともに内部状態は更新される.

世界がどのように変化するかに関する情報

自身の行動が世界にどのような影響を与えるかに関する情報

例:車が車線変更を行う場合

「信号が見えた 車線変更する」という瞬間的な知覚だけでは不十分.

「近くに車が無いか」という状態を内部に保持.

その状態も考慮した上で車線変更するかを決定.

19記憶を持つ反射エージェント

エージェント(Agent)

センサ

エフェクタ

環境

今すべき動作は?

今の世界は?

内部状態

世界の変化則

条件-動作ルール

自身の行動の影響

20ゴール主導エージェント

環境の情報だけで意思決定を行うのは不十分.エージェントには ゴールに関する情報 が必要.

- 例:ゴール = 乗客の目的地

- タクシーの移動方向は目的地に依存する.

探索 や プラニング により動作を決定(3章以降)

未来に関する考慮を含む(条件-動作ルールとの根本的な違い)

「もしこの動作をしたら何が起きるのだろうか」

適応性・柔軟性が高い

What will happen if I do such-and-such?

21ゴール主導エージェント

エージェント(Agent)

センサ

エフェクタ

環境

ゴール 今すべき動作は?

今の世界は?

行動を行うと?

内部状態

世界の変化則

自身の行動の影響

22効率主導エージェント

より性能尺度の高い動作(列)を決定するために,効用関数 を用いる.

矛盾する目標(e.g.安全性 vs スピード)がある場合は,適切なトレードオフを指定する.

確実に目標を達成する動作列が存在しない場合,成功の見込みをゴールの重要性に対して,重み付けする方法をとる.

状態を幸せの度合を表す実数値へマッピングする

23効率主導エージェント

エージェント(Agent)センサ

エフェクタ

環境

効用

今すべき動作は?

今の世界は?内部状態

世界の変化則

自身の行動の影響 行動を行うと?

その状態の幸福度は?

24エージェントと環境

環境(Environment) とは,

「エージェントの外部にあって, エージェントの意思によって変更できないもの全てをさす」

(参考文献[2]より)

環境(シミュレータ)プログラム

… エージェントと環境を結びつける

1. 各エージェントに知覚を与える2. エージェントから動作を受け取る3. 環境を更新

25環境の特徴

環境はいくつかの種類に分類できる.

アクセス可能 vs アクセス不能

決定的 vs 非決定的

エピソード的 vs 非エピソード的

静的 vs 動的

離散的 vs 連続的

異なった環境のタイプに応じて,その環境で効果的に働くためには, 異なったタイプのエージェントプログラムが必要.

右側の環境は複雑.

26まとめ(1)

エージェントは,環境においてセンサで知覚してエフェクタで動作する.

理想的エージェントは,知覚系列と自身の知識に基づいて,性能尺度を最大にするような動作を選択する.

エージェントは,設計者が組み込んだ環境に関する知識よりも,自らの経験に依存して動作を選択する度合を備えた自律性を持つ.

27まとめ(2)

エージェント=アーキテクチャ+プログラム

エージェントプログラムは,内部情報を更新しつつ,知覚から動作へのマッピングを行う.

エージェントプログラムの適切な設計は,知覚,動作,ゴール,環境 に依存する.

28参考文献

[1] エージェントアプローチ 人工知能

[2] マルチエージェントシステムの基礎と応用―複雑系工学の計算パラダイム 大内 東 (著), 川村 秀憲 (著), 山本 雅人 (著)

top related