yamauchi b

56
仮想ロボットにおける身体拡張に関する研究 Effects of Body Extension in Virtual Robots 北海道大学 工学部 情報工学コース 複雑系工学講座 調和系工学研究室 学部4山内翔

Upload: harmonylab

Post on 11-Jul-2015

146 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: yamauchi b

仮想ロボットにおける身体拡張に関する研究

Effects of Body Extension in Virtual Robots

北海道大学 工学部 情報工学コース

複雑系工学講座 調和系工学研究室 学部4年

山内翔

Page 2: yamauchi b
Page 3: yamauchi b

研究背景 ロボットにおける身体拡張

• ロボットにおいて身体拡張がどのような効果をもたらすか、

多くの研究がなされている

西出俊, 中川達裕, 尾形哲也, 谷淳, 高橋徹, 奥乃博, "二次リカレントニューラルネットワークを用いた 道具身体化モデルの構築", 日本ロボット学会第27 回学術講演会, 2009.

Mai Hikita, Sawa Fuke, Masaki Ogino and Minoru Asada,"Cross-modal body representation based on visual attention by saliency",Proc.IROS,pp.2041-2046,2008.

Cota Nabeshima, Yasuo Kuniyoshi and Max Lungarella, "Towards a Model for Tool- Body Assimilation and Adaptive Tool-Use", Proc.ICDL, pp288-293, 2007.

Rolf Pfeifer, Fumiya Iida, Gabriel Gomez,“Morphological computation for adaptive behavior and cognition”, International Congress Series 1291, 2006.

Page 4: yamauchi b

研究目的 ロボットにおける身体拡張と行動ルールの関係

• ロボットにおいて身体拡張はどのような効果をもたらすか – ロボット相撲をテーマに身体拡張の効果を調べる

車両ロボット

車両ロボット の

押し相撲ゲームを採用

多様な対戦相手の設定が可能

接触(身体構造)が影響

単純な移動のみに基づく戦略

全探索可能なパターン数

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

Page 5: yamauchi b

シミュレーション実験 シミュレーションを支える物理演算エンジン

・シミュレーション空間 ―物理法則が成立する空間を再現

物理演算エンジンの 導入

様々な物理演算エンジン Bullet Physics Library

―オープンソースであり、移植性も高い ―商用製品への利用実績多数 ―活発なコミュニティによる 迅速なアップデート

Page 6: yamauchi b

シミュレーション実験 実験で用いる車両ロボット

・車両ロボット ーDifferential Drive ー剛体の接続が可能

4 4

10

5

2.7

2.7

VL

VR

VL =VR

VL >VR

VL <VR

直進

VR = -VL,VR > 0

右折

左折

反時計回りの回転

Differential Drive

左右の車輪の速度差でコントロール

シミュレーション上での表示

Page 7: yamauchi b

シミュレーション実験 車両ロボットと剛体の接続

ブルドーザー

三角柱

2

20

2

2

30°

30°

10

10

10

0.1

10 5 5

5

6

8

8

剛体の接続

Body Ext.

Body :Ext. = 10 :3

重量比

ロボットの身体構造を変化させる

剛体の接続

表面積:168

表面積:300

表面積:164

Page 8: yamauchi b

シミュレーション実験 ロボットの行動ルール

4種の動作

回転

中央へ 停止

VL

VR

q

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VL =VR

VL <VR

VL >VR

ì

íï

îïï

VR = -VL,VR > 0

VL =VR = 0

j

中央

p

16<q £ p

æ

èç

ö

ø÷

-p

16£q £

p

16

æ

èç

ö

ø÷

-p <q < -p

16

æ

èç

ö

ø÷

-p

16£j £

p

16

æ

èç

ö

ø÷

-p <j < -p

16

æ

èç

ö

ø÷

p

16<j £ p

æ

èç

ö

ø÷

相手の距離を3段階で評価

距離毎 の

動作を決定

ロボットの 行動ルール

(1)相手の方向(θ)及び相手の中央からの距離を3段階( ) (2)自分から見た中央の方向(φ)

攻撃

センサ

1R 2R 3R

321 ,, RRR

Page 9: yamauchi b

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

Page 10: yamauchi b

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の 拡張部と

Page 11: yamauchi b

シミュレーション実験 ロボットの行動ルール例

1R

2R

3R 中央へ

攻撃 攻撃 回転

回転

停止

中央へ

中央へ

中央へ

中央へ

中央へ

攻撃

1R 2R 3R

相手の拡張部

相手の 中央からの距離に応じて

行動が決まる

Page 12: yamauchi b

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

Page 13: yamauchi b

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

3段階の距離に応じた動作

4種類の拡張状態

34

25644

Page 14: yamauchi b

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

各組み合わせ毎の 勝率を分析する

Page 15: yamauchi b

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

こちら側の行動ルールは 固定

Page 16: yamauchi b

シミュレーション実験 今回の実験

取りうる全ての行動ルール

今回の実験

種類のロボット 25644

対戦

こちら側の行動ルールは 固定

この実験により どの拡張部が性能を上げるか議論する

Page 17: yamauchi b

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手として ランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに 最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの 拡張部の 相手と競う

遺伝子型 近 中 遠 相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

Page 18: yamauchi b

シミュレーション実験 GAによる行動ルールの探索

個体数 50 世代数 200 ルーレット方式

2点交叉

相手として ランダムに拡張部・行動ルールが

決まる相手50体

トータル勝利数が適応度

GAの設定

拡張部ごとに 最も良い個体を

選ぶ

より良い行動ルールを探索

ランダムな50体

それぞれの 拡張部の 相手と競う

遺伝子型 近 中 遠 相手が中央からどの程度の

距離にいるか

という情報をもとにしたルールテーブルを表す

以降これらをGAロボットと呼ぶ

Page 19: yamauchi b

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

Page 20: yamauchi b

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

Page 21: yamauchi b

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

これら二つの観点から勝敗の結果を考察する

Page 22: yamauchi b

シミュレーション実験 勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

G A

ロボッ ト

すべての行動ルールパターン

勝率

Page 23: yamauchi b

シミュレーション実験 勝敗の結果

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

GAロボット側を 主軸に結果を考察

G A

ロボッ ト

Page 24: yamauchi b

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

G A

ロボッ ト

Page 25: yamauchi b

シミュレーション実験 GAロボット側から見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

勝率の順序 > > >

G A

ロボッ ト

Page 26: yamauchi b

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

トータル 勝率

0.57421875

0.6328125

0.71484375

0.83984375

強さの順序 > > >

何も拡張されていない ロボットが最も勝率が高い、という

結果

G A

ロボッ ト

Page 27: yamauchi b

シミュレーション実験 実験の目的

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

Page 28: yamauchi b

シミュレーション実験 GAロボット側からから見た勝率

0.84375 0.34375 0.515625 0.59375

0.78125 0.25 0.828125 0.671875

0.96875 0.828125 0.234375 0.828125

0.953125 0.6875 0.890625 0.828125

すべての行動ルールパターン

勝率を反転

G A

ロボッ ト

Page 29: yamauchi b

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

G A

ロボッ ト

Page 30: yamauchi b

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン すべての行動ルールパター

ン側を 主軸に結果を考察

G A

ロボッ ト

Page 31: yamauchi b

シミュレーション実験 すべての行動ルールパターン側から見た勝率

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

G A

ロボッ ト

Page 32: yamauchi b

シミュレーション実験 身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

勝率の順序 > > >

G A

ロボッ ト

Page 33: yamauchi b

シミュレーション実験 身体拡張と行動・行動ルールの関係

0.15625 0.65625 0.484375 0.40625

0.21875 0.75 0.171875 0.328125

0.03125 0.171875 0.765625 0.171875

0.046875 0.3125 0.109375 0.171875

すべての行動ルールパターン

トータル 勝率

0.11328125 0.47265625 0.3828125 0.26953125

勝率の順序 > > >

GAロボット側とは異なる結果

この見方は何を意味するか?

勝率を高める働きをする 拡張部が変化

G A

ロボッ ト

Page 34: yamauchi b

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての 行動ルール パターン

今何を表すか

勝率の順序 > > >

Page 35: yamauchi b

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

Page 36: yamauchi b

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

軌道の分析

Page 37: yamauchi b

結果の分析 2つの分析

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

GAロボット

すべての

行動ルールパターン

今何を表すか

勝率の順序 > > >

なぜこの差が生まれるか?

軌道の分析

接触時間の分析

Page 38: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

GAロボットの軌道

Page 39: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

ゲーム開始から終了までの

X座標とZ座標

GAロボットの軌道

Page 40: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン

・移動の軌跡による分類

移動の軌跡を取得

クラスター1

クラスター2

クラスター3

クラスター4

K-means法により

4つのクラスターに分類

取りうる全パターンの 相手に対して取得

ゲーム開始から終了までの

X座標とZ座標

相手(GAロボット側)に ゲーム中どのような軌道を取らせたか、という データにどのような特徴が現れるか?

GAロボットの軌道

Page 41: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

Page 42: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

各クラスターに 満遍なく存在

Page 43: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

各クラスターに 満遍なく存在

相手に様々な動きをさせている

Page 44: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

・移動の軌跡による分類

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

分類されるクラスターに 偏りがある

Page 45: yamauchi b

拡張部別の相手の行動パターンの比較 拡張部別の相手の行動パターン-結果-

0

50

100

150

200

250

1 2 3 4

該当する試合数

クラスター

ブルドーザー

三角柱

拡張部なし

勝率の順序 > > >

分類されるクラスターに 偏りがある

相手に動きのパターンが 似通っている

Page 46: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用

・部位別に相手との接触を計測

接触時間を計測

拡張部への接触

ボディへの接触 2パターンに分類

拡張部ごとに接触時間にどのような差異が現れるか? 拡張部がない場合との差は?

Page 47: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

Page 48: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部接触の時間は 表面積に比例しない

Page 49: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部接触の時間は 表面積に比例しない

Page 50: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から表面積あたりの増加率を求める

拡張部接触の時間は 表面積に比例しない

Page 51: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から単位表面積あたりの増加率を求

める

ブルドーザー 三角柱 棒

単位表面積あたりの 増加率

+14.435% -6.217% -69.6337%

拡張部接触の時間は 表面積に比例しない

Page 52: yamauchi b

拡張部別の身体利用の比較 拡張部別の身体利用-結果-

拡張部の表面積 300 168 164

0

50

100

150

200

250

300

350

400

ブルドーザー 三角柱 拡張部なし 棒

相手との接触時間の平均

拡張部

ボディ

> > >勝率の順序

0

拡張部なしの場合との差から表面積あたりの増加率を求める

ブルドーザー 三角柱 棒

単位表面積あたりの 増加率

+14.435% -6.217% -69.6337%

拡張部接触の時間は 表面積に比例しない

増加率の大小関係が 拡張部なしを除いた 強さの順序に 一致する

Page 53: yamauchi b

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

Page 54: yamauchi b

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

> > >

強さの順序 > > >

強さの順序

Page 55: yamauchi b

まとめ

拡張部 熟達した者がより強くなる

特定の行動ルールにおいて

行動ルールに依らず強くなりやすい

複数の行動ルールにおいて

勝率向上

> > >

強さの順序 > > >

強さの順序

・拡張部には特定の行動ルールの勝率を向上させる働きをするものと 行動ルールに依らず平均的に勝率を向上させるものがあることを示した ・相手に様々な動きをさせる、身体を効率的に利用する、といった 要素によりこれらの性質が生まれていることを示した

Page 56: yamauchi b