認知と心理視覚認知

認知と心理

視覚認知

慶應義塾大学今井むつみ

私たちの「見ている」ものは単なる網膜に映った像ではない

• 錯視• 恒常現象• 奥行きの知覚• 運動時の物体の知覚

脳の視覚経路 ( 下から見た図 )

恒常現象• 光源、距離、角度などの観察条件によ

って、網膜入力の特徴はさまざまに変化する。それでも私たちには対象の普遍の康応や性質が難なく知覚される。つまり、外界の物体の不変の性質を不変のものとして知覚する– 大きさの恒常性→網膜の像の大きさは対象

への距離や見る角度によって異なるのに私たちは恒常的な大きさを知覚できる

錯視• 物理的特徴（網膜像の特徴）とはちが

う特徴を知覚してしまう現象の総称• http://www.brl.ntt.co.jp/IllusionForum/basic

s/visual/index.html

ミュラー・リアー錯視

ボッケンドルフの錯視

ボンゾの錯視

奥行きの知覚

• 　そもそも網膜への光の投影は二次元の（平面）のものなのに、我々は三次元の世界をどうして「知覚」できるのか

運動時の物体の知覚• 網膜は自分が制止している場合の物体

の運動と、自分自身の運動により網膜上のイメージの変化をどうして区別できるのか

ヘルムホルツ

「視覚認知とは無意識に行う推論のことである」

視覚認知

→ 様々な心的計算によって網膜上のイメージを再構成するプロセス

世界を知覚するためにシステムが計算しなければならない問題

• 「何」があるのか (what)

• 「どこに」あるのか (where)

• モノがどのように運動したり作用したりするのか (how)

前頭葉

頭頂葉

後頭葉側頭葉

網膜外側膝状体

一次視覚野腹側経路（物体視経路 )

背側経路（空間視経路 )

Where?

What?

世界を「認知」するためには

• 個々の物体をそれ以外のモノ（他の物体、あるいは背景）と分離する

• （自分からの、あるいは他の物体からの）距離、奥行きを計算する

• 物体の運動のしかた（どのくらいの速度で動いているか、どの方向に動いているかなど）を計算する

分離 (segregation) （ 1 ）

• ある対象を他のもの（他の物体や背景）と分離するにはその対象をひとつの「モノ (object) 」として認識し、その輪郭を同定する必要がある

• 物体の位置と形はさまざまな情報から計算される– 例　影の情報の利用 (Cavanough &Leclerc, 1

989)

分離（２）

• ゲシュタルト学派が提唱した物体分離知覚に働く要因　

図 (figure) と背景 (ground) の関係の抽出

図→結合、統合されており、背景と対比

（ただし、どちらが図でどちらが背景なのか曖昧な場合もある）

分離（３）図を認識する際に用いられる原則

• 近接の原則• 類似の原則• 連続性の原則• 閉鎖の原則

距離、奥行きの計算（１）• 人はさまざまな情報源から奥行きや距

離を判断する– 単眼情報

• 線形パースペクティヴ• 肌理 (texture) の勾配• 遮蔽• 運動視差

– 両眼情報• 立体視 (steropsis)

• 線形パースペクティヴ平行な線が近づいていくと距離が遠く

なると知覚され、平行な線が離れていくと距離が近くなると知覚される

• 肌理の勾配　ある対象の表面の肌理は距離が近いほど細かくなり、遠いほど荒くなる。また、二次元の描写では密度が高くなるにつれ遠くに後退するように知覚される。

距離・奥行きの計算（２）線形パースペクティヴ、肌理の勾配

距離、奥行きの計算（３）遮蔽、運動視差

• 遮蔽　ある対象が別の対象に一部を遮蔽されている場合、遮蔽された対象はより後方（遠い方）にあると知覚される

• 運動視差　観察者が動くとき、より近くにある対象は遠くの対象よりも速く動くように知覚される

距離、奥行きの計算（４）立体視

• 両眼で世界を見た場合、二つの眼で眺める角度は多少異なる。

• このため、二つの対象の網膜に映る距離は多少異なる。

• 人はこの両眼の網膜に映った二つの対象の距離の相違を実世界での対象の間の距離や奥行きの計算に用いる。

運動の知覚（１）

• 眼球や頭の運動によって外界の静止対象の網膜像は流動する。それにもかかわらず対象は以前として静止してみえる。（しかしまぶたの上から眼球を指で押した場合、今度は網膜像の移動に応じて外界全体が動いて見える。薬物によって眼筋を麻痺させてもそうなる）

運動の知覚（３）運動の知覚の計算

• 網膜上のイメージの動き　　自分自身が動いたため？　　対象が動いたため？

• 視覚システムはそれを決定するために運動感覚システムからの情報を取り入れ視覚インプットを矯正する計算を行う

• たとえば物体が自分に近づいていく場合に網膜イメージの広がりのレートから速度を計算したり、運動によって対象を他の物体から分離したり、形状を決定したりする。

物体の認識• 物体の認識における「単位」とは何か

– 全体を一つの単位？– 「原素的特徴 (primitive) 」に還元できるの

か？

物体の認識：特徴ベースモデル

• 物体の記憶中の表象は基本的線分などの特徴の集合として符号化されている

• 物体認識のプロセスは、複雑な刺激を特徴に分解し、長期記憶の中の表象の一覧と照合すること

• このモデルでは特徴とは何か、視覚刺激がどのように符号化されているのかを明らかにすることを目標

特徴ベースモデル（２）

• 　ポップアウト現象垂直な線分の中のななめの線分は見つけるのが容易。しかし、ななめの線分の中から垂直な線分を見つけるのは時間がかかる

• 垂直な線分は標準（デフォルト）で、これからの逸脱（斜めの線分など）は余分な特徴として符号化されているのではないか

特徴ベースモデルの限界• 特徴間の空間的、構造的関係を表せない

　（例えば垂直線分、水平線分などの特徴を検出したとしても T と＋の区別がされない

• 個々の物体がすでに背景から、あるいは他の物体から分離されていることを前提にしたモデルだが、物体認識の大きな問題はどのように物体を分離し、輪郭の形状を同定するかにある

物体認識の構造的アプローチ• 物体の記述は特徴のリストのみではなく、

特徴の構造的関係の記述が含まれなければならない

• Reed(1974) の実験物体が提示され、次に部分が提示される。２番目に提示された部分が最初に提示された物体の一部であるかを判断→部分の切り分け方によって判断の速度や誤答率が変わる→単なる線分以上のより自然な「構造」が存在

ビーダーマンのジオン理論

• 特徴と構造の両方を記述した物体認識理論

• 物体はジオンと呼ばれる要素に分解される

ジオン理論

• 視覚システムは特定の役に立つ情報に注目する傾向がある→ジオンの検出– スムースな連続性– 結合– 平行– 対象

何にみえる？

視覚認知における知識や文脈の影響

Stroop 効果

物体認知における高次認知の影響（２）

• Yokosawa&Imai(1997) の研究• 二つの物体の同異判断課題• 概念的なつながりがある物体同士を否

と答えるのは二つの物体に概念的なつながりが無い場合に比べ時間がかかる

• 概念的なつながり– 上位概念のつながり– 連想的なつながり　　

物体認知における高次認知の影響（２）

• Yokosawa &Imai の研究から示唆されること

→物体の知覚的な認識 ( 例：ウサギを表す絵を「ウサギの絵」として同定すること）の際に概念知識が自動的に働く

シーンの中の物体の認識

• 写真の中の物体を認識、同定する際、写真の体制化された構造がトップダウン的に影響を及ぼす

ビーダーマン (Biedreman, 1972) の実験（１）

• 被験者は多くの場面の写真を短時間見る。その際写真に含まれる物体の一つをターゲットであることを知らされる。

• テストでは、４つの選択肢の中からターゲットの物体を選び出す。

ビーダーマン (Biedreman, 1972) の実験（２）

• シーンの提示のされ方自然な位置　対　６分割されてランダムに再構成

• ターゲットを示す矢印が提示される順序シーンの直前　対　シーンの直後

• ４つの選択肢とシーンを見る順序選択肢を見てからシーン　対　シーンを見てから選択肢　

シーンの位置情報のトップダウン処理

• 被験者がどこを見ればよいか、何を探すか知っている場合 (事前手がかり、事前選択肢）でも分割撹拌操作は目標物体の同定に影響を与えた　→シーンの位置情報のトップダウン処理が自動的に働く

ただし、知識と関係なく自動的に働くプロセスもある

• 見まいとしても見えてしまう。– カニッツアの錯視

• 考えたり、想像したりすることはできるが、知覚的に経験することはできない– ネッカーの立方体

• 推論したり想像したりすることは困難であるにもかかわらず、簡単に知覚されてしまう– ペンローズの不可能図形

• 認知的な知識や推論が知覚に影響を与えない場合もある

–カニッツアの錯視

視覚認知は• 視覚認知は知識に依存しない自動的処

理と知識に依存するプロセスのせめぎあいである

3) 顔認知の特殊性　　　

　　：顔認識に専門化された処理経路は存在するか？

① 相貌失認② 脳画像研究と紡錘状回③ 現在の論争点 ( 特殊説と熟達化説 )

◆ 視覚失認 (Visual Agnosia)：基礎的な視覚機能 ( 視力等 ) ，知能の障害に起因

　　　　　できない視覚物体認識の障害

1) 主に後側頭葉の腹側面の損傷で生じる2) モダリティ依存　（聴覚や触覚ならば認識可能 )3) 特定のカテゴリーに選択的な障害が見られる

　　・相貌失認 (Prosopagnosia) Bodamer (1947)：顔の認識だけができない．他の物体ならば OK

　　・ C.K さん (Moscovitch et al., 1997)：顔の認識だけができる．他の物体は認識不能

２重解離 (Double Dissociation) ⇒ 顔専門システムの存在

① 相貌失認の研究

普通の人　　：果物でできた顔

相貌失認　　：果物にしか見えない

C.K さん　　：顔にしか見えない

普通の人　　：本でできた顔

相貌失認　　：本にしか見えない

C.K さん　　：顔にしか見えない

森の中に顔が隠されている（ 1 ０個以上ある )

普通の人： 1 分間で 1 個のペースで発見できる

C.K さん：矢継ぎ早に顔を指摘

　．．．というか，　顔の集合写真にしか　見えない

脳の視覚認識システムには２つのシステムがある

① 顔専門のシステム

② 一般的な物体認識システム

◆ 相貌失認と倒立効果のまとめ

脳の活動を調べる方法 ( その１ )

脳波 (EEG: Electroencephalogram)

: 頭皮上に電極を配置する

様々な刺激を提示したときの脳波の違いを調べる

◆ 実験の流れ

1s

◆ 事象関連電位　（ ERP: Event-Related Potential)

顔の認知に関連した ERP波形家の認知に関連した ERP波形

平均加

算

FaceHouse 300ms

+9μV

-9μV

T5 T6

実験１の結果外側側頭部位 (T5, T6) で記録された ERP波形

Face House Car

0 100 200 300 400 500 0 100 200 300 400 500(ms) (ms)

+ 6

0

- 6

(μV)

← N170← N170

0 100 200 300 400 500 0 100 200 300 400 500(ms) (ms)

+ 6

0

- 6

(μV)

← N170

Human Face Cat Face Dog Face

実験２の結果外側側頭部位 (T5, T6) で記録された ERP波形

← 動物は 10ms遅い

脳波研究のまとめ

1) 顔に特有な脳波成分 (N170) が見られた

2) N １７０は動物の顔でも，倒立顔でも生じる

3) しかし，動物の顔や倒立顔は潜時がやや遅れる

脳の活動を調べる方法 ( その 2)

機能的 MRI (fMRI)

神経細胞の活動で生じる脳血流と酸素消費の変化を調べることにより，脳の活動部位を同定する．

fMRI研究：　顔を提示すると選択的に活動する部位が見られる　　 (McCarthy et al., 1997)

紡錘状回 (Fusiform Gyrus)：顔に対して特に強く応答することが知られている

Tong et al. (2000) の fMRI研究：紡錘状回の応答特性を探る

人の顔でも動物の顔でも強く反応する

アニメキャラクターの顔でも強く応答する


正面向きでも，横向きでも FFA は強く反応する


③ 現在の論争点 ( 特殊説と熟達化説）

・相貌失認　・脳波の N170

・外側紡錘状回

顔に特有な現象

本当に「顔」に特有なのか？

顔という物体・社会的に重要・深い情報処理 ( 個人識別 )・高度な熟達化

これらの条件を満たせば「顔」以外でも見られるのでは？

車の専門家

鳥の専門家

顔を提示　　　　車を提示　　　　　鳥を提示

Gauthier (2000) の fMRI研究　　　：専門家が自分の専門領域の物体を見ると，　　　　顔と同じ脳の領域が活動する

Gauthier (1999)：顔を模擬して作られた未知の３ D 物体 (グリーブル )

普通の人には見分けがつかない

数週間に及ぶ専門訓練を施すと個体識別ができるようになる

訓練前と訓練後で FFA の活動を比較

Gauthier (1999)　　　訓練前：顔を見せたときにのみ FFA が強く活動　　　訓練後：顔とグリーブルの両者で FFA が強く活動

認知と心理 視覚認知

Documents

認知と心理視覚認知