the role of explanatory considerations in updating …miwalab.cog.human.nagoya-u.ac.jp › database...
TRANSCRIPT
The Role of Explanatory Considerations in Updating Igor Douven, Jonah N. Schupbach
Cognition, 2015, 299-311
<Introduction>
• 人間は,新しく得た情報に応じて,信念の信頼度を更新することで学習する
− いつ,どの程度更新するのかを決定する要因はなにか?
− 哲学において論争のある Bayesianismと Explanationismについて検討
ü Bayesianism: ベイズの定理によって導出される事後確率に更新
ü Explanationism: 条件付き確率でない方法(説明の良し悪し)で更新
• Q1: 説明の良し悪しの判断は,信念の更新において重要な役割を持つのか?
Q2: Q1が確認された場合,信念更新のために条件付き確率は(説明の良し悪しの判断
と並行して)用いられるのか?
Q3: 特に,どのような説明の良し悪しの判断が,信念更新の要因となるのか?
• 過去の研究で,人間の確率判断が規範的でないことが示唆されている(e.g., Phillips and
Edwards, 1966, Robinson and Hastie, 1985; Zhao et al., 2012)
• 説明の良し悪しが確率判断に影響を与えることを示した実験もある(Lombrozo, 2006; 2007;
Lombrozo and Carey, 2006; Douven and Verbrugge, 2010; 2013)
• しかし,Bayesianismと Explanationismの関係性を,実験を通して体系的に比較し
た研究は少ない
<Experiment 1>
• 目的: 参加者が求めた主観的事後確率をうまく説明する変数(あるいは変数の組み合
わせ)を探すために,説明評価のための4つの尺度を比較する
• 参加者: ピッツバーグ大学の学生 26名(平均年齢: 20歳(𝑆𝐷= 2), 女性 12名)
• 課題: 不透明な2つの壷を使用してインタビューを行った.各壷には40個のボールが入
っており,その内訳は黒いボール30個と白い玉10個を含む壷(壷A)と,黒いボ
ール15個と白い玉25個を含む壷(壷B) 参加者には,インタビュー開始時に壷が
示され,各内容についての教示を受けた.
実験者はコイントスをし,どちらか1つの壷から計10個のボールを取き出した(表
ならAから, 裏ならBから).参加者には,コイントスによって平等に壷が選ばれ
ることを伝えていたが,どちらが選ばれたかは知らせなかった.
その後,参加者は,玉が1度取り出される度,「壷Aから取り出している」とい
う仮説(HA)の説明的良さ(explanatory goodness)を5段階(「極めて悪い」か
ら「極めて良い」)で評価する.壷Bに関しても同様の評価を行った.
また,「壷A(B)がどれくらいの確率で選ばれたか」をそれぞれ-100から100で
評価した(主観的事後確率).ただし,AとBの合計は100になるようにしなけれ
ばならなかった.これら2評価を10回繰り返した.
• 記述統計: 青線が主観的事後確率,赤線が客観的事後確率を示す
− 主観的事後確率と客観的事後確率を比較すると,参加者の主観的確率判断は規範
から逸脱していることがわかる(両者が完全に一致した場合は,右図において,
全ての点が対角線上にプロットされる)
− 実際の確率が 50%より小さいとき(右図の左半分)は規範よりも大きく,50%よ
り大きいとき(右半分)は規範よりも小さく見積もられる傾向が示された
− 主観的事後確率の 87.3%は,規範値よりも 50%に有意に近かった(𝜒2(1) = 143.27,
𝑝 < .0001)
− 主観的事後確率・50%間の偏差の平均 < 規範値・50%間の偏差の平均(𝑡(259)=
16.27、𝑝<.0001)
− これらの結果から,中心化傾向バイアス(the central tendency bias)の存在が
考えられる
• O: HAの客観的事後確率, S: HAの主観的事後確率
A: HAの説明的良さ, B: HBの説明的良さ
− 全ての変数間に相関あり(有意水準はα=.0001)
− しかし,Oと Sの間に有意差あり(𝑡(259)=2.08, 𝑝=.039)
− 一方の説明に対する良し悪しの評価値は,もう一方の説明の良さの判断と負の相
関がある
• 一番の興味は,Oのみを予測因子にもつモデルMO1(Bayesianismモデル)と,A, B,
ABを予測因子にもつモデルMA1, MB1, MAB1(Explanationismモデル)の比較
− MOAB1以外のモデルは,MOAB1が持つ変数(M, O, A, B)のいずれかを含ん
でいるため,尤度比検定を用いてモデル間の優劣を判断する(𝜒2値が小さいモ
デルほど優れている)
− 現状,MOAB1が最も優れたモデルである.BayesianismのモデルMO1よりも,
Explanationismとの組み合わせモデルであるMOA1, MOB1の方が優れている
(MO1 vs. MOA1: 𝜒2(1) = 27.41, 𝑝 < .0001; MO1 vs. MOB1: 𝜒2(1) = 56.74,
𝑝 < .0001)
− MO1とMA1, MB1を比較すると,MO1の方がモデルとして優れている
(𝑝 < .0001)が,MAB1はMO1より優れている(𝑝=.024)
• Q1: 説明の良し悪しの判断は,信念の更新において重要な役割を持つのか?について
− Oの標準化係数βは 0.91と大きく,MO1において重要(有意)
− O・A・Bの 3変数すべてがMOAB1において重要(有意)
ü 客観的事後確率に基づく判断だけでなく,新しく得た証拠をもとに主観確率
を更新するという証拠である
• Q2: 信念更新のために客観的事後確率は用いられるのか?についてだが,MOAB1に
おいて,客観的事後確率 Oが他の変数と並んで重要な役割を果たしているため,Yes
− MAB1は客観的事後確率を変数から排し,完全に説明の良し悪しの判断だけで主
観的事後確率を予測するモデルだが,AIC・BICともに小さく,MOAB1に次い
で優れたモデルであると言える(Table2.2参照)
• Q3: どのような説明の良し悪しの判断が,信念更新の要因となるのか?について
− MOAB1では Aと Bの両方が有意な予測因子である
− モデルの従属変数が HAについての主観的事後確率であるため,HAの値の増加は
主観的事後確率の増加を説明する.一方で,HBの値の増加は,主観的事後確率の
低下を説明する
− Aと Bが事後確率の決定に貢献するとき,それらがどのように関係して影響を与
えているのか
• 混合効果モデル(mixed-effects models)
− 説明の良し悪しの判断には個人差が含まれる可能性があるため,それを考慮する
ことでMO1やMOAB1よりも優れたモデルを作る(Table 2.4)
− 尤度比検定を行いMMO1とMO1とを比較すると,前者が後者よりも有意に優
れたモデルだった(χ2(3)= 159.91, 𝑝<.0001)
ü AIC・BIC・𝑅2で比較しても明らかで,
[AIC] MMO1 : MO1 = −552.68 : −398.77
[BIC] MMO1 : MO1 = −531.32 : 388.09
[ 𝑅2 ] MMO1 : MO1 = .96 : .83
ü また,MMO1とMOAB1を比較すると,前者が有意に優れたフィッティン
グを見せた(χ2(1)=35.04, 𝑝<.0001).ただし,混合モデル同士で比較しな
ければならないため,MMOAB1をモデリング
− MO1→MMO1でモデルが大幅に改善されたのと同様に, MMOAB1もMOAB1
と比較して優れたモデルとなった(χ2(10)=128.62, 𝑝<.0001).AIC値は-628.26
(以前は-519.64)および BIC値は-574.85(以前は-501.84),𝑅2=.98(以前は.90)
− また,予測変数として Oと(A−B)を持ち,個人差を考慮したモデルMMO(A−B)
は,MMOAB1と比較すると AIC・BICの値では有意に優れており,𝑅2値は同
じだった(𝑅2=.98)
• Discussion
− MOAB1は,MO1を含む全てのモデルよりも正確に主観的事後確率を説明した
ü Explanationismを支持
− MOAB1の2変数 Aと Bを,「Aと Bの差」という変数に置き換えることで,同
等以上の説明力を持つモデルを導き出した.
<Experiment 2>
• 目的: 実験 1では,参加者 26人それぞれに実際に袋から玉を取り出していたため,出
方が 26通りで統一性がなかったため,予め出方のパターンを定めて実施する
− 実験 2では,各グループで玉の出方が同じなので,ランダム効果としてグループ
を有する混合効果モデルと,参加者を有する混合効果モデルの両方をつくり,そ
れらを比較することができた
− 実験 1の分析における混合効果モデルの優位性が,参加者毎に異なる一連の玉の
出方に直面していたことによるものであれば,グループをランダム効果として追
加することでモデルが改善される
− この予測が当てはまらなかったとき,実験 1のモデルの優越性は予測変数による
ものであり,参加者をランダム効果として追加することでモデルが改善される
• 参加者: 259名(平均年齢 39歳, SD=12; 女性=58%; 大卒 66%, 高卒 29%)
− ネット上のプラットフォームを介して募集
− 不完全な回答をした 9名,英語が母語ではない 15名,課題を理解しなかった 39
名(課題後のアンケートによって発覚),回答速度が最も速かった 5%と最も遅か
った 5%を除外した,計 167名を分析対象とした
• 課題: 実験 1と同様のものをWebブラウザで実施
− 10個の玉の出方は,実験 1の出方を参考に 4パターン用意し,参加者はランダ
ムに 4つのグループに割り振られた(除外後,35名, 41名, 45名, 46名)
− 取り出された玉の色はブラウザに表示され,記憶する必要はなかった
− 実験 1と同様,玉が取り出された袋が Aである確率(HA),Bである確率(HB=100
−HA)である確率,説明の良し悪しの判断(5件法)を回答した
• 結果:
− データの線形モデルは,混合効果モデルの前に,本実験のデータで実験 1と同様,
Bayesianism vs. Explanationismを検討する(実験 1では後者の立場を支持)
− 分析結果は,実験 1に見られるパターンと似ていた(Table 3.1)
ü Vuong検定(競合するモデル間の優劣を統計的に検定するモデル選択検定)
によれば,MOAB2は,MO2含め,他のモデルよりも優れていた.
ü また,MO2はMA2・MB2よりも有意に劣ってはいなかったが,MAB2よ
りは有意に劣っていた
− 特に関心のある 2つのモデルMO2とMOAB2を比較し,実験 1の結論
(Explanationism > Bayesianism)を再検討する(Table 3.2)
− 今回も,HA−HBという変数 Xを定義し,Oと Xを予測変数とするモデルを作成
した
ü 𝑅2値において,MOX2とMOAB2は同じ.AIC・BICの値(2422.07, -2400.38)
はMOAB2の値より多少下回っていた.Vuong検定によれば,MOX2 >
MOAB2だった(𝑝<.0001)
− 今回の実験の動機付けとなった主な質問に答えるために,MO2とMOAB2のそ
れぞれについて,2種類の混合効果モデル(ランダム効果としてグループを有す
るモデル,ランダム効果として参加者を有するモデル)の両方を作成・比較した
ü ランダム効果として参加者を組み込んだモデルは,MO2・MOAB2ともに
通常のモデルよりも大きく改善された(MO2:χ2(1)=517.92, 𝑝<.0001)
(MOAB2: 𝜒2(6) = 773.54, 𝑝 < .0001)
ü ランダム効果としてグループを組み込んだモデルは,通常線形モデルと比べ
て有意に優れているモデルにはならなかった
• Discussion:
− 主観的事後確率を予測するために,客観的事後確率を考慮するだけでなく,説明
的の良し悪しの判断を考慮するという Explanationismの主張のさらなる証拠と
なった
− ランダム効果として参加者間の揺れを組み込んだモデルは,通常のモデルと比較して
有意に改善された一方で,グループ間の揺れを組み込んだモデルは,改善をもたらさ
なかったことを考慮すると,説明の良し悪しの判断が主観的事後確率にどの程度に影
響するかは個人差が大きいと考え得る証拠となった
<Experiment 3>
• 目的: 実験 2におけるグループ間の玉の出方の差をなくすために,
• 参加者: 201名(平均年齢 39歳, SD=12; 女性=70%; 大卒 70%, 高卒 24%)
− 実験 2と同様の基準で除外し,最終的に 114名を分析対象とした
• 課題: 実験 1と同様のものをブラウザで実施(平均 206秒, 𝑆𝐷=74秒)
− 手順は実験 2と同じ(参加者を4グループに振り分ける)
− ただし,出玉の色を毎回確認し,説明を毎回評価するのではなく,10個の玉が出
揃った状態を見て,確率や説明の良し悪しを評価する
• 結果:
− 実験 2までの議論に沿って,Oだけでなく Aと Bを予測変数に持つモデル
(MOAB3)がすべての指標に最も適していることが予想される
− 実験 2と同様に(実験 1とは対照的に),AIC・BICに着目すると,MO3がMA3
やMB3よりも劣っている(尤度比試験およびVuong検定によっても確認された)
− MAB3がMOAB3に次いで優れたモデルであり,実質的にMOAB3と同様に効
果的であると言える
ü 客観的確率は主観的事後確率の説明に重大な影響を及ぼすことを示してい
る一方、説明の良し悪しの判断も同様に重要であり,Explanationismをさ
らに支持する結果となった
− Table 4.2では,MO3とMOAB3についてより詳細な回帰結果を示し,客観的事
後確率が主観的事後確率に有意な影響を及ぼすことを改めて確認する.ただし,
説明の良し悪しの判断についても同様の結果が見られ,Explanationismをさら
に支持する結果となった
− また,HA−HBを変数 Xとしてモデルに組み込んだら,MOX3 > MOAB3となっ
た(MOX3は,AIC=−178.46および-BIC=−167.52)
− すべての参加者が,取り出された 10個の玉の色が最終的にどうだったかについ
てのみ質問されたので,参加者をランダム効果として含む混合効果モデルを作成
することはできなかった
ü しかし,参加者を 4グループに分け,各グループが異なる一連の出方を観察
したため,グループをランダムエフェクトとする混合効果モデルを作成した
ü 上記で検討したすべてのモデルの混合効果モデルを検討したが,そのどれも
が,対応する通常のモデルよりも有意に優れていたものはなかった
ü そのため,実験 1における混合効果モデルの優位性は,混合効果モデルによ
る優れた結果は,全参加者が異なる玉の出方を観察したという事実の副産物
に過ぎないのではないか
<General Discussion>
• Q1について
− ベイジアンモデルMO1〜3,特に Bayesianismの混合効果モデルMMO1と
MMO2は,参加者の確率更新に適合した
− しかし,ExplanationismのモデルMOAB1〜3,MMOAB1〜2は,Bayesianism
のモデルよりも優れていた
• Q2について
− 客観的事後確率もまた,最も適合する Explanationismのモデルにおいて重要な
要因かどうかを検討した.
− 予測変数が Aと Bのみで,Oを含まない極端なモデルは,Sをうまく予想した
→客観的事後確率は必要ない?
− しかし,そのような純粋な Explanationismのモデルは,すべての場合において,
A,B,および Oの3変数を予測因子として組み込んだモデルMOABによって凌
駕される
ü MOAB1〜3,MMOAB1〜2のすべてにおいて,客観的事後確率(O)は非
常に重要だった
− したがって,我々の研究は,客観的事後確率が説明の良し悪しの判断とともに確
率更新に貢献することを支持する
• Q3について
− 変数 A・Bの組み合わせを,差 A−Bで置き換えることで,より適合度の高いモデ
ルを得ることができることが明らかになった
− 今回明らかになった中で最も優れたモデルは,予測変数に Oと差 A−Bを持つ混
合効果モデルである
• 我々の実験では、HAと HBの間の説明の良し悪しの差が,これらの仮説に対する主観
的事後確率を求める中で重要な役割を果たすと考える証拠を見出した