ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf ·...

12
12.10 表4-14のデータに対して,∬軌ガン死亡者数と塩売波畳が2変数正 規分抑こ従うと仮定して,帰無仮説為‥P=0を有意水準10%で検定せよ. ここで,Pは母相関係数を表すものとする. 12.11前間と同棲な仮定が,胴げソ死亡者数とタバコの販売量に対しても 成立するものとする.このとき,帰無仮説玖:P=Ot8を有意水準5%で検 定せよ. 12.ほ12人の浜技に対して,審判員A,Bの順位ほ A:12 3 4 5 6 7 8 9101112 B;3 8 51221911104 6 7 であったという.A,Bの順位の付け方に関連性があるかどうかを,有意 水準5%で検定せよ. 12.13蓑4-6?データに対して,学生種別が全科履修生かそうでないかに 2分したときに,この分構と性別が独立であるかどうか,有意水準1%で 検定せよ. 12.14 表4-7のデータに対して,長野県を教育県だと思う人の割合と年代 とは関連があるかどうかを,有意水準5%で検定せよ.(無回答は,たとえ ば「どちらとも言えない」に含めて計算した方がよい。) 1う ベイズ推論 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」 がある.第1章で統計学の発展について簡単な解説を行なったが, 20世紀の統計学でも統計分析の基本的な考え方は1.つではない. 1950年代までの主流は,E,S.PearsonやJ.Neymannなどを中心 にして体系化された数理統計学の方法論であり,ネイマン・ピアソソ 学派と呼ばれる.これに対して,最近でほベイズ統計学あるいはペ イジアン統計学(Bayesianstatistics)とよばれる考え方が次第に広 まりつつあり,現在の統計手法は大きくべイズ統計学と,非ベイズ 統計学(non-Bayesian statistics)とに分けられるようにぎえなっ た.非ベイズ統計学は,繰り返し実験に基づく標本分布を基本的な 分析用具とすることから,標本理論と呼ばれることもある.この章 ではベイズ統計学の基本的な考え方を学ぶことにする.なお,この 立場にたつ人々をペイジアンと称する. ベイズ礫計学とは,その名称からわかるように,ベイズの定理を 基本的な分析手法として用いる考え方である.ベイズの定理は第6 章で学んだが,この定理を利用することは,実は確率の解釈に関し て根本的な問題を提起することになるのである.このことを理解す るために,以下のような例を考えてみよう. 例13-1 ある地域の小学校では,ある病気Ⅹ(たとえば結核)を予防する た捌こ,ある検査A(たとえばツベルクリン反応)を実施してい る.この検査は次の表13-1に示すような性質を持っている.この 表13-1検査Aの特性 表にほ,検査を受ける人が病 気Ⅹにかかっているとき, いないときのそれぞれについ て,検査結果が陽性および陰 1う ベイズ推論-265 264

Upload: others

Post on 25-May-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

12.10 表4-14のデータに対して,∬軌ガン死亡者数と塩売波畳が2変数正

規分抑こ従うと仮定して,帰無仮説為‥P=0を有意水準10%で検定せよ.

ここで,Pは母相関係数を表すものとする.

12.11前間と同棲な仮定が,胴げソ死亡者数とタバコの販売量に対しても

成立するものとする.このとき,帰無仮説玖:P=Ot8を有意水準5%で検

定せよ.

12.ほ12人の浜技に対して,審判員A,Bの順位ほ

A:12 3 4 5 6 7 8 9101112

B;3 8 51221911104 6 7

であったという.A,Bの順位の付け方に関連性があるかどうかを,有意

水準5%で検定せよ.

12.13蓑4-6?データに対して,学生種別が全科履修生かそうでないかに

2分したときに,この分構と性別が独立であるかどうか,有意水準1%で

検定せよ.

12.14 表4-7のデータに対して,長野県を教育県だと思う人の割合と年代

とは関連があるかどうかを,有意水準5%で検定せよ.(無回答は,たとえ

ば「どちらとも言えない」に含めて計算した方がよい。)

1う

ベイズ推論

13.1ベイズ統計学

現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

がある.第1章で統計学の発展について簡単な解説を行なったが,

20世紀の統計学でも統計分析の基本的な考え方は1.つではない.

1950年代までの主流は,E,S.PearsonやJ.Neymannなどを中心

にして体系化された数理統計学の方法論であり,ネイマン・ピアソソ

学派と呼ばれる.これに対して,最近でほベイズ統計学あるいはペ

イジアン統計学(Bayesianstatistics)とよばれる考え方が次第に広

まりつつあり,現在の統計手法は大きくべイズ統計学と,非ベイズ

統計学(non-Bayesian statistics)とに分けられるようにぎえなっ

た.非ベイズ統計学は,繰り返し実験に基づく標本分布を基本的な

分析用具とすることから,標本理論と呼ばれることもある.この章

ではベイズ統計学の基本的な考え方を学ぶことにする.なお,この

立場にたつ人々をペイジアンと称する.

ベイズ礫計学とは,その名称からわかるように,ベイズの定理を

基本的な分析手法として用いる考え方である.ベイズの定理は第6

章で学んだが,この定理を利用することは,実は確率の解釈に関し

て根本的な問題を提起することになるのである.このことを理解す

るために,以下のような例を考えてみよう.

例13-1

ある地域の小学校では,ある病気Ⅹ(たとえば結核)を予防する

た捌こ,ある検査A(たとえばツベルクリン反応)を実施してい

る.この検査は次の表13-1に示すような性質を持っている.この

表13-1検査Aの特性 表にほ,検査を受ける人が病

気Ⅹにかかっているとき,

いないときのそれぞれについ

て,検査結果が陽性および陰

1う ベイズ推論-265 264

Page 2: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

性になる確率が与えられている.

さて,校医yの診断で,ある子どもgの検査結果が陽性とでた

とき,それだけでgがⅩに感染しているといえるだろうか.統計

学の勉強をしたことがない人であれば,陽牲になる確率0.9と0.2

を比べただけで,かなり高い確率で感染していると考えるかも知れ

ない.この問題に,ベイズの定理を応用しよう.

いま,これまでの経験から,この地域では病気Ⅹに感染してい

る児童の割合は1%であることが知られているものとしよう.そう

すると,この特定の子ども互が感染している確率も,ほかの子ど

もたちと外見上の健康状態が同じならば,1%と考えるのが自然で

あろう gが病気Ⅹ正感染しているという事象をⅩで表し,検査

結果が陽性となる事象をAで表すことにすると,以上から次のよう

る..この点が明らかにならないかぎり,ベイズの定理の意味は明ら

かでなく,したがってその価値も認められないことになる.すでに

第6章で説明したように,ベイズ統計学では確率はすべて主観的な

ものとして定義される.次節で,その意味について考えよう.

13.2 主観確率

近代確率論は数学的な公理体系として整理されており,その体系

は第6章にも紹介されている.しかしこの概念を現実に応用しよう

とする場合,確率をいかに解釈するかという問題峠道けて通れな

い.ここでは3つの考え方を順にみていこう.

先験的確率

サイコロ投げを考えるとき,われわれは「2の目がでる確率は

1/6だ」と自然に考える.それは,この実験では可能な結果が6通

りであり,そのいずれも「同様に確からしい」と考えられるからで

ある.この例のように,同様に確からしい事象がⅣ通りあるとき,

その1つ1つの事象の確率ほ1/Ⅳと定義するのが先験的確率であ

る.トランプによるゲームや,コイン投げの問題など,そもネも近

代確率論が生み出されたときには,このような発験的確率が自然に

定義されるような問題が扱われていた.

ところでこのような定義が受け入れられる条件としては,トラソ

プはよく混ぜてからカードを引く,などの前担がある.しカゝしコイ

ン投げの実験で,もしもコインが歪んでいれば,もほや同様に確か

らしいとはいえないから,そのような例ではそもそも「表のでる

確率」などは定義できないことになる,したがって先験的確率の解

釈によって利用できる確率論の成果も,その応用の範囲は限られた

ものとならざるを得ない.

相対度数

歪んだコイン投げの例については,次のような実験(思考実険)

を考えることができる.もちろん実際に突放するわけではなく,頭

の中だけで考えられればいい.

問題のコインを投げ続けて,毎甲の結果(表または裏)を記録

したものとする.いま乃回投げて,そのうちのr(乃)回に表がでた

ものとすると,衰の「相対度数(頻度)」は′(乃)=r(7Z)/乃となる.

たとえばクヱ=10,000までの結果は図13-1のようになる.このよ

うに”とともに相対度数が変動することは,経験的によく知られて

15 ベイズ推論-267

な確率が与えられる.

ア(ズ)=0.01

ア(AlX)=0.9

ア(Al又)=0.2

ただし又はⅩの余事象,すなわち足がズに感染していないとい

う事象を表す.われわれが欲しい確率は,検査結果が陽性であるこ

とを知ったとき,足が病気である確率ア(ⅩlA)であるが,それほ

ベイズの定理から次のように計算さ九る.

ア(ズIA)=ア(AlX)ア(g)/ア(A)

ア(Alズ)ア(Ⅹ)

ア(Alズ)ア(ズ)+ア(AlX)ア(又)

0.9×0.01

0.9×0.01+0.2×0.99

=0.043478 (13.4)

つまりこの検査だけからは,足が病気である確率は5%にも満た

ないほど小さいことになる.-(この例続く)

ところで今の例で,足は実際檻病気Ⅹにかかっていたのを,こ

の子のかかりつけの医師Zが知っていたものとする.そうすると

実は「だが・ズにかかっている確率」ははじめから100%であって

ベイズの定理などそもそも利用する必要がないことになる.ふたつ

の事前確率,P(Ⅹ)=0.01とア(ズ)=1のどちらを正しいと考える

べきだろうか.

ここでの本質的な問題は,確率P(Ⅹ)とは何か,という点であ

266

Page 3: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

投票前夜の天気に関する同様な状況(投票日の天候が投票行動に影

響を与えることはよく知られている),その他無数の条件を同じに

して,実験を繰り返すことを考えなければならない.

結局,「今日」という状態を何回も作り出すことを想定しなけれ

ばならないが,そうすると,開票結果はまったく同じとならざるを

得ないことになる.そこで,明日になってか候補が当選したこと

がわかれば,この実験を何度繰り返しても刀候補は当選する.す

なわち,相対度数は100%になるし,逆にか候補が落選するなら

ば,相対度数は0%になる.

したがって,この例ではそもそも実験を繰り返すということが原

理的に不可能,あるいははとんど無意味と考えられる.(例終り)

じつは,実験の環境を厳密に同じにするということについての困難は,コ

イン投げの問題にもあてはまる.コインのはじきかた,落下する床の状態

(へこみ具合いなどのすべて),部屋の中の空気甲状態,など,ありとあらゆ

る条件をすべて同じにして実験を行なえば,必ず結果は同じ(たとえばい

つも表)となるはずである.しかし,経験から明らかなように,十分高いと

ころから,十分大きい回転を与えてコインを投げれば,どんなに訓練した人

間でもいつも表を出すとし、うことは不可能である.それほ,ほんのわずかな

ほじきかたの適いによって,結果が大きく変化するような実験を考えている

からである.このように,同じ実験といっても,最後には偶然の影響を除外

できないようなものについて,確率という概念が意味を持つのである.フラ

ンズの数学者ポアソカレの『科学と方法』(岩波文庫)にも関連する問題の

記述があるので,このような話題に関心のある読者は参考にして欲しい.

主観確率

先の例13-1をもう一度考えよう.足を初めて診察した校医y

は,この地域では病気Ⅹに感染している児童の割合は1%であるこ

とを知っている.さらにyの判断では,首とほかの子どもたちと

外見上の健康状態は同じであった.このときには,検査Aを実施

する前の校医yにとってほ「足がⅩに感染している確率」は1%

と考えるのが自然であろう.第6章で述べたように,このような確

率の判断は判断の主体(ここではy)に固有のものであるとし

由で,主観確率と呼ばれる.そうすると,例13-1で取り上げた事

前確率ア(Ⅹ)および事後確率ア(ⅩlA)はいずれもyにとっての主

観確率であったということになる.

このように考えれば,家庭医Zにとって,「疋がⅩに感染してい

る(主観)確率」はア(ズ)=1となって,この場合には事後確率も

1ら ベイズ拙論-269

0

。∴。○・。 。。。・。e。・。…¢¢。

。。.。。 ○ ●

1 10 10U lOOO lOOOO ク2

図13-1コイン投げの実験(構軸は対数尺度を用いていることに注意)

いる事実である.また,相対度数∫(乃)の変動は乃が大きくなるに

つれて次第に弱まっていき,ついにはある特定の値に近づくように

見える.この値のことを「表がでる確率」と定義しようというの

が,相対度数による確率の解釈である.このような考え方ほ相対度

数(頻度)説とか,経験的確率とか呼ばれる.

ところで,以上の意味での極限は,もちろん数学的な極限ではな

い.数学的には7‡がある値より大きければ相対度数が特定の値に十

分近くなることは何も保証されていない.それでも,経験的にある

種の極限が観察されることが,この確率の解釈の基礎となっている

のである.

この解釈によれば,先はどの歪んだコインについても表のでる確

率を定義することができる.ただし,その確率がいくらであるかは

実験をしてみなければわからない.また,実際にはコインを無限に

投げ続けることは不可能である(コインが摩耗すれば,もはや同じ

実験とはいえないし,そもそも人間の寿命は有限である).それに

もかかわらず,繰り返しの可能な実験については,この解釈で広い

範囲に確率論を応用することができそうに思える.しかし,次の例

を考えてみよう.

例13-2

C市でほ,明日,市長選挙が行なわれる.選挙運動を終えた時点

で,ある政治評論家は,か候補が当適する確率を80%であるとい

っている.この確率を相対度数で解釈するとどうなるだろうか.そ

のためには同じ実験,すなわち同じ条件の選挙を何回も行なうこと

を想定しなければならない.つまり,同じ有権者,同じ政治環境,

268

Page 4: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

は情報ガを前提にして定められる.したがって確率ほすべて条件

一付き確率ということになる.そこで,確率の公理も,第6章で述べ

たような形よりも,はじめから条件付き確率の形で与えることが多

い.たとえばAlfredR6nyi:FblmdationsdProbability,Holden・

Day(1979)やAnthony O’Hagan:Probability,Chapmanand

Hall(1988)などがそのような立場である.条件付き確率の公理の

たやに,次のような事象を考える・

A,A花(7Z=1,2,…)を任意の事象とし,旦Cを事象のうち,条

件の前提とできるような事象とする(たとえば塗薬合針は含まな

い).残念ながら,月などの条件の前提とできる事象がどのような

条件を満たせばいいのかについての数学的に赦密な議論は,この講

義の水準を超えるので,ここでは省略する.

(公理1)固定した別こついてア(A1月)ほ非負である.またA几

(乃=1,2,・‘・)を互いに排反な事象とするとき,ア(A」月)

は加法的である.すなわち

P(Ⅹ」A)=1と変化しないことがベイズの定馴こよって確かめられ

る.つまり主観確率の立場では,客観的確率という唯一の確率のか

ぁりに特定の問題に直面している個人にとっての主観的確率という

ものの存在を認め,その確率は個人個人によって異なることをも認

めるのである.しかし,そうはいっても,まったくでたらめに確率

を定めていい,というものではない.主観確率でも,数学としての

確率の公理体系を満足させなければ,確率と呼ぶわけにはいかない

のであるから,これは当然のことである.そのためには,合理的に

行動する人間,という考え方が必要であるが,実際に,どうしたら

数学としての公理体系を満足させるような主観確率を定めることが

できるかは,次節で説明する.

ここでは,なぜ主観確率に違いが生ずるのかを考えてみよう.

例13-3

ある男〟が,サイコロを使う賭(丁半)をすることになった.

用いられるサイコロは,見かけ上まったく自然であり,数回転がし

てみてもおかしいところほまったく見いだせなかった.この男〝

はいつも半(奇数)の目に牌けることにしているが,彼にとって

「サイコロ投げ(1回勝負)で勝つ確率」は1/2と考えてよい.

ところで彼の相手はイカサマ師アで,誰にもわからないうちに

サイコロをすり替えた.アは,あらカラじめ多数回実験をして丁(偶

数)の目のでる頻度は1/2ではなく0.9となることを確かめていた

とする.そこでアにとって「〟が勝つ確率」は0.1となるであろ

う.しかし,このサイコロを外見などで判断する限りどこもおかし

なところがなければ,〟としては,次の勝負で勝つ確率は相変わ

らず1/2と想定する以外に方法はないことになる.(例終り)

このように確率の判断は,.判断に先立つ情報をどれだけ持ってい

るかによって異なるのである.したがって,任意の事象Aに閲す

-る客観的確率というア(A)が存在すると考えることはできず,あ

る情報ガを前提とした条件付き確率ア(Alガ)のみの存在が認め

られることになる.人間が合理的に行動するものと仮定すれば,同

じ陪報せ持っている人々は同じ主観確率を持つことになる.しか

し,今の例や,先の例13-1のような場合には,事前の情報ガは人

によって異なるのだから,主観確率も人によって違ったのである.

条件付き確率の公理

以上の皐うな立場をとるベイズ統計学にとっては,すべての確率

270・

ア(UA花トβ)=∑ア(A乃l月) 弗=1 ク1=1

が成立する.

(公理2)ア(βlβ)=1

(公理3)もしもβ⊂Cかつ

ア(月tC)>0

であれば,すべての事象Aに対して

(13.5)

ア(AnβlC) P(Al月)= (13.8)

が成立する.

情報ガによって主観確率が異なることを認めるベイズ統計学の

立場では,第6章で紹介したような公理体系より,条件付き確率の

公理体系の方が利用しやすいことは理解できよう.ただし,これか

ら先でもいちいち月‘を示すのはわずらわしいので,誰にとっての

主観確率であるかが分脈から判断できるときにほ,ア(Al月つの代

わりに通常の記号ア(A)なども用いることにする.

ベイズの定理の解釈

これまでの議論で明らかになったように,ベイズの定理を利用す

るためには確率として主観確率を導入することが基本的な前提とな

る.そのことをこれまで匿あげた例で考えよう.

1う ベイズ推論-271

Page 5: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

例13-1については,すでに触れたように,医師yとZとでは事

前の情報が違っていたために彼らの事前確率も異なっていた.しか

し,もしもyがZと同じ情報を持っていたならば2人に共通な事

前分布が想定できるのであるから,それを客観確率と呼んでもいい

のではないか,そして,そうすることによって,非科学的な印象を

与える主観確率という概念を不要にすることができるのでほない

か,と考える人もいるかも知れない.実際,ベイズ統計学が比較的

浸近まで一般に受け入れられなかったのは,「主観」という概念を

科学的な立場から正当化することが容易ではなかったからである.

しかしながら,相対度数による客観確率の解釈によっては,ベイ

ズの定理はほとんど意味を持たないのである.つまり,疋ほ病気Ⅹ

に感染しているかいないかのどちらかである.すると,相対度数的

に解釈するならば,疋がⅩに感染しているときは,何度思考実験

を繰り返しても足ほⅩに感染しているのであり,その相対度数

(すなわち客観確率)は1とならざるを得ない.逆に,gがⅩに感

染していないならば,客観確率ほ0となる.

このように,「足がⅩに感染している」などのような事象(第6

茸の用語では原因)は,正しいか正しくないかのどちらかしかない

わけで,それが正しい確率,という概念は相対度数的にほ殆ど無意

味なのである.

客観的には固定している原因(病気Ⅹ)についての判断を(主観)

確率で表現すれば,いろいろな情報を得ることによってその判断は

変化するであろう.ベイズの定理は,このような判断の変更手続き

を与えるものと解釈すべきである.

例13-2では,選挙について何も知識のない人であれば,刀候

補の当選する確率は(仮に候祁著が5人いれば)1/5と考えてもお

かしくはない.先ほどの政治評論家は,彼の得た情報によって1/5

という素朴な事前確率を変換した結果として,0.8という事後確率

を得たものと理解される.

例13-1(続き)

さきに,医師Zの主観確率をア(Ⅹ)=1としたのは,実は非現実

的である.Zが足の病気を確信するに到る経過は,実際は以下のよ

うなものであろう.先ほどの検査Aのはかに,病気Ⅹに関する検、

査月,Cがあり,それらの特性は表13-2に示すとおりとする.ま

た,これらの検査結果はいずれも独立な確率変数とする.すなわち

272

ア(An月lX)=

ア(AlX)ク(β」Ⅹ)

などを仮定する.

足はいずれの結果でも

陽性と甘たものとする

表13-2 検査凰Cの特性

と,Zのはじめの確率ア(Ⅹ)=0.01は,検査Aの結果から

P(AtX)P(Ⅹ) ア(ⅩlA) 0.04348

ア(AlX)ア(ズ)+P(Al又)ア(妥)

とベイズの定理匿よって変換される.ただし,ここではア(Ⅹ)な

どはZの主観確率を表すものとする.さらに,検査月の結果をみ

たときのZの判断はア(ⅩlA)を事前分布としてベイズの定理をも

う一度適用すれば,次のようになる.(ここでほ検査Aとβが独立

であることを用いている)

ア(ⅩlA,β)=ア(劃ズ)P(glA)/ア(月」A)

ア(月lX)ア(ⅩlA)

ア(βlズ)ア(ⅩlA)+ア(β卜言)ア(度IA)

0.8×0.04348 0.26667

0.8×0.04348十0.1×0.95652

最後に,検査Cの結果を知ったときにはア(ⅩtAnβ)を事前分布

としてベイズの定理を適用することにより,次のようになる.

ア(ⅩlAnβnC)=ア(ClX)ア(ⅩlAn月)/ク(CIAnβ)

ア(ClX)ア(ズIAnβ)

ア(Clざ)ア(ⅩlAnβ)十ア(Cl又)P(度】An月)

0.95×0.26667 0.95×0.26667+0.15×0.73333

=0.69725

このように,新たな情報を得ることによってそれまでの判断が修

正されていき,正しい状態(すなわちⅩであること)の確率が次

窮に1に近づいていくのである.(例終り)

13.3 主観確率の定め方

いま述べたように,ベイズ統計学は「主観確率」という概念を必

要とする.したがって主観確率を科学的な立場から正当化しなけれ

ばならない.そのためにはいくつかの方法があるが,合理的行動を

する人間のモデルに基づいて,ベイズ統計学の体系を整合的に導い

.たのはLeonardJ.Savage:Fbundation5 qfSiatistics(1954)で

1う ベイズ推ぷトーー273

Page 6: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

ある.以下では,もう少し簡単な方法で,主観確率がどのようにし

て導かれるかを概観する.

原因として一般的に扱うべきものはパラメータ(母数)βであ

り,/ミラメーク全体の集合は母数空間∂である.ここでは事象E

ほ母数空間∂の部分集合と定義してよい.さらに人間のとり得る行

動dを決定(decision)と呼び,/くラメークβと決定dの組み合わせ

として定まる状態c=(♂,d)(すなわち報酬や損失)を結果と呼ぶ.

ここでは,母数も決定も有限個の場合のみを考える(連続的変数は

離散的変数で近似されるという第2章の議論を思い出せば,有限個

にちいての議論でも十分に一般的であることがわかる).

例13-4

ある甲の朝,ダ氏が家を出るときに,傘を持っていくかどうか

迷っている状況を考えよう.ここではパラメークβはその日の降雨

量(mm単位)であり,事象且の例は,小雨,大雨,晴れ,などで

ある.ダ氏の決定としては,dl:傘を持っていく,d2:傘を持って

いかない,などが考えられる.したがって,結果の例としてはc=

(雨量Ommのとき,レインコートを着て長靴をはいて傘を持って

いく)や,C′=(雨量50mmのとき,傘を持っていかない)などが

あげられる.(例終り)

以下の議論はやや数学的なので,興味のない読者は次の例まで飛

ばしていい.

ここで意思決定者(主観確率を前提とするベイズ統計学では,特

定の個人を対象として理論を構成することを思い出して◆ほしい)

が,β∈Eのときcl,そうでないときc2を結果として受け取る状

況を考える.このような状況はくじ(あるいは賭,英語では

lottery,gamble,云ptionなど)と呼ばれるが,これを

のような記法が恵妹をもつ.ここで,次の仮定が重要である.

(仮定1)すべてのくじは,選好(preference)を比佼することが

できる・すなわち,任意の2つのくじβ1とβ2が与えられ

たとき,意思決定者にとって

β1>β2(♂1をβ2より選好する)

β1<β2 ■(gzをβ1より選好する)

β1~β2(♂1と♂2は知差別である)

という3つの状態のうちの1つだけが成り立つ.

(仮定2)選好は推移的(transitive)である.すなわち

β1>β2かつβ巳>βaならばgl>β8である.

結果cそのものも,くじの特別な場合であるから,上の仮定から結

果を選好の順序に並べることができる.ここで,dも♂も有限であ

るから結果の数も有限となり,最良の結果c*と撮悪の結果c*が存

在する.そうすると標準実験によるくじと結果cとを比較すること

により(仮定から比較可能である),すべての結果cは

C~(c=きzらC*(1-“)) (13.11)

を満たすz‘によって一意的に順序づけることができる.この

混=ヱ‘(c) (13.12)

は,経済学において結果cの効用(utility)と呼ばれるものと本質

的に同等である・さらに次の仮定を導入する.この仮定は,結果を

それと同等なくじで置き換えても,選好が変らないことを意味する

ものである.

(仮定3)くじは代替可能(substitutable)である.すなわち

c~(cl耳,C2眉)ならば

(cア,ご3戸)~(cl(且F),C2(丘ダ),C8戸)(13.13)

が成り立つ・(簡単のために∴Enダを且Fのように表すこ

とにする.)

以上から,任意の事象Eが与えられたとき,結果c=(。*亙。*且)

と標準くじから得られ畠結果(c*“,C*(1-“))とが無差別になるよ うなα(0≦“≦1)が存在することがわかる.このz‘を意思決定者の

事象且に関する主観確率と呼び,ア(E)と表す.

このようにして得られた主観確率アは,確率の公理(第6章のも

の,あるいは本章の条件付きのもの)を満たすことが以下のように

して確かめられる・第6葦の通常の公理について示すと(Al),

(A2)を満たすことは明らかである・(A3)については,今は有限個

1う ベイズ推論-275

β=(cl旦,C2E) (13.9)

と表すことにする.

われわれは,区間[0,1]上の一様分布に従う(すべての人が承認

するという意味で客観的な)確率変数の存在を仮定する.そのよう

なものとしては,ルーレットのような回転盤を精密化したものを想

定すればいい.このような確率変数を標準実験とよぶ.標準実験匿

よって,たとえば(13.9)における事象且を確率(標準実験の意味

で)㍑の事象とすれば

β=(clα,C之(1-α))

274

(13.10)

Page 7: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

て,その馬券ほあたれば1杖につき300円の配当がつく.もう1つ

の封筒には現金100,000円が入っている.エ氏ほ2つの封筒のうち

いずれかをもらえると位肌、て,熟考したすえに馬券を選んだ.もし

も,この場合のエ氏にとっての効用が金偶で表現できるとすれば,

このことは,■エ氏にとって馬券のほうが現金より効用が高い,すな

わち期待金額が大きいことを意味する‥馬券のあたる(エ氏の主

観)確率をクとすると,これから300000♪≧100000すなわち♪≧

1/3が導かれる.(例終り)

このような牌の状況を想屈すれば,われわれがいろいろな事象に

対して抱いている主観確率をある程度明らかにすることができる

主観確率を実際に評価する問題は,心理実験の問題でもあり,この

節で紹介した方法のはかにもいろいろな方法が考案され,現実問題

にも応用されるようになってきている.

なお,主観確率を厳密に評価することが難しいという場合も,も

ちろん存在する.そのような事態を心配する人のためには,後にそ

の例を示す「安定的推定」の命題がある.この命題によれば「デー

クを十分に多く観察すれば」,事後分布から得られる結論は,事前

分布によらず安定的であることが示される.したがって,主観確率

を精密に評価する必要があるのは,観測されるデータが不十分な場

合だけであるということにもなる.

13.4 2項分布に関する推論

この節では,最も簡単な問題として,2項分布に関するベイズ

推論を述べる.問題は,確率変数Ⅹが2項分布昂(7ちのに従うと

き,そのパラメータ♂を推定することである.ここで♂の範囲は区

間[0,1]である.Xの確率分布は

ゃ(∬岬)=Cβ∬(1-♂)… (13.19)

と表さ方†る(弼1,…,乃)・ただしc=(芸)である・今までは,確 率分布の変数とパラメータを区別するためク(∬;♂)と書いたが,ベ

イズ統計学の伝統に従って第13章,第14葦では〆エlのの形で表

す.

事前分布

βに関する事前分布としては,次の形のもの(ベータ分布と呼ば

れ月(α,ろ)と略記される)を想定する(α>0,み>0).今の問題では

これは数学的な扱いが最も簡単な事前分布である.

1う ベイズ推論277

の場合を考えているから,屈1,且2

を互いに排反な事象とするとき

P(耳1∪且2)=ア(耳1)-トP(屈2)

(13.14)

が成り立つことを示せばいい.その

た即こは標準実験によって確率0.5

表13-3 加法性の証明のための

2つのくじ一

くじβ1 くじ戯

∴・J・- -J・-

E 且 E

.に..K .uト

ハし ハし ′し

声 * *

(し C (し

の事象ダ(公平なコイン投げを考え

てもいい)を想定し,表13-3のようなくじβ1とg2を考える.た

だし,且3は(ElU且2)の余事象であり,2つのくじはいずれも事象

且とダの組合せで結果が定まるものとする.

まず事象ダの定義から◆

(c毒;ダ,C⇒…犀)~(c*見c;王;ダ) (13.15)

であるから,E2が起きたときにはくじβ1とβ2とは無差別になる.

それ以外のときは2つのくじは同じであるからβ1~β2が導かれ

る.ここで且1,E2,(且1∪且2)の主観確率をそれぞれα1,Z‘2,‡‘とし,

それぞれのくじと等価な結果をcl,C2,Cという記号で表すことにす

る.つまり

cl=(c‥お風,C戎透1)=(c;kヱ‘1,C卓(1一之‘1))

c2=(c*E2,C*眉2)=(c考;‡J2,C司;(1一子‘2)) (13.16)

c=(c串(且1∪属2),Cェ!ミ(耳1∪且2))=(c*zらC可ミ(1-Z‘))

とする,そうすると,はじ捌こダと斤の分類に注目することによ

って

β1~(clダ,C2厨)~(c⊃k且ダ,C;ト屋1ダ,C弓く且2斤,C*眉2厨)

=(c弓;(茸㌔uE2戸),C竜⊆(屋1ダ∪屋2犀))

=(cヰ;z‘′,C*(1一‡/)) (13.17)

を得る.ただしzJ′=(即1+晦)/2である.(ア(ダ)=P(厨)=1/2に注

意)同様にして

β彗~(cダ,C司;犀)~(㌔(且1∪且2)ダ,C巧く且3ダ,C‥:;犀)

(13,18) =(c司…z‘′′,C*(1-㍑′′))

を得る.ただし,‡‘′′=ヱ‘/2である.

以上の結果を合わせると,Z上′=〝′′すなわちz‘1+!‘2=‡‘となって,

(13,14)式が成り立つことが証明された.

例13-5

エ氏の酔狂な友人が,プレゼソトとして2つの封筒を持ってき

た.1つには,5分後に出走する競馬の馬券が1,000枚入ってい

.276

Page 8: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

州∬)==雌) ♪(二と)

(13.23)

ここで,分母の少(∬)は

J〆♂)〆可β)dβ (13.24)

と,Ⅹとβの同時分布をβに関して精分することによって求められ

る.しかし,この係数はβの分布である少(βl∬)にとっては比例定

数である.この比例定数は密度関数を積分すると1になるという条

件のために必要なものであるが,以下でみるように,この例では杭

分の損作が不要になる.そこでⅩを単なる定数とみなして(13.23)

の分子をβについて整理してみると

ク(β)♪(ェ岬)∝βα‾1(1-β)む‾1β∬(1-β)…

=βかα‾1(1-β)犯‾∬+む‾1 (13.25)

が得られる.ところで(13.25)と(13.20)を比べると,事後分布

少(βlェ)はベータ分布月(ヱ+α,光一エ+占)となっていることがわか

る.比例定数は(13.25)が蹟分して1になるという粂件から自動的

に定まる.事後分布の平均と分散は(13.22)と比べることによって,

次のようになる.

E(♂」∬)= (13.26)

図13-2 いろいろなべ一夕分布

少(β)∝伊「1(1-β)わ‾1 0<β<1 (13.20)

ここで∝という記号は比例を表す.すなわち,この式が[0,1]上

の確率分布であるた獲涌こは積分して1とならなければならないが,

そのための比例定数が省略されていることを表している.その比例

定数はベータ関数とよばれる

上1∬α-1(1-∬)ムー1ゐ (13・21)

の逆数である.しかし,すくやあとでわかるように,この比例定数は

事後分布の計算にとって本質的な問題ではない.なお,βの分布も

Ⅹの分布も同じ少という記号で表現しているが,混乱はないだろ・

う.この記法はベイズ統計学でほ広く用いられているものである.

ベータ分布は[0,1]上のいろいろな形の分布を表すことができる.

たとえば,βに関してまったく事前情報を持たないことを[0,1]上

の一様分布で表すことがあるが,それもα=み=1というベータ分布

の特別な場合である.ここでは云一夕分布のパラメータ¢,かを適

当に変えることにより,(13.20)によって事前分布が表現されてい

るものと考える.(13.20)のベータ分布の平均,分散はそれぞれ

(ヱ+α)(7い-エ+み) Var(βl∬)= (13.27)

(〃+α+∂)2(乃f示二古手了ブ

以上が形式的なべイズ統計学の分析であるが,この結果からいろ

いろな事実が明らかになる.まず,事後分布の平均(事後平均)に

ついて考えよう・事前分布の平均を刑,データの平均を7一=エ/乃と

表すと,(13.26)は次のように変形できる.

乃r十(α+占)〝Z E(♂l二と)= (13.28)

乃+(α+み)

これほ,事後平均が事前分布の平均とデータの平均の加重平均とし

て表されることを示している.そのウェイトは乃と(α+占)であり,

7乙がデータ甲サイズすなわちその情報量の大きさを表すのに対し

て,(α+∂)は事前分布の持つ情報の丑を計るものと考えられる. このようにベイズ統計学でほ,事前の情報とデータの情報の両者

が取り入れられていることになる・さらに,事前分布の影響の大き

さを考えてみよう・そのた捌こ,データのサイズ乃が大きくなる状

況を考える・プZが大きくなるにつれ,(13・26)の平均はデータの平

均7・に近づく,したがって,異なる事前分布を持っていても,十分

1う ベイズ推論-279

d∂ E(β)=,Var(β)= (13.22)

(α+み)2(α+ゐ十1)

で与えられる.ベータ分布の形ほ図13-2に掲げてある.

事後分布

いま,データとして観測値エが与えられたとすると,ベイズの定

理からβに関する事後分布を計算することができる

278

Page 9: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

大きいデータを集めれば,結局はデータのみによって事後分布が定

められることになる.これが,前節で触れた安定的推定(stable

es■仁imation)の2項分布での例である.

例13-6

例13-3のサイコロについて考える.ただしここでほ1回勝負で

はなく,何回も牌を続けたものとしよう.100.回の勝負のあとで,

〟氏は丁が90軌 半が10回出たことを観察した.彼はどう行動す

るだろうか.

賭を始める前に,「丁が出る確率」鋸に関して,凡才氏が想定して

いた主観確率を事前分布として導いてみよう.そのためにはあらか

じめ次のような質問をしてみる.

「パラメータβについては十分多くの実験をすればはぼ確実に知

ることができる.ところで♂がある♂0より大きい可能性と小さい

可能性が等しくなるようなβ0はいくらだと考えるか.」

〟氏は熟考したうえで「そのようなβ。ほ0.5である」と答えた.

サイコロが公正なように見えたからである.つぎに「♂があるβ1よ

り小さい可能性が1/4となるようなβ1はいくらか」という質問に.対

して,〟氏は「そのような∂1は0.4である」と答えた.同様に「♂

がある♂2より大きい可能性が1/4となるようなβ2はいくらか」と

いう質問に対して,凡才氏は「そのような♂2は0.6である」と答え

た.以上の結果は〟氏が「ことによるとこのサイコロは公正では

ないかも知れない」といくらか自信がないことを表している.

以上の質問を通じて〟氏がβについてあらかじめ抱いていた情

報がある程度明らかになった.事前分布β(♂)に置き換えて表現す

ると,次のようになる.

「少(♂)はメディアンが0.5,第1四分位が0.4,第3四分位が

0.6となるような分布である」

以上の談論と,先の例13-3は矛盾していない.先の例では「1

回の勝負で凡才氏が勝つという事象(これも凡才と呼ぶ)」の主観確

率が0.5とされた.このことは

ア(凡才)=0.5

を意味する.これに対して今の例ではβの事前分布ク(のがある程

度明らかにされた.♂が与えられたときには

ア(月4岬)=β

と,必ずしも勝つ確率は0.5にはならず,遣う結果となる.ここ

280

l/\\ l \ 園13-3 〝氏の事前分布

0

図ほ-4 〝氏の事後分布

で,〟氏のβに関する主観確率をもう少し詳しく調べて,β(β)は

モードを0.5とする対称な分布であることがわかったとしよう(当

然平均も0.5となる).そうすると

ア(研=′ノァ(〟,β)dβ=Jp(即)少(β)d♂

=J♂〆β)dβ=0・5 (13.29)

が得られる.これが例13-3で導いた主観確率である.

もっと細かい質問をして,〟氏からさ‘らに詳しい主観確率を得

ることも不可能ではないが,この程度の情報で〟氏の事前分布を

ベータ分布で近似してみよう.ベータ分布でパラメータをα=∂=6

と選ぶと,これは対称な分布で

ア(0.4<β<0.6)=0.5070

と,はぼ且オ氏の考えに近い.その分布を図13-3に示す.

さて,乃=100回の乗除でェ=90回「T」が出る確率ほ,(1∂.19)

の2項分布で表現される.したがって,100回雁を行なった彼の〟

氏の専横分布はベータ分布月(96,16)(図13-4)となる.この事

後分布の平均は0.857,モードは0.866となる.こうなると〝氏

ははっきりとサイコロの公正さを疑っていることがわかる.(例終

り)

1う ベイズ推論-281

Page 10: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

∝eXp〔一生㌍(♂-〝1′)2 〕

(13・34) 13.5 平均に関する推論

この節でほ,正規分布の平均に関する推論を簡単に紹介する∴話

を簡単にするために,データは分散(α2=で‾1)既知の正規分布から

とられたものとし,正規分布の平均βの推定を考える(分散の逆数

は精度と呼ばれ,ベイズ統計学でよく用いられる).確率変数ズの

分布は

綽l♂)∝eXpト音(ェーβ)2) (13・30)

となる.これをⅩ~.Ⅳ(β,丁‾1)と表す.

先はどの2項分布の場合と異なり,この問題ではパラメータβの

取り得る値は(-∞,∞)である.こぁときには事前分布として正娩

分布を考えるのが便利である.そこで

β~Ⅳ(〃らひ‾1) (13.31)

という事前分布を想定する.ここで大きさ乃のデータが得られたも

のとする.データ全体を#=(ヱ1,エ2,…,∬籠)として,これを

ク(ぷlβ)=ク(ご1,エ2,…,∬乃lβ)=ク(ェ11の…ク(ェ犯岬)

と書こう.事後分布は次の式から求められる.

ク(βlガ)=ク(β)ク(#岬)/ク(ぷ)

前と同じように,分母のク(ぷ)はβの分布であるや(♂1ガ)にとって

ほ単なる比例定数である.

ふたたびズを単なる定数とみなしてク(βlズ)の分子をβに関する

2次式に整理する.まず,ク(∬岬)のうちβを含む雫をまとめよう.

P(xEO)∝eXp[一言(xl-0)2]・・・eXPト音(xn-0)2〕

が得られる.ただし

乃丁度+Ⅵ〃乃 (13.35) ク,Z′=

クヱ丁+w

とする.最後の式で比例記号を用いているのは,βを含まない項を

無視したからである.(13.35)と正規分布の密度関数(13.30)を比べ

ることにより,事後分布♪(β一方)は正規分布

βlぷ~Ⅳ(ク托′,(乃で+ひ)‾1) (13.36)

となることがわかる.

ここで,事後分布の平均は,2項分布の場合と同じように事前分

布の平均∽とデータの平均点との加重平均になっており,そのウ

ェイトは事前分布および標本平均の精度(分散の逆数)となってい

ることが読み取れる.

例13二7

ある銘柄のトマトジュースの缶詰16本について,ビタミ ソCの

含有量(重畳/く-セント)を測定したところ

16,22,21,20,25,22,19,15,13,24,17,20,29,18,

22,16

となった.これらは,同じ平均と分散を持つ正規分布からの独立な

標本と(近似的に)考えていい.このデー タから平均を推定しよう.

データから計算された平均は20.0,標準偏差は4.099だが,簡単

のためα=4.0(丁=リ16)が与えられたものとしよう.

事前分布としては,平均に関してまったぐ情報を持たないことを

表すため

β~Ⅳ(ナ花,てU‾1)

において,椚を任意とし,ひ→0とすることを考える.こうすると

事前分布の精度(分散の逆数)がゼロとなる.すなわち,情報を持

たないことが表現できることになる.そうすると(13.35),(13.36)

から,事後分布は平均椚′=20.0,分散てU′=(乃て+w)‾1→(〃て),1=

クエ‾1♂2(て〃→0)の正規分布となることがわかる.

ベイズ統計学では,すべての推論は事後分布に基づいてなされ

る.したがって,βの推定値がほしければ事後分布のモードをとる

のが1つの回答となる.またβの区間推定が必要ならば事後分布の

もっとも確率の高い区間を取り出せばいい.たとえば確率のもっと

1う ベイズ推論一283

=eXp〔一号ゑ(∬i-β)2〕

ここで,eXpの中の総和の部分ほ

91 つl 犯

∑(∬豆-β)2=77β2-2(∑萌)β+∑ご電2 豆=1宜=1i=1

=7Z(β一念)2+c?nSt.

(13.32)

(13.33)

となる.ただし烹はデータの平均を表す.また,針に関係のない部

分はconst.とまとめてある.そうすると

ク(β)紬β)∝eXpト音(盃-β)2〕expト晋(β一〝乙)2〕

=eXp〔一言{(7ヱ叶てり)β2-2(7ヱ;抽7瑚+乃ば+ひ7,乙2} 〕

282

」■

Page 11: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

これに対して,ベイズ統計学でほ(13.37)の区間を次のように解

釈することになる.

(2)ペイジ7ン区間推定

与えられた大きさ7Zの慄本に基づく事後分布では,其の

パラメークβが

も高い区間でそれが含む確率が95%となるようなものは

プフ云′±1.96w′=盃±1.96α/イ蒜(18.04,21.96)(13.37)

で与えられる.

この例のように,事前の情報がまったくない場合には,ベイズ統

計学は通常の推定と同じ答えを与える.しかし次節で述べるよう

に,その解釈は異なったものとなる.(例終り)

13.6 標本理論との違い

標本理論とベイズ統計学との根本的な相違点ほ,前者が繰り返し

実験を前提とするのに対して,後者は与えられたデータを前提とす

るところにある,といえる.このことの意味を,以下のいくつかの

問題で明らかにしよう.

区間推定

前節の例13-7について,信板係数95%の区間推定は次のよう

に計算される.

烹±1;96♂/イ蒜三(18.04,21.96)

この結果は,形式的には前節のベイズ統計学の信収区間と同じだ

が,その解釈は同じではない.標本理論の解釈を復習すると,次の

ようになる.

(1)信頼区間

大きさ7Zの標本を繰り返しとって,そのたびに

烹±1.96げ/蒜 (13・38)

によって信癖区間を計算する,という操作を繰り返せ

ば,そのうちの95%は真のパラメータβ。を含む.

与のような命題ほ,トマトジュースの例であれば,軌ヨの品質管

理を行なってビタミソCの量が不足していると判断されたときに

は原材料を点検する,などの「手続き」としての意味を持つ.しか

し,今の例が缶詰の購入を検討している輸入業者に与えられたサン

プルであれば,彼にとってこの実験を繰り返すことは不可能であ

る.彼にとって意味があるのは,目の前にある缶詰についての結論

なのであって,将来にわたって類似の缶詰を購入しようとしない限

り,先の命題は役にたたない.つまり,この命題は「特定の」デー

タに基づいた議論ではなく,実験を繰り返したときの推論について

の議論なのである.命題(1)の95%を「確率」と呼ばず「信額係

数」と呼ばぎるを得ないのは,このような事情による.

284

(13.39) 虎±1.96♂/イオ

という区間に含まれる確率は95%である.

ベイズ統計学の用いる事後分布は,その形ク(♂l∬)からわかるよ

うに観測個豆が与えられたときの議論である.これこそ,先の輸入

業者にとって必要な推論であった.

極端な言い方をすれば,標本理論では「特定の」データに基づい

た議論はいっさい行なわない,ということになる.したがって,品

質管理など工業的な応用での有用性はあるものの,社会・経済デー

タなどの繰り返しの不可能な問題にそのまま標本理論的な信頗区間

を作っても,はとんど意味がないことになる.

不偏推定

点推定量のうち,不偏推定量はその考え方が基本的に標本理論的

なものである.したがって,特定のデータが与えられたとき甲推論

には役にたたない考え方であるということが予想されるが,実際に

そのような例をあげることができる.

例13-8

製品Aの特性を♂,軌認Bの特性をβ十1とする.観測値エは次

のようなメカニズムで与えられる.確率変数yは0,1をそれぞれ

1/2の確率でとる確率変数とし,lr=0のとき製品Aを測定し,y==

1のとき製品Bを測定した結果が∬となる.測定誤差を無視すれば

Ⅹ=β (y=0のとき)

Ⅹ=β十1(y=1のとき)

である.ここで,βの推定量として

T=Ⅹ一古

(13.40)

(13.41)

を考えると,Tが不偏推定量であることは次のようにして確かめ

られる.

( 郡T)=(β一耕(y=0)+(叫1)一書)ァ(y=1)

=((β一昔卜(往古))・喜=β (13・42)

しかし,実際に観測した結果としてたとえば(ッ=0,∬=4)が得

1う ベイズ推論-285

Page 12: ベイズ推論 - yoshizoe-stat.jp › stat › textbook › bayesian_inference.pdf · 13.1ベイズ統計学 現代の統計学には,実はいくつかの異なった考え方を持つ「学派」

られたとき,♂=4が明らかであるにもかかわらず,「不偏」推定量

Tの実現値は3.5になる.一方,(ッ=1,ご=5)が得られたときに

は,rの実現値は4.5となる.(例終り)

たしかに(13.31)の推定量Tは,実験を繰り返したときの平均と

しては真の♂を与える.しかし,特定のデータを前にしては殆ど無

意味な結論を与えている.

ベイズ統計学の回答は次のようになろう.もう少し一般的にする

た削こ,観測値に誤差を認めることにする.そこで観測値が∬とな

る確率変数Ⅹの分布を

Ⅹ~Ⅳ(♂,て‾1) (y=0のとき)

Ⅹ~Ⅳ(♂+1,T‾1) (y=1のとき) (13.43)

とする.事前の情報がない場合を比較するために,事前分布は例

13-7のように選ぶことにする.そうすると,データ(ヱおよびッ)

が与えられたときの事後分布は

βlご,ツ~Ⅳ(ェ,で‾1) (ッ=0のとき)

β」ェ,ツ~Ⅳ(ェ∵-1,で‾1)(ッ=1のとき) (13.44)

となることがわかる.そこで(ッ=0,∬=4)が得られたときには

◆β」ェ,ツ~Ⅳ(4,で‾1)

が得られる.この事後分布のモードはβ=4と正しい値となる.特

に丁=∞すなわち測定誤差がない場合には,確実にβ=4と正しい

結論が得られる.もちろん(ッ=1,エ=5)が得られたときに.も,事

後分布のモードとして♂=4が得られる.

ベイズ統計学ではデータが与えられたあとでの議論をするので,

現実のデータ解析にとって意味のある結論を導くことができるので

ある.

標本理論の意義

ネイマン・ピアソソに代表される標本分布の考え方には,以上見

てきたほかにもいろいろな理論的難点がある.たとえば,仮説検定

についても,「有意水準」という概念は与えられた特定のデータに

ついては殆ど無意味である.そもそも理論の整合性,首尾一貫性と

いう点で,標本理論には矛盾がある*.

それにもかかわらず,標本理論は長い間実際に利用されてきてお

り,また多くの成果をあげてきてもいる.ではなぜ,標本理論は有

用であり得たのだろうか・

それには,2つの回答がある.第1は,信蚊区間の例で触れたよ

う匿,工業における品質管理の問題などは,毎日の製品検査峰まさ

に繰り返しが行なわれる問題である.そもそもネイマン・ピアソソ

の理論はこのような状況を前提匿して構成されたものである・した

がって,この分野では1度や2度の失政や成功が問題ではなく,平

均的な効率が問題なのである.これはまさに標本理論の考えそのも

のであり,このような分野では,・′依然として標本理論は有用であり

続けるだろう.

第2の答えは,現実的な多くの問題では「標本理論はベイズ統計

学理論と近似的に一致する」という好運による,というものであ

る.さきに正規分布の平均についてみたように,事前の情報がない

ときには,いずれの立場でも形式的な答えほ同じであった.その他

の問題でも,似たような答えを得ることがある.

しかし,社会・経済データのように本質的に繰り返し不可能なデ

ータに対して,標本理論の成果を形式的に利用する,という態度は

きわめて危険である.そのような問題において,ベイズ統計学の有

効性が本当に明らかになるであろう.

*興味のある盲読者は,拙稿「ベイズの手法による統計分析」,竹内啓編:計量経済学の

新展開 プに京大学出版会 を参照されたい.

286 15 ベイズ推論-2S7