群以上の多群間検定(分布を利用した検定)arima/lectures/jt-6.pdf ·...

22
6 3 群以上の多群間検定 63 6 3 群以上の多群間検定(分布を利用した検定) 1. 1 元配置の分散分析 (One-way An alysis o f Va riance, ANOVA) 三群以上の設定の場合に用いる.一般的には,この検定で有意差が検出された場合,どこの群間かは不明であ る.したがって,どこの群間に有意差があるかはいつかの検定法で吟味する.ここの項では,一元配置の分散分 析を説明する.毒性試験では,通常 3 群以上を設定することから分散分析が常用されている.各用量群と対照群 のみの比較の場合は,Dunnett の多重比較検定を使用する. 全平方和の算出 群間平方和の算出 誤差項の平方和を計算,全平方和-群間平方和 それぞれの平方和を自由度で割って分散を算出 分散比を算出して F-分布表の値と比較して有意差を判定する. 出産までの在胎週数の違いによって新生児期黄疸の強さに変化があるか,在胎週の違いによって出産した新生 児を 3 群に分けて黄疸指数を調査した結果を1 に示した. 1. 在胎週と黄疸指数 在胎週数 38-40 (正常分娩) 3638 <36 5 9 13 5 11 6 4 11 11 7 10 12 7 7 14 3 7 10 3 5 9 4 8 11 5 7 11 個体値 3 10 10 標本数 10 10 10 平均値 ±標準偏差 4.6±1.5 8.5±2.0 10.7±2.2 合計 46 85 107 総合計 238 1)全平方和 9 . 290 30 ) 238 ( ) 10 11 5 5 ( 2 2 2 2 2 = - + × × × × × + 2)群間平方和 9 . 190 30 ) 238 ( 10 46 10 85 10 107 2 2 2 2 = - + + 分母の 10 は各群の新生児を示す.もし各群の新生児数が異なればその人数を分母にとる. 3)誤差項の平方和 全平方和-群間平方和=誤差項の平方和

Upload: others

Post on 15-Oct-2019

2 views

Category:

Documents


0 download

TRANSCRIPT

第 6 章 3 群以上の多群間検定

63

第 6 章 3 群以上の多群間検定(分布を利用した検定) 1. 1 元配置の分散分析 (One-way Analysis of Variance, ANOVA) 三群以上の設定の場合に用いる.一般的には,この検定で有意差が検出された場合,どこの群間かは不明であ

る.したがって,どこの群間に有意差があるかはいつかの検定法で吟味する.ここの項では,一元配置の分散分

析を説明する.毒性試験では,通常 3 群以上を設定することから分散分析が常用されている.各用量群と対照群

のみの比較の場合は,Dunnett の多重比較検定を使用する. 全平方和の算出 群間平方和の算出 誤差項の平方和を計算,全平方和-群間平方和 それぞれの平方和を自由度で割って分散を算出 分散比を算出して F-分布表の値と比較して有意差を判定する. 出産までの在胎週数の違いによって新生児期黄疸の強さに変化があるか,在胎週の違いによって出産した新生

児を 3 群に分けて黄疸指数を調査した結果を表 1 に示した.

表 1. 在胎週と黄疸指数

在胎週数 38-40 週

(正常分娩) 36~38 週 <36 週

5 9 13 5 11 6 4 11 11 7 10 12 7 7 14 3 7 10 3 5 9 4 8 11 5 7 11

個体値

3 10 10 標本数 10 10 10 平均値

±標準偏差 4.6±1.5 8.5±2.0 10.7±2.2

合計 46 85 107 総合計 238

1)全平方和

9.29030

)238()101155(2

2222 =-+×××××+

2)群間平方和

9.19030

)238(1046

1085

10107 2222

=-++

分母の 10 は各群の新生児を示す.もし各群の新生児数が異なればその人数を分母にとる. 3)誤差項の平方和 全平方和-群間平方和=誤差項の平方和

第 6 章 3 群以上の多群間検定

64

分散分析表を表 2 に示した.

表 2. 分散分析表

要因 平方和 自由度 分散 分散比 確率 全体 290.9 29 群間 190.9 2 95.5 25.8 P<0.001 誤差 100 27 3.70

F-分布表,0.1%水準の数表 6-1 の縦軸 27, 横軸 2 の交点 9.019 と比較して,算出された値の 25.8 は大きいので

有意差ありと判断する.

数表 6-1. F 分布のパーセント点 (0.1%水準点) (吉村ら,1987) N1\N2 1 2 3 4 5 6 7 8 9 10

27 13.613 9.019 7.272 6.326 5.726 5.308 4.998 4.759 4.568 4.412 N1=誤差項の自由度,N2=群間の自由度.

したがって,この 3 群間のどこかの群間に 0.1%水準で有意差を示したことになる.各群間差を吟味したい場

合は,以下の解析法による. 正常な在胎週数は 39-40 週とするとこの群に対して 37-38 週と 36 週以前の群と比較検討する場合は,Dunnettの多重比較検定法 (Dunnett's multiple comparison test)で,全群間の比較が(総あたり,3 群を設定した場合,3 組

の組み合わせができる)Duncan および Tukey の多重範囲検定 (Duncan's and Tukey's multiple range tests)を使用す

る.

第 6 章 3 群以上の多群間検定

65

SAS JMP による解析結果を下記に示した.

2. Dunnett の多重比較検定 (Dunnett’s multiple comparison test) (Dunnett, 1955, 1964)

一つの基準となる群と各群の比較のみに使用する. 各群の分散がほぼ等しく標本数も同一の場合. 分散分析表の誤差項の標準誤差を用いて下記の式によって,38~40 週と 36~38 週,<36 週間の平均値の差を

吟味する. 通常 5 および 1%水準で判定する.

計算法はいつか発表されている.表 3 に計算に必要な数値を示した.

第 6 章 3 群以上の多群間検定

66

表 3. 在胎週と黄疸指数 在胎週数 <36 週 36~38 週 38~40 週 標本数 10 10 10 平均値 10.7 8.5 4.6

計算式 1 は次に示した.

群内の標本数

誤差項の分散の分布値表からの値

12´´= DunnettRp

Rp 値と各群間の差を比較し各群間の差が大きければ有意差を示す.2 は定数.

711.11070.3299.1 =´´=Rp

1.99 は,Dunnett の t-分布表(数表 6-2)(5%水準)の縦の自由度 27 と横の自由度 3(設定した群数)の交点.

この場合,在胎週数の増加によって黄疸指数が減少することが分かっていることから,片側検定を採用した.両

側検定の場合は 2.33(数表 6-3)となる.1 および 0.1%水準で検定する場合は,同一の自由度で各棄却限界値を

挿入する.1.711 より各群間差が大きければ有意差を示したことになる.

判定: 各群間との差 有意差 38~40 週 vs. 36~38 週 3.9 >1.711 ∴ P<0.05 38~40 週 vs. <36 週 6.1 >1.711 ∴ P<0.05

数表 6-2. Dunnett の多重比較のパーセント点(片側 5%)(吉村ら,1987) 誤差項の自由度\群数 2 3 4 5 6 7 8

27 1.703 1.997 2.157 2.265 2.347 2.411 2.465

数表 6-3. Dunnett の多重比較のパーセント点(両側 5%)(吉村ら,1987) 誤差項の自由度\群数 2 3 4 5 6 7 8

27 2.052 2.333 2.488 2.594 2.674 2.738 2.791 Dunnett の棄却限界値(表)の横軸は,群数を示す.原著(Dunnett, 1964)は,対照群を除いた群数(群数-1)を表

示している.吉村らは群数を表示している.両者とも数値は同一である. 計算式 2 (Dunnett, 1955, 1965) 誤差項の分散は 3.70 である. 群数は 3, 自由度 27 の Dunnett の棄却限界値(数表 6-4)(0.1%の片側検定)は 3.678.

001.054.4859.09.3

10270.3

5.86.438364036 <\==

´

-= p週群~週対~

001.010.7859.0

1.6

10270.3

7.106.4364038 <\==

´

-=< p週群週対~

数表 6-4. Dunnett の多重比較のパーセント点(片側 0.1%)(吉村ら,1987)

誤差項の自由度\群数 2 3 4 5 6 7 8 27 3.422 3.676 3.821 2.922 3.999 4.061 4.1114

各計算値を数表 6-4 の 3.676 と比較し,大きければ 0.1%水準(片側検定)で有意差を認めたと判断する. 結果,~40 週と各群間の差は,0.1%水準で有意差を示したことになる.

第 6 章 3 群以上の多群間検定

67

SAS JMP による解析結果を下記に示した.

38~40 週(赤色/一番下の円)は正常群とするこれに対して残りの 2 群の円は黒色を示す.赤い色の円が認め

られれば有意差を示したことになる.基準の群(38~40 週,対照群・正常群)は図の中に個体番号が示される. SAS JMP では,Dunnett の検定が妥当と思われるものは,サンプルデータの「血圧」および「コレステロール」

のデータ.対照群に対して各群間の差のみを検定する.この場合,生データのコントロールの列に,右クリック

によってラベルありの表示にする.したがって,対照群に対して各項目間の差を解析する. SAS JMP では,Tukey の検定が妥当と思われるものは,サンプルデータの「タイプライター」および「ゴル

フ」の各銘柄に対するデータ.この場合は,全対の比較を必要とする.このデータは,群数が 3 ですので,比較

の対は 3 通りである,

第 6 章 3 群以上の多群間検定

68

3. Tukey の多重範囲検定法 (Tukey’s multiple range test)(吉田,1980) 全群間の比較に使用する. 各群の分散がほぼ等しく標本数も同一の場合に使用する. 分散分析表の誤差項の標準誤差を用いて下記の式によって,全群間の平均値の差を吟味する. 通常 5 および 1%水準で判定する.しかし,一般的には表中は 5%のみの有意水準で 表示している文献が多

い. 分散分析表の誤差項の分散を各試験の標本数で割って平方根をとる. 新生児の黄疸指数について吟味する.誤差項の分散は 3.70 である.

608.01070.3

±==xS

次に,Tukey の表(数表 6-5)から,Q 値を求める.本例では水準数(群数)3,誤差項の自由度 27(実際の

表は 30)であるから,Q (3,30;0.05)は 3.4864 である. xS と Q とから,有意な差 D を計算し,試験で得られた

平均値間の差を D と比較し,D より大きい場合には,有意な差であると判断する.

数表 6-5. Tukey のパーセント点(5%水準)(吉田,1980) 誤差項の自由度\群数 2 3 4 5 6 8 10

24 2.9188 3.5317 3.9013 4.1663 4.3727 4.6838 4.9152 30 2.8882 3.4864 3.8454 4.1021 4.3015 4.6014 4.8241

119.24864.3608.0 =´=®®®= DxQSD

次に表 4 に示したように各群の平均値からの差を計算する.

表 4. 各群の平均値からの差 群 平均値 平均値 -4.6 平均値 -8.5

<36 週 10.7 6.1* 2.2* 36~38 週 8.5 3.9* 38~40 週 4.6

*P<0.05.

表 5. Tukey の検定による新生児黄疸指数の 統計処理結果の表示法

在胎週数 <36 週 36~38 週 38~40 週 標本数 10 10 10 平均値 10.7a 8.5b 4.6c

異符号間は 5%水準で有意差を示す. 有意でない平均値は同一のアルファベットを肩口に付けることで一目瞭然(表 5)である.表の欄外に“異符

号間は 5%水準で有意差を示す”と明記すこと.そして,~40 週は,ほかの群に対して 5%水準で有意差を示した

ことになる.この調査結果は,各胎在週数によって新生児指数に統計学的有意差を示したことになる. 1%水準で吟味したい場合は,Tukey の 1%水準点を代入する. 有意差の表示法はこのほかにも平均値を小さい(大きい)順に並べ有意差がない値に下線を引く方法,各平均

値同士全ての組み合わせを線で結び線上に有意差印の星 (*)を付す方法およびサッカーの星取り表を作成し有

意差印を表示する方法などがある.

第 6 章 3 群以上の多群間検定

69

SAS JMP による解析結果を下記に示した.

SAS JMP と手計算は同一の結果を得た.

第 6 章 3 群以上の多群間検定

70

4. Duncan の多重範囲検定法 (Duncan’s multiple range test) (柴田,1970) 全群間の比較に使用する. 各群の分散がほぼ等しく標本数が異なる場合に使用する. 分散分析表の誤差項の標準誤差を用いて下記の式によって,全群間の平均値の差を吟味する. 通常 5 および 1%水準で判定する.しかし,一般的には 5%のみの有意水準で表示している文献が多い. 表 1 に示した前述の在胎週数の違いによって新生児期黄疸の強さのデータ数を変化させて(表 6)検討する.

表 6. 在胎週と黄疸指数

在胎週数 38~40 週

(正常分娩) 36~38 週 <36 週

5 9 13 5 11 6 4 11 11 7 10 12 7 7 14 3 7 10 3 5 9 4 8 5

個体値

3 標本数 10 8 7 平均値

±標準偏差 4.6±1.5 8.5±2.0 10.7±2.2

合計 46 68 75 総合計 189

1)全平方和

2.26025

)189()91055(2

2222 =-+×××××+

2)群間平方和

3.16425

)189(1075

868

746 2222

=-++

3)誤差項の平方和 全平方和-群間平方和=誤差項の平方和 分母の 10 は各群の新生児数を示す.もし各群の新生児数が異なればその人数を分母にとる.分散分析表を表

7 に示した.

表 7. 分散分析表 要因 平方和 自由度 分散 分散比 確率 全体 260.2 24 群間 164.3 2 82.2 19.1 P<0.001 誤差 95.9 22 4.3

F-分布表,0.1%水準(数表 6-6 の縦軸 22, 横軸 2 の交点 9.162 と比較して,算出された値の 19.1 は大きいので

有意差ありと判断する.

数表 6-6. F 分布のパーセント点 (0.1%水準点) (吉村ら,1987) N1\N2 1 2 3 4 5 6 7 8 9 10

22 14.380 9.612 7.796 6.814 6.191 5.758 5.438 5.190 4.993 4.832 N1=誤差項の自由度,N2=群間の自由度.

第 6 章 3 群以上の多群間検定

71

SAS JMP による解析結果を下記に示した.

Duncan の多重範囲検定

Rp = Sm×Q Sm = 分散分析表の誤差項の標準誤差 Q = Duncan の分布表からの値

Rp 値と各群間の差を比較し各群間の差が大きければ有意差を示す.この方法は多重範囲のため,一般的に平

均値の肩口にアルファベットを付け異符号間では,有意差を示すことを表示する(一括表示のため).外国の毒

性試験および関連試験では比較的使用されている.我が国では,検出力が低いとのことで使用されない傾向にあ

る. Gad et al., (1986) は,標本数が同一または同一でない場合にそれぞれ異なった計算式を提唱している. Sm 算出時に必要なサンプルは,25/3 群で平均 8.3 である.

72.03.83.4

±==Sm

Q の算出は Duncan の 5%の分布表 (α=0.05)(数表 6-7)から引きだす.すなわち,縦の項は 22(分散分析表の

誤差項の自由度),横の項は群の数だけ横にとる.この場合,2.93, 3.08 となる.

第 6 章 3 群以上の多群間検定

72

数表 6-7. Duncan のパーセント点 (5%水準点) (柴田,1970)

N1\N2 2 3 4 5 6 7 8 9 10 22 2.95 3.08 3.17 3.24 3.29 3.32 3.35 3.37 3.39

数表 6-8. Duncan のパーセント点 (1%水準点) (柴田,1970)

N1\N2 2 3 4 5 6 7 8 9 10 22 3.99 4.17 4.28 4.36 4.42 4.48 4.53 4.57 4.60

したがって,5%水準では,

21.208.372.012.295.272.005.0

=´=´=Rp

同様に 1%水準(数表 6-8)は,

00.317.472.087.299.372.001.0

=´=´=Rp

この Rp の値に比較されるべき試験誤差は表 8 の通りとなる.

表 8. 各群の平均値からの差 RP

P= 0.05 0.01 群 平均値 平均値-4.6 平均値-8.5

(3) 2.21 3.00 <36 週 10.7 6.1* 2.2 (2) 2.12 2.87 36~38 週 8.5 3.9*

38~40 週 4.6 すなわち,平均値の大きい群から順次上から下に並べ,まず最下位の~40 週群の平均値 4.6 と残り 2 群の平均

値間の差を算出して,この値をそれぞれ対応する RP の値と対比して大きければ有意差とする(表 8).

表 9. Duncan の検定による新生児黄疸指数の統計処理結果の表示法 在胎週数 <36 週 36~38 週 38~40 週 標本数 7 8 10 平均値 10.7b 8.5b 4.6a

異符号間は 5%水準で有意差を示す. 有意でない平均値は同一のアルファベットを肩口に付けることで一目瞭然である(表 9).表の欄外に“異符

号間は 5%水準で有意差を示す”と明記すこと. SAS JMP では Duncan の多重範囲検定のような各群内標本数が異なる場合の解析法は記載されていない.各群

内標本数が大きく変化していない場合は,Dunnett および Tukey の多重比較および範囲検定を使用しても大きな

間違いではない. 5. Scheffé の多重比較検定 (Scheffé’s multiple comparison test) Scheffé の多重比較検定は種々の対比較に使用できる. 各群の分散がほぼ等しく標本数が異なる場合に使用する. 群の大きさが等しい場合は,検出力が少し低くなるといわれている. 通常 5 および 1%水準で判定する. Duncan の多重範囲検定で用いたデータで吟味する. 誤差項の分散 4.6 を使用して下記の式へ代入して得た値と,F-分布表値(数表 6-9)(5%水準の縦軸 22,横軸

2 の交点値 3.443 と比較して大きければ有意差あり)を比較する. Scheffé の分布表(数表)というものはない.F-分布を使用する.

第 6 章 3 群以上の多群間検定

73

数表 6-9. F 分布のパーセント点 (5%水準点) (吉村ら,1987) N1\N2 1 2 3 4 5 6 7 8 9 10

22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 N1=誤差項の自由度,N2=群間の自由度.

~40 週対~38 週群

05.086.7)

81

101(3.4)13(

)5.86.4( 2<\=

+´´-

-= pF

~40 週対~36 週群

05.082.17)

71

101(3.4)13(

)7.106.4( 2<\=

+´´-

-= pF

~38 週対~36 週群

 有意差なし05.040.2)

71

81(3.4)13(

)7.105.8( 2>\=

+´´-

-= pF

統計処理の結果,Duncan の多重範囲検定と同一の結果を得た. 6. 分散分析を実施せず直接多重比較・範囲検定で解析 従来は,一般的に分散分析を実施して 5%水準で有意差が認められた場合,誤差項の分散を用いて Dunnett または Tukey などの多重比較・範囲検定で各群間差を吟味してきた.しかし,最近では直接多重比較・範囲検定

で実施することによって第二種の過誤を防ぐことができる.Dunnett (1955)自身も同様に提唱している. ある企業でワープロを導入する前に実施したタイピングの試験のデータで,3 種類のワープロに対してほぼ同

一の能力のタイピストをランダムに割りあて,ワープロ機種別の打ちやすさを比較しようとした結果である.変

数ブランドはワープロの機種を表す因子で,3 水準を持つ.速さはそれぞれの成績で 1 分間あたりの打鍵数を記

録した.データは,SAS JMP のサンプルデータのタイプライターを一部改変(表 10)した.

表 10. 各ワープロに対する 1 分間の打鍵数 群(機種) REGAL SPEEDYTYPE WORD-O-MATIC

67 74 62 66 68 77 57 64 66 68 75 61 62 81 61 59

個体値

70

平均値 63.75 72.40 66.50 合計 510 (88) 362 (100) 266 (92)

括弧内の数値は Speedy type に対する指数を表す.

第 6 章 3 群以上の多群間検定

74

SAS JMP による解析結果を下記に示した.

SAS JMP の結果,分散分析では P=0.0655 を示し 5%水準で有意差を認めない.従来はここで検定は終了とな

る.しかし,直接 Dunnett の多重比較検定で実施した場合は,スピートタイプに対してリーガルタイプ間に有意

差が認められる.

第 6 章 3 群以上の多群間検定

75

第 6 章 3 群以上の多群間検定

76

Tukey の多重範囲検定を用いた場合,全対に有意差は認められない.この理由は Dunnett の多重比較検定に比

較して検定回数が一回多いことによる.

第 6 章 3 群以上の多群間検定

77

7. 2 元配置の分散分析 (Two-way Analysis of Variance) 表 11 は超音波で調べた胎児の頭部周囲データの再現性を調べる大量の研究データの一部である.4 名の測定

者はそれぞれ同じ胎児 3 人について 3 回測定した(木船,佐久間,1999).毒性試験では,イヌを用いた試験で

初回値との差を求め用量と経時的変化について二元配置で薬剤の影響を検討している報告もある.

表 11. 超音波で調べた胎児の頭部周囲データの再現性 観測者 1 2 3 4 合計

14.3 13.6 13.9 13.8 14.0 13.6 13.7 14.7 胎児 1 14.8 13.8 13.8 13.9

計 43.1 41.0 41.4 42.4

167.9 (109)

19.7 19.8 19.5 19.8 19.9 19.3 19.8 19.6 胎児 2 19.8 19.8 19.5 19.8

計 59.4 58.9 58.8 59.2

236.3 (154)

13.0 12.4 12.8 13.0 12.6 12.8 12.7 12.9 胎児 3 12.9 12.5 12.5 13.8

計 38.5 37.7 38.0 39.7

153.9 (100)

合計 141.0 (99.8) 137.6 (97.4) 138.2 (97.8) 141.3 (100) 558.1

全平方和の計算= (14.32+14.02+・・・・・・+12.92+13.82)-558.12/36=8979.7-8652.1=327.6

558.1=total, 36=N, 558.12/36=8652.1 観測者間平方和=1/9 (141.02+137.62+138.22+141.32)-558.12/36=8653.2-8652.1=1.199 胎児間平方和=1/12 (167.92+236.32+153.92)-558.12/36=8976.1-8652.1=324 胎児×観測者(相互間)=1/3 (43.12+59.42+38.52+41.02+58.92+37.72+41.42+58.82+38.02+42.42

+59.22+39.72)-558.12/36=8977.8-8652.1=325.7

相互間 325.7 から観測者間平方和 1.199 および胎児間平方和 324 を引くと相互間の平方和は,

325.7-324-1.199=0.571 自由度は,(3-1) (4-1)=6 誤差の算出 全平方和-(観測者+胎児+胎児×観測者)=1.83 となり,自由度は=35-2-3-6=24 分散分析の結果は,表 12 に示した.

表 12. 分散分析表 項目 平方和 自由度 分散 分散比 確率 胎児* 324 2 162 2131 P<0.001 観測者* 1.199 3 0.399 5.25 P<0.01

胎児×観測者** 0.571 6 0.095 1.25 有意差無し 誤差 1.83 24 0.076 計 327.6 35

*主効果,**相互作用. 数表 6-10 の F 分布表を用いる.縦の自由度は 24,横の自由度は,各項目の自由度を採り,計算値が二つの自

由度の交点値より大きければ有意差ありといえる.

第 6 章 3 群以上の多群間検定

78

数表 6-10. F 分布のパーセント点 (1%水準点) (吉村ら,1987) N1\N2 1 2 3 4 5 6 7 8 9 10

24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 N1=誤差項の自由度,N2=群間の自由度.

SAS JMP による入力表を表 13 に示した.

表 13. SAS JMP による入力 ライン

番号 胎児番号

(文字) 観察者番号

(文字) 胎児の頭部周

囲長(数値) 1 1 1 14.3 2 1 1 14.0 3 1 1 14.8 4 1 2 13.6 5 1 2 13.6 6 1 2 13.8 7 1 3 13.9 8 1 3 13.7 9 1 3 13.8

10 1 4 13.8 11 1 4 14.7 12 1 4 13.9 13 2 1 19.7 14 2 1 19.9 15 2 1 19.8 16 2 2 19.8 17 2 2 19.3 18 2 2 19.8 19 2 3 19.5 20 2 3 19.8 21 2 3 19.5 22 2 4 19.8 23 2 4 19.6 24 2 4 19.8 25 3 1 13.0 26 3 1 12.6 27 3 1 12.9 28 3 2 12.4 29 3 2 12.8 30 3 2 12.5 31 3 3 12.8 32 3 3 12.7 33 3 3 12.5 34 3 4 13.0 35 3 4 12.9 36 3 4 13.8

SAS JMP による解析結果を表 14 に示した.

SAS JMP では,二および三元配置の分散分析解析ツールは存在していない.したがって,モデルのあてはめ

を利用する.

第 6 章 3 群以上の多群間検定

79

分析→モデルのあてはめ→C胎児の頭部周囲長を Y へ,Nの胎児番号と観察者番号を追加へ,相互作用を検

定するため次に,胎児番号 Ctrl 観察者番号を交差へ入力(3 項目がモデル効果の構成へ表示される)→モデルの

実行.結果を表 14 に示した.

表 14. 効果の検定

結果および考察: 胎児間に 0.1%水準で有意差を認めた. 観測者間にも 1%水準で有意差を認めた. 胎児と観測者の相互作用間に有意差は認められなかった.したがって,胎児間と観測者間の有意差は独立

して差を認めたことになる. 胎児間および観測者の何処と何処の間に差があるかを検討する場合は,全対比較が可能な Tukey の多重範

囲検定で実施する.この場合は,誤差項の分散 0.076 を用いて計算する. 相互間に有意差を認めない場合は,相互間を除いた分散分析表を作成して厳密な分析(表 15)を支持する

学者もいる. 相互間の平方和が除去されたことによって観測者の分散比が大きくなり有意水準が高くなる.

表 15. 相互間を除いた分散分析表 項目 平方和 自由度 分散 分散比 確率 胎児 324 2 162 2025 P<0.001 観測者 1.199 3 0.399 4.98 P<0.001 誤差 2.40 30 0.08 - - 計 327.6 35

第 6 章 3 群以上の多群間検定

80

8. 3 元配置の分散分析 (Three-way Analysis of Variance) アンケート(厚生統計協会, 1992)によるがんで死亡した患者に対する「告知の状況」・「死亡者の性」・「年

齢(5 段階)」について分析する.3 元配置とは,男女間(2 群)・年齢層(5 群)・告知(3 群)である.表 16にデータを示した.

表 16. 死亡数,告知の状況×死亡者の性・年齢(5 段階) 告知の状況

性 年齢層 知っていた 知らなかった 分からない

40~44 歳 17 11 7 45~49 歳 18 26 15 50~54 歳 33 43 23 55~59 歳 44 96 48

60~64 歳 72 137 89

679

40~44 歳 34 7 8 45~49 歳 31 17 4 50~54 歳 22 30 12 55~59 歳 40 38 20

60~64 歳 38 76 15

392

40~44 歳=84 45~49 歳=111 50~54 歳=163 55~59 歳=286

60~64 歳=427

349 481 241 1071

全平方和の計算= (172+182+332+442+722+342+312+222+402+382+112+262+432+962+1372+72+ 172+302+382+762+72+1522+232+482+892+82+42+122+202+152)-10712/30= 65433-38235=27198

1071=total, 30=N, 10712/30=38235 男女間平方和=1/15 (6792+3922)-10712/30=40980-38235=2745 年齢層間平方和=1/6 (842+1112+1632+2862+4272)-10712/30=51678-38235=13443 告知の状況間平方和 =1/10 (3492+4812+2412)-10712/30=41124-38235=2889 1/15, 1/6 および 1/10 は各調査群内に含まれる個体数. 自由度 (D.F.)は, 全体=30-1=29, 男女間=2-1=1, 年齢層間=5-1=4, 告知の状況間=3-1=2 表 17 に男女(性)と年齢層を示した.

表 17. 男女(性)と年齢層 40~44 歳 45~49 歳 50~54 歳 55~59 歳 60~64 歳

男 35 59 99 188 298 女 49 52 64 98 129

i=1/3 (352+492+592+522+992+642+1882+982+2982+1292)-10712/30=58033-38235=19798

この平方和 (i)より男女 (性)および年齢層の持つそれぞれの平方和を減じたものが男女(性)と年齢層の平

方和である.すなわち,男女(性)と年齢層の平方和=19798-2745-13443=3610 となり,自由度は,D.F.= (2-1) (5-1)=4

第 6 章 3 群以上の多群間検定

81

次に,年齢層と告知の状況を表 18 に示した.

表 18. 年齢層と告知の状況 知っていた 知らなかった 分からない

40~44 歳 51 18 15 45~49 歳 49 43 19 50~54 歳 55 73 35 55~59 歳 84 134 68 60~64 歳 110 213 104

ii=1/2 (512+492+552+842+1102+182+432+732+1342+2132+152+192+352+682+1042)-

10712/30=57630-38235=19395 この平方和 (ii)より年齢層と告知の状況の持つそれぞれの平方和を減じたものが年齢層と告知の状況の平方

和である.すなわち,年齢層と告知の状況の平方和=19395-13443-2889=3063 となり,自由度は D.F.= (5-1) (3-1)=8 次に,告知の状況と男女(性)を表 19 に示した.

表 19.告知の状況と男女(性) 男 女

知っていた 184 165 知らなかった 313 168 分からない 182 59

iii=1/5 (1842+3132+1822+1652+1682+592)-10712/30=44775-38235=6540 この平方和 (iii)より告知の状況と男女(性)の持つそれぞれの平方和を減じたものが告知の状況と男女(性)の

平方和である.すなわち,告知の状況と男女(性)の平方和=6540-2889-2745=906 となり,自由度は D.F.= (3-1) (2-1)=2 誤差の算出:全平方和- [男女間+年齢層間+告知の状況間+男女間(性)と年齢層間+年齢層間と告知の状況間+告知の状況間と男女(性)] すなわち, 27198-(2745+13443+2889+3610+3063+906)=

27198-26656=542 となり,自由度は D.F.=29-1-4-2-4-8-2=8 分散分析結果を表 20 に示した.

表 20. 分散分析表 項目 平方和 自由度 分散 分散比 確率

男女(性)* 2745 1 2745 40.4 P<0.05 年齢* 13443 4 3360 49.4 P<0.05

告知の状況* 2889 2 1444 21.2 P<0.05 男女(性)と年齢層** 3610 4 902 13.2 P<0.05 年齢層と告知の状況** 3063 8 382 5.6 P<0.05

告知の状況と男女(性)** 906 2 453 6.6 P<0.05 誤差 542 8 68 計 27198 29

*主効果,**相互作用. 各項目に対して分散比を算出する.分母に誤差項の分散の 68 を用いる.この場告の全て 68 より大きいことか

ら 1 以上の値が算出される. 数表 6-11 の F 分布表を用いる.縦の自由度は 8,横の自由度は,各項目の自由度を採り,二つの自由度の交

点値より大きければ有意差ありといえる.

第 6 章 3 群以上の多群間検定

82

数表 6-11. F 分布のパーセント点 (5%水準点) (吉村ら,1987)

N1\N2 1 2 3 4 5 6 7 8 9 10 8 5.318 4.459 4.066 3.838 3.687 3.581 3.500 3.438 3.388 3.347

N1=誤差項の自由度,N2=群間の自由度.

SAS JMP による入力表を表 21 に示した.

表 21. SAS JMP による入力 ライン

番号 性

(文字) 年齢層

(文字) 告知の状況

(文字) 人数

(数値) 1 1 1 1 17 2 1 2 2 11 3 1 3 3 7 4 1 4 1 18 5 1 5 2 26 6 1 1 3 15 7 1 2 1 33 8 1 3 2 43 9 1 4 3 23

10 1 5 1 44 11 1 1 2 96 12 1 2 3 48 13 1 3 1 72 14 1 4 2 137 15 1 5 3 89 16 2 1 1 34 17 2 2 2 7 18 2 3 3 8 19 2 4 1 31 20 2 5 2 17 21 2 1 3 4 22 2 2 1 22 23 2 3 2 30 24 2 4 3 12 25 2 5 1 40 26 2 1 2 38 27 2 2 3 20 28 2 3 1 38 29 2 4 2 76 30 2 5 3 15

SAS JMP による解析: 分析→モデルのあてはめ→C人数 Y へ,Nの性,年齢層および告知の状況を各々追加へ,相互作用を検定す

るため次に,性 Ctrl 年齢層,性 Ctrl 告知の状況,年齢層 Ctrl 告知の状況を各々交差へ入力(6 項目がモデル効果

の構成へ表示される)→モデルの実行. 注意点:全ての組み合わせで実施すると組み合わせが多いことから P 値が算出されない.

第 6 章 3 群以上の多群間検定

83

SAS JMP による結果を表 22 に示した.

表 22. 効果の検定

結果および考察: 男女間,年齢間および告知の状況間にそれぞれ 5%水準以下で有意差が認められる. 全ての相互作用に差 (P<0.05)があることからこの三者が若干主効果の有意差検出を低下させている. 年齢層および告知状況に差があることから,何処と何処に有意差が認められるかは,全対比較が可能な

Tukey の多重範囲検定で実施する.この場合は,誤差項の分散 68 を用いて計算する. 9. 群数が増加すると検出力が低下する 毒性試験は通常対照群を含めて 4 群を設定する.しかし,スクリーニング試験および数種の薬剤評価の場合,

6~10 群の設定を実施する場合がある.探査的研究の場合,最初の段階で薬効・毒性を見逃してはならない.

Dunnett の多重比較検定で群数が増加するにしたがって,検出力が低下するパーターン(72 週齢の B6C3F1 雄マ

ウスのヘモグロビン値,g/dL,)を表 23 に示した.群数が増加すると組み合わせが増えるからで,多重比較・範

囲検定の宿命である.したがって,多くの群を設定したスクリーニング試験の場合では,t-検定の使用を推奨し

たい.

表 23. 群数の変化による検出力の変化 用量 対照群 低用量群 中用量群 高用量群 最高用量群

個体値

13.9 14.3 13.7 13.8 14.0 14.3 13.9 13.7 13.9 13.5

14.0 13.3 15.0 13.8 14.1 13.3 14.1 13.9 13.8 13.4

14.0 13.8 13.7 13.8 13.5 14.1 14.2 13.8 14.1 14.0

14.1 13.9 14.3 14.0 14.2 14.1 14.3 14.4 14.4 14.4

14.2 14.2 14.7 13.9 14.3 13.7 14.3 14.4 14.0 14.3

動物数 10 10 10 10 10 平均値±標準偏差 13.9±0.3 13.9±0.4 13.9±0.2 14.2±0.2 14.2±0.3 Dunnett’s t-検定の

計算値 0.41 0.00 2.52

5%の棄却限界値 2α 2.45 統計学的有意差 NS NS *

Dunnett’s t-検定の 計算値

0.40 0.00 2.51 2.43

5%の棄却限界値 2α 2.53 統計学的有意差 NS NS NS NS

同一試験系で 4 群設定の場合は,高用量群で有意差 (*)が認められますが 5 群設定では有意差が認められない.

したがって,スクリーニング(選抜)などの試験では t-検定で二群間差を吟味した方が第二種の過誤を防ぐこと

ができる.

第 6 章 3 群以上の多群間検定

84

【引用文献および引用資料】

木船義久,佐久間昭訳 (1999):医学研究における実用統計学,pp267-268,サイエンティスト社,東京.

柴田寛三 (1970):生物統計学講義,pp66-67,東京農業大学,東京.

厚生省大臣官房統計情報部 (1994):平成 4 年度人口動態社会経済面調査報告,pp47, 厚生統計協会,東京.

吉田 実 (1980):畜産を中心とする実験計画法,pp85, 養賢堂,東京.

吉村 功ら (1987):毒性・薬効データの統計解析,サイエンティスト社,東京.

Dunnett, C.W. (1964): New tables for multiple comparisons with a control, Biometrics, September 482-491.