cspor npo j-crsu · 2017-06-05 · lang t a and secic m: how to report statistics in medicine -...

22
臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(200 使用目的を研究者の自己学習用に限り、その他への転用を禁じる 1 1 臨床試験のための生物統計学入門 乳がん臨床研究支援事業 CSPOR 運営委員長 NPO 日本臨床研究支援ユニット J-CRSU 理事長 東京大学医学系研究科 生物統計学 大橋靖雄 2003FEB08 2 目標

Upload: others

Post on 10-Jun-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 1

1

臨床試験のための生物統計学入門

乳がん臨床研究支援事業 CSPOR運営委員長NPO日本臨床研究支援ユニット J-CRSU理事長

東京大学医学系研究科 生物統計学

大橋靖雄

2003FEB08

2

目標

「オンコロジストのための統計学」を読む上で必要なエッセンスを話す

このテキストのレヴェルは実は高い

「よく分かる」という授業・本の印象は既知の知識の量による

結局、(その場では分かったつもりになっても)一回聞いただけではなかなか分からない。繰り返し接するか、一度本格的に勉強するか

全部理解しようとは思わないこと。重要な概念だけで十分

Q and A統計パッケージデモ (休憩時間に、伊藤陽一先生)

SAS:製薬会社やFDAで使われている業界標準、敷居高い ・値段も高いJMP:研究者向けの使いやすいソフト、教育用に適

3

内容

なぜ統計学が必要か

統計学を理解するために

プロトコルを読むために必要な最低知識

検定とランダム化

NSAS-BC02プロトコルから:生存時間解析入門

なぜ生物統計?

Design Design Design Design Design DesignDesign Design Design Design Design DesignDesign Design Design Design Design DesignDesign Design Analysis Design DesignDesign Design Design Design Design DesignDesign Design Design Design Design DesignDesign Design Design Design Design DesignDesign Design Design Design Design Design

+ Interpretation and Communication

5

なぜ生物統計?

推論・判断の際にバラツキが無視できないから

バラツキの存在下で正しく推論・判断するためにデータをどうとるか?

バラツキのもとでの客観的な推論・判断をどう行うか?

バラツキを如何に小さくするか、如何に効率的にデータを得るか?

(品質管理、データマネージメントの範疇でもある。)

6

なぜ統計学が必要か?

バラツキの存在下での判断

例題:5円玉と1円玉はどちらが重いか?

SCLCで(CPT11+CDDP)と(VP-16+CDDP)のどちらの予後が良いか?

SCLC: 小細胞肺癌

CPT11:塩酸イリノテカンCDDP:シスプラチン、VP16:エトポシド

Page 2: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 2

7

1.00 1.50 2.00 2.50 3.00 3.50 4.00

平均 0.9998g

SD 0.0080

平均 3.7686g

SD 0.0197

0

10

5

Weight (g)

Count

1.0 049(g ) 0. 9926

0.9 945 1.00 46

0.9 945 0.99 56

0.9 933 0.99 56

1.0 175 1.00 51

3.7 584(g ) 3.76 24

3.7 631 3.7633

3.7 708 3.8173

3.7 653 3.7776

3.7 399 3.7682

5円玉1円玉

5円玉と1円玉:ヒストグラム(密度関数)

8

ある臨床試験(小細胞肺癌)の成績:生存曲線

9

バラツキの存在下での判断なぜ「5円玉の方が1円玉より重い」と判断するか?

ともにバラツイている :「分布」の概念の導入バラツキを客観的・定量的に扱うために「確率論」を応用

実際の測定値の分布の比較 internalな証拠比較してよいか、不公平な比較ではないか

5円玉 SCLC「日本中5円玉、1円玉はどれも同じ」 選択に偏り?しかし

無作為(ランダム)抽出したとみなして良い ランダム化

同じ測定方法 同じ測定・追跡方法

群内のバラツキと群間の違いを比較: シグナルとノイズの比較10

バラツキの存在下での判断(続き)なぜ「5円玉の方が1円玉より重い」と判断するか?

先験的な知識・常識(externalな証拠)の活用と一般化

5円玉 SCLC先験情報 これまでの「持った感じ」 第 II相の結果対象選択 「日本中5円玉、1円玉はどれも同じ 」 選択に偏り?

無作為(ランダム)抽出したとみなして良い ×

一般化 確率的な不確実さがあるものの可能 ?

11

ある臨床試験(小細胞肺癌)の成績:密度関数

12

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

1.00 1.50 2.00 2.50 3.00 3.50

Weight (g)

4.00

1- (distribution function)

5円玉と1円玉:ヒストグラム(生存関数)

Page 3: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 3

13

一般化可能性のために

患者背景の解析結果の差異の説明

部分集団の解析部分集団における効果の差、交互作用の検討

再試験FDAの方針

メタアナリシス複数の独立な研究結果の統計的併合

緩い選択条件large-scale-rando mized-evide nce

ITT( Intentiont-to-treat)解析14

ITT?(ワイス:医療の疫学第4章)

ランダム化比較試験

化学療法 50名 全員治療

手術療法 50名 36名治療9名拒否で化学療法5名悪化で化学療法

どの群とどの群とを比較すべきか?

50 vs36, 59 vs 36, 64 vs 36, 50 vs 50 ….

15

ITT?

治療しようとする意思に基づく解析

割付け後、何が起きようともその群として解析

実は人によって異なるいくつかのレベル、曖昧

なぜ? 解析対象選択に伴うバイアス避ける

ランダム化によって保証される comparability保つ統計解析の基礎(p値の根拠)を作る

16

ITT?

古今東西喧嘩のたね

臨床家 統計家

気持ちが悪い その通り

医学的に意味がない そうかもしれない

しかし統計的に Validそもそもなぜランダム化したのか?

差は有ると思い込んでいる 差は有るか懐疑的である

差有りのもとでの検出力重視 差無しのもとでの第一種の過誤α重視

17

ITT? 何を評価するのか

処方しようとする意思 ITT実際の処方

服薬 per-protocol血中濃度 PK-guided study組織内濃度

環境(副作用軽減対策などの)変化によって

ITTの意義が薄れることもあり

18

ITT? 有名な実例

Coronary Drug Project Researc h Group (19 80) NE JM 30 3 1038-10 41

5-years cumulative mortalityALL Compliance > 80% < 80%

Clofibrate 18.0% 15.7% 22.5%

Placebo 19.5 16.4 25.8

Page 4: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 4

19

統計ガイドライン(E9) :解析対象の規定

解析の役割り双方の解析を計画:さらに探索することも望ましい

同等性・非劣性試験ではランダム化された全被験者の解析は問題

無作為化した全症例

明らかな組み入れ違反例

組み入れ基準適合例

未投与例、投与後未観測例

最大の解析対象集団

違反例、脱落例

試験計画適合例

Full-analysis set

Per-protocol set20

検証的な試験において、主たる解析はITTの考え方に従って行われる。

バイアスを除くことが第一に重要であるからである。プロトコル不遵守、脱落などによる質の低下は、

試験の感度を下げ、医学的意義を損なう結果となる。

21

内容

なぜ統計学が必要か

統計学を理解するために

プロトコルを読むために必要な最低知識

検定とランダム化

NSAS-BC02プロトコルから:生存時間解析入門

22

臨床研究の報告:ガイドライン

Lang T A and Secic M: How to Report Statistics in Medicine -Annotated Guidelines fo r Authors, Editors and Reviewers, American College of Physicians, 1997.

Fukuda H and Oha shi Y: A g uideline for reporting result s of statistical analy sis in JJ CO, Japan. J. Clinical Oncology 27, 121-127, 1997 (http://wwwinfo. ncc.go.jp/jjco/ 英文・日本語とも )

CONSORT stateme ntConsolidation of Standard for Reporting Trials

23

定評のある教科書

丹後俊郎:新版 医学への統計学、朝倉書店、1993.

吉村功編著:毒性・薬効データの統計解析、サイエンティスト社、1987.(改訂中)

Altman DG:Practical Statistics for Medical Research, Chapman and Hall,1991. (佐久間昭監訳:「医学研究における実用統計学」、サイエンティスト社、1999)

Armitage P and Berry G:Statistical Methods in Medical Research, 3rd ed., Blackwell, 1994.(椿美智子・椿広計共訳:「医学研究のための統計的方法」、サイエンティスト社、2001)

浜田知久馬:学会・論文発表のための統計学、真興交易医書、1999.

24

臨床研究の報告:ガイドラインCONSORT statement

70を超える医学雑誌編集者の合意ランダム化試験が対象

文献Begg C et al. : Improving the quality of reporting of randomized

controlled trials, JAMA 276, 637-63 9, 1996.

(別府・津谷「コクラン共同計画資料集」サイエンティスト社に翻訳あり)Meinert C: Beyond CONSORT, JAMA 27 9, 1487-1489, 1998.Moher D: CO NSO RT: An evolving tool to help impr ove the

quality of reports of ra ndo mized controlled trials, JAMA 279, 1489-149 1, 1998.

Page 5: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 5

25

臨床研究の報告:ガイドラインCONSORT statement:報告項目の規準

抄録 構造化

はじめに 設定仮説、臨床的な目的、計画した部分集団・共変量解析

方法 プロトコル、割付け、盲検

結果 被験者の内訳(図表示)

解析 主要・副次評価変数に対する介入の推定効果

(点推定と区間推定)

再解析に必要な詳細な要約統計量

群毎の予後因子の記述と(試みられれば)調整解析

プロトコルからの逸脱とその理由

コメント

バイアスと精度低下の原因を含む結果の具体的解釈

可能なら外的妥当性に対する議論

26

データや論文を理解するための3原則

正しい用語を正確な理解のもとに使うべし

統計手法は要約手法、要約は適切か(手法の前提は満たされているか)に注意すべし

どこまで結論は一般化できるか、に留意すべし

番外:良い統計家の教師・友達を持つべし

27

When doctors meet numbersBerwick et al.(1981), Am J Med 71:991-998.

Q1: 偽陽性 false positive-rate とはどれか?Disease

+ -test + A B

- C D

a: B/(A+B) b: B/(A+B+C+D) c: C/(A+C) d: (B+C)/(A+D) e: B/(B+D)

医師研究者の半分は誤って覚えている!

正しい用語を

28

検査の特性

Disease + -

Test + True-Positive False-Positive- False-Negative True-Negative

感度 Sensitivity = TP/(TP+FN) PiD特異度 Specificity = TN/(FP+TN) NiH

100%

正しい用語を

29

ついでに:When doctors meet numbers

Berwick et al.(1981), Am J Med 71:991-998.

Q2:人口100万人の都市にX病に罹患している患者が1000人いる。A検査を行うと罹患している患者の95%が陽性となる。一方、罹患していない人が陰性となる確率も95%である。ランダムに住民に検査を行ったところ検査は陽性となった。この人が罹患している確率はいくつか?

a:1-3% b: 10-25% c: 50-60% d: 80-94% e: 95%

30

正確な用語を

許せない誤用これら不適格患者を母数から除くと…二つの治療群に無作為抽出によって割り付け. ..A薬については2用量、B薬については有・無の階乗実験で…

一般会話ではまあ許せるが基準物質の測定結果は表示どおりで、この測定系の精度は高い…層別解析をおこなったところ、重症例では . ..

Page 6: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 6

31

実験法と解析:多因子要因実験Design of experiments and analysis:Factorial experiments

2×2 A noA

BnoB

Aの効果 effect of A

Bの効果effect of B

Aと Bの間に交互作用無ければ、2つの実験分の情報量Inform ation of 2 inde pendent experime nts if there is no interaction

参考

32

N-SAS BC02研究代表者 渡辺亨

ホルモン療法低感受性、n+ 症例に対する術後補助療法エンドポイント

無病生存期間

神経毒性を中心とした HRQOL

ACの有無、Taxaneの種類に関する2×2要因実験AC有無に関する非劣性non-inferiority試験、1200例

Randomize

AC× 4 Paclitaxel× 4

AC× 4 Docetaxel× 4

Paclitaxel× 8

Docetaxel× 8

n個数HER2腫瘍径術式施設動的割付

参考

33

標準偏差と標準誤差

standard deviation vs standard error

標本分布の概念実験・試行の仮想的繰り返し

「「統計量の標準偏差」の推定値」=標準誤差

推定値±1.96(推定値の標準誤差)=95%信頼区間

正しい理解

標準誤差=標準偏差/n1/2 ではない

34

50 ± 100 ???

極端な歪か外れ値均質な集団ならCVは20-40%程度(増山元三郎「準恒常性仮説」)

要約は適切か?

35

誤差的バラツキをどうやって測るか?

XSDCVtiont of VariaCoefficienSDDeviationStandard

nXXiSDVariance

nXiX

n

i

n

i

/

)1/()(

/

1

22

1

=変動係数

標準偏差

分散

平均

=

=

−−==

=

参考

36

偏差値の解釈

Q1: ある学生Tの試験成績は中学では 70 (平均=63.3)高校では 30 (平均=33.0)であった。成績は落ちたのか?

Q2: 偏差値の上限は?偏差値= (raw value-mean)/SD×10 + 50

要約は適切か?

Page 7: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 7

37

分布の歪みと平均

ひずんだ分布(skewed distribution)では、central value ≠ mean value

mean median mode mode median mean

median- mean: mea n-mo de = 1:2

左に歪む left-skewed 右に歪む right-skewed

要約は適切か?

38

偏差値と順位

正規分布なら

平均値と標準偏差による分布の要約が適切

(十分統計量: それ以上の情報は必要ない)

正規分布なら

偏差値 60 upper 15.9%70 2.3%80 0.13%

要約は適切か?

39

正規分布の密度関数(ヒストグラムの)極限

) 2

)-(xexp(-21

2

2

σµ

σπ

平均(真ん中)μ

標準偏差(ばらつきの大きさ)σ

要約は適切か?

40

なぜ正規分布

実際のデータの分布???

「統計量」の漸近(ぜんきん)分布 asymptotic distributionちりも積もれば正規分布

Σ(重み)(データ) ---> 正規分布

ある程度の独立性があれば

パチンコのモデル

中心極限定理central-limit theorem

要約は適切か?

41

統計モデル

全てのモデルは誤っている。ただし役に立つモデルも存在する。(GEP Box)

モデルの意義

データの要約 summarizatio n予測 内挿・外挿

異常データ・問題点の摘出 exposure

ある因子の効果(影響)の定量的評価

医学統計では

現象(自然史)の理解

研究計画への利用

比較の際の偏りの除去・軽減

個々の患者への適用、とくに治療法の選択

要約は適切か?

42

直線モデルのあてはめとモデル診断

直線モデルの意義

表現の一意性

前提は正しいのか?

y = xの線形関数+誤差的変動

誤差的変動:平均は0、分散等しく、独立でほぼ正規

回帰診断

残差の検討(残差プロット )と影響力の解析

y=a+bx

x

y

要約は適切か?

Page 8: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 8

43

回帰式もR2もすべて出力は同じ!

44

要約は適切か?

要約統計量平均、標準偏差は正規分布のもとでは完璧な要約

しかし外れ値、極端な歪みに対しては不適切(ロバストではない )

分布の変換あるいは他のロバストな手法

統計モデルのあてはめモデルの妥当性の検討:線形回帰の場合は残差プロット

他の手法の場合も類似の方法

ランダム化臨床試験の場合はあくまで補助的手法

45

内容

なぜ統計学が必要か

統計学を理解するために

プロトコルを読むために必要な最低知識

検定とランダム化

NSAS-BC02プロトコルから:生存時間解析入門

46

これだけは理解しておきたい統計基礎概念

正確度と精密度 accuracy and precision無作為抽出とランダム化 random sampling vs randomization臨床試験の目標

一般化可能性 generalizability

47

精密度と正確度 Precision and accuracy

観測値 = 真の値+バイアス+誤差的バラツキ

observed true bias error

accuracy precision

○ ○

○ ×

× ○

× ×

true value 48

臨床試験の目標

バラツキを小さくすること(精度を高くすること)

Clarity偏り (バイアス)を小さくすること

Comparability広い対象に適用できる結論を得ること

Generalizability

Page 9: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 9

49

なぜバラツキ?

進行・再発大腸癌患者に対する5FUの成績authors # of patients response (%)

Sharp and Benefeil 13 85Hall and Good 19 63Rochlin et al. 47 55Allaire et al. 17 47Cornell et al. 13 46Every 12 41Field 37 41Bell 22 36Weiss and Jackson 37 35Ferguson and Humphrey 12 33Hurley 150 31ECOG 48 26Talley 271 21Hyman et al. 30 20Moore et al. 80 19Ansfield 141 17Mayo 358 17Ellison 87 12Kennedy 22 9Knoepp et al. 11 9Olson and Green 12 8

50

誤差的バラツキとバイアスRandom Variation and Bias

さまざまな理由によるバラツキたとえば進行癌に対するある化学療法の奏効率

患者全身状態(PS)と ADMEの違い、腫瘍の性質(病理・分子生物学的)、

dose-intensit yと コース、評価部位と評価方法、出版バイアス,…施設差

モデルとしての「誤差」バラツキの理由は同定できない、あるいはあえてしない

確率変数としてのモデル化:確率論の応用が可能となる

誤差的バラツキとバイアスの相対性知識が深まれば/情報が得られれば、

誤差的バラツキは制御可能なバイアス要因に転化

51

誤差的バラツキ Random variation無作為抽出random sampling : 同一確率で独立に

population 母集団

sample 対象集団10%14%25%30%,... ..

each result is not equal to the true value

20% responder

52

誤差的バラツキ Random variation

n=1

n=4

n=200

0% 100%

0% 100%

0% 100%

Mean is 20%!unbiased

53

真値に収束する 大数の法則

分布の形が正規分布に収束する 中心極限定理

54

信頼区間 Confidence interval

1/5 ≠ 4/20 ≠ 20/100 ≠ 200/1000情報量(precision)の差

95% 信頼区間confidence interval

(正確な計算あるいは正規近似)1/5: 0.005-0.724/20: 0.06-0.4420/100: 0.12-0.28200/1000: 0.18-0.22

p p p n± × −196 1. ( ) /

正規近似

Page 10: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 10

55

医学研究におけるバイアスBias in medical research

主なバイアスの原因

対象選択 Selection of study population情報収集 Gathering information(デザイン含む) (including design)

交絡 Confounding

56

選択バイアス Selection bias

どちらの病院を選びますか?Which hospital to select?

5-year survivalSurgery Radiation

Hospital A 80% 25%B 60% 20%

57

選択バイアス Selection bias

In total: Hospital A 36% B 36%

5-year survivalSurgery Radiation

Survival Death T otal Survival Death Total

Hospital A 16 4 20 20 60 80B 24 16 40 12 48 60

Treatment selection (Treatment by indication)

58

患者選択のバイアスがん第II相試験における患者選択

Sternberg CN et al. (1985), J. Urology 12/24 CRSternberg CN et al. (1989), Cancer 44/121 CRLoehrer PJ Sr. et al. (1992), JCO

RCT of MVAC vs single CDDP17 CR 32 PR/ 126 4 CR 10 PR/ 120

MVAC for urothelium cancer

50%

36%

13%

59

がんの臨床試験においては、反応(奏功率)の大きさは患者選択によって大きく変化する。

(歴史対照と比較した有効性のある程度の評価は可能であるが。)したがって、相対的な有効性の評価のためには

一般薬と同様に比較が必要となる。

それでは正確な比較はどうやって行うか?患者選択と交絡によるバイアスの制御が必要

60

交絡 Confounding

原因系

処置・曝露treatment/expo sure

結果・反応response

他の要因

交絡因子confounding factor

?

因果 causal effect関連 association

例:重度な患者に強い治療

Page 11: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 11

61

Stage 1

Stage 2

解析で無視するとStage 1+2

交絡 Confounding

62

Random sampling vs randomization無作為割付け(無作為化) randomization 内的妥当性の確保無作為抽出 random sampling 外的妥当性

無作為抽出:多くの統計理論において理論上重要な概念であるが、臨床試験に

おいてはほとんど現実味をもたない。私見であるが、不用で誤解を招く概念

Senn, S(1 997), Statistical Issues in Drug Development,Wiley: glossary

偶然・同意

target population

施設の限定・安全性の配慮

study po pulatio n

63

ランダム化の意義

Byar D. et al. : Rando mized Clinical Trials, NEJM 29 5: 74-80, 1976

治療割付けに伴うバイアスの除去 交絡を小さく

予後要因の分布の均等化(平均的に) 信憑性の向上

個人差・バイアスを確率化 p値の根拠

ランダム化に基づくdesign-basedな解析母集団そして(仮想的)無作為抽出に基づくmodel-basedな解析

幸いに?簡単な問題では両者の結果は近似的に等しい

64

ランダム化の意義

例: 仮想的な10人の患者治療に対する潜在的反応

A B

+ + 2人 推定したい奏効率の差

+ - 3人 (3-1)/10= 20%- + 1人- - 4人

ランダム割付け 10C5 =252ハ ゚ター ン 最良は 100-20=80%、最悪は 0-40=-40%この分布は?

-40 -20 0 20 40 60 80

真の値 20%からのバイア スは 0、誤差的バラツキは大誤差的バ ラツキを小さくするには? サンプルサイズ大きく

並べ替え分布

65

真値に収束する 大数の法則

分布の形が正規分布に収束する 中心極限定理

ランダム化の意義:Fisherの実験計画法1930年代ロザムステッド農事試験場新品種、肥料などの評価のための実験?

品種A B

信憑性の高い評価になるか

バイアス (交絡):水はけ、日当たり、地味、・・・

AABB

ブ ロック

フ ゚ロット

均質に近いブロッ ク

最後はランダム化

Page 12: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 12

ランダム化の意義:Fisherの実験計画法

くり返し・反復 repetition・replication局所管理 local controlランダム化 randomization

要因組み合わせ factorial experiment

Fisherの実験計画法技術評価のための実験

科学的精密実験 技術評価のための実験

法則発見 目的 普及したときの有用性の評価

易 実験の制御 難

可能な限り排除 未知要因の影響 ランダム化

0であるべき 誤差 存在を前提

臨床研究への実験計画法の応用生物統計学の制度への組み込み

英国MRCによるストレプトマイシンの評価(1947)倫理と科学の幸運なる一致

アメリカへの伝播:大規模予防研究、がん共同研究グループ

新薬認可のシステム確立(FDA)

国際ハーモナイザーリョン

E9ガイドライン 統計的原則E3 治験の総括報告書E5 人種要因(bridging研究)

70

研究 (計画・実施)に要求される条件

Clarity

Comparability

Generalizability

サンプルサイズ大きく

ランダム化・マスキング(盲検化)

研究の繰り返し・メタアナリシス施設・背景によるsubgroup解析(交互作用の検討)など

プロトコル遵守(適格条件、治療、観察、報告)データ管理

71

内容

なぜ統計学が必要か

統計学を理解するために

プロトコルを読むために必要な最低知識

検定とランダム化

NSAS-BC02プロトコルから:生存時間解析入門

72

仮説検定の論理透視実験超能力を信じるか? (ESP experiment)

つぼの中のサイコロの目を当てると主張する「超能力」は本物か?

1回の試行で当たったら?2回の試行で当たったら?・・・10回なら?

トランプなら?

Page 13: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 13

73

仮説検定の論理

数学での「背理法」 reductive absurdityK.Popperの科学哲学「反証できない命題は科学的ではない 」

帰無仮説:「超能力者の言うことはまったくでたらめである」

その下で観察事象あるいはそれ以上に仮説からずれた事象がおきる

確率は?

1回の試行であたったら? 1/6=0.17 2回の試行であたったら? 1/36=0.028・・ ・ 10回なら? 0.00000002

トランプなら? 1/52=0.019

p値 p-values

P < 0.05 : statistically significant< 0.01 : highly statistically significant

74

仮説検定の論理

多少のリスクはあるが帰無仮説は真実とは考え難い

しからば?

対立仮説:alternative hypothesis超能力を信ずる

あるいは

何かインチキがあるのではないか

75

仮説検定の原理:一種の背理法

帰無仮説「新薬は効かない、標準薬と同等かそれ以下」

そのもとで、

現実に得られたデータ以上に新薬に有利な結果

が得られる確率を計算

P値

例:新薬とプラセボのクロスオーヴァー 2重盲検比較試験エンドポイント :どちらが効いたか?患者の選択10人中 10人が新薬選択 P値は ( 1/2) 10=1/1024=0.00 0989人なら 10人と 9人の分を加えて ( 1/2) 10+10 ( 1/2) 10=0.011

76

仮説検定の原理:一種の背理法

p値が基準の値(5%)以下なら帰無仮説を棄却する (「新薬は効く」と判断する)

対立仮説を選択する

あるいは何かインチキ?と判断する

工業における抜き取り検査sampling inspectionの抽象化繰り返しプロセスにおける平均的特性の確保

(Neyman-Pearson)それは科学か?(Fisherの批判)

GCP(品質保証)による排除

77

仮説検定と2種類の過誤α (第1種 )とβ (第2種)

事実 新薬は効く 効かない

意思決定 承認 1-β α

(仮説を捨てる) 検出力 power false-positivesensitivity

β 1-α承認しない false-negative specificity

(仮説を捨てない)

行政側: αの維持

スホ ゚ンサー:資源の制約下でβを小さく (症例数増やす、誤差的バラツキ小さく)

検定の繰り返し(多重性:多エンドポイント、多サブグループ、多時点での検定、複数の検定手法)、症例の除外:αの増加 78

仮説検定と2種類の過誤α (第1種 )とβ (第2種)

事実 病気 健康

検査結果 陽性 1-β α

(病気の診断) 検出力power false-positivesensitivity感度

β 1-α陰性 false-negative specificity特異度

(健康の診断)

ボンヤリ者

アワテ者

Page 14: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 14

79

仮説検定と2種類の過誤必要サンプルサイズの計算

Time-to-eventの場合、情報量はイベント数

ハザード(発生率) 半減することを証明するために必要な

イベント数 = 95 (α=0.05 両側、β=0.10)

(累積)発生率 各群に必要 Number-Nee ded-to -Ttreatコントロール群 治療群 な症例数 ( 1件のイベント減に対して)

1% 0.5% 6330 2005% 2.5% 1260 40

20% 10.6% 310 10.6100% 100% 48 ---

80

仮説検定と2種類の過誤必要サンプルサイズの計算

薬効評価ではαは一定(両側5%が標準)βを減らすには?効く薬を

精密なエンドポイントを

サンプルサイズを増やす

必要サンプルサイズの計算 ( 2群:α=0.05, β=0.10)連続量なら 各群 21×(群内SD/群平均差) 2

割合なら 各群 21×(平均p(1-p) ) /差 2

81

仮説検定と2種類の過誤必要サンプルサイズの計算

差とは何か?

非劣性の場合はホットな問題

優越性の場合:期待したい差 (新薬開発の場合)

臨床的に意味のある(最小)差 (標準治療確立の場合)

可能な症例数である程度の検出力が保証される差

慣習による設定

臨床的な有意差と統計的な有意差

優越性試験と非劣性試験

Lower (upper:通常0)

優越性:Superior

同等:Equivalent

非劣性:Non-inferior

治療効果の差と信頼区間 : 標準治療 /試験治療の効果の差 をδ

試験治療優れる

δをどう選択するか?Smallest effect sizeThere is little published experience

信頼区間(通常 95%)これが 0を含まなければ「統計的に( 5%)有意」

判断できず : Indeterminate

83

割合の比較

リューマチに対する多施設共同プラセボ対照2重盲検無作為化比較試験

反応:改善あり(著名、やや)、無し response: yes( marke d, some), none重要な共変量:性別、年齢、施設 covariates: gender, age, center

improvementsome or marked none total

test n11=28 n12= 13 n1+ = 41placebo n21= 14 n22= 29 n2+ = 43

n+1= 42 n+2 = 42 n=8 4

Koch et al. :From Peace ed. (1988), Biopharmaceutical statistics for drug development , Dekker, 翻訳有り (サイエ ンティスト社)

84

モデルに基づく検定

前提: それぞれの母集団での改善割合ρT ρP

無作為抽出random sampling

n11 follows Binomial distribution (n1+ ,ρT)n21 (n2+ ,ρP)

pT= n11/ n1+ , ρTの推定値 estiamte(あるいは推定量estimator)

pp= n21/ n2+ ρP

仮説 H0: ρT = ρP

ρT ρPn1+ sampling n2+ sampling

n11● n12○ n21● n22○

Page 15: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 15

85

モデルに基づく検定

検定統計量 test statistics : Signal / Noise

仮説の下、n大でzは標準正規に従う

正規分布の表からp値を計算

Z= 0.3573/0.1091 =3.274 p=0.0005 4 (片側)

++++ ++=−

+=

−−−−−=

21

1211

21

0

,)1(11

tan

nnnnppp

nnSE

UnderHNumeratorofErrordardSppz PT

86

標準正規分布(平均0、分散1)の密度関数

z=3.274

1.96:これを超えれば5%有意

87

検定と推定の関連

検定シグナル/ノイズ

(差の推定値/差の標準誤差) 正規分布のパーセント点と比較

絶対値が 1.96を超えれば 5%有意

推定95%信頼区間:興味のあるパラメータの推定値± 1.96×標準誤差

興味のあるパラメータが差の場合、

その95%信頼区間が0を含まなければ5%有意

88

ランダム化に基づく検定 Design-based test

前提:ランダム化のみ反応に個人差を考えてもよい

仮説H0:介入による反応に差はない

response of i-th individual by test=XiT placebo XiP

XiT= XiP

仮説の下で、ランダム化は n+1個の黒玉と n+2個の白玉をランダムに n1+と n2+に分

ける作業に対応

89

ランダム化に基づく検定 Design-based test

得られたパターンの出現確率

probability of the observed pattern ●●● … n+1

○○○ … n+2

n+1Cn11・n+2Cn12/ nCn1+

より極端なパターンの出現確率を加える:片側

n11=28 確率 0.00082258

29,30,…41 合計 0.001

確率が同じかそれ以下のパターンを加える (13以下か 28以上):両側 0.002

Fisherの直接確率検定 Fisher’s Exact test90

プログラムと出力 Program and output (SAS)

TABLE O F TR EAT BY I MPROV E

TR EAT I MPRO VE

Fr equen cy|

Ro w Pct |y es | no | To tal

-- ----- --+- ---- ---+ ---- ----+

t | 28 | 13 | 41

| 68. 29 | 31 .71 |

-- ----- --+- ---- ---+ ---- ----+

p | 14 | 29 | 43

| 32. 56 | 67 .44 |

-- ----- --+- ---- ---+ ---- ----+

To tal 42 42 84

Page 16: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 16

91

プログラムと出力 Program and output (SAS)

STATIS TICS FOR TABL E OF TRE AT B Y IMP ROVE

Sta tist ic DF Valu e Prob

--- ---- ---- ----- ---- ---- ---- ---- ----- ---- ---- ---- -----

Chi -Squ are 1 1 0.72 0 0.001

Lik elih ood Ratio Chi -Squ are 1 1 0.96 2 0.001

Con tinu ity Adj. Chi- Squa re 1 9.33 9 0.002

Man tel- Haen szel Chi- Squa re 1 1 0.59 3 0.001

Fis her' s Ex act T est (Lef t) 1.000

(Rig ht) 1.0 3E-03

(2-T ail) 2.0 6E-03

Phi Coe ffic ient 0.35 7

Con ting ency Coef fici ent 0.33 6

Cra mer' s V 0.35 7

92

プログラムと出力 Program and output (SAS)

Column 1 R isk Estim ates

95% Conf iden ce Bo unds 95 % Co nfide nce Boun ds

R isk A SE (A symp totic ) (Exa ct)

---- ----- ---- ---- ---- ----- ---- ---- ---- ---- ----- ---- ---- ---- ----- ---- ---- --

Row 1 0. 683 0. 073 0.5 40 0.8 25 0. 519 0. 819

Row 2 0. 326 0. 071 0.1 86 0.4 66 0. 191 0. 485

Tota l 0. 500 0. 055 0.3 93 0.6 07 0. 389 0. 611

Diff erenc e 0. 357 0. 102 0.1 58 0.5 57

(Row 1 - Row 2)

93

仮説検定の原理

治療Aと治療Bの反応率の比較

帰無仮説のもとでは反応は固定していると考えてよい

並べ替えによって、現実のデータ以上に極端なパターンが得られる確率を計算

design-based: Fisherの直接確率反応率 p=n/mによって母集団の反応率を推定、差の正規近似

model-based:Zあるいはχ2乗検定

反応あり なし 計

A mA nA-mA nAB mB nB-mB nB

94

検定にはさまざまな種類

データの型の違いと原理型 model-based design- ba sed

0-1 割合の差のZ(Z2=χ 2) Fisher連続 t 並べ替え検定、順位和検定

time-to-event Log-rank検定

正確な検定が困難な場合の近似の違い

対立仮説として何を想定するかの違い典型は用量反応を調べる場合

直線的な用量反応、プラセボとの最大用量の差、

プラセボとの最小用量の差、どこかの差、...

解析者の趣味の違い

95

Model based vs Design based

幸いにも、単純な問題では二つの(検定)結果はほぼ等しい

ランダム化試験の主たる解析はdesign-basedであるべき計算能力が向上したので手間のかかるdesign-basedも実施可能

96

検定に対する誤解

ノンパラ検定=順位を使う検定

分散が異なるかどうかF検定でチェックして、異なればWelchサンプルサイズが小さくて正規性が確認できないときはノンパラ

正規分布に従わないときはt検定を使ってはならない

正しい理解:高級課題

Page 17: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 17

97

検定に対する誤解

ノンパラ検定=順位を使う検定順位検定はノンパラの一つ

分散が異なるかどうかF検定でチェックして、異なればWelch群の大きさがそろっていればWelch不要、むしろ検定の選択が問題

サンプルサイズが小さくて正規性が確認できないときはノンパラサンプルサイズ小さいとき(10以下)は、順位検定の検出力小さい

正規分布に従わないときはt検定を使ってはならないt検定は design-base dな並べ替え検定の近似と解釈できるしたがってαは保たれる(criterion-robust ness成立 )

ただし外れ値や歪が大きいとβ大きくなる( efficiency-robust ness問題)

正しい理解:高級課題

98

内容

なぜ統計学が必要か

統計学を理解するために

プロトコルを読むために必要な最低知識

検定とランダム化

NSAS-BC02プロトコルから:生存時間解析入門

99

がん臨床試験プロトコルを読むためにNSAS-BC02から

試験計画とくに割り付け方法7-3-1(p.21) 層別化因子に基づいて動的割り付け法を用いて割り付ける。

症例数の設定根拠15-1-1(p.46)同等とみなせる幅Δ これをハザード比に換算して1.30

α、β、Shoenfeld-Richterの式(正規近似)

統計解析15-6(pp.50-51)群間の均衡性について、..分割表χ2検定、Wilcoxon検定、Mantel検定intent-to-treat principleに基づきKaplan-Meier法により無再発率を推定し、log-rank検定を適用..信頼区間の計算にはGreenwoodの公式..予後因子の影響の調整と治療効果の推定のためCoxの比例ハザードモデル...

中間解析15-7(p.52) Lan&DeMetsの方法で多重性を調整..ベイズ流予想確率 100

がん臨床試験プロトコルを読むためにこれを理解できれば完璧!

割り付け方法 必要性 具体的手法(おおよそ)

解析集団 集団の違いによるバイアス、ITTの考え方統計的推測の方法推定・検定そして信頼区間の概念

α、β、検出力

具体的手法(どこまで?)

優越性か非劣性か、その他か(選択、用量反応の解析など)

生存時間解析の「 3種の神器」Kaplan-Meier推定、Log-rank検定、Cox回帰(比例ハザードモデル)

症例設定の根拠 原理

中間解析 必要性多重性の必要性

101

品質管理と品質保証

ランダム化手法が不適切であった例

102

目的・目標既知の因子はもちろん、未知の因子についても群間で均衡

偏りの防止、感度の向上

盲検化できない場合には予見性を小さくする

一方で過度に複雑な手続きは避けたい

具体的手法盲検下をどこまで

中央登録かそれ以外か(封筒法は一般には×)

層別するか

背景因子を考慮した動的割り付けを行うか

施設をどうするか

割り付け比率は?

2群なら通常は1:1、ときに2:1など

割り付け方法

Page 18: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 18

103

実際に用いられている方法盲検可能な治験の場合

施設毎の置換ブロック法 permuted-block2群ブロックの大きさ4の場合、AAPP,… PPAAの6通りを施設毎にランダムに順次発生

ブロックの大きさはプロトコルに通常記載しない

盲検を行わないがん臨床試験の場合

層別を行うこともあり

通常は2-4程度の因子を用いた動的割り付け法どの時点でもバランス取れるように割り付け確率変化させる

施設は因子に含める場合とアンバランス程度の制約を与える場合あり(Zelenの方法)

割り付け方法(続き)

104

割り付け方法(続き)

A B B A A A B B …. 置換ブロック法

群A 群B性 男 20 19

女 10 11年齢 <50 11 10

>=5 0 19 20重症度 III 5 3

IV 25 27

次患者 (男 <50 III) どちらに割り振ればバランスとれるかA:20+11+5=3 6 B:19+10 +3 =32 Bに割り振る確率大とする

最小化法

105

Prospective studies and retrospective studies前向き研究と後ろ向き研究

Cohort study コホート研究

disease no-diseaseexposure n1 m1 n1-m1

control n0 m0 n0-m0

Risk ratio リスク比 =

Follow-up

m1/n1m0/n0

106

Prospective studies and retrospective studies前向き研究と後ろ向き研究

Case-control studyケースコントロール研究

disease(case) no-disease(control)

n1 n0

exposure yes m1 m0

no n1-m1 n0-m0

Odds-ratio オッズ比 =

Survey

m1/(n1-m1)m0/(n0-m0 )

107

Prospective studies and retrospective studies前向き研究と後ろ向き研究

In rare disease :

O DDS-RATIO = RISK-RATIO

108

オッズ比と相対危険

ある薬剤Z服用によって疾患Xの死亡オッズが 10倍になった

新聞報道「Zによって死亡が 10倍になる!」

Z無 Z有

0.01 0.0920.05 0.3450.10 0.5260.20 0.714

オッズ = p/(1-p)

オッズ比=曝露群のオッズ /対照群のオッズ

正しい理解

Page 19: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 19

109

オッズ比一定(10)の場合のリスク比(相対危険)

110

ハザード

発症率 罹患率 morbidity, incidence rate 死亡率 mortality, death rate

ともにこれまで起きていない事象(イベント)が新たに起きるスピードとして

ハザード hazardが用いられる

111

打ち切り

event, failure: 目標の事象打ち切りcensoring

*打ち切りはランダムか?non-informative censoring

打ち切りとその後の予後が独立

informative censoring

××

?観測打ち切り termination of follow- up

脱落drop-out, lost-to-f ollow- up

112

ハザードとその推定

発症率、死亡率 ハザードhazard[time]-1

単位時間あたりの新たなイベントの発生

ハザードの直接推定(保険統計法) actuarial method国の人口動態統計など

臨床では、サンプルサイズ不足のため(累積)生存率推定通常Kaplan-Meier法

time time time

初期故障型 摩耗故障型 偶然故障型

113

hazard = number of deaths size of risk set - 0.5(deaths+dropout s)

保険統計法

114

ハザードと(累積)生存率

ハザードと(累積)生存率の関連 hazard vs survival function一定 指数 exponential関数

2倍になれば 2乗0.9 -> 0.810.8 -> 0.640.6 -> 0.36

微分方程式 微分と積分の関係

速度と到達距離の関連 数学的には1:1であるが統計的には?

λ(t)= λ 1 S(t) = exp(-λt)

Page 20: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 20

115

オッズ、ハザード、リスク

リスク(累積発症率)

オッズ

慢性疾患では(イベント発生少ないがん再発でも)

オッズ比~ハザード比~リスク比

t

duutpt

u

λ

λ

−−= ∫=

λが小さく一定なら

))(exp(1)(0

ppp

p≈

−小さければ

1

116

生存時間解析の3種の神器

Kaplan-Meier法Log-rank検定Cox回帰

ランダム化試験なら基本的解析はログランク検定

しかし 、

単なる有意性有無だけでなく、治療効果を推定したい

(割付に用いた)予後因子の予後予測性を知りたい

治療効果予測因子の予測性(治療との交互作用)知りたい

多数の因子の影響を同時に考慮したい

このときモデル(Cox回帰が代表選手)が有用

117

生存関数の推定と比較

生存関数の推定

打ち切り無ければ単純で生存割合をプロット

打ち切りあればKaplan-Meier法 誤差はGreenwoodの公式

生存関数の比較

打ち切り無ければふつうの連続データの解析

ただし歪み大きいので変換、ないしノンパラメトリック検定

3年、 5年等の生存割合の比較

時点選択の問題、情報のロス

ハザードの比較

順位を用いるノンパラメトリック検定

118

Kaplan-Meier法:積極限product-limit法

death1 death1 censor1 death1

10 9 8 7 6

1 1× (1 -1/1 0) 1× (1 -1/10 )× (1 -1/9 ) 1× (1-1 /10 )× (1-1 /9)× ( 1-1 /7)

打ち切りはヒゲで示すことが多い

119

グラフの見方:(念のため)グラフが上にある方が生存成績が良い端の方は信頼性が低いグラフの下の面積が平均生存期間MSTは50%の線と交わる時点

120

ハザードの違いのノンパラメトリック検定

群1 10 death 1 death 1

2 10 death 1

死 生存群1 1 9 10

2 0 10 101 19 20

死 生存群1 1 8 9

2 0 10 101 18 19

ハザード等しければO-E = 1 - 1×10/20 1- 1×9/19

0- 1×10/20 0- 1×10/19

O: observed, E: expected

time

Page 21: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 21

121

ハザードの違いのノンパラメトリック検定

検定統計量

これが大きくなればなるほど群間差あり

Variance分散の式は省略3.84より大のとき5%有意

VarianceEOweight∑ −

=2

2 ))((χ

重み 1 Log-rank検定risk-setの大きさ Generalized Wilcoxon検定

122

多変量解析=統計モデルのあてはめ

全てのモデルは誤っている。ただし役に立つモデルも存在する。

モデルの意義

データの要約 summarization予測 内挿・外挿

異常データ・問題点の摘出exposure

ある因子の効果(影響)の定量的評価

医学統計では

現象(自然史)の理解(予後因子・予測因子)

研究計画への利用(層別因子、調整因子)

比較の際の偏りの除去・軽減

個々の患者への適用、とくに治療法の選択

123

比例ハザードモデル Proportional hazard model= Cox回帰 regression

ハザードを時間に関する部分と共変量の部分に分解

x=1(試験治療)=0(対照群)とすれば(ダミー変数という)β<0 効果あり、=0 効果なし exp(β):ハザード比

(β/標準誤差) 2 > 3.84 なら 5%有意

因子の寄与は掛け算(対数線形性)

時間依存性共変量も扱うこと可能

比例ハザード性・対数線形性(前提)を検証すること好ましい

)exp()exp()exp()...exp()(

)()(),(

2211

2211

kk

kk

xxxxxxxxthazardxthazard

ββββββψψ

L=++=×=

124

血管新生(Micro Vessel Count)と乳癌患者(n0)の予後Heimann R. et al. JNCI 1996; 88:17 64-9

125

血管新生(Micro Vessel Count)と乳癌患者(n0)の予後Heimann R. et al. JNCI 1996; 88:17 64-9

ログランク検定結果 Cox回帰結果

126

比例ハザードモデル Proportional hazard model= Cox回帰 regression

x :共変量 covariates

人口学的変数(性、年齢)、手術・病理・ゲノム情報、

治療法、施設(変量モデルとして扱うこと多い)・時代

コード化の問題、とくにステージなど順序変数どうするか

可能ならダミー変数

相関の高い変数(多重共線性) 0.8くらいなら問題なし

変数の数はどこまで

情報量はイベント数 1変数 5イベント以上欲しい

変数選択 減少法の方が安全、全ての組み合わせの実施も可能

交互作用 掛け算の項をモデルに導入

Page 22: CSPOR NPO J-CRSU · 2017-06-05 · Lang T A and Secic M: How to Report Statistics in Medicine - Annotated Guidelines for Authors, Editors and Reviewers, American College of Physicians,

臨床試験のための生物統計学入門(大橋靖雄) 第6回CSPOR・CRCセミナー(2003/2/8~9)

使用目的を研究者の自己学習用に限り、その他への転用を禁じる 22

127

予後因子と予測因子

)...exp()()()(),(

2211 kkxxxxxthazardxthazard

βββψψ

++=×=

予後因子モデル βT×Treatment+βG×Factor

予測因子モデル β P×Factor×Treatment

Log-hazard

Factor=0 1

Treatment =0

Treatment =1

Log-hazard

Factor=0 1

Treatment =0

Treatment =1

128

目標:どこまで達成できたか?

「オンコロジストのための統計学」を読む上で必要なエッセンスを話す

このテキストのレヴェルは実は高い

「よく分かる」という授業・本の印象は既知の知識の量による

結局、(その場では分かったつもりになっても)一回聞いただけではなかなか分からない。繰り返し接するか、一度本格的に勉強するか

全部理解しようとは思わないこと。重要な概念だけで十分

Q and A統計パッケージデモ (休憩時間に、伊藤陽一先生)

SAS:製薬会社やFDAで使われている業界標準、敷居高い ・値段も高いJMP:研究者向けの使いやすいソフト、教育用に適

129

重要な概念

正確度と精密度

無作為抽出とランダム化

ランダム化とITT一般化可能性

検定と信頼区間の構成

必要な情報量とサンプルサイズの計算

多重性によるαの上昇、中間解析

割り付け法の実際

ハザード比、オッズ比、リスク比

生存時間解析の3種の神器

130

Q and Aデモ