death noteの統計学」 - sas institute...sasによる生存時間分布の予測 「death...
TRANSCRIPT
SASによる生存時間分布の予測「Death Noteの統計学」
東京理科大学
浜田知久馬,魚住龍史
Prediction of Survival Distribution using SAS
Statistics for “Death Note”
Chikuma Hamada
Tokyo University of Science
Death Note
要旨
分位点回帰を行うプロシジャQUANTREGプロシジャを打ち切りがある場合に拡張したQUANTLIFEプロシジャがバージョン9.4から新たに追加された.このプロシ
ジャを利用するとメディアン等の分位点と共変量の関係をモデル化することが出来る.本発表では,チュートリアルとしてLIFETESTプロシジャ,PHREGプロシジャ,LIFEREGプロシジャ,QUANTLIFEプロシジャを用いた生存関数の予測について解説する.
キーワード:生存時間分布,比例ハザードモデル,加速モデル,分位点回帰
2
QUANTREG(分位点回帰)+LIFETEST(ノンパラ)
=QUANTLIFE(分位点回帰の生存時間への拡張)
内容
3
生存時間の予測ノンパラメトリックな予測
KM(LIFETEST)セミパラメトリックな予測
Cox(PHREG)
パラメトリックな予測加速(LIFEREG)
分位点の予測QUANTLIFE
Death Note
生存時間解析のSASの教科書
4
生存時間解析応用編
第1 章はじめに
1.1 生存時間解析とSAS
1.1.1 LIFETEST プロシジャ(第2 章)
1.1.2 PHREG プロシジャ(第3 章)
1.1.3 POWER プロシジャ(第4 章)
1.1.4 LIFEREG プロシジャ
1.1.5 SURVEYPHREG プロシジャ
1.1.6 QUANTLIFE プロシジャ
1.1.7 ICLIFETEST プロシジャ
1.1.8 ICPHREG プロシジャ5
第2 章生存関数のノンパラメトリックな推定と検定(LIFETEST プロシジャ)
2.1 ノンパラメトリックな生存関数と
ハザード関数の推定
2.1.1 カプラン・マイヤー推定量
2.1.2 カプラン・マイヤープロット
2.1.3 生存関数の信頼区間
2.1.4 生存関数の信頼バンド
2.1.5 ハザードの推定と可視化
2.2.1 2 群間の比較
2.2.2 多重比較法による解析 6
第3 章コックス回帰によるハザード比の推定とその拡張(PHREGプロシジャ)
3.1 PHREG プロシジャによる様々な線型仮説に対する検討
3.2 共変量及び多重性の調整
3.3 最大対比法の適用
3.4 モデルの評価
3.4.1 残差統計量
3.4.2 累積ショーンフェルド残差プロットによる
比例ハザード性の評価
3.4.3 累積マルチンゲール残差プロットによる線型モデル
の仮定の評価
3.5 フレイルティモデルと周辺コックスモデルによる
クラスター生存時間データの解析7
第4 章生存時間解析における例数設計(POWER プロシジャ)
4.1 生存時間解析における例数設計の概要:
4.2 フリードマンの方法とショーンフェルドの方法4.3 POWER プロシジャによる生存時間解析の
例数設計
4.3.1 ラカトスの方法
4.3.2 POWER プロシジャによる実行例
4.3.3 フリードマンの方法とショーンフェルドの
方法による例数との比較
4.3.4 区分直線モデルによる例数設計 8
応用編に関連したチュートリアル浜田知久馬・藤井陽介(2003). 生存時間解析の症例数設計.
浜田知久馬・安藤英一(2005). POWERプロシジャによる症例数設計.
浜田知久馬(2011). 生存時間解析再入門
生存時間解析のミステリーをひも解く.
浜田知久馬(2013). SAS 生存時間解析プロシジャの最新の機能拡張.
9
10
共変量 (covariate)予後因子(prognostic factor)背景因子(baseline factor)
• 生存時間に対する影響を調べたい変数
1)治療法の違いを表す共変量
2)患者固有の性質を表す共変量:年齢,検査値
3)外性的な共変量(環境要因):施設,時代
• 時間非依存性共変量:性,人種
• 時間依存性共変量:検査値,治療法
( time dependent covariate )
11
生存時間に影響を与える因子
性別:男性 80.5歳(8位) 女性 86.8歳(1位) (2014)
疾患:糖尿病,高血圧
食生活:赤ワイン,果物
地域:沖縄県は長寿だった
生活習慣:喫煙,運動
職業:医師,タクシードライバー,関取
遺伝子(ゲノム疫学)
12
生存時間解析の方針• ノンパラメトリック(LIFETEST)
– 特定の分布を仮定しない推定
– Kaplan-Meier法,
ログランク検定,一般化ウイルコクソン検定
• セミパラメトリック(PHREG)– 特定の分布を仮定しないハザード比の推定
– Coxの比例ハザードモデル
• パラメトリック(LIFEREG)– 特定の分布を仮定した生存時間解析
– 加速モデル
•13
Kaplan-Meier法死亡時点で階段が低下
t1 t2 t3 t4
1/71/7
2
11
4
11
6
11
7
11
4
11
6
11
7
11
6
11
7
11
7
11
↑ ↑ ↑
Kaplan-Meier法瞬間の単位で生き残る確率を積算
時点tまで生き残る:ti<tの全てを生き残る.
死亡が起きてない時点: 生き残る確率= 1
死亡が起きた時点:生き残る確率=
ni:時点iのリスク集合の大きさ
di:時点iの死亡数
死亡がおきてない時点は水平で,死亡が起きた時点で生存関数S(t)は階段状に低下
(di=1で打ち切りがなければ,1/nづつ低下)
i
i
n
d1
•15
生存割合の推移
時点t1まで:1 (死亡がおきてない)
t1~t2 :
t2~t3 :
t3~t4 :
t4 ~ : 27.02
11
4
11
6
11
7
11
54.04
11
6
11
7
11
714.07
5
6
5
7
6
6
11
7
11
857.07
6
7
11
死亡:階段低下 打ち切り:ヒゲ
t1 t2 t3 t4
1.0
0.8
0.6
0.4
0.2
0.0
↑ ↑ ↑
17
加速(時間に対するモデル化)比例ハザード(時間の逆数のモデル化)
β>0:z↑→T ↑ (リスクは減少)
β<0:z↑→T ↓ (リスクは増大)
比例
β>0:z↑→T ↓ (リスクは増大)
β<0:z↑→T ↑ (リスクは減少)
2つのモデル間でβの符号は反対
)exp(0 izβTTT
)exp()()( 0 izβTthth
加速
18
加速モデルと比例ハザードモデル
・加速モデル
・比例ハザードモデル
))(loglog())(loglog(
)()(
)exp()()(
0
)exp(
0
0
tStS
tStS
thth
T
T
T
zβ
zβ
zβ
0
0
0
loglog
)exp()(
)exp(
TT
tStS
TT
T
T
T
zβ
zβ
zβ
19
加速モデル:横軸が定数倍,S(t)=S0(t/2)
:T0 :T exp(β Tz)=2
5.02
1)1( 00 SSS
任意の%点が定数倍
20
比例ハザードモデル:縦軸がべき乗
S(t)=S0(t)2 exp(β Tz)=2のとき
0.8
0.82 0.6
0.62
0.3
0.32
21
二重対数プロット加速モデル
log(-log(S))
log(time)
水平方向に
平行移動
βa
z=0,1
0loglog TzT
22
二重対数プロット比例ハザードモデル
log(-log(S))
log(time)
垂直方向に
平行移動
βph
z=0,1
))(loglog())(loglog( 0 tSztS
23
ワイブル確率プロット(二重対数プロット)
ワイブル分布の生存関数
logtを横軸,log(-logS(t))を縦軸に
プロットすると傾きγ の直線になる.
ttS
ttS
ttS
loglog))(loglog(
)(log
)exp()(
tlog
))(loglog( tS
log切片:
傾き:
24
二重対数プロットワイブル分布
log(-log(S))
log(time)
βa
βph
傾き:γ
βph=―γβa
log切片:
ttS loglog))(loglog(
25
二重対数プロット1)横軸:log(time) 縦軸:log(-log(S))
2)比例ハザードモデルのとき,
上下に平行移動
3)加速モデルのとき,左右に平行移動
4)ワイブル分布のときは直線
(上下,左右に同時に平行移動)
比例ハザードかつ加速モデル
-β (加速)×γ =β (比例)
例題データ:加速モデルdata test;
do drug=0,1;
do i=1 to 20;time=i*(drug+1);output;end;end;run;
proc print;run;
proc sgplot;
scatter x=time y=drug ;run;
26
例題データ:人工的な加速モデル
27生存時間
薬剤群
対照群
生存時間が2倍
2 4 6 8 10 ・・・ 20・・・ 40
12345 ・・・ 10・・・ 20
01 2 TT
401T
200T
LIFETESTによる解析(ノンパラ)proc lifetest data= test plots=(s,lls);
time time;
strata drug;
run;
28
生存関数の予測(ノンパラ)Kaplan-Meier プロット
29
二重対数プロット(ノンパラ)
30
log(2)=0.693
対数生存時間比
01
01
log2loglog
2
TT
TT
log(time)
PHREGによる解析(セミパラ)data dummy; do drug=0 to 1;_group_=1;output; end;
proc phreg data=test plots(overlay=group)=(s);
model time= drug;
baseline out=out covariates=dummy
survival=s loglogs=lls/nomean;run;
data out;set out;logw=log(time);
label s='survival' lls='lls';
proc gplot data=out;
plot s*time=drug lls*logw=drug;;run;
31
生存関数の予測(セミパラ)
32
33
尤推定値の分析
パラメータ パラメータ推定値
ハザード比
drug -1.36910 0.254 対数ハザード比-1.369=log(0.254)
二重対数プロット(セミパラ)log(-log(S))
共変量の効果を誤特定
LIFEREGによる解析(パラ)ワイブル分布
proc lifereg data=test;
model time=drug/dist=weibull;
output out=out cdf=cdf;
data out;set out;s=1-cdf;
lls=log(-log(s));logw=log(time);
proc gplot;
plot s*time=drug lls*logw=drug;
symbol1 i=spline c=red w=3 l=;
symbol2 i=spline c=green w=3 l=;run; 34
生存関数の予測(パラ)
35
01 2 TT
二重対数プロット(パラ)
36
Analysis of Maximum Likelihood Parameter Estimates
Parameter Estimate
Intercept 2.4643
drug 0.6931
Scale 0.5489
Weibull Shape 1.8220
0.6931×1.822=1.262
log2=0.6931
log(-log(S))
生存時間分布を誤特定
比例ハザードモデルと加速モデル
1)ノンパラ 共変量をモデル化できない.
既存のモデルは仮定が厳しすぎる.
2)比例ハザードモデル
ハザードが時点によらず定数倍
二重対数プロットが縦軸方向に平行移動
3)加速モデル(ワイブル分布)
時間の%点が定数倍
二重対数プロットが横軸方向に平行移動
特定の生存時間分布を仮定する必要がある. 37
QUANTLIFEによる解析
proc quantlife data= test method=na log plot=quantplot;
model time=drug /quantile=0.00 to 0.95 by 0.05;
baseline out=qlout covariates=dummy survival=qlsurv quantile=qly;run;
proc gplot data=qlout;plot qlsurv*qly=drug;
symbol1 i=steplj w=3 l=1 c=red;
symbol2 i=steplj w=3 l=2 c=blue;run; 38
加速(対数線形)モデル
zT )(1)(0)(log τ分位点に対する回帰分析
39
Parameter Estimates
Quantile Parameter DF Estimate StandardError
95% Confidence Limits t Value Pr > |t|
0.1000 Intercept 1 0.7815 0.5170 -0.2317 1.7948 1.51 0.1389
drug 1 0.6704 0.7164 -0.7338 2.0745 0.94 0.3553
0.2000 Intercept 1 1.4111 0.4257 0.5768 2.2454 3.31 0.0020
drug 1 0.7116 0.5987 -0.4618 1.8850 1.19 0.2420
0.3000 Intercept 1 1.8239 0.3375 1.1624 2.4855 5.40 <.0001
drug 1 0.6869 0.4654 -0.2253 1.5990 1.48 0.1482
0.4000 Intercept 1 2.0954 0.2651 1.5758 2.6150 7.90 <.0001
drug 1 0.6772 0.3789 -0.0653 1.4198 1.79 0.0818
0.5000 Intercept 1 2.3283 0.2240 1.8893 2.7674 10.39 <.0001
drug 1 0.6706 0.3150 0.0531 1.2880 2.13 0.0398
0.6000 Intercept 1 2.5161 0.1736 2.1758 2.8563 14.49 <.0001
drug 1 0.6931 0.2537 0.1960 1.1903 2.73 0.0095
0.7000 Intercept 1 2.6647 0.1385 2.3933 2.9360 19.25 <.0001
drug 1 0.6931 0.1963 0.3083 1.0780 3.53 0.0011
0.8000 Intercept 1 2.7900 0.1085 2.5773 3.0026 25.72 <.0001
drug 1 0.6931 0.1573 0.3848 1.0015 4.41 <.0001
0.9000 Intercept 1 2.9232 0.0772 2.7718 3.0745 37.85 <.0001
drug 1 0.6931 0.1134 0.4708 0.9155 6.11 <.0001
zT )(1)(0)(log 加速モデル
パラメータ推定値× Quantile
40
log(2)=0.693
log(i)i=1 to 20
zT )(1)(0)(log
)(1)( tStF
)2log()(1
plot=quantplotオプション
%点によらず係数は一定加速モデルが成立
)20log()(0
生存関数の予測
41
N=19で対数変換なし(加法モデル)data test;
do drug=0,1;
do i=1 to 19;time=i*(drug+1);output;end;end;run;
proc quantlife data= test method=na plot=quantplot;
model time=drug / quantile=0.00 to 0.95 by 0.05;
baseline out=qlout covariates=dummy survival=qlsurv quantile=qly;
run;
proc gplot data=qlout;plot qlsurv*qly=drug;
symbol1 i=steplj w=3 l=1 c=red;
symbol2 i=steplj w=3 l=2 c=blue;run; 42
zT )(1)(0
生存関数の予測
43
44
Parameter Estimates
Quantile Parameter
DF Estimate StandardError
95% Confidence Limits
t Value Pr > |t|
0.1000 Intercept 1 2.0000 1.3175 -0.5822 4.5822 1.52 0.1377
drug 1 2.0000 2.9569 -3.7954 7.7954 0.68 0.5031
0.2000 Intercept 1 4.0000 1.7206 0.6277 7.3723 2.32 0.0258
drug 1 4.0000 3.8306 -3.5078 11.5078 1.04 0.3033
0.3000 Intercept 1 6.0000 1.9308 2.2157 9.7843 3.11 0.0037
drug 1 6.0000 4.4071 -2.6378 14.6378 1.36 0.1818
0.4000 Intercept 1 8.0000 2.0055 4.0694 11.9306 3.99 0.0003
drug 1 8.0000 4.4343 -0.6911 16.6911 1.80 0.0796
0.5000 Intercept 1 10.0000 2.0368 6.0080 13.9920 4.91 <.0001
drug 1 10.0000 4.7272 0.7349 19.2651 2.12 0.0414
0.6000 Intercept 1 12.0000 2.1370 7.8116 16.1884 5.62 <.0001
drug 1 12.0000 4.5073 3.1658 20.8342 2.66 0.0115
0.7000 Intercept 1 14.0000 2.1706 9.7457 18.2543 6.45 <.0001
drug 1 14.0000 4.3911 5.3937 22.6063 3.19 0.0030
0.8000 Intercept 1 16.0000 1.8313 12.4107 19.5893 8.74 <.0001
drug 1 16.0000 3.9257 8.3057 23.6943 4.08 0.0002
0.9000 Intercept 1 18.0000 1.2936 15.4646 20.5354 13.91 <.0001
drug 1 18.0000 2.7325 12.6443 23.3557 6.59 <.0001
zT )(1)(0 加法モデル
パラメータ推定値× Quantile
45
zT )(1)(0
20)(0 20)(1
)(1)( tStF )(1)( tStF
QUANTLIFEの文法PROC QUANTLIFE < options > ;
BASELINE < options > ;*予測する共変量の指定;
CLASS variables ;
EFFECT name = effect-type ( variables < / options > ) ;
MODEL response < censor(list) > = < effects >
< / QUANTILE= > ;
OUTPUT <OUT=SAS-data-set > < keyword=name . . . keyword=name > ;
TEST effects < / options > ;
生存時間解析のプロシジャの比較
47*QUANTLIFE:生存時間分布に特定の分布を仮定しないが,共変量で%点が変化
プロシジャ 焦点 モデルアプローチ
共変量 打ち切り
LIFETEST生存関数
ノンパラ 層別 右側
PHREGハザード関数
比例ハザードモデル
セミパラモデル調整
右側
LIFEREG生存時間
加速モデル パラモデル調整
右側,
左側,区間
QUANTLIFE 生存時間の分位点
加速モデルセミパラ*
モデル調整
右側加法モデル
最小2乗法と絶対値の和の最小
48
5:
min
8.4
0)(2
)9()6()5()3()1(
min)(
96531
22222
2
medianA
AyS
yAnAy
AydA
dS
AAAAA
AyS
,,,,:y
i
i
i
i
i
算術平均:4.8 中央値:5.02乗和を最小 絶対値の和を最小
49
1
3
5
6
9
A
最小2乗の確認S=Σ(Yi-4.8)2
=(1-4.8)2 + (3-4.8)2 + (5-4.8)2 + (6-4.8)2 + (9-4.8)2
=(-3.8)2 + (-1.8)2 + (0.2)2 + (1.2)2 + (4.2)2
=36.8
S’=Σ(Yi-5.0)2
=(1-5.0)2 + (3-5.0)2 + (5-5.0)2 + (6-5.0)2 + (9-5.0)2
=(-4.0)2 + (-2.0)2 + (0)2 + (1)2 + (4)2
=37.050
最小絶対値の確認
S=Σ|Yi-4.8|
=|1-4.8 | + |3-4.8| + |5-4.8| + |6-4.8| + |9-4.8|
=3.8 +1.8 + 0.2 +1.2 + 4.2
=11.2
S’=Σ|Yi-5.0|
=|1-5 | + |3-5| + |5-5| + |6-5| + |9-5|
=4.0 +2 + 0 +1 + 4
=11.051
絶対値の和の変化
52
1
3
5
6
9
A
最小2乗法の模式図単回帰分析
53
Y
X0
××
XX
×
no x y
1 1 3
2 2 2
3 3 5
4 4 4
5 5 14
最小2乗推定
直線による予測式:
残差:
残差平方和:
b0 b1の関数
偏微分して0⇒正規方程式54
ii xbby 10
iii yye
min)(
)(
2
10
22
ii
iiie
xbby
yyeS
最小2乗推定量
55xx
xy
ii
ii
iiii
iiii
iiie
iiiie
ii
iiie
S
S
xxxx
yyxxb
xxxxbyyxx
exexx
xxbyyxxdb
dS
xxbyyxbbyS
xbybxbby
xbbny
exbbydb
dS
))((
))((
))(())((
02)(2
))()((2
))(()(
0
0
02)(2
1
1
1
1
2
1
2
10
1010
10
10
0
単回帰分析の結果
i
ii
x
xbby
4.26.1
10
%点(分位点)回帰の指標
57
n
yi
T
i
n
yi
T
i
n
yi
T
i
n
yi
T
i
n
i
T
i
n
i
T
i
Ti
Ti
Ti
Ti
yyS
yyS
yS
yS
βx
i
βx
i
βx
i
βx
i
i
i
ii
ii
βxβx
βxβx
βx
βx
::
::
1
2
1
05.095.0
:%95
)1(
:%
5.0:
:
点回帰
点回帰
メディアン回帰
回帰分析
proc quantreg;model y=x /quantile=.05 .50 .95;
xy
xy 2
xy 75.225.0
50%点
95%点
5%点
QUANTREGプロシジャの結果
xy 75.225.0
xy 2
xy
切片 傾き
分位点 分位点
QUANTREGプロシジャの結果 50%点
xy 2
n
i
T
iyS1
5.0: βxiメディアン回帰
5%点:負の残差が出ないようにする
xy
n
yi
T
i
n
yi
T
iT
iT
i
yySβx
i
βx
i
ii
βxβx::
95.005.0
95%点:正の残差が出ないようにする
xy 75.225.0
n
yi
T
i
n
yi
T
iT
iT
i
yySβx
i
βx
i
ii
βxβx::
05.095.0
分位点回帰の特徴ノンパラメトリック回帰
1)外れ値に対して頑健
(平均値に対する中央値の頑健性.)
2)等分散性が成り立たない場合でも対応可
(期待値が大きくなると分散が大きくなる.)
3) %点についてモデル化
%点ごとに異なった回帰係数をあてはめることができる.
63
64
2013年プロ野球打者のデータ
年俸(万円)
通算安打
回帰分析90%予測区間
阿部
65
分位点回帰95%点
50%点
5%点
分位点回帰1)不等分散性に対応可2)外れ値に対して頑健
通算安打
年俸万円
2013年プロ野球打者のデータ
%点回帰(quantlifeの記載)
n
yi
T
i
n
yi
T
i
n
i
T
i
T
i
n
i
T
i
Ti
Ti
yy
yIy
yr
uIuu
βx
i
βx
i
ii
i
ii
βxβx
βxβx
βxβ
::
1
1
)1(
)0)((
)(
))0(()(
分位点回帰の打ち切りデータに対する拡張方針打ち切りを起こした個体:打ち切り時点から∞の
どこかで死亡が起きる.
1)打ち切り時点で死亡
2)∞(最終観察時点)の時点で死亡
に重みを付けて分割
後の時点の累積死亡率を推定するときは,1)の重みを大きくする.重みは逐次的に更新
67
Kaplan-Meier-Type Estimatorイベント,打ち切りの寄与
i
ii
i
T
i
T
ii
T
i
w
y
ory
yw
yw
y
1
)(
:
:
))(1(
)(
*
*
最終観察時点
打ち切り時点生存時間
打ち切り:
イベント:
βx
βx
βx
i
i
i
:推定したい分位点
の累積分布個体
打ち切り時点の
i
:
i
打ち切りデータの重み
69の死亡の重み時点
の重み:打ち切り時点の死亡
:推定したい分位点
の累積分布打ち切り時点の個体
:
1
1
1
1)(1
1
)(
i:
ii
iii
i
ii
i
w
w
Kaplan-Meier-Type Estimator 打ち切りデータの重み
00.14.01
4.00.1
1
:0.1,4.0
83.04.01
4.09.0
1
:9.0,4.0
17.04.01
4.05.0
1
:5.0,4.0
016.04.01
4.03.0
1
:3.0,4.0
i
ii
i
ii
i
ii
i
ii
で死亡iy
り最終観察時点で打ち切:*y
累積分布が0.3の時点では生存
累積分布が1.0の時点では死亡
重みの模式図
71時間
累積死亡分布関数
i t ∞
i
1
i1
i
1
時点tでの死亡の重み
時点∞での死亡の重み
最終観察時点
重みの持つ意味KM推定量:1 2 3 4 5 6 7 8 9 10
* * *
72
1,76,0,52.0,4.0,3.0,2.0,1.0:)(
0,24.0,48.0,6.0,7.0,8.0,9.0:)(
10964321:
1
0
2
1
5
4
7
6
8
7
9
8
10
9
1
11
2
11
5
11
7
11
8
11
9
11
10
11
tF
tS
t
LIFETESTのプログラム
data data;
input t c @@;
cards;
1 0 2 0 3 0 4 0 5 1
6 0 7 1 8 1 9 0 10 0
;
proc lifetest plots=s(atrisk=0 to 10 by 1);
time t*c(1);run;73
74
0.1
0.1
0.1
0.1
0.12
0.24
2.114.01
4.052.01
4.01
4.0
1 2 3 4 5 6 7 8 9 10* * *
75
76.010
52.01
52.021
4.01
4.01111
9
52.010
14.01
4.01111
6
の累積分布関数τ時点
の累積分布関数τ時点 の重みで死亡2.04.01
4.052.0
この式をτ について解くとKM推定量
EXAMPLE: PRIMARY BILIARY CIRRHOSIS STUDY
原発性胆汁性肝硬変(PBC)N=418 死亡:161,打ち切り:257
Time:生存時間(年)
Status:打ち切り変数(1 :死亡,0:打ち切り)
Age:試験登録時の年齢
Albumin:アルブミン濃度(g/dL)
Bilirubin:ビリルビン(mg/dL)
Edema:浮腫の有無
Protime:プロトロンビン時間(秒)
PHREGによる解析proc phreg data=pbcmodel Time*Status(0)=logBilirubin logProtime logAlbumin Age Edema;
77
最尤推定値の分析
パラメータ 自由度
パラメータ推定値
標準誤差
カイ 2 乗値
Pr > ChiSq
ハザード比
logBilirubin 1 0.87072 0.08263 111.0484 <.0001 2.389
logProtime 1 2.37789 0.76674 9.6181 0.0019 10.782
logAlbumin 1 -2.53264 0.64819 15.2664 <.0001 0.079
Age 1 0.03940 0.00765 26.5306 <.0001 1.040
Edema 1 0.85934 0.27114 10.0447 0.0015 2.362
78
プロットする参照共変量 (平均値)
logBilirubin logProtime logAlbumin Age Edema
0.571493 2.369201 1.244156 50.741460 0.100478
PHREGによる生存時間分布の予測
LIFEREGによる解析(ワイブル)proc lifereg data=pbc; model Time*Status(0)=logBilirubin logProtime logAlbumin Age Edema;
Analysis of Maximum Likelihood Parameter Estimates
Parameter DF Estimate Standard Error
Chi-Square
Pr > ChiSq
Intercept 1 12.2155 1.4539 70.59 <.0001
logBilirubin 1 -0.5770 0.0556 107.55 <.0001
logProtime 1 -1.7565 0.5248 11.20 0.0008
logAlbumin 1 1.6694 0.4276 15.24 <.0001
Age 1 -0.0265 0.0053 25.35 <.0001
Edema 1 -0.6303 0.1805 12.19 0.0005
Scale 1 0.6807 0.0430
Weibull Shape 1 1.4691 0.0928
QUANTLIFEのプログラム
ods graphics on;
proc quantlife data=pbc log method=naplot=(quantplot survival) seed=1268;
model Time*Status(0)=logBilirubinlogProtime logAlbumin Age Edema
/quantile=(.1 .2 .3 .4 .5 .6 .75);
run;
分位点に対するパラメータ推定値
82
12.2
-0.58
-1.761.67
QUANTLIFEのパラメータ推定値
生存時間
を有意に低下
有意差なし
LIFEREGの推定値
QUANTLIFEのパラメータ推定値
83
-0.0265 -0.63
分位点によらず,回帰係数はほぼ一定加速モデルの妥当性が示唆
プロットする参照共変量 (平均値)
logBilirubin logProtime logAlbumin Age Edema
0.571493 2.369201 1.244156 50.741460 0.100478
plot=(survival)オプション
QUANTLIFEによる生存時間分布の予測
QUANTLIFEの利点
任意の%点に対して,特定の生存時間分布を
仮定しないで共変量の影響を評価,生存時間分布を予測
任意の%点に対する係数の一様性を評価することで加速モデルの妥当性を評価
(加速モデルでは任意の%点に対して
係数が一定)
85
参考文献Koenker, R. and Bassett, G. W. (1978), “Regression Quantiles,” Econometrica, 46, 33–50.12SAS Global Forum 2013 Statistics and Data Analysis
Koenker, R. and Geling, O. (2001), “Reappraising Medfly Longevity: A Quantile Regression Survival Analysis,”Journal of the American Statistical Association, 96, 458–468.
Peng, L. and Huang, Y. (2008), “Survival Analysis with QuantileRegression Models,” Journal of the American Statistical Association, 103, 637–649.
Portnoy, S. (2003), “Censored Regression Quantiles,” Journal of the American Statistical Association, 98, 1001–1012.
Lin, G. and Rodriguez,N.R. (2013), “Using the QUANTLIFE Procedure for Survival Analysis” SAS Global Forum 2013,Paper 421 86