차 례 - samsunghospital.comadvance.pdf · 2011 의학통계 교육 (고급) example1....
Post on 06-Feb-2018
226 Views
Preview:
TRANSCRIPT
● Analysis for Repeated measures data ……………… 1
● Survival analysis ………………………………………… 37
● SPSS사용법 배우기(고급) ………………………………… 73
차 례차 례
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (고급)
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (기초)
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (고급)
Analysis for Repeated measures data(반복 측정 자료 분석)
- 1 -
2011 의학통계 교육 (고급) ◀
ContentsContents
1. 들어가기에 앞서….2. 반복 측정 자료란?3. Repeated measures ANOVA & Mixed model4 Generalized estimating equation(GEE)4. Generalized estimating equation(GEE)
2
A l i fAnalysis for Repeated measures dataRepeated measures data
(반복 측정 자료 분석)
- 3 -
▶ 삼성서울병원 교육수련부/통계지원팀
2. 반복측정자료란(Repeated measures data?)
동일한 개체에 대하여 동일한 변수를 반복 요인수준 순서에 따라 2회 이상 반복 측정한 자료
개체 : 피험자, 동물, 세포, ….반복요인 : 시간, 농도, ….
4
1 들어가기에 앞서1. 들어가기에 앞서…
일한 피험자 대상 혈압 약 전후의 혈압을Ex) 동일한 피험자를 대상으로 혈압 약 복용 전후의 혈압을측정 (2회 반복 측정)
분석 방법Paired t-test, orWilcoxon’s signed rank test
← 반복 측정의 가장 간단한 Design
3
- 4 -
2011 의학통계 교육 (고급) ◀
Example1Example1
복압성 요실금 환자를(55세 이하, 55세 초과) 대상으로 술 후1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
반복 요인인 “시간” 순서대로스트레스 점수를 반복 측정스트레스 점수를 반복 측정
6
반 측정 자 의 징반복 측정 자료의 특징-> 동일변수에 대한 측정값들이 비 독립적
한 개체 내에서 동일변수에 대한 측정값이 두 번이상 측정이되어 있고, 동일한 개체에 대해 시간에 따라(혹은 실험 조건에따라) 반복 측정한 개체 내 자료는 서로 상관이 있음(the measures within subjects are correlated)
5
- 5 -
▶ 삼성서울병원 교육수련부/통계지원팀
앞의 자료를 이용하여 생각해 볼 수 있는 분석 가설:
- 연령이 (≤55, >55) 일정할 때, 시간에 따라 스트레스 점수가 다르다.(Within subjects effect) (time effect) Main
effect
- 시간이 일정할 때, 연령 두 군간(55세 이하, 초과) 스트레스 점수가다르다. (Between subjects effect) (age group effect)
effect(주 효과)
다 다 j g g p
- 시간에 따른 스트레스 점수 변화 양상이 두 연령군간에 (55세 이하, 초과) 다르다 (I t ti ff t(교호작용 효과) 검정)과) 다르다. (Interaction effect(교호작용 효과) 검정)
Cf) 반복 측정이 아닌 경우, 대개 between-subject effect 만이 관심 대상
8
→한 개체 내에서 스트레스 점수에 대한 측정값을 1개월, 3개월, 6개월, 9개월, 12개월 시점에서 측정(동일한 개체에 대해 시간에 따라 반복 측정) : 개체 내 자료는 서로 상관이 있음
7
- 6 -
2011 의학통계 교육 (고급) ◀
교호작용의 여러 형태
Blue line : 55세 이하d li 세 초과Red line : 55세 초과
�� �������� 3�� 6��)������3����6��)
�� ��������
10
교호작용 (Interaction)교호작용 (Interaction)
인 의 에 따라 인 의 효과가 달라지 것을 말함요인 A의 수준에 따라 요인 B의 효과가 달라지는 것을 말함(요인 A의 효과가 요인 B의 수준에 따라 달라지면 두 요인간교호 작용이 있다고 하고, 요인 A의 효과가 요인 B의 수준에따라서 달라지지 않으면 두 요인간의 교호 작용은 없다고 함)->Ex) 시간에 따른 효과가 그룹간(55세 이하 vs 초과) 달라지면시간과 그룹간에 교호 작용이 있다고 하고, 시간의 효과가그룹간에 다르다고 할 수 없으면 시간과 그룹간에 교호작용은없다고 함
9
- 7 -
▶ 삼성서울병원 교육수련부/통계지원팀
교호작용 검정을 위한논문 사용 example논문 사용 p
12
→→
time age(≤55, >55) age*time
A 효과 없음 효과 없음 효과 없음
B 효과 있음 효과 있음 효과 없음
C 효과 없음 효과 있음 효과 없음C 효과 없음 효과 있음 효과 없음
D 효과 있음 효과 없음 효과 있음
E 효과 있음 효과 있음 효과 있음
F 효과 있음 효과 있음 효과 있음
11
- 8 -
2011 의학통계 교육 (고급) ◀
Example1Example1
복압성 요실금 환자를(55세 이하, 초과) 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를 이용하여 스트레스 점수를 측정
반복 요인인 “시간” 순서대로 스트레스 점수(연속형 변수)를 5번 반복측정측정
14
3 �������� �������� ����� &3� �������� �������� ����� &����� ���������� �����
<<-연속형 자료인 outcome을 반복 측정했을 경우
13
- 9 -
▶ 삼성서울병원 교육수련부/통계지원팀
Green line: 55세 이하, Blue line: 55세 초과
16
Complete data without missing (N=16)Complete data without missing (N 16)
Outcome variable (Continuous type)Outcome variable (Continuous type): 스트레스 점수
Independent variables: age(55세 이하, 초과), time(개월)
15
- 10 -
2011 의학통계 교육 (고급) ◀
h d• Method :
Repeated measures ANOVA
18
가설:
- 연령군이 일정할 때, 시간에 따라 스트레스 점수가 다르다.(Within subjects effect) (time effect)(Within subjects effect) (time effect)
- 시간이 일정할 때, 연령 두 군간(55세 이하, 초과)
Main effect
(주 효과)
스트레스 점수가 다르다.(Between subjects effect) (age group effect)
- 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55세 이하, 초과) 다르다. (Interaction effect(교호작용 효과) 검정)초과) 다르다. (Interaction effect(교호작용 효과) 검정)
17
- 11 -
▶ 삼성서울병원 교육수련부/통계지원팀
분석 방법
정규성 가정 만족 : OK정규성 가정 만족 : OK →
R t d ANOVARepeated measures ANOVA →
th 구형성 검정 결과 h kthen, 구형성 검정 결과 check→
구형성 가정 만족하면 일변랑 분석구형성 가정 만족하면 – 일변랑 분석구형성 가정 만족하지 않으면- 다변량 분석,
Greenhouse-Geisser 방법으로 수정된 일변량 분석
20
Repeated measures ANOVARepeated measures ANOVA
가정가정- Outcome이 Normal Distribution(정규 분포)을 따라야 함
19
- 12 -
2011 의학통계 교육 (고급) ◀
구형성 가정 : O 일변량 분석
Repeated
measures Greenhouse-measures
ANOVA Geisser 방법
으로 수정된
구형성 가정 : X
수정된
일변량 분석
다변량 분석
22
구형성 (S h i it ) 가정 검사를 하는 이유구형성 (Sphericity) 가정 검사를 하는 이유
반복 처리간 상관이 동일함을 의미하는 복합 대칭성: 반복 처리간 상관이 동일함을 의미하는 복합 대칭성(compound symmetry)과 각 처리마다 처리내 분산들이 동일 함을 의미하는 등분산 l i 이 두 만족하는지일 함을 의미하는 등분산(equal variance)이 모두 만족하는지보기 위함←Mauchly's Test of Sphericity
• 구형성 가정이 만족 될 경우, 다변량 분석을 하면 처리구형성 가정이 만족 될 경우, 다변량 분석을 하면 처리효과의 차이를 감지해 내는 능력인 검정력이 떨어짐
21
- 13 -
▶ 삼성서울병원 교육수련부/통계지원팀
> 일변량 분석-> 일변량 분석
- ���� ��� �, ��� �� ���� ��� ���� � � ��
(P-value = 0.021)- ����������� ����������� ��) : ��� �� ���� �� ��
24
����������� ����������� ��) ��� �� ���� �� ����� �� � �� (55� ��, ��) ���� � � ��.(P-value = 0.506)
분석 결과분석 결과
형성 가정• 구형성 가정 test
• P-value > 0.05 ; 구형성 가정 만족
23
- 14 -
2011 의학통계 교육 (고급) ◀
���
P ����� < 0 0� ; ��� �� ���� ����P-����� < 0.0� ; ��� �� ���� ����,������������� ��������� ��� ���� �� �
26
- ��� ��할 �, �� � ��(55� ��, ��) ���� �수� ���고 할 수 �� (P value 0 048)고 할 수 ��. (P-value= 0.048)
25
- 15 -
▶ 삼성서울병원 교육수련부/통계지원팀
• 다변량 분석은 공분산 행렬에 아무런 가정이 없이도 가다변량 분석은 공분산 행렬에 아무런 가정이 없이 가능하지만 피험자의 수가 적은 경우 검정력이 매우 떨어짐. 따라서 구형성 가정이 만족이 안되더라도 아주 크게벗어나지 않는다면 어 정 의 수정을 거쳐 일변량 분벗어나지 않는다면 어느 정도의 수정을 거쳐 일변량 분석을 행할 수 있음>->
Greenhouse-Geisser, Huyng-Feldt 방법 등이 있음
28
다변량 분석 방법다변량 분석 방법
- Pillai의 트레이스(trace)Pillai의 트레이스(trace)- Wilks의 람다(lambda)- Hotelling의 트레이스g- …
←SPSS에서 default로 제공
27
- 16 -
2011 의학통계 교육 (고급) ◀
Missing data
�����
빈도 퍼센트 유효 퍼센트 누적퍼센트
1 21 21 9 21 9 21 9
유효
1 21 21.9 21.9 21.9
2 21 21.9 21.9 43.8
3 20 20.8 20.8 64.6유효
4 18 18.8 18.8 83.3
� 16 16.� 16.� 100.0
합계 96 100 0 100 0합계 96 100.0 100.0
30
(참고) Stress data with missing (N=21)에
Outcome variable
(참고) Stress data with missing (N 21)에Repeated measures ANOVA를 적용할 경우
Outcome variable: 스트레스 점수
Independent variables: age(55세 이하, 초과), time(개월)
29
- 17 -
▶ 삼성서울병원 교육수련부/통계지원팀
d• Repeated measures ANOVA : “complete data without missing” 로 분석
Reduced sample sizeSelection bias
32
Repeated measures ANOVA �� ��Repeated measures ANOVA �� ��(�� 명� : 16명 (subjects without missing))
다변량 검정b
효과 값 F 가설 자유도 오차 자유도 유의확률
Pillai의 트레590 3 950a 4 000 11 000 032
요인1
의 트레이스
.590 3.950a 4.000 11.000 .032
Wilks의 람다 .410 3.950a 4.000 11.000 .032
Hotelling의1 436 3 950a 4 000 11 000 032
Hotelling의트레이스
1.436 3.950a 4.000 11.000 .032
Roy의 최대근 1.436 3.950a 4.000 11.000 .032
Pillai의 트레 a
요인1 * age_1
Pillai의 트레이스
.284 1.090a 4.000 11.000 .408
Wilks의 람다 .716 1.090a 4.000 11.000 .408
Hotelling의1 Hotelling의트레이스
.396 1.090a 4.000 11.000 .408
Roy의 최대근 .396 1.090a 4.000 11.000 .408
31
- 18 -
2011 의학통계 교육 (고급) ◀
• Reponses : distances between well defined points: distances between well defined points
34
Example2Example2 (more complicated data with missing)
• How does craniofacial growth depend on testosteron production?
• Randomized experiment in which 50 male rats are prandomized to- Control (15 rats) , Low does (18 rats),
High does (17 rats)
• Treatment starts at the age of 45 daysg y• Measurements
: every 10 days ; from day 50
33
y y ; y
- 19 -
▶ 삼성서울병원 교육수련부/통계지원팀
• Missing (56%)
36
• Data
35
- 20 -
2011 의학통계 교육 (고급) ◀
가설가설: Age(days)에 따른 distance 변화 양상이 그룹간(control, low dose, high dose) 다른가
38
Rat profiles
Rats간에 age(days)에 따른 다양한 변화 pattern 이 존재에 g ( y )에 따른 다양 화 p 이 재-> much variability among rats
- various intercepti l f
37
- various slope for age
- 21 -
▶ 삼성서울병원 교육수련부/통계지원팀
Not all measurements available due to dropout: missing data 고려하여 분석 필요
Much variability among ratsy g: rat간 variability를 고려하여 분석 필요
Repeated measurements scheduled per rats.
: 고정된 time points에 따라 반복 측정된 자료를 다룸: 고정된 time points에 따라 반복 측정된 자료를 다룸
-> 개체 내 반복 측정된 자료간에 다양한상관구조(correlation structure)를 고려하여 분석 필요상관구조( )를 고려하여 분석 필요
40
석 방법• 분석 방법Repeated measures ANOVA ? ->
적절하지 않을 수 있음
Why?Missing due to dropout- Missing due to dropout
- No consideration of variability among rats - No consideration of various correlation structureNo consideration of various correlation structure
among time (age; days)
39
- 22 -
2011 의학통계 교육 (고급) ◀
Correlation structureCorrelation structure
• Correlation structure• Correlation structure– Specifies how the observations within a
subject are relatedsubject are related
• Typeyp– Unstructured– Compound symmetryCompound symmetry– Autoregressive AR(1)– ……
42
f dCf) Repeated measures ANOVA
- Include only subjects without missing observations- 반복 처리(시점)간 측정값들의 동일 상관구조 (동일 분산,
동일 공분산)이 가정된 분석동일 공분산)이 가정된 분석
41
- 23 -
▶ 삼성서울병원 교육수련부/통계지원팀
• Autoregressive AR(1) (1 )• Correlation between responses depends on the
i t l f ti b tinterval of time between responses– Farther apart responses => weaker correlation
O l 1 i !– Only 1 parameter to estimate!
⎛ ⎞11ρ
⎛ ⎞⎜ ⎟⎜ ⎟
2
11
ρρ ρ
⎜ ⎟⎜ ⎟⎜ ⎟3 2 1ρ ρ ρ⎜ ⎟⎝ ⎠
44
• Conpound symmetry( )– Any responses within the same subject has theAny responses within the same subject has the
same correlation– Simple (1 parameter to estimate)p ( p )
⎛ ⎞11ρ
⎛ ⎞⎜ ⎟⎜ ⎟1
1ρρ ρ
⎜ ⎟⎜ ⎟⎜ ⎟1ρ ρ ρ⎜ ⎟⎝ ⎠
43
- 24 -
2011 의학통계 교육 (고급) ◀
(정리) 반복 측정 자료에서 생각할 수 있는 문제
• Much variability between subjects• Missing data• Missing data• Various correlation structure of repeated measurements
←Mixed model
46
• Unstructured ( )All l ti ffi i t f t t k– All correlation coefficients free to take any valueE g– E.g.,
1⎛ ⎞10.3 1
⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟0.1 0.5 10 05 0 2 0 4 1⎜ ⎟⎜ ⎟⎝ ⎠0.05 0.2 0.4 1⎝ ⎠
45
- 25 -
▶ 삼성서울병원 교육수련부/통계지원팀
• 랜덤효과(random effect)
고정효과와는 달리 어떤 변수의 level이 모집단으로 부터 sampling되므로 샘플마다 이 요인의 level이 fixed되어 있지 않아 이 요인의효과가 어떤 분포를 가지는 효과효과가 어떤 분포를 가지는 효과(즉, 어떤 요인의 level이 모집단에서 sampling할 때 마다 변동될 수있어서 그 효과가 샘플마다 다를 수 있어 효과가 어떤 랜덤분포를가진다고 가정)
48
Mixed modelMixed model
d d l• Mixed model - 고정효과(fixed effect)와 랜덤효과(random effect)로 이루어진 모형
• 고정 효과(fixed effect) - 어떤 요인의 level이 샘플과 모집단에서 똑같이 고정되어 있는 요인의
효과(즉 모집단에서 이 요인의 level이 sampling되는 것이 아니므로 샘플마(즉, 모집단에서 이 요인의 level이 sampling되는 것이 아니므로 샘플마다 이 요인의 level은 동일하고 샘플마다 이 요인의 효과는 동일하다고간주함)
(ex) age(55세 초과, 이하), 성별, 처리 유무, 그룹, …
47
- 26 -
2011 의학통계 교육 (고급) ◀
l l d d lExample Analysis using mixed model
Ex1) 900명의 환자를 대상으로 5개의 medical center마다 180명의Ex1) 900명의 환자를 대상으로 5개의 medical center마다 180명의혈압을 조사한 경우, 성별이 일정할 때(보정하여) center간 혈압이다른지 보고 싶다면, 성별을 고정효과로, center를 랜덤효과로다른지 싶다면, 성별을 고정효과 , 를 랜덤효과고려하여 분석 할 수 있음
Ex2) 100명의 환자를 대상으로 피험자마다 혈압을 1주일 간격(fixed level)으로 3번 반복 측정할 경우, 3시점 간에 혈압이 다른지 보고자 한다면, 시점을 고정 효과로, 피험자를 랜덤효과로 고려하여 분석할 수 있음시점을 정 과 , 피험자를 랜덤 과 려하여 분석할 수 있음
50
(ex1) medical center모집단에 1000개의 medical centers가 있다고 가정하자. 이때,샘플로 20개의 medical centers만을 임의로 추출할 경우 (100개샘플로 20개의 medical centers만을 임의로 추출할 경우 (100개level중 20개의 level을 sampling), 어떤 medical center가 추출되느냐에 따라 medical center effect가 달라지므로 이러한 medical 냐에 따라 가 라지 이러한center에 대한 효과는 어떤 랜덤분포를 갖는다고 가정함.
(ex2) 환자간 효과21명의 환자를 대상으로 1개월, 3개월, 6개월, 9개월, 12개월 마다스트레스 점수를 측정할 경우 21명의 환자는 모집단에서 임의로스트레스 점수를 측정할 경우, 21명의 환자는 모집단에서 임의로추출되었기 때문에 만약 환자간에 시간에 따른 변화양상이 다르다면 환자효과를 랜덤효과로 간주할 수 있음.
49
- 27 -
▶ 삼성서울병원 교육수련부/통계지원팀
Patients profiles
100
Patients profiles
60
80
20
40
0
1 2 3 4 5
P i �� ��� �� ��� 이 ��•Patient��, ��� �� ��� pattern 이 ��: due to Much variability between patients
•Missing data
•Various Correlation structure due to Repeated
52
pmeasurements scheduled per patient
In Stress Example1 (with missing)…p ( g)
������������� ��,���� ���� � � ���,�3�� 6�� 9�� ���� �� �����������3��, 6��,�9��,����� �� ������������������������
51
- 28 -
2011 의학통계 교육 (고급) ◀
Mixed model using gAR(1) correlation structure
54
분석 가설분석 가설시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에(55세 이하, 초과) 다르다.(Interaction effect(교호작용 효과) 검정)
→→Analysis using Mixed model
Random effect : patient effect: due to Much variability between patients y p
Fixed effect : age(55 , ), time
correlation structure : Ar(1)
53
- 29 -
▶ 삼성서울병원 교육수련부/통계지원팀
age가 일정할 때, 시간에 따라 stress 점수는 다르다고 할 수있으면 어느 시간 간에 다른가?있으면 어느 시간 간에 다른가?
시간에 대해 다중 비 검정 시 1개월을 R f시간에 대해 다중 비교검정 시 1개월을 Reference category로 지정(1개월와 비교했을 때 3개월, 6개월, 9개월, 12개월에서 stress 점수가 다른가를 검정)
56
• age*visit(interaction effect) ; P-value=0.493: 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간시간에 따른 레 점수 변화 양상은 연령 두 군간(55세 이하,초과) 다르다고 할 수 없음
• Age(55세 이하, 초과) ; P-value = 0.056: 시간이 일정할 때, age 두 군간 stress 점수는 다르다고시 이 일정할 때 g 두 점수 다 다할 수 없음
• time (5 시점) ; P-value = 0.014: age가 일정할 때, 시간에 따라 stress 점수는 다르다고할 수 있음
55
- 30 -
2011 의학통계 교육 (고급) ◀
참고: Bonferroni’ correction
h l l
참고: Bonferroni correction
When Multiple testing….
False positive error 증가(due to positive correlation between tests of comparisons)-> P-value 보정 필요
HOW? P-value * (# of multiple testings)
58
3개월 – 1개월 : P-value = 0.11557.. * 4 = 0.4626개월 1개월 P l 0 01774 * 4 0 0716개월 – 1개월 : P-value = 0.01774.. * 4 = 0.0719개월 – 1개월 : P-value = 0.00066.. * 4 = 0.00312개월 1개월 P l 0 00642 * 4 0 02612개월 – 1개월 : P-value = 0.00642.. * 4 = 0.026
(P-values are corrected by Bonferroni’s method due to multiple testing)
57
- 31 -
▶ 삼성서울병원 교육수련부/통계지원팀
• 범주형 outcome이 반복 측정된 경우범주형 이 반복 측정된 경우
• 범주형 outcome type범주형 yp- binary- ordinalordinal- nominal
60
4 Generalized estimating4. Generalized estimating equation(GEE)q ( )
59
- 32 -
2011 의학통계 교육 (고급) ◀
자료 입력
62
Ex2) 복압성 요실금 환자를 대상으로 술 후 1개월 3개월Ex2) 복압성 요실금 환자를 대상으로 술 후 1개월, 3개월,6개월, 9개월, 12개월 마다 증상의 스트레스 설문지를이용하여 스트레스 완화 여부를 측정이용하여 스트레스 완화 여부를 측정
Outcome type : 범주형 자료Outcome type : 범주형 자료
Outcome variable: 1개월, 3개월, 6개월, 9개월, 12개월 마다 스트레스 완화 여부(binary data) 측정
Independent variable: 연령 (55세 이하, 초과): 연령 (55세 이하, 초과)
61
- 33 -
▶ 삼성서울병원 교육수련부/통계지원팀
l l d→ Analysis using Generalized estimating equation (GEE)
64
가설: ① 시간에 따른 스트레스 완화 비율의 변화 양상은 연령 두① 시간에 따른 레 완화 비율의 변화 양상은 연령 두
군간 (55세 이하, 초과) 다르다.(interaction effect(교호작용) 검정)
② 시간이 일정할 때, 연령 두 군간 스트레스 완화 비율은다르다. (연령에 대한 main effect(주효과) 검정)
② 연령이 일정할 때, 시간에 따른 스트레스 완화 비율은다르다. (시간에 대한 main effect(주효과) 검정)다 다 (시간에 대한 (주 과) 검정)
63
- 34 -
2011 의학통계 교육 (고급) ◀
• Age(55세 이하, 초과) ; P-value = 0.414: 시간이 일정할 때, age 두 군간 stress 완화 비율이 다르다 할 수 없음다고 할 수 없음
시점 l• time (5 시점) ; P-value = 0.849: age가 일정할 때, 시간에 따라 stress 완화 비율이 다르다고 할 수 없음다고 할 수 없음
66
age*visit(interaction effect) ; P-value=0.009�간� �� ���� �� ��� �� ��� �� � �간 세 �� 과 다 다 할 수 ��간 (55세 ��,초과) 다르다고 할 수 ��
65
- 35 -
▶ 삼성서울병원 교육수련부/통계지원팀
l 이 반 인에 의해 회 이상 반2. Categorical outcome이 반복 요인에 의해 2회 이상 반복측정된 경우
① GEE(G li d ti ti ti ) 이용① GEE(Generalized estimating equation) 이용
② GLMM(G li d Li i d d l)을 이용하여② GLMM(Generalized Linear mixed model)을 이용하여random effect와 fixed effect를 고려할 수도 있음
68
Summary
이 반 인에 의해 회 이상
Summary
1. Continuous outcome이 반복 요인에 의해 2회 이상반복 측정된 경우
① Repeated measures ANOVA 적용→ 결측값이 있는 case는 분석에서 제외됨
② 통계적 방법(imputation)에 의해 결측치를 impute ② 통계적 방법( p )에 의해 결측치를 p
③ Mixed model을 이용한 분석 적용③ Mixed model을 이용한 분석 적용
②와 ③ 적용의 경우에도 결측치 비율이 너무 큰 경우에②와 ③ 적용의 경우에도 결측치 비율이 너무 큰 경우에는 해당 시점을 분석에서 제외함이 바람직함.
67
- 36 -
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (기초)
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (고급)
Survival analysis(생존 분석)
- 37 -
2011 의학통계 교육 (고급) ◀
ContentsContents
l l1. Survival analysis ?2. Survival data 구조 및 입력방법3. 생존율 및 생존 곡선 추정4. 그룹간 생존곡선비교5. 특정시점에서 그룹간 생존율 비교6. Event 발생에 대한 위험인자 분석7. Time dependent Cox regression model8. More than one event
2
Survival analysis(생존 분석)
- 39 -
▶ 삼성서울병원 교육수련부/통계지원팀
d k l l• Censoring : don’t know survival time exactly
• Why censor ?- Study ends - Lost f/u- Withdrawals
4
1 Survival analysis1. Survival analysis
l d• Data: Incomplete data
• Incomplete?- 관심 있는 사건에 대한 정보가 완전하지 못함<- censored data
3
- 40 -
2011 의학통계 교육 (고급) ◀
Time to event outcomes: censoringExample of overall survival, over time
Time to event outcomes: censoringp
Time 0 STUDY END
6
Time to event outcomes: censoringExample of overall survival, over time
Time to event outcomes: censoringp
Time 0
5
- 41 -
▶ 삼성서울병원 교육수련부/통계지원팀
Time to event outcomes: censoring: More realistic clinical setting Time to event outcomes: censoring
Patients enter at various time points and are followeduntil a common point in time
Time 0 STUDY ENDTime 0 STUDY END
8
Time to event outcomes: censoringExample of overall survival, over time
Time to event outcomes: censoringp
Time 0 STUDY END
7
- 42 -
2011 의학통계 교육 (고급) ◀
Time to event outcomes: censoringTime to event outcomes: censoring: even More realistic
Time 0 STUDY ENDTime 0 STUDY END
10
Time to event outcomes: censoring: More realistic clinical setting Time to event outcomes: censoring
Patients enter at various time points and are followeduntil a common point in time
Ti 0 STUDY ENDTime 0 STUDY END
9
- 43 -
▶ 삼성서울병원 교육수련부/통계지원팀
Incomplete Data가 생기는 원인
연 시점 인한 절단
Incomplete Data가 생기는 원인
• 연구종료 시점으로 인한 중도 절단
• 연구참여 거부나 이사 등의 이유로 더 이상 추적이 불가능해서 발생하는 중도 절단
• 환자 보호 등의 이유로 drop out 또는 withdrawal이 발생하는 중도 절단생하는 중도 절단
12
<-Incomplete data
11
- 44 -
2011 의학통계 교육 (고급) ◀
( ) MACE( j d di t ) ft I l t d(ex) MACE(major adverse cardiac events) after Isolated Aortic Valve Replacement in Patients with severe Aortic Stenosis (A B C D)Aortic Stenosis (A, B, C, D)
A (5mon) B (24mon)B (24mon) C (12mon)D (9mon)( )
(적색: MACE, 녹색: non-MACE)
14
중도 절단된 자료 (즉, incomplete data) 분석에는 기존의
통계 분석방법을 적용 할 수 없음
13
- 45 -
▶ 삼성서울병원 교육수련부/통계지원팀
Subject 관찰기간 MACE 여부 6개월째Subject 관찰기간 MACE 여부 6개월째MACE 여부
A 5 MACEat 5mon
MACE
B 24 Non-MACE Non-MACE
C 12 MACEt 12
Non-MACEat 12mon
D 10 Non-MACE Non-MACE
MACE rateC ateat 5Mon
= ¼
Completed tdata
일반적 방법사용 가능
16
Subject 관찰기간 MACE 여부Subject 관찰기간 MACE 여부
A 5 MACEat 5mon
B 24 Non-MACE
C 12 MACEt 12at 12mon
D 10 Non-MACE
15
- 46 -
2011 의학통계 교육 (고급) ◀
Subject 관찰기간 MACE 여부 6개월째 12개월째 MACE free timeSubject 관찰기간 MACE 여부 6개월째MACE 여부
12개월째MACE 여부
MACE free time
A 5 MACEat 5mon
MACE MACE 5
B 24 Non-MACE Non-MACE Non-MACE ? (>24)
C 12 MACEt 12
Non-MACE MACE 12at 12mon
D 9 Non-MACE Non-MACE ? ? (>9)
MACE rate MACE rate MACE free timeC ateAt 6Mon
= ¼
C ateat 12Mon
= ?
C ee t e= ?
Completed t
Incompleted t
Incompleted tdata data data
일반적 방법사용 가능
일반적 방법사용 불가
일반적 방법사용 불가
Subject B: censored at 24 mon after replacement
18
j pSubject D: censored at 9 mon after replacement
Subject 관찰기간 MACE 여부 6개월째 12개월째Subject 관찰기간 MACE 여부 6개월째MACE 여부
12개월째MACE 여부
A 5 MACEat 5mon
MACE MACE
B 24 Non-MACE Non-MACE Non-MACE
C 12 MACEt 12
Non-MACE MACEat 12mon
D 9 Non-MACE Non-MACE ?
MACE rate MACE rate C ateAt 6Mon
= ¼
C ateat 12Mon
= ?
Completed t
Incompleted tdata data
일반적 방법사용 가능
일반적 방법사용 불가
17
- 47 -
▶ 삼성서울병원 교육수련부/통계지원팀
2 Data 구조 및 입력2. Data 구조 및 입력(in Survival analysis)y
• Time to event
• EventEvent (event 여부; (ex) event 발생=1, censored=0)
20
Survival analysis
19
- 48 -
2011 의학통계 교육 (고급) ◀
Data 입력
Ex) MACE(major adverse cardiac events) after Isolated Aortic Valve
Data 입력
Ex) MACE(major adverse cardiac events) after Isolated Aortic Valve Replacement in Patients with severe Aortic Stenosis (A, B, C, D)
Event = MACE after Isolated Aortic Valve ReplacementTime = Time to cardiac event after Isolated Aortic ValveTime = Time to cardiac event after Isolated Aortic Valve
Replacement
22
E t (사건) 정의 Ti t t 정의Event (사건) 정의 Time to event 정의
D h f O 시작시점 정의• Death after Op• Recurrence after Tx• Response after Tx
• 시작시점 정의- 수술 후 재발까지- 첫번째 방사선 치료 후Response after Tx
• Progression after first tx• …
첫번째 방사선 치료 후재발까지
- …
21
- 49 -
▶ 삼성서울병원 교육수련부/통계지원팀
id replacement date
Last F/U date Event 발생 여부(censoring 여부)
Timedate (censoring 여부)
1: MACE, 0:censored
(Last F/U date– Op date)
1 2008. 1. 21 2008. 6. 20(MACE 발생)
1 5
2 2007 12 4 2009 12 3 0 242 2007. 12. 4 2009. 12. 3(최종 F/U date)
0 24
3 2008. 3. 26 2009. 3.25 1 12(MACE 발생)
4 2008. 8. 31 2009. 05. 30(최종 F/U date)
0 9(최종 / )
24
id replacement date
Last F/U datedate
1 2008. 1. 21 2008. 6. 20(MACE 발생)
2 2007. 12. 4 2009. 12. 3(최종 F/U date)
3 2008. 3. 26 2009. 3.25(MACE 발생)
4 2008. 8. 31 2009. 06. 30(최종 F/U date)
23
- 50 -
2011 의학통계 교육 (고급) ◀
Kaplan Meier methodKaplan-Meier method
A di d b b d i l i• Ascending order about observed survival time• Product-limit estimator of Kaplan-Meier method
Ex) 10 patients with lung cancer : After surgery, relapse 조사 (n=10)(relapse: 3.0, 6.5, 10, 12, 15), (censored : 8.4, 4.0, 5.7, 10.0)
Time to relapse
Rank r (n-r)/(n-r+1) Survival rate
3 0 1 1 9/10 (9/10) = 0 93.0 1 1 9/10 (9/10) = 0.9
4.0+ 2 - - -
5.7+ 3 - - -
6.5 4 4 6/7 (9/10)*(6/7) = 0.77
6.5 5 5 5/6 (9/10)*(6/7) *(5/6) = 0.64
26
… … … … …
15.0 10 10 0 0
3 생존율 및 생존곡선 추정3. 생존율 및 생존곡선 추정
생 율 추정• 생존율 추정- Kaplan-Meier 방법
각 Event 발생 시점에서의 생존율 산출- 각 Event 발생 시점에서의 생존율 산출
생존곡선 추정• 생존곡선 추정- 추정된 생존율을 이어 만든 곡선
25
- 51 -
▶ 삼성서울병원 교육수련부/통계지원팀
생 선이 할 때• 생존곡선이 cross할 때- 전체 기간에서 그룹간 생존곡선을 비교하는 것은 큰 의미가 없음→ Time dependent Cox regression 적용 stratified Cox regression→ Time dependent Cox regression 적용, stratified Cox regression
28
4 그룹간 생존곡선 비교4. 그룹간 생존곡선 비교
k• Log-rank test- 그룹간 생존곡선의 차이가 시간에 따라 크게 변하지 않는 경우 사용
(각 시점 별 동일한 가중치 부여)(각 시점 별 동일한 가중치 부여)(가정: 각 인자가 MACE 발생에 미치는 영향이 시간에 따라 변하지 않는다. )
• Breslow test- Event가 초기에 많이 발생하므로 초기에 가중치를 줄 때 사용
• … 27
- 52 -
2011 의학통계 교육 (고급) ◀
MACE free rate 추정 Kaplan-Meier 방법 적용
MACE free rate MACE free rate의 SE
30
E ) M l i l di 를 갖는 ST l i di lEx) Multi-vessel disease를 갖는 non-ST-elevation myocardial infarction 환자들을 대상으로 single vessel 만 치료한 군과 multi vessel 를 치료한 두 군간에 MACE free curve 비교
Variable : G (M l i l 1 i l l 2)Group (Multi vessel=1, single vessel=2)Time to MACE(month)Status(MACE ; MACE=1 censored=0)Status(MACE ; MACE=1, censored=0)
29
- 53 -
▶ 삼성서울병원 교육수련부/통계지원팀
5M MACE f ?5Mo MACE free rate ?
………..
0.922
Group=1: 5Mo MACE free rate = 약 92%
………..0.906
time=5.0
time=4 767 time=5 057
32
time=4.767 time=5.057
시간 =4.767Mo , S(4.767)=0.922 , se=0.031시간 =5.057Mo , S(5.057)=0.906 , se=0.034
31
- 54 -
2011 의학통계 교육 (고급) ◀
Group간 MACE free curve 비교p간 비교-> Log-rank test
Results
P-value = <.001 ; Group간 MACE free curve는 다르다고 할 수 있음Group간 MACE free curve는 다르다고 할 수 있음
34
5Mo MACE free Curve5Mo MACE free Curve
33
- 55 -
▶ 삼성서울병원 교육수련부/통계지원팀
E ) l i l di 를 갖는 ST l i di lEx) multi-vessel disease를 갖는 non ST elevation myocardial infarction 환자들을 대상으로 single vessel 만 치료한 군과 multi vessel 를 치료한 두 군 간에 5 개월 째 MACE free rate 비교
Variable : G (M l i l 1 i l l 2)Group (Multi vessel=1, single vessel=2)Time to MACE(month)Status(MACE ; MACE=1 censored=0)Status(MACE ; MACE=1, censored=0)
36
5 특정 시점에서 룹간 생존율 비5. 특정 시점에서 그룹간 생존율 비교
• 가설: 시점 t에서 생존율이 두 그룹간 다르다.
• 두 그룹의 시점 t에서 추정된 생존율이 각각 S1(t)와 S2(t)라 할 때,
을 계산한 후,
표준정규분포에서 |Z|이상일 확률을 구하면 이 값이p value (여기서 SE1과 SE2는 S1(t)와 S2(t)의 표준오차)p-value (여기서 SE1과 SE2는 S1(t)와 S2(t)의 표준오차)
35
- 56 -
2011 의학통계 교육 (고급) ◀
~~~~~~
G 2 ( i l l)
~~~
Group=2 (single vessel): 5Mo – MACE free rate = 0.634, se=0.033
~~~
38
Group=1 (multi vessel): 5Mo - MACE free rate = 0.922, se=0.031
37
- 57 -
▶ 삼성서울병원 교육수련부/통계지원팀
6. Event 발생에 대한 위험인자분석(다른 인자 보정 후)
Ex) Multi-vessel disease를 갖는 non ST elevation myocardial infarction 환자들을 대상으로 single vessel로 치료한 후, age가 일정g g할 때(보정하여) Lesion type간 MACE(major adverse cardiac events) 발생 위험율이 다른지 보고자 함
Variable :Age(year)g ylesion type (1, 2, 3, 4)Time to MACE(month)
j d di dStatus(MACE(major adverse cardiac events); MACE=1, censored=0)
40
두 군간 5개월 MACE free rate의 비교두 군간 5개월 MACE free rate의 비교
• 가설: 두 군간 5개월 MACE free rate이 다르다• 가설: 두 군간 5개월 MACE free rate이 다르다.
group=1: 5Mo MACE free rate=0.922 (SE=0.031)g pgroup=2: 5Mo MACE free rate=0.634 (SE=0.033)
- 엑셀 칸에 =NORMDIST(6.361,0,1,TRUE)를 입력하고enter하면 <.999가 산출됨
- P-value = 2*(1-<.999)=<.0001각 군의 5Mo MACE free rate과 SE를 이용한 Z-test
39
- 58 -
2011 의학통계 교육 (고급) ◀
l l h d d lAnalysis using Cox proportional hazards model(MACE 발생에 대한 위험인자 분석 (다른 인자 보정 후))
:가정- 각 인자가 MACE 발생에 미치는 영향이 시간에 따라 변하지 않는다각 인자가 MACE 발생에 미치는 영향이 시간에 따라 변하지 않는다
(독립변수의 효과는 시간에 관계 없이 일정하다)(=Proportional hazard(PH) 가정)
42
41
- 59 -
▶ 삼성서울병원 교육수련부/통계지원팀
Hazard ratio(HR)Hazard ratio(HR)
HR i h i f h d• HR is the ratio of two hazard rates.
• A measure of association between the outcome variable and anA measure of association between the outcome variable and an independent variable in Cox regression
• The hazard ratio is expressed in terms of an exponential of a regression coefficient in Cox regression model.
• If independent variable with more than two categories (ex; lesion (1, 2, 3, 4)), calculate more than one HR -> (ex; 1 – 2, 1 – 3, 1 – 4, 2 – 3, 2 – 4, 3 – 4)
Cf) H d t i th i t t f t (diffi ltCf) Hazard rate is the instaneous rate for event occurrence. (difficult for practical interpretation)
44
ResultResult방정식의 변수
����B)에 대한B 표준오차 �al� 자유도 유의확률 ����B)
����B)에 대한95.0� ��
하한 상한lesion 36 98 3 00 0 000lesion 36.98 3.00 0.000
lesion�1) -2.86 1.01 8.02 1.00 0.000 0.06 0.01 0.�1
lesion�2) -1.38 0.28 23.8� 1.00 0.000 0.25 0.15 0.��
lesion�3) -0 82 0 20 16 �9 1 00 0 000 0 �� 0 30 0 65lesion�3) 0.82 0.20 16.�9 1.00 0.000 0.�� 0.30 0.65
age 0.03 0.01 12.00 1.00 0.000 1.03 1.01 1.05
Lesion 4 군간에 MACE 발생 위험율은 다르다고 할 수 있다Lesion 4 군간에 MACE 발생 위험율은 다르다고 할 수 있다. (P-value = <.001)
l i (1) 1 4 P l 0 001 X 3 001lesion(1): 1 vs 4 ; P-value = < 0.001 X 3 = <.001lesion(2): 2 vs 4 ; P-value = < 0.001 X 3 = <.001lesion(3): 3 vs 4 ; P-value = < 0.001 X 3 = <.001
43
(P-values were corrected by Bonferroni’s method due to multiple testing)
- 60 -
2011 의학통계 교육 (고급) ◀
• Note 1: HR ≠ OR, HR ≠ RR (Relative Risk)
N t 2 통계적 유의성은 HR 크기가 아니라 P l 로 해석• Note 2: 통계적 유의성은 HR 크기가 아니라 P-value로 해석
• Note 3: P>0 05 95% CI for HR includes HR=1 0Note 3: P>0.05 95% CI for HR includes HR 1.0
• Note 4: 범주형 독립변수의 경우,어느 범주에 속한 피험자 중에 event가 발생한 피험자가한 명도 없다면 분석이 불가능 함( ) l i 2 4간에 위험율이 다른지 검정 할 때(ex) lesion 2 vs 4간에 위험율이 다른지 검정 할 때, lesion 2에 속한 피험자 중에 event가 발생한 피험자가한 명도 없다면 분석이 불가능 함)한 명도 없다면 분석이 불가능 함)
46
Ex) Hazard ratio for lesion (2 vs 4)) ( )
Hazard ratio(HR)= (hazard in lesion 2) / (hazard in lesion 4)
If lesion(II vs IV) is a risk factorIf lesion(II vs IV) is a risk factor(hazard in lesion 2) ≠ (hazard in lesion 4) → HR ≠ 1
If lesion(II vs IV) is not a risk factor(hazard in lesion 2) = (hazard in lesion 4) → HR = 1
45
- 61 -
▶ 삼성서울병원 교육수련부/통계지원팀
Proportional hazard(PH) 가정check
h l h(1) Graphical approach- Survival graph
log ( log (survival)) graph- log (-log (survival)) graph
(2) Statistical test(2) Statistical test
48
fCf)• RR = the ratio of risks• OR = the ratio of odds (logistic regression)• HR = the ratio of hazard rates (Cox regression)
47
- 62 -
2011 의학통계 교육 (고급) ◀
② lesion간의 log(-log (survival)) graph 비교
50
lesion- PH 가정 check: Graphical approach
① lesion간의 Survival graph 비교
49
- 63 -
▶ 삼성서울병원 교육수련부/통계지원팀
상관계수
lesion(1) lesion(2) lesion(3) age
상관계수 -.966** -.558** -.226* -.103
Spearman의 rho
Month 유의확률(양측 .000 .000 .011 .251
N 125 125 125 125
52
lesion- PH 가정 check; Statistical test
h f ld d l l d• Schoenfeld residual (Harrel and Lee(1986))
Step1
각 독립변수의 partial residual을 Cox regression을 이용하여 계산
Step2
Event=1인 피험자를 대상으로 time과 각 독립변수의 partialEvent=1인 피험자를 대상으로 time과 각 독립변수의 partial
residual간 상관 분석
51
- 64 -
2011 의학통계 교육 (고급) ◀
7 Time dependent Co regression7. Time dependent Cox regression방정식의 변수
Exp(B)에 대한 95 0%
B 표준오차 Wald 자유도 유의확률 Exp(B)
Exp(B)에 대한 95.0% CI
하한 상한
age 0.03 0.01 10.87 1.00 0.00 1.03 1.01 1.05age 0.03 0.01 10.87 1.00 0.00 1.03 1.01 1.05
lesion 31.57 3.00 0.00
lesion(1) -4.13 2.37 3.04 1.00 0.08 0.02 0.00 1.67
lesion(2) -2 70 0 62 18 81 1 00 0 00 0 07 0 02 0 23lesion(2) 2.70 0.62 18.81 1.00 0.00 0.07 0.02 0.23
lesion(3) -1.60 0.37 18.39 1.00 0.00 0.20 0.10 0.42
T_COV_*lesion 10.15 3.00 0.02
T_COV_*lesion(1) 0.27 0.33 0.65 1.00 0.42 1.31 0.68 2.51
T_COV_*lesion(2) 0.29 0.10 7.84 1.00 0.01 1.34 1.09 1.64
T_COV_*lesion(3) 0.20 0.08 6.72 1.00 0.01 1.22 1.05 1.42
54
_ _ ( )
PH 가정 check 결과PH 가정 check 결과
L i 이 MACE 발생에 미치는 영향이 시간에 따라 변한다• Lesion이 MACE 발생에 미치는 영향이 시간에 따라 변한다
→
Cox regression 적용 불가
Time-dependent Cox regression analysis 적용
53
- 65 -
▶ 삼성서울병원 교육수련부/통계지원팀
HR f l i (2 4( f)) th f ll ti• HR for lesion (2 vs 4(=ref)) over the follow-time
time HR
1 0.089815 2.51 0.089815
2 0.120032
3 0.160414
4 0.214381
5 0.286505 1.5
2
6 0.382893
7 0.511709
8 0.683861
9 0.913931 0.5
1
10 1.221403
11 1.632316
12 2.1814720
1 2 3 4 5 6 7 8 9 10 11 12
<-HR(t) = exp( 2 7*(1 0)+0 29* (1*t 0*t)) = exp( 2 7+0 29t)HR(t) = exp(-2.7 (1-0)+0.29 (1 t-0 t)) = exp(-2.7+0.29t)
56
• Age가 일정할 때 lesion이 시간에 따라 MACE 발생 위험에 미치는• Age가 일정할 때, lesion이 시간에 따라 MACE 발생 위험에 미치는영향이 lesion간에 다르다고 할 수 있다. (P-value =0.02)
- Age가 일정할 때, lesion 2이 시간에 따라 MACE 발생 위험에미치는 영향이 lesion 4와 다르다고 할 수 있다미치는 영향이 lesion 4와 다르다고 할 수 있다. (P-value =0.01*3=0.03)
- Age가 일정할 때, lesion 3이 시간에 따라 MACE 발생 위험에미치는 영향이 lesion 4와 다르다고 할 수 있다. (P-value =0.01*3=0.03)
(P values were corrected by Bonferroni’s method due(P-values were corrected by Bonferroni s method due to multiple testing)
55
- 66 -
2011 의학통계 교육 (고급) ◀
8 More than one e ent
참
8. More than one event
(참고)• More than one event may be considered
?
58
number status month lesion age70 0 9.5 2 56.436 0 9 9 2 56 4
lesion=4일 때 보다 lesion=2일 때, 시간이 지남에 따라 event가 더 많이 36 0 9.9 2 56.4
99 0 10.5 2 48.531 1 10.5 2 41.651 1 10.5 2 52.1
시간이 지남에 따라 event가 더 많이발생하고 있음을 탐색적으로도 알 수있음
93 0 10.7 2 36.534 0 10.8 2 52.145 0 11.0 2 41.824 1 11 2 2 44 524 1 11.2 2 44.525 0 11.3 2 45.129 0 12.3 2 63.943 0 12.5 2 48.9
number status month lesion age85 1 9.2 4 47.221 0 9 4 4 64 2
43 0 12.5 2 48.9
21 0 9.4 4 64.2112 1 9.4 4 55.511 1 10.3 4 53.783 0 11.1 4 56.071 0 11.5 4 48.842 0 12.2 4 33.740 0 12.2 4 46.732 0 12 4 4 54 0
57
32 0 12.4 4 54.0
- 67 -
▶ 삼성서울병원 교육수련부/통계지원팀
Competing Risks survival analysisCompeting Risks survival analysis
• 경쟁 위험(Competing Risk)
- 흔히 환자는 ‘실제 우리가 관심을 가지는 사건’ 이외의 사건을흔히 환자는 실제 우리가 관심을 가지는 사건 이외의 사건을경험하게 된다. (2개의 이상의 사건)
- 이때, 관심 대상인 사건의 확률은 다른 사건의 발생으로 인하여 변화한다.
Cf) This situation contrasts with the topic of recurrent event (subjects could experience more than one event of a given type)
60
Recurrent event survival analysisRecurrent event survival analysis
• Recurrent events
– Outcome events that may occur more than once over theOutcome events that may occur more than once over the follow-up time for a given subject.
Ex1) Repeated heart attacks-coronary patients
Ex2) Multiple relapse from remission – leukemia patientsp p p
Ex3) Recurrence of tumors - bladder cancer patients
59
- 68 -
2011 의학통계 교육 (고급) ◀
l 의 k인 l l d• Disease relapse의 competing risk인 transplant related morality (TRM)을 어떻게 처리할 것인가 ?
62
• Allogeneic hematopoietic stem cell transplantation (HSCT) Study- event of interest : disease relapse
-> BUT, disease relapse 이외에 mortality related to complications
of transplantation 가 발생할 수 있음
61
- 69 -
▶ 삼성서울병원 교육수련부/통계지원팀
(비교) KM vs CR(비교) KM vs CR
64
l kAnalysis using Competing risk
63
- 70 -
2011 의학통계 교육 (고급) ◀
• site=2에 속한 피험자가 각각 2명으로 너무 작음. 의 경 가 발생한 사람 아 없• site=2의 경우 death가 발생한 사람은 아무도 없음.
> 이런 자료 구조의 경우-> 이런 자료 구조의 경우…
• ��-자료를 더 모으고, 임상적으로 합칠 수 있는 범주가있다면 합쳐서 분석만일 자료를 더 모으기 어렵다면 무리하게 분석을-만일, 자료를 더 모으기 어렵다면 무리하게 분석을수행하기 보다는 descriptive하게 기술
66
주의 사항 1주의 사항 1Site (1=Upper T 2=Mid T 3=Lower T 4=Main) 간에 survival curve 비교 검정 시비교 검정 시
65
- 71 -
▶ 삼성서울병원 교육수련부/통계지원팀
SummarySummaryG l h d S i l d l iGeneral method Survival data analysis
Summary of data Descriptive statistics• mean, variance
Descriptive statistics• Survival rate
• median, inter quartile range (IQR)
• Median survival time
Tests for K independent Parametric method Parametric methodTests for K independent samples
Parametric method• t-test• One-way ANOVA
Parametric method• Likelihood ratio test(LRT)
Nonparametric methodNonparametric method• Mann-Whitney test
p• Log-rank test
• Kruskal-Wallis test
Regression Multiple linear regression
Cox regressionTime dependent Cox g
Logistic regressionp
regression67
- 72 -
●●● 삼성서울병원 교육수련부 / 통계지원팀 ●●●
2011 의학통계 교육 (고급)
SPSS사용법 배우기(고급)
- 73 -
2011 의학통계 교육 (고급) ◀
��������
반복측정자료 분석반복측정자료 분석
- Repeated measures ANOVA (Ex1-1)- Analysis using Mixed model (Ex1-2)Analysis using Mixed model (Ex1 2)- Analysis using Generalized estimating
equation (GEE) (Ex2)q ( ) ( )
생존분석
- Survival rate estimation & Log-rank test(Ex3-1)- Cox regression analysis (Ex3-2)- Time dependent Cox regression analysis
(Ex3-2)
2
SPSSSPSSSPSSSPSS(( ))(( ))
- 75 -
▶ 삼성서울병원 교육수련부/통계지원팀
가설: - 시간에 따른 스트레스 점수 변화 양상은 연령 두 군간에 (55시간에 따른 레 점수 변화 양상은 연령 두 군간에 (
세 이하, 초과) 다르다. (교호작용 효과 검정)- 연령군이 일정할 때, 시간에 따라 스트레스 점수가 다르다. - 시간이 일정할 때, 연령 두 군간에 스트레스 점수가 다르다.
4
Example 1Example 1--1 1 Example 1Example 1--1 1 (Repeated measures ANOVA)(Repeated measures ANOVA)
Ex1) 복압성 요실금 환자(≤55, >55)를 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스설문지를 이용하여 스트레스 점수를 측정id age age_1 stress_score.1 stress_score.2 stress_score.3 stress_score.4 stress_score.5
62 57 1.00 81 78 60 77 782,083 56 1.00 67 77 70 77 792,166 57 1.00 50 62 70 77 803,504 58 1.00 77 80 73 77 704 755 53 0 00 76 60 70 71 734,755 53 0.00 76 60 70 71 736,039 61 1.00 66 70 75 80 708,523 55 0.00 80 88 77 75 808,792 56 1.00 55 69 73 73 7011,973 55 0.00 69 67 70 77 8012 655 53 0 00 75 77 75 80 8812,655 53 0.00 75 77 75 80 8813,156 57 1.00 68 70 75 77 6013,161 55 0.00 75 77 80 88 7014,922 56 1.00 67 70 76 77 8015,229 57 1.00 69 67 80 81 8817,743 55 0.00 81 84 85 80 77
3
,20,232 54 0.00 73 70 77 80 77
- 76 -
2011 의학통계 교육 (고급) ◀
Method :
Repeated measures ANOVA
6
N=16 (complete data without missing)N=16 (complete data without missing)
Outcome variable (Continuous type)Outcome variable (Continuous type): 스트레스 점수
Independent variable: age(55세 이하, 초과), time(개월)
5
- 77 -
▶ 삼성서울병원 교육수련부/통계지원팀
8
Method in SPSSMethod in SPSSMethod in SPSSMethod in SPSS
분석 > 일반선형모형 > 반복측정
7
- 78 -
2011 의학통계 교육 (고급) ◀
9
- 79 -
▶ 삼성서울병원 교육수련부/통계지원팀
���� ��
N
age_1.00 7
1 00 91.00 9
1�
- 80 -
2011 의학통계 교육 (고급) ◀
--> > 일변량일변량 분석분석일 량일 량 석석
- ���� 일�할 때, ��� �� 스�레스 �수� 다르다고 할 수 ������ 일�할 때, ��� �� 레 �수� 다 다 할 수 ��
(P-value = 0.021)- �������������������������� ����� �� 스�레스 �수 변���� �� 두 �� (55세 �� ��) 다르다고 할 수 �다
��
��� �� 두 �� (55세 ��, ��) 다르다고 할 수 �다.(P-value = 0.506)
���� �������� ����
구형성 가정 test
P-value > 0.05 ; 구형성 가정 만족
��
- 81 -
▶ 삼성서울병원 교육수련부/통계지원팀
Example 1Example 1 2 (Mixed model)2 (Mixed model)Example 1Example 1--2 (Mixed model)2 (Mixed model)
Ex1) 복압성 요실금 환자를(≤55, >55) 대상으로 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다 증상의 스트레스설문지를 이용하여 레 점수를 측정설문지를 이용하여 스트레스 점수를 측정
- ��� ��할 �, �� � ��(55� ��, ��) ���� �수� ���고 할 수 �� (P value= 0 048)고 할 수 ��. (P-value= 0.048)
��
- 82 -
2011 의학통계 교육 (고급) ◀
분석 가설분석 가설����� �������� ����� � ��� ���세 이하��초과� ���������������������������� �과� ���
→→��������������������������
Random effect : patient effect: due to Much variability between patients y p
Fixed effect : age(55세 초과, 이하), time
correlation structure : Ar(1)
��
Outcome variable
N=21 (data with missing)
: 스트레스 점수
Independent variable: age(55세 이하, 초과), time(개월)
��
- 83 -
▶ 삼성서울병원 교육수련부/통계지원팀
Analysis using Mixed modelAnalysis using Mixed modelAnalysis using Mixed modelAnalysis using Mixed model
- 84 -
2011 의학통계 교육 (고급) ◀
�������� ����((������ 내내 �������� ������ ���� ����))�������� ����((������ 내내 �������� ������ ���� ����))
��
> >
- 85 -
▶ 삼성서울병원 교육수련부/통계지원팀
- 86 -
2011 의학통계 교육 (고급) ◀
- 87 -
▶ 삼성서울병원 교육수련부/통계지원팀
Model CheckingModel CheckingModel CheckingModel Checking
Residual plot : to detect any outliers or a general lack : to detect any outliers or a general lack normality
- 88 -
2011 의학통계 교육 (고급) ◀
- 89 -
▶ 삼성서울병원 교육수련부/통계지원팀
Explore the residual distributionExplore the residual distribution
> >
- 90 -
2011 의학통계 교육 (고급) ◀
- 91 -
▶ 삼성서울병원 교육수련부/통계지원팀
→ Analysis using Generalized estimating equation (GEE) equation (GEE)
��
Example 2 (GEE)Example 2 (GEE)Example 2 (GEE)Example 2 (GEE)
Ex2) 술 후 1개월, 3개월, 6개월, 9개월, 12개월 마다증상의스트레스 설문지를 이용하여 스트레스 완화 여부를
측정
가설 가설: 시간에 따른 스트레스 완화 가능성 변화 양상은 연령 두 군간
(55세 이하,초과) 다르다(55세 이하, 과) 다 다
Outcome variable 1개월 3개월 6개월 9개월 12개월 마다 스트레스 완화 여부 측정: 1개월, 3개월, 6개월, 9개월, 12개월 마다 스트레스 완화 여부 측정
Independent variabledepe de t a ab e: 연령 (55세 이하, 초과), time
��
- 92 -
2011 의학통계 교육 (고급) ◀
Analysis using GEEAnalysis using GEEAnalysis using GEEAnalysis using GEE
> >
- 93 -
▶ 삼성서울병원 교육수련부/통계지원팀
- 94 -
2011 의학통계 교육 (고급) ◀
- 95 -
▶ 삼성서울병원 교육수련부/통계지원팀
��스 �� 요약�� �� 약
N 퍼센트
포함됨 96 100 0%포함됨 96 100.0%
제외됨 0 .0%
합계 96 100 0%합계 96 100.0%
상관 ��� 요약
수준의 수
개체 효과 id 21
개체-내 효과 visit 5
개체의 수 21
개체당 측정 수최소값 2
개체당 측정 수최대값 5
상관행렬 차원 5
��
- 96 -
2011 의학통계 교육 (고급) ◀
Survival analysisSurvival analysis
Tests of �odel �ffects
Type III
Source Wald Chi-Square df Sig.(Intercept) 3 182 1 074(Intercept) 3.182 1 .074
age_1 .668 1 .414
visit 1.372 4 .849
age_1 � visit 13.�96 4 .009
4�
- 97 -
▶ 삼성서울병원 교육수련부/통계지원팀
MACE free rateMACE free rate KaplanKaplan--Meier Meier
Example 3Example 3 11Example 3Example 3--11
Ex) Multi-vessel disease를 갖는 non-ST-elevation myocardial infarction 환자들을 대상으로 single vessel 만 치료한 군과 multi vessel 를 치료한 두 군간에 MACE free curve 비교
Variable : Variable : Group (Multi vessel=1, single vessel=2)Time to MACE(month)������(MACE ; MACE=1, ��������=��
��
- 98 -
2011 의학통계 교육 (고급) ◀
MACE free curve 출력
- 99 -
▶ 삼성서울병원 교육수련부/통계지원팀
=4.767Mo , S(4.767)=0.922 , se=0.031=5.057Mo , S(5.057)=0.906 , se=0.034
ResultsResults MACE free t
MACE free rate의SErate SE
��
- 100 -
2011 의학통계 교육 (고급) ◀
Group간 MACE free curve �� L k -> Log-rank test
��
- 101 -
▶ 삼성서울병원 교육수련부/통계지원팀
Example 3Example 3 22Example 3Example 3--22
Ex) Multi-vessel disease를 갖는 non ST elevation myocardial infarction 환자들을 대상으로 single vessel로 치료한 후, age가 일정infarction 환자들을 대상으로 single vessel로 치료한 후, age가 일정할 때(보정하여) Lesion type간 MACE(major adverse cardiac events) 발생 위험율이 다른지 보고자 함
Variable :Age(year)lesion type (1, 2, 3, 4)Time to MACE(month)Status(MACE(major adverse cardiac events); Status(MACE(major adverse cardiac events); MACE=1,censored=0)
��
Results
- 102 -
2011 의학통계 교육 (고급) ◀
Analysis using Cox proportional hazards modelmodel(MACE 발생에 대한 위험인자 분석 (다른 인자 보정 후))
:가정- 각 인자가 MACE 발생에 미치는 영향이 시간에 따라 변하지 않는다.
��
- 103 -
▶ 삼성서울병원 교육수련부/통계지원팀
Analysis using Cox proportional Analysis using Cox proportional h d d lh d d lhazards modelhazards model
> > Cox
- 104 -
2011 의학통계 교육 (고급) ◀
- 105 -
▶ 삼성서울병원 교육수련부/통계지원팀
PH(Proportional hazard)PH(Proportional hazard) checkcheckPH(Proportional hazard) PH(Proportional hazard) checkcheck
(1) Graphical approach- Survival graph Survival graph - log (-log (survival)) graph
(2) Statistical test
Lesion 4 군간에 MACE 발생 위험율은 다르다고 할 수 있다. (P-value = <.001)
lesion(1): 1 vs 4 ; P-value = < 0.001 X 3 = <.001lesion(2): 2 vs 4 ; P-value = < 0.001 X 3 = <.001lesion(3): 3 vs 4 ; P value < 0 001 X 3 < 001lesion(3): 3 vs 4 ; P-value = < 0.001 X 3 = <.001(P-values were corrected by Bonferroni’s method due to multiple testing)
��
- 106 -
2011 의학통계 교육 (고급) ◀
lesionlesion Survival graphSurvival graphlesionlesion Survival graph Survival graph
lesionlesion-- PH PH check: Graphical approachcheck: Graphical approach
분석 > 생존확률 > Cox 회귀모형 > 도표
- 107 -
▶ 삼성서울병원 교육수련부/통계지원팀
lesionlesion-- PH PH check; Statistical testcheck; Statistical test
Schoenfeld residual (Harrel and Lee(1986))
Step1
각 독립변수의 partial residual을 Cox regression을 이용하여 계산
Step2
Event=1인 피험자를 대상으로 time과 각 독립변수의 partialEvent=1인 피험자를 대상으로 time과 각 독립변수의 partial
residual간 상관 분석
lesionlesionlog(log(--log (survival)) graph log (survival)) graph
- 108 -
2011 의학통계 교육 (고급) ◀
Schoenfeld residual methodSchoenfeld residual methodSchoenfeld residual methodSchoenfeld residual method
분석 > 생존확률 > Cox 회귀모형 > 도표
- 109 -
▶ 삼성서울병원 교육수련부/통계지원팀
> > > >
- 110 -
2011 의학통계 교육 (고급) ◀
PH PH 가�가� check check ����PH PH 가�가� check check ����
Lesion이 MACE 발생에 미치는 영향이 시간에 따라 변한다
→
Cox regression 적용 불가
Time-dependent Cox regression analysis 적용
��
상관계수
lesion(1) lesion(2) lesion(3) age
상관계수 -.966** -.558** -.226* -.103
Spearman의 rho
Month 유의확률(양측 .000 .000 .011 .251
N 125 125 125 125
�3
- 111 -
▶ 삼성서울병원 교육수련부/통계지원팀
Time dependent Cox regressionTime dependent Cox regressionTime dependent Cox regressionTime dependent Cox regression분석 > 생존 확률 > 시간 종속 Cox 회귀 모형분석 생존 확률 시간 종속 회귀 형
- 112 -
2011 의학통계 교육 (고급) ◀
- 113 -
▶ 삼성서울병원 교육수련부/통계지원팀
���의 ��
B 표준오차 Wald 자유도 유의확률 Exp(B)
Exp(B)에 대한 95.0% CI
하한 상한
age 0.03 0.01 10.87 1.00 0.00 1.03 1.01 1.05
lesion 31.57 3.00 0.00
lesion(1) -4.13 2.37 3.04 1.00 0.08 0.02 0.00 1.67
lesion(2) -2.70 0.62 18.81 1.00 0.00 0.07 0.02 0.23
lesion(3) -1.60 0.37 18.39 1.00 0.00 0.20 0.10 0.42
T_COV_*lesion 10.15 3.00 0.02
0 27 0 33 0 65 1 00 0 42 1 31 0 68 2 51T_COV_*lesion(1)
0.27 0.33 0.65 1.00 0.42 1.31 0.68 2.51
T_COV_*lesion(2)0.29 0.10 7.84 1.00 0.01 1.34 1.09 1.64
T_COV_*lesion(3)0.20 0.08 6.72 1.00 0.01 1.22 1.05 1.42
80
- 114 -
2011 의학통계 교육 (고급) ◀
���� : : ���� 자료자료���� : : ���� 자자
��
Age가 일정할 때 lesion이 시간에 따라 MACE 발생 위험에 미치는Age가 일정할 때, lesion이 시간에 따라 MACE 발생 위험에 미치는영향이 lesion간에 다르다고 할 수 있다. (P-value =0.02)
- Age가 일정할 때, lesion 2이 시간에 따라 MACE 발생 위험에미치는 영향이 lesion 4와 다르다고 할 수 있다 미치는 영향이 lesion 4와 다르다고 할 수 있다. (P-value =0.01*3=0.03)
- Age가 일정할 때, lesion 3이 시간에 따라 MACE 발생 위험에미치는 영향이 lesion 4와 다르다고 할 수 있다. (P-value =0 01*3=0 03)(P-value =0.01*3=0.03)
(P-values were corrected by Bonferroni’s method due to multiple testing)
��
- 115 -
▶ 삼성서울병원 교육수련부/통계지원팀
Example 1Example 1--22Example 1Example 1 22
Example 1Example 1--11Example 1Example 1 11
- 116 -
2011 의학통계 교육 (고급) ◀
Example 2Example 2Example 2Example 2
- 117 -
▶ 삼성서울병원 교육수련부/통계지원팀
Example 3Example 3--11Example 3Example 3 11
- 118 -
2011 의학통계 교육 (고급) ◀
- 119 -
▶ 삼성서울병원 교육수련부/통계지원팀
Example 3Example 3--22Example 3Example 3 22
- 120 -
2011 의학통계 교육 (고급) ◀
- 121 -
▶ 삼성서울병원 교육수련부/통계지원팀
- 122 -
top related