朱 益 民 浙江大学医学院 流行病与卫生统计学系
DESCRIPTION
病例对照研究 case-control study. 朱 益 民 浙江大学医学院 流行病与卫生统计学系. 问 题. 某单位某日发生许多腹泻病人,初步调查发现可能与该单位食堂就餐有关。如何调查此次事件的病因?. 以目标人群中患有某种疾病的人 ( 病例组 )和未患该病或正常人( 对照组 )为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。. 一、病例对照原理. 病例对照研究模式图. 过 去. 现 在. 暴露率. 人数. 暴露状况. 是否患病. +. a. 病例组. - PowerPoint PPT PresentationTRANSCRIPT
朱 益 民浙江大学医学院
流行病与卫生统计学系
病例对照研究case-control study
某单位某日发生许多腹泻病人,初步调查发现可能与该单位食堂就餐有关。如何调查此次事件的病因?
问 题
以目标人群中患有某种疾病的人 ( 病例组)和未患该病或正常人(对照组)为研究对象,调查过去暴露于某个危险因素的情况及程度,比较两组暴露史的差别,以分析暴露因素与疾病有无关联以及关联程度的大小。
一、病例对照原理
研究人群
病例组
对照组
+
-
+
-
a
b
c
d
是否患病 过 去
病例对照研究模式图
A/(a+b)
c/(c+d)
暴露率 人数 暴露状况现 在
病例对照研究的特点
属于观察性研究方法 回顾性研究 从果到因研究
二、病例对照研究的设计与实施1. 明确研究目的,提出假设 病例对照研究主要检验某因素与疾病之间的关系。 通过查阅文献和描述性研究, 提出研究假设 - 选题。2. 病例选择 病例定义 在研究时已经患病的人 确定诊断标准(防止错分偏倚) 疾病分型和严重程度 原则 选择病例的原则是进入病例组的病例足以代表总体 (
即产生这组病人的目标人群 ) 中该病的全部病例。
病例的来源 医院:一家或多家医院住院或门诊已明确诊断病例。 社区人群:普查结果;疾病发病或死亡登记报告资料。 病例的类型 新发病例:回忆偏倚低;代表性好;受生存因素影响少;易合作 现患病例、死亡病例:易发生 Neyman bias
3. 对照选择对照的定义:研究时不患所研究疾病的人,包括其他病
人和健康人设立对照的目的和选择原则:代表性、可比性、暴露不
能作为选择对照的依据。对照的来源 以人群为基础的病例对照研究 以医院为基础的病例对照研究
4. 病例和对照的匹配匹配的概念 选择对照的方法,使对照在某些因素的分布与病
例组保持一致。匹配因素 常用的配比变量有年龄、性别、居住地、出生地、
社会经济水平、民族、病情轻重、疾病类型。 一旦被匹配后,就无法分析该匹配因素与疾病的关系。匹配的作用 增加病例组与对照组的均衡性与可比性。控制外
部因素 , 消除非研究因素的作用,提高提高研究效率。匹配的类型:群体匹配和个体匹配
群体(或频数)匹配( frequency matching )在选择对照组时,使某些因素在对照组中与病例组中的分布在整体上相同。
年龄、性别、种族等分布一致
N2 对照N1 病例
成组的病例对照研究
实例:绿茶与子宫内膜癌的病例对照研究
case control total P value
<45 104(10.45) 124(11.41) 228
0.918
45- 163(16.83) 172(15.82 335
50- 230(23.12) 255(23.46) 485
55- 156(15.68) 165(15.18) 321
60- 160(16.08) 186(17.11) 346
>65 182(18.29) 185(17.02) 367
按年龄频数匹配后,病例组和对照组年龄的分布
成组病例对照研究资料整理表暴露 不暴露 小计
病例 a b a+b对照 c d c+d合计 a+c b+d n
age, sex, race
根据病例组中每个个体的匹配因素的特点,选择与其相匹配的对照。配比的病例对照研究
个体匹配 (Individual matching)
controls
pair
cases
配比的病例对照研究 : 1 case: R controls 配对病例对照研究 1 case: 1 control
R 1 2 3 4 5 6 ∞efficiency 1 1.33 1.5
01.60
1.67
1.71
2.00
如何在病例数受限的条件下,如少见病或罕见疾病,进行病因研究?
对子的种类暴露情况
对子数病例 对照
1 + + A2 + - C3 - + B4 - - D
病例+ -
对照+ A B- C D
配对病例对照数据整理
配对病例对照研究的对子类型
实例:青年女性阴道腺癌的病因调查 1966-1969年波士顿Vincent 纪念医院收治7例阴道腺癌患者,年龄 15-22岁; 通常阴道癌占女性生殖系统肿瘤的 2%,而阴道腺癌仅占阴道癌的 5~ 10%;以往阴道腺癌的年龄均在 25岁以上; 因此,这 7例异常病例:肿瘤类型异常;时间、地区分布异常集中;年龄分布异常 分布差异提示了线索:该地区有某些因素与阴道腺癌异常发病有关。
☻病例组: 8例(同地区另一医院一例),均经病理确诊;☻对照组:每个病人配 4 个对照,共 32 个对照,选自与病例同一医院(病房)出生、出生日期与病例前后不超过 5天的女青年。☻调查:设计几十种有关因素,对病例组、对照组及其她们的母亲进行了调查。研究因素包括母亲年龄、吸烟史、母亲以前流产史、此次怀孕阴道出血史、母亲怀孕期间使用过己烯雌酚激素的情况、哺乳史和妊娠期间射线接触史等。
研究背景 研究设计
研究结果
匹配过头( Overmatching) :把不应该匹配的因素进行匹配,不仅增加了工作难度,而且使病例组和对照组在这个因素的分布人为一致;如果该因素与研究的暴露因素存在联系,就可能使研究因素和疾病之间的关联减弱或消失。
5、病例对照研究的样本含量影响样本含量的因素被研究因素在对照人群中的暴露率(率越高样本越小)。 估计该因素造成的相对危险度( RR)或暴露比值比( OR) OR越大样本越小。
需要达到的检验显著性水平, α=0.01 样本大于 α=0.05。
要求的把握度 1-β 把握度要求越高样本越大。设计类型:成组设计和配比设计
成组设计的病例对照研究样本含量估计
210
20011
)()2(
PPQPQPKQPK
N
Z 和 Z 分别是和值对应的标准正态分布分位数 (查表 )p0 和 p1 分别是所研究因素在对照组和病例组的估计暴露率q0 = 1p0 , q1=1p1 ;P=(p0+p1)/2, q= 1p’;p1=(ORp0)/(1p0+ORp0) ;
Schlesselman 用病例对照研究小儿先天性心脏病与母亲孕期口服避孕药 (OC) 关系。假定育龄妇女中应用 OC者占 30%,孕期服用 OC与小儿先天性心脏病的 RR=3 , =0.05(双侧检验 ), =0.10 ;查表 Z=1.96 , Z=1.28 。 q0 = 10.3=0.7 p1=(30.3)/(10.3+30.3)=0.5625 q1=10.5625=0.4375 P=(0.3+0.5625)/2=0.4313 ; q=10.4313=0.5687 n=73 在此条件下研究,病例组和对照组至少各需 73人
样本含量估计实例
采用成组病例对照研究设计,当 α = 0.05 , β= 0.20 时,两组不同的暴露率下的样本量。
按照 1: 1的病例对照研究方法设计,当某一 SNP 位点 MAF 频率为 0.2 时,不同样本量和 OR值下的检验效能
m
Z Z p p
p
2 1
12
2
2( )
1:1 配对病例对照研究的样本含量
p OROR
RRRR
1 1
m 为需要结果不一致的对子数。 M = m/pe pe p0q1+p1q0 M 为研究需要的总对子数, pe 为病例组和对照组暴露情况不一致的对子数出现的频率。 p0 和 p1 分别是人群中估计的暴露率和病例组估计的暴露率。
6、暴露资料的收集及测量 对每一种暴露因素必须有严格的定义,并尽量与其他研
究者的定义一致,以便相互比较。 根据研究目的精选暴露因素 回顾性方法调查暴露状况:问卷调查、查阅记录、电话访问等。
制定调查表
Never smokers were defined as subjects who had never smoked or had smoked fewer than 100 cigarettes in his or her lifetime.
Former smokers reported a history of smoking but had stopped at least 1 year before being diagnosed with lung cancer (or 1 year before enrollment in the study, for control subjects).
Current smokers were currently smoking or had stopped smoking less than 1 year before being diagnosed with lung cancer (or less than 1 year before enrollment in the study, for control subjects).
吸烟的标准
四、资料分析( 1)资料整理:核对、分组、归纳、数量化。( 2 )描述性统计分析: 研究对象的一般特征,如描述年龄、性别、职业等的分
布频率; 资料均衡性检验。( 3 )分析病例组与对照组之间有关因素的暴露率有无显著性差异
( 4 )暴露与疾病的关联强度分析。
1、一般步骤
一般情况和均衡性比较
年龄: <15 15- 45- 65-
病例组 对照组 χ2
P性别 : 男 女
疾病类型:
2 、成组病例对照研究的资料分析
暴 露 不暴露 小计
病 例 a B A+b
对 照 c D C+d
总 计 A+c B+d n
( 1)成组资料整理表
( 2)分析病例组与对照组的暴露率有无显著性差异 ?
>3.84, P<0.05; >6.63, P<0.01
22
d)c)(bc)(a(ba
n)2bcad(χ
22
d
n
( 3)联系强度的计算 相对危险度( RR):反映暴露与疾病发生(发病或死亡)
关联强度的指标,危险比( risk ratio )
亡率非暴露组的发病率或死率暴露组的发病率或死亡
RR
在病例对照研究中 RR一般无法计算
相对危险度与联系强度相对危险度大小 联系强度意义 0.9~1.0 1.0~1.1 无 0.7~0.8 1.2~1.4 弱 0.4~0.6 1.5~2.9 中等 0.1~0.3 3.0~9.0 强 <0.1 >10.0 很强
即优势比。优势( odds) 是某事件发生(暴露)与未发生(非暴露)的概率之比。反映病例与对照在暴露程度上的差异。
0
1
对照组中暴露的优势病例组中暴露的优势
OddsOdds
OR
对照组中不暴露的概率对照组中暴露的概率病例组中不暴露的概率病例组中暴露的概率
比值比 ( Odds ratio , OR )
bcad
dcddcc
babbaa
OR
)()(
)()( 如所研究疾病的发病率
较低 (<5%) ,可用比值比来估计相对危险度
暴 露 不暴露 小计病 例 a b a+b对 照 c d c+d总 计 a+c b+d n
OR 的 95% 可信区间
• Woolf 法: LnOR 的 95% 可信区间
dcbaOR 111196.1ln
• Miettinen 法:296.11 OR
例 Doll 和 Hill 关于吸烟与肺癌关系的病例对照研究
(4) 剂量反应关系分析Doll 和 Hill 研究男性吸烟与肺癌关系
每日吸烟量 0 1 - 5 - 15 - 合计肺癌 2 (c) 33(a1) 250(a2) 364(a3) 649(n1)对照 27(d) 55(b1) 293(b2) 274(b3) 649(n2)合计 29(mo) 88(m1) 543(m2) 638(m3) 1298(n)OR 1.0 8.10 11.52 17.93
2 趋势检验 , 自由度为 12=43.15, 自由度= 3, P<0.001
2趋势检验 , 自由度为1
t
iii
t
iii
t
iii
XmT
XmT
XaT
nnTnTnnV
VnTnT
0
23
02
01
222321
221
2
1/
//
Xi 为每个暴露水平
在上一例中: T1=1625 T2=8002 T3=1625 V=164.0039 2=40.01 v=1
P<0.01
每日酒精消费量(克/日) 0~39 40~79 80~119 >=120 合计
食管癌 29 75 51 45 200
对 照 386 280 87 22 775
合计 415 355 138 67 975 OR 1.0 3.57 7.80 27.23
趋势检验 2=151.9, p<0.001
每日酒精消费量与食管癌发病危险的关系
为了控制混杂偏倚,将资料按某些特征分成不同的层次,分析不同层内暴露因素与疾病的关系。
( 5)分层分析
食管癌 对照 小计饮 酒 a b a+b OR=ad/bc不饮酒 c d c+d总 计 a+c b+d n
吸 烟 不 吸 烟食管癌 对照 小计 食管癌 对照 小计
饮 酒 A1 B1A1+b
1A2 B2
A2+b2
不饮酒 C1 D1C1+d1
C2 D2C2+d2
合 计 A1+c1 B1+d1 N1 A2+c2 B2+d2 N2
OR1=a1d1/b1c1 OR2=a2d2/b2c2
病 例
暴 露 不暴露 小计
暴 露 a B A+b 对 照 不暴露 c D C+d
总 计 A+c B+d n
( 3)分析病例组与对照组的暴露率有无显著性差异
a,b,c,d 分别代表病例和对照配对的对子数
3. 配对资料分析
cb
2cb2χ
1
联系强度 OR=c/b
)/96.11( 2OR
91.11d)c)(bc)(a(ba
nbc)(adχ2
2
d
如把上述资料拆成成组资料:
54.312613281
OR
暴 露 不暴露 小计病 例 81 12 93
对 照 61 32 93
总 计 142 44 186
五、病例对照研究中的偏倚选择偏倚:选入者与未选入者某些特征上存在差异引起 入院偏倚、现患 -新发病例偏倚、检出征候偏倚、时间效
应偏倚等信息偏倚:收集信息时由于测量及获得数据的方法不正确而造成。回忆偏倚、测量偏倚
混杂偏倚:
六、病例对照研究的优点研究所需的时间短,人力、财力、物力均较节省,并较易组织实施、容易得出结果
适用于少见病的研究一次病例对照研究可调查多种因素与疾病的关
系。病因筛选
病例对照研究的缺点样本代表性差暴露资料准确性较差不能计算RR和发病率,不能直接估计联系强度(只能计算OR)
分 组 母亲数 合 计生短肢畸形儿 无短肢畸形儿妊娠 8周内服用反应停者 12 2 14
早期未服反应停者 38 88 126
服用反应停与短肢畸形发生的关系
比值比 OR=12×88/(38×2)=13.9
谢 谢!