中国大陆自杀 死亡 者抑郁症状评定

29
中中中中中中 中中中中中中 中中 中中 中中中中中中中 中中中中中中中 Michael Robert Phillips Michael Robert Phillips Qijie Shen Qijie Shen Xiehe Liu Xiehe Liu Sonya Pritzker Sonya Pritzker David Streiner David Streiner Ken Conner Ken Conner Gonghuan Yang Gonghuan Yang

Upload: torsten-markku

Post on 04-Jan-2016

79 views

Category:

Documents


2 download

DESCRIPTION

中国大陆自杀 死亡 者抑郁症状评定. Michael Robert Phillips Qijie Shen Xiehe Liu Sonya Pritzker David Streiner Ken Conner Gonghuan Yang. 研究背景. 疾病负担研究发现 , 到 2020 年神经精神类疾病负担将占所有疾病负担 15% 。该负担的 83% 将来自于发展中国家。 国家性精神卫生行动计划的发展和评估应该建立在对各种 精神疾病发病率 和其他人口学分布的 可靠和有效的评估 上。 关键性的第一步是建立一个可以准确诊断精神状态的操作过程 。. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 中国大陆自杀 死亡 者抑郁症状评定

中国大陆自杀中国大陆自杀死亡死亡者抑郁症状评定者抑郁症状评定

Michael Robert Phillips Michael Robert Phillips Qijie Shen Qijie Shen Xiehe Liu Xiehe Liu

Sonya Pritzker Sonya Pritzker David Streiner David Streiner Ken Conner Ken Conner

Gonghuan Yang Gonghuan Yang

Page 2: 中国大陆自杀 死亡 者抑郁症状评定

研究背景研究背景 疾病负担研究发现疾病负担研究发现 ,, 到到 20202020 年神经精神类年神经精神类

疾病负担将占所有疾病负担疾病负担将占所有疾病负担 15%15% 。该负担。该负担的的 83%83% 将来自于发展中国家。将来自于发展中国家。

国家性精神卫生行动计划的发展和评估应国家性精神卫生行动计划的发展和评估应该建立在对各种该建立在对各种精神疾病发病率精神疾病发病率和其他人和其他人口学分布的口学分布的可靠和有效的评估可靠和有效的评估上。 上。

关键性的第一步是建立一个可以准确诊断关键性的第一步是建立一个可以准确诊断精神状态的操作过程 。精神状态的操作过程 。

Page 3: 中国大陆自杀 死亡 者抑郁症状评定

目前抑郁症的诊断现状及其原因目前抑郁症的诊断现状及其原因 2002–20032002–2003 年使用年使用 DSM-ⅣDSM-Ⅳ 为标准的流调发现北为标准的流调发现北

京京 1212 月内情感障碍发病率为月内情感障碍发病率为 2.5%2.5% ,上海为,上海为 1.71.7%% 。而美国为。而美国为 9.6%9.6% 。。

语言语言与与文化文化被认为是导致较低报道率的两个潜在被认为是导致较低报道率的两个潜在原因。中国被试不原意报道精神症状,或者使用原因。中国被试不原意报道精神症状,或者使用不同于西方被试的方法描述抑郁症状。 不同于西方被试的方法描述抑郁症状。

相对于中国较高的自杀率,诊断抑郁的工具在非相对于中国较高的自杀率,诊断抑郁的工具在非西方文化背景中的不敏感可能导致了评估抑郁与西方文化背景中的不敏感可能导致了评估抑郁与自杀关系的困难。自杀关系的困难。

Page 4: 中国大陆自杀 死亡 者抑郁症状评定

理论假设理论假设

增加文化敏感条款的测量工具将辨别出一增加文化敏感条款的测量工具将辨别出一些由标准些由标准 SCIDSCID 测量不能发现的抑郁患者测量不能发现的抑郁患者 ,,并且这些人的自杀风险高于正常人群。并且这些人的自杀风险高于正常人群。

使用多元变量测定抑郁严重程度比二元变使用多元变量测定抑郁严重程度比二元变量测定可以更好的预测自杀风险。量测定可以更好的预测自杀风险。

Page 5: 中国大陆自杀 死亡 者抑郁症状评定

样本样本 样本来源样本来源 :: 从从 145145 个中国国家疾病监测网网点覆盖个中国国家疾病监测网网点覆盖

的的 2323 个有代表性的地区中纳入自杀死亡、非自杀伤个有代表性的地区中纳入自杀死亡、非自杀伤害死亡、未确定的意外死亡、和精神病死亡案例。害死亡、未确定的意外死亡、和精神病死亡案例。

针对针对 18071807 个入选案例中对其家属开展心理解剖访个入选案例中对其家属开展心理解剖访谈。被试中有谈。被试中有 6767 人联系不上,人联系不上, 6565 人拒绝。人拒绝。 2222 个个人的调查材料遗失,人的调查材料遗失, 44 例没有完成,例没有完成, 4141 人是因为死人是因为死者小于者小于 1616 岁而被排除。最后一共纳入了岁而被排除。最后一共纳入了 16081608 个案个案例 例

16081608 个案例中自杀病例组个案例中自杀病例组 887887 例,非自杀死亡对照例,非自杀死亡对照组组 721721 例。(其中意外伤害死亡例。(其中意外伤害死亡 687687 ,精神疾病死,精神疾病死亡亡 3434 例。)例。)

Page 6: 中国大陆自杀 死亡 者抑郁症状评定

样本样本 14931493 例进行了两次有效心理解剖访谈,例进行了两次有效心理解剖访谈, 1111

55 例进行了例进行了 11 次。总共次。总共 31013101 次访谈中一个次访谈中一个信息提供人的有信息提供人的有 2404 (78%)2404 (78%) ,多个信息提,多个信息提供者供者 697697 人人 (22%).(22%). 提供信息者中提供信息者中 1541 (501541 (50%)%) 为男性为男性 , 1115 (36%) , 1115 (36%) 为女性为女性 , 445(14, 445(14%)%) 有男有女有男有女 . . 受访者年龄平均 受访者年龄平均 4646 岁岁 (SD1(SD13). 3). 死亡后到访谈的中位时间数是 死亡后到访谈的中位时间数是 11.0 (7.11.0 (7.8–14.2) 8–14.2) 月。月。

Page 7: 中国大陆自杀 死亡 者抑郁症状评定

调查工具调查工具

每个每个 SCIDSCID 对抑郁症状的标准提问后增加了对抑郁症状的标准提问后增加了 1-31-3个适合中国文化的探测条目。增加条目来自于两个适合中国文化的探测条目。增加条目来自于两位高年资的中国精神科大夫 ;位高年资的中国精神科大夫 ;

记录下死前出现的所有明确的或者处于阈下型的记录下死前出现的所有明确的或者处于阈下型的症状;症状;

即使没有情绪低落和兴趣丧失也要完成全部即使没有情绪低落和兴趣丧失也要完成全部 99 大大症状的评定 ;症状的评定 ;

评定死前因抑郁症状带来的社会功能的影响;评定死前因抑郁症状带来的社会功能的影响; 评定死者抑郁症状对家人的影响;评定死者抑郁症状对家人的影响;

Page 8: 中国大陆自杀 死亡 者抑郁症状评定

测量内容测量内容 使用标准及扩增条目测量使用标准及扩增条目测量

抑郁的各个症状;抑郁的各个症状; 使用标准及扩增条目测量使用标准及扩增条目测量

所得的所有症状的数目;所得的所有症状的数目; 使用标准及扩增条目测量使用标准及扩增条目测量

抑郁所得诊断抑郁所得诊断 (( 分为重性分为重性抑郁、轻度抑郁、阈下症抑郁、轻度抑郁、阈下症状、没有症状状、没有症状 )) ;;

使用标准及扩增条目测量使用标准及扩增条目测量抑郁死前一月症状严重程抑郁死前一月症状严重程度;度;

测定死前一个月抑郁症对测定死前一个月抑郁症对个体的影响 ;个体的影响 ;

测定死前一个月死者抑郁测定死前一个月死者抑郁症状对家人的影响 ;症状对家人的影响 ;

测定死前死者一个月生活测定死前死者一个月生活质量 ;质量 ;

测定一年前慢性生活事件测定一年前慢性生活事件得分得分 ; ;

Page 9: 中国大陆自杀 死亡 者抑郁症状评定

统计方法统计方法 使用使用 SPSS11.0SPSS11.0 进行分析。进行分析。 LOGISTICLOGISTIC 回归分析。回归分析。 两种测量工具的两种测量工具的 ICC ICC 、测量结果经回归分、测量结果经回归分析后的 析后的 OROR 值 、值 、 Nagelkerke RNagelkerke R22 比较。比较。

年龄、性别、居住地调整后的自杀风险年龄、性别、居住地调整后的自杀风险 (O(OR)R)值。值。

四个诊断组之间的自杀死亡特征使用卡方四个诊断组之间的自杀死亡特征使用卡方比较(分类变量),比较(分类变量), Kruskal-WallisKruskal-Wallis 检验检验(连续性变量)。 (连续性变量)。

Page 10: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 11对对 14931493 个死者家属使用不同测量工具一致性比较结果个死者家属使用不同测量工具一致性比较结果

Page 11: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 11对对 14931493个死者家属使用不同测量工具一致性比较结果个死者家属使用不同测量工具一致性比较结果

表表 11 可以看出两种测量工具除了标准测量中对可以看出两种测量工具除了标准测量中对“不能集中注意力” “不能集中注意力” ICCICC 较差较差 (0.47),(0.47),余一致性余一致性均好均好 (0.61-0.78)(0.61-0.78) 。。

使用了扩增条目的测量工具在测定死前抑郁的发使用了扩增条目的测量工具在测定死前抑郁的发生、症状总数、症状严重程度、以及对生、症状总数、症状严重程度、以及对 99 大抑郁大抑郁症状中的症状中的 66 条测定时,其一致性比标准条目测定条测定时,其一致性比标准条目测定的好。的好。

使用两种工具评定抑郁对个体社会心理影响的使用两种工具评定抑郁对个体社会心理影响的 ICICC=0.80C=0.80 ,抑郁对家庭成员的影响的,抑郁对家庭成员的影响的 ICC=0.74,ICC=0.74, 生生活质量得分活质量得分 ICC=0.82,ICC=0.82,慢性生活事件得分的慢性生活事件得分的 ICCICC=0.77=0.77 。 。

Page 12: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

Page 13: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

使用扩增工具使得报道抑郁症的发生率在使用扩增工具使得报道抑郁症的发生率在自杀死亡人群中由自杀死亡人群中由 26.4%26.4% 升至 升至 40.2%40.2% ,,其他死亡由其他死亡由 1.0 %1.0 % 升 到升 到 2.1%2.1% 。。

使用两种测量工具所得重性抑郁发作患者使用两种测量工具所得重性抑郁发作患者的自杀风险相近的自杀风险相近(标准工具(标准工具 OR=39.2 (18.2–84.OR=39.2 (18.2–84.4) 4) ,扩增工具,扩增工具 OR=33.9 (19.8–58.1) POR=33.9 (19.8–58.1) P〉〉 0.050.05 )。)。

有扩增条目的测量工具能更好解释变量。 有扩增条目的测量工具能更好解释变量。 (R(R 22 =0.39 vs.0.31, P=0.001)=0.39 vs.0.31, P=0.001)

Page 14: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

只能适用扩增条款的诊断的只能适用扩增条款的诊断的 131131 例患者中,例患者中,抑郁症状对患者生活影响严重 。死前一个抑郁症状对患者生活影响严重 。死前一个月由于抑郁症引起的的精神功能损害是月由于抑郁症引起的的精神功能损害是 43.43.0% 0% (SD20.4%)(SD20.4%) 。其生活质量得分仅为。其生活质量得分仅为 51.5 51.5 (10.6)(10.6) 。。

与与 928928 例没有抑郁症状的人比较,其发生例没有抑郁症状的人比较,其发生自杀的危险是这些人的自杀的危险是这些人的 37.037.0 倍 倍 (17.6–77.6)(17.6–77.6) 。。

Page 15: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

除睡眠障碍以外,两种测量方法得到的抑郁症状除睡眠障碍以外,两种测量方法得到的抑郁症状的自杀风险没有显著性差异。的自杀风险没有显著性差异。

两种测量方法中的“想死”和“无望感”都是与两种测量方法中的“想死”和“无望感”都是与自杀最密切相关的症状。自杀最密切相关的症状。

使用两种测量方法所得使用两种测量方法所得 44 个类型诊断(个类型诊断(无症状、域无症状、域下症状、轻度抑郁发作和重度抑郁发作下症状、轻度抑郁发作和重度抑郁发作)计算发生自杀)计算发生自杀的风险。与诊断有的风险。与诊断有 &&无抑郁的诊断结果比较可以无抑郁的诊断结果比较可以更好的解释变量。(更好的解释变量。(标准测量法标准测量法 44 类诊断结果的类诊断结果的 RR22=0.=0.49 49 而该法而该法 22 类诊断结果的类诊断结果的 RR22=0.31, Pb0.001=0.31, Pb0.001 ;扩增测量;扩增测量法法 44 类诊断结果的类诊断结果的 RR22=0.51 =0.51 而该法而该法 22 类诊断结果的类诊断结果的 RR22=0.=0.39, Pb0.00139, Pb0.001 。。) )

Page 16: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

无抑郁症状中有其他精神障碍诊断的占总无抑郁症状中有其他精神障碍诊断的占总数的数的 38% (109/286)38% (109/286) , 而轻度抑郁和阈下, 而轻度抑郁和阈下抑郁症状中有其他精神障碍诊断的占总数抑郁症状中有其他精神障碍诊断的占总数 440% (98/244) 0% (98/244) (( XX22=0.23, df=1, P=0.629=0.23, df=1, P=0.629 )。所)。所以。对于患有轻度抑郁和阈下抑郁症状患以。对于患有轻度抑郁和阈下抑郁症状患者的自杀风险不能用其他精神病来解释。者的自杀风险不能用其他精神病来解释。

Page 17: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 22使用两种测量工具死者家属报道死者死前使用两种测量工具死者家属报道死者死前 1414 天出现抑郁症状的情况天出现抑郁症状的情况

男性受试家属比女性受试报道更多的抑郁男性受试家属比女性受试报道更多的抑郁症状和更强的由症状引起的社会心理影响。症状和更强的由症状引起的社会心理影响。

在非自杀死亡案例中多个家属做受试提供在非自杀死亡案例中多个家属做受试提供了比单个家属受试更多的抑郁症状。了比单个家属受试更多的抑郁症状。

Page 18: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 33887887例自杀死亡者中不同诊断组的特征比较例自杀死亡者中不同诊断组的特征比较

Page 19: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 33887887例自杀死亡者中不同诊断组的特征比较例自杀死亡者中不同诊断组的特征比较

286286 人没有抑郁,人没有抑郁, 244244 人有域下症状或轻度抑郁,人有域下症状或轻度抑郁,123123 例抑郁发作只能符合扩增测量工具诊断标准,例抑郁发作只能符合扩增测量工具诊断标准,234234 例抑郁发作符合标准测量工具诊断标准。例抑郁发作符合标准测量工具诊断标准。

使用标准测量工具就能诊断的患者年龄较大,更使用标准测量工具就能诊断的患者年龄较大,更容易有预先的自杀意图,更容易接受精神治疗,容易有预先的自杀意图,更容易接受精神治疗,社会功能及心理受到抑郁影响也更大 。社会功能及心理受到抑郁影响也更大 。

只能使用扩增条目测量工具才能诊断的患者其抑只能使用扩增条目测量工具才能诊断的患者其抑郁症状对个体,家庭的影响较小。更容易在死前郁症状对个体,家庭的影响较小。更容易在死前一周伴有急性的生活事件 。一周伴有急性的生活事件 。

没有抑郁症状的自杀死亡者更年轻,出现自杀意没有抑郁症状的自杀死亡者更年轻,出现自杀意念次数更少。慢性刺激少,有着更高的生活质量。念次数更少。慢性刺激少,有着更高的生活质量。更多的有突发生活事件 。更多的有突发生活事件 。

Page 20: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 4 4 使用两种测量方法所得抑郁症状数目及强度与自杀风险的关系使用两种测量方法所得抑郁症状数目及强度与自杀风险的关系

Page 21: 中国大陆自杀 死亡 者抑郁症状评定

结果结果 4 4 使用两种测量方法所得抑郁症状数目及强度与自杀风险的关系使用两种测量方法所得抑郁症状数目及强度与自杀风险的关系

自杀风险与抑郁症状的数目和严重程度有自杀风险与抑郁症状的数目和严重程度有着强的“量着强的“量 -- 效关系”。 效关系”。

Page 22: 中国大陆自杀 死亡 者抑郁症状评定

讨论讨论 使用增加针对抑郁症文化敏感条目的诊断工具提使用增加针对抑郁症文化敏感条目的诊断工具提

高了抑郁症的辨别率高了抑郁症的辨别率 ,, 提高了测试者之间内部一提高了测试者之间内部一致性。致性。

研究需要把它应用在大型社区项目中以便确定其研究需要把它应用在大型社区项目中以便确定其效果。使用文化敏感扩增条目将会提高效果。使用文化敏感扩增条目将会提高 SCIDSCID 中中其他疾病的诊断其他疾病的诊断 ((焦虑焦虑 ,,物质滥用等物质滥用等 )) 。。

发展和检验这些项目是一个长期的过程。发展和检验这些项目是一个长期的过程。 提高非西方文化中精神流行病学的可靠性是关键提高非西方文化中精神流行病学的可靠性是关键

的一步。的一步。 增加条目使得受试负担增加 。增加条目使得受试负担增加 。

Page 23: 中国大陆自杀 死亡 者抑郁症状评定

讨论讨论 自杀的风险与抑郁严重程度增加线性相关自杀的风险与抑郁严重程度增加线性相关 .. 多元多元

的定量的测定抑郁可以比二元定性测定抑郁更好的定量的测定抑郁可以比二元定性测定抑郁更好的预测自杀。的预测自杀。

既往心理解剖偏重于定性既往心理解剖偏重于定性 ,, 可能没有估计到亚抑可能没有估计到亚抑郁、焦虑的重要性。没有估计到一些人格特征对郁、焦虑的重要性。没有估计到一些人格特征对自杀的影响。自杀的影响。 ((冲动性和攻击性冲动性和攻击性 )) 这些都可以作为这些都可以作为连续变量测量。连续变量测量。

以定性诊断疾病为基础的扫描会错误地把有着亚以定性诊断疾病为基础的扫描会错误地把有着亚症状的人群分到低危险组中症状的人群分到低危险组中 ..但是这些人实际上但是这些人实际上有着比没有抑郁症状人群要高的自杀风险。有着比没有抑郁症状人群要高的自杀风险。

一些非诊断的自杀因素(如:慢性刺激一些非诊断的自杀因素(如:慢性刺激 ,,急性刺急性刺激激 ,, 生活质量 )也可以通过连续测量获得。 生活质量 )也可以通过连续测量获得。

Page 24: 中国大陆自杀 死亡 者抑郁症状评定

对国内研究的影响对国内研究的影响 精神精神 -- 心理疾病与文化背景密切相关。在国内开心理疾病与文化背景密切相关。在国内开

展其他精神疾病研究需要使用西方文化背景的标展其他精神疾病研究需要使用西方文化背景的标准或者量表的时候,按本文方法:准或者量表的时候,按本文方法: 1 1 保证翻译的保证翻译的准确性; 准确性; 2 2 在测量必要的时候,联系实际,增加在测量必要的时候,联系实际,增加文化敏感条目(本土化)。文化敏感条目(本土化)。

建立中国自己的诊断标准和相应量表的必要性。建立中国自己的诊断标准和相应量表的必要性。 诊断结论实现多元、等级化。能更为细致的描述诊断结论实现多元、等级化。能更为细致的描述

疾病。疾病。 即使使用了扩增条目的诊断即使使用了扩增条目的诊断 ,,仍有仍有 286/887286/887 ,不,不

能用抑郁解释能用抑郁解释 ,, 在今后的研究中是否可以增加人在今后的研究中是否可以增加人格特质的研究格特质的研究 ,(,(冲动行冲动行 ,,攻击性攻击性 )) ,对高危人群,对高危人群使用什么样的筛差工具合适?使用什么样的筛差工具合适?

Page 25: 中国大陆自杀 死亡 者抑郁症状评定

对国内研究的影响对国内研究的影响 1 1 死亡登记制度的改善需要立即进行。不死亡登记制度的改善需要立即进行。不

能够我们所有的研究都建立在对死亡原因能够我们所有的研究都建立在对死亡原因事后推测上。事后推测上。

2 2 测量工具的中国特色。(值得在其他诊测量工具的中国特色。(值得在其他诊断工具推广)断工具推广)

3 3 心理解剖中对信息人提供信息方式的选心理解剖中对信息人提供信息方式的选择。时间的选择?择。时间的选择?

4 4 诊断标准是否符合中国?如,是否诊断标准是否符合中国?如,是否 1414 天天的时间标准在中国是否适用。的时间标准在中国是否适用。

Page 26: 中国大陆自杀 死亡 者抑郁症状评定

费老师点评费老师点评 本文重点本文重点 11 对受试的选择,选择什么样的信息人能够对受试的选择,选择什么样的信息人能够

最好的获得最多、最确切的信息。最好的获得最多、最确切的信息。 本文重点本文重点 22 调查时间距离死亡时间为调查时间距离死亡时间为 1111 个月,但是有个月,但是有

研究发现,在该时间段内,提供的信息与研究发现,在该时间段内,提供的信息与死亡死亡 33 -- 44 个月内调查没有明显差异。个月内调查没有明显差异。

Page 27: 中国大陆自杀 死亡 者抑郁症状评定

费老师点评费老师点评 本文重点本文重点 33 研究对诊断结果实现了“连续谱诊断”,研究对诊断结果实现了“连续谱诊断”,

这样的诊断方式符合抑郁本身就是一个连这样的诊断方式符合抑郁本身就是一个连续过程的事实。对研究其他疾病如焦虑、续过程的事实。对研究其他疾病如焦虑、人格障碍等也可以采用这样的诊断。使用人格障碍等也可以采用这样的诊断。使用“连续谱诊断”对研究疾病与疾病事件的“连续谱诊断”对研究疾病与疾病事件的影响、后果可以进行严格的“量-效”关影响、后果可以进行严格的“量-效”关系的分析。系的分析。

Page 28: 中国大陆自杀 死亡 者抑郁症状评定

费老师点评费老师点评 本文重点本文重点 44 本文通过评定抑郁症状的数目、严重程度本文通过评定抑郁症状的数目、严重程度

预测自杀风险。通过多元连续性诊断能更预测自杀风险。通过多元连续性诊断能更好的预测自杀风险。好的预测自杀风险。

本文通过评定死亡前生活质量、慢性生活本文通过评定死亡前生活质量、慢性生活事件、突发生活事件等连续性变量很好的事件、突发生活事件等连续性变量很好的预测自杀风险。预测自杀风险。

Page 29: 中国大陆自杀 死亡 者抑郁症状评定

费老师点评费老师点评 本文重点本文重点 55 对两组测量工具的对两组测量工具的 ICCICC 进行比较的方法进行比较的方法““ bootstrap procedure“ 。这是没有其他方法可以对其进行比较的时候选用的一种方法。

具体方法为对进入样本重复抽样,抽出后放入再抽出,循环进行,抽一次看一次两者差距,得到差距的分布,计算其 95% 的可信区间。