Transcript
Page 1: 第八章  均值之差的推断

第8章 均值之差的推断 1

第八章 均值之差的推断本章内容• 8.1 两个总体均值之差推断的基本内容• 8.2 独立样本均值之差检验• 8.3 两总体方差差异检验• 8.4 成对样本推断

下一页 返回目录

Page 2: 第八章  均值之差的推断

第8章 均值之差的推断 2

8.1 两个总体均值之差推断的基本内容• 8.1.1 两个总体均值之差的抽样分布• 8.1.2 三种检验情况• 8.1.3 Excel双样本检验分析工具的内容

上一页 下一页 返回本章首页

Page 3: 第八章  均值之差的推断

第8章 均值之差的推断 3

假定从总体 1 中抽取一个随机样本,从总 体2 中抽取另一个随机样本。这两个样本的均值 之差为: 。 根据第 5 章知识可知, =μ1 , =μ2 。

21 xx

8.1.1 两个总体均值之差的抽样分布

1x2x

上一页 下一页 返回本节首页

Page 4: 第八章  均值之差的推断

第8章 均值之差的推断 4

• 样本均值之差的抽样分布的标准差,称为两个均值之差的组合标准差,用下式表示:

• 如果两个总体的标准差未知,就用两个样本的标准差作为估计值,其公式为:2

22

1

21

21 nnxx

2

22

1

21

21 nS

nS

S xx

上一页 下一页 返回本节首页

Page 5: 第八章  均值之差的推断

第8章 均值之差的推断 5

• 如果是小样本,则可分成两种情况,一是虽然两个总体方差未知,但知道有 = 。这种情况下, 的估计量为:

21

11ˆ21 nn

s pxx

12 2

2

21 xx

上一页 下一页 返回本节首页

Page 6: 第八章  均值之差的推断

第8章 均值之差的推断 6

• 当方差未知,且方差不等时,虽可采用上式,但此时抽样分布已不服从自由度为( n1+n2-2 )的 t 分布,而是近似服从修正自由度为的 t 分布,的计算公式为:

2

2

2

22

1

2

1

21

2

2

22

1

21

)()(

)(

nns

nns

ns

ns

df

上一页 下一页 返回本节首页

Page 7: 第八章  均值之差的推断

第8章 均值之差的推断 7

• 均值之差的参数估计的基本公式为:

21

2

221

11)( nnstxx p ±

上一页 下一页 返回本节首页

Page 8: 第八章  均值之差的推断

第8章 均值之差的推断 8

8.1.2 三种检验情况 当从两个总体中抽取的样本不成对时,称其为 独立样本。 Excel 提供了三种对独立样本进行 假设检验的分析方法。三种方法的选择依赖于 两个总体所提供的方差。一般来说共有三种可 能,每种可能需要使用不同的计算方法。

上一页 下一页 返回本节首页

Page 9: 第八章  均值之差的推断

第8章 均值之差的推断 9

1. 总体方差已知• 这种情况下根据两个样本的数据计算样本统计量 z 。2 .总体方差未知且两总体方差相等• 需假设两个总体方差相等。• 计算合并样本方差。• 根据两个样本的均值和合并样本方差可以计算样本统计量 t 值。• t 分布的自由度是 n1 + n2-2 , n1 和 n2 是两个样本的容量。

上一页 下一页 返回本节首页

Page 10: 第八章  均值之差的推断

第8章 均值之差的推断 10

3 .总体方差未知且两总体方差不等• 此种情况称为贝伦斯 - 费雪问题。• 一个从样本数据中计算出来统计量近似服从 t 分布,此检验称为 t 检验。• 在 Excel 的输出中称其为“ t Stat” 。• 自由度由萨特思韦特逼近公式计算并取其最接近的整数。• 然后再根据它和 t 分布得到 P 值和其他临界值进行推断。

上一页 下一页 返回本节首页

Page 11: 第八章  均值之差的推断

第8章 均值之差的推断 11

8.1.3 Excel 双样本检验分析工具的内容• F- 检验:双样本方差• t- 检验: 双样本等方差假设• t- 检验: 双样本异方差假设• t- 检验: 平均值的成对二样本分析

上一页 下一页 返回本节首页

Page 12: 第八章  均值之差的推断

第8章 均值之差的推断 12

双样本等方差检验对话框如图所示。

上一页 下一页 返回本节首页

Page 13: 第八章  均值之差的推断

第8章 均值之差的推断 13

对话框的主要内容包括:• 变量 1 的区域:在此输入需要分析的第一个数据区域的单元格引用。该区域必须由单列或单行的数据组成。• 变量 2 的区域:在此输入需要分析的第二个数据区域的单元格引用。该区域必须由

单列或单行的数据组成。• 假设平均差:在此输入期望中的样本均值的差值。 0 值则说明假设样本均值相同。

上一页 下一页 返回本节首页

Page 14: 第八章  均值之差的推断

第8章 均值之差的推断 14

• 标志:如果输入区域的第一行或第一列中包含标志项,请选中此复选框;如果输入区域没有标志项,请清除此复选框, Excel 将在输出表中自动生成数据标志。

• 显著水平 a :为第 I 类错误发生概率的显著性水平(弃真假设),该值必须在范围 0~1 之间。

• 输出区域:在此输计算结果。如果输出表将覆盖已有的数据, Excel 会自动确定输出区域的大小并显示信息。

上一页 下一页 返回本节首页

Page 15: 第八章  均值之差的推断

第8章 均值之差的推断 15

• 新工作表组:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。如果需要给新工作表命名,请在右侧的编辑框中键入名称。

• 新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。

上一页 下一页 返回本节首页

Page 16: 第八章  均值之差的推断

第8章 均值之差的推断 16

8.2 独立样本均值之差检验 8.2.1 等方差假设检验 8.2.2 等方差参数估计 8.2.3 不等方差假设检验

上一页 下一页 返回本章首页

Page 17: 第八章  均值之差的推断

第8章 均值之差的推断 17

8.2.1 等方差假设检验 例

某学校管理学院考虑专业设置情况,现已知会计专业与财务专业皆为社会所需求,但似乎会计专业毕业生年薪高于财务专业。 现在某地开发区随机抽取会计与财务专业的毕业生各 12 名,调查其参加工作第一年的年薪情况。 试以 0.05 显著性水平,判断会计专业毕业生的年薪是否高于财务专业毕业生的年薪。

上一页 下一页 返回本节首页

Page 18: 第八章  均值之差的推断

第8章 均值之差的推断 18

1 .假设检验计算• 本题证明会计专业毕业生的年薪高于财务专业毕业生的年薪,所以是一个单侧检验。• 会计专业年薪的数据是变量 1 ,财务专业年薪的数据是变量 2 。• 差异是两个均值之差。• 原假设是两个专业毕业生的年薪相同,即两个均值之差为零。• 备择假设是会计专业毕业生年薪均值大于财务专业毕业生年薪均值,即两个均值之差大于零。

上一页 下一页 返回本节首页

Page 19: 第八章  均值之差的推断

第8章 均值之差的推断 19

建立假设:0: 21 oH 二者没有显著差别

会计专业年薪大于财务专业年薪

0: 21 aH

①打开“第 8 章 均值之差推断 .xls” 工作簿,选择 “ 等方差”工作表。如下页图所示。

上一页 下一页 返回本节首页

Page 20: 第八章  均值之差的推断

第8章 均值之差的推断 20上一页 下一页 返回本节首页

Page 21: 第八章  均值之差的推断

第8章 均值之差的推断 21

②在“工具”菜单中选择“数据分析”选项,打开“数据 分析”对话框,选择“ t 检验:双样本等方差假设”, 单击”确定“按钮,打开双样本等方差分析对话框。

上一页 下一页 返回本节首页

Page 22: 第八章  均值之差的推断

第8章 均值之差的推断 22

③在“变量 1 的区域”中输入“ A1:A13” 。④在“变量 2 的区域”中输入“ B1:B13” 。⑤在“假设平均差”中输入数字“ 0” ,选择“标志”选项,在处选择 0.05 ,单击“输出区域”,在右边空格中输入单元格 D1 ,单击“确定”按钮。

上一页 下一页 返回本节首页

Page 23: 第八章  均值之差的推断

第8章 均值之差的推断 23

8.2.2 等方差参数估计 下述步骤描述了如何为均值间的差异确定 置信区间。①如下页图所示,在单元格 H1 中输入“ 95%的 置信区间”,从单元格 H4起,分别输入“观 察均值差异”,“标准误差”,“ t 统计量”, “ 抽样极限误差”,“估计下限”和“估计上限”。

上一页 下一页 返回本节首页

Page 24: 第八章  均值之差的推断

第8章 均值之差的推断 24

②在单元格 I4 中输入公式“ =E4-F4” ,计算样本均值差异。③在单元格 I5 中输入公式“ =(I4-E8)/E10” ,计算标准误差。

上一页 下一页 返回本节首页

Page 25: 第八章  均值之差的推断

第8章 均值之差的推断 25

④在单元格 I6 中输入公式“ =TINV(0.05,E9)” ,计算 t 统计量。⑤在单元格 I7 中输入公式“ =I6*I5” ,计算抽样极限误差。⑥在单元格 I8 中输入公式“ =I4-I7” ,计算估计下限。⑦在单元格 I9 中输入公式“ =I4+I7” ,计算估计上限。 根据上页图可知,置信区间可以解释为总体均值差在 161~6404 元之间的概率是 95%

上一页 下一页 返回本节首页

Page 26: 第八章  均值之差的推断

第8章 均值之差的推断 26

8.2.3 不等方差假设检验 例

某供应电脑显示器的公司正考虑采用一种耐用时间更长的新灯泡。 公司有以前灯泡样本的检验数据,也有最近得到的新灯泡样本检验数据。 根据这些数据,该公司能够在显著性水平为 0.05 的情况下认定新灯泡的平均寿命比旧灯泡长吗 ?

上一页 下一页 返回本节首页

Page 27: 第八章  均值之差的推断

第8章 均值之差的推断 27上一页 下一页 返回本节首页

•建立假设 原假设: Ho : μ 新≤ μ 旧 备择假设: Ha : μ 新≥ μ 旧拒绝原假设的必要条件是新 >旧,即样本均值同原来不一致。打开“第 8 章 均值之差推断 .xls” 工作簿,选择“异方差”工作表如图所示。

Page 28: 第八章  均值之差的推断

第8章 均值之差的推断 28

1. 方差相等检验①选择“工具”菜单的“数据分析”选项,打开数据分析对话框。• 在“数据分析”对话框中选择“ t 检验:双样本等方差假设”选项• 单击“确定”按钮,打开“ t 检验:双样本

等方差假设”对话框如图所示。

上一页 下一页 返回本节首页

Page 29: 第八章  均值之差的推断

第8章 均值之差的推断 29

②在“变量 1 的区域”中输入 “ A1:A23” 。③在“变量 2 的区域”中输入 “ B2:B13” 。④在“假设平均差”中输入数字“ 0” ,并选择“标志” 选项。 上一页 下一页 返回本节首页

Page 30: 第八章  均值之差的推断

第8章 均值之差的推断 30

⑤单击“输出区域”,在右边空格中输入单元格地址 C1 ,单击“确定”按钮,得到结果如图所示。

上一页 下一页 返回本节首页

Page 31: 第八章  均值之差的推断

第8章 均值之差的推断 31

检验结果分析如下:①输出结果的第一行给出了样本均值,旧灯泡平均耐用小时为 47.5 ,新灯泡平均耐用小时为 52.41 。二者存在差异,样本与原假设不一致,可以利用 P 值进行判断决策。②单侧 P 值是 .0.051746 ,比显著性水平 (0.05)稍大一点。因此不能拒绝原假设,也就是说在 0.05 的显著性水平下没有证据说明新灯泡比旧灯泡更耐用。

上一页 下一页 返回本节首页

Page 32: 第八章  均值之差的推断

第8章 均值之差的推断 32

③t 单侧临界值为 1.6938 ,略大于 t 统计量的绝对值,所以,不能拒绝原假设。• 上面计算结果是假设两总体方差相同,二者的方差存在很大的差异,因而如果利用异方差进行检验可能会有不同的结果

上一页 下一页 返回本节首页

Page 33: 第八章  均值之差的推断

第8章 均值之差的推断 33

2 .方差不等检验 利用 Excel 中的“ t- 检验:双样本异方差假设”分析工具进行检验。①在数据分析对话框中选择“ t 检验:双样本异方差假设”选项,打开“ t 检验:双样本异方差假设”对话框如图所示。

上一页 下一页 返回本节首页

Page 34: 第八章  均值之差的推断

第8章 均值之差的推断 34

②在“变量 1 的区域”中输入 “ A1 : A23” 。③在“变量 2 的区域”中输入 “ B2 : B13” 。④在“假设平均差”中输入数字“ 0” ,并单击“标志”选项。⑤单击“输出区域”,在右边空格中输入单元格地址 G1 ,单击“确定”按钮,得到结果如图所示。

上一页 下一页 返回本节首页

Page 35: 第八章  均值之差的推断

第8章 均值之差的推断 35

• 这一输出结果和前面相似,检验结果却与前不同。在上图中,单侧 P 值是 0.025783329 ,比显著性水平 0.05 小, t 统计量的绝对值大于 t 临界值,拒绝原假设,结论是在 0.05 的显著性水平下新灯泡明显比旧灯泡更耐用。

上一页 下一页 返回本节首页

Page 36: 第八章  均值之差的推断

第8章 均值之差的推断 36上一页 下一页 返回本章首页

•可以设计检验如下: 原假设 Ho : σ2 新 =σ2 旧 备择假设 Ha : σ2 新≠ σ2 旧,

•当假设总体比较正常地服从 F 分布时,样本统计量在这种条件下是两个样本方差的比率。如果原假设被拒绝,就可相信总体方差是不同的,则使用两样本异方差检验的结果就是正确的。反之,则应使用两样本等方差检验。

8.3 两总体方差差异检验

Page 37: 第八章  均值之差的推断

第8章 均值之差的推断 37

①打开“第 8 章 均值之差推断 .xls” 工作簿,选择“异方差”工作表 。②在 “数据分析”对话框“分析工具”栏中选择“ F 检验:双样本方差”选项,打开“ F 检验:双样本方差”对话框。

上一页 下一页 返回本节首页

Page 38: 第八章  均值之差的推断

第8章 均值之差的推断 38

③在“变量 1 区域”中输入 A1:A23 。在“变量 2 区域”中输入 B1:B13 。选择“标志”选项。输入显著性水平 0.05 , Excel 分析工具通常将 0.05 作为默认值。

④单击“输出区域”,在右边空格中给出输出地址 C30 ,分析结果将会以 C30 为输出起点。单击“确定”按钮,分析结果如下页图所示。

上一页 下一页 返回本节首页

Page 39: 第八章  均值之差的推断

第8章 均值之差的推断 39

⑤选中 C39 : E39 ,单击鼠标右键,打开快捷菜 单,从菜单中选择“插入”选项,在出现的插 入对话框中选择“活动单元格下移”选项,单 击确定“按钮。上一页 下一页 返回本节首页

Page 40: 第八章  均值之差的推断

第8章 均值之差的推断 40

⑥在单元格 C39 中输入“双侧 P 值”,在 D39单元格中输入公式“ =D38*2” ,显示的值是0.017676129 。

• P 值很小,可以在显著性水平为 5% , 2% 时拒绝方差相等的原假设,并认为它们明显不等。因此,例 8.2应采用异方差检验法的结果。

上一页 下一页 返回本节首页

Page 41: 第八章  均值之差的推断

第8章 均值之差的推断 41

案例研究:美国男女收入差异检验背景分析

根据美国劳动部女工局资料显示, 1994年,美国女性劳动力约占 46% ,据预测到 2005年可能会占 48% 。 这些数据表明女性是美国社会中的“半边天”。女性在为美国的经济发展中贡献近一半的力量,然而,其收入却同美国男性有着显著差别。 这里利用均值之差检验,以 0.05 为显著性水平,对美国男女收入差异进行检验,以判断是否存在差异。

上一页 下一页 返回本节首页

Page 42: 第八章  均值之差的推断

第8章 均值之差的推断 42

①打开“第 8 章 均值之差推断 .xls” 工作簿,选择“美 国男女收入”工作表

上一页 下一页 返回本节首页

Page 43: 第八章  均值之差的推断

第8章 均值之差的推断 43

建立假设:男性与女性收入之间没有显著差别 男性收入大于女性收入

0: 21 oH0: 21 aH

②在“变量 1 的区域”中输入 “ A1 : A66” 。③在“变量 2 的区域”中输入 “ B2 : B66” 。④在“假设平均差”中输入数字“ 0” ,单击“标志”选项。⑤单击“输出区域”,在右边空格中输入单元格地址 D2 ,单击“确定”按钮,得到结果如图所示。上一页 下一页 返回本节首页

Page 44: 第八章  均值之差的推断

第8章 均值之差的推断 44

计算结果:

上一页 下一页 返回本节首页

Page 45: 第八章  均值之差的推断

第8章 均值之差的推断 45

• 从计算结果可以看出 :• 男性周工资平均收入为 625.6美元,女性为

494.3美元,二者之间具有很大的差异。而且男女周工资的方差相差非常大。• 从检验结果看, t 单侧临界值为 1.65 , t 统计量为 3.462 ,大于临界值, P 值为 0.0007

6 ,小于显著性水平 0.05 ,说明男性与女性的收入之间存在着明显不平等的现象。

上一页 下一页 返回本节首页

Page 46: 第八章  均值之差的推断

第8章 均值之差的推断 46

8.4 成对样本推断 8.4.1 成对均值之差抽样分布 8.4.2 成对差异样本检验 8.4.3 用分析工具进行成对样本检验

上一页 下一页 返回本章首页

Page 47: 第八章  均值之差的推断

第8章 均值之差的推断 47

8.4.1 成对均值之差抽样分布

nS

Dt

很多实验是以一个样本的每一变量 与另一样本的一个特定变量配对的方式进行的。但对于相互不独立的两个样本,则不能直接应用上述方法。其处理方法基于以下事实:检验两个总体的均值相等的假设: μ1 = μ2 ,等价于检验假设 Ho: μ1- μ2 =0 。令 d=x-y ,则 d~n(μ, ) 。问题可以简化为: D=0 ,则使用统计量:

上一页 下一页 返回本节首页

Page 48: 第八章  均值之差的推断

第8章 均值之差的推断 48

8.4.2 成对差异样本检验 例

某轮胎制造企业想知道一个新的橡胶配方是否能提高胎面摩擦力,即新轮胎与旧轮胎是否具有显著差异。 质量检查人员使用两套样本,一套是用传统配方制造的轮胎,另一套是用新配方制造的轮胎,两套轮胎除了在橡胶方面不同外其他各方面均相同。

上一页 下一页 返回本节首页

Page 49: 第八章  均值之差的推断

第8章 均值之差的推断 49

现随机选择 6 名汽车司机进行实验,每个小汽车配两个用原橡胶配方生产的轮胎和两个用新配方生产的轮胎,并且保证每个汽车的前轮和后轮均装有一个新配方的轮胎和用原配方制造的轮胎。开动汽车直到当有一轮胎破裂,对这个轮胎的里程寿命进行登记,然后继续开这辆车,直到所有的轮胎破裂为止,记录每个轮胎行程里数。 根据所得数据,以 0.05 为显著性水平,制造企业是否有足够的证据证明用新配方制造的轮胎的平均寿命超过用原橡胶配方制造的轮胎的平均寿命?

上一页 下一页 返回本节首页

Page 50: 第八章  均值之差的推断

第8章 均值之差的推断 50

建立假设: 原假设: Ho : μ 新≤ μ 旧 备择假设: Ha : μ 新> μ 旧。• 由于这种方法用于两个总体均值的推断,其所表示的假设与两个总体均值之间的差异有关,如果设 Ho : μ 新- μ 旧=μ0=0 ,则原假设可转变为 Ho :

μ0≤0 ,备择假设就可转变为 Ha : μ0> 0 ,由于每个用传统橡胶配方制造的轮胎和用新配方制造的轮胎相对应,因此,这些样本明显成对。

上一页 下一页 返回本节首页

Page 51: 第八章  均值之差的推断

第8章 均值之差的推断 51

①打开“第 8 章 均值之差推断 .xls” 工作簿,选择“配对”工 作表。

上一页 下一页 返回本节首页

Page 52: 第八章  均值之差的推断

第8章 均值之差的推断 52

②在单元格 C1 中输入“离差”,在单元格 C2中输入公式“ =A2-B2” ,其显示值为 5,759 。复制单元格 C2 中的公式到单元格区域 C3:C13中。③在单元格 B14 中输入“均值”,在单元格 B1

5 中输入“标准差”,在单元格 B16 中输入“标准误差”,在单元格 B17 中输入“ t 统计量”,在单元格 B18 输入“ P 值”。④在单元格 C14 中输入公式“ =AVERAGE(C2:

C13)” 计算均值,在单元格 C15 中输入公式“ =STDEV(C2:C13)” ,计算标准差,分别显示结果为 3092 和 4471.701 。上一页 下一页 返回本节首页

Page 53: 第八章  均值之差的推断

第8章 均值之差的推断 53

⑤ 在单元格 C16 中输入公式“ =C15/SQRT(12)” ,计算标准误差。⑥在单元格 C17 中输入公式“ =C14/C16” 计算 t统计量。⑦在单元格 C18 中输入公式“ =TDIST(ABS(C17),

11,1)” 计算单侧 P 值,显示结果为 0.01777 。• 由于这个 P 值小于显著性水平,故拒绝原假设,并得出结论:可以证明用新橡胶配方生产的所有轮胎的胎面寿命的均值超过原橡胶配方生产的轮胎寿命的均值。

上一页 下一页 返回本节首页

Page 54: 第八章  均值之差的推断

第8章 均值之差的推断 54

8.4.3 用分析工具进行成对样本检验• 除了利用 Excel 创建公式检验配对样本,也可利用 Excel 提供的配对样本检验分析工具,这个分析工具能自动地进行各种计算并得出结果。但如果发生数据改动,则需要再运行一次分析工具。

上一页 下一页 返回本节首页

Page 55: 第八章  均值之差的推断

第8章 均值之差的推断 55

①打开“第 8 章 均值之差推断 .xls” 工作簿,选择“配对”工 作表。

上一页 下一页 返回本节首页

Page 56: 第八章  均值之差的推断

第8章 均值之差的推断 56

②在“数据分析”对话框中的“分析工具”列表中选择“ t 检验:平均值的成对二样本分析”选项,打开对话框。

上一页 下一页 返回本节首页

Page 57: 第八章  均值之差的推断

第8章 均值之差的推断 57

③在“变量 1 区域”中输入 A1:A13 。④在“变量 2 区域”中输入 B1:B13 。⑤在“假设平均差”区域中输入数值“ 0” 。⑥选择“标志”选项。⑦在“”区域中输入显著性水平 0.05 , Excel 分

析工具通常将 0.05 作为默认值。⑧单击“输出区域”,在右边空格中给出输出地址 D1 ,分析结果将会以 D1 为输出起点。

上一页 下一页 返回本节首页

Page 58: 第八章  均值之差的推断

第8章 均值之差的推断 58

⑨单击“确定”按钮,分析结果图所示。

上一页 下一页 返回本节首页

Page 59: 第八章  均值之差的推断

第8章 均值之差的推断 59

结果分析:• 分析工具的输出结果中给出了单侧检验和双侧检验的 t 临界值和 P 临界值。无论根据 t 统计量与 t 临界值比较进行判断,还是利用 P 值与显著性水平比较判断,都能得出拒绝原假设的结论。• 需要说明的是分析工具给出的输出结果并没有显示原假设是否被拒绝,其判断仍需人为决定,另外,输出结果中没有包括差异和均值的标准误差,也未给出置信区间。

上一页 下一页 返回本节首页

Page 60: 第八章  均值之差的推断

第8章 均值之差的推断 60

Thank you Thank you very much!very much!

上一页 退出返回本章首页


Top Related