chapter three central tendency 算术平均数 中数 百分位数 众数 加权平均数...

67
大大大大 www.dashikaoyan.c om Chapter Three central tenden cy •大大大大大 •大大 •大大大大 •大大 •大大大大大 •大大大大大 •大大大大大

Upload: pearl-hernandez

Post on 01-Jan-2016

289 views

Category:

Documents


32 download

DESCRIPTION

Chapter Three central tendency 算术平均数 中数 百分位数 众数 加权平均数 几何平均数 调和平均数. 算术平均数( average ) : 未归表的原始数据计算算术平均数: 8 、 2 、 5 、 3 、 7 已归表的原始数据计算算术平均数. 中数 (Median) :位于一组按大小顺序排列的数据中间位置上的数据。 未归表的原始数据计算算术平均数:中数 = ( N+1 ) /2 数据个数为奇数与偶数的情形 数据个数为奇数与偶数时有重复数据的情形 1 , 9 , 5 , 5 , 5 , 7 , 4— 4.5-5.5 - PowerPoint PPT Presentation

TRANSCRIPT

大师教育 www.dashikaoyan.com

Chapter Three central tendency•算术平均数•中数•百分位数•众数•加权平均数•几何平均数•调和平均数

大师教育 www.dashikaoyan.com

•算术平均数( average ) :

•未归表的原始数据计算算术平均数: 8 、 2 、 5 、 3 、 7

•已归表的原始数据计算算术平均数

1 2 3 1...

N

ii i

XX X X X

XN N

1 1 2 2 3 3 1...

k

i ci i i

f Xf X f X f X f X

XN N

大师教育 www.dashikaoyan.com

•中数 (Median) :位于一组按大小顺序排列的数据中间位置上的数据。

•未归表的原始数据计算算术平均数:中数 = ( N+1 ) /2

•数据个数为奇数与偶数的情形•数据个数为奇数与偶数时有重复数据的情形

•1 , 9 , 5 , 5 , 5 , 7 , 4— 4.5-5.5

•1 , 9 , 5 , 5 , 5 , 7 , 4— 4.5-5.5

•已归表的原始数据计算算术平均数

2d md bmd

N iM L F

f

大师教育 www.dashikaoyan.com

•百分位数 (Percentiles) :位于依一定顺序排列的一组数据中某一百分位置的数据。

p pp

iP L pN n

f

大师教育 www.dashikaoyan.com

•众数 (Mode) :一组数据中出现次数最多的那个数。•用观察法计算•用公式计算:•W.I.King 插补法

3 2o dM M X

ao mo

a b

fM L i

f f

大师教育 www.dashikaoyan.com

•加权平均数 (weighted mean) ,有时也可称为总体平均数,是几个样本的平均数组成的总体的平均数。

1 1 2 2 3 3

1 2 3

...

...k k

tk

n x n x n x n xX

n n n n

2 2 21 1 2 2 ...w k kSS n n n

大师教育 www.dashikaoyan.com

•几何平均数 (GEOMEAN) :当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。

1 2 3...Ng NX X X X X

大师教育 www.dashikaoyan.com

•调和平均数 (HARMEAN) :主要用于求学习速度

11 2 3

111 1 1 1 1

...H N

iN

NX

XN X X X X

大师教育 www.dashikaoyan.com

Chapter Four Measures of Variation•全距 (Range)

•四分位差 (Quartile)

•百分位距 (Percent Rank)

•平均差 (AD)

•方差和标准差 (Variance & SD)

•汇合标准差或总体标准差 (ST)

•偏态量 (Skew)

•峰态量 (Kurt)

•相对标准差 (CV)

标准差 (Z)

大师教育 www.dashikaoyan.com

•全距 (Range)

•四分位差 (Quartile)

•百分位距 (Percent Rank)

1 114Q b

Q

N iQ L F

f

3 334Q b

Q

N iQ L F

f

大师教育 www.dashikaoyan.com

1 、 5 、 8 、 12 、 13 、 16 、 19 、 28 、30 ;

50 、 51 、 59 、 65 、 66 、 79 、 82 、90 ;

大师教育 www.dashikaoyan.com

90 90904Q b

Q

N iQ L F

f

10 10104Q b

Q

N iQ L F

f

大师教育 www.dashikaoyan.com

•平均差 (AD—average deviation, or MD—median deviation):

•未归表数据求平均差;•已归表数据求平均差。

1

n

ii

x xAD

n

1

k

i ci

f x xAD

N

大师教育 www.dashikaoyan.com

•MD

1

n

i di

x MMD

n

1

k

i c di

f x MMD

N

大师教育 www.dashikaoyan.com

•方差和标准差 (variance and standard deviation):

•未归表数据求方差和标准差•已归表数据求方差和标准差

2

1

n

ii

x xS

n

2

2 1

n

ii

x xS

n

大师教育 www.dashikaoyan.com

2

2

1 1

N N

i ii i

x xS

N N

2

2 2

1 1 1

K K K

i ci i ci cii i i

f x x f x xS

N N N

大师教育 www.dashikaoyan.com

•汇合标准差或总体标准差

2 2 2 2 2 21 1 2 2 1 1 2 2

1 2 3

... ...

...n n n n

Tn

N S N S N S N d N d N dS

N N N N

大师教育 www.dashikaoyan.com

•标准分数( Z ):以标准为单位,标志某一分数离开团体均数的距离:

XZ

ix xZ

s

大师教育 www.dashikaoyan.com

•相对差异量 (relative deviation) :该值一般在 5%-35% 之间。

100%S

CVX

大师教育 www.dashikaoyan.com

•偏态量 (Skew) :当 N>200 以上时,计算的偏态系数才是可靠的。 SK>0 为正偏态, SK<0 为负偏态, SK=0 为正态。

oX MSK

S

3 2 3d dX M X X MSK

S S

3 3

1 11 1

3 3

N k

i ii i

x x

X X f X X

N NS S

大师教育 www.dashikaoyan.com

大师教育 www.dashikaoyan.com

Y

XO

大师教育 www.dashikaoyan.com

Y

XO

大师教育 www.dashikaoyan.com

•峰态量 (kurt) : Ku 以 0.263 为判断值,小于为高狭峰,大于为低阔峰; u 以 0 为判断标准,大于 0 为高狭峰,小于 0 为低阔峰。

4 4

1 11 1

4 4

3

N k

i ii i

x x

X X f X X

N NS S

-3或

75 25

90 102u

P Pk

P P

大师教育 www.dashikaoyan.com

Y

XO

大师教育 www.dashikaoyan.com

Y

XO

大师教育 www.dashikaoyan.com

Starti ng Sal ary

62500. 0

57500. 0

52500. 0

47500. 0

42500. 0

37500. 0

32500. 0

27500. 0

22500. 0

17500. 0

12500. 0

7500. 0

Starti ng Sal ary

Freq

uenc

y200

100

0

Std. Dev = 6967. 98

Mean = 26064. 2

N = 1100. 00

大师教育 www.dashikaoyan.com

练习与思考题 P71-72 :

•作业: 2 、 5 、 6 、 7 、 8 、 11

•其它:练习

大师教育 www.dashikaoyan.com

单元总结:•1. 心理与教育统计学研究的主要内容有哪些?•2. 为什么要学习心理与教育统计学?•3. 次数分布表的制作分为哪几步?•4. 解释下列概念:随机变量 样本 统计量 参数 随机现象•5. 什么是集中量?包含哪些计算指标?•6. 当一组数据呈正态分布时,中枢、均数与众数之间具有怎样的关系?•7. 请分别写出下列统计量的基本计算公式:均数 加权平均数 •8. 请分别写出下列统计量的基本计算公式:平均差 标准差 标准分数 偏态量 峰态量

大师教育 www.dashikaoyan.com

9. 什么是四分位距?如何计算?

10. 什么是百分位距?百分等级?两者之间是什么关系?

11. 当一组数据呈正态分布时,全距、平均差、四分位距与标准差之间具有怎样的关系?

12. 差异量的作用是什么?

大师教育 www.dashikaoyan.com

Chapter Five Probability and Distribution

•概率的含义•二项分布•正态分布

大师教育 www.dashikaoyan.com

•描述统计与推论统计的关系:

前面介绍的统计方法是对研究所获资料进行一般性描述,但科学研究的任务更重要的是根据所获资料去推论由其所代表的总体的一般性情况。由于研究中所获数据多为随机数据或随机变量,因此,根据随机变量去推论由它们所构成的总体,就要依赖描述随机变量规律性变化的理论即概率论为基础。•概率的含义:

•后验概率:在对随机现象进行 N 次观察时,组成该随机现象的随机事件之一随机事件 A 出现的次数为 M 次,随着观测次数的不断增加,随机事件 A 发生的可能性逐渐稳定在M/N附近,该值就被用来描述随机事件 A 在该随机现象中有规律地出现的可能性大小,即随机事件 A 发生的概率,表示为:

mP A

n

大师教育 www.dashikaoyan.com

•先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币:

•试验的每一种可能结果(称为基本事件)是有限的;•每一个基本事件出现的可能性相等;

•概率的性质:•公理性质:

•任何一个随机事件都是非负的;•必然事件的概率为 1 ;•不可能事件的概率为 0 ;

•加法定理:•两个互不相容的事件之和的概率为两个事件概率之和。•互不相容的事件指在一次观测中不能同时发生的事件。

大师教育 www.dashikaoyan.com

•公式表示为:

•可推广为:

A B A BP P P

1 21 2 n nA AA A A AP P P P

大师教育 www.dashikaoyan.com

•举例:凭猜测回答 2道是非题,答对 1 题的可能性有多大?至少答对 1 题的可能性有多大?全猜对的可能性多大?

× × 1/4

× √ 1/4

√ √ 1/4

√ × 1/4

大师教育 www.dashikaoyan.com

•乘法定理:•两个独立事件同时发生的概率等于这两个事件各自出现概率的乘积。•独立事件指一个事件的出现对另一个事件的出现不发生影响。•公式表示为:

A B A BP P P

1 21 2 n nA AA A A AP P P P

大师教育 www.dashikaoyan.com

•举例:甲射手击中目标的概率为 0.9 ,乙射手击中目标的概率为 0.8 ,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少?

大师教育 www.dashikaoyan.com

•概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。•概率分布的类型:

•离散分布与连续分布•离散分布:随机变量取孤立的值时的概率分布,如二项分布;•连续分布:连续随机变量的概率分布;如正态分布

•经验分布与理论分布:•经验分布:根据观察或实验所获得的饿数据而编制的次数分布或相对频率分布;•理论分布:一指随机变量概率分布的函数—数学模型;二指按某种数学模型计算出的总体次数分布;

大师教育 www.dashikaoyan.com

•基本随机变量分布与抽样分布:•基本随机变量分布:理论分布中描述构成总体的基本变量的分布;•抽样分布:样本统计量的理论分布;样本统计量如平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率等等是基本随机变量的函数,即统计量是由基本随机变量计算而来的,故抽样分布又称为基本随机变量函数的分布。

大师教育 www.dashikaoyan.com

•二项分布:•二项分布试验:指满足下列条件的试验:

•一次试验只有两种可能结果,即成功或失败;•各次试验相互独立,即各次试验之间互不影响;•各次试验中成功的概率或失败的概率相等

•二项分布函数:•含义:描述在 N 次试验中成功事件出现不同次数的概率分布。•表达式:

!

! !

0,1, 2, ,

X X n X X n XnX

nP C p q p q

X n X

X n

大师教育 www.dashikaoyan.com

•二项分布表达式的由来:•以抛硬币为例:抛 3 次硬币,出现的可能结果分布如下( p 代表正面, q 代表反面):

ppp, ppq, pqq, qqq, qqp, qpp, pqp, qpq

出现的结果可分成四类,即: p3 、 3 p2 p1 、 3p1 p2 、 p3 ,它们恰好是根据二项式定理对( p+q ) 3 进行推导的展开式,若进行 N 次观察,则出现的各种可能结果就可用二项式定理( p+q ) n 的展开式加以对应描述,二项展开式的各项系数也可用杨辉三角直接求出。

二项分布图的性质:

当 P=Q 时,不管 N 多大,呈对称分布;当 N 很大时,接近正态分布;

当 P 不等于 Q且 N较小时,图形呈偏态:偏的方向取决于 P 与 Q 相比睡大睡小

大师教育 www.dashikaoyan.com

二项分布图的平均数与标准差:当其接近正态分布时:•平均数:

•标准差:

•二项分布的应用:•用来判断成功事件出现的概率;•判断试验结果的机遇性与真实性的界限。如回答 10道四择一的选择题,如何判断学生的回答是真实的而非猜测?

•练习与作业 P96-97 : 1--5

np

npq

大师教育 www.dashikaoyan.com

•正态分布:连续性随机变量的概率分布•正态分布的函数

•或写成标准正态分布的形式:

2

22

2

XN

Y e

2

2

2

ZNY e

1541551561571581591601611621631641651661671681691701711721730

2

4

6

8

10

Frequency

height(cm)

1531541551561571581591601611621631641651661671681691701711721730

5

10

15

20Frequency

longth(cm)

1541551561571581591601611621631641651661671681691701711721730

2

4

6

8

10Frequency

height(cm)

大师教育 www.dashikaoyan.com

•当样本均数等于总体均数时,可写成:

•当标准差为 1 时,

即 Y 的最大值为 0.3989

01

2Y e

01 10.3989

2 2Y e

大师教育 www.dashikaoyan.com

曲线为频数(频率)曲线,略呈钟型,两头低,中间高,左右对称,近似数学上的正态曲线( normal curve ),故称这种分布为正态分布( normal distribution )。

1541551561571581591601611621631641651661671681691701711721730

2

4

6

8

10

Frequency

height(cm)

大师教育 www.dashikaoyan.com

•正态分布曲线的性质:•以过平均数的点为轴,两侧对称,均数、中数、众数三者相等,此点 Y至最大,左右相当的饿间距面积相等;•中央点最高向两侧下降,先里后外,拐点位于正负一个标准差处,曲线两端无限延伸,但最终不与基线相交;•正态曲线下的面积为,以平均数为界,左右各占 0.5 ,每一横坐标的值是其所对应面积与总面积的比值,是其所代表的随机变量的出现概率;•正态分布的形态取决于平均数和标准差;•正态部分中各差异量的值 都有固定的比率(见 P155 );•正态分布中的标准差与概率之间具有一定的数量关系:即正负一个标准差包含 68.26% 的面积;正负一个标准差包含 95% 的面积;正负一个标准差包含 99% 的面积。•依标准分数性质,标准正态分布均数为 0 , 标准差为 1

大师教育 www.dashikaoyan.com

均数

方差 2

标准差

偏度系数 1= 0

峰度系数 2= 0

大师教育 www.dashikaoyan.com

•正态分布曲线表的编制与使用:

正态曲线下各对应的横坐标处与平均数之间的面积即个体概率及密度函数值( Y 值)可根据 Z 值 的变化用积分公式加以计算(如下式),公式中的为 X轴上无限小的区间。由于不同的编制者,有的从 Z 为无限小开始计算,有的 Z=0 开始计算,所制作的正态分布曲线表也就不同。

2

221

2

Xa

X aP e dx

大师教育 www.dashikaoyan.com

•正态分布曲线表的使用:•依据 Z 分数求概率 P ;

•某分数与平均数之间的概率;如 Z72=0.8

•求 Z 分数以上或以下的概率;•求两个分数之间的概率;

•从概率 P 求 Z 分数;•已知从平均数开始的概率值,求 Z 值;•求两端的概率值;•若已知正态曲线下中央部分的概率, Z 分数

•求概率密度 Y

大师教育 www.dashikaoyan.com

•正态分布理论在测验上的应用:•化等级评定为测量数据;•在能力评定或等级分组时确定人数;•确定录取线;•确定测验题目的难易程度:化百分数为 Z 分数•化原始分数为标准分数( Z 或 T )

•练习与作业( P96-98 )

大师教育 www.dashikaoyan.com

等级 评分教师甲 5 0.10 10 0.20 15 0.30

乙 20 0.40 15 0.30 20 0.40

丙 20 0.40 15 0.30 10 0.20

丁 5 0.10 10 0.20 5 0.10

总计

3名教师对 50 位学生的等级总评定

大师教育 www.dashikaoyan.com

A B C

A 甲 乙 乙

B 乙 乙 甲

C 乙 丙 乙

3名教师对三位学生的等级评定

大师教育 www.dashikaoyan.com

三名教师各自等级的 Z 分数:

甲 乙 丙 丁

A 1.64 0.52 -0.52 -1.64

B 1.28 0.39 -0.39 -1.28

C 1.04 0 -0.84 -1.64

三位同学获得的 Z 分数

a=0.67

b=0.65

c=0.043

大师教育 www.dashikaoyan.com

Chapter Six sample distribution and inference of population parameters

•抽样分布•总体平均数的估计•总体比率的估计•假设检验的基本原理•总体平均数的显著性检验

大师教育 www.dashikaoyan.com

•抽样分布

大师教育 www.dashikaoyan.com

135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 127 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 131 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122 128 127 125 127 131

大师教育 www.dashikaoyan.com

K=10 i=3 XC f P ,Fa Pa Fb Md1 142-- 143 1 0.0125 1 0.0125 80 79.52 139-- 140 3 0.0375 4 0.05 79 77.53 136-- 137 8 0.1 12 0.15 76 724 133-- 134 10 0.125 22 0.275 68 635 130-- 131 20 0.25 42 0.525 58 486 127-- 128 19 0.2375 61 0.7625 38 28.57 124-- 125 12 0.15 73 0.9125 19 138 121-- 122 4 0.05 77 0.9625 7 59 118-- 119 2 0.025 79 0.9875 3 2

容量 =80 平均数 =128.913 标准差 =5.223

大师教育 www.dashikaoyan.com

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10

1系列

•总体分布:总体内个体数值的频率分布;

大师教育 www.dashikaoyan.com

135 134 129 133 131 131 131 134

124 132 122 124 127 131 137 132

134 138 124 132 128 136 127 120

131 120 121 144 128 133 128 127

126 130 122 128 127 125 127 131

135 127 127 133 130 132 132 129

大师教育 www.dashikaoyan.com

K=10 i=3 XC f P Fa Fb1 141-144 142 1 0.021 1 482 138-141 139 1 0.021 2 473 135-138 136 4 0.083 6 464 132-135 133 11 0.229 17 425 129-132 130 10 0.208 27 316 126-129 127 12 0.25 39 217 123-126 124 4 0.083 43 98 120-123 121 5 0.104 48 5

容量 =48 平均数 =129.5625 标准差 =4.8942

大师教育 www.dashikaoyan.com

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8

1系列

•样本分布:样本内个体数值的频数分布;

大师教育 www.dashikaoyan.com

所抽取的各样本的平均数如下:

容量 =50 平均数 =129.303 标准差 =0.878

大师教育 www.dashikaoyan.com

所抽取的各样本平均数次数分布表:

K=6 I=1 f p Fa Pa Fb Pb

1 131-132 2 0.04 2 0.04 50 1

2 130-131 5 0.10 7 0.14 48 0.96

3 129-130 27 0.54 34 0.68 43 0.86

4 128-129 13 0.26 47 0.94 16 0.32

5 127-128 2 0.04 49 0.98 3 0.06

6 126-127 1 0.02 50 1 1 0.02

大师教育 www.dashikaoyan.com

•请求出每个可能的样本平均数对应的 Z 分数

大师教育 www.dashikaoyan.com

•根据抽样平均数频率分布表制作的多边图

0

5

10

15

20

25

30

1 2 3 4 5 6

1系列

05

101520

2530

1 2 3 4 5 6

1系列