此幻灯片可在网址 appmath 上下载
Post on 01-Jan-2016
181 Views
Preview:
DESCRIPTION
TRANSCRIPT
1
此幻灯片可在网址http://www.appmath.cn上下载
第 17讲
2
第五章 大数定律和中心极限定理
3
第一节 大数定律
4
在第一章曾讲过,事件 A 在多次独立重复试验中发生的频率 fn(A) 具有“稳定性”,即当n时, fn(A) 在“一定的意义下收敛于P(A)=p” ,注意,此处的“收敛”不是指通常意义下的数列的收敛,即
lim ( ) (1)nnf A p
不一定成立 . 这一点可说明如下:若 (1) 式成立,由数列极限的定义,对于任意给定的 >0, 总存在 N>0 ,使当 n>N时 , 总有 |fn(A)p|<. 但是,若取 <p ,由于
5
P{fn(A)=0}=(1p)n>0,即不论 N 多大 , 在 N 以后总有可能存在着 n, 使 fn(A)=0 ,对于这样的 n ,总有|fn(A)p|=|0p|=p>. 所以 fn(A) 不可能在通常的收敛意义下收敛到 p.事实上,上述在“一定意义下 fn(A) 收敛于P(A)=p” 是指
lim {| ( ) | } 1nnP f A p
对任意的 >0 成立,此即为下述依概率收敛的定义。
6
定义 1 设 Y1,Y2,…,Yn,… 是一个随机变量序列 , a 是一个常数 , 若对任何正数 , 有
lim {| | } 1, (2)nnP Y a
则称序列 Y1,Y2,…,Yn,…依概率收敛于 a, 记为P
nY a
7
PnY a 的直观解释是:对任意>0, 当 n充
“分大时, Yn与 a的偏差大于” 这一事件{|Yn a|>}发生的概率很小(收敛于 0). 这里的收敛性是在概率意义下的收敛性. 也就是说,不论给定怎样小的>0, Yn与 a的偏差大于是可能的,但是当 n很大时,出现这种偏差的可能性很小. 因此,当 n很大时,我们有很大的把握保证 Yn很接近于 a.
8
依概率收敛序列具有如下性质:设 P
nX a , PnY b , 又设 g(x,y)在点(a,b)
连续,则 ( , ) ( , )Pn ng X Y g a b .
历史上,伯努利首先从理论上证明了在独立重复试验中,事件 A 出现的频率依概率收敛于事件 A的概率.
9
定理 1( 伯努利大数定律 ) 设试验 E 是可重复进行的,事件 A 在每次试验中出现的概率P(A)=p(0<p<1), 将试验独立地进行 n 次,用nA 表示其中事件 A 出现的次数,则对于任意正数 , 有
lim 1 (3)A
n
nP p
n
或
lim 0A
n
nP p
n
或可写成 PAn
pn 即频率收敛于概率
10
证 因为 nA~b(n,p), 故E(nA)=np,D(nA)=np(1p).
由数学期望和方差的性质,有
2
1 (1 ), ( ) .A A
A
n n p pE p D D n
n n n n
于是任取 >0, 由切比雪夫不等式可得
2 2
1 (1 )0nA An n p p
P p Dn n n
即lim 1 lim 1A A
n n
n nP p P p
n n
11
定理 1 以严格的数学形式表述了概率的稳定性,即当 n 很大时,事件发生的频率与概率有较大偏差的可能性很小,由实际推断原理,在应用中,当试验次数很大时,便可以用事件发生的频率来代替事件发生的概率 .
12
若记 Xi 为第 i 次试验中事件 A 出现的次数,即在第 i 次试验中, A 出现则 X 取值为 1 ,否则取值为 0 ,则
1 1 1 1
1 1 1, , ( ) ( )
n n n nA
A i i ii i i i
nn X X p P A E X
n n n n
故定理 1 可以写成
1 1
1 1lim ( ) 1 (4)
n n
i in
i i
P X E Xn n
定理 1 是大数定律的一种特殊情形 . 一般地 , 若随机变量序列 X1,X2,…, 的数学期望都存在,且满足 (4) 式,则称其此序列满足大数定律 .
13
定理 2( 切比雪夫大数定律的特殊情况 ) 设随机变量 X1,X2,…,Xn,… 相互独立,且具有相同的数学期望和方差 : E(Xk)=,D(Xk)=2 (k=1,2,…). 作前 n 个随机变量的算术平均
1
1,
n
kk
X Xn
则对于任意正数 , 有
1 1
lim {| | }
1 1lim ( ) 1
n
n n
k knk k
P X
P X E Xn n
14
证 由于
1 1
22
2 21 1
1 1 1( ) ,
1 1 1( ) ,
n n
k kk k
n n
k kk k
E X E X nn n n
D X D X nn n n n
任取 >0, 由切比雪夫不等式可得
2
21
1 /1 .
n
kk
nP X
n
在上式令 n, 并注意概率不能大于 1 ,可得
1
1lim 1
n
knk
P Xn
15
定理 2表明,在所给条件下,n个随机变量
X1,X2,…,Xn的算术平均值1
1 n
ii
X Xn
当 n
时,依概率收敛于. 例如, 我们用同一测量装置重复测量一个物理量共 n次,得到测量值 x1,x2,…,xn,把它们可以看作是 n个相互独立的,具有相同的数学期望和方差2的随机
变量 X1,X2,…,Xn的取值,我们常取1
1 n
ii
xn
,
这是因为2
( ) , ( )E X D Xn
,
16
当 n时, ( ) 0D X ,因此X将比较密集地聚集在的附近,这正是定理 2所阐明的意义。 定理 2 中要求随机变量 X1,X2,…,Xn,…的方差存在,但在这些随机变量服从同一分布的情况下,并不需要这一要求, 我们有如下定理。
17
定理 3 ( 辛钦大数定律 ) 设随机变量 X1,X2 ,…,Xn ,… 相互独立,服从同一分布,具有数学期望 E(Xk)=(k=1,2,…,), 则对于任意正数,有
1
1lim 1
n
kn
k
P Xn
辛钦大数定律的证明超过了我们的知识范围 . 它在数理统计中十分有用。
18
第二节 中心极限定理
19
对于中心极限定理的掌握,不需要去了解任何定理,只需要记住如下的描述即可:当一个随机变量 X 是由 n 个相互独立的随机变量的和构成,即 X=X1+X2+…+Xn ,则只要n 足够大 ( 最好超过 100 ,但是,如果 n 大于20 就足够好 , 大于 10 有时也凑合 ) ,而且这n 个随机变量的数学期望和方差都存在,且它们的方差都差不多大,则 X 近似服从正态分布。 ( 这里不管这 n 个随机变量的分布有多么地不同,甚至有的是离散型有的连续型。 )
20
说严格点,假设 X1,X2,…,Xn是 n 个相互独立的随机变量,其中 E(Xi)=i, D(Xi)=i
2, i=1,2,…,n, X=X1+X2+…+Xn, 则根据数学期望和方差的性质可得E(X)==1+2+…+n, D(X)=2=1
2+22+…
+n2,
则只要 n 相当大 (>10) ,就近似有 X~N(,2).最常见的情况是 X1,X2,…,Xn 相互独立同分布它们的期望和方差都是 , 2, 则 X=X1+…+Xn
近似服从 N(n,n2). 这其实就是定理 1 的意思 .
21
一种情况是 X~b(n,p), 则 X 可被视为由 n 个相互独立的 0-1 分布的随机变量相加构成,因为 E(X)=np, D(X)=np(1p) ,因此只要 n 足够大 (>20) ,就近似有 X~N(np, np(1p)). 这其实就是定理 2( 德莫佛 - 拉普拉斯中心极限定理 ).
22
可以用 excel 结合应用数学家园网站的直方图功能来观察大致的中心极限定律的效果 , 在excel 的一个单元格中键入=rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()+rand()将此单元格复制到多个单元格 ,然后将值复制到应用数学家园网站的直方图功能中 , 就可以看到大致的正态分布的形状 .如果每一个单元格只是一个 rand(), 将看到均匀分布的直方图 .
23
例 1 独立地掷 10颗骰子,求掷出的点数之和在 30到 40 点之间的概率 .解 以 Xi 表示第 i颗骰子掷出的点数 (i=1,2,…,10), 则
2
1{ } , 1,2, ,6
67 35
( ) , ( )2 12
i
i i
P X j j
E X D X
点数之和为 X=X1+X2+…+X10, 则近似有70 350
~ ,2 12
X N
或 X~N(35,29.16667)
24
X~N(35,29.16667)因此有
{30 40}
30 35 35 40 35
29.16667 29.16667 29.16667
0.92582 ( 0.92582)
2 (0.92582) 1 2 0.8238 1
0.6476
P X
XP
25
例 2 在一家保险公司有一万人参加保险,每年每人付 12元保险费 . 在一年内这些人死亡的概率都为 0.006 ,死亡后家属可向保险公司领取 1000元,试求:(1) 保险公司一年的利润不少于 6万元的概率 ;(2) 保险公司亏本的概率 .解 设参保的一万人中一年内死亡的人数为 X ,则 X~b(10000, 0.006), E(X)=60, D(X)=59.64, 因此近似有 X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属 1000X元,一年的利润为
1200001000X=1000(120X).
26
解 设参保的一万人中一年内死亡的人数为 X ,则 X~b(10000, 0.006), E(X)=60, D(X)=59.64, 因此近似有 X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属 1000X元,一年的利润为
1200001000X=1000(120X).(1) 保险公司一年利润不少于 6万元的概率为 {1000(120 ) 60000} {120 60}
{ 60} 0.5
P X P X
P X
27
解 设参保的一万人中一年内死亡的人数为 X ,则 X~b(10000, 0.006), E(X)=60, D(X)=59.64, 因此近似有 X~N(60, 59.64), 保险公司年收入10000元保险费,付给死者家属 1000X元,一年的利润为
1200001000X=1000(120X).(2) 保险公司亏本的概率为
{1000(120 ) 0} { 120}
60 120 601 (7.769)
59.64 59.64
1 1 0
P X P X
XP
28
例 3 独立地测量一个物理量,每次测量产生的误差都服从区间 (1,1) 上的均匀分布 .(1) 如果取 n 次测量的算术平均值作为测量结果 , 求它与其真值的差小于一个小的正数的概率 ;(2) 计算 (1) 中当 n=36, =1/6 时的概率的近似值 ;(3) 取 =1/6, 要使上述概率不小于 =0.95, 应进行多少次测量?解 (1) 用表示所测量物理量的真值, X 表示第 i 次测量值 , i 表示第 i 次测量所产生的随机误差 (i=1,2,…,n), 于是 Xi=+i, 由题设 i~U(1,1)
29
(1) 如果取 n 次测量的算术平均值作为测量结果 , 求它与其真值的差小于一个小的正数的概率 ;解 (1) 用表示所测量物理量的真值, X 表示第 i 次测量值 , i 表示第 i 次测量所产生的随机误差 (i=1,2,…,n), 于是 Xi=+i, 由题设 i~U(1,1), 所以
2[1 ( 1)] 1( ) 0, ( ) ,
12 31
( ) , ( ) ( ) ( 1,2, , ).3
i i
i i i
E D
E X D X D i n
30
(1) 如果取 n 次测量的算术平均值作为测量结果 , 求它与其真值的差小于一个小的正数的概率 ;
1( ) , ( ) ( ) ( 1,2, , ).
3i i iE X D X D i n
因此 X1+X2+…+Xn近似服从 ,3
nN n
,
1 2 nX X XX
n
近似服从
1,3
Nn
, 则
{| | }1 (3 ) 1 (3 )
XP X P
n n
31
1 2 nX X XX
n
近似服从
1,3
Nn
, 则
{| | }1 (3 ) 1 (3 )
2 ( 3 ) 1
XP X P
n n
n
(2) 当 n=36, 1
6 时,
上式=1
2 3 36 1 2 (1.73) 1 0.926
32
{| | } 2 ( 3 ) 1P X n
(3) 要求 n使得2 ( 3 ) 1 0.95n ,即
1 0.95( 3 ) 0.975
2n
,反查正态分布表得
必须 3 1.96n ,即2
2
1.96
3n
,将
1
6 代入得
21.9636 46
3n 。
33
作业 :第 132页开始习题 5-1,2 第 3,4,5,7题
34
作业题讲解 :习题 4-1 10. 若有 n把看上去样子相同的钥匙 , 其中只有一把能打开门上的锁 , 用它们去试开门上的锁 , 设取到每只钥匙是等可能的 , 若每把钥匙试开一次后除去 , 求试开次数 X 的期望 .
35
作业题讲解 :习题 4-1 10. 若有 n把看上去样子相同的钥匙 , 其中只有一把能打开门上的锁 , 用它们去试开门上的锁 , 设取到每只钥匙是等可能的 , 若每把钥匙试开一次后除去 , 求试开次数 X 的期望 .
解 : 试开次数可能为 1次 ,2次 ,3次 ,…,n 次共 n 种可能 , 这些可能的大小一样 , 即有P{X=1}=P{X=2}=…=P{X=n}=1/n, 因此
1 1
1 1 ( 1) 1( )
2 2
n n
i i
i n n nE X i
n n n
top related