第六章 正态条件下回归的推论

81
第第第 第第第第第第第第第第

Upload: iren

Post on 04-Jan-2016

91 views

Category:

Documents


3 download

DESCRIPTION

第六章 正态条件下回归的推论. 问题的提出. 在前述各章中我们假定随机扰动项服从均值 =0 ,方差等于(常数),独立同分布。但是,并没有假定随机扰动项服从何种具体的分布。 由于没有假定服从何种具体的分布,因而无法计算随机扰动项取不小于某值的概率,因而也无法计算估计量取某种值的概率,也就无法对统计量进行假设检验和进行区间估计。 点估计给出是某个具体的数值,无法给出相应的可靠性,也就是我们得出的结论的缺乏可靠性,从而降低了结论的有效性与实用性。 如果假定随机扰动项服从正态分布,那么估计量就可立即得到相应的区间估计及其概率,也就是结论具有了可靠性。. 同方差 = 常数,协方差 =0. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第六章  正态条件下回归的推论

第六章 正态条件下回归的推论

Page 2: 第六章  正态条件下回归的推论

问题的提出• 在前述各章中我们假定随机扰动项服从均值 =0 ,方差

等于(常数),独立同分布。但是,并没有假定随机扰动项服从何种具体的分布。

• 由于没有假定服从何种具体的分布,因而无法计算随机扰动项取不小于某值的概率,因而也无法计算估计量取某种值的概率,也就无法对统计量进行假设检验和进行区间估计。

• 点估计给出是某个具体的数值,无法给出相应的可靠性,也就是我们得出的结论的缺乏可靠性,从而降低了结论的有效性与实用性。

• 如果假定随机扰动项服从正态分布,那么估计量就可立即得到相应的区间估计及其概率,也就是结论具有了可靠性。

Page 3: 第六章  正态条件下回归的推论

种假定呢?为什么要进一步作出这

的性质是什么?、、现在,假定

布总之仍然不知是什么分

BNii

XXBdiiB

XXBVarBBEYXXXB

VarMinE

adiidii

a

byu

bbbywb

xbxbyu

uxbxby

iii

iiiiii

ikkiii

iikkii

ˆ),0(..~

,..~ˆ

ˆ)ˆ(ˆ

)()(

,..~),0(..~

ˆ

ˆˆ

2

21

211

2

11

2

11

Page 4: 第六章  正态条件下回归的推论

2

2

2

00

0

00

00

uiVar

同方差 = 常数,协方差 =0同方差 = 常数,协方差 =0

nxn , x

Z 自变量与随机扰动项无关,从而自变量之间也无关。X 是确定性变量, Y 只有垂直变动

Page 5: 第六章  正态条件下回归的推论

解决问题的思路• 首先,复习有关正态分布的一些结论• 进而假定随机扰动项服从正态分布• 导出估计量也服从正态分布• 给出关于估计量的假设检验和区间估计• 再给出利用模型进行预测的可靠性,使

模型能够运用于实际

Page 6: 第六章  正态条件下回归的推论

有关正态分布的一些结论• 1 、正态分布的线性组合也服从正态分布• 2 、标准正态分布的平方和服从卡平方分

布• 3 、标准正态分布除以卡平方分布及其自

由度的商,服从 t 分布• 4 、两个卡平方分布分别除以各自自由度

的商之比服从 F 分布

Page 7: 第六章  正态条件下回归的推论

FZ

ZZZ

t

N

NN

aaNaN

nn

nn

n

n

n

n

iii

n

iiiiiiiiii

n

nF

nZ

Nt

ZN

N

NN

2,1

22

11

2

22

2

11

22

2

1

22

1

222

~

~,~.4

~

~,0~.3

~,0~.2

,~,~.1

Page 8: 第六章  正态条件下回归的推论

第一节 问题的引入• 1 、假定随机扰动项服从正态分布,导出

Yi 也服从正态分布• 2 、一元模型中斜率也服从正态分布• 3 、一元模型中截距也服从正态分布• 4 、回归估计系数的分布的总结

Page 9: 第六章  正态条件下回归的推论

1 、假定随机扰动项服从正态分布,导出Yi 也服从正态分布

2

2

2

,..~

,0..~

xyuuxy

xuxyy

uxyuyuuxy

ii

iiii

iiii

i

iiiii

iiii

baNii

VarbaVarVar

baEbaE

ba

Niiba

也服从正态分布

然服从正态分布正态分布的线性组合仍

的线性组合是服从正态分布

Page 10: 第六章  正态条件下回归的推论

2 、一元模型中斜率也服从正态分布

xx

xx

yywyxx

xxyuuxy

i

i

iiii

i

i

iiiiii

bNb

bVarbbEb

bx

b

baNiiNiiba

2

2

2

2

2

22

,~ˆ

ˆˆˆ

ˆˆ

,..~,0..~

且也服从正态分布

的线性组合是

Page 11: 第六章  正态条件下回归的推论

xxx

xxxxx

xxxxxx

xxxxx

xxx

xxx

xx

xx

yywyxx

xxyuuxy

i

i

i

i

i

ii

i

i

i

i

i

i

i

iiii

i

i

iiiiii

nn

nn

n

nnx

n

n

n

naNabNb

bVarbbEb

bx

b

baNiiNiiba

2

2

2

222

2

222

2

22

2

2

2

2

2

2

2

2

2

2

22

22

21

,~ˆ,~ˆ

ˆˆˆ

ˆˆ

,..~,0..~

同理即

且也服从正态分布

然服从正态分布正态分布的线性组合仍

的线性组合是

Page 12: 第六章  正态条件下回归的推论

3 、一元模型中截距也服从正态分布

2

2

2

2

2

2

22

,~ˆ

ˆˆˆ

ˆ

11ˆˆ

,..~,0..~

xxx

xxx

y

ykywywy

xyuuxy

i

i

i

i

i

iiiiiii

iiiiii

naNa

naVaraaEa

a

xn

xn

xbya

baNiiNiiba

且也服从正态分布

的线性组合是

Page 13: 第六章  正态条件下回归的推论

4 、回归估计系数的分布的总结

估计出来?将

未知,怎样决:参数仍然有一个问题有待解

服从正态分布的线性组合是

现假定

原假定

2

2

21

21

1

2

2

2

,~ˆ

ˆˆ

ˆˆ

,~

,0~

,0..~

XXXBNB

XXBVarBBE

BYYXXXB

IXBNY

INuuXBY

IdiiuuXBY

Page 14: 第六章  正态条件下回归的推论

第二节 问题的解决• 1 、解决问题的关键是样本带来了总体的信

息,所以用样本的信息去估计总体的信息。• 2 、用残差去估计总体的随机扰动项,进而

用残差的方差去估计随机扰动项的方差• 3 、构造残差的方差为随机扰动项方差的无

偏估计量。• 4 、随机扰动项方差的估计量 S2 的分布

Page 15: 第六章  正态条件下回归的推论

1 、解决问题的关键是用样本残差去估计总体的随机扰动项

• 解决问题的关键是用样本残差去估计总体的随机扰动项。

• 进而用样本残差的方差 S2 去估计随机扰动项的方差—— 2

• 最后,在随机扰动项服从正态分布的假定下,导出样本残差方差 S2 的性质或分布

Page 16: 第六章  正态条件下回归的推论

2 、随机扰动项方差的估计量

2

12

22

121

2

2

121

2

1

2

11

2

12

22222

222

1

2

11

2

11

~1

~1

1)1(

~)1,0(~0

)ˆ(

~1)2(1

,,,ˆ,

,~),0(~

ˆ

ˆˆ

ˆ

ˆˆˆˆ

ˆˆˆ

knkn

n

ii

kn

n

iin

ii

ii

ii

ikkiiiii

kn

iki

ikkiii

iikkii

su

uNuN

yyxbxbyyyu

sss

ss

ybbyxbxbyu

uxbxby

knknkn

N

a

knE

a

aNN

a

的也服从正态分布。这一线性组合当之无愧

的无偏估计量是)(

的性质:。首先讨论去估计现在用

也服从正态分布服从正态分布,从而

为什么是n-k-1?(第三节)

Page 17: 第六章  正态条件下回归的推论

3 、随机扰动项方差估计量的性质• ( 1 )无偏性 E(S2)=2

• ( 2 )随机扰动项方差估计量 S2 服从卡方分布,自由度 = n-k-1

2

12

2

2222

2

22

1

2

2

~1)2(

1

1

ˆ

kn

n

ii

sss

ss

us

kn

E

kn

的无偏估计量是)(

的性质:

。去估计现在用

Page 18: 第六章  正态条件下回归的推论

第三节 派生内容:自由度• 1 、什么是自由度• 2 、对应于平方和分解的自由度的分解• 3 、 k 元模型中随机扰动项的自由度为什

么 =n-k-1?

Page 19: 第六章  正态条件下回归的推论

1 、什么是自由度• 模型中样本值可以自由变动的个数,称为

自由度• 自由度 = 样本个数 - 样本数据受约束条件

(方程)的个数• 例如,样本数据个数 =n ,它们受 k+1 个

方程的约束(这 n 个数必须满足这 k+1 个方程)

• 那么,自由度 df = n-k-1

Page 20: 第六章  正态条件下回归的推论

数据个数与约束方程• Y1+Y2+Y3=7

• Y1=7

• 那么 Y2 、 Y3 中只有 1 个是自由的。• 又如:• Y1+Y2+Y3+Y4=7

• Y1=7

• 那么, Y2 、 Y3 、 Y4 中只有 2 个是自由的

Page 21: 第六章  正态条件下回归的推论

2 、对应于平方和分解的自由度的分解

•自由度 = 变量个数 - 约束方程个数•TSS=RSS+ESS dfT=dfR+dfE

•dfT=n-1

•dfR=k

•dfE=dfT-dfR= n-1-k = n - (k+1)

1

0

0

2

1 1

22

2

ˆ

ˆ

ˆˆ

knRSSTSSESS

nk

kk

RSS

ynTSS

df

ybu

b

dfb

xxbyy

yyy

E

ij

i

j

Rj

k

j

n

ijijji

ii

所以,

约束个个方程对方程求出,共有由而

在变,个只有

一个方程的约束受

Page 22: 第六章  正态条件下回归的推论

3 、 k 元模型中随机扰动项的自由度为什么

=n-k-1?

的由来。个方程求出。这就是过上列

个通个是自由的,其余中只有个

的自由度个方程的约束。因此,受个变数这里共有

求导)(对

求导)(对

求导)(对

求偏导数:

2

1

1

11

1111

11

11

22

1

11,1)1(

1

0

0

0

0

0

0

kn

i

ii

k i

i

i

kikkiiik

ikkiii

ikkii

iikkii

k

kknnknkn

kn

a

a

aa

MinMin

uuu

ux

uxu

bxbxbyx

bxbxbyxxbxby

uxbxbau

Page 23: 第六章  正态条件下回归的推论

第四节 回归系数的假设检验• 1 、大样本与小样本• 2 、斜率的分布• 3 、回归系数假设检验的意义• 4 、假设检验的原理• 5 、假设检验的种类• 6 、 F 检验的步骤• 7 、 t 检验的步骤• 8 、回归分析进行假设检验的步骤

Page 24: 第六章  正态条件下回归的推论

1 、大样本与小样本• 中心极限定理告述我们:• 随机变量 X 无论服从什么分布,只要它的方差

存在,只要样本个数 n 充分的大, X 的平均数就服从正态分布。

• 那么,充分大在实际应用中怎样掌握呢?• 凡是 n >30 ,我们就可以认为它具有此种极限

性质,称为大样本。• 否则,就称为小样本,小样本不具有此种极限

性质。

Page 25: 第六章  正态条件下回归的推论

2 、斜率的分布• ( 1 )已知 2 或大样本情形

• ( 2 )未知 2 且为小样本情形

1,0~ˆ

,~ˆ

2

22

2

Nbb

NbNb

xxxx

i

i

Page 26: 第六章  正态条件下回归的推论

( 2 )未知 2 且为小样本情形

xxss

xx

t

s

xx

i

i

kn

kn

i

bb

bb

t

knZ

Nt

knZN

bbN

2

2

2

2

2

2

1

2

12

2

2

2

ˆ

ˆ

~

1

~1

1,0~ˆ

Page 27: 第六章  正态条件下回归的推论

t

xxRsb

xxRsbb

bbb

bb

Rxs

b

sRxb

xxxxxx

xxxxx

xb

kn

ii

xxi

xxi

ii

ii

ii

i

iiii

i

SEt

VarSE

Var

Var

Var

1

11

22

12

2

1

11

22

12

2

11

1

11

11

2

21

2

1

2

1

22

2

21

2

1

2

1

2

2

2

2

1

21

2

2

2

2

1

2

22

21

22

2

2

1

2

2

1

~

11

1

1

1

ˆˆˆ

ˆ

ˆˆ

ˆ

ˆ

ˆ

估计现在用

Page 28: 第六章  正态条件下回归的推论

0:0:

,0)(

10

2211

HbHuuxbxby

A

iiiiiEa

欲检验

未知方差

定。的概率越小,结论越肯绝的绝对值越大越好,拒

,软件给出这个,否则不拒绝,那么拒绝如果

HHHt

tt

xxRsb

xxRsbb

tt

xxRsb

xxRsbb

t

tt

t

t

kn

nkn

ii

nkn

ii

0

001,

121

22

22

21

2

2

22

22

21

2

22

121

11

22

12

2

1

11

22

12

2

11

~

11

~

11

ˆˆ

ˆˆ

Page 29: 第六章  正态条件下回归的推论

0:0:

,0)(

10

2211

HbHuuxbxby

A

iiiiiEa

欲检验

未知方差

3 、回归系数假设检验的意义• 通过 F 检验只是对方程作为一个整体进

行检验,只要其中一个或几个自变量的系数显著不为零,整个方程就是有意义的。

• 但是,还必须继续对各个自变量的系数进行检验,否则方程中会包含一些对因变量从统计意义上说没有意义的自变量

Page 30: 第六章  正态条件下回归的推论

3 、回归系数假设检验的意义• 例如: Y^=1.78+1.56X1+0.036X2• 对多元回归除了进行整体检验外,还需要分别对 X1 和

X2 的系数进行 t 检验。• 对 X1 的系数检验,计算出来的 t 大于临界值,拒绝H0 ,

即 X1 的系数与 0 有显著的差异,认为 X1 对 Y 有意义;• 对 X2 的系数检验,计算出来的 t 小于临界值,不拒绝

H0 ,认为 X2 的系数与 0 没有本质的差异,虽然它 =0.036 ,于是认为 X2 对 Y 没有意义,是方程中的累赘,应剔除,重新估计方程。

• 因此,要求方程中所有系数都应与 0 差异显著。

Page 31: 第六章  正态条件下回归的推论

4 、假设检验的原理• 1 、提出二择一的假设 H0 (往往与试验目的相反)与 HA (往往是欲得到的结论)

• 2 、给定显著水平(小概率)• 3 、在 H0成立下,收集数据,寻找检验统计量(如 t 、 F ),肯

定知道统计量的分布,可计算各种取值的概率• 4 、找出小概率发生的临界值• 5 、将样本值和 H0代入检验统计量进行计算• 6 、将计算结果与临界值比较,若大于临界值,小概率事件发生,根据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在哪里?

• 7 、原来是假设 H0错了,因为一切都是在 H0成立下推证的,于是拒绝H0 。否则,不拒绝H0

Page 32: 第六章  正态条件下回归的推论

大海里捞针——反证法• H0 :一棵针掉进了大海里(海底只有一棵针)• HA :海底不只一棵针• 显著水平 =0.01 (小概率)• 进行试验——到海底捞针• 通常用大海里捞针比喻不可能发生的事• 现在,一次潜水(试验)就捞上一棵针,这掉下

的一棵针居然被我们捞上来,不可能发生的事件发生了,于是拒绝 H0 ,认为大海里不只一个针。

Page 33: 第六章  正态条件下回归的推论

两类错误之一——弃真• 1 、 H0 :海底只有一棵针。但一次试验捞了上来。因

为小概率事件发生,必须拒绝( H0 )。然而海底真的只有一棵针,结论说不只一棵针。犯弃真错误了,只有拒绝H0时才会犯弃真错误

• 2 、此时犯了弃真的错误,但是犯弃真错误的可能性,事先已经控制——只有显著水平(小概率)那么大

• 3 、所以拒绝不仅是坚决的,而且犯错误的概率(冒险率是事先控制的)也很小。所得结论的可靠性 = 1-

• 4 、所以,人们提出的 H0 通常是无效的

Page 34: 第六章  正态条件下回归的推论

犯两类错误之二——纳伪• H0 :某某(高考的考生) = 大学生(准予参考就是提出

这个假设,即假设他是优秀青年)• 进行抽样试验——参加高考• 检验统计量——考试总分(包括加分)• 众所周知,大学生乃同龄人中的佼佼者,而该某某平时素质和学业平平,距高等学府之路遥遥,被录取(总分超过报考学校的录取线)的概率很小。 H0成立下,优秀毕业生考分低于录取线(失常)的概率很小。

• 在此次抽样中他的总分喜煞人,由于小概率事件(优秀者失常)没有发生,于是不能拒绝H0 。某某顺利进入重庆某学院,显然属于纳伪。

Page 35: 第六章  正态条件下回归的推论

不拒绝 H0 是无可奈何• 某某进入高校,招生犯了纳伪的错误• 进行检验时,没有事先控制纳伪的概率——无

法度量犯纳伪的可能性。也就不能给出不拒绝H0 结论(录取进大学)的可靠性( 1- )。

• 就本次试验而言,不拒绝 H0 是无可奈何的。• 千万不可,以接受 H0 作为我们研究的结论。欲证明 H0成立必须继续抽样、继续检验,并采用功效函数。

• 所以某某进校后不断地被抽样、被检验

Page 36: 第六章  正态条件下回归的推论

5 、假设检验的种类• 1 、参数检验• 已知分布形式,检验分布的参数,例如

检验均值或检验方差• 2 、非参数检验• 检验随机变量的分布形式,例如是否服

从正态分布• 本课程主要讨论参数检验

Page 37: 第六章  正态条件下回归的推论

6 、假设检验的步骤—— t 检验为例

• 1 、提出假设 H0 和 HA

• 2 、收集数据估计出 b^

• 3 、计算出 2 的估计量 s2

• 4 、计算检验统计量 t (代入假设 H0 )• 5 、根据显著水平,查出临界值 t• 6 、作出统计推断:如果 t>t ,拒绝H0;否则

不拒绝H0 。 t 的绝对值越大,自变量对因变量的作用越显著。

Page 38: 第六章  正态条件下回归的推论

比较,下结论(绝对值)与

查出临界值根据

t

txx

sxx

s

xxss

kn

kn

ii

i

t

kn

bt

bbt

bSEkn

ESS

1,2

1,2

2

2

2

2

2

22

,1,

ˆˆ

ˆ1

t检验的步骤

t

f(t)

t kn 1,2

t kn 1,

2

不拒绝 H0 区域

拒绝域拒绝域

Page 39: 第六章  正态条件下回归的推论

t

f(t)

t kn 1,2

t kn 1,

2

不拒绝 H0 区域

拒绝域拒绝域

Page 40: 第六章  正态条件下回归的推论

t

f(t)

t kn 1,2

t kn 1,

2

不拒绝 H0 区域

拒绝域拒绝域

Page 41: 第六章  正态条件下回归的推论

1ˆˆˆˆ

1ˆˆ

ˆ

ˆˆ

ˆ

ˆ

1

1,2

1,2

1,2

1,2

1,2

2

2

2

2

1,2

1,2

tt

t

tt

xxs

xxs

tt

knkn

kn

knkn

i

i

knkn

bSEbbbSEbP

bSEbbP

bSE

bbptp

bSEbb

bSE

bbt

tptp

Page 42: 第六章  正态条件下回归的推论

HH

b

b

0

0

ˆ

ˆ

1

在置信区间内,不拒绝

在置信区间外,拒绝

间置信区间是一个随机区置信度

显著水平(冒险率)

b^

f(b^)

bSEb t knˆˆ

1,2

bSEb t kn

ˆˆ1,

2

置信区间

上限下限

假设检验与区间估计是一个问题的两个方面

Page 43: 第六章  正态条件下回归的推论

b^

f(b^)

bSEb t knˆˆ

1,2

bSEb t kn

ˆˆ1,

2

置信区间

上限下限

Page 44: 第六章  正态条件下回归的推论

t

f(t)

t kn 1,2

t kn 1,

2

Page 45: 第六章  正态条件下回归的推论

F 检验的步骤• 假定随机扰动项 u 服从正态分布。检验目标是联合检验,• ( 1 )提出假设 H0: b1 = b2 =b3 =……=bk=0

• ( 2 )适合的检验统计量

• ( 3 )根据冒险率,确定临界值 F• ( 4 )将计算出的 F 与临界值 F 比较• ( 5 )下结论:若 F>临界值 F ,则拒绝 H0;若 F<=临界值 F ,则

不拒绝 H0

• ( 6 )结合经济学理论与经验,下经济学的结论或进行经济学分析

1/

/

1/

/

ˆˆ

2

2

1,

knESS

kRSS

kn

k

yy

yyF

ii

iknk

Page 46: 第六章  正态条件下回归的推论

1-

F

F

f(F)

Page 47: 第六章  正态条件下回归的推论

7 、回归分析进行假设检验的步骤• ( 1 )查看拟合优度,进行 F 检验,从整体上判断回归

方程是否成立,如果 F 检验通不过,无须进行下一步;否则进行下一步

• ( 2 )查看各个变量的 t 值及其相应的概率,进行 t 检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为 0 ,该自变量对因变量作用显著;否则系数与 0 无显著差异(本质上 =0 ),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。

• ( 3 )但是,一次只能将最不显著(相应概率最大)的删除。

Page 48: 第六章  正态条件下回归的推论

第五节 预测• 1 、预测的定义• 2 、利用模型进行预测的种类• 3 、一般水平的预测• 4 、个体水平的预测• 5 、预测的精度• 6 、滞后模型进行预测• 7 、案例分析——假日旅馆房间收入的预测• 8 、指数平滑预测

Page 49: 第六章  正态条件下回归的推论

1 、预测的定义• 预测是对于未来或未知的预计与推测• 预测不是臆测,这里的预测是科学的预测,它是建立在对预测对象认识、分析和科学的推理基础之上的。

• 由于客观世界的复杂性和不确定性与人类认识的矛盾,以及预测科学(又称未来学)仍然处于成长阶段,还有预测手段的不完善,尤其是与进行预测人员的素质、知识、经验、魄力、胆略、价值取向密切相关,所以预测既是一门科学又是一门艺术。

Page 50: 第六章  正态条件下回归的推论

2 、利用模型进行预测的种类• ( 1 )定性预测与定量预测• ( 2 )模型预测与非模型预测

– 即利用回归直线或其它模型进行预测,由于回归直线本身有一个变动幅度(随抽样不同而不同),也一定存在误差。

– 一般水平预测与个别值的预测– 点预测与区间预测

• ( 3 )超长期预测、长期预测、中期预测、短期预测

• ( 4 )情景预测

Page 51: 第六章  正态条件下回归的推论

3 、一般水平的预测• 关于平均水平的预测——关于 E(y^)=a^+b^x 均值的

预测• 因为随机扰动项的平均数 =0 ,所以随机扰动项对预

测值没有影响• 随机扰动项有一个变动幅度,由于没有考虑随机扰

动项的变动幅度• 因此,预测的方差会相应的小些• 为什么一般水平的预测也会存在预测误差呢?因为 a

^ 和 b^ 随着样本的不同而不同,有一个变动幅度,所以 E(y^) 也有一个变动幅度。

Page 52: 第六章  正态条件下回归的推论

1,

)1(~

1

1,0~

1

1,~

12

1

)ˆ,ˆ(21

)ˆ,ˆ(2)ˆ()ˆ()ˆˆ()(ˆˆ

1,2

1,2

2

2

2

2

2

2

2

2

2

2

2

2

2

22

222

2

2

2

222

2

2

ˆˆˆˆ

ˆˆˆˆˆ

ˆˆˆˆˆ

ˆˆ

ˆˆ

tyytyy

sxxxx

yyyyy

xxxx

yyyyy

xx

xxyy

xx

xxxx

xxx

xxx

x

xxx

xxx

x

xxxyxy

kniiknii

i

i

ii

i

ii

i

i

ii

i

ii

i

i

ii

i

i

i

i

i

i

i

i

i

i

i

iiiiii

VarSEVarSEP

knt

n

E

VarSE

E

N

n

E

VarSE

E

nEN

n

x

n

ban

baCovbVaraVarbaVarVarba

Page 53: 第六章  正态条件下回归的推论

1,

)1(~

1

1,0~

1

1,~

12

1

)ˆ,ˆ(21

)ˆ,ˆ(2)ˆ()ˆ()ˆˆ()(ˆˆ

1,2

1,2

2

2

2

2

2

2

2

2

2

2

2

2

2

22

222

2

2

2

222

2

2

ˆˆˆˆ

ˆˆˆˆˆ

ˆˆˆˆˆ

ˆˆ

ˆˆ

tyytyy

sxxxx

yyyyy

xxxx

yyyyy

xx

xxyy

xx

xxxx

xxx

xxx

x

xxx

xxx

x

xxxyxy

kniiknii

i

i

ii

i

ii

i

i

ii

i

ii

i

i

ii

i

i

i

i

i

i

i

i

i

i

i

iiiiii

VarSEVarSEP

knt

n

E

VarSE

E

N

n

E

VarSE

E

nEN

n

x

n

ban

baCovbVaraVarbaVarVarba

Page 54: 第六章  正态条件下回归的推论

nst

1

xx

xxi

i

nst 2

2

1

xiba ˆˆ

x xi

X

Y

0

= 平均数时,预测误差最小xi

Page 55: 第六章  正态条件下回归的推论

影响预测误差的因素

• 1 、 ( 1- ) t 预测误差(只有这么多信息,可靠性预测误差 ,可靠性 预测误差 )

• 2 、 x 均值预测误差• 3 、 x 方差 预测误差• 4 、 n 预测误差

1,

1

ˆˆ

1,2

1,2

2

2

2

ˆˆ

ˆ

tyytyy

sxx

xxy

xy

kniiknii

i

i

i

ii

VarSEVarSEP

nVarSE

ba

Page 56: 第六章  正态条件下回归的推论

4 、个体水平的预测• 是关于个别值( Yi )的预测,• 因为一个 Xi 会对应多个 Yi ,由于考虑了随

机扰动项的变动(一般水平预测,随机扰动项 =0 ,不于考虑)

• 个别值总是在均值附近振动外再加一个随机扰动项的变动,所以个体预测值的变动幅度大些。

• 个体水平的预测是关于 Yi=a+bXi+ui 的预测

Page 57: 第六章  正态条件下回归的推论

1,

)1(~

11

1,0~1

1,~

11

1

)ˆˆ()(ˆˆ

1,2

1,2

2

2

2

22

2

2

2

2

2

2

2

2

2

ˆˆˆˆ

ˆˆˆˆˆ

ˆˆˆ

ˆˆ

tyytyy

sxxxx

yyyyy

yyy

xx

xxyy

xx

xxxx

xx

xuyuxy

kniiknii

i

i

ii

i

ii

i

ii

i

i

ii

i

i

i

i

iiiiii

VarSEVarSEP

knt

n

E

VarSE

E

NVarSE

E

nEN

nn

baVarVarVarba

)(已知

个别值的预测误差自然比一般水平的预测误差增大

Page 58: 第六章  正态条件下回归的推论
Page 59: 第六章  正态条件下回归的推论

5 、滞后模型进行预测

Page 60: 第六章  正态条件下回归的推论

7 、案例分析——假日旅馆房间收入的预测

• 已知(美国 1970-1980年间):• 房间总收入 =

• 房间租用率 X 房间总数 X 平均租金• 要求:• 根据美国假日旅馆近年来的年报和美国政府公布的资料,预测假日旅馆明年房间总收入?

Page 61: 第六章  正态条件下回归的推论

REV OCCP RRATE ROOMS GNP PGNP UNEMP CPR697. 3471 68. 5 15. 55 179364. 0 922. 7 91. 45 4. 90 7. 72813. 7161 67. 4 16. 50 200464. 0 1077. 6 96. 01 5. 90 5. 11962. 5911 70. 7 16. 87 221113. 0 1185. 9 100. 00 5. 60 4. 691121. 7400 70. 6 17. 63 246913. 0 1326. 4 105. 69 4. 90 8. 151223. 5500 68. 3 18. 38 267032. 0 1434. 2 114. 92 5. 60 9. 871369. 2100 65. 4 20. 86 274969. 0 1549. 2 125. 56 8. 50 6. 331539. 0700 68. 4 22. 17 278064. 0 1718. 0 132. 11 7. 70 5. 351780. 4900 71. 2 24. 56 278957. 0 1818. 0 139. 83 7. 00 5. 602160. 9780 74. 3 27. 81 286529. 0 2156. 1 150. 05 6. 00 7. 992605. 0000 73. 8 32. 65 296251. 0 2413. 9 162. 77 5. 80 10. 912915. 5300 71. 5 36. 80 303578. 0 2627. 4 177. 45 7. 10 12. 29

Page 62: 第六章  正态条件下回归的推论

资料( LX4\SHM31 )

变量名 指标含义及单位FJZSR 房间总收入,百万美圆FZ 房租,平均每天租出房间的百分比FJSHM 假日旅馆房间总数GNP 美国国民生产总值(用现价计)PGNP 表示GNP隐含的价格因素,用以修正GNP剔除价格因素SHYL 美国失业率SYZQLL 主要商业证券利率

Page 63: 第六章  正态条件下回归的推论

预测步骤• 1 、预测房间租用率 FJZYL

• 2 、预测平均房租 FZ

• 3 、预测房间数目 FJSHM

• 4 、预测房间总收入• =FJZYL X FZ X FJSHM

Page 64: 第六章  正态条件下回归的推论

分析房间租用率• 假日旅馆的房间租用率与美国经济形势

有关,而失业率是一个反映经济形势的很好的指标

• 而且,经验表明短期利率是反映和预测今后一般经济活动很好的指标

• 当然,不能仅用失业率的下降趋势来解释租用率的上升,它们还受发展趋势的影响,所以生成一个增长趋势指标 QSH

Page 65: 第六章  正态条件下回归的推论

租用率关于失业率和趋势回归

Page 66: 第六章  正态条件下回归的推论

考虑不知道当期值不能预测

Page 67: 第六章  正态条件下回归的推论

当含有被解释变量滞后值滞后就不使用趋势变量

Page 68: 第六章  正态条件下回归的推论

引入商业证券利率

Page 69: 第六章  正态条件下回归的推论

预测房租

Page 70: 第六章  正态条件下回归的推论

预测房间数目

Page 71: 第六章  正态条件下回归的推论

Variable Coefficient Std. Error T-Statistic Prob.

SHYL -1.854182 0.385229 -4.813194 0.0013QSH 0.784188 0.134062 5.849461 0.0004C 69.87705 2.329669 29.99441 0.0000

R-squared 0.831986 Mean dependent var 70.00909Adjusted R-squared 0.789983 S.D. dependent var 2.703499S.E. of regression 1.238950 Akaike info criterion 0.655529Sum squared resid 12.27998 Schwartz criterion 0.764046Log likelihood -16.21373 F-statistic 19.80757Durbin-Watson stat 1.556777 Prob(F-statistic) 0.000797

租用率关于失业率 和趋势回归

Page 72: 第六章  正态条件下回归的推论

• 由于不能事先得到 1981年的失业率,所以不能利用上述方程进行预测,

• 但是方程反映出变量之间的关系,进一步证实租用率与失业率有非常相似的周期

• 不过,假日旅馆的租用率呈上升趋势,大约每年递增 0.7%

Page 73: 第六章  正态条件下回归的推论

8 、指数平滑预测

10

1

1

ˆ

ˆˆˆ

1

1

平滑常数

期的平滑值(预测值)在平滑序列

期的实际值在平滑序列

期的平滑值(预测值)在平滑序列

ty

ty

ty

yyy

yyy

t

t

t

ttt

Page 74: 第六章  正态条件下回归的推论

指数平滑法的使用

Page 75: 第六章  正态条件下回归的推论

指数平滑报告表

Page 76: 第六章  正态条件下回归的推论

第六节 复习与提高• 1 、随机扰动项的分布• 2 、因变量 Yi 的分布• 3 、回归分析估计量的分布• 4 、影响预测的精度因素

Page 77: 第六章  正态条件下回归的推论

1 、随机扰动项的分布

)ˆ(),ˆ(~)ˆ(

,~ˆˆ

,~

,0,0..~

,0..~

211

2

22

2

YVarYENYE

XXBNBYXXXB

XBN

NNii

dii

y

u

u

i

i

i

估计出结论可靠性)和区间为了进行假设检验(给

Page 78: 第六章  正态条件下回归的推论

2 、因变量 Yi 的分布

2

2

,~

,0~

xy

uuxy

ii

iiii

baN

Nba

Page 79: 第六章  正态条件下回归的推论

3 、回归分析估计量的分布

2

2

2

2

2

2

2

1,~ˆ

1,~ˆ

,~

,0~

xx

xxx

xy

uuxy

i

i

ii

iiii

bNb

naNa

baN

Nba

Page 80: 第六章  正态条件下回归的推论

的分布和 yyii

ˆ

2

2

2

2

2

2

2

2

11

11,~

11,~

ˆˆ

ˆ

ˆˆˆ

ˆ

xxxy

xxxyy

xxxy

xxxyy

xyuxy

i

i

i

i

i

ii

i

i

i

i

i

ii

iiiii

x

nVar

x

nEN

x

nVar

x

nEN

baba

Page 81: 第六章  正态条件下回归的推论

4 、影响预测的精度因素• 1 、 ( 1- ) t 预测误差

(只有这么多信息,可靠性预测误差 ,可靠性 预测误差 )

• 2 、 x 均值预测误差• 3 、 x 方差 预测误差• 4 、 n 预测误差

1,

1

ˆˆ

1,2

1,2

2

2

2

ˆˆ

ˆ

tyytyy

sxx

xxy

xy

kniiknii

i

i

i

ii

VarSEVarSEP

nVarSE

ba