政治大學公企中心必修課課程名稱：社會科學研究方法（量化分析）...

1 政治大學公企中心必修課 -- 社會科學研究方法（量化分析） -- 黃智聰

政治大學公企中心必修課課程名稱：社會科學研究方法（量化分析）

授課老師：黃智聰授課內容：

簡單線性迴歸模型：報告結果與選擇函數型式

參考書目： Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics. New York: John Wiley & Sons

日期： 2012 年 11 月 19 日


簡單線性迴歸模型Yt = β1+ β2Xt+et et ~N(0,1)

兩個分析模型的理由：解釋應變數 (yt) 會如何隨著自變數 (xt ) 的改變

而改變。在 x0 已知下預測 y0 。


yyy ˆ,,

ttt eyyyy ˆˆ

222ˆˆ ttt eyyyy

總平方和 (SST) 可解釋的平方和 (SSR) 誤差平方和 (SSE)

SST = SSR + SSE


SST

SSE

SST

SSRR 12

R2= 判定係數 0 <R2 < 1 越接近 1 越好

若 R2 = 1: 表示迴歸模型「完全地」配合這份資料。 R2 = 0: 表示 y 與 x 的樣本資料並不相關，而且未顯示任何的線性關係，則最小平方配適線為「水平的」。


註 : R2 是一個敘述性的衡量值。它本身並不能衡量迴歸模型的品質，只著重將 R2 最大化的迴歸決策並非好方法。

解釋 : R2=0.32 表示 Y 的變異中有 32% 可以用 X 的變異來解釋，或是說迴歸模型可以解釋 32% Y 的變異，剩下 68% 的變異無法解釋。

這樣的 R2 看起來很低嗎 ?

不，在使用橫斷面資料的迴歸研究，以不同時點觀察同一個體或其他經濟行為的樣本時，是很具有代表性的。


(2) R2=(Yt, ) 的相關係數 =

簡單線性迴歸的相關分析(1) r2 = R2, r = Cov(X,Y) /

=

)()( yVarxVar

22 )()())((

YYXXYYXX

tt

tt

tY2

tyrty

舉例來證明 r2 =2

tyrty

舉例來證明 r2=R2


報告迴歸結果

ty = 40.7676 + 0.1283 Xt R2 = 0.317 (22.1387) (0.0305) (s.e)

或= 40.7676 + 0.1283 Xt R2 = 0.317 (1.84) (4.20) (t)

ty


選擇函數形式簡單線性迴歸模型指的是參數不會相乘、相除、

平方、立方等。滿足 SR1 SR5 簡單線性迴歸模型轉換（ Transformation ） (1) 變數間的線性關係 : β2= 斜率（ slope）(2)倒數（ Reciprocal） :


給定一個模型，使其誤差項具有下列性質： 1. E(et)=0

2. Var (et)=σ2

3. Cov(ei,ej)=0

4. et~N(0, σ2)

運用其他函數形式來進行迴歸分析。


選擇函數形式：實證議題

1.散佈（ plot ） 2. 模型 Yt=β1+β2 Xt+et 3. 估計 4. 預測 5. 殘差分佈 → 檢查是否為常態分配 ?

技術的改變

時間


其他形式 Yt=β1+β2Xt

3+et Zt3=Xt

3/1000000 =0.874+9.68 Zt

3 R2=0.751 R2↑ Notice : 殘差模式也有許多其他的不足之處，例

如有被忽略的變數，異質變異性（ heteroskedasticity ），自我相關（ autocorrelation ）

錯誤建立迴歸模型。

Y


殘差為常態分配嗎？ 1. 平均值→ 0

2. 傑古貝拉檢定（ Jarque-Bera test for normality ），用來檢定常態性。

Ho: 常態， H1: 非常態若 P ＞ α

無法拒絕虛無假設


JB =

T: 觀察值的個數 S: 偏態（ skewness ） k: 峰態（ kurtosis ）Ex: T=40 ， S=0.396920 ， K=2.874151 JB=1.077

JB 5.99 = ﹤ 22, 0.05

JB 值

4

)3(

6

22 k

ST


Ho ：常態分配（ Normal distribution ） JB ＜常態分配

包含截距項的係數個數 JB ＞拒絕常態分配 P ＜ 0.05 拒絕 Ho

2,nX

2,nX


y=1+ 2X+3Z 理論模型解釋 β1 , β2 , β3

Model:

y=E(y)+et= 1+ 2X+3Z +et

假設 :

(1) E(et)=0 (2) Var(et)=σ2

(3) Cov(et,es)=0 (4) et~N(0, σ2)

複迴歸模型


最小平方估計式的變異數與共變數 (1) σ2 Var(b2) 越不精確 (2)T Var(b2) 越精確 (3)Var(X2 ) Var(b2) 越精確 (4)Cov(X2 , X3 ) Var(b2) 越不精確


誤差為常態分配之最小平方估計式的性質*

)(~)(ˆ

)1,0(~)(

KTtbrVa

bt

NbVar

bZ

K

KK

K

KK

K: 未知係數項的個數


衡量配適度 R2 =1-(SSE/SST) R2 的一個難題 R2 的難題是若加入越來越多的變數，會變的

很大，即使這些加入的變數在理論上不具任何適當性。

若模型中包含 T-1 個變數，則 R2 =1 R2=1- 其中， T 代表觀察數目 K 代表變數個數

SSESST

1

/

TSST

KTSSE


R2 （調整後 R2 ）的使用 : * 優點 : 當變數增加時 R2 並不會一直上升。 * 缺點 : (1)失去原有的解釋，即 R2 不再是被解釋的變異百

分比。 (2)此修正後的 R2 有時會被誤用為選擇一組適當的

解釋變數之方法。 (3) 若模型未包含截距項，則衡量的 R2 就不適合了。


受限制的最小平方單一參數 t 檢定聯合虛無假設 F 檢定 F 檢定的基礎是在於比較原始且未受限制之複

迴歸模型的誤差平方和，以及認為虛無假設為真時的迴歸模型之誤差平方和。

複迴歸模型的進一步推論


例 :

y=α0 +α1 X1 +α2 X2+ α3 X3 + e

H0: α2 = α3 = 0

即 y= α0 +α1 X1 + e

F=

F F≧ (J,T-K, α) 拒絕虛無假設

P=P F﹝ (2,96) F≧ ﹞＜ 0.05 拒絕虛無假設

SSER-SSEu/J

SSEu/(T-K)

J=2

T= 觀察值個數 (100)

K=4

2, 96, 0.05


虛無假設中不能包含任何「大於」或者「小於」的假設。

H0: β2=0, β3=0… βK=0

H1: β2 0 或 β3 0 ，或兩者都不為零， βK 中至少有一個不是零若 J=1 ， F= T2


注意若模型為 :

y= β0 + β1 X1 + β2X22+ e

=2β2X2 隱含 X2 對每個 y 有不同程度的影響 =β1 X1 對於所有的 y 的影響都相同

dydX2

dydX1


其他例子 y= β0 + β1 X1 + β2X2+ e

H0: β1=β2

H1: β1β2

y= β0 + β1 (X1 + X2)+ e

F test F(1,T-3, α)


模型設定模型選擇的三個重要要素 :

(1) 函數形式的選擇(2)選擇包含的解釋變數（迴歸式）的模型。(3)複迴歸模型的假設 MR1-MR6 是否成立。


1. 遺漏以及不相關的變數例 :y= β0 + β1 X1 + β2X2+ e

假設我們漏了 X2 , 以下列式子進行迴歸分析： y= β0 +β1*X1 + e

若 Cov(X1 ,X2) 0 則 β1* β1

我們得到非常強的虛無假設， β2=0 。然而， Cov(X1 ,X2)=0 的情形非常少見 E(b1*)=β1+β2

Cov(X1, X2)

Var(X1)


若估計出的方程式有出現未預期，或大小不符現實的係數時，造成這些怪異結果的一個可能原因就是遺漏了重要的變數。

T檢定或 F檢定這兩種顯著檢定可以評估是否一個變數或一組變數包含在一個方程式中。


必須注意，有兩種可能的原因，不拒絕虛無假設的結果。

(1) 對應的變數不會影響 y ，且可以排除在模型之外。 (但是結果不能拒絕虛無假設 )

(2)對應的變數對於納入模型來說是很重要的，但因資料不夠充分而無法拒絕 H0 。


1.P( 無法拒絕 H0│ 虛無假設為真 )

Accept H0 => 不顯著係數

2.P( 無法拒絕 H0│ 虛無假設不為真 ) 如果因為不顯著就去除此變數，要小心喔！我們可能會排除一個不相關的變數，但也可能造成剩餘的係數估計值會產生遺漏變數的偏誤。


所以，儘可能在模型中納入最多的變數 ?

Y=β0+β1X1+β2X2+e <= true model --------- (1)

但是估計 Y=β0+β1X1+β2X2+β3X3+e --------- (2)

Var (b1),Var (b2),Var (b3) 在 (2) 式中比在 (1) 式中來的大。

若 X3 與 X2 ， X1 相關，但是理論上 X3 不影響 Y 。


2. 檢定模型是否設定錯誤 : RESET 檢定是否設定錯誤可用下列問題瞭解 : (1) 是否遺漏重要變數？(2) 是否納入重要變數？ (3) 是否選擇錯誤的函數形式？(4) 是否違背假設？ RESET 檢定（ Regression Specification Error Te

st ） RESET 的用意是發現遺漏的變數，以及不正確

的函數形式。


假設 : Y=β0+β1X1+β2X2+e =b0+b1X1+b2X2

Y=β0+β1X1+β2X2+r1 2+e -------- (1)

Y=β0+β1X1+β2X2+r1 2+ r2

3+e -------- (2) (1) 檢定 H0: r1=0 H1: r1≠0 (2) 檢定 H0: r1= r2=0 H1: r1≠0 或 r2≠0 拒絕 H0 表示原始的模型不適當，且可以改進。無法拒絕 H0 表示此檢定沒有發現任何設定錯誤的情況。

只能告訴模型不好，不能告訴模型是好的。

YY

Y Y

政治大學公企中心必修課 課程名稱：社會科學研究方法（量化分析）...

Documents

政治大學公企中心必修課課程名稱：社會科學研究方法（量化分析）...