政治大學公企中心必修課 課程名稱:社會科學研究方法(量化分析)...
DESCRIPTION
政治大學公企中心必修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型:報告結果 與選擇函數型式 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics . New York: John Wiley & Sons 日期: 2012 年 11 月 19 日. 簡單線性迴歸模型. Y t = β 1 + β 2 X t +e t e t ~N(0,1) 兩個分析模型的理由: - PowerPoint PPT PresentationTRANSCRIPT
1 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
政治大學公企中心必修課課程名稱:社會科學研究方法(量化分析)
授課老師:黃智聰 授課內容:
簡單線性迴歸模型:報告結果與選擇函數型式
參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics. New York: John Wiley & Sons
日期: 2012 年 11 月 19 日
2 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
簡單線性迴歸模型Yt = β1+ β2Xt+et et ~N(0,1)
兩個分析模型的理由: 解釋應變數 (yt) 會如何隨著自變數 (xt ) 的改變
而改變。 在 x0 已知下預測 y0 。
3 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
yyy ˆ,,
ttt eyyyy ˆˆ
222ˆˆ ttt eyyyy
總平方和 (SST) 可解釋的平方和 (SSR) 誤差平方和 (SSE)
SST = SSR + SSE
4 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
SST
SSE
SST
SSRR 12
R2= 判定係數 0 <R2 < 1 越接近 1 越好
若 R2 = 1: 表示迴歸模型「完全地」配合這份資料。 R2 = 0: 表示 y 與 x 的樣本資料並不相關,而且未 顯示任何的線性關係,則最小平方配適 線為「水平的」。
5 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
註 : R2 是一個敘述性的衡量值。它本身並不能衡量迴歸模型的品質,只著重將 R2 最大化的迴歸決策並非好方法。
解釋 : R2=0.32 表示 Y 的變異中有 32% 可以用 X 的變異來解釋,或是說迴歸模型可以解釋 32% Y 的變異,剩下 68% 的變異無法解釋。
這樣的 R2 看起來很低嗎 ?
不,在使用橫斷面資料的迴歸研究,以不同時點觀察同一個體或其他經濟行為的樣本時,是很具有代表性的。
6 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
(2) R2=(Yt, ) 的相關係數 =
簡單線性迴歸的相關分析(1) r2 = R2, r = Cov(X,Y) /
=
)()( yVarxVar
22 )()())((
YYXXYYXX
tt
tt
tY2
tyrty
舉例來證明 r2 =2
tyrty
舉例來證明 r2=R2
7 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
報告迴歸結果
ty = 40.7676 + 0.1283 Xt R2 = 0.317 (22.1387) (0.0305) (s.e)
或= 40.7676 + 0.1283 Xt R2 = 0.317 (1.84) (4.20) (t)
ty
8 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
選擇函數形式 簡單線性迴歸模型指的是參數不會相乘、相除、
平方、立方等。 滿足 SR1 SR5 簡單線性迴歸模型 轉換( Transformation ) (1) 變數間的線性關係 : β2= 斜率( slope)(2)倒數( Reciprocal) :
9 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
給定一個模型,使其誤差項具有下列性質: 1. E(et)=0
2. Var (et)=σ2
3. Cov(ei,ej)=0
4. et~N(0, σ2)
運用其他函數形式來進行迴歸分析。
10 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
選擇函數形式:實證議題
1.散佈( plot ) 2. 模型 Yt=β1+β2 Xt+et 3. 估計 4. 預測 5. 殘差分佈 → 檢查是否為常態分配 ?
技術的改變
時間
11 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
其他形式 Yt=β1+β2Xt
3+et Zt3=Xt
3/1000000 =0.874+9.68 Zt
3 R2=0.751 R2↑ Notice : 殘差模式也有許多其他的不足之處,例
如有被忽略的變數,異質變異性( heteroskedasticity ),自我相關 ( autocorrelation )
錯誤建立迴歸模型。
Y
12 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
殘差為常態分配嗎? 1. 平均值→ 0
2. 傑古貝拉檢定( Jarque-Bera test for normality ),用來檢定常態性。
Ho: 常態, H1: 非常態 若 P > α
無法拒絕虛無假設
13 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
JB =
T: 觀察值的個數 S: 偏態( skewness ) k: 峰態( kurtosis )Ex: T=40 , S=0.396920 , K=2.874151 JB=1.077
JB 5.99 = ﹤ 22, 0.05
JB 值
4
)3(
6
22 k
ST
14 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
Ho :常態分配( Normal distribution ) JB < 常態分配
包含截距項的係數個數 JB > 拒絕常態分配 P < 0.05 拒絕 Ho
2,nX
2,nX
15 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
y=1+ 2X+3Z 理論模型 解釋 β1 , β2 , β3
Model:
y=E(y)+et= 1+ 2X+3Z +et
假設 :
(1) E(et)=0 (2) Var(et)=σ2
(3) Cov(et,es)=0 (4) et~N(0, σ2)
複迴歸模型
16 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
最小平方估計式的變異數與共變數 (1) σ2 Var(b2) 越不精確 (2)T Var(b2) 越精確 (3)Var(X2 ) Var(b2) 越精確 (4)Cov(X2 , X3 ) Var(b2) 越不精確
17 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
誤差為常態分配之最小平方估計式的性質*
)(~)(ˆ
)1,0(~)(
KTtbrVa
bt
NbVar
bZ
K
KK
K
KK
K: 未知係數項的個數
18 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
衡量配適度 R2 =1-(SSE/SST) R2 的一個難題 R2 的難題是若加入越來越多的變數,會變的
很大,即使這些加入的變數在理論上不具任何適當性。
若模型中包含 T-1 個變數,則 R2 =1 R2=1- 其中, T 代表觀察數目 K 代表變數個數
SSESST
1
/
TSST
KTSSE
19 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
R2 (調整後 R2 ) 的使用 : * 優點 : 當變數增加時 R2 並不會一直上升。 * 缺點 : (1)失去原有的解釋,即 R2 不再是被解釋的變異百
分比。 (2)此修正後的 R2 有時會被誤用為選擇一組適當的
解釋變數之方法。 (3) 若模型未包含截距項,則衡量的 R2 就不適合了。
20 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
受限制的最小平方 單一參數 t 檢定 聯合虛無假設 F 檢定 F 檢定的基礎是在於比較原始且未受限制之複
迴歸模型的誤差平方和,以及認為虛無假設為真時的迴歸模型之誤差平方和 。
複迴歸模型的進一步推論
21 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
例 :
y=α0 +α1 X1 +α2 X2+ α3 X3 + e
H0: α2 = α3 = 0
即 y= α0 +α1 X1 + e
F=
F F≧ (J,T-K, α) 拒絕虛無假設
P=P F﹝ (2,96) F≧ ﹞< 0.05 拒絕虛無假設
SSER-SSEu/J
SSEu/(T-K)
J=2
T= 觀察值個數 (100)
K=4
2, 96, 0.05
22 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
虛無假設中不能包含任何「大於」或者「小於」的假設。
H0: β2=0, β3=0… βK=0
H1: β2 0 或 β3 0 ,或兩者都不為零, βK 中至 少有一個不是零若 J=1 , F= T2
23 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
注意若模型為 :
y= β0 + β1 X1 + β2X22+ e
=2β2X2 隱含 X2 對每個 y 有不 同程度的影響 =β1 X1 對於所有的 y 的影響都相同
dydX2
dydX1
24 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
其他例子 y= β0 + β1 X1 + β2X2+ e
H0: β1=β2
H1: β1β2
y= β0 + β1 (X1 + X2)+ e
F test F(1,T-3, α)
25 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
模型設定 模型選擇的三個重要要素 :
(1) 函數形式的選擇(2)選擇包含的解釋變數(迴歸式)的模型。(3)複迴歸模型的假設 MR1-MR6 是否成立。
26 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
1. 遺漏以及不相關的變數 例 :y= β0 + β1 X1 + β2X2+ e
假設我們漏了 X2 , 以下列式子進行迴歸分析: y= β0 +β1*X1 + e
若 Cov(X1 ,X2) 0 則 β1* β1
我們得到非常強的虛無假設, β2=0 。 然而, Cov(X1 ,X2)=0 的情形非常少見 E(b1*)=β1+β2
Cov(X1, X2)
Var(X1)
27 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
若估計出的方程式有出現未預期,或大小不符現實的係數時,造成這些怪異結果的一個可能原因就是遺漏了重要的變數。
T檢定或 F檢定這兩種顯著檢定可以評估是否一個變數或一組變數包含在一個方程式中。
28 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
必須注意,有兩種可能的原因,不拒絕虛無假設的結果。
(1) 對應的變數不會影響 y ,且可以排除在模型之外。 (但是結果不能拒絕虛無假設 )
(2)對應的變數對於納入模型來說是很重要的,但因資料不夠充分而無法拒絕 H0 。
29 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
1.P( 無法拒絕 H0│ 虛無假設為真 )
Accept H0 => 不顯著係數
2.P( 無法拒絕 H0│ 虛無假設不為真 ) 如果因為不顯著就去除此變數,要小心喔! 我們可能會排除一個不相關的變數,但也可能造成剩餘的係數估計值會產生遺漏變數的偏誤。
30 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
所以 ,儘可能在模型中納入最多的變數 ?
Y=β0+β1X1+β2X2+e <= true model --------- (1)
但是估計 Y=β0+β1X1+β2X2+β3X3+e --------- (2)
Var (b1),Var (b2),Var (b3) 在 (2) 式中 比在 (1) 式中來的大。
若 X3 與 X2 , X1 相關,但是理論上 X3 不影響 Y 。
31 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
2. 檢定模型是否設定錯誤 : RESET 檢定 是否設定錯誤可用下列問題瞭解 : (1) 是否遺漏重要變數?(2) 是否納入重要變數? (3) 是否選擇錯誤的函數形式?(4) 是否違背假設? RESET 檢定( Regression Specification Error Te
st ) RESET 的用意是發現遺漏的變數,以及不正確
的函數形式。
32 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰
假設 : Y=β0+β1X1+β2X2+e =b0+b1X1+b2X2
Y=β0+β1X1+β2X2+r1 2+e -------- (1)
Y=β0+β1X1+β2X2+r1 2+ r2
3+e -------- (2) (1) 檢定 H0: r1=0 H1: r1≠0 (2) 檢定 H0: r1= r2=0 H1: r1≠0 或 r2≠0 拒絕 H0 表示原始的模型不適當,且可以改進。 無法拒絕 H0 表示此檢定沒有發現任何設定錯誤的情況。
只能告訴模型不好,不能告訴模型是好的。
YY
Y Y