f orel asning 6gauss.stat.su.se/gu/finstat/lektioner ht12/f6-ht12.pdf · tecknet kunde anas utav...

Forelasning 6Autokorrelation och Durbin-Watson testet

Patrik Zetterberg

17 december 2012

1 / 14

Korrelation och autokorrelation

Pa tidigare forelasningar har vi analyserat korrelationer forstickprov och stokastiska variabler.

I tidsserieanalys ar intresserade av hur en variabel yt korrelerarmed sig sjalv mellan olika tidpunkter.

Denna typ av korrelation kallas autokorrelation

3 / 14


Det vi vill gora ar att berakna autokorrelationen mellan yt ochyt−1 i en observerad tidsserie.

Vi har observerat serien yt .

Vi skapar serien yt−1 genom att genom att skjuta fram serienyt en tidsperiod.

t yt yt−1

1 13 *2 8 133 15 84 4 15...

......

yt−1 kallas det laggade vardet av yt .

4 / 14


Vi har tio observationer pa denna tidsserie.

t yt yt−1

1 13 ∗2 8 133 15 84 4 155 4 46 12 47 11 128 7 119 14 7

10 12 14

Summa 100

Korrelerar variablerna yt och yt−1? Vi borjar med ettspridningsdiagram.

c©Jorgen Save-Soderbergh Finansiell statistik, varterminen 2011


Vi har den laggade variabeln yt−1 pa y-axeln och den ursprungligayt pa x-axeln. Alltsa ar det forsta paret i tabellen ar (8, 13). Langsttill vanster ser vi de tva paren (4, 4) och (4, 15). (y = 10)



Med inspiration av definitionen ovan av korrelation mellan tvavariabler, soker vi nu nagot liknande mellan yt och yt−1.Om vi har en tidsserie y1, y2, . . . , yn, sa definieras stickprovetsautokorrelationsfunktion i laggen 1 som

r1 =

∑nt=2 (yt − y) (yt−1 − y)∑n

t=1 (yt − y)2. (1)

Vi har n = 10 observationer. Summan av observationerna aretthundra, sa medelvardet for yt ar tio.



For att berakna taljaren i (1) fyller vi pa tabellen nedan

t yt yt−1 yt − 10 yt−1 − 10 (yt − 10)(yt−1 − 10)

1 13 ∗ 3 ∗ ∗2 8 13 -2 3 -63 15 8 5 -2 -104 4 15 -6 5 -305 4 4 -6 -6 366 12 4 2 -6 -127 11 12 1 2 28 7 11 -3 1 -39 14 7 4 -3 -12

10 12 14 2 4 8

Summa -27



Ur kolumn 4 i tabellen kan vi aven berakna namnaren i (1). Denblir

32 + (−2)2 + · · ·+ 22 = 144.

Alltsa blir

r1 =−27

144= −0.1875.

Med detta varde ar vi inte sa langt fran att yt och yt−1 arokorrelerade.

Tecknet kunde anas utav plotten ovan.

Storleken mycket svar att se.



Allt som sagts ovan om korrelationen hos en tidserie mellanobservationerna pa ett stegs tidsavstand kan generaliseras till tvastegs avstand, tre steg o s v. For att kunna gissa vad korrelationenar pa tva stegs avstand, sa kan man plotta yt mot yt−2. Genomformeln

r2 =

∑nt=3 (yt − y) (yt−2 − y)∑n

t=1 (yt − y)2.

definieras stickprovets autokorrelationsfunktion i laggen 2. I vartexempel kan man visa att r2 = −0.201389.Amnet aterkommer i samband med ARIMA-modeller.



Vi far till slut autokorrelationen vid lag k som

rk =

∑nt=k+1(yt − y)(yt−k − y)∑n

t=1(yt − y)2

Eftersom vi i taljaren summerar over alla tidpunkter fran k ochframat sa ”tappar” vi k observationer i borjan av tidsserien yt iberakningarna.

5 / 14

Autokorrelerade feltermer

Hittills har vi endast undersokt autokorrelation i yt men vi ar ocksaofta intresserade av om det finns autokorrelation i feltermerna εt :

εt i en linjar modell antas vara oberoende stokastiska variabler.

Ar feltermerna oberoende medfor detta att Corr(εt ,εt−k)=0.

Eftersom residualerna

et = yt − yt

skattar εi ska residualerna bevara oberoendet.

Tyvarr ar detta ett for kraftigt antagande nar vi anvanderregressionsmetoder pa tidsseriedata.

6 / 14


Forklaringar till att feltermer i olika laggar ar autokorrelerade kanvara att man inte har tagit hansyn till cykliska effekter ellersasongsfluktuationer i en tidsserie.

Detta blir ett problem eftersom

Vi missar att modellera effekter i yt vilket ger daligaprognoser.

Skattningarna gjorda med minsta kvadratmetoden paverkas.s2e kommer att underskatta den sanna variasen σ2. Darforkommer s2bk att underskatta V (bk).

Konsekvensen ar att inferensen (t-test, F -test,konfidensintervall, etc) blir opalitlig!

7 / 14

Autokorrelerade feltermer - Grafisk analys

Tva satt att upptacka autokorrelation grafiskt ar att plottaresidualerna et mot tiden t respektive de laggade residualerna et−1.

Residualer mot t

Time

residualer

1990 1995 2000 2005 2010

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

-1.0 -0.5 0.0 0.5 1.0 1.5 2.0

-1.0

-0.5

0.0

0.5

1.0

1.5

2.0

Residualer mot laggade residualer

lag(residualer, 1)

residualer

8 / 14

Autokorrelerade feltermer - Grafisk analys

De tva spridningsdiagrammen ar baserade pa samma tidsserie. Vikan se tydliga tecken pa autokorrelation:

Plot 1 - manga residualer i foljd med samma tecken indikeraren positiv autokorrelation.

Plot 2 - tolkar sambandet som vanlig korrelation. Positivt,starkt linjart samband indikerar positiv autokorrelation nara 1.

Hur kan vi avgora om autokorrelationen for feltermerna arsignifikant skild ifran 0?

9 / 14

Vi maste ha en specifik typ av korrelation mellanfeltermerna!

Forestall er att pa

ett stegs avstand mellan feltermerna εt och εt−1 sa har vikorrelationen φ.

tva stegs avstand mellan feltermerna εt och εt−2 sa har vikorrelationen φ2.

tre stegs avstand mellan feltermerna εt och εt−3 sa har vikorrelationen φ3.

till slut

pa k stegs avstand mellan feltermerna εt och εt−k sa har vikorrelationen φk .

Korrelationerna pa de olika tidsavstanden utgor alltsa en talfoljd

φ, φ2, φ3, . . . , φk .



En modell med en sadan autokorrelationsstruktur ar:

εt = φεt−1 + at , t = 1, 2, ... (2)

Enligt definitionen for korrelationer galler att −1 ≤ φ ≤ 1.

Denna modell kallas for en autoregressiv modell av forstaordningen, vilket ofta forkortas som AR(1).

De nya feltermerna at har egenskaperna

E (at) = 0, V (at) = σ2a , Corr(at , at−k) = 0

Om feltermer,at , for en tidsserie har dessa egenskaper sagerman att att at ar vitt brus (white noise).

Vi forklarar begreppen vitt brus och AR(1) under nasta forelasning.

10 / 14

Durbin-Watsons test: nollhypotesen

Om φ = 0 i ekvation (2) ovan, sa blir εt = at och feltermerna arsom vanligt igen. Om φ > 0, sa har vi en geometriskt fallandetalfoljd av uttrycket φk vars samtliga medlemmar ar positiva. (SeSydsæter/Hammond, sidan 248 for talfoljder).Lat oss darfor testa H0 : φ = 0 mot alternativet Ha : φ > 0.Vi kan aven uttrycka dessa hypoteser som

H0 : feltermerna ar ej autokorrelerade

mot alternativet

Ha : feltermerna ar positivt autokorrelerade.


Durbin-Watsons test: testvariabeln

Durbin-Watsons testvariabel ges som:

dobs =

∑nt=2(et − et−1)2∑n

t=1 e2t

Dar et ar residualerna vid tidpunkt t. Eftersom

n∑t=1

e2t ≈n∑

t=2

e2t ≈n∑

t=2

e2t−1

da n ar ”tillrackligt” stort, kan dobs approximeras med:

dobs ≈ 1 + 1 − 2

∑nt=2 etet−1∑n

t=1 e2t

(3)

11 / 14


Lar oss skriva upp stickprovets autokorrelationsfunktion i laggen 1for residualerna e1, e2, . . . , en. Da har vi

r1 =

∑nt=2 (et − e) (et−1 − e)∑n

t=1 (et − e)2.

Nu ar ju summan av residualerna noll, sa e = 0, vilket ger

r1 =

∑nt=2 etet−1∑n

t=1 e2t

.

Detta kanner vi igen fran (3) ovan, som alltsa kan skrivas

d ≈ 1 + 1− 2r1 = 2− 2r1 = 2(1− r1).



En approximation av testvariabeln ar alltsa

d ≈ 2(1− r1).

Om nollhypotesen (ingen autokorrelation) ar sann, sa bor r1

bli mycket nara noll och saledes d ≈ 2.

Om vi har allvarlig positiv autokorrelation i feltermerna, blirr1 > 0, sa 1− r1 < 1 och d < 2.



For alla korrelationer galler att −1 ≤ korrelationen ≤ 1. Da kanvi bestamma variationsomradet for d . Vi har att

−1 ≤ r ≤ 1

1 ≥ −r ≥ −1

2 ≥ 1− r ≥ 0

4 ≥ 2(1− r) ≥ 0.

Alltsa ligger d approximativt mellan 0 och 4.


Durbin-Watsons test: beslutsregler

Fordelningen for testvariabeln d ar komplicerad och kan inteapproximeras med nagon kand fordelning.

Darfor skapade Durbin och Watson en egen tabell medgransvarden for olika urvalsstorlekar n, signifikansnivaer α ochantalet forklarande variabler k.

Beslutsreglerna finns angivna i forelasningsanteckningarna.Men man far en bra overblick av de kritiska granserna genomatt rita upp dem langs en tallinje som pa s. 585 i NCT.

12 / 14

Durbin-Watsons test

Stall upp hypoteserna


mot alternativet

Ha : feltermerna ar positivt autokorrelerade

(eller H0 : φ = 0 mot alternativet Ha : φ > 0 i modellenεt = φεt−1 + at for feltermerna) Testet ar da foljande:

1 Om d < dL,α, sa forkastar vi H0.

2 Om d > dU,α, sa forkastar vi inte H0.

3 Om dL,α ≤ d ≤ dU,α, sa kan ingen slutsats dragas.


Durbin-Watsons test:alternativ mothypotes

Satt upp hypoteserna


mot alternativet

Ha : feltermerna ar negativt autokorrelerade

(eller H0 : φ = 0 mot alternativet Ha : φ < 0 i modellenεt = φεt−1 + at for feltermerna) Testet ar da foljande:

1 Om 4− d < dL,α, sa forkastar vi H0. (Detta hander om d arstor, storre an 3)

2 Om 4− d > dU,α, sa forkastar vi inte H0.

3 Om dL,α ≤ 4− d ≤ dU,α, sa kan ingen slutsats dragas.


Durbin-Watsons test: Ett exempel

Vi sag tidigare ett exempel pa en tidsserie dar residualerna visuelltsag ut att vara autokorrelerade. Vi ska testa om vi statistiskt kansakerstalla en autokorrelation. Hypotesuppstallning ar:

H0 : φ = 0H1 : φ > 0

I detta fall hade vi n = 60 observationer och en modell med k = 1forklarande variabel. Om vi satter signifikansnivan α = 5% kan vi itabellen hitta gransvardena dL,0.05 och dU,0.05:

dL,0.05 = 1.55 och dU,0.05 = 1, 62

4 − dL,0.05 = 2.45 och 4 − dU,0.05 = 2.38

13 / 14

Durbin-Watsons test: Ett exempel

Da vi har n = 60 tar vi hjalp av R for att berakna r1:

[1] 0.8965074

Vi beraknar testvariabelns approximativa varde:

dobs ≈ 2(1 − r1) = 2(1 − (−0.8965)) = 0.207

Da dobs < dL,0.05 forkastas H0 och vi drar slutsatsen att det finnsen signifikant positiv autokorrelation mellan feltermerna i dennamodell.

14 / 14

f orel asning 6gauss.stat.su.se/gu/finstat/lektioner ht12/f6-ht12.pdf · tecknet kunde anas utav...

Documents