något om val mellan olika metoder

59
Något om val mellan olika metoder Givet är en observerad tidsserie: y 1 , y 2 ,…,y n Säsonger? Nej Trend? Nej ARMA- modeller Enkel exponentiell utjämning Tidsserieregres sion ARIMA-modeller Dubbel exponentiell utjämning Ja Tidsserieregressi on Klassisk komponentuppdelni ng (S)ARIMA-modeller Winters’ metod

Upload: makoto

Post on 26-Jan-2016

56 views

Category:

Documents


1 download

DESCRIPTION

Något om val mellan olika metoder. Givet är en observerad tidsserie: y 1 , y 2 ,…, y n. Nej. Nej. Säsonger?. ARMA-modeller Enkel exponentiell utjämning. Trend?. Ja. Tidsserieregression ARIMA-modeller Dubbel exponentiell utjämning. Tidsserieregression Klassisk komponentuppdelning - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Något om val mellan olika metoder

Något om val mellan olika metoder

Givet är en observerad tidsserie: y1, y2,…,yn

Säsonger?Nej

Trend?Nej

ARMA-modeller

Enkel exponentiell utjämning

Tidsserieregression

ARIMA-modeller

Dubbel exponentiell utjämning

Ja

Tidsserieregression

Klassisk komponentuppdelning

(S)ARIMA-modeller

Winters’ metod

Page 2: Något om val mellan olika metoder

ARMA-, ARIMA, (S)ARIMA

Modernare metoder för tidsserieanalys och prognoser

• Box, George and Jenkins, Gwilym (1970) Time series analysis: Forecasting and control, San Francisco: Holden-Day

– Ett “standardverk” som samlade upp idéer, uppkomna från c:a 1950-talet inom ekonometri och ingenjörsvetenskap

– Skapade ett system för att identifiera, skatta och utvärdera modeller för tidsserier

– Metodologin går fortfarande under namnen “Box-Jenkins-metodik”

Page 3: Något om val mellan olika metoder

EUR/SEK

MonthDay

novokt2111121111

10.50

10.25

10.00

9.75

9.50

Time Series Plot of EUR/ SEK

Exempel: Växelkurs EUR/SEK 25 sep – 25 nov 2008 (Källa: www.oanda.com, 2008-11-25)

Säsongsvariation?

Trend?

Konjunktur?

Om vi skulle vilja göra korttidsprognoser för t.ex. en dag eller två?

Page 4: Något om val mellan olika metoder

Med hittills genomgångna metoder:

1) Tidsserieregression med linjär/kvadratisk trend, men utan säsongdummies

2) Dubbel exponentiell utjämning (Holt’s metod)

Fungerar dessa bra?

Data

MonthDay

novokt2111121111

10.50

10.25

10.00

9.75

9.50

EUR/SEKFITS1forecastslolimuplim

Variable

Time Series Plot of EUR/ SEK; FITS1; forecasts; lolim; uplim

Tidsserieregression, linjär trend

EUR

/SEK

MonthDay

novokt2111121111

10.75

10.50

10.25

10.00

9.75

9.50

Alpha (level) 1.30980Gamma (trend) 0.04006

Smoothing Constants

MAPE 0.464123MAD 0.046514MSD 0.003581

Accuracy Measures

ActualSmoothedForecasts95.0% PI

Variable

Double Exponential Smoothing Plot for EUR/ SEK

Holt’s metod

Smoothing ConstantsAlpha (level) 1.30980Gamma (trend) 0.04006

Page 5: Något om val mellan olika metoder

En vanlig metod som inte tagits upp till fullo i kursen:

Rullande medelvärden (mer korrekt: Glidande oviktade medelvärden)

StatTime SeriesMoving Average…

Veckovis “rullande” medelvärden

Page 6: Något om val mellan olika metoder

EUR/SEK

MonthDay

novokt2111121111

10.50

10.25

10.00

9.75

9.50

Length 7Moving Average

MAPE 0.886779MAD 0.089558MSD 0.016162

Accuracy Measures

ActualSmoothedForecasts95.0% PI

Variable

Moving Average Plot for EUR/ SEK

Inte så imponerande heller!

Page 7: Något om val mellan olika metoder

Time

EUR

/S

EK

65605550454035302520151051

10.75

10.50

10.25

10.00

9.75

9.50

Time Series Plot for EUR/ SEK(with forecasts and their 95% confidence limits)

Är nedanstående bättre? (De gröna trianglarna motsvarar prognoserna för 26/11 och 27/11 samt prognosintervallgränser, resten är originaldata.)

Vad är detta för metod?

Page 8: Något om val mellan olika metoder

Några viktiga begrepp i sammanhanget

Stationaritet

En tidsserie säges vara stationär om den i princip består av data med konstant väntevärde och varians

2001000

25

20

15

10

5

0

t

Yt

Något mer matematiskt:

E( yt ) =

Var( yt ) = 2

Corr( yt , yt-k ) beror bara av k

och alltså inte av t.

Page 9: Något om val mellan olika metoder

Hur kan icke-stationära tidsserier se ut?

2001000

2500

2000

1500

1000

500

0

t

Wt

2001000

250000

200000

150000

100000

50000

0

t

Ut

Linjär trend, icke-stationär av första ordningen

Kvadratisk trend, icke-stationär av andra ordningen

2001000

50000

0

-50000

-100000

t

Vt

Icke-konstant varians, även om väntevärdet verkar konstant

Page 10: Något om val mellan olika metoder

Är växelkursexemplet en stationär tidsserie?

EUR/SEK

MonthDay

novokt2111121111

10.50

10.25

10.00

9.75

9.50

Time Series Plot of EUR/ SEK

Beror på tidsperspektivet. Här ser det ut som att en trend finns, men i ett längre tidsperspektiv rör det sig nog bara om en tendens.

Page 11: Något om val mellan olika metoder

Kan en tidsserie göras stationär?

Differentiering

En tidsserie wt som är icke-stationär av första ordningen (i princip uppvisar en linjär trend) kan differentieras en gång:

yt = wt = wt – wt – 1

yt kan då bli en stationär serie (men inte nödvändigtvis)

En tidsserie som är icke-stationär av andra ordningen (i princip uppvisar en kvadratisk trend) kan differentieras två gånger:

yt = (ut ) = ut – ut – 1 = ut – ut – 1 – ( ut – 1 – ut – 2 ) = ut – 2 ∙ ut – 1 + ut – 2

yt kan då bli en stationär serie (men inte nödvändigtvis)

Page 12: Något om val mellan olika metoder

2001000

500

0

-500

-1000

t

Diff

Wt

Har den blivit stationär?2001000

2500

2000

1500

1000

500

0

t

Wt

Page 13: Något om val mellan olika metoder

Variansstabilisering

Om variansen inte bedöms vara konstant Transformera på samma sätt som vid regressionsanalys, oftast med logaritmering

w’t = ln ( wt )

2001000

8

7

6

5

4

3

2

t

log(

Wt)

2001000

2500

2000

1500

1000

500

0

t

Wt

Konstant varians?

Page 14: Något om val mellan olika metoder

Efter variansstabilisering kanske det blir OK att differentiera

2001000

1.0

0.5

0.0

-0.5

tD

iff lo

g(W

t)

2001000

8

7

6

5

4

3

2

t

log(

Wt)

(log(Wt))

Stationär?

Page 15: Något om val mellan olika metoder

Fungerar detta för våra växelkursdata?EU

R/SEK

MonthDay

novokt2111121111

10.50

10.25

10.00

9.75

9.50

Time Series Plot of EUR/ SEK

Diff(

EUR

/SEK

)

MonthDay

novokt2111121111

0.6

0.4

0.2

0.0

-0.2

Time Series Plot of Diff(EUR/ SEK)

Inte otänkbart!

Page 16: Något om val mellan olika metoder

Autokorrelation

För en tidsserie yt definieras autokorrelationsfunktionen (acf) som

k = Corr ( yt , yt – k ) för k = 1, 2, 3, 4, …

Anger alltså korrelationen (graden av linjärt beroende) mellan två värden på tidsavstånd k i tidsserien.

För en stationär tidsserie skall acf endast vara en funktion av k, dvs. det skall inte spela någon roll var i tidsserien de två värdena ligger utan endast vilket tidsavstånd det är mellan dem.

Värdena kan både vara positiva och negativa (beroende på hur beroendet ser ut)

Page 17: Något om val mellan olika metoder

För serier med korta beroenden avtar acf snabbt mot 0 då k växer

acf

00.05

0.10.15

0.20.25

0.30.35

1 2 3 4 5 6 7 8 9 1011121314151617181920

k

acf

-0.6

-0.4

-0.2

0

0.2

0.4

1 3 5 7 9 11 13 15 17 19

k

För serier med långa beroenden avtar acf långsammare, men tydligt mot 0 då k växer

acf

0

0.2

0.4

0.6

0.8

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

k

Page 18: Något om val mellan olika metoder

En tidsserie med väntevärde 0 och där acf är = 0 överallt kallas vitt brus

Innehåller egentligen ingen information

Kan man se i figuren att acf = 0 överallt?

t

Et

200150100500

5.0

2.5

0.0

-2.5

-5.0

-7.5

Page 19: Något om val mellan olika metoder

Skattning av acf

Minitab (och andra statistiska programpaket) har funktioner för att skatta acf från existerande data

Page 20: Något om val mellan olika metoder

t

Yt

200150100500

16

14

12

10

8

6

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Yt(with 5% significance limits for the autocorrelations)

t

Et

200150100500

5.0

2.5

0.0

-2.5

-5.0

-7.5

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Et(with 5% significance limits for the autocorrelations)

Page 21: Något om val mellan olika metoder

t

Wt

200150100500

2500

2000

1500

1000

500

0

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Wt(with 5% significance limits for the autocorrelations)

Typiskt exempel på en skattad acf för en tidsserie som inte är stationär. Mycket långsamt avklingande mönster.

Autokorrelationen är hög för värden som ligger på en gemensam trend.

Skattad acf brukar i litteraturen förkortas SAC (Sample AutoCorrelation function)

Page 22: Något om val mellan olika metoder

Hur ser SAC ut för växelkursdata?

Lag

Auto

corr

ela

tion

16151413121110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for EUR/ SEK(with 5% significance limits for the autocorrelations)

Litet väl långsamt avklingande. Tyder på icke-stationaritet i form av linjär trend.

Page 23: Något om val mellan olika metoder

Med hjälp av SAC kan man tydligen bedöma om en serie är stationär eller ej. Bra hjälpmedel för att t.ex. se om en differentiering räcker.

t

Wt

200150100500

2500

2000

1500

1000

500

0

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Wt(with 5% significance limits for the autocorrelations)

Icke-stationär (men det visste vi i och för sig)

Differentiera en gång

t

Diff W

t

200150100500

500

250

0

-250

-500

-750

-1000

-1250Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Diff Wt(with 5% significance limits for the autocorrelations)

Mer stationär, men ännu inte tillräckligt avklingande

Page 24: Något om val mellan olika metoder

Logaritmera och differentiera sedan

t

log(W

t)

200150100500

8

7

6

5

4

3

2

t

Diff lo

g(W

t)

200150100500

1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Diff log(Wt)(with 5% significance limits for the autocorrelations)

Bättre än tidigare. Snabbare avklingning mot 0.

Page 25: Något om val mellan olika metoder

Partiell autokorrelation

Svårare begrepp.

Den partiella autokorrelationen mellan y och x definieras som den del av korrelationen mellan y och x som inte har att göra med andra variabler.

Partiell autokorrelationsfunktion (pacf) för tidsserier

k = Corr( yt , yt – k | yt – (k – 1) , yt – (k – 2) , …, yt – 1 )

Funktionen har egenskaper som effektivt kan utnyttjas vid identifiering av modeller (se nedan)

Även den partiella autokorrelationsfunktionen kan skattas från existerande data. Den brukar då kallas SPAC

z

y

x

Röd korrelation är unik mellan y och x , dvs. partiell korrelationBlå korrelation kommer från y:s och x:s respektive samband med zRöd + Blå är den totala korrelationen.

Page 26: Något om val mellan olika metoder

Autoregressiva modeller (AR-modeller)

En tidsserie y1, y2, y3, … satisfierar en autoregressiv modell av ordning 1, en s.k. AR(1)-modell om

där och 1 är konstanter (parametrar) och at är vitt brus, dvs. en serie av okorrelerade värden (Corr(at , at – k ) = 0 för alla k) med väntevärde 0 och konstant varians (jfr. t från tidsserieregressionen)

(till exempel: yt = 2.0 + 0.4 yt – 1 + at )

“autoregressiv” innebär alltså att y har regression “på sig själv” (fast ett tidssteg bakåt)

ttt ayy 11

Page 27: Något om val mellan olika metoder

Exempel:

yt = 2.0 + 0.4 yt – 1 + at där at antas vara okorrelerade och N(0, 2)-fördelade

En realisering av denna tidsserie i 200 tidpunkter kan se ut på följande sätt

t

Yt

200150100500

10

8

6

4

2

0

-2

Page 28: Något om val mellan olika metoder

Om vi istället realiserar 200 värden av följande modell

yt = 2.0 – 0.4 yt – 1 + at där at antas vara okorrelerade och N(0, 2)-fördelade

dvs. 1 = – 0.4 istället för 0.4

kan vi få

t

Yt

200150100500

7.5

5.0

2.5

0.0

-2.5

-5.0 t

Yt

200150100500

10

8

6

4

2

0

-2

Jämför med 1 = 0.4 :

Page 29: Något om val mellan olika metoder

Stationära och icke stationära AR(1)-modeller

En tidsserie som satisfierar en AR(1)-modell är stationär om –1 < 1 < 1

Om 1 = 1 eller –1 råder instabilt läge. Serien kan urarta men behöver inte göra det.

Om 1 = 1 och = 0 säges tidsserien vara en random walk (slumpvandring)

yt = yt – 1 + at

En vanlig modell för enskilda aktiekurser.

Prognoser beräknas med den enkla formeln

persistensprognos

tt yy ˆˆ 1

Page 30: Något om val mellan olika metoder

Exempel på realisering av en random walk

t

Yt

200150100500

5

0

-5

-10

-15

-20

-25

-30

-35

Skulle mycket väl kunna motsvara utvecklingen av en aktiekurs,

men kan vi med utgångspunkt från det tycka att det rör sig om en trend?

Page 31: Något om val mellan olika metoder

Om | 1 | > 1 säger man ibland att AR(1)-modellen är explosiv.

Exempel: En realisering av modellen yt = 2.0 + 1.01 yt – 1 + at med at ~ N(0, 2)

t

Yt

200150100500

1400

1200

1000

800

600

400

200

0

Tydligt icke-stationär!

Page 32: Något om val mellan olika metoder

Identifiering av AR(1)-modeller

För tidsserier som satisfierar en AR(1)-modell och är stationära, dvs. | 1 | < 1, gäller att autokorrelationsfunktionen (acf) är

Exempel:

1 = 0.4 1 = –0.7

,3,2,1,1 kkk

acf

0

0.1

0.2

0.3

0.4

0.5

1 2 3 4 5 6 7 8 9 101112131415 1617181920

k

acf

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

1 3 5 7 9 11 13 15 17 19

k

Page 33: Något om val mellan olika metoder

Vidare gäller att den partiella autokorrelationsfunktionen är

Exempel:

1 = 0.4 1 = –0.7

,4,3,20

11

k

kk

pacf

0

0.2

0.4

0.6

1 2 3 4 5 6 7 8 9 10 1112 1314 15 1617 1819 20

k

pacf

-0.8

-0.6

-0.4

-0.2

01 2 3 4 5 6 7 8 9 101112 1314151617 181920

k

Page 34: Något om val mellan olika metoder

Antag nu att vi har en observerad tidsserie i n tidpunkter: y1, y2,…, yn

t

Yt

200150100500

160

140

120

100

80

60

40

20

0

Om tidsserien satisfierar en AR(1)-modell borde detta avspeglas i SAC och SPAC, dvs. skattningarna av acf och pacf.

Vi förväntar oss att få liknande utseenden som de teoretiska funktionerna har.

Page 35: Något om val mellan olika metoder

SAC:

Lag

Auto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Yt(with 5% significance limits for the autocorrelations)

Verkar i början avta ungefär som den teoretiska acf.

De “spikar” som hamnar inom de röda linjerna kan bortses från om de ligger långt från 0.

SPAC:

Lag

Part

ial A

uto

corr

ela

tion

50454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Partial Autocorrelation Function for Yt(with 5% significance limits for the partial autocorrelations) En tydlig spik för k = 1. Övriga kan

negligeras. Utseendet överensstämmer alltså med den teoretiska pacf.

Verkar vara en AR(1)-modell

Page 36: Något om val mellan olika metoder

Skattning av parametrar i en AR(1)-modell

Minitab (liksom andra statistiska programpaket) har procedurer för att skatta parametrar i autoregressiva modeller.

AR(1) är ett specialfall av de generella ARIMA-modellerna.

Skattningsproceduren är betydligt mer komplicerad än t.ex. För multipel regressionsanalys Ingen närmare teoretisk genomgång görs här.

Page 37: Något om val mellan olika metoder

Ger skattning av en AR(1)-modell

Här kan man välja om skall vara med eller ej

Page 38: Något om val mellan olika metoder

ARIMA model for Yt

Estimates at each iteration

Iteration SSE Parameters

0 5144.80 0.100 114.252

1 3985.36 0.250 95.207

2 3095.92 0.400 76.162

4 2127.03 0.700 38.070

7 2041.72 0.819 22.948

8 2041.72 0.819 22.929

Relative change in each estimate less than 0.0010

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 0.8190 0.0409 20.00 0.000

Constant 22.9295 0.2263 101.31 0.000

Mean 126.700 1.251

1

Page 39: Något om val mellan olika metoder

Number of observations: 200

Residuals: SS = 2027.86 (backforecasts excluded)

MS = 10.24 DF = 198

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 8.8 25.1 36.7 50.8

DF 10 22 34 46

P-Value 0.552 0.290 0.346 0.291

Ljung-Box är mått på hur bra anpassningen har blivit. Alla P-värden skall vara stora här om modellen skall anses vara bra.

Skattad modell är alltså:

och automatiskt erhålls prognosmodellen:

1819.093.22 tt yy

tt yy 819.093.22ˆ 1

Page 40: Något om val mellan olika metoder

Fler modeller

Autoregressiv modell av ordning 2, AR(2):

Har längre beroenden än AR(1)

Typiska utseenden hos acf och pacf:

acf: Avtar relativt snabbt mot noll, ev. med växlande tecken

pacf: Är skild från 0 för k=1 och 2, är 0 för k = 3, 4, 5, ….

tttt ayyy 2211

acf

0

0.2

0.4

0.6

0.8

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

k

pacf

0

0.2

0.4

0.6

0.8

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

k

Page 41: Något om val mellan olika metoder

Glidande medelvärdesmodell av ordning 1, MA(1) (Moving Average):

• yt “skapas” alltså genom en sammanvägning av det vita bruset (ett sorts glidande medelvärde av en underliggande slumpvariation.

• en MA(1) är alltid stationär

• svårare att tolka, svårare att uttrycka en generell prognosformel

• acf: har motsvarande utseenden som en pacf för AR(1)

• pacf: har motsvarande utseenden som en acf för AR(1)

Lika “enkelt” att identifiera en MA(1) som en AR(1)

• skattningar av parametrar och prognoser kan beräknas med samma program som tidigare

11 ttt aay

Page 42: Något om val mellan olika metoder

Glidande medelvärdesmodell av ordning 2, MA(2):

• har längre beroenden än en MA(1)

• är alltid stationär

• acf: motsvarande utseenden som pacf för AR(2)

• pacf: motsvarande utseenden som acf för AR(2)

Kombinerad autoregressiv och glidande medelvärdesmodell av

ordningarna p och q, ARMA(p, q):

• har mer komplicerade beroenden

• acf: avtar mot noll, ofta med växlande tecken

• pacf: avtar mot noll, ofta med växlande tecken

2211 tttt aaay

qtqttptptt aaayyy 1111

Page 43: Något om val mellan olika metoder

Exempel: Finansinstitutens utlåning till hushåll kv 1, 1992 -

kv 3, 2001

0

10000

20000

30000

40000

50000

1 4 7 10 13 16 19 22 25 28 31 34 37

(kvartal)

MK

r

Tidsserien innehåller trend och är därför inte stationär.

Differentiering behövs!

Obs! Kvartalsdata, men det är tydligt att någon säsongsvariation ej finns. Betrakta data som varandes utan säsongkomponent.

Page 44: Något om val mellan olika metoder

Efter en differentiering:

Index

Diff(

Yt)

3632282420161284

5000

4000

3000

2000

1000

0

-1000

-2000

-3000

Kan den vara stationär? Kolla med SAC och SPAC.

Page 45: Något om val mellan olika metoder

Lag

Auto

corr

ela

tion

10987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Diff(Yt)(with 5% significance limits for the autocorrelations)

SAC:

SPAC:

Lag

Part

ial A

uto

corr

ela

tion

10987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Partial Autocorrelation Function for Diff(Yt)(with 5% significance limits for the partial autocorrelations)

Verkar definitivt vara stationär. Frågan är vad det kan röra sig om för modell.

Ingen ren AR- eller MA-modell kan ses.

Prova med en ARMA(1,1)

Page 46: Något om val mellan olika metoder

Notera att en ARMA(1,1) skulle gälla för den differentierade serien.

Prognoser vill vi dock ha för originalserien!

Minitab (och andra) fixar detta!

StatTime SeriesARIMA… Originalserien

Anger att vi vill differentiera 1 gång

Ordningarna, dvs. 1 och 1 i den ARMA-modell som anpassas till diff. data

Page 47: Något om val mellan olika metoder

Anger som vanligt att vi vill ha prognoser 4 tidpunkter framåt räknat från slutet.

(dvs. prognoser för kvartal 1, 2, 3 och 4 2002)

Page 48: Något om val mellan olika metoder

ARIMA Model: Yt

.

.

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 1.0455 0.0731 14.29 0.000

MA 1 0.8875 0.1663 5.34 0.000

Differencing: 1 regular difference

Number of observations: Original series 39, after differencing 38

Residuals: SS = 59067529 (backforecasts excluded)

MS = 1640765 DF = 36

Signifikanta parameterskattningar!

Page 49: Något om val mellan olika metoder

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 6.3 15.0 30.2 *

DF 10 22 34 *

P-Value 0.793 0.861 0.656 *

Ljung-Box ser bra ut!

Forecasts from period 39

95 Percent

Limits

Period Forecast Lower Upper Actual

40 45657.6 43146.5 48168.7

41 47636.4 43794.3 51478.5

42 49705.3 44625.7 54784.9 Prognoserna med intervall!

43 51868.4 45550.6 58186.1

Page 50: Något om val mellan olika metoder

Följande figur kan även “beställas” vid körningen:

Time

Yt

4035302520151051

60000

50000

40000

30000

20000

Time Series Plot for Yt(with forecasts and their 95% confidence limits)

Page 51: Något om val mellan olika metoder

Åter till växelkursdata!

Om vi nu tror att den differentierade serien är stationär

Diff(

EUR

/SEK

)

MonthDay

novokt2111121111

0.6

0.4

0.2

0.0

-0.2

Time Series Plot of Diff(EUR/ SEK)

Lag

Auto

corr

ela

tion

151413121110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for Diff(EUR/ SEK)(with 5% significance limits for the autocorrelations)

SAC

Lag

Part

ial A

uto

corr

ela

tion

151413121110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Partial Autocorrelation Function for Diff(EUR/ SEK)(with 5% significance limits for the partial autocorrelations)

SPAC

Ingen renodlad AR- eller MA-modell här heller.

Pröva med en ARMA(1,1)

Page 52: Något om val mellan olika metoder

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 -0.2081 0.4057 -0.51 0.610

MA 1 -0.5021 0.3552 -1.41 0.163

Constant 0.01607 0.01161 1.38 0.172

Differencing: 1 regular difference

Number of observations: Original series 62, after differencing 61

Residuals: SS = 0.210938 (backforecasts excluded)

MS = 0.003637 DF = 58

Ej signifikanta!

Page 53: Något om val mellan olika metoder

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 11.8 31.1 41.0 54.0

DF 9 21 33 45

P-Value 0.227 0.072 0.160 0.169

Forecasts from period 62

95 Percent

Limits

Period Forecast Lower Upper Actual

63 10.4524 10.3342 10.5707

64 10.4701 10.2767 10.6634

65 10.4825 10.2403 10.7246

OK här!

Time

EUR

/S

EK

65605550454035302520151051

10.75

10.50

10.25

10.00

9.75

9.50

Time Series Plot for EUR/ SEK(with forecasts and their 95% confidence limits)

Detta är det diagram vi först såg (men då med trianglarna grönfärgade).

Page 54: Något om val mellan olika metoder

Andra tillämpningar:

Residualerna från en tidsserieregression, eller från vilken regression som helst där tiden är inblandad kan ofta uppvisa beroendemönster (jfr. Durbin-Watson’s test)

Residualerna kan modelleras separat med en AR-modell och därigenom erhålls bättre skattningar och prognoser (smalare prognosintervall)

Exempel: I datorövning 6 gjordes en tidsserieregression på andel arbetslösa 1994-2002.

Page 55: Något om val mellan olika metoder

Residualerna uppvisar en tydlig positiv seriell korrelation, dvs. autokorrelation, eftersom mönstret är en ”följsam” kurva.

Observation Order

Resi

dual

1009080706050403020101

2.0

1.5

1.0

0.5

0.0

-0.5

-1.0

Residuals Versus the Order of the Data(response is %Unemployed)

Page 56: Något om val mellan olika metoder

Observation Order

Resi

dual

1009080706050403020101

2.0

1.5

1.0

0.5

0.0

-0.5

-1.0

Residuals Versus the Order of the Data(response is %Unemployed)

Detta är den variationbredd som skattningen av s baseras på

Detta är den egentliga variationsbredden som själva slumpen omfattar

Om inte hänsyn tas till att residualerna är korrelerade kan man i vissa fall överskatta slumpvariationen

Osäkra parameterskattningar, breda prognosintervall

Page 57: Något om val mellan olika metoder

Går det nu att anpassa t.ex. en AR-modell till residualerna?

SAC:

SPAC:

Kanske inte helt orimligt med en AR(1)-modell även om det finns en störande spik i SPAC längst t.h. Det är dock snudd på icke-stationaritet.

Lag

Auto

corr

ela

tion

2624222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Autocorrelation Function for RESI2(with 5% significance limits for the autocorrelations)

Lag

Part

ial A

uto

corr

ela

tion

2624222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Partial Autocorrelation Function for RESI2(with 5% significance limits for the partial autocorrelations)

Page 58: Något om val mellan olika metoder

Ingen konstantterm tas med eftersom residualerna varierar runt 0

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 0.9126 0.0409 22.31 0.000

Number of observations: 108

Residuals: SS = 8.24689 (backforecasts excluded)

MS = 0.07707 DF = 107

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 16.5 24.5 45.1 54.3

DF 11 23 35 47

P-Value 0.124 0.377 0.118 0.217

Page 59: Något om val mellan olika metoder

Anpassningen av en AR-modell till residualerna skall göras samtidigt med anpassningen av själva regressionsmodellen (för att få rätt standardavvikelse och medelfel för skattningar)

Kan dock ej göras i Minitab, men i t.ex. SAS

Överhuvudtaget kan modellerna byggas ut till att omfatta säsongsvariation (SARIMA) men även för att inkludera andra tidsserier som förklaringsvariabler (s.k. Transfer Function Models)

En intressant delmodell av detta är s.k. interventionsmodeller (t.ex. inkludering av 11-september-effekten i analyserna)

För allt detta krävs fler kurser i tidsserieanalys!