något om val mellan olika metoder
Post on 26-Jan-2016
56 Views
Preview:
DESCRIPTION
TRANSCRIPT
Något om val mellan olika metoder
Givet är en observerad tidsserie: y1, y2,…,yn
Säsonger?Nej
Trend?Nej
ARMA-modeller
Enkel exponentiell utjämning
Tidsserieregression
ARIMA-modeller
Dubbel exponentiell utjämning
Ja
Tidsserieregression
Klassisk komponentuppdelning
(S)ARIMA-modeller
Winters’ metod
ARMA-, ARIMA, (S)ARIMA
Modernare metoder för tidsserieanalys och prognoser
• Box, George and Jenkins, Gwilym (1970) Time series analysis: Forecasting and control, San Francisco: Holden-Day
– Ett “standardverk” som samlade upp idéer, uppkomna från c:a 1950-talet inom ekonometri och ingenjörsvetenskap
– Skapade ett system för att identifiera, skatta och utvärdera modeller för tidsserier
– Metodologin går fortfarande under namnen “Box-Jenkins-metodik”
EUR/SEK
MonthDay
novokt2111121111
10.50
10.25
10.00
9.75
9.50
Time Series Plot of EUR/ SEK
Exempel: Växelkurs EUR/SEK 25 sep – 25 nov 2008 (Källa: www.oanda.com, 2008-11-25)
Säsongsvariation?
Trend?
Konjunktur?
Om vi skulle vilja göra korttidsprognoser för t.ex. en dag eller två?
Med hittills genomgångna metoder:
1) Tidsserieregression med linjär/kvadratisk trend, men utan säsongdummies
2) Dubbel exponentiell utjämning (Holt’s metod)
Fungerar dessa bra?
Data
MonthDay
novokt2111121111
10.50
10.25
10.00
9.75
9.50
EUR/SEKFITS1forecastslolimuplim
Variable
Time Series Plot of EUR/ SEK; FITS1; forecasts; lolim; uplim
Tidsserieregression, linjär trend
EUR
/SEK
MonthDay
novokt2111121111
10.75
10.50
10.25
10.00
9.75
9.50
Alpha (level) 1.30980Gamma (trend) 0.04006
Smoothing Constants
MAPE 0.464123MAD 0.046514MSD 0.003581
Accuracy Measures
ActualSmoothedForecasts95.0% PI
Variable
Double Exponential Smoothing Plot for EUR/ SEK
Holt’s metod
Smoothing ConstantsAlpha (level) 1.30980Gamma (trend) 0.04006
En vanlig metod som inte tagits upp till fullo i kursen:
Rullande medelvärden (mer korrekt: Glidande oviktade medelvärden)
StatTime SeriesMoving Average…
Veckovis “rullande” medelvärden
EUR/SEK
MonthDay
novokt2111121111
10.50
10.25
10.00
9.75
9.50
Length 7Moving Average
MAPE 0.886779MAD 0.089558MSD 0.016162
Accuracy Measures
ActualSmoothedForecasts95.0% PI
Variable
Moving Average Plot for EUR/ SEK
Inte så imponerande heller!
Time
EUR
/S
EK
65605550454035302520151051
10.75
10.50
10.25
10.00
9.75
9.50
Time Series Plot for EUR/ SEK(with forecasts and their 95% confidence limits)
Är nedanstående bättre? (De gröna trianglarna motsvarar prognoserna för 26/11 och 27/11 samt prognosintervallgränser, resten är originaldata.)
Vad är detta för metod?
Några viktiga begrepp i sammanhanget
Stationaritet
En tidsserie säges vara stationär om den i princip består av data med konstant väntevärde och varians
2001000
25
20
15
10
5
0
t
Yt
Något mer matematiskt:
E( yt ) =
Var( yt ) = 2
Corr( yt , yt-k ) beror bara av k
och alltså inte av t.
Hur kan icke-stationära tidsserier se ut?
2001000
2500
2000
1500
1000
500
0
t
Wt
2001000
250000
200000
150000
100000
50000
0
t
Ut
Linjär trend, icke-stationär av första ordningen
Kvadratisk trend, icke-stationär av andra ordningen
2001000
50000
0
-50000
-100000
t
Vt
Icke-konstant varians, även om väntevärdet verkar konstant
Är växelkursexemplet en stationär tidsserie?
EUR/SEK
MonthDay
novokt2111121111
10.50
10.25
10.00
9.75
9.50
Time Series Plot of EUR/ SEK
Beror på tidsperspektivet. Här ser det ut som att en trend finns, men i ett längre tidsperspektiv rör det sig nog bara om en tendens.
Kan en tidsserie göras stationär?
Differentiering
En tidsserie wt som är icke-stationär av första ordningen (i princip uppvisar en linjär trend) kan differentieras en gång:
yt = wt = wt – wt – 1
yt kan då bli en stationär serie (men inte nödvändigtvis)
En tidsserie som är icke-stationär av andra ordningen (i princip uppvisar en kvadratisk trend) kan differentieras två gånger:
yt = (ut ) = ut – ut – 1 = ut – ut – 1 – ( ut – 1 – ut – 2 ) = ut – 2 ∙ ut – 1 + ut – 2
yt kan då bli en stationär serie (men inte nödvändigtvis)
2001000
500
0
-500
-1000
t
Diff
Wt
Har den blivit stationär?2001000
2500
2000
1500
1000
500
0
t
Wt
Variansstabilisering
Om variansen inte bedöms vara konstant Transformera på samma sätt som vid regressionsanalys, oftast med logaritmering
w’t = ln ( wt )
2001000
8
7
6
5
4
3
2
t
log(
Wt)
2001000
2500
2000
1500
1000
500
0
t
Wt
Konstant varians?
Efter variansstabilisering kanske det blir OK att differentiera
2001000
1.0
0.5
0.0
-0.5
tD
iff lo
g(W
t)
2001000
8
7
6
5
4
3
2
t
log(
Wt)
(log(Wt))
Stationär?
Fungerar detta för våra växelkursdata?EU
R/SEK
MonthDay
novokt2111121111
10.50
10.25
10.00
9.75
9.50
Time Series Plot of EUR/ SEK
Diff(
EUR
/SEK
)
MonthDay
novokt2111121111
0.6
0.4
0.2
0.0
-0.2
Time Series Plot of Diff(EUR/ SEK)
Inte otänkbart!
Autokorrelation
För en tidsserie yt definieras autokorrelationsfunktionen (acf) som
k = Corr ( yt , yt – k ) för k = 1, 2, 3, 4, …
Anger alltså korrelationen (graden av linjärt beroende) mellan två värden på tidsavstånd k i tidsserien.
För en stationär tidsserie skall acf endast vara en funktion av k, dvs. det skall inte spela någon roll var i tidsserien de två värdena ligger utan endast vilket tidsavstånd det är mellan dem.
Värdena kan både vara positiva och negativa (beroende på hur beroendet ser ut)
För serier med korta beroenden avtar acf snabbt mot 0 då k växer
acf
00.05
0.10.15
0.20.25
0.30.35
1 2 3 4 5 6 7 8 9 1011121314151617181920
k
acf
-0.6
-0.4
-0.2
0
0.2
0.4
1 3 5 7 9 11 13 15 17 19
k
För serier med långa beroenden avtar acf långsammare, men tydligt mot 0 då k växer
acf
0
0.2
0.4
0.6
0.8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
k
En tidsserie med väntevärde 0 och där acf är = 0 överallt kallas vitt brus
Innehåller egentligen ingen information
Kan man se i figuren att acf = 0 överallt?
t
Et
200150100500
5.0
2.5
0.0
-2.5
-5.0
-7.5
Skattning av acf
Minitab (och andra statistiska programpaket) har funktioner för att skatta acf från existerande data
t
Yt
200150100500
16
14
12
10
8
6
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Yt(with 5% significance limits for the autocorrelations)
t
Et
200150100500
5.0
2.5
0.0
-2.5
-5.0
-7.5
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Et(with 5% significance limits for the autocorrelations)
t
Wt
200150100500
2500
2000
1500
1000
500
0
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Wt(with 5% significance limits for the autocorrelations)
Typiskt exempel på en skattad acf för en tidsserie som inte är stationär. Mycket långsamt avklingande mönster.
Autokorrelationen är hög för värden som ligger på en gemensam trend.
Skattad acf brukar i litteraturen förkortas SAC (Sample AutoCorrelation function)
Hur ser SAC ut för växelkursdata?
Lag
Auto
corr
ela
tion
16151413121110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for EUR/ SEK(with 5% significance limits for the autocorrelations)
Litet väl långsamt avklingande. Tyder på icke-stationaritet i form av linjär trend.
Med hjälp av SAC kan man tydligen bedöma om en serie är stationär eller ej. Bra hjälpmedel för att t.ex. se om en differentiering räcker.
t
Wt
200150100500
2500
2000
1500
1000
500
0
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Wt(with 5% significance limits for the autocorrelations)
Icke-stationär (men det visste vi i och för sig)
Differentiera en gång
t
Diff W
t
200150100500
500
250
0
-250
-500
-750
-1000
-1250Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Diff Wt(with 5% significance limits for the autocorrelations)
Mer stationär, men ännu inte tillräckligt avklingande
Logaritmera och differentiera sedan
t
log(W
t)
200150100500
8
7
6
5
4
3
2
t
Diff lo
g(W
t)
200150100500
1.00
0.75
0.50
0.25
0.00
-0.25
-0.50
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Diff log(Wt)(with 5% significance limits for the autocorrelations)
Bättre än tidigare. Snabbare avklingning mot 0.
Partiell autokorrelation
Svårare begrepp.
Den partiella autokorrelationen mellan y och x definieras som den del av korrelationen mellan y och x som inte har att göra med andra variabler.
Partiell autokorrelationsfunktion (pacf) för tidsserier
k = Corr( yt , yt – k | yt – (k – 1) , yt – (k – 2) , …, yt – 1 )
Funktionen har egenskaper som effektivt kan utnyttjas vid identifiering av modeller (se nedan)
Även den partiella autokorrelationsfunktionen kan skattas från existerande data. Den brukar då kallas SPAC
z
y
x
Röd korrelation är unik mellan y och x , dvs. partiell korrelationBlå korrelation kommer från y:s och x:s respektive samband med zRöd + Blå är den totala korrelationen.
Autoregressiva modeller (AR-modeller)
En tidsserie y1, y2, y3, … satisfierar en autoregressiv modell av ordning 1, en s.k. AR(1)-modell om
där och 1 är konstanter (parametrar) och at är vitt brus, dvs. en serie av okorrelerade värden (Corr(at , at – k ) = 0 för alla k) med väntevärde 0 och konstant varians (jfr. t från tidsserieregressionen)
(till exempel: yt = 2.0 + 0.4 yt – 1 + at )
“autoregressiv” innebär alltså att y har regression “på sig själv” (fast ett tidssteg bakåt)
ttt ayy 11
Exempel:
yt = 2.0 + 0.4 yt – 1 + at där at antas vara okorrelerade och N(0, 2)-fördelade
En realisering av denna tidsserie i 200 tidpunkter kan se ut på följande sätt
t
Yt
200150100500
10
8
6
4
2
0
-2
Om vi istället realiserar 200 värden av följande modell
yt = 2.0 – 0.4 yt – 1 + at där at antas vara okorrelerade och N(0, 2)-fördelade
dvs. 1 = – 0.4 istället för 0.4
kan vi få
t
Yt
200150100500
7.5
5.0
2.5
0.0
-2.5
-5.0 t
Yt
200150100500
10
8
6
4
2
0
-2
Jämför med 1 = 0.4 :
Stationära och icke stationära AR(1)-modeller
En tidsserie som satisfierar en AR(1)-modell är stationär om –1 < 1 < 1
Om 1 = 1 eller –1 råder instabilt läge. Serien kan urarta men behöver inte göra det.
Om 1 = 1 och = 0 säges tidsserien vara en random walk (slumpvandring)
yt = yt – 1 + at
En vanlig modell för enskilda aktiekurser.
Prognoser beräknas med den enkla formeln
persistensprognos
tt yy ˆˆ 1
Exempel på realisering av en random walk
t
Yt
200150100500
5
0
-5
-10
-15
-20
-25
-30
-35
Skulle mycket väl kunna motsvara utvecklingen av en aktiekurs,
men kan vi med utgångspunkt från det tycka att det rör sig om en trend?
Om | 1 | > 1 säger man ibland att AR(1)-modellen är explosiv.
Exempel: En realisering av modellen yt = 2.0 + 1.01 yt – 1 + at med at ~ N(0, 2)
t
Yt
200150100500
1400
1200
1000
800
600
400
200
0
Tydligt icke-stationär!
Identifiering av AR(1)-modeller
För tidsserier som satisfierar en AR(1)-modell och är stationära, dvs. | 1 | < 1, gäller att autokorrelationsfunktionen (acf) är
Exempel:
1 = 0.4 1 = –0.7
,3,2,1,1 kkk
acf
0
0.1
0.2
0.3
0.4
0.5
1 2 3 4 5 6 7 8 9 101112131415 1617181920
k
acf
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
1 3 5 7 9 11 13 15 17 19
k
Vidare gäller att den partiella autokorrelationsfunktionen är
Exempel:
1 = 0.4 1 = –0.7
,4,3,20
11
k
kk
pacf
0
0.2
0.4
0.6
1 2 3 4 5 6 7 8 9 10 1112 1314 15 1617 1819 20
k
pacf
-0.8
-0.6
-0.4
-0.2
01 2 3 4 5 6 7 8 9 101112 1314151617 181920
k
Antag nu att vi har en observerad tidsserie i n tidpunkter: y1, y2,…, yn
t
Yt
200150100500
160
140
120
100
80
60
40
20
0
Om tidsserien satisfierar en AR(1)-modell borde detta avspeglas i SAC och SPAC, dvs. skattningarna av acf och pacf.
Vi förväntar oss att få liknande utseenden som de teoretiska funktionerna har.
SAC:
Lag
Auto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Yt(with 5% significance limits for the autocorrelations)
Verkar i början avta ungefär som den teoretiska acf.
De “spikar” som hamnar inom de röda linjerna kan bortses från om de ligger långt från 0.
SPAC:
Lag
Part
ial A
uto
corr
ela
tion
50454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Partial Autocorrelation Function for Yt(with 5% significance limits for the partial autocorrelations) En tydlig spik för k = 1. Övriga kan
negligeras. Utseendet överensstämmer alltså med den teoretiska pacf.
Verkar vara en AR(1)-modell
Skattning av parametrar i en AR(1)-modell
Minitab (liksom andra statistiska programpaket) har procedurer för att skatta parametrar i autoregressiva modeller.
AR(1) är ett specialfall av de generella ARIMA-modellerna.
Skattningsproceduren är betydligt mer komplicerad än t.ex. För multipel regressionsanalys Ingen närmare teoretisk genomgång görs här.
Ger skattning av en AR(1)-modell
Här kan man välja om skall vara med eller ej
ARIMA model for Yt
Estimates at each iteration
Iteration SSE Parameters
0 5144.80 0.100 114.252
1 3985.36 0.250 95.207
2 3095.92 0.400 76.162
4 2127.03 0.700 38.070
7 2041.72 0.819 22.948
8 2041.72 0.819 22.929
Relative change in each estimate less than 0.0010
Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 0.8190 0.0409 20.00 0.000
Constant 22.9295 0.2263 101.31 0.000
Mean 126.700 1.251
1
Number of observations: 200
Residuals: SS = 2027.86 (backforecasts excluded)
MS = 10.24 DF = 198
Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 8.8 25.1 36.7 50.8
DF 10 22 34 46
P-Value 0.552 0.290 0.346 0.291
Ljung-Box är mått på hur bra anpassningen har blivit. Alla P-värden skall vara stora här om modellen skall anses vara bra.
Skattad modell är alltså:
och automatiskt erhålls prognosmodellen:
1819.093.22 tt yy
tt yy 819.093.22ˆ 1
Fler modeller
Autoregressiv modell av ordning 2, AR(2):
Har längre beroenden än AR(1)
Typiska utseenden hos acf och pacf:
acf: Avtar relativt snabbt mot noll, ev. med växlande tecken
pacf: Är skild från 0 för k=1 och 2, är 0 för k = 3, 4, 5, ….
tttt ayyy 2211
acf
0
0.2
0.4
0.6
0.8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
k
pacf
0
0.2
0.4
0.6
0.8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
k
Glidande medelvärdesmodell av ordning 1, MA(1) (Moving Average):
• yt “skapas” alltså genom en sammanvägning av det vita bruset (ett sorts glidande medelvärde av en underliggande slumpvariation.
• en MA(1) är alltid stationär
• svårare att tolka, svårare att uttrycka en generell prognosformel
• acf: har motsvarande utseenden som en pacf för AR(1)
• pacf: har motsvarande utseenden som en acf för AR(1)
Lika “enkelt” att identifiera en MA(1) som en AR(1)
• skattningar av parametrar och prognoser kan beräknas med samma program som tidigare
11 ttt aay
Glidande medelvärdesmodell av ordning 2, MA(2):
• har längre beroenden än en MA(1)
• är alltid stationär
• acf: motsvarande utseenden som pacf för AR(2)
• pacf: motsvarande utseenden som acf för AR(2)
Kombinerad autoregressiv och glidande medelvärdesmodell av
ordningarna p och q, ARMA(p, q):
• har mer komplicerade beroenden
• acf: avtar mot noll, ofta med växlande tecken
• pacf: avtar mot noll, ofta med växlande tecken
2211 tttt aaay
qtqttptptt aaayyy 1111
Exempel: Finansinstitutens utlåning till hushåll kv 1, 1992 -
kv 3, 2001
0
10000
20000
30000
40000
50000
1 4 7 10 13 16 19 22 25 28 31 34 37
(kvartal)
MK
r
Tidsserien innehåller trend och är därför inte stationär.
Differentiering behövs!
Obs! Kvartalsdata, men det är tydligt att någon säsongsvariation ej finns. Betrakta data som varandes utan säsongkomponent.
Efter en differentiering:
Index
Diff(
Yt)
3632282420161284
5000
4000
3000
2000
1000
0
-1000
-2000
-3000
Kan den vara stationär? Kolla med SAC och SPAC.
Lag
Auto
corr
ela
tion
10987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Diff(Yt)(with 5% significance limits for the autocorrelations)
SAC:
SPAC:
Lag
Part
ial A
uto
corr
ela
tion
10987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Partial Autocorrelation Function for Diff(Yt)(with 5% significance limits for the partial autocorrelations)
Verkar definitivt vara stationär. Frågan är vad det kan röra sig om för modell.
Ingen ren AR- eller MA-modell kan ses.
Prova med en ARMA(1,1)
Notera att en ARMA(1,1) skulle gälla för den differentierade serien.
Prognoser vill vi dock ha för originalserien!
Minitab (och andra) fixar detta!
StatTime SeriesARIMA… Originalserien
Anger att vi vill differentiera 1 gång
Ordningarna, dvs. 1 och 1 i den ARMA-modell som anpassas till diff. data
Anger som vanligt att vi vill ha prognoser 4 tidpunkter framåt räknat från slutet.
(dvs. prognoser för kvartal 1, 2, 3 och 4 2002)
ARIMA Model: Yt
.
.
Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 1.0455 0.0731 14.29 0.000
MA 1 0.8875 0.1663 5.34 0.000
Differencing: 1 regular difference
Number of observations: Original series 39, after differencing 38
Residuals: SS = 59067529 (backforecasts excluded)
MS = 1640765 DF = 36
Signifikanta parameterskattningar!
Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 6.3 15.0 30.2 *
DF 10 22 34 *
P-Value 0.793 0.861 0.656 *
Ljung-Box ser bra ut!
Forecasts from period 39
95 Percent
Limits
Period Forecast Lower Upper Actual
40 45657.6 43146.5 48168.7
41 47636.4 43794.3 51478.5
42 49705.3 44625.7 54784.9 Prognoserna med intervall!
43 51868.4 45550.6 58186.1
Följande figur kan även “beställas” vid körningen:
Time
Yt
4035302520151051
60000
50000
40000
30000
20000
Time Series Plot for Yt(with forecasts and their 95% confidence limits)
Åter till växelkursdata!
Om vi nu tror att den differentierade serien är stationär
Diff(
EUR
/SEK
)
MonthDay
novokt2111121111
0.6
0.4
0.2
0.0
-0.2
Time Series Plot of Diff(EUR/ SEK)
Lag
Auto
corr
ela
tion
151413121110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for Diff(EUR/ SEK)(with 5% significance limits for the autocorrelations)
SAC
Lag
Part
ial A
uto
corr
ela
tion
151413121110987654321
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Partial Autocorrelation Function for Diff(EUR/ SEK)(with 5% significance limits for the partial autocorrelations)
SPAC
Ingen renodlad AR- eller MA-modell här heller.
Pröva med en ARMA(1,1)
Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 -0.2081 0.4057 -0.51 0.610
MA 1 -0.5021 0.3552 -1.41 0.163
Constant 0.01607 0.01161 1.38 0.172
Differencing: 1 regular difference
Number of observations: Original series 62, after differencing 61
Residuals: SS = 0.210938 (backforecasts excluded)
MS = 0.003637 DF = 58
Ej signifikanta!
Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 11.8 31.1 41.0 54.0
DF 9 21 33 45
P-Value 0.227 0.072 0.160 0.169
Forecasts from period 62
95 Percent
Limits
Period Forecast Lower Upper Actual
63 10.4524 10.3342 10.5707
64 10.4701 10.2767 10.6634
65 10.4825 10.2403 10.7246
OK här!
Time
EUR
/S
EK
65605550454035302520151051
10.75
10.50
10.25
10.00
9.75
9.50
Time Series Plot for EUR/ SEK(with forecasts and their 95% confidence limits)
Detta är det diagram vi först såg (men då med trianglarna grönfärgade).
Andra tillämpningar:
Residualerna från en tidsserieregression, eller från vilken regression som helst där tiden är inblandad kan ofta uppvisa beroendemönster (jfr. Durbin-Watson’s test)
Residualerna kan modelleras separat med en AR-modell och därigenom erhålls bättre skattningar och prognoser (smalare prognosintervall)
Exempel: I datorövning 6 gjordes en tidsserieregression på andel arbetslösa 1994-2002.
Residualerna uppvisar en tydlig positiv seriell korrelation, dvs. autokorrelation, eftersom mönstret är en ”följsam” kurva.
Observation Order
Resi
dual
1009080706050403020101
2.0
1.5
1.0
0.5
0.0
-0.5
-1.0
Residuals Versus the Order of the Data(response is %Unemployed)
Observation Order
Resi
dual
1009080706050403020101
2.0
1.5
1.0
0.5
0.0
-0.5
-1.0
Residuals Versus the Order of the Data(response is %Unemployed)
Detta är den variationbredd som skattningen av s baseras på
Detta är den egentliga variationsbredden som själva slumpen omfattar
Om inte hänsyn tas till att residualerna är korrelerade kan man i vissa fall överskatta slumpvariationen
Osäkra parameterskattningar, breda prognosintervall
Går det nu att anpassa t.ex. en AR-modell till residualerna?
SAC:
SPAC:
Kanske inte helt orimligt med en AR(1)-modell även om det finns en störande spik i SPAC längst t.h. Det är dock snudd på icke-stationaritet.
Lag
Auto
corr
ela
tion
2624222018161412108642
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Autocorrelation Function for RESI2(with 5% significance limits for the autocorrelations)
Lag
Part
ial A
uto
corr
ela
tion
2624222018161412108642
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Partial Autocorrelation Function for RESI2(with 5% significance limits for the partial autocorrelations)
Ingen konstantterm tas med eftersom residualerna varierar runt 0
Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 0.9126 0.0409 22.31 0.000
Number of observations: 108
Residuals: SS = 8.24689 (backforecasts excluded)
MS = 0.07707 DF = 107
Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 16.5 24.5 45.1 54.3
DF 11 23 35 47
P-Value 0.124 0.377 0.118 0.217
Anpassningen av en AR-modell till residualerna skall göras samtidigt med anpassningen av själva regressionsmodellen (för att få rätt standardavvikelse och medelfel för skattningar)
Kan dock ej göras i Minitab, men i t.ex. SAS
Överhuvudtaget kan modellerna byggas ut till att omfatta säsongsvariation (SARIMA) men även för att inkludera andra tidsserier som förklaringsvariabler (s.k. Transfer Function Models)
En intressant delmodell av detta är s.k. interventionsmodeller (t.ex. inkludering av 11-september-effekten i analyserna)
För allt detta krävs fler kurser i tidsserieanalys!
top related