curso de anÁlise de sÉries temporais –...
TRANSCRIPT
![Page 1: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/1.jpg)
1
FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia
CURSO DE ANÁLISE DE SÉRIES
TEMPORAIS – MODELO ARIMA
MATERIAL DE APOIO
Professor:
Sandro Eduardo Monsueto
NEPEC/FACE/UFG
Goiânia – Setembro/Outubro 2014
Versão 1.0
![Page 2: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/2.jpg)
2
1. Introdução e conceitos básicos
Esta apostila serve de material de apoio para a realização do curso. Longe de ser
abrangente, tem como objetivo servir de guia ou de lembrete para a execução de
tarefas. Outros materiais, melhores e mais completos, podem ser facilmente
encontrados de forma gratuita na internet e em livros especializados no assunto. Para
realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar
gratuitamente no site gretl.sourceforge.net.
A primeira definição necessária para nossa análise é o conceito de série
temporal. Uma série temporal é uma sequência de dados no tempo com uma
determinada periodicidade. Alguns exemplos:
- PIB brasileiro trimestral.
- taxa de juros mensal.
- índice pluviométrico semanal.
- valor das ações da Petrobras minuto a minuto.
Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de
vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação
algébrica para representar os dados no tempo:
Yt: a observação no tempo t da variável Y. Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal. Yt+1: a observação um período a frente. Generalizando: Yt±j: a observação no período t±j Exemplo:
Mês Período Yt Yt-1 Yt+1
1991.01 Y1 3,6 3,9
1991.02 Y2 3,9 3,6 2,5
1991.03 Y3 2,5 3,9 1,9
1991.04 Y4 1,9 2,5 2,7
1991.05 Y5 2,7 1,9 2,4
1991.06 Y6 2,4 2,7 1,6
1991.07 Y7 1,6 2,4 1,6
1991.08 Y8 1,6 1,6 1,7
1991.09 Y9 1,7 1,6 2,5
1991.10 Y10 2,5 1,7 -
O restante do material está constituído de uma série de exemplos estimados com
dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do
curso serão acrescentados novos exemplos.
![Page 3: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/3.jpg)
3
2. Exemplos de Modelos Autoregressivos – AR(p) AR(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,571725 0,11237 5,0879 <0,00001 ***
phi_1 0,788617 0,0471062 16,7413 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006069 D.P. das inovações 0,326753
Log da verossimilhança -55,45739 Critério de Akaike 116,9148
Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2680 0,0000 1,2680 0,0000
AR(2) Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,569602 0,108703 5,2400 <0,00001 ***
phi_1 0,815008 0,0755062 10,7939 <0,00001 ***
phi_2 -0,0338969 0,0758055 -0,4472 0,65476
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,005716 D.P. das inovações 0,326574
Log da verossimilhança -55,35740 Critério de Akaike 118,7148
Critério de Schwarz 131,5527 Critério Hannan-Quinn 123,9187
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2969 0,0000 1,2969 0,0000
Raiz 2 22,7468 0,0000 22,7468 0,0000
AR(3) Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,574432 0,115983 4,9527 <0,00001 ***
phi_1 0,819322 0,0755966 10,8381 <0,00001 ***
phi_2 -0,0819083 0,0988616 -0,8285 0,40738
phi_3 0,0579267 0,0767865 0,7544 0,45062
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006535 D.P. das inovações 0,326053
Log da verossimilhança -55,07385 Critério de Akaike 120,1477
Critério de Schwarz 136,1951 Critério Hannan-Quinn 126,6525
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2395 0,0000 1,2395 0,0000
Raiz 2 0,0873 -3,7310 3,7320 -0,2463
Raiz 3 0,0873 3,7310 3,7320 0,2463
![Page 4: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/4.jpg)
4
Exemplos de modelos AR(p) usando dados da Sefaz/GO:
ICMS – Taxa de crescimento
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00567966 0,00816623 0,6955 0,48674
phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações 0,000328 D.P. das inovações 0,130597
Log da verossimilhança 80,70000 Critério de Akaike -155,4000
Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950
Real Imaginária Módulo Frequência
AR
Raiz 1 -2,4979 0,0000 2,4979 0,5000
Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00586463 0,00564463 1,0390 0,29882
phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***
phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações 0,000412 D.P. das inovações 0,121990
Log da verossimilhança 89,49711 Critério de Akaike -170,9942
Critério de Schwarz -159,4934 Critério Hannan-Quinn -166,3209
Real Imaginária Módulo Frequência
AR
Raiz 1 -0,7650 -1,4942 1,6786 -0,3253
Raiz 2 -0,7650 1,4942 1,6786 0,3253
![Page 5: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/5.jpg)
5
3. Exemplos de Modelos de Média Móvel – MA(q) MA(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,543279 0,0464909 11,6857 <0,00001 ***
theta_1 0,611094 0,0422925 14,4492 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,001839 D.P. das inovações 0,391161
Log da verossimilhança -88,12918 Critério de Akaike 182,2584
Critério de Schwarz 191,8868 Critério Hannan-Quinn 186,1612
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,6364 0,0000 1,6364 0,5000
MA(2)
Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,546989 0,0585125 9,3482 <0,00001 ***
theta_1 0,881548 0,0774425 11,3833 <0,00001 ***
theta_2 0,387895 0,0583002 6,6534 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,002213 D.P. das inovações 0,350163
Log da verossimilhança -68,05490 Critério de Akaike 144,1098
Critério de Schwarz 156,9477 Critério Hannan-Quinn 149,3136
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,1363 -1,1344 1,6056 -0,3751
Raiz 2 -1,1363 1,1344 1,6056 0,3751
MA(3)
Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,550957 0,0646414 8,5233 <0,00001 ***
theta_1 0,782521 0,0735914 10,6333 <0,00001 ***
theta_2 0,5313 0,0810619 6,5542 <0,00001 ***
theta_3 0,251944 0,0703504 3,5813 0,00034 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,003248 D.P. das inovações 0,342610
Log da verossimilhança -64,02861 Critério de Akaike 138,0572
Critério de Schwarz 154,1046 Critério Hannan-Quinn 144,5620
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,6714 0,0000 1,6714 0,5000
Raiz 2 -0,2187 -1,5254 1,5410 -0,2727
Raiz 3 -0,2187 1,5254 1,5410 0,2727
![Page 6: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/6.jpg)
6
Exemplos de modelos MA(q) usando dados da Sefaz/GO:
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00560753 0,00080953 6,9269 <0,00001 ***
theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,000695 D.P. das inovações 0,109008
Log da verossimilhança 103,4931 Critério de Akaike -200,9861
Critério de Schwarz -192,3605 Critério Hannan-Quinn -197,4812
Real Imaginária Módulo Frequência
MA
Raiz 1 1,0815 0,0000 1,0815 0,0000
Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00570155 0,000691485 8,2454 <0,00001 ***
theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***
theta_2 -0,115467 0,0992711 -1,1632 0,24477
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,002216 D.P. das inovações 0,108390
Log da verossimilhança 104,1715 Critério de Akaike -200,3431
Critério de Schwarz -188,8423 Critério Hannan-Quinn -195,6698
Real Imaginária Módulo Frequência
MA
Raiz 1 1,0562 0,0000 1,0562 0,0000
Raiz 2 -8,1999 0,0000 8,1999 0,5000
![Page 7: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/7.jpg)
7
4. Exemplos de Modelos ARMA (1,1)
Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto
prazo:
Modelo 1: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00569386 0,000702447 8,1057 <0,00001 ***
phi_1 0,102099 0,0982049 1,0397 0,29850
theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,002089 D.P. das inovações 0,108501
Log da verossimilhança 104,0450 Critério de Akaike -200,0900
Critério de Schwarz -188,5892 Critério Hannan-Quinn -195,4167
Real Imaginária Módulo Frequência
AR
Raiz 1 9,7944 0,0000 9,7944 0,0000
MA
Raiz 1 1,0578 0,0000 1,0578 0,0000
Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00140343 0,00101435 1,3836 0,16649
phi_1 0,681096 0,0674072 10,1042 <0,00001 ***
theta_1 -1 0,0236957 -42,2017 <0,00001 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações -0,000652 D.P. das inovações 0,148405
Log da verossimilhança 62,41573 Critério de Akaike -116,8315
Critério de Schwarz -105,3307 Critério Hannan-Quinn -112,1582
Real Imaginária Módulo Frequência
AR
Raiz 1 1,4682 0,0000 1,4682 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
![Page 8: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/8.jpg)
8
5. Estimar modelos ARMA/ARIMA no Gretl
Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique
na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:
Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será
utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo
ARMA tradicional não possui regressores extras.
Selecione a variável e clique no botão lilás
Define a ordem AR(p) - longo prazo
Define a ordem MA(q) - curto prazo
![Page 9: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/9.jpg)
9
6. O método Box-Jenkins de previsão
O objetivo do método é gerar um modelo com as seguintes características:
i. Estabilidade (módulo das raízes fora do círculo unitário)
ii. Resíduos na forma de Ruído Branco
a. Sem memória
b. Normalmente distribuído
c. Homocedástico
O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA
![Page 10: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/10.jpg)
10
7. O correlograma
Para gerar o correlograma de uma série temporal, clique sobre uma variável com
o botão direito do mouse e selecione a opção Correlograma:
O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que
ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando
presença de algum tipo de memória na série.
A interpretação do correlograma segue o esperado para cada tipo de modelo
teórico. Seguindo Bueno (2011), temos:
Fonte: Bueno (2011)
Função de Autocorrelação Simples (FAC)
Função de Autocorrelação Parcial (FACP)
![Page 11: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/11.jpg)
11
Correlograma esperado para um AR(1) FAC – decaimento exponencial
FACP – truncada na primeira defasagem
Correlograma esperado para um AR(2)
FAC – decaimento exponencial
FACP – truncada na segunda defasagem
Correlograma esperado para um MA(2)
FAC – truncada na segunda defasagem
FACP – decaimento exponencial
Correlograma esperado para um ARMA(2,1)
FAC – truncada na primeira e decaimento exponencial a partir da segunda defasagem
FACP – truncada na segunda e decaimento exponencial a partir da terceira defasagem
Contudo, lembre-se que na prática a identificação visual do modelo é
complicada, devendo o pesquisador utilizar o processo de tentativa e erro do
fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o
modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.
![Page 12: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/12.jpg)
12
8. Estabilidade do modelo
Para verificar a estabilidade, basta observar se os módulos das raízes do modelo
são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-
estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se
obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.
Exemplo de modelo não-estável (raízes no círculo unitário).
Exemplo de modelo estável (raízes fora do círculo unitário).
O módulo da raiz MA(1) não está fora do círculo unitário
O módulo de cada raiz está fora do círculo unitário
![Page 13: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/13.jpg)
13
9. Diagnóstico de resíduos
Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou
seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).
Para testar a presença de memória, são usados dois testes: o Correlograma dos
Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do
modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:
Teste da memória dos resíduos (correlograma e Ljung-Box)
Basta clicar em OK para o Gretl gerar
o correlograma dos resíduos e o
teste de Ljung-Box.
Neste resultado, vemos que o
correlograma dos resíduos
apresenta correlações
(memórias) significativamente
diferente de zero (barras
rompendo o intervalo de
confiança)
É um indício de que o modelo
não está bem estimado.
![Page 14: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/14.jpg)
14
Da mesma forma, o Ljung-Box
confirma a presença de memória
nos resíduos, como mostram os
baixo [p-valores] obtidos após a 5ª
defasagem.
Um bom modelo exibe um [p-
valor] alto para todas as
defasagens, evidenciando a não
rejeição da hipótese nula de
correlação igual a zero.
Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo
estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:
Teste de normalidade dos resíduos
Para testar a
normalidade dos
resíduos, na tela do
modelo estimado,
clique no menu Testes
e na opção
Normalidade dos
resíduos.
![Page 15: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/15.jpg)
15
O GRETL exibe um histograma dos
resíduos e o resultado do teste de
Doornik-Hansen na parte superior
esquerda da tela. Um p-valor (entre
colchetes) alto revela a não rejeição da
hipótese nula de normalidade dos
resíduos.
Um p-valor muito baixo mostra a
necessidade de se estimar um novo
modelo.
Teste ARCH para heterocedasticidade
O teste ARCH tem como
objetivo verificar se os resíduos
do modelo apresentam
variância constante
(homocedasticidade).
Menu Testes, opção ARCH.
Um p-valor muito alto revela a
não rejeição da hipótese nula de
homocedasticidade.
Um p-valor muito baixo mostra
que os resíduos são
heterocedásticos e um novo
modelo deve ser estimado
10. Comparação entre modelos
Na prática, mais de um modelo pode ser usado para representar a evolução da
série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”
para compará-los e escolher qual deles será usado para a previsão. Um modelo
![Page 16: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/16.jpg)
16
candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,
em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de
ajustamento. Desta forma, três critérios gerais são comumente empregados:
1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão disponíveis automaticamente sempre que um modelo é estimado.
Deve-se buscar privilegiar o modelo que gerar os menores critérios de informação
2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção
Mostrar efetivo, ajustado, resíduos.
Quanto menores os erros médios, melhor é o nível de ajustamento do modelo e melhor tende a ser a qualidade da previsão
3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de
memória que são não significativos, principalmente os últimos de cada ordem (AR ou MA).
Coeficiente significativo a 10% Coeficiente não significativo (p-valor muito alto)
![Page 17: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/17.jpg)
17
11. Previsão Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL
a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável
k períodos a frente:
A previsão k períodos a
frente pode ser feita por
meio do menu Análise,
opção Previsões....
• Período para realizar a previsão
• Método de previsão (o mais usado
é a previsão automática)
• Opções para exibir o intervalo de
confiança da previsão
![Page 18: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/18.jpg)
18
12. Séries não estacionárias Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que
mantinham constante suas características fundamentais. Contudo, a maior parte das
séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se
altere ao longo do tempo.
De maneira geral, trabalhamos com dois tipos de tendência:
• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no
tempo. Também conhecidas como séries TSP (Trend Stationary Process -
Processo de Tendência Estacionária).
• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se
altera com o passar do tempo. É também denominada de DSP (Difference
Stationary Process – Processo Estacionário por Diferença) ou ainda processo com
Raiz Unitária.
Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar
a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de
uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,
transformando a variável em sua primeira diferença. Em geral, a primeira diferença de
uma série é estacionaria.
Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença
Logarítmo da Arrecadação na Agropecuária (em nível)
Primeira difeença do logaritmo da arrecadação na agropecuária
3
4
5
6
7
8
9
10
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
desem
pre
go
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
d_desem
pre
go
16
16,2
16,4
16,6
16,8
17
17,2
2004 2006 2008 2010 2012 2014
l_agro
pecuaria
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
2004 2006 2008 2010 2012 2014
d_l_
agro
pecuaria
![Page 19: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/19.jpg)
19
Para a situação de tendência determinística (TSP) deve-se primeiro extrair o
componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos
estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,
onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X
seria a tendência temporal determinística. As próximas seções mostram como
operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.
13. Modelo ARIMA (p,d,q) O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária
ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A
primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)
sobre esta nova série estacionária.
Para gerar a primeira diferença de
uma série, selecione a variável e siga
até o menu Acrescentar, e depois na
opção Primeiras diferenças das
variáveis selecionadas.
Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA
(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se
obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos
passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem
de integração da série:
Define a ordem de integração da série
Após entrar pelo menu Modelos, opção Séries
Temporais, ARIMA, selecione as ordem p,d,q
![Page 20: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/20.jpg)
20
Note que, em termos de modelo, é a mesma coisa estimar um modelo
ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a
primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2
respectivamente:
Estimando um ARIMA (1,1,1) para a série de L_energia original Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***
Média var. dependente 0,006812 D.P. var. dependente 0,618222
Média de inovações 0,003483 D.P. das inovações 0,434964
Log da verossimilhança -77,41286 Critério de Akaike 162,8257
Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990
Real Imaginária Módulo Frequência
AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
Estimando um ARMA(1,1) para a primeira diferença da série de L_energia Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***
Média var. dependente 0,006812 D.P. var. dependente 0,618222
Média de inovações 0,003483 D.P. das inovações 0,434964
Log da verossimilhança -77,41286 Critério de Akaike 162,8257
Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990
Real Imaginária Módulo Frequência
AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a
previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.
Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um
modelo ARIMA.
![Page 21: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/21.jpg)
21
Observações importantes:
i. O correlograma para identificação inicial das ordens AR(p) e MA(q)
devem ser feitas em cima da primeira diferença da série.
ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.
14. Séries com tendência determinística Para se estimar um modelo com tenência determinística, devemos primeiro
extrair o componente determinístico por meio de um modelo de Mínimos Quadrados
Ordinários. As etapas são:
1. Rodar um modelo de M.Q.O. com a tendência temporal como variável
dependente.
2. Extrair os resíduos deste modelo estimado.
3. Estimar um modelo ARMA(p,q) sobre os resíduos.
Para acrescentar uma tendência
temporal, clique no menu
Acrescentar e depois na opção
Tendência Temporal.
No menu Modelo, selecione a
opção Mínimos Quadrados
Ordinários. Acrescente a variável
time na lista de Regressores e
estime o modelo.
![Page 22: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/22.jpg)
22
Depois de estimado o modelo, salve os resíduos por meio do menu Salvar, opção Resíduos. Isso irá gerar uma nova variável na base de dados.
Abaixo, seguem os resultados para o tratamento da tendência determinística da
arrecadação do setor de Energia (em logaritmos).
Extração da tendência determinística Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Coeficiente Erro Padrão razão-t p-valor
const 17,7131 0,0773861 228,8933 <0,00001 ***
time 0,0050459 0,00100969 4,9975 <0,00001 ***
Média var. dependente 18,04870 D.P. var. dependente 0,480775
Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026
R-quadrado 0,161153 R-quadrado ajustado 0,154700
F(1, 130) 24,97460 P-valor(F) 1,84e-06
Log da verossimilhança -78,52907 Critério de Akaike 161,0581
Critério de Schwarz 166,8237 Critério Hannan-Quinn 163,4010
rô 0,021395 Durbin-Watson 1,956131
Arrecadação do setor de energia Resíduos do modelo de M.Q.O.
16
16,5
17
17,5
18
18,5
19
19,5
20
2004 2006 2008 2010 2012 2014
l_EN
ER
GIA
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2004 2006 2008 2010 2012 2014
resíd
uo
Resíduos da regressão (= observados - ajustados l_ENERGIA)
![Page 23: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/23.jpg)
23
Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência determinística
Modelo 13: ARMA, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: uhat12
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00370065 0,0635819 0,0582 0,95359
phi_1 0,852921 0,0951371 8,9652 <0,00001 ***
theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***
Média var. dependente -1,16e-15 D.P. var. dependente 0,440335
Média de inovações -0,001374 D.P. das inovações 0,429159
Log da verossimilhança -75,68339 Critério de Akaike 159,3668
Critério de Schwarz 170,8980 Critério Hannan-Quinn 164,0525
Real Imaginária Módulo Frequência
AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
15. Modelo ARMAX para a tendência determinística Alternativamente, a tendência determinística pode ser modelada junto com o
modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o conjunto de variáveis extra.
Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.
Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 17,7187 0,123729 143,2058 <0,00001 ***
phi_1 0,852917 0,0951118 8,9675 <0,00001 ***
theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***
time 0,00501748 0,00159592 3,1439 0,00167 ***
Média var. dependente 18,04870 D.P. var. dependente 0,480775
Média de inovações -0,001349 D.P. das inovações 0,429158
Log da verossimilhança -75,68323 Critério de Akaike 161,3665
Critério de Schwarz 175,7805 Critério Hannan-Quinn 167,2237
Real Imaginária Módulo Frequência
AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
![Page 24: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/24.jpg)
24
Para estimar um modelo ARMAX, basta acrescentar variáveis extra na lista de Regressores. No nosso caso, acrescentamos a variável time, que é a tendência temporal.
16. Teste de Dickey-Fuller Aumentado (ADF)
O teste ADF foi originalmente desenhado para captar a presença de raiz unitária
na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de
tendência determinística (TSP). O teste possui a seguinte hipótese nula:
Ho: Presença de Raiz Unitária
Ha: Sem Raiz Unitária
Pode-se comparar o valor da estatística calculada com a tabela de valores críticos
de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.
Teste para Desemprego em nível Teste para a primeira diferença do desemprego
Teste de Dickey-Fuller para desemprego
dimensão de amostragem 111
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,029
valor estimado de (a - 1): 0,000551086
estatística de teste: tau_nc(1) = 0,0669027
p-valor 0,702
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,014
valor estimado de (a - 1): -0,0750893
estatística de teste: tau_c(1) = -1,9269
p-valor 0,319
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,038
valor estimado de (a - 1): -0,153099
estatística de teste: tau_ct(1) = -3,01459
p-valor 0,133
Teste de Dickey-Fuller para d_desemprego
dimensão de amostragem 110
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): -1,02869
estatística de teste: tau_nc(1) = -10,7045
p-valor 1,639e-068
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): -1,03106
estatística de teste: tau_c(1) = -10,6734
p-valor 3,585e-015
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,006
valor estimado de (a - 1): -1,03417
estatística de teste: tau_ct(1) = -10,6509
p-valor 4,921e-014
![Page 25: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/25.jpg)
25
Contudo, a ausência de raiz unitária não implica necessariamente em uma série estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para identificação correta, deve-se aplicar o teste ADF em sua versão mais completa disponível no Gretl.
Para realizar o teste ADF, siga o esquema abaixo:
Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz
unitária, teste de Dickey-Fuller aumentado.
• Determina a ordem máxima para o teste. O Gretl calcula automaticamente usando a fórmula
� = ��� �12 ∗ � �100��/��
Onde T é o número de observações da base de dados.
• Marcar essa opção para visualizar todo o resultado do teste.
![Page 26: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/26.jpg)
26
O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste ADF e identificar o tipo de tendência da série.
Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação
deste fluxograma:
![Page 27: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/27.jpg)
27
Teste ADF para L_agropecuaria Teste Aumentado de Dickey-Fuller para l_agropecuaria
incluindo 10 defasagens de (1-L)l_agropecuaria
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 121
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,036
diferenças defasadas: F(10, 110) = 5,480 [0,0000]
valor estimado de (a - 1): 0,000232479
estatística de teste: tau_nc(1) = 0,31619
p-valor assintótico 0,777
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
----------------------------------------------------------------
l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770
d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***
d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***
d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *
d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***
d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***
d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***
d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***
d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***
d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *
d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***
AIC: -131,382 BIC: -100,629 HQC: -118,892
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,029
diferenças defasadas: F(10, 109) = 3,331 [0,0008]
valor estimado de (a - 1): -0,127696
estatística de teste: tau_c(1) = -1,25345
p-valor assintótico 0,6533
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 2,13351 1,69898 1,256 0,2119
l_agropecuaria_1 -0,127696 0,101876 -1,253 0,6533
d_l_agropecuar~_1 -0,256666 0,129785 -1,978 0,0505 *
d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 **
d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115
d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 *
d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***
d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 **
d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***
d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***
d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795
d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **
AIC: -131,12 BIC: -97,5709 HQC: -117,495
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,026
diferenças defasadas: F(10, 108) = 3,298 [0,0009]
valor estimado de (a - 1): -0,204218
estatística de teste: tau_ct(1) = -1,69067
p-valor assintótico 0,7557
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 3,37431 1,99834 1,689 0,0942 *
l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557
d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539
d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *
d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472
d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721
d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **
d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **
d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***
d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***
d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985
d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **
time 0,000492543 0,000419508 1,174 0,2429
AIC: -130,655 BIC: -94,3098 HQC: -115,894
Sem evidência de tendência determinística. Mas com p-valor auto para o teste de raiz unitária. Subir para a versão sem tendência.
Constante não significativa e p-valor alto para o teste de raiz unitária. Subir para a versão sem constante.
Evidência de raiz unitária
![Page 28: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/28.jpg)
28
Teste ADF para L_deduções Teste Aumentado de Dickey-Fuller para l_deducoes
incluindo 9 defasagens de (1-L)l_deducoes
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 122
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,018
diferenças defasadas: F(9, 112) = 7,901 [0,0000]
valor estimado de (a - 1): 0,00223531
estatística de teste: tau_nc(1) = 1,92907
p-valor assintótico 0,9876
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:11-2013:12 (T = 122)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
----------------------------------------------------------------
l_deducoes_1 0,00223531 0,00115875 1,929 0,9876
d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***
d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***
d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444
d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215
d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573
d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293
d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048
d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852
d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015
AIC: -28,9695 BIC: -0,929251 HQC: -17,5804
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,012
diferenças defasadas: F(2, 125) = 32,965 [0,0000]
valor estimado de (a - 1): -0,0012576
estatística de teste: tau_c(1) = -0,0565259
p-valor assintótico 0,9522
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:04-2013:12 (T = 129)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
-----------------------------------------------------------------
const 0,0595967 0,416673 0,1430 0,8865
l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522
d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***
d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***
AIC: -42,6647 BIC: -31,2255 HQC: -38,0168
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,017
diferenças defasadas: F(9, 110) = 4,740 [0,0000]
valor estimado de (a - 1): -0,169562
estatística de teste: tau_ct(1) = -2,29238
p-valor assintótico 0,4376
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:11-2013:12 (T = 122)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 2,92584 1,27459 2,296 0,0236 **
l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376
d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***
d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***
d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853
d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570
d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694
d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004
d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677
d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694
d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *
time 0,00409814 0,00164218 2,496 0,0141 **
AIC: -31,6994 BIC: 1,94888 HQC: -18,0325
Evidência de misto TSP/DSP
![Page 29: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/29.jpg)
29
Teste ADF para L_Folha Teste Aumentado de Dickey-Fuller para l_Folha
incluindo 7 defasagens de (1-L)l_Folha
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 124
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,013
diferenças defasadas: F(7, 116) = 11,119 [0,0000]
valor estimado de (a - 1): 0,00132659
estatística de teste: tau_nc(1) = 0,636633
p-valor assintótico 0,8538
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:09-2013:12 (T = 124)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
-------------------------------------------------------------
l_Folha_1 0,00132659 0,00208376 0,6366 0,8538
d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***
d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***
d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***
d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***
d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***
d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***
d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *
AIC: 168,31 BIC: 190,873 HQC: 177,476
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,004
diferenças defasadas: F(2, 125) = 3,846 [0,0239]
valor estimado de (a - 1): -0,490125
estatística de teste: tau_c(1) = -4,22483
p-valor assintótico 0,0005936
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:04-2013:12 (T = 129)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
------------------------------------------------------------
const 9,82062 2,32168 4,230 4,48e-05 ***
l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***
d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***
d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021
AIC: 167,034 BIC: 178,473 HQC: 171,682
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,002
diferenças defasadas: F(11, 106) = 0,668 [0,7658]
valor estimado de (a - 1): -1,582
estatística de teste: tau_ct(1) = -4,44467
p-valor assintótico 0,001802
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2004:01-2013:12 (T = 120)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
-------------------------------------------------------------
const 30,9189 6,95904 4,443 2,19e-05 ***
l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***
d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *
d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *
d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **
d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *
d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *
d_l_Folha_6 0,353092 0,228215 1,547 0,1248
d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *
d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *
d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *
d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *
d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *
time 0,0105217 0,00253157 4,156 6,58e-05 ***
AIC: 154,267 BIC: 193,291 HQC: 170,115
Sem evidência de raiz unitária e com tendência determinística significativa. Evidência de série TSP
![Page 30: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/30.jpg)
30
17. Sazonalidade As séries econômicas, principalmente as brasileiras, podem estar sujeitos à
sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um componente de memória e pode ser modelada juntamente com uma estimativa ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a sazonalidade da série e trabalhar com um processo livre deste componente.
Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade
• Suavização por média móvel
• Suavização exponencial
• X-12-ARIMA
• ARMA degenerado
• SARMA(p,q)(P,Q)
• ARMAX com dummies periódicas
17. Suavização por média móvel
Salvar a série suavizada
Define a quantidade de meses usada na média móvel
![Page 31: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/31.jpg)
31
18. Suavização exponencial
19. X-12-ARIMA Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário
instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:
1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na parte esquerda.
Determina o valor de α. Quanto maior este valor, maior o peso no presente.
Yt*=αYt-1 + (1-α)Y*t-1
![Page 32: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/32.jpg)
32
2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe 3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será
iniciado.
4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl
não esteja aberto neste momento.
5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl
sempre que o usuário abrir uma base de dados como série temporal mensal ou
trimestral.
6. O pacote X-12-ARIMA pode ser acessado no menu Variável ���� Análise X-12-ARIMA OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!
![Page 33: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/33.jpg)
33
7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM dessazonalizado.
20. ARMA degenerado
• Define as ordens específicas de defasagens
![Page 34: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/34.jpg)
34
Exemplo de um modelo ARIMA[(1,12), 1, 1] Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const -0,000919328 0,0154457 -0,0595 0,95254
phi_1 -0,179238 0,084197 -2,1288 0,03327 **
phi_12 0,36066 0,0891847 4,0440 0,00005 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações 0,000271 D.P. das inovações 0,150173
Log da verossimilhança 61,60090 Critério de Akaike -115,2018
Critério de Schwarz -103,7010 Critério Hannan-Quinn -110,5285
Real Imaginária Módulo Frequência
AR
Raiz 1 -1,0696 0,0000 1,0696 0,5000
Raiz 2 1,1052 0,0000 1,1052 0,0000
Raiz 3 -0,0176 -1,0900 1,0901 -0,2526
Raiz 4 -0,0176 1,0900 1,0901 0,2526
Raiz 5 0,9516 -0,5585 1,1034 -0,0845
Raiz 6 0,9516 0,5585 1,1034 0,0845
Raiz 7 -0,5546 -0,9276 1,0808 -0,3358
Raiz 8 -0,5546 0,9276 1,0808 0,3358
Raiz 9 -0,9341 -0,5276 1,0728 -0,4182
Raiz 10 -0,9341 0,5276 1,0728 0,4182
Raiz 11 0,5367 -0,9581 1,0982 -0,1687
Raiz 12 0,5367 0,9581 1,0982 0,1687
21. SARMA(p,q)(P,Q)
• Define as ordens sazonais
![Page 35: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/35.jpg)
35
Exemplo de um modelo SARIMA(1,1,1)(1,0) Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00126219 0,00109948 1,1480 0,25097
phi_1 0,605108 0,0757161 7,9918 <0,00001 ***
Phi_1 0,409892 0,090208 4,5439 <0,00001 ***
theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações -0,000195 D.P. das inovações 0,137608
Log da verossimilhança 71,55078 Critério de Akaike -133,1016
Critério de Schwarz -118,7256 Critério Hannan-Quinn -127,2600
Real Imaginária Módulo Frequência
AR
Raiz 1 1,6526 0,0000 1,6526 0,0000
AR
(sazonal)
Raiz 1 2,4397 0,0000 2,4397 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
22. ARMAX com dummies periódicas
Para acrescentar as binárias de períodos, clique no menu Acrescentar e na opção Dummies periódicas
Com isso, são criadas binárias para cada período. No exemplo, foram criadas 12 dummies, uma para cada mês do ano.
![Page 36: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO](https://reader034.vdocuments.net/reader034/viewer/2022052609/5b7d527a7f8b9ada6d8c28d0/html5/thumbnails/36.jpg)
36
Para estimar o modelo, basta acrescentar as binárias na lista de Regressores. Lembre-se de sempre acrescentar um número a menos que a quantidade total de binárias. No exemplo, são 12 meses. Logo, devem ser incluídas no máximo 11 binárias no modelo.
Exemplo de um modelo ARMAX com dummies periódicas
Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,000610663 0,00324124 0,1884 0,85056
phi_1 0,345129 0,156311 2,2080 0,02725 **
theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***
dm2 0,0285772 0,0379625 0,7528 0,45159
dm3 0,0176125 0,0445928 0,3950 0,69287
dm4 0,148899 0,0470598 3,1640 0,00156 ***
dm5 0,276885 0,0481692 5,7482 <0,00001 ***
dm6 0,178553 0,0486953 3,6667 0,00025 ***
dm7 0,25779 0,0488848 5,2734 <0,00001 ***
dm8 0,299158 0,0488054 6,1296 <0,00001 ***
dm9 0,265164 0,0484063 5,4779 <0,00001 ***
dm10 0,187742 0,0474609 3,9557 0,00008 ***
dm11 0,0240094 0,0452392 0,5307 0,59561
dm12 -0,123349 0,0391174 -3,1533 0,00161 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações 0,001485 D.P. das inovações 0,114141
Log da verossimilhança 98,19136 Critério de Akaike -166,3827
Critério de Schwarz -123,2548 Critério Hannan-Quinn -148,8579
Real Imaginária Módulo Frequência
AR
Raiz 1 2,8975 0,0000 2,8975 0,0000
MA
Raiz 1 1,2603 0,0000 1,2603 0,0000