diagnosis de modelos de regresión serialmente...
TRANSCRIPT
Universidadede Vigo
El fallo de la suposición de dependencia: El efecto
del tiempo
Modelos autocorrelados: Un caso
particular de los modelos de regresión
lineal generalizado
Universidadede Vigo
Universidadede Vigo
Introducción al modelo de regresión
generalizado
En muchos problemas económicos se producen efectossobre las perturbaciones, de tal forma que éstas tienendispersiones distintas, como ocurre en las seriesfinancieras, y en algunos casos se producen interaccionesentre ellas, como es el caso de las series temporales coninformación del pasado.
Esto afecta al comportamiento de la regresión, pues actúasobre dos de las suposiciones básicas del modelo linealgeneral:
la homocedasticidad: Cuando las varianzas de las perturbacionesson distintas para cada observación.
la independencia: Cuando existe relación entre dos cualesquieraobservaciones diferentes.
Universidadede Vigo
Universidadede Vigo
Introducción al modelo de regresión
generalizado (2)
Las dos suposiciones anteriores obligan a que las
perturbaciones se comporten todas del mismo modo y por
consiguiente tienen una matriz de varianzas-covarianzas
con un único parámetro desconocido, es una matiz escalar.
Cuando las perturbaciones del modelo de regresión tienen
matriz de varianzas-covarianzas no escalar, se dice que
estamos en un modelo de regresión lineal generalizado
(MRLG).
A ese tipo de perturbaciones se les denomina no esféricas.
Estudiamos primero el caso general y luego cada uno de los
específicos.
Universidadede Vigo
Perturbaciones esféricas y no
esféricas
Para comprender mejor las diferencias supongamos que tenemos
sólo dos observaciones
2
1
Esféricas
2
1
No esféricas
La forma tiene una inclinación que corresponde a la
correlación entre las perturbaciones. La elipse tiene ejes
diferentes que corresponden a la heterocedasticidad.
Por consiguiente presentan forma no esférica
Bajo normalidad, se verifica que la incorrelación es
independencia, manifestándose en los ejes ortogonales. La
homocedasticidad implica que ambos ejes son iguales en
dimensión. Por consiguiente presentan forma esférica
Universidadede Vigo
Universidadede Vigo
Modelo de regresión lineal
generalizado
1
Y=X +
donde sigue una ley N(0, ).
Suposiciones del MRLC con
perturbaciones no esféricas
Universidadede Vigo
Universidadede Vigo
Matriz de varianzas covarianzas de
las perturbaciones
La matriz de varianzas-covarianzas se descompone en
dos elementos
, que nos mide la parte de las varianzas común a todas las
observaciones,
que será una matriz simétrica, cuyos elementos nos indican las
relaciones entre las observaciones o la ratio de varianzas respecto
a su parte común.
De esta forma facilitamos la comparación con el MRLC,
que será un caso particular de éste cuando =I.
Universidadede Vigo
Universidadede Vigo
Generaliza el MRLC
Permite Heterocedasticidad.
Por ejemplo medidas de la producción de diferentes empresas donde la
fiabilidad de la estimación de esa producción dependa del tamaño de la
empresa.
Permite dependencia de las perturbaciones y por lo tanto de las
observaciones.
Un caso se produce cuando se estiman las ventas de una empresa y el
error de esa estimación depende de las ventas del periodo anterior.
El MRLC es un caso particular cuando =I.
Universidadede Vigo
Universidadede Vigo
Efecto sobre los estimadores MCO
Sigue siendo lineal e insesgado.
La varianza aumenta por lo que pierde eficiencia el
estimador.
La varianza estimada de los estimadores de los
coeficientes, bajo las suposiciones del MRLC estará mal
estimada.
Los test de la regresión MCO serán inválidos, sino se
cambia el estimador de la varianza.
El estimador MCO de la parte de la varianza que es
común a todas las observaciones s2 es sesgado.
Universidadede Vigo
Universidadede Vigo
Comprobación de esos efectos
Para comprobar esos efectos primero se verán las
propiedades que no cambian, que son las referentes al valor
esperado de la dependiente.
Después las que cambian, que son las que están relacionadas
con las varianzas de los estimadores.
Universidadede Vigo
Universidadede Vigo
Es lineal e insesgado
La linealidad se deriva de la construcción pues la forma de
construir el estimador no varía.
Para ver la insesgadez se utiliza la forma que relaciona b y .
b= +(X’X)-1X’
E(b)=E( +(X’X)-1X’ +E((X’X)-1X’
+(X’X)-1X’E( +0=
Universidadede Vigo
Universidadede Vigo
El estimador deja de ser eficiente
Partimos de la misma definición del estimador MCO pero ahora debemos considerar que las perturbaciones no son escalares
b= +(X’X)-1X’
Var(b)=E((X’X)-1X’ (X’X)-1X’E( X(X’X)-1
(X’X)-1X’ 2 X(X’X)-1
2 (X’X)-1X’ X(X’X)-1 2 (X’X)-1
Consecuentemente la varianza no coincide con la que se había estimado bajo el MRLC, de hecho se deduce de las propiedades de las formas cuadráticas que ya no es la menor, y no se puede asegurar la eficiencia.
Consecuencia de lo anterior la varianza estimada en el MRLC estará mal estimada, pues no es la verdadera al cambiar las suposiciones de partida.
Universidadede Vigo
Universidadede Vigo
Los test de la regresión MCO serán
inválidos
Por consiguiente para que los test de los coeficientes de
regresión estimados bajo MCO sean válidos es necesario que
cambiemos las varianzas estimadas.
Los que salen por defecto en la ejecución de los programas
serán inválidos
En SHAZAM debemos hacer uso de una opción del OLS que
depende si suponemos heterocedasticidad (HETCOV) o
autocorrelación (AUTCOV). No obstante la salido es similar.
Universidadede Vigo
Comparación entre ambas salidas
|_ols y x x2/resid=e Predict=ye noanova
REQUIRED MEMORY IS PAR= 1 CURRENT PAR= 11000
OLS ESTIMATION
7 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 7
R-SQUARE = 0.9221 R-SQUARE ADJUSTED = 0.8832
VARIANCE OF THE ESTIMATE-SIGMA**2 = 35.597
STANDARD ERROR OF THE ESTIMATE-SIGMA = 5.9664
SUM OF SQUARED ERRORS-SSE= 142.39
MEAN OF DEPENDENT VARIABLE = 41.143
LOG OF THE LIKELIHOOD FUNCTION = -20.4769
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL
NAME COEFFICIENT ERROR 4 DF P-VALUE CORR.
X 7.1057 1.033 6.876 0.002 0.960
X2 1.0678 0.9414 1.134 0.320 0.493
CONSTANT -4.7473 8.089 -0.5869 0.589-0.282
|_ols y x x2/resid=e Predict=ye hetcov noanova
REQUIRED MEMORY IS PAR= 1 CURRENT PAR= 11000
OLS ESTIMATION
7 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 7
USING HETEROSKEDASTICITY-CONSISTENT COVARIANCE MATRIX
R-SQUARE = 0.9221 R-SQUARE ADJUSTED = 0.8832
VARIANCE OF THE ESTIMATE-SIGMA**2 = 35.597
STANDARD ERROR OF THE ESTIMATE-SIGMA = 5.9664
SUM OF SQUARED ERRORS-SSE= 142.39
MEAN OF DEPENDENT VARIABLE = 41.143
LOG OF THE LIKELIHOOD FUNCTION = -20.4769
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL
NAME COEFFICIENT ERROR 4 DF P-VALUE CORR.
X 7.1057 0.8917 7.969 0.001 0.970
X2 1.0678 0.4916 2.172 0.096 0.736
CONSTANT -4.7473 4.226 -1.123 0.324-0.490
Test asintótico
válidoTest inválido
Universidadede Vigo
Universidadede Vigo
El estimador MCO de 2 es sesgado
El estimador de la parte común de la varianza 2, era insesgado en el caso el
MRLC. Ahora va a ser sesgado por ser diferente la varianza de las
perturbaciones.
Para verlo consideramos la varianza de los residuos MCO que vendrá dada por
Var(e)=var(M var ’ ’= ’
Luego, partiendo de la definición de la varianza residual
La esperanza de ese estimador sería
De donde se sigue que no tiene
porque verificarse la insesgadez del estimador.
Se e
T k2
1
E SE trz e e
T k
E trz ee
T k
trzE ee
T k
trz e
T k
trz M M
T k
trz MM
T k
trz M
T k
( )( ( )) ( ( ' ))
( ' ) var( )
2
2
2 2 2
1 1
1 1 1
1 1
Universidadede Vigo
Universidadede Vigo
Casos particulares del MRLG
Fundamentalmente se estudian dos casos particulares:
La autocorrelación
La heterocedasticidad.
En este capítulo estudiaremos la primera.
Para comprenderla es necesario analizar el concepto de
independencia al que está asociado.
La independencia indica que ninguna observación nos da información
pertinente sobre las demás salvo en cuanto a la relación entre las
variables analizadas. Por tanto la variable dependiente condicionada a
la información que las independientes dan sobre ella, en una
determinada observación no aporta información adicional sobre la
misma variable condicionada en otra observación.
Universidadede Vigo
Modelos dependientes
La dependencia en modelos de regresión lineal
Modelos autocorrelados: El efecto del pasado de forma lineal
Universidadede Vigo
Universidadede Vigo
La independencia
El hecho de suponer que las observaciones son independientes nos permite analizar las perturbaciones como si fueran un conjunto de variables igualmente distribuidas y, por lo tanto, nos permite suponer que cada observación agota la información que esa observación puede dar sobre la variable dependiente.
Este hecho nos permite suponer que todas las perturbaciones provienen de la misma población y, por consiguiente analizar lsoresiduos como si todos ellos fueran observaciones de una misma variable
En caso contrario existe dependencia. Eso implicaría que la matriz de varianzas covarianzas ya no va ser escalar, es decir, la identidad por un escalar, sino que los elementos de fuera de la diagonal pueden ser distintos de 0.
Universidadede Vigo
Modelo lineal con dependencia
El modelo es similar
Pero la matriz de covarianzas varía:
12
Y=X + siendo una
12 1
12 22
1
1 ...
1 ...
... ... ... ...
... ... 1
T
T
T
Mantiene la diagonal
principal constante, es
decir, las varianzas son
las mismas para todas las
perturbaciones
Representa la varianza de
todas las perturbaciones
Representa la matriz de correlaciones entre cada
par de perturbaciones
Universidadede Vigo
Universidadede Vigo
Ejemplos de dependencia
Se quiere estudiar la rentabilidad en función del numero de
clientes en una red de sucursales de banca, cuyos sistemas de
organización están relacionados y es posible que las
perturbaciones entre oficinas estén relacionadas. (correlación)
Estudio de las ventas de una compañía en diferentes zonas que
posiblemente esté afectado por al distancia a los centros de
venta (correlación espacial)
Evolución de las ventas de una empresa en función de su
publicidad y sus ventas pasadas. (correlación temporal)
Universidadede Vigo
Universidadede Vigo
Modelos autocorrelados
Aunque la dependencia se puede dar por múltiples causas, lo mas habitual es que tenga que ver con el tiempo, pues existe en las variables económicas un efecto temporal consecuencia de “recordar” efectos del pasado.
Por ese motivo, vamos a estudiar un caso particular, los modelos autocorrelados, que significan que existe influencia del pasado, y esta influencia se recoge mediante un efecto lineal, es decir es siempre constante independientemente del periodo, pero depende del retardo.
Si el efecto del pasado desaparece a partir de un determinado retardo se dice que la serie tiene memoria finita. En el caso siguiente tiene memoria de orden m si alcanza hasta el retardo m.
Universidadede Vigo
Universidadede Vigo
Modelo lineal con autocorrelación
Existe dependencia del pasado en las perturbaciones, por
consiguiente, estas no son independientes.
La forma general será
1 1
2
..
(0, )
t t t
t t m t m t
Y X
sigue N I
Universidadede Vigo
Universidadede VigoModelos autocorrelados de orden 1
Vamos a estudiar fundamentalmente un caso particular, los modelos autocorrelados de orden 1, que significan que solo existe influencia del pasado mas reciente, es decir la información del pasado esta toda contenida en el periodo anterior.
Esto, como veremos posteriormente, indica que existe influencia en cualquier pasado, si bien de una forma determinada.
Sin embargo comentaremos el efecto sobre los otros modelos autocorrelados, pues es muy similar en sus efectos y en su forma de detectarlo.
Universidadede Vigo
Universidadede Vigo
Modelo lineal con autocorrelación de
orden 1
Existe dependencia del pasado en las perturbaciones, por consiguiente, estas no son independientes.
Para determinar bien un modelo debemos llegar a especificar las perturbaciones como ruido blanco, puesto que en ese instante no dan información adicional sobre el modelo. Por consiguiente, la forma general será
1 1
2(0, )
t t t
t t t
Y X
sigue N I
Universidadede Vigo
Universidadede Vigo
Forma matricial del modelo lineal con
autocorrelación
Escribiendo en forma matricial lo anterior tendríamos que
Y=X + siendo una
1......
............
...1
...1
1
2
1
2
n
n
n
Por consiguiente estaríamos en un caso particular del modelo de
regresión lineal generalizado. Sus efectos serán consecuencia de ello.
Universidadede Vigo
Universidadede Vigo
Efectos de la autocorrelación
Falla la independencia de las observaciones
Los estimadores OLS son centrados pero ineficientes.
Las varianzas obtenidas por OLS, bajo las suposiciones del MRLC, son falsas por tanto los test obtenidos a partir de ellas serán sesgados.
Las predicciones son ineficientes.
Universidadede Vigo
Universidadede VigoIdentificación de la autocorrelación
Gráficos
Algunos coinciden con los ya definidos y sólo cambia su interpretación.
Otros son específicos de este análisis
Tests de hipótesis
Son específicos de la hipótesis alternativa de autocorrelación
Pueden ser de orden 1 o de orden mayor que 1.
Universidadede Vigo
Gráficos para detectar la
autocorrelación
1. Residuos respecto al tiempoRepresentamos los residuos respecto al tiempo
2. Residuos respecto a valores retardados.Representamos los residuos respecto a los residuos retardados
uno o mas periodos.
Universidadede Vigo
Universidadede VigoGráficos de residuos respecto al tiempo
Representamos los residuos respecto al tiempo.
Si son ruido blanco siempre se espera las tres características enunciadas en el tema 1: media nula constante, varianza constante e independencia.
Cuando existe autocorrelaciónpositiva los residuos cortan pocas veces el eje.
Cuando es negativa lo cortan muchas.
En caso de no correlación deberían comportarse como un ruido blanco.
e t
tiempo
**
** **
**
*
*
***
*
**
***
*
**
** ****
Autocorrelación positiva
e t
tiempo
*
*
*
*
*
*
*
Autocorrelación negativa
Universidadede Vigo
Gráficos de la evolución temporal de las
variables
Universidadede Vigo
Grafico respecto a valores predichos
No se ve clara
ninguna estructura,
aunque tampoco
parecen un ruido
blanco
Universidadede VigoGráfico de residuos respecto al tiempo
Hay pocos cortes ,
pero no se ve claro
del todo
Universidadede Vigo
Universidadede Vigo
Gráficos de residuos respecto a
valores retardados
Representamos los residuos respecto a sus valores retardados.
Depende del orden que se quiera estudiar para hacer uso de él en la representación.
Lo normal será estudiar autocorrelación de primer orden por lo que haremos uso de los residuos retardados una vez.
Para órdenes superiores al primero se haría de la misma forma haciendo uso de residuos de orden superiores
Universidadede Vigo
Universidadede Vigo
Gráficos de residuos respecto a
valores retardados
Al estudiar autocorrelación de primer orden debería tener una forma similar a la lineal.
Si la autocorrelación es positiva dicha forma será creciente
Si la autocorrelación es negativa dicha forma será decreciente.
En caso de no correlación deberían comportarse como un ruido blanco.
e t
e t
e t-1
e t-1
Creciente
Decreciente
Universidadede Vigo
Grafico respecto a residuos retardados
Cierta relación
lineal positiva
Universidadede Vigo
Universidadede Vigo
Gráficos de residuos respecto a residuos retardados
en orden superior al primero
Si la autocorrelación se sospecha que sólo se da en un orden superior al primero
Por ejemplo en datos trimestrales cada año, y por tanto con retardo 4
Entonces se representa los residuos actuales respecto a los residuos retardados s veces
En el caso anterior s=4
La interpretación es similar al caso de s=1
e t
e t
e t-1
e t-1
Creciente
Decreciente
Universidadede Vigo
Test de hipótesis para comprobar
la autocorrelación
Test de autocorrelación individuales y conjuntos. De primer orden o
de orden superior
Universidadede Vigo
Universidadede Vigo
Tests de hipótesis para la identificación
de la autocorrelación
Para identificar la autocorrelación en un modelo, se parte de suponer que ésta no existe.
Se realiza la estimación como si no la hubiese
Se analizan los residuos para ver si el comportamiento que presentan es el esperado bajo no correlación, o aparecen situaciones inesperadas que, en algunos casos serán síntomas de autocorrelación.
Universidadede Vigo
Universidadede VigoTest de autocorrelación (1)
Los test para comprobar la existencia de autocorrelación, van a ser muy similares en su construcción a los test enunciados para la otras suposiciones, si bien algunos tienen especiales características.
La hipótesis nula, en todos ellos va a ser la de no existencia de autocorrelación.
La alternativa cambia según se sospeche autocorrelación de primer orden o de orden superior.
Estudiaremos en primer lugar la autocorrelación de orden uno.
Universidadede Vigo
Universidadede Vigo
Test de autocorrelación
Los test de autocorrelación de orden 1 se consideran todos ellos Individuales, pues únicamente se contrasta un parámetro
Pueden ser
Paramétricos
Test de Durbin-Watson
Test de la Razón de Von-Neuman
Test LM de autocorrelación
Test de Wald
No paramétricos Test de Wald-Wolfowitz o de las rachas
No generalizables a
orden superior*
Generalizables a
orden superior
* En realidad se pueden generalizar pero sus leyes de distribución necesitan tablas alternativas de difícil cálculo
Universidadede Vigo
Universidadede Vigo
Modelo de test de autocorrelación de
orden 1
En todos los test paramétricos de autocorrelación de orden 1, el modelo es el mismo, pues se considera el modelo mas general y se comprueba si la restricción de que el coeficiente de autocorrelacion se a nulo se verifica.
El modelo general con las suposiciones del MRLG será
La hipótesis nula será normalmente que 1=0, por lo que el modelo quedará convertido en un MRLC, puesto que y coinciden.
1 1
2(0, )
t t t
t t t
Y X
sigue N I
Universidadede Vigo
Universidadede Vigo
Residuos OLS en modelos
autocorrelados
Para desarrollar los diferentes test de hipótesis de autocorrelación de orden 1 es conveniente analizar el comportamiento de los residuos OLS bajo autocorrelación.
et=ret-1+ut
La esperanza del residuo de orden t condicionada al de orden t-1 depende del signo de r
E(et/et-1)=ret-1
Si r es negativo el residuo se espera con el signo diferente del anterior, mientras que si es positivo el signo es igual.
Por lo tanto
|E(et/et-1)-et-1|=|r-1|
Si r es negativo la diferencia tiende a ser mayor que 1, mientras que si es positivo tiende a ser cercano a cero. Por tanto las distancias entre dos residuos consecutivos se incrementará cuando ambos tienen diferente signo
Universidadede Vigo
Universidadede Vigo
Test de Durbin-Watson
Contrasta la autocorrelación de orden 1 bajo el modelo
de regresión lineal con autocorrelación.
Las hipótesis a contrastar serán las siguientes:
H0: =0, lo que significa incorrelación
H1: , lo que significa que existe autocorrelación lineal de
orden 1
Universidadede Vigo
Universidadede Vigo
Idea del Test de Durbin-Watson
La idea de este test es comprobar si las
diferencias entre los residuos observados
consecutivamente es muy grande o muy
pequeña.
Si es muy grande es síntoma de que
cambia de signo, y entonces la
autocorrelación es negativa.
Si es muy pequeña es que están muy
seguidos y normalmente no cambiará de
signo por lo que la relación entre ellos es
positiva
e t
tiempo
**
** **
**
*
*
***
*
**
***
*
**
** ****
Autocorrelación positiva
e t
tiempo
*
*
*
*
*
*
*
Autocorrelación negativa
Diferencias muy
pequeñas
Diferencias muy
grandes
Universidadede Vigo
Universidadede Vigo
Test de Durbin-Watson (2)
• Bajo las suposiciones del MRLC, que es bajo la hipótesis nula,
se construye el estadístico
T
t
t
T
t
tt
e
ee
DW
1
2
2
2
1)(
• Se puede observar como dicho estadístico se obtiene como
diferencia entre dos residuos consecutivos al cuadrado,
normalizado por la suma de todos ellos al cuadrado.
Universidadede Vigo
Universidadede Vigo
Test de Durbin-Watson (3)
Intuitivamente, ese estadístico nos dice que si un residuo está muy cercano al anterior entonces la correlación es positiva, ya que la diferencia será cercana a 0.
Si está muy alejado, significa que irá pegando saltos de un lado al otro del 0 y por tanto la correlación en negativa.
Cuando es un número intermedio el estimador sería aproximadamente el promedio entre 0 y el límite superior del estadístico.
Universidadede Vigo
Universidadede Vigo
Test de Durbin-Watson (4)
A la vista del estadístico anterior, se demuestra que es aproximadamente igual a
DW 2(1-r)
Siendo r un estimador de
Cuando DW es pequeño será cercano a 0, pues r es aproximadamente 1.
Cuando DW es grande será cercano a 4 pues r es aproximadamente –1.
Cuando es un número intermedio el estimador sería aproximadamente 2, que es el promedio entre 0 y 4.
Universidadede Vigo
Universidadede Vigo
Regla de decisión en el test de Durbin-
Watson
El estadístico DW sigue una ley tabulada por D-W.
Dicha ley tiene una particularidad que hay una zona donde el test no permite decidir
Las decisiones pueden ser de indecisión, según el siguiente gráfico
Zonas de indecisión
Autocorrelación positiva
Autocorrelación negativa
No Autocorrelación
0 d 42L Ud
d LUd4- 4-
Universidadede Vigo
Valores
críticos del
contraste
de Durbin-
Watson
Universidadede Vigo
Universidadede Vigo
Test DW para las telas
|_g elag=lag(e)
..NOTE.LAG VALUE IN UNDEFINED OBSERVATIONS SET TO ZERO
|_g de2=(e-elag)**2
|_g e2=e*e
|_stat e2/sum=se2 beg=1 end=40
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
E2 40 0.73068E-01 0.78376E-01 0.61427E-02 0.70056E-05 0.26232
|_stat de2/sum=sde2 beg=2 end=40
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
DE2 39 0.49600E-01 0.66347E-01 0.44020E-02 0.56465E-04 0.30769
|_gen1 dw=sde2/se2
|_p dw
DW
0.6618468Media de las diferencias muy
pequeña lo que indica que las
diferencias tienden a ser
pequeñas
http://shazam.econ.ubc.ca/runshazam
Universidadede Vigo
Universidadede Vigo
Calculo con SHAZAM del estadístico
de Durbin-Watson
GEN1 T=$N
GEN1 SCE=$SSE
GENR ER1=LAG(E)
GENR DEER12=(E-ER1)**2
?STAT DEER12 / SUMS=SDEER12 BEG=2 END=T
GEN1 DWC1=SDEER12/SCE
PRINT SDEER12 SCE DWC1 sample 1 40read Y X1 X2
13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721 11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044
12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774 13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449
16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957 15.11844 9.201688 8.291451
13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272 12.70277 3.510909 10.50123 16.68311 11.33816 10.72216
13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825 15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346
12.34175 2.077172 8.083948 16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanova
GEN1 T=$NGEN1 SCE=$SSEGENR ER1=LAG(E)GENR DEER12=(E-ER1)**2?STAT DEER12 / SUMS=SDEER12 BEG=2 END=TGEN1 DWC1=SDEER12/SCEPRINT SDEER12 SCE DWC1
http://shazam.econ.ubc.ca/runshazam/
Universidadede Vigo
Regla de decisión en el test de Durbin-
Watson anterior
Zonas de indecisión
Autocorrelación positiva
Autocorrelación negativa
No Autocorrelación
0 421,39 1,60 2,40 2,61
DW=0,66
Universidadede Vigo
Universidadede Vigo
Test de la Razón de Von-Neuman
Similar al anterior pero intenta corregir el efecto del número de observaciones en los dos términos del cociente.
Su idea intuitiva es similar a la de DurbinWatson
Por consiguiente las hipótesis a contrastar son:
H0: =0, lo que significa incorrelación
H1: lo que significa que existe autocorrelación lineal de orden 1
Universidadede Vigo
Universidadede Vigo
Estadístico de la Razón de Von-Neuman
La ratio de Von Neumann corrige el tamaño muestral, para lo cual secalcula dividiendo cada término por el número de observaciones queintervienen en él.
El estadístico que se obtiene es
T
t
t
T
t
tt
eeT
eeT
RVN
1
2
2
2
1
)(1
)(1
1
Universidadede Vigo
Universidadede Vigo
Distribución de la Razón de Von-Neuman
La ley de distribución en muestras pequeñas está tabulada, además se
puede determinar su distribución asintótica, bajo independencia de
las perturbaciones, que viene dada por una ley normal.
)1
)2(4,2(
2T
TANesRVN
A esto se añade la ventaja de que esta ley no depende del
comportamiento estocástico de los regresores, como ocurría en
DW.
Tampoco necesita la normalidad estricta de las perturbaciones.
Universidadede Vigo
Universidadede Vigo
Test de la Razón de Von-Neuman
La interpretación del estadístico es muy similar a la de DW, pero ahora
se puede determinar su distribución asintótica, bajo independencia de
las perturbaciones, que viene dada por una ley normal. Tomando
entonces el t-estadístico lo compararíamos con las tablas de la normal
tipificada
1
)2(4
2
2T
T
RVNtRVN
La regla de decisión será rechazar si |tRVN|>
gen1 rvn=(T/(T-1))*dw
p rvn
gen1 tvn=(rvn-2)/sqrt(4*(T-2)/(T**2-1))
distrib tvn/
http://shazam.econ.ubc.ca/runshazam/
sample 1 40
read Y X1 X2 13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721
11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044 12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774
13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449
16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957
15.11844 9.201688 8.291451 13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272
12.70277 3.510909 10.50123 16.68311 11.33816 10.72216 13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825
15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346 12.34175 2.077172 8.083948
16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanova
GEN1 T=$NGEN1 SCE=$SSEGENR ER1=LAG(E)GENR DEER12=(E-ER1)**2?STAT DEER12 / SUMS=SDEER12 BEG=2 END=TGEN1 DWC1=SDEER12/SCE
gen1 rvn=(T/(T-1))*dwc1p rvngen1 tvn=(rvn-2)/sqrt(4*(T-2)/(T**2-1))distrib tvn/
Universidadede Vigo
Universidadede Vigo
Test RVN para las telas
|_gen1 rvn=(N/(n-1))*dw
RVN
0.6788172
|_gen1 tvn=(rvn-2)/sqrt(4*(n-2)/(n**2-1))
|_distrib tvn/
NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE=
1.0000
DATA Z PDF CDF 1-CDF
TVN -4.2851 0.00041 0.00009 0.99999
Muy significativo.
Se rechaza H0
Universidadede Vigo
Universidadede Vigo
Test de Wald-Wolfowitz o de las
rachas
El test contrasta la existencia o no de autocorrelación de modo no paramétrico, es decir sin necesidad de conocer exactamente los parámetros que caracterizan el modelo. Analiza si entre los residuos existe independencia o asociación de orden 1, es decir, relación entre una observación y la anterior o la siguiente. Por consiguiente las hipótesis van a ser:
H0: Existe independencia entre los residuos
H1: Existe relación de orden 1 entre los residuos
Para calcularlo es necesario hacer uso de las rachas.
Universidadede Vigo
Calculo de las rachas
Se define una racha como una sucesión de símbolos iguales, entre dos distintos.
Se calculan respecto a la mediana. Para ello:
1. Se consideran como 1 losvalores mayores que lamediana, y 0 los menores.Se eliminan los iguales
2. Se cuenta el número derachas.
et
M e d ia n a
*
**
*
*
* *
*
*
*
**
**
*
***
*
*
**
**
*
**
R a c h a 1
R a c h a 2
R a c h a 1 3
Universidadede Vigo
Universidadede Vigo
Idea intuitiva del test de las rachas
Para interpretar el sentido de las rachas es conveniente analizar el comportamiento de los residuos OLS bajo autocorrelación.
et=ret-1+ut
La esperanza del residuo de orden t condicionada al de orden t-1 depende del signo de r
E(et/et-1)=ret-1
Si r es negativo el residuo se espera con el signo diferente del anterior, mientras que si es positivo el signo es igual.
En consecuencia, si hay muchas rachas significa que se corta el eje muchas veces, por consiguiente
un residuo y el siguiente tienen diferente signo, lo que implica la existencia de autocorrelación negativa.
si hay pocas, es síntoma de que los resiudos tienden a tener el miso signo por lo que la autocorrelación es positiva.
El caso intermedio es cuando no hay autocorrelación.
Por tanto usamos como estadístico el número de rachas.
Universidadede Vigo
Universidadede Vigo
Estadístico de las rachas y ley de
distribución
)1(
))(2)((2
)(21
2 TT
TmTmmTm
T
mTmw
tRVNM
Sea w= nº de rachas, que está tabulado para muestras
pequeñas.
Para muestras grandes se puede suponer asintóticamente
normal, pues es una suma de variables aleatorias, por tanto
tomaríamos el t-estadístico y lo compararíamos con la
normal tipificada, por tanto, el t-estadístico
La regla de decisión será rechazar si es mayor que la normal
tipificada
)(
)(
wsd
wEwtRVNM
Cuando m es la mitad de T entonces esta cantidad vale
T/2+1
Universidadede Vigo
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0 5 10 15 20 25 30 35 40
E
TIME
SHAZAM PLOT
E
Gráfico de residuos respecto al tiempo
en las telas
12
rachas
GENR pos=(e.gt.0)GENR neg=(e.lt.0)GENR poslag=lag(pos)GENR racha1=(pos-poslag.ne.0)STAT racha1/sum=nracha1GENR NEGlag=lag(NEG)GENR racha2=(NEG-NEGlag.ne.0)STAT racha2/sum=nracha2PRINT POS NEG RACHA1 RACHA2SAMPLE 1 1GENR NRACHAS=MAX(NRACHA1,NRACHA2)SAMPLE 1 40STAT POS/sum=N1STAT NEG/sum=N2PRINT nrachas*Valor esperado.GEN1 ENRACHAS=((2*N1*N2)/(N1+N2))+1PRINT ENRACHAS*Varianza.GEN1 VNRACHAS=((2*N1*N2*(2*N1*N2-N1-N2))/((N1+N2)**2*(N1+N2-1)))GEN1 SNRACHAS=SQRT(VNRACHAS)PRINT VNRACHAS SNRACHAS*Estadístico normal.GEN1 TRACHAS=(NRACHAS-ENRACHAS)/SNRACHASPRINT TRACHAS?DISTRIB TRACHAS / TYPE=NORMAL
http://shazam.econ.ubc.ca/runshazam/
sample 1 40read Y X1 X2 13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721 11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044 12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774 13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449 16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957 15.11844 9.201688 8.291451 13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272 12.70277 3.510909 10.50123 16.68311 11.33816 10.72216 13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825 15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346 12.34175 2.077172 8.083948 16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanovaGEN1 T=$N
GENR pos=(e.gt.0)GENR neg=(e.lt.0)GENR poslag=lag(pos)GENR racha1=(pos-poslag.ne.0)STAT racha1/sum=nracha1GENR NEGlag=lag(NEG)GENR racha2=(NEG-NEGlag.ne.0)STAT racha2/sum=nracha2PRINT POS NEG RACHA1 RACHA2SAMPLE 1 1GENR NRACHAS=MAX(NRACHA1,NRACHA2)SAMPLE 1 40STAT POS/sum=N1STAT NEG/sum=N2PRINT nrachas*Valor esperado.GEN1 ENRACHAS=((2*N1*N2)/(N1+N2))+1PRINT ENRACHAS*Varianza.GEN1 VNRACHAS=((2*N1*N2*(2*N1*N2-N1-N2))/((N1+N2)**2*(N1+N2-1)))GEN1 SNRACHAS=SQRT(VNRACHAS)PRINT VNRACHAS SNRACHAS*Estadístico normal.GEN1 TRACHAS=(NRACHAS-ENRACHAS)/SNRACHASPRINT TRACHAS?DISTRIB TRACHAS / TYPE=NORMAL
Universidadede Vigo
Universidadede Vigo
Test de rachas para la telas
RUNS TEST: 12 RUNS, 22 POS, 0 ZERO, 18 NEG
gen1 resp=(2*22*18/40)-1
p resp
RESP
18.80000
gen1 varr=sqrt(2*22*18*(2*22*18-40)/((40**2)*39))
p varr
VARR
3.089 436
NORMAL STATISTIC = -2.8484
Autocorrelación
positiva
Universidadede Vigo
Test de Wald
El test de Wald es un test paramétrico que se realiza para contrastar la existencia de autocorrelación. Por tanto sigue el modelo explicitado previamente, y las hipótesis son:
H0: =0, lo que significa incorrelación H1: lo que significa que existe autocorrelación lineal de orden 1
La idea de este test consiste en comprobar directamente si un estimador consistente de la autocorrelacion se puede considerar nulo (hipótesis nula) o no. Al ser un estimador consistente, es decir que converge en probabilidad al parámetro en grandes muestras, se espera que dicho estimador esté cercano al parámetro y por consiguiente si este está cerca de cero el parámetro teórico también se puede suponer igual a cero.
Universidadede Vigo
Estadístico y regla de decisión del
test de Wald
Utilizamos como estimador del parámetro el coeficiente de correlación simple r. Dicho coeficiente sigue bajo la hipótesis nula una ley de distribución asintóticamente normal de media 0 y varianza 1/T (AN(0, 1/T)), luego el estadístico como estadístico del test tomamos el valor tipificado de r que será asintóticamente N(0,1), es decir
La regla de decisión será rechazar la hipótesis nula si |tW|>
T
rtW
1
Universidadede Vigo
Universidadede Vigo
Extensión del test de Wald a orden
superior
Si se quiere contrastar la existencia de autocorrelación de orden
superior al orden 1, el test se generaliza fácilmente, pero cambian
las hipótesis a contrastar. Por ejemplo suponiendo un orden m
cualquiera, el modelo ahora será el siguiente:
Ahora las hipótesis a contrastar serían:
H0: m=0, lo que significa incorrelación de orden m
H1: m , lo que significa que existe autocorrelación lineal de
orden m
2(0, )
t t t
t m t m t
Y X
sigue N I
Universidadede Vigo
Estadístico y regla de decisión del
test de Wald de orden superior
Sigueindo la misma idea intuitiva del caso de orden 1 y utilizando tambien de modo similar a ese caso como estimador del parámetro el coeficiente de correlación simple de orden m rm. Dicho coeficiente también sigue bajo la hipótesis nula una ley de distribución asintóticamente normal de media 0 y varianza 1/T (AN(0, 1/T)), luego el estadístico como estadístico del test tomamos el valor tipificado de rm que será asintóticamente N(0,1), es decir
La regla de decisión será rechazar la hipótesis nula si |tW|>
1
mW
rt
T
Universidadede Vigo
Test de Wald para las telas
LAG RHO STD ERR T-STAT
1 0.6521 0.1581 4.1244
2 0.3960 0.1581 2.5042
3 0.2816 0.1581 1.7810
4 0.2438 0.1581 1.5418
5 0.1434 0.1581 0.9072
6 0.0655 0.1581 0.4142
7 -0.1958 0.1581 -1.2385
8 -0.3726 0.1581 -2.3565
9 -0.3150 0.1581 -1.9923
10 -0.2053 0.1581 -1.2985
11 -0.1736 0.1581 -1.0978
12 -0.2099 0.1581 -1.3277
Se rechaza
autocorrelación
nula
Universidadede Vigo
Universidadede Vigo
Test LM de autocorrelación
El test LM de autocorrelación es un test paramétrico que se realiza para contrastar la existencia de autocorrelación de cualquier orden. Empezamos explicando el de orden 1, peor se generaliza fácilmente a ordenes superiores.
Por tanto sigue el modelo explicitado previamente, y las hipótesis son:
H0: =0, lo que significa incorrelación H1: lo que significa que existe autocorrelación lineal de orden
1
La idea de este test es comprobar que no existe relación lineal entre los residuos y los residuos retardados basándonos en el gráfico de residuos y residuos retardados.
Universidadede Vigo
Universidadede Vigo
Idea del Test LM de autocorrelación
En dicho gráfico se observa si existe algúntipo de relación lineal entre los residuos y losresiduos retardados, para comprobar si existeo no, se debe hacer una regresión de losresiduos sobre los residuos retardados.
Una vez hecho eso, se busca un estadísticoque mida el grado de relación lineal existenteentre las dos variables. Dado que es unaregresión simple parece lógico hacer uso delcoeficiente de determinación.
Cuanto mayor sea este mas relación linealexiste independientemente del signo de larelación.
Se demuestra que el estadístico LM=TR2sigue asintóticamente una con 1 grado delibertad. Por consiguiente ese será elestadístico que elijamos.
La regla de decisión será rechazar la hipótesisnula si
et
et-1
2LM En la práctica se utiliza la raíz cuadrada de LM y se compara con
una normal, pero el estadístico no indica el signo de la relación.
Universidadede Vigo
Universidadede Vigo
Test LM para telas
RESIDUAL CORRELOGRAM
LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL
LAG RHO sample 2 40
ols e elag
R-SQUARE = 0.4410 R-SQUARE ADJUSTED = 0.4259
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.42912E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.20715
SUM OF SQUARED ERRORS-SSE= 1.5878
MEAN OF DEPENDENT VARIABLE = 0.72745E-02
LOG OF THE LIKELIHOOD FUNCTION = 7.08551
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS
ELAG 0.65675 0.1216 5.402 0.000 0.664 0.6640 -0.3159
CONSTANT 0.95726E-02 0.3317E-01 0.2886 0.775 0.047 0.0000 1.3159
gen1 LM=$n*$r2
..NOTE..CURRENT VALUE OF $N = 39.000
..NOTE..CURRENT VALUE OF $R2 = 0.44096
distrib lm / type=chi df=1
CHI-SQUARE PARAMETERS- DF= 1.0000
MEAN= 1.0000 VARIANCE= 2.0000 MODE= 0.0000
DATA PDF CDF 1-CDF
LM 17.197 0.17734E-04 0.99997 0.33689E-04
Universidadede Vigo
Universidadede Vigo
Test LM de autocorrelación de orden
superior
El test LM de autocorrelación de orden superior generaliza el de orden 1. El modelo es como el del test de Wald de orden superior y sus hipótesis son similares, es decir
H0: m=0, lo que significa incorrelación de orden m
H1: m , lo que significa que existe autocorrelación lineal de orden m
El método de cálculo es una generalización del de orden 1, portanto primero se debe hacer una regresión de los residuos sobrelos residuos retardados de orden m y luego se debe tomar elestadístico LM=TR2 de forma similar a como se vio en el casoanterior. Seguirá asintóticamente una con 1 grado de libertad.
La regla de decisión será rechazar la hipótesis nula si
En la práctica se utiliza la raíz cuadrada de LM y se compara conuna normal, pero el estadístico no indica el signo de la relación.
2LM
Universidadede Vigo
Universidadede Vigo
Salida del Diagnos
LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL
LAG RHO LM-STAT
1 0.6521 4.3099
2 0.3960 2.5414
3 0.2816 1.8931
4 0.2438 1.7124
5 0.1434 1.1343
6 0.0655 0.5215
7 -0.1958 1.6507
8 -0.3726 3.1299
9 -0.3150 2.8827
10 -0.2053 1.8885
11 -0.1736 1.5125
12 -0.2099 1.8986
Se rechaza
autocorrelación nula
Universidadede Vigo
Universidadede Vigo
Tests conjuntos de autocorrelación
Contrastan si existe autocorrelación de orden 1 hasta m conjuntamente. Por consiguiente el modelo que se contrasta ahora es diferente de los anteriores. Ahora se debe considerar que existe mas de un retardo por consiguiente tendremos que
Ahora las hipótesis que se contrastan son:
H0: 1= = m=0, lo que significa incorrelación de orden 1 hasta el m
H1: j para algún j =1…m, lo que significa que existe autocorrelación lineal de algún orden entre 1 y m
Estudiaremos dos tipos de test que son dos versiones del mismo Test de Box-Pierce Test de Ljung-Box-Pierce
1 1
2(0, )
t t t
t t m t m t
Y X
sigue N I
Universidadede Vigo
Universidadede Vigo
Test de Box-Pierce
Como ambos son versiones del mismo test estudiamos el test de Box-Pierce y únicamente indicaremos en el otro caso el estadístico correspondiente.
La idea de ambos test consiste en comprobar si conjuntamente los estimadores de las autocorrelaciones de orden 1 hasta el m son todos nulos o no. Para ello, calculamos los coeficientes de autocorrelación hasta el orden m.
Definimos como estadístico la suma de las m correlaciones primeras al cuadrado por el número de observaciones
Como vimos que cada autocorrelación seguía asintóticamente una N(0,1) dicho estadístico seguirá asintóticamente una ji cuadrado con m grados de libertad.
Por tanto la regla de decisión será rechazar si BP> 2
T
i
i
T
ki
kiik eeer1
2
1
m
k
krTBP1
2
Universidadede Vigo
Universidadede Vigo
Test de Ljung-Box
Corrige en parte el anterior para muestras pequeñas y sigue la misma ley de distribución asintótica. El estadístico es
Que también sigue asintóticamente una ji cuadrado con m grados de libertad
Por tanto la regla de decisión será como antes rechazamos la hipótesis nula si Q> 2
2
1
2
)2( m
m
k
k AkT
rTTQ
Universidadede Vigo
Universidadede Vigo
Test de autocorrelación para telas
RESIDUAL CORRELOGRAM
LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL
LAG RHO STD ERR T-STAT LM-STAT DW-TEST BOX-PIERCE-LJUNG
1 0.6521 0.1581 4.1244 4.3099 0.6618 18.3190
2 0.3960 0.1581 2.5042 2.5414 1.1691 25.2503
3 0.2816 0.1581 1.7810 1.8931 1.3301 28.8508
4 0.2438 0.1581 1.5418 1.7124 1.3111 31.6241
5 0.1434 0.1581 0.9072 1.1343 1.4335 32.6116
6 0.0655 0.1581 0.4142 0.5215 1.5263 32.8235
7 -0.1958 0.1581 -1.2385 1.6507 1.9222 34.7757
8 -0.3726 0.1581 -2.3565 3.1299 2.2586 42.0640
9 -0.3150 0.1581 -1.9923 2.8827 2.1377 47.4418
10 -0.2053 0.1581 -1.2985 1.8885 1.8985 49.8024
11 -0.1736 0.1581 -1.0978 1.5125 1.8118 51.5479
12 -0.2099 0.1581 -1.3277 1.8986 1.8333 54.1922
LM CHI-SQUARE STATISTIC WITH 12 D.F. IS 45.536
Universidadede Vigo
Universidadede Vigo
Tratamiento de la autocorrelación
El proceso que seguiremos se denomina de mínimos cuadrados generalizados factibles (MCGF)
Primero se ve cual es el modelo teórico de estimación, generalizando MCO, al caso de matrices de covarianzas no escalares
Después se estudia la estimación factible
Este proceso necesita que analicemos previamente las características de la estimación por mínimos cuadrados generalizados, al que dedicamos el tema siguiente.