diagnosis de modelos de regresión serialmente...

77
Universidade de Vigo El fallo de la suposición de dependencia: El efecto del tiempo Modelos autocorrelados: Un caso particular de los modelos de regresión lineal generalizado

Upload: duongphuc

Post on 02-Nov-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

El fallo de la suposición de dependencia: El efecto

del tiempo

Modelos autocorrelados: Un caso

particular de los modelos de regresión

lineal generalizado

Page 2: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Introducción al modelo de regresión

generalizado

En muchos problemas económicos se producen efectossobre las perturbaciones, de tal forma que éstas tienendispersiones distintas, como ocurre en las seriesfinancieras, y en algunos casos se producen interaccionesentre ellas, como es el caso de las series temporales coninformación del pasado.

Esto afecta al comportamiento de la regresión, pues actúasobre dos de las suposiciones básicas del modelo linealgeneral:

la homocedasticidad: Cuando las varianzas de las perturbacionesson distintas para cada observación.

la independencia: Cuando existe relación entre dos cualesquieraobservaciones diferentes.

Page 3: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Introducción al modelo de regresión

generalizado (2)

Las dos suposiciones anteriores obligan a que las

perturbaciones se comporten todas del mismo modo y por

consiguiente tienen una matriz de varianzas-covarianzas

con un único parámetro desconocido, es una matiz escalar.

Cuando las perturbaciones del modelo de regresión tienen

matriz de varianzas-covarianzas no escalar, se dice que

estamos en un modelo de regresión lineal generalizado

(MRLG).

A ese tipo de perturbaciones se les denomina no esféricas.

Estudiamos primero el caso general y luego cada uno de los

específicos.

Page 4: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Perturbaciones esféricas y no

esféricas

Para comprender mejor las diferencias supongamos que tenemos

sólo dos observaciones

2

1

Esféricas

2

1

No esféricas

La forma tiene una inclinación que corresponde a la

correlación entre las perturbaciones. La elipse tiene ejes

diferentes que corresponden a la heterocedasticidad.

Por consiguiente presentan forma no esférica

Bajo normalidad, se verifica que la incorrelación es

independencia, manifestándose en los ejes ortogonales. La

homocedasticidad implica que ambos ejes son iguales en

dimensión. Por consiguiente presentan forma esférica

Page 5: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Modelo de regresión lineal

generalizado

1

Y=X +

donde sigue una ley N(0, ).

Suposiciones del MRLC con

perturbaciones no esféricas

Page 6: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Matriz de varianzas covarianzas de

las perturbaciones

La matriz de varianzas-covarianzas se descompone en

dos elementos

, que nos mide la parte de las varianzas común a todas las

observaciones,

que será una matriz simétrica, cuyos elementos nos indican las

relaciones entre las observaciones o la ratio de varianzas respecto

a su parte común.

De esta forma facilitamos la comparación con el MRLC,

que será un caso particular de éste cuando =I.

Page 7: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Generaliza el MRLC

Permite Heterocedasticidad.

Por ejemplo medidas de la producción de diferentes empresas donde la

fiabilidad de la estimación de esa producción dependa del tamaño de la

empresa.

Permite dependencia de las perturbaciones y por lo tanto de las

observaciones.

Un caso se produce cuando se estiman las ventas de una empresa y el

error de esa estimación depende de las ventas del periodo anterior.

El MRLC es un caso particular cuando =I.

Page 8: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Efecto sobre los estimadores MCO

Sigue siendo lineal e insesgado.

La varianza aumenta por lo que pierde eficiencia el

estimador.

La varianza estimada de los estimadores de los

coeficientes, bajo las suposiciones del MRLC estará mal

estimada.

Los test de la regresión MCO serán inválidos, sino se

cambia el estimador de la varianza.

El estimador MCO de la parte de la varianza que es

común a todas las observaciones s2 es sesgado.

Page 9: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Comprobación de esos efectos

Para comprobar esos efectos primero se verán las

propiedades que no cambian, que son las referentes al valor

esperado de la dependiente.

Después las que cambian, que son las que están relacionadas

con las varianzas de los estimadores.

Page 10: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Es lineal e insesgado

La linealidad se deriva de la construcción pues la forma de

construir el estimador no varía.

Para ver la insesgadez se utiliza la forma que relaciona b y .

b= +(X’X)-1X’

E(b)=E( +(X’X)-1X’ +E((X’X)-1X’

+(X’X)-1X’E( +0=

Page 11: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

El estimador deja de ser eficiente

Partimos de la misma definición del estimador MCO pero ahora debemos considerar que las perturbaciones no son escalares

b= +(X’X)-1X’

Var(b)=E((X’X)-1X’ (X’X)-1X’E( X(X’X)-1

(X’X)-1X’ 2 X(X’X)-1

2 (X’X)-1X’ X(X’X)-1 2 (X’X)-1

Consecuentemente la varianza no coincide con la que se había estimado bajo el MRLC, de hecho se deduce de las propiedades de las formas cuadráticas que ya no es la menor, y no se puede asegurar la eficiencia.

Consecuencia de lo anterior la varianza estimada en el MRLC estará mal estimada, pues no es la verdadera al cambiar las suposiciones de partida.

Page 12: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Los test de la regresión MCO serán

inválidos

Por consiguiente para que los test de los coeficientes de

regresión estimados bajo MCO sean válidos es necesario que

cambiemos las varianzas estimadas.

Los que salen por defecto en la ejecución de los programas

serán inválidos

En SHAZAM debemos hacer uso de una opción del OLS que

depende si suponemos heterocedasticidad (HETCOV) o

autocorrelación (AUTCOV). No obstante la salido es similar.

Page 13: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Comparación entre ambas salidas

|_ols y x x2/resid=e Predict=ye noanova

REQUIRED MEMORY IS PAR= 1 CURRENT PAR= 11000

OLS ESTIMATION

7 OBSERVATIONS DEPENDENT VARIABLE= Y

...NOTE..SAMPLE RANGE SET TO: 1, 7

R-SQUARE = 0.9221 R-SQUARE ADJUSTED = 0.8832

VARIANCE OF THE ESTIMATE-SIGMA**2 = 35.597

STANDARD ERROR OF THE ESTIMATE-SIGMA = 5.9664

SUM OF SQUARED ERRORS-SSE= 142.39

MEAN OF DEPENDENT VARIABLE = 41.143

LOG OF THE LIKELIHOOD FUNCTION = -20.4769

VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL

NAME COEFFICIENT ERROR 4 DF P-VALUE CORR.

X 7.1057 1.033 6.876 0.002 0.960

X2 1.0678 0.9414 1.134 0.320 0.493

CONSTANT -4.7473 8.089 -0.5869 0.589-0.282

|_ols y x x2/resid=e Predict=ye hetcov noanova

REQUIRED MEMORY IS PAR= 1 CURRENT PAR= 11000

OLS ESTIMATION

7 OBSERVATIONS DEPENDENT VARIABLE= Y

...NOTE..SAMPLE RANGE SET TO: 1, 7

USING HETEROSKEDASTICITY-CONSISTENT COVARIANCE MATRIX

R-SQUARE = 0.9221 R-SQUARE ADJUSTED = 0.8832

VARIANCE OF THE ESTIMATE-SIGMA**2 = 35.597

STANDARD ERROR OF THE ESTIMATE-SIGMA = 5.9664

SUM OF SQUARED ERRORS-SSE= 142.39

MEAN OF DEPENDENT VARIABLE = 41.143

LOG OF THE LIKELIHOOD FUNCTION = -20.4769

VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL

NAME COEFFICIENT ERROR 4 DF P-VALUE CORR.

X 7.1057 0.8917 7.969 0.001 0.970

X2 1.0678 0.4916 2.172 0.096 0.736

CONSTANT -4.7473 4.226 -1.123 0.324-0.490

Test asintótico

válidoTest inválido

Page 14: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

El estimador MCO de 2 es sesgado

El estimador de la parte común de la varianza 2, era insesgado en el caso el

MRLC. Ahora va a ser sesgado por ser diferente la varianza de las

perturbaciones.

Para verlo consideramos la varianza de los residuos MCO que vendrá dada por

Var(e)=var(M var ’ ’= ’

Luego, partiendo de la definición de la varianza residual

La esperanza de ese estimador sería

De donde se sigue que no tiene

porque verificarse la insesgadez del estimador.

Se e

T k2

1

E SE trz e e

T k

E trz ee

T k

trzE ee

T k

trz e

T k

trz M M

T k

trz MM

T k

trz M

T k

( )( ( )) ( ( ' ))

( ' ) var( )

2

2

2 2 2

1 1

1 1 1

1 1

Page 15: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Casos particulares del MRLG

Fundamentalmente se estudian dos casos particulares:

La autocorrelación

La heterocedasticidad.

En este capítulo estudiaremos la primera.

Para comprenderla es necesario analizar el concepto de

independencia al que está asociado.

La independencia indica que ninguna observación nos da información

pertinente sobre las demás salvo en cuanto a la relación entre las

variables analizadas. Por tanto la variable dependiente condicionada a

la información que las independientes dan sobre ella, en una

determinada observación no aporta información adicional sobre la

misma variable condicionada en otra observación.

Page 16: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Modelos dependientes

La dependencia en modelos de regresión lineal

Modelos autocorrelados: El efecto del pasado de forma lineal

Page 17: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

La independencia

El hecho de suponer que las observaciones son independientes nos permite analizar las perturbaciones como si fueran un conjunto de variables igualmente distribuidas y, por lo tanto, nos permite suponer que cada observación agota la información que esa observación puede dar sobre la variable dependiente.

Este hecho nos permite suponer que todas las perturbaciones provienen de la misma población y, por consiguiente analizar lsoresiduos como si todos ellos fueran observaciones de una misma variable

En caso contrario existe dependencia. Eso implicaría que la matriz de varianzas covarianzas ya no va ser escalar, es decir, la identidad por un escalar, sino que los elementos de fuera de la diagonal pueden ser distintos de 0.

Page 18: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Modelo lineal con dependencia

El modelo es similar

Pero la matriz de covarianzas varía:

12

Y=X + siendo una

12 1

12 22

1

1 ...

1 ...

... ... ... ...

... ... 1

T

T

T

Mantiene la diagonal

principal constante, es

decir, las varianzas son

las mismas para todas las

perturbaciones

Representa la varianza de

todas las perturbaciones

Representa la matriz de correlaciones entre cada

par de perturbaciones

Page 19: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Ejemplos de dependencia

Se quiere estudiar la rentabilidad en función del numero de

clientes en una red de sucursales de banca, cuyos sistemas de

organización están relacionados y es posible que las

perturbaciones entre oficinas estén relacionadas. (correlación)

Estudio de las ventas de una compañía en diferentes zonas que

posiblemente esté afectado por al distancia a los centros de

venta (correlación espacial)

Evolución de las ventas de una empresa en función de su

publicidad y sus ventas pasadas. (correlación temporal)

Page 20: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Modelos autocorrelados

Aunque la dependencia se puede dar por múltiples causas, lo mas habitual es que tenga que ver con el tiempo, pues existe en las variables económicas un efecto temporal consecuencia de “recordar” efectos del pasado.

Por ese motivo, vamos a estudiar un caso particular, los modelos autocorrelados, que significan que existe influencia del pasado, y esta influencia se recoge mediante un efecto lineal, es decir es siempre constante independientemente del periodo, pero depende del retardo.

Si el efecto del pasado desaparece a partir de un determinado retardo se dice que la serie tiene memoria finita. En el caso siguiente tiene memoria de orden m si alcanza hasta el retardo m.

Page 21: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Modelo lineal con autocorrelación

Existe dependencia del pasado en las perturbaciones, por

consiguiente, estas no son independientes.

La forma general será

1 1

2

..

(0, )

t t t

t t m t m t

Y X

sigue N I

Page 22: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede VigoModelos autocorrelados de orden 1

Vamos a estudiar fundamentalmente un caso particular, los modelos autocorrelados de orden 1, que significan que solo existe influencia del pasado mas reciente, es decir la información del pasado esta toda contenida en el periodo anterior.

Esto, como veremos posteriormente, indica que existe influencia en cualquier pasado, si bien de una forma determinada.

Sin embargo comentaremos el efecto sobre los otros modelos autocorrelados, pues es muy similar en sus efectos y en su forma de detectarlo.

Page 23: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Modelo lineal con autocorrelación de

orden 1

Existe dependencia del pasado en las perturbaciones, por consiguiente, estas no son independientes.

Para determinar bien un modelo debemos llegar a especificar las perturbaciones como ruido blanco, puesto que en ese instante no dan información adicional sobre el modelo. Por consiguiente, la forma general será

1 1

2(0, )

t t t

t t t

Y X

sigue N I

Page 24: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Forma matricial del modelo lineal con

autocorrelación

Escribiendo en forma matricial lo anterior tendríamos que

Y=X + siendo una

1......

............

...1

...1

1

2

1

2

n

n

n

Por consiguiente estaríamos en un caso particular del modelo de

regresión lineal generalizado. Sus efectos serán consecuencia de ello.

Page 25: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Efectos de la autocorrelación

Falla la independencia de las observaciones

Los estimadores OLS son centrados pero ineficientes.

Las varianzas obtenidas por OLS, bajo las suposiciones del MRLC, son falsas por tanto los test obtenidos a partir de ellas serán sesgados.

Las predicciones son ineficientes.

Page 26: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede VigoIdentificación de la autocorrelación

Gráficos

Algunos coinciden con los ya definidos y sólo cambia su interpretación.

Otros son específicos de este análisis

Tests de hipótesis

Son específicos de la hipótesis alternativa de autocorrelación

Pueden ser de orden 1 o de orden mayor que 1.

Page 27: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Gráficos para detectar la

autocorrelación

1. Residuos respecto al tiempoRepresentamos los residuos respecto al tiempo

2. Residuos respecto a valores retardados.Representamos los residuos respecto a los residuos retardados

uno o mas periodos.

Page 28: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede VigoGráficos de residuos respecto al tiempo

Representamos los residuos respecto al tiempo.

Si son ruido blanco siempre se espera las tres características enunciadas en el tema 1: media nula constante, varianza constante e independencia.

Cuando existe autocorrelaciónpositiva los residuos cortan pocas veces el eje.

Cuando es negativa lo cortan muchas.

En caso de no correlación deberían comportarse como un ruido blanco.

e t

tiempo

**

** **

**

*

*

***

*

**

***

*

**

** ****

Autocorrelación positiva

e t

tiempo

*

*

*

*

*

*

*

Autocorrelación negativa

Page 29: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Gráficos de la evolución temporal de las

variables

Page 30: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Grafico respecto a valores predichos

No se ve clara

ninguna estructura,

aunque tampoco

parecen un ruido

blanco

Page 31: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede VigoGráfico de residuos respecto al tiempo

Hay pocos cortes ,

pero no se ve claro

del todo

Page 32: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Gráficos de residuos respecto a

valores retardados

Representamos los residuos respecto a sus valores retardados.

Depende del orden que se quiera estudiar para hacer uso de él en la representación.

Lo normal será estudiar autocorrelación de primer orden por lo que haremos uso de los residuos retardados una vez.

Para órdenes superiores al primero se haría de la misma forma haciendo uso de residuos de orden superiores

Page 33: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Gráficos de residuos respecto a

valores retardados

Al estudiar autocorrelación de primer orden debería tener una forma similar a la lineal.

Si la autocorrelación es positiva dicha forma será creciente

Si la autocorrelación es negativa dicha forma será decreciente.

En caso de no correlación deberían comportarse como un ruido blanco.

e t

e t

e t-1

e t-1

Creciente

Decreciente

Page 34: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Grafico respecto a residuos retardados

Cierta relación

lineal positiva

Page 35: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Gráficos de residuos respecto a residuos retardados

en orden superior al primero

Si la autocorrelación se sospecha que sólo se da en un orden superior al primero

Por ejemplo en datos trimestrales cada año, y por tanto con retardo 4

Entonces se representa los residuos actuales respecto a los residuos retardados s veces

En el caso anterior s=4

La interpretación es similar al caso de s=1

e t

e t

e t-1

e t-1

Creciente

Decreciente

Page 36: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Test de hipótesis para comprobar

la autocorrelación

Test de autocorrelación individuales y conjuntos. De primer orden o

de orden superior

Page 37: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Tests de hipótesis para la identificación

de la autocorrelación

Para identificar la autocorrelación en un modelo, se parte de suponer que ésta no existe.

Se realiza la estimación como si no la hubiese

Se analizan los residuos para ver si el comportamiento que presentan es el esperado bajo no correlación, o aparecen situaciones inesperadas que, en algunos casos serán síntomas de autocorrelación.

Page 38: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede VigoTest de autocorrelación (1)

Los test para comprobar la existencia de autocorrelación, van a ser muy similares en su construcción a los test enunciados para la otras suposiciones, si bien algunos tienen especiales características.

La hipótesis nula, en todos ellos va a ser la de no existencia de autocorrelación.

La alternativa cambia según se sospeche autocorrelación de primer orden o de orden superior.

Estudiaremos en primer lugar la autocorrelación de orden uno.

Page 39: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de autocorrelación

Los test de autocorrelación de orden 1 se consideran todos ellos Individuales, pues únicamente se contrasta un parámetro

Pueden ser

Paramétricos

Test de Durbin-Watson

Test de la Razón de Von-Neuman

Test LM de autocorrelación

Test de Wald

No paramétricos Test de Wald-Wolfowitz o de las rachas

No generalizables a

orden superior*

Generalizables a

orden superior

* En realidad se pueden generalizar pero sus leyes de distribución necesitan tablas alternativas de difícil cálculo

Page 40: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Modelo de test de autocorrelación de

orden 1

En todos los test paramétricos de autocorrelación de orden 1, el modelo es el mismo, pues se considera el modelo mas general y se comprueba si la restricción de que el coeficiente de autocorrelacion se a nulo se verifica.

El modelo general con las suposiciones del MRLG será

La hipótesis nula será normalmente que 1=0, por lo que el modelo quedará convertido en un MRLC, puesto que y coinciden.

1 1

2(0, )

t t t

t t t

Y X

sigue N I

Page 41: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Residuos OLS en modelos

autocorrelados

Para desarrollar los diferentes test de hipótesis de autocorrelación de orden 1 es conveniente analizar el comportamiento de los residuos OLS bajo autocorrelación.

et=ret-1+ut

La esperanza del residuo de orden t condicionada al de orden t-1 depende del signo de r

E(et/et-1)=ret-1

Si r es negativo el residuo se espera con el signo diferente del anterior, mientras que si es positivo el signo es igual.

Por lo tanto

|E(et/et-1)-et-1|=|r-1|

Si r es negativo la diferencia tiende a ser mayor que 1, mientras que si es positivo tiende a ser cercano a cero. Por tanto las distancias entre dos residuos consecutivos se incrementará cuando ambos tienen diferente signo

Page 42: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Durbin-Watson

Contrasta la autocorrelación de orden 1 bajo el modelo

de regresión lineal con autocorrelación.

Las hipótesis a contrastar serán las siguientes:

H0: =0, lo que significa incorrelación

H1: , lo que significa que existe autocorrelación lineal de

orden 1

Page 43: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Idea del Test de Durbin-Watson

La idea de este test es comprobar si las

diferencias entre los residuos observados

consecutivamente es muy grande o muy

pequeña.

Si es muy grande es síntoma de que

cambia de signo, y entonces la

autocorrelación es negativa.

Si es muy pequeña es que están muy

seguidos y normalmente no cambiará de

signo por lo que la relación entre ellos es

positiva

e t

tiempo

**

** **

**

*

*

***

*

**

***

*

**

** ****

Autocorrelación positiva

e t

tiempo

*

*

*

*

*

*

*

Autocorrelación negativa

Diferencias muy

pequeñas

Diferencias muy

grandes

Page 44: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Durbin-Watson (2)

• Bajo las suposiciones del MRLC, que es bajo la hipótesis nula,

se construye el estadístico

T

t

t

T

t

tt

e

ee

DW

1

2

2

2

1)(

• Se puede observar como dicho estadístico se obtiene como

diferencia entre dos residuos consecutivos al cuadrado,

normalizado por la suma de todos ellos al cuadrado.

Page 45: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Durbin-Watson (3)

Intuitivamente, ese estadístico nos dice que si un residuo está muy cercano al anterior entonces la correlación es positiva, ya que la diferencia será cercana a 0.

Si está muy alejado, significa que irá pegando saltos de un lado al otro del 0 y por tanto la correlación en negativa.

Cuando es un número intermedio el estimador sería aproximadamente el promedio entre 0 y el límite superior del estadístico.

Page 46: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Durbin-Watson (4)

A la vista del estadístico anterior, se demuestra que es aproximadamente igual a

DW 2(1-r)

Siendo r un estimador de

Cuando DW es pequeño será cercano a 0, pues r es aproximadamente 1.

Cuando DW es grande será cercano a 4 pues r es aproximadamente –1.

Cuando es un número intermedio el estimador sería aproximadamente 2, que es el promedio entre 0 y 4.

Page 47: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Regla de decisión en el test de Durbin-

Watson

El estadístico DW sigue una ley tabulada por D-W.

Dicha ley tiene una particularidad que hay una zona donde el test no permite decidir

Las decisiones pueden ser de indecisión, según el siguiente gráfico

Zonas de indecisión

Autocorrelación positiva

Autocorrelación negativa

No Autocorrelación

0 d 42L Ud

d LUd4- 4-

Page 48: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Valores

críticos del

contraste

de Durbin-

Watson

Page 49: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test DW para las telas

|_g elag=lag(e)

..NOTE.LAG VALUE IN UNDEFINED OBSERVATIONS SET TO ZERO

|_g de2=(e-elag)**2

|_g e2=e*e

|_stat e2/sum=se2 beg=1 end=40

NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM

E2 40 0.73068E-01 0.78376E-01 0.61427E-02 0.70056E-05 0.26232

|_stat de2/sum=sde2 beg=2 end=40

NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM

DE2 39 0.49600E-01 0.66347E-01 0.44020E-02 0.56465E-04 0.30769

|_gen1 dw=sde2/se2

|_p dw

DW

0.6618468Media de las diferencias muy

pequeña lo que indica que las

diferencias tienden a ser

pequeñas

http://shazam.econ.ubc.ca/runshazam

Page 50: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Calculo con SHAZAM del estadístico

de Durbin-Watson

GEN1 T=$N

GEN1 SCE=$SSE

GENR ER1=LAG(E)

GENR DEER12=(E-ER1)**2

?STAT DEER12 / SUMS=SDEER12 BEG=2 END=T

GEN1 DWC1=SDEER12/SCE

PRINT SDEER12 SCE DWC1 sample 1 40read Y X1 X2

13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721 11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044

12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774 13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449

16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957 15.11844 9.201688 8.291451

13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272 12.70277 3.510909 10.50123 16.68311 11.33816 10.72216

13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825 15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346

12.34175 2.077172 8.083948 16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanova

GEN1 T=$NGEN1 SCE=$SSEGENR ER1=LAG(E)GENR DEER12=(E-ER1)**2?STAT DEER12 / SUMS=SDEER12 BEG=2 END=TGEN1 DWC1=SDEER12/SCEPRINT SDEER12 SCE DWC1

http://shazam.econ.ubc.ca/runshazam/

Page 51: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Regla de decisión en el test de Durbin-

Watson anterior

Zonas de indecisión

Autocorrelación positiva

Autocorrelación negativa

No Autocorrelación

0 421,39 1,60 2,40 2,61

DW=0,66

Page 52: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de la Razón de Von-Neuman

Similar al anterior pero intenta corregir el efecto del número de observaciones en los dos términos del cociente.

Su idea intuitiva es similar a la de DurbinWatson

Por consiguiente las hipótesis a contrastar son:

H0: =0, lo que significa incorrelación

H1: lo que significa que existe autocorrelación lineal de orden 1

Page 53: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Estadístico de la Razón de Von-Neuman

La ratio de Von Neumann corrige el tamaño muestral, para lo cual secalcula dividiendo cada término por el número de observaciones queintervienen en él.

El estadístico que se obtiene es

T

t

t

T

t

tt

eeT

eeT

RVN

1

2

2

2

1

)(1

)(1

1

Page 54: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Distribución de la Razón de Von-Neuman

La ley de distribución en muestras pequeñas está tabulada, además se

puede determinar su distribución asintótica, bajo independencia de

las perturbaciones, que viene dada por una ley normal.

)1

)2(4,2(

2T

TANesRVN

A esto se añade la ventaja de que esta ley no depende del

comportamiento estocástico de los regresores, como ocurría en

DW.

Tampoco necesita la normalidad estricta de las perturbaciones.

Page 55: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de la Razón de Von-Neuman

La interpretación del estadístico es muy similar a la de DW, pero ahora

se puede determinar su distribución asintótica, bajo independencia de

las perturbaciones, que viene dada por una ley normal. Tomando

entonces el t-estadístico lo compararíamos con las tablas de la normal

tipificada

1

)2(4

2

2T

T

RVNtRVN

La regla de decisión será rechazar si |tRVN|>

gen1 rvn=(T/(T-1))*dw

p rvn

gen1 tvn=(rvn-2)/sqrt(4*(T-2)/(T**2-1))

distrib tvn/

http://shazam.econ.ubc.ca/runshazam/

sample 1 40

read Y X1 X2 13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721

11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044 12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774

13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449

16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957

15.11844 9.201688 8.291451 13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272

12.70277 3.510909 10.50123 16.68311 11.33816 10.72216 13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825

15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346 12.34175 2.077172 8.083948

16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanova

GEN1 T=$NGEN1 SCE=$SSEGENR ER1=LAG(E)GENR DEER12=(E-ER1)**2?STAT DEER12 / SUMS=SDEER12 BEG=2 END=TGEN1 DWC1=SDEER12/SCE

gen1 rvn=(T/(T-1))*dwc1p rvngen1 tvn=(rvn-2)/sqrt(4*(T-2)/(T**2-1))distrib tvn/

Page 56: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test RVN para las telas

|_gen1 rvn=(N/(n-1))*dw

RVN

0.6788172

|_gen1 tvn=(rvn-2)/sqrt(4*(n-2)/(n**2-1))

|_distrib tvn/

NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE=

1.0000

DATA Z PDF CDF 1-CDF

TVN -4.2851 0.00041 0.00009 0.99999

Muy significativo.

Se rechaza H0

Page 57: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Wald-Wolfowitz o de las

rachas

El test contrasta la existencia o no de autocorrelación de modo no paramétrico, es decir sin necesidad de conocer exactamente los parámetros que caracterizan el modelo. Analiza si entre los residuos existe independencia o asociación de orden 1, es decir, relación entre una observación y la anterior o la siguiente. Por consiguiente las hipótesis van a ser:

H0: Existe independencia entre los residuos

H1: Existe relación de orden 1 entre los residuos

Para calcularlo es necesario hacer uso de las rachas.

Page 58: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Calculo de las rachas

Se define una racha como una sucesión de símbolos iguales, entre dos distintos.

Se calculan respecto a la mediana. Para ello:

1. Se consideran como 1 losvalores mayores que lamediana, y 0 los menores.Se eliminan los iguales

2. Se cuenta el número derachas.

et

M e d ia n a

*

**

*

*

* *

*

*

*

**

**

*

***

*

*

**

**

*

**

R a c h a 1

R a c h a 2

R a c h a 1 3

Page 59: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Idea intuitiva del test de las rachas

Para interpretar el sentido de las rachas es conveniente analizar el comportamiento de los residuos OLS bajo autocorrelación.

et=ret-1+ut

La esperanza del residuo de orden t condicionada al de orden t-1 depende del signo de r

E(et/et-1)=ret-1

Si r es negativo el residuo se espera con el signo diferente del anterior, mientras que si es positivo el signo es igual.

En consecuencia, si hay muchas rachas significa que se corta el eje muchas veces, por consiguiente

un residuo y el siguiente tienen diferente signo, lo que implica la existencia de autocorrelación negativa.

si hay pocas, es síntoma de que los resiudos tienden a tener el miso signo por lo que la autocorrelación es positiva.

El caso intermedio es cuando no hay autocorrelación.

Por tanto usamos como estadístico el número de rachas.

Page 60: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Estadístico de las rachas y ley de

distribución

)1(

))(2)((2

)(21

2 TT

TmTmmTm

T

mTmw

tRVNM

Sea w= nº de rachas, que está tabulado para muestras

pequeñas.

Para muestras grandes se puede suponer asintóticamente

normal, pues es una suma de variables aleatorias, por tanto

tomaríamos el t-estadístico y lo compararíamos con la

normal tipificada, por tanto, el t-estadístico

La regla de decisión será rechazar si es mayor que la normal

tipificada

)(

)(

wsd

wEwtRVNM

Cuando m es la mitad de T entonces esta cantidad vale

T/2+1

Page 61: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

-0.5

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0 5 10 15 20 25 30 35 40

E

TIME

SHAZAM PLOT

E

Gráfico de residuos respecto al tiempo

en las telas

12

rachas

GENR pos=(e.gt.0)GENR neg=(e.lt.0)GENR poslag=lag(pos)GENR racha1=(pos-poslag.ne.0)STAT racha1/sum=nracha1GENR NEGlag=lag(NEG)GENR racha2=(NEG-NEGlag.ne.0)STAT racha2/sum=nracha2PRINT POS NEG RACHA1 RACHA2SAMPLE 1 1GENR NRACHAS=MAX(NRACHA1,NRACHA2)SAMPLE 1 40STAT POS/sum=N1STAT NEG/sum=N2PRINT nrachas*Valor esperado.GEN1 ENRACHAS=((2*N1*N2)/(N1+N2))+1PRINT ENRACHAS*Varianza.GEN1 VNRACHAS=((2*N1*N2*(2*N1*N2-N1-N2))/((N1+N2)**2*(N1+N2-1)))GEN1 SNRACHAS=SQRT(VNRACHAS)PRINT VNRACHAS SNRACHAS*Estadístico normal.GEN1 TRACHAS=(NRACHAS-ENRACHAS)/SNRACHASPRINT TRACHAS?DISTRIB TRACHAS / TYPE=NORMAL

http://shazam.econ.ubc.ca/runshazam/

sample 1 40read Y X1 X2 13.67419 5.812306 9.618232 12.23123 2.349833 8.792984 14.24416 6.512268 7.245803 13.09992 4.247147 7.628721 11.57063 2.129643 5.580494 13.34827 5.168126 7.879123 13.72654 6.991165 4.697044 12.64680 3.473818 10.29553 14.81051 7.414717 9.116850 14.26475 6.512593 8.998774 13.82903 6.346602 7.702146 12.50548 4.228968 6.302803 16.46039 10.17773 10.47208 15.53935 9.036032 5.301139 14.18664 5.389858 9.912449 16.03517 10.32533 6.892142 16.24270 10.65682 8.527317 14.35575 7.139112 6.420603 13.73911 5.426304 8.659825 13.74065 7.120570 3.591744 16.41518 11.68747 5.727957 15.11844 9.201688 8.291451 13.16943 5.389102 8.350465 12.34674 4.320868 4.284089 14.28210 6.715199 8.144075 16.12797 11.41178 3.930686 16.36737 11.33818 9.573272 12.70277 3.510909 10.50123 16.68311 11.33816 10.72216 13.62423 6.421302 4.121910 15.41468 8.373539 8.733325 13.69979 6.292514 3.134825 15.62946 9.368146 6.891760 14.73427 7.213666 5.138107 14.03419 5.703933 6.581673 14.93376 6.993492 8.776701 16.63914 10.82451 5.594346 12.34175 2.077172 8.083948 16.61178 11.98494 3.796529 12.08137 3.016656 3.163270?ols y x1 x2/resid=e predict=ye rstat dwpvalue noanovaGEN1 T=$N

GENR pos=(e.gt.0)GENR neg=(e.lt.0)GENR poslag=lag(pos)GENR racha1=(pos-poslag.ne.0)STAT racha1/sum=nracha1GENR NEGlag=lag(NEG)GENR racha2=(NEG-NEGlag.ne.0)STAT racha2/sum=nracha2PRINT POS NEG RACHA1 RACHA2SAMPLE 1 1GENR NRACHAS=MAX(NRACHA1,NRACHA2)SAMPLE 1 40STAT POS/sum=N1STAT NEG/sum=N2PRINT nrachas*Valor esperado.GEN1 ENRACHAS=((2*N1*N2)/(N1+N2))+1PRINT ENRACHAS*Varianza.GEN1 VNRACHAS=((2*N1*N2*(2*N1*N2-N1-N2))/((N1+N2)**2*(N1+N2-1)))GEN1 SNRACHAS=SQRT(VNRACHAS)PRINT VNRACHAS SNRACHAS*Estadístico normal.GEN1 TRACHAS=(NRACHAS-ENRACHAS)/SNRACHASPRINT TRACHAS?DISTRIB TRACHAS / TYPE=NORMAL

Page 62: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de rachas para la telas

RUNS TEST: 12 RUNS, 22 POS, 0 ZERO, 18 NEG

gen1 resp=(2*22*18/40)-1

p resp

RESP

18.80000

gen1 varr=sqrt(2*22*18*(2*22*18-40)/((40**2)*39))

p varr

VARR

3.089 436

NORMAL STATISTIC = -2.8484

Autocorrelación

positiva

Page 63: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Test de Wald

El test de Wald es un test paramétrico que se realiza para contrastar la existencia de autocorrelación. Por tanto sigue el modelo explicitado previamente, y las hipótesis son:

H0: =0, lo que significa incorrelación H1: lo que significa que existe autocorrelación lineal de orden 1

La idea de este test consiste en comprobar directamente si un estimador consistente de la autocorrelacion se puede considerar nulo (hipótesis nula) o no. Al ser un estimador consistente, es decir que converge en probabilidad al parámetro en grandes muestras, se espera que dicho estimador esté cercano al parámetro y por consiguiente si este está cerca de cero el parámetro teórico también se puede suponer igual a cero.

Page 64: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Estadístico y regla de decisión del

test de Wald

Utilizamos como estimador del parámetro el coeficiente de correlación simple r. Dicho coeficiente sigue bajo la hipótesis nula una ley de distribución asintóticamente normal de media 0 y varianza 1/T (AN(0, 1/T)), luego el estadístico como estadístico del test tomamos el valor tipificado de r que será asintóticamente N(0,1), es decir

La regla de decisión será rechazar la hipótesis nula si |tW|>

T

rtW

1

Page 65: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Extensión del test de Wald a orden

superior

Si se quiere contrastar la existencia de autocorrelación de orden

superior al orden 1, el test se generaliza fácilmente, pero cambian

las hipótesis a contrastar. Por ejemplo suponiendo un orden m

cualquiera, el modelo ahora será el siguiente:

Ahora las hipótesis a contrastar serían:

H0: m=0, lo que significa incorrelación de orden m

H1: m , lo que significa que existe autocorrelación lineal de

orden m

2(0, )

t t t

t m t m t

Y X

sigue N I

Page 66: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Estadístico y regla de decisión del

test de Wald de orden superior

Sigueindo la misma idea intuitiva del caso de orden 1 y utilizando tambien de modo similar a ese caso como estimador del parámetro el coeficiente de correlación simple de orden m rm. Dicho coeficiente también sigue bajo la hipótesis nula una ley de distribución asintóticamente normal de media 0 y varianza 1/T (AN(0, 1/T)), luego el estadístico como estadístico del test tomamos el valor tipificado de rm que será asintóticamente N(0,1), es decir

La regla de decisión será rechazar la hipótesis nula si |tW|>

1

mW

rt

T

Page 67: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Test de Wald para las telas

LAG RHO STD ERR T-STAT

1 0.6521 0.1581 4.1244

2 0.3960 0.1581 2.5042

3 0.2816 0.1581 1.7810

4 0.2438 0.1581 1.5418

5 0.1434 0.1581 0.9072

6 0.0655 0.1581 0.4142

7 -0.1958 0.1581 -1.2385

8 -0.3726 0.1581 -2.3565

9 -0.3150 0.1581 -1.9923

10 -0.2053 0.1581 -1.2985

11 -0.1736 0.1581 -1.0978

12 -0.2099 0.1581 -1.3277

Se rechaza

autocorrelación

nula

Page 68: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test LM de autocorrelación

El test LM de autocorrelación es un test paramétrico que se realiza para contrastar la existencia de autocorrelación de cualquier orden. Empezamos explicando el de orden 1, peor se generaliza fácilmente a ordenes superiores.

Por tanto sigue el modelo explicitado previamente, y las hipótesis son:

H0: =0, lo que significa incorrelación H1: lo que significa que existe autocorrelación lineal de orden

1

La idea de este test es comprobar que no existe relación lineal entre los residuos y los residuos retardados basándonos en el gráfico de residuos y residuos retardados.

Page 69: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Idea del Test LM de autocorrelación

En dicho gráfico se observa si existe algúntipo de relación lineal entre los residuos y losresiduos retardados, para comprobar si existeo no, se debe hacer una regresión de losresiduos sobre los residuos retardados.

Una vez hecho eso, se busca un estadísticoque mida el grado de relación lineal existenteentre las dos variables. Dado que es unaregresión simple parece lógico hacer uso delcoeficiente de determinación.

Cuanto mayor sea este mas relación linealexiste independientemente del signo de larelación.

Se demuestra que el estadístico LM=TR2sigue asintóticamente una con 1 grado delibertad. Por consiguiente ese será elestadístico que elijamos.

La regla de decisión será rechazar la hipótesisnula si

et

et-1

2LM En la práctica se utiliza la raíz cuadrada de LM y se compara con

una normal, pero el estadístico no indica el signo de la relación.

Page 70: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test LM para telas

RESIDUAL CORRELOGRAM

LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL

LAG RHO sample 2 40

ols e elag

R-SQUARE = 0.4410 R-SQUARE ADJUSTED = 0.4259

VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.42912E-01

STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.20715

SUM OF SQUARED ERRORS-SSE= 1.5878

MEAN OF DEPENDENT VARIABLE = 0.72745E-02

LOG OF THE LIKELIHOOD FUNCTION = 7.08551

VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY

NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS

ELAG 0.65675 0.1216 5.402 0.000 0.664 0.6640 -0.3159

CONSTANT 0.95726E-02 0.3317E-01 0.2886 0.775 0.047 0.0000 1.3159

gen1 LM=$n*$r2

..NOTE..CURRENT VALUE OF $N = 39.000

..NOTE..CURRENT VALUE OF $R2 = 0.44096

distrib lm / type=chi df=1

CHI-SQUARE PARAMETERS- DF= 1.0000

MEAN= 1.0000 VARIANCE= 2.0000 MODE= 0.0000

DATA PDF CDF 1-CDF

LM 17.197 0.17734E-04 0.99997 0.33689E-04

Page 71: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test LM de autocorrelación de orden

superior

El test LM de autocorrelación de orden superior generaliza el de orden 1. El modelo es como el del test de Wald de orden superior y sus hipótesis son similares, es decir

H0: m=0, lo que significa incorrelación de orden m

H1: m , lo que significa que existe autocorrelación lineal de orden m

El método de cálculo es una generalización del de orden 1, portanto primero se debe hacer una regresión de los residuos sobrelos residuos retardados de orden m y luego se debe tomar elestadístico LM=TR2 de forma similar a como se vio en el casoanterior. Seguirá asintóticamente una con 1 grado de libertad.

La regla de decisión será rechazar la hipótesis nula si

En la práctica se utiliza la raíz cuadrada de LM y se compara conuna normal, pero el estadístico no indica el signo de la relación.

2LM

Page 72: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Salida del Diagnos

LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL

LAG RHO LM-STAT

1 0.6521 4.3099

2 0.3960 2.5414

3 0.2816 1.8931

4 0.2438 1.7124

5 0.1434 1.1343

6 0.0655 0.5215

7 -0.1958 1.6507

8 -0.3726 3.1299

9 -0.3150 2.8827

10 -0.2053 1.8885

11 -0.1736 1.5125

12 -0.2099 1.8986

Se rechaza

autocorrelación nula

Page 73: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Tests conjuntos de autocorrelación

Contrastan si existe autocorrelación de orden 1 hasta m conjuntamente. Por consiguiente el modelo que se contrasta ahora es diferente de los anteriores. Ahora se debe considerar que existe mas de un retardo por consiguiente tendremos que

Ahora las hipótesis que se contrastan son:

H0: 1= = m=0, lo que significa incorrelación de orden 1 hasta el m

H1: j para algún j =1…m, lo que significa que existe autocorrelación lineal de algún orden entre 1 y m

Estudiaremos dos tipos de test que son dos versiones del mismo Test de Box-Pierce Test de Ljung-Box-Pierce

1 1

2(0, )

t t t

t t m t m t

Y X

sigue N I

Page 74: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Box-Pierce

Como ambos son versiones del mismo test estudiamos el test de Box-Pierce y únicamente indicaremos en el otro caso el estadístico correspondiente.

La idea de ambos test consiste en comprobar si conjuntamente los estimadores de las autocorrelaciones de orden 1 hasta el m son todos nulos o no. Para ello, calculamos los coeficientes de autocorrelación hasta el orden m.

Definimos como estadístico la suma de las m correlaciones primeras al cuadrado por el número de observaciones

Como vimos que cada autocorrelación seguía asintóticamente una N(0,1) dicho estadístico seguirá asintóticamente una ji cuadrado con m grados de libertad.

Por tanto la regla de decisión será rechazar si BP> 2

T

i

i

T

ki

kiik eeer1

2

1

m

k

krTBP1

2

Page 75: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de Ljung-Box

Corrige en parte el anterior para muestras pequeñas y sigue la misma ley de distribución asintótica. El estadístico es

Que también sigue asintóticamente una ji cuadrado con m grados de libertad

Por tanto la regla de decisión será como antes rechazamos la hipótesis nula si Q> 2

2

1

2

)2( m

m

k

k AkT

rTTQ

Page 76: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Test de autocorrelación para telas

RESIDUAL CORRELOGRAM

LM-TEST FOR HJ:RHO(J)=0, STATISTIC IS STANDARD NORMAL

LAG RHO STD ERR T-STAT LM-STAT DW-TEST BOX-PIERCE-LJUNG

1 0.6521 0.1581 4.1244 4.3099 0.6618 18.3190

2 0.3960 0.1581 2.5042 2.5414 1.1691 25.2503

3 0.2816 0.1581 1.7810 1.8931 1.3301 28.8508

4 0.2438 0.1581 1.5418 1.7124 1.3111 31.6241

5 0.1434 0.1581 0.9072 1.1343 1.4335 32.6116

6 0.0655 0.1581 0.4142 0.5215 1.5263 32.8235

7 -0.1958 0.1581 -1.2385 1.6507 1.9222 34.7757

8 -0.3726 0.1581 -2.3565 3.1299 2.2586 42.0640

9 -0.3150 0.1581 -1.9923 2.8827 2.1377 47.4418

10 -0.2053 0.1581 -1.2985 1.8885 1.8985 49.8024

11 -0.1736 0.1581 -1.0978 1.5125 1.8118 51.5479

12 -0.2099 0.1581 -1.3277 1.8986 1.8333 54.1922

LM CHI-SQUARE STATISTIC WITH 12 D.F. IS 45.536

Page 77: Diagnosis de Modelos de regresión serialmente correladoscjardon.webs.uvigo.es/Transparencias/Unidad5.pdf · diferentes que corresponden a la heterocedasticidad. Por consiguiente

Universidadede Vigo

Universidadede Vigo

Tratamiento de la autocorrelación

El proceso que seguiremos se denomina de mínimos cuadrados generalizados factibles (MCGF)

Primero se ve cual es el modelo teórico de estimación, generalizando MCO, al caso de matrices de covarianzas no escalares

Después se estudia la estimación factible

Este proceso necesita que analicemos previamente las características de la estimación por mínimos cuadrados generalizados, al que dedicamos el tema siguiente.