Download - Econometria II

Transcript
Page 1: Econometria II

Notas de Econometría II

Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

1

Notas de Econometría II

Autores:

Dr. Antonio Caparrós Ruiz*

Dr. Oscar D. Marcenaro Gutierrez**

Profesores Titulares de Universidad

Departamento de Economía Aplicada (Estadística y Econometría, 15)

Facultad de Ciencias Económicas y Empresariales

El Ejido, 6

Universidad de Málaga

Email*: [email protected]

Email**: [email protected]

Tfno*: 952 131163

Tfno**: 952137003

Page 2: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

2

Índice Tema 1. Análisis clásico de series temporales .

1.1. Introducción. 1.2. Componentes de una serie temporal. Descomposición. 1.3. Componente estacional. 1.4. Componente tendencia-ciclo. 1.5. Predicción.

Tema 2. Modelos de Alisado Exponencial (M.A.E.)

2.1. Introducción. 2.2. Tipos de modelos.

2.2.1. M.A.E. simple. 2.2.2. M.A.E. doble. 2.2.3. M. de Holt-Winters (H-W) sin estacionalidad. 2.2.4. M.H-W con estacionalidad.

Tema 3. Modelos estocásticos de series temporales .

3.1. Introducción. 3.2. M. estacionarios lineales: ARMA (p,q). 3.3. M. no estacionarios: ARIMA (p,d,q) y modelos estacionales.

Tema 4. Análisis Box-Jenkins.

4.1. Introducción. 4.2. Identificación. 4.3. Estimación 4.4. Validación 4.5. Predicción

Tema 5: Introducción a los Modelos Dinámicos.

5.1. Introducción. 5.2. Causas que generan retardos en el comportamiento económico. 5.3. Modelo dinámico general. Modelo de retardos distribuidos (MRD). 5.4. Características de los modelos dinámicos.

• Multiplicadores. • Condición de estabilidad. • Tipos de trayectoria. • Condición de monotonía. • Retardo medio y Retardo Mediano.

Tema 6: Especificación y Estimación de MRD.

6.1. Introducción. 6.2. Especificación y estimación de MRD finitos:

6.2.1. Sin restricciones. 6.2.2. Con restricciones.

6.2.2.1. Ponderaciones. 6.2.2.2. Polinomios.

6.3. Especificación y estimación de MRD infinitos. 6.3.1. Retardo geométrico (Koyck). 6.3.2. Retardo racional general (Jorgenson).

Page 3: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

3

6.4. Justificación teórica de los MRD. 6.4.1. Modelo con rigideces. Hipótesis de Ajuste Parcial (HAP). 6.4.2. Modelo con incertidumbre. Hipótesis de Expectativas Adaptativas

(HEA). 6.5. Estimación de MDA.

Tema 7: Modelos multiecuacionales.

7.1. Introducción. 7.2. Sistemas de ecuaciones no simultáneas: Modelos recursivos y SURE. 7.3. Modelos de ecuaciones simultáneas.

7.3.1. Identificación (condiciones orden y rango). 7.3.2. Estimación y validación. 7.3.3. Simulación y predicción.

Apéndice A. Alfabeto griego. Nota sobre el multiplicador de Haavelmo.

Page 4: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

4

PREFACIO Es importante recordar la creciente importancia de la econometría como disciplina dentro de la economía. De hecho la necesidad de cuantificar y evaluar las teorías e hipótesis económicas se han convertido en una piedra angular de la economía, que cobra aún más relevancia en tiempos convulsos para la economía como los actuales.

En los temas que siguen ampliaremos nuestro campo de visión respecto a la modelización de la economía y la administración de empresas, al tener en cuenta un aspecto esencial de esta disciplina científica: el carácter dinámico del comportamiento de los agentes económicos. Aquí, como en cualquier otro ámbito de la investigación econométrica aplicada habrá que seguir una serie de pasos para dotar a nuestras investigaciones del suficiente rigor. Sirva como recordatorio el siguiente esquema, en el que se resumen esas etapas fundamentales del análisis econométrico aplicado:

Cuadro 1.1. Etapas del análisis econométrico aplicado.

Fuente: Maddala (2001).

En un contexto de análisis de series temporales es importante hacer, en primer lugar, una breve reseña histórica que nos permita ubicarnos con mayor facilidad en las diferentes aproximaciones que se han abordado ante el problema de análisis de series temporales. En estos procedimientos metodológicos se pueden sintetizar en tres:

a) El análisis clásico de series temporales (extendido en la década de 1920) se basa en descomponer la serie temporal en cuatro componentes: tendencia, ciclo, movimiento estacional y movimiento irregular. Este procedimiento pretende acotar cada uno de estos componentes

Teoría Económica

Modelo Econométrico

Test correcta especificación modelo

¿Es el modelo adecuado?

Datos

Contrastes de hipótesis

Utilización del modelo para tareas predictivas

Sí No

Estimación

Page 5: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

5

para, posteriormente, utilizarlo en la determinación de la evolución futura de la variable. Este procedimiento implica un enfoque determinista. Con el enfoque adoptado en el análisis clásico se pueden obtener predicciones de los valores de la variable a partir del pasado de la misma, sin recurrir a la información de otras variables (como hace el análisis causal) para obtener las predicciones.

Con posterioridad se desarrolló la concepción estocástica de las series temporales, que se basa en la teoría de los procesos estocásticos. Dentro de esta concepción podemos distinguir a su vez dos procedimientos para abordar el análisis de series temporales, el enfoque Box-Jenkins y el análisis causal.

b) El enfoque Box-Jenkins implica que es un proceso estocástico el que genera la evolución de

una serie temporal, y por tanto la cuestión esencial es determinar el proceso generador (modelo ARIMA) de la serie temporal, que se basará en lo que los propios datos observados para la serie temporal nos indiquen. En síntesis se trata de explicar el comportamiento de una variable en el futuro (fin predictivo) a partir de cómo han evolucionado los valores de esa variable en los periodos anteriores. En este contexto una serie temporal es una realización de un proceso estocástico.

c) El análisis causal, también llamado enfoque estructural, que explica el comportamiento de una variable a partir de las variaciones en otras (variables causales) más un término de perturbación aleatoria. Así la evolución futura de la variable explicada vendrá determinada por los valores en el futuro de las variables explicativas (causales). Este será el enfoque que abordaremos a lo largo de la última parte de la asignatura (modelos de retardos distribuidos y modelos dinámicos autoregresivos).

Page 6: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

6

Tema 1. Análisis clásico de series temporales.

1.1 Introducción.

La asignatura precedente de Econometría, Econometría I, se ha ubicado en el campo de la Econometría causal, es decir, una variable dependiente es explicada y predicha por su relación con k variables explicativas:

Yt = β1 + β2*X2t + ...+ βk*Xkt + ut

Este tipo de análisis conlleva una serie de problemas:

1) La necesidad de una teoría que justifique las posibles variables explicativas que se han de introducir en el modelo.

2) Las predicciones de la variable Y se basan en predicciones de las X’s. Por estas razones surge el análisis clásico de series temporales que permite realizar predicciones

de la variable con la única información procedente del pasado de la misma.

1.2 Componentes de una serie temporal.

Una serie temporal puede descomponerse en las siguientes cuatro componentes: a) Tendencia de larga duración o secular (Tt):

Recoge el movimiento de la variable a largo plazo, que puede ser debido a cambios demográficos, tecnológicos o institucionales.

Ejemplos de variables con tendencia. 1) Paro registrado en España (nº personas).

Fuente: INE. 2) Edad media a la maternidad (años).

Fuente: INE.

Paro registrado

0500000

100000015000002000000250000030000003500000400000045000005000000

19

96

M0

1

19

97

M0

5

19

98

M0

9

20

00

M0

1

20

01

M0

5

20

02

M0

9

20

04

M0

1

20

05

M0

5

20

06

M0

9

20

08

M0

1

20

09

M0

5

20

10

M0

9

20

12

M0

1

Edad media a la maternidad

26

27

28

29

30

31

32

19

75

19

77

19

79

19

81

19

83

19

85

19

87

19

89

19

91

19

93

19

95

19

97

19

99

20

01

20

03

20

05

20

07

20

09

Page 7: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

7

3) Tasa de mortalidad infantil posneonatal. (nº defunciones por cada mil nacidos).

Fuente: INE.

Ejemplo de variable sin tendencia. Temperatura media en Málaga en el mes de septiembre (grados centigrados).

Fuente: INE.

b) Movimiento oscilatorio o cíclico:(Ct) Recoge las fluctuaciones originadas por el ciclo económico, que pueden durar entre 4 y 8 años.

Ejemplo: Variaciones intertrimestrales del PIB a precios de mercado (Indice de volúmenes encadenados).

Fuente: INE.

b) Fluctuaciones estacionales (Et):

Son movimientos que se presentan con una periodicidad inferior al año (mes, trimestre, cuatrimestre,...), suelen ser repetitivos y muestran el efecto de la climatología, la estructura productiva o festividades.

Tasa de mortalidad infantil postneonatal

0

1

2

3

4

5

6

7

19

75

19

77

19

79

19

81

19

83

19

85

19

87

19

89

19

91

19

93

19

95

19

97

19

99

20

01

20

03

20

05

20

07

20

09

Temperatura media en Málaga en septiembre

22

22.5

23

23.5

24

24.5

25

19

97

19

98

19

99

20

00

20

01

20

02

20

03

20

04

20

05

20

06

20

07

20

08

20

09

20

10

Variaciones interanuales (%) del PIB a precios de mercado (índices de volumen encadenados)

-20

-15

-10

-5

0

5

10

2001TI 2002TIII 2004TI 2005TIII 2007TI 2008TIII 2010TI 2011TIII

Page 8: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

8

Ejemplo: Indice del comercio al por menor.

Fuente: INE.

d) Variaciones irregulares (It):

Muestra aquellos factores asociados al muy corto plazo y que quedan fuera del control del analista. Dentro de este componente también denominado residual, se encuentran factores inusuales, pero fácilmente reconocibles como una catástrofe natural.

Ejemplo. Licitación oficial de las Administración Públicas (millones de euros).

Fuente: INE.

Indice de ventas del comercio minorista

0

20

40

60

80

100

120

140

2003M01 2004M07 2006M01 2007M07 2009M01 2010M07 2012M01

Licitación oficial de las Administraciones Pública s

0

1000

2000

3000

4000

5000

6000

7000

1995M01 1999M03 2003M05 2007M07 2011M09

Page 9: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

9

Ejemplo de descomposición de una serie en componentes:

Dado que los componentes de una serie no se observan aisladamente, se necesita aplicar hipótesis

que representen el proceso generador de los datos:

1) Hipótesis aditiva: Yt = Tt + Ct + Et + It

2) Hipótesis multiplicativa: Yt = Tt * Ct * Et * It 3) Hipótesis mixta: Yt = Tt * Ct * Et + It

A nivel práctico hay que elegir entre uno u otro esquema. Hay que considerar que en la hipótesis

aditiva los cuatro componentes son independientes, por ejemplo, la existencia de tendencia no condiciona el efecto de la estacionalidad; mientras que en la hipótesis multiplicativa, los elementos están interrelacionados entre sí. Para concretar si la serie temporal sigue un esquema aditivo o uno multiplicativo, por ejemplo se puede analizar la amplitud del ciclo anual (componentes de la serie estacional). Si ésta aumenta a medida que lo hace la tendencia (las ondas se agrandan), el modelo es multiplicativo. Si permanece constante es aditivo.

1,600,000

2,000,000

2,400,000

2,800,000

3,200,000

3,600,000

4,000,000

4,400,000

4,800,000

1996 1998 2000 2002 2004 2006 2008 2010 2012

PARO

1,500,000

2,000,000

2,500,000

3,000,000

3,500,000

4,000,000

4,500,000

5,000,000

1996 1998 2000 2002 2004 2006 2008 2010 2012

TENDENCIA

-400,000

-200,000

0

200,000

400,000

1996 1998 2000 2002 2004 2006 2008 2010 2012

CICLO

-200,000

-100,000

0

100,000

200,000

1996 1998 2000 2002 2004 2006 2008 2010 2012

ESTACIONALIDAD

-60,000

-40,000

-20,000

0

20,000

40,000

60,000

80,000

1996 1998 2000 2002 2004 2006 2008 2010 2012

IRREGULAR

Page 10: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

10

Ejemplo:

1. 3. Componente estacional: Desestacionalización.

En este epígrafe analizamos, en primer lugar, cómo conocer mediante el uso de tasas de variación la evolución de una variable a medio y largo plazo. En segundo lugar, se presenta una serie de técnicas que permiten desestacionalizar una serie y extraer el componente estacional de la misma. 1.3.1 Evolución a medio y largo plazo de la variable. Si el objetivo es conocer la evolución de la serie sin estacionalidad, es decir, su evolución a medio y a largo plazo, es necesario obtener su tasa de variación interanual. Así, por ejemplo, bajo una hipótesis multiplicativa y con datos trimestrales (Yt = Tt * Ct * Et * It), la tasa interanual se obtendría de la siguiente forma:

T14 = [(Yt – Yt-4) / Yt-4] *100= [(( Tt * Ct * Et * It)- ( Tt-4 * Ct-4 * Et-4 * It-4))/ ( Tt-4 * Ct-4 * Et-4 * It-4))*100]

Si se supone estacionalidad estable Et = Et-4, entonces:

200

400

600

800

1,000

1,200

1,400

1,600

96 98 00 02 04 06 08 10

Serie1_Hipótesis aditiva

400

600

800

1,000

1,200

1,400

1,600

96 98 00 02 04 06 08 10

SERIE2_Hipótesis multiplicativa

Page 11: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

11

T14 = [(Yt – Yt-4) / Yt-4] *100=[(( Tt * Ct * It)- ( Tt-4 * Ct-4 * It-4))/ ( Tt-4 * Ct-4 * It-4))*100]

Con esta tasa el efecto estacional queda excluido. Ejemplo:

Tasas de variación del Indice de pedidos en la industria (2012M1-2012M6)

Tasa de variación Tasa de variación intertrimestral interanual 2012M01 3.97 0.12 2012M02 0.32 -0.15 2012M03 10.77 -3.91 2012M04 -13.15 -4.21 2012M05 8.41 -3.84 2012M06 1.70 -1.67

1.3.2 Desestacionalización.

En este subepígrafe se presentan diversos métodos para extraer el componente estacional de una variable. a) Método de la razón a la media móvil.

Con este método se obtienen unos coeficientes que sintetizan en un único valor la estacionalidad para cada periodo temporal. Y a partir de ahí, poder obtener la serie desestacionalizada, es decir, la serie sin el componente estacional.

El método parte de suponer que se cumple lo siguiente:

a) La serie ha sido generada bajo una hipótesis multiplicativa:

Yt = Tt * Ct * Et * It

b) La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4 o Et=Et-12, con datos trimestrales y mensuales, respectivamente. c) La tendencia y el ciclo se obtienen de forma conjunta.

Indice de pedidos en la industria

0

2040

6080

100

120140

2002

M01

2002

M11

2003

M09

2004

M07

2005

M05

2006

M03

2007

M01

2007

M11

2008

M09

2009

M07

2010

M05

2011

M03

2012

M01

Page 12: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

12

El objetivo del método es obtener una estimación de Et. Concretamente, el procedimiento consta de las siguientes pasos: 1) Dada una serie Yt se estima el componente tendencia-ciclo a través de la serie de medias móviles centradas:

MMct=Tt*Ct=

++++++++++

−−++

−−++

mensualesdatosconYYYYY

estrimestraldatosconYYYYY

ttttt

ttttt

,12/)*5.0......*5.0(

,4/)*5.0*5.0(

6116

2112

2) Se obtiene el componente estacional e irregular (Et*It). Para ello se divide la serie original por MMct :

Et*It= Yt / MMct

A esta serie de valores se les denominan índices específicos o brutos de variación estacional y constituyen una primera aproximación del componente estacional. 3) Primera estimación del componente estacional: E’j .

La diferencia entre los índices estacionales es debida a los factores irregulares. Estos se eliminan tomando la media aritmética para cada una de las "m" fracciones del año (m es cuatro con datos trimestrales y 12 para datos anuales). 4) Normalización de los coeficientes: E’j.

La estacionalidad media en un esquema multiplicativo corresponde a Et=1. Por ello, para lograr que los índices estacionales tengan como media 1, éstos han de ser normalizados. Como resultado se obtienen los índices generales de variación estacional (IGVE):

IGVEj = m

m

j

EEE

E

''2

'1

'

*...**, j=1,...,m

La serie desestacionalizada se obtendría de la siguiente forma: Ydt,j= Yt,j / IGVEj.

5) Los IGVEj fluctúan por debajo y por encima de 1.

Ejemplo con la serie “índice de pedidos en la industria”:

Page 13: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

13

Sample: 2002M01 2012M06 Included observations: 126 Ratio to Moving Average Original Series: PEDIDOS Adjusted Series: PEDIDOSSA

Scaling Factors: 1 0.985893

2 0.976118 3 1.076340 4 1.005896 5 1.040415 6 1.049747 7 1.063365 8 0.772776 9 1.045012 10 1.049583 11 1.021198 12 0.954751

• Interpretación de los IGVE: 1) (IGVEmarzo-1)*100 = (1.076-1)*100= 7.6%

La estacionalidad del mes de marzo provoca que el índice de pedidos en la industria crezca un 7.6% por encima de su valor medio anual. 2) (IGVEagosto-1)*100 = (0.77-1)*100= -23%

La estacionalidad del mes de agosto provoca que el índice de pedidos en la industria caiga un 23% por debajo de su valor medio anual. b) Método de la diferencia a la media móvil:

La hipótesis que subyacen tras este método son las siguientes: * La serie ha sido generada bajo una hipótesis aditiva:

60

80

100

120

140

0.7

0.8

0.9

1.0

1.1

02 03 04 05 06 07 08 09 10 11 12

PEDIDOS PEDIDOSSA IGVE

Page 14: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

14

Yt = Tt + Ct + Et + It

* La estacionalidad es estable, no varía para mismo periodos de diferentes años: Et=Et-4 (t es un trimestre) o Et=Et-12 (t es un mes). * La tendencia y el ciclo se obtienen de forma conjunta.

El procedimiento consta de los siguientes pasos:

1) Estimación del componente tendencia-ciclo a través de la serie de medias móviles centradas: MMct = Tt + Ct+ Et + It

++++++++++

−−++

−−++

mensualesdatosconYYYYY

estrimestraldatosconYYYYY

ttttt

ttttt

,12/)*5.0......*5.0(

,4/)*5.0*5.0(

6116

2112

2) Primera estimación del componente estacional e irregular (Et+It). Para ello se resta la MMct a la serie original, Yt,:

Et+It= Yt - MMct

A esta serie de valores se les denominan índices específicos o brutos de variación estacional y

constituyen una primera aproximación del componente estacional.

3) Primera estimación del componente estacional: E’j. Bajo la hipótesis de estacionalidad estable, la diferencia entre los índices específicos o brutos de

variación estacional es debida a los factores irregulares. Estos se eliminan tomando la media aritmética para cada una de las fracciones del año. 3) Posteriormente se normalizan los coeficientes E’j, para que la media de todos los índices valga 0 (valor correspondiente a la ausencia de estacionalidad bajo una hipótesis aditiva), obteniéndose los IGVEj=

∑=

−m

jjj mEE

1

'' /

Por ejemplo, si los datos son trimestrales:

IGVE1= E’1 - ∑=

4

1

' 4/j

jE ; IGVE2= E’2 - ∑=

4

1

' 4/j

jE ; IGVE3= E’3 - ∑=

4

1

' 4/j

jE ; IGVE4= E’4 - ∑=

4

1

' 4/j

jE

4) La serie desestacionalizada se obtendría de la siguiente forma: Ydt,j= Yt,j- IGVEj.

5) Los IGVEj con la hipótesis aditiva fluctúan por encima y por debajo de 0.

Ejemplo con la serie “índice de pedidos en la industria”:

Page 15: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

15

Sample: 2002M01 2012M06 Included observations: 126 Difference from Moving Average Original Series: PEDIDOS Adjusted Series: PEDIDOSSA

Scaling Factors: 1 -1.585038

2 -2.635843 3 7.158018 4 0.194009 5 3.770388 6 4.493587 7 5.706653 8 -22.41911 9 3.910828 10 4.366078 11 1.893486 12 -4.853052

• Interpretación de los IGVE:

IGVEmarzo= 7.15, en el mes de marzo la estacionalidad provoca un aumento del índice de pedidos de 7.15 puntos con respecto a su valor medio anual. IGVEagosto= -22.41, en el mes de agosto la estacionalidad provoca una caída del índice de pedidos de 23 puntos con respecto a su valor medio anual. c) Método X11.

Este método, al contrario que los dos anteriores, supone que el componente estacional varía de forma estocástica a lo largo del tiempo. Se puede aplicar tanto con una hipótesis aditiva como multiplicativa. En este caso, el procedimiento de obtención del componente estacional no es tan sencillo, desde un punto de vista algebraico, como en los dos casos anteriores. Por este motivo, sólo nos limitamos a señalar con el ejemplo que se presenta a continuación como se aplicaría dicho método con el programa EVIEWS 7.0.

-40

-20

0

20

40

60

80

100

120

140

02 03 04 05 06 07 08 09 10 11 12

PEDIDOS PEDIDOSSA IGVE

Page 16: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

16

Ejemplo con la serie “índice de pedidos en la industria”: • X11-Multiplicativo:

• X11. Aditivo:

60

80

100

120

140

70

80

90

100

110

02 03 04 05 06 07 08 09 10 11 12

PEDIDOS PEDIDOSSA FACTORS

-40

-20

0

20

40

60

80

100

120

140

02 03 04 05 06 07 08 09 10 11 12

PEDIDOS PEDIDOSSA FACTORS

Page 17: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

17

1.4. Componente de tendencia-ciclo

En este epígrafe se diferencian dos subepígrafes donde se muestra cómo tratar y obtener los compenentes de tendencia y ciclo, respectivamente. 1.4.1. Componente tendencia

Un mecanismo para captar el componente de tendencia de una variable es mediante el análisis de regresión. En particular, se considera un modelo que relacione a la variable Ydt (variable desestacionalizada) con el tiempo (si los datos son anuales, Ydt = Yt ):

Ydt = f(t) + ut

A continuación se presentan diversas especificaciones para f(t):

a) Función lineal: Ydt = β1 + β2 t + ut, la variable t se puede construir dándole 1 al primer periodo, 2 al segundo, y así sucesivamente. Gráficamente, correspondería a series de este tipo:

β2: Mide la variación absoluta que por término medio experimenta la variable Ydt al transcurrir un periodo, ya que:

E(Yt-1) = β1 + β2 (t-1) E(Yt) = β1 + β2 t E(Yt) - E(Yt-1) = β2

• Predicción Para obtener predicciones de la variables Yt, sólo se considera el componente de tendencia y el de

estacionalidad. Por ello, en primer lugar, se predice el valor desestacionalizado tras estimar el modelo de tendencia y, en segundo lugar, se incorpora el componente estacional. Ejemplo: Periodo t Ydt IGVEj

. 2012.09 2012.10 2012.11

. 15 16 17

. Yd2012.09

Yd2012.10

Yd2012.11

. IGVE9

IGVE10

IGVE11

70

80

90

100

110

120

130

I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV

2002 2003 2004 2005 2006 2007

Fuente: Elaboración propia a partir de datos del INE.

Indice de pedidos en la industria (desestacionalizado)

Page 18: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

18

Predicción para 2012:12 de Yt: - Hipótesis multiplicativa:

1212.2012

^

12.2012

^* IGVEYY

d

=

donde: 182

^

1

^

12:2012

^

ββ +=d

Y

- Hipótesis aditiva:

1212.2012

^

12.2012

^IGVEYY

d

+=

b) Función polinómica:

La expresión general es:

Ydt = β1 + β2 t + β3 t2+ ...+ βp+1 tp + ut En la práctica uno de los valores para p más usuales es p=2, con lo que la expresión resultante

es:

Ydt = β1 + β2 t + β3 t2+ ut Este tipo de función es apropiada para la representación gráfica de una serie que presenta una

tendencia curva, con una variación (crecimiento o decrecimiento), que no es constante sino que es función del periodo considerado, por ejemplo:

Si se supone el modelo ya está estimado, se observa como la variación de la variable con el tiempo no es constante:

23

^

2

^

1

^^

ttY t

d

βββ ++=

76

80

84

88

92

96

100

104

108

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

Fuente: Elaboración propia a partir de datos del INE.

Indice de ventas del comercio minorista (desestacionalizado)

Page 19: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

19

tt

Yt3

^

2

^^

ββ +=∂

• Predicción: Haciendo uso del ejemplo anterior:

- Hipótesis multiplicativa:

1212:2012

^

12:2012

^* IGVEYY

d

=

donde 23

^

2

^

1

^

12:2012

^

1818 βββ ++=d

Y

- Hipótesis aditiva:

1212.2012

^

12.2012

^IGVEYY

d

+= c) Función exponencial:

En ocasiones, el crecimiento de la variable no es moderado si no que parece seguir una ley exponencial, con un ritmo de variación de fuerte crecimiento o caída. En este caso la función que se propone es: Ydt = e(β1 + β2t +ut)

El siguiente gráfico es un ejemplo de este tipo de modelo:

Para estimar el modelo es necesario linealizarlo:

ln Ydt = β1 + β2 t + ut

Interpretación de ^

2β :

100*100*^

2^

^

β=∂

d

dt

tY

Y

^

2β * 100 es la variación en términos porcentuales que se produce en la variable dependiente cuando transcurre un periodo temporal. Para recuperar los valores ajustados de la variable original:

)

2(^

2

2

^

1

^

T

etd

t

t

eY∑

++=

ββ

1,600,000

2,000,000

2,400,000

2,800,000

3,200,000

3,600,000

4,000,000

II III IV I II III IV I II III IV

2007 2008 2009

Fuente: Elaboración propia a partir de datos del INE.

Paro registrado

Page 20: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

20

Ejemplo: Precio del barril Brendt (2002.01-2007.11) en dólares.

Dependent Variable: LNBARRISA Method: Least Squares Sample: 2002M01 2007M11 Included observations: 71

Variable Coefficient Std. Error t-Statistic Prob. C 3.149329 0.028046 112.2913 0.0000

T 0.018201 0.000677 26.88314 0.0000 R-squared 0.912846 Mean dependent var 3.804561

Adjusted R-squared 0.911583 S.D. dependent var 0.393187 S.E. of regression 0.116914 Akaike info criterion -1.426989 Sum squared resid 0.943155 Schwarz criterion -1.363252 Log likelihood 52.65812 F-statistic 722.7032

* Realizar una predicción para diciembre del 2007, sabiendo que t es igual a 1 en 2002.1, y que el IGVE12= 0.957

$27.83957.0** )142/943155.072*018201.0149.3(1212.2007

^

12.2007

^=== ++eIGVEYY d

* Interpretación de ^

2β * 100:

Al transcurrir un periodo la variable “Precio del barril de petróleo desestacionalizada” aumenta por término medio en un 1,82%.

1.4.2. Componente cíclico: Filtro de Holdrick-Prescott

A partir de este procedimiento se desea obtener el componente cíclico de la variable. Para aplicar este filtro la variable ha de estar desestacionalizada. Se supone una hipótesis aditiva: Ydt = Tt + Ct+ It, t= 1,...,T. A partir de estas consideraciones, se desea obtener la serie suavizada, que en este caso, sería la tendencia Tt. Para ello habría que minimizar la siguiente función:

]))()(([)([ 2

211

2

1∑∑

=−+

=

−−−+−T

ttttttt

dT

tTt

TTTTTYMin λ

10

20

30

40

50

60

70

80

90

100

2002 2003 2004 2005 2006 2007

BARRIL

Page 21: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

21

tras minimizar la función se obtiene un vector de dimensión 1xT que recoge el componente tendencia: T1, T2,..., TT. λ es un parámetro que penaliza la variabilidad del componente tendencia, los autores del método proponen los siguientes valores:

λ= 100 con datos anuales λ= 1600 con datos trimestrales λ= 14400 con datos mensuales.

Una primera aproximación al componente cíclico sería: C’t = Ydt - Tt; no obstante, en C’t está

incluido el componente irregular, así pues, para conseguir la verdadera estimación de Ct hay que volver a aplicar el filtro de Holdrick-Prescott a C’t para obtener, nuevamente, una serie suavizada que sería Ct:

]))()(([)([ 2

211

2'

1∑∑

=−+

=

−−−+−T

ttttttt

T

tCt

CCCCCCMin λ

donde Ct es el componente cíclico. Ejemplo: Proc/Holdrick-Prescott filter: Serie “Paro registrado” (1996M1-2012M01)

-400,000

-200,000

0

200,000

400,000

600,000

1,000,000

2,000,000

3,000,000

4,000,000

5,000,000

96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12

PARO Trend Cycle

Hodrick-Prescott Filter (lambda=14400)

Page 22: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

22

1.5. Predicción.

Antes de analizar la predicción es necesario que se hagan explícitos los siguientes supuestos: a) Se considera que existe una cierta estabilidad en el fenómeno.

Ejemplo: Serie no estable: Nº de terremotos en España en el mes de abril. Fuente: INE.

-400,000

-200,000

0

200,000

400,000

-400,000

-200,000

0

200,000

400,000

600,000

96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12

CICLO1 Ciclo Irregular

Hodrick-Prescott Filter (lambda=14400)

Nº de terremos en el mes de Abril

0

100

200

300

400

500

1985

1987

1989

1991

1993

1995

1997

1999

2001

2003

2005

2007

2009

Page 23: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

23

b) Los datos han de ser homogéneos en el tiempo, es decir, se ha de mantener la definición y los procedimientos de medición de la magnitud objeto de estudio.

Ejemplo: La Encuesta de Ocupación Hotelera sustituyó desde enero del 1999 a la Encuesta de Movimiento de Viajeros en Establecimientos Hoteleros, ampliando la investigación a la categoría de una estrella y similares.

Si la variable que se investiga es Yt, el conjunto de información disponible es: Y1, Y2, ..., YT

La predicción puede ser de tres tipos:

a) Interim: ^

1,Y ...,,^

2Y^

.TY

b) Ex-post: ...1

^

+TY

c) Ex-ante: 0

^Y , 1

^

−Y , 2

^

−Y ,... Al error de predicción se le denomina:

et = tY^

- Yt. Y el porcentaje del error de predicción se define como:

% Error de predicción= ( tY^

- Yt/ Yt) *100

• Medidas para valorar la capacidad predictiva de los modelos:

1) Error absoluto medio: EAM

EAM = T

YYT

ttt∑

=

−1

^

, en el interior de la muestra.

EAM = M

YYM

m

mm∑=

−1

^

, fuera de la muestra.

2) Porcentaje de error absoluto medio: PEAM

PEAM = T

YYYT

tttt∑

=

−1

^/)(

, en el interior de la muestra.

PEAM = M

YYYM

m

mmm∑=

−1

^/)(

, fuera de la muestra.

3) Error cuadrático medio: ECM

Page 24: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

24

ECM = T

YYt tt∑ − 2

^

)(, en el interior de la muestra.

ECM = M

YYm mm∑ − 2^

)( , fuera de la muestra.

4) Raíz del error cuadrático medio

RECM= ECM Cuanto más cercanas estén a cero todas las medidas anteriores mejor será la capacidad predictiva

del modelo. Las limitaciones de las medidas anteriores son que carecen de cota superior. Además los valores

que alcancen el EAM, el ECM y la RECM dependen de la unidad de medida de la variable y, por consiguiente, no son adecuados para realizar comparaciones al menos que vengan referidas las predicciones a la misma variable.

5) Coeficiente de desigualdad de Theil

T

Y

T

Y

T

YY

UT

t

t

T

t

t

T

t

tt

∑∑

==

=

+

=

1

2

1

2^

1

2^

)(

;

éste índice está acotado entre 0 y 1. Además es una medida adimensional. Otra forma de expresar el coeficiente de desigualdad de Theil es con su valor al cuadrado:

U2 =

2

1

2

1

2^

1

2^

)(

+

∑∑

==

=

T

Y

T

Y

T

YY

T

t

t

T

t

t

T

t

tt

El cuadrado del coeficiente de desigualdad de Theil, U2, permite ser descompuesto en tres componentes, que son denominados componente de sesgo, de varianza y de covarianza. En particular, la forma de la descomposición es la siguiente:

U2 = 2

1

2

1

2^

,

2

1

2

1

2^

2

2

1

2

1

2^

2^ )1(2)(

)(^^^

+

−+

+

−+

+

∑∑∑∑∑∑======

−−

T

Y

T

Y

rSS

T

Y

T

Y

SS

T

Y

T

Y

YY

T

t

t

T

t

t

yyyy

T

t

t

T

t

t

yy

T

t

t

T

t

t

=[ componente de sesgo +componente de varianza+ componente de covarianza].

Page 25: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

25

Los dos primeros componentes (componente de sesgo y de varianza) forman la parte sistemática; mientras que el componente de covarianza, la parte no sistemática, lo ideal es que el componente de varianza y sesgo sean lo más pequeños posibles. Ejemplo: Se ha estimado un modelo lineal para para la variable desestacionalizada del índice de ventas del comercio minorista:

Dependent Variable: INDICE_SA Method: Least Squares Sample: 2007M01 2012M05 Included observations: 65

Variable Coefficient Std. Error t-Statistic Prob.

C 123.4290 1.550832 79.58891 0.0000 T -0.369913 0.018548 -19.94332 0.0000

AR(1) 0.315413 0.119344 2.642888 0.0104

R-squared 0.932072 Mean dependent var 93.44975 Adjusted R-squared 0.929880 S.D. dependent var 7.247092 S.E. of regression 1.919039 Akaike info criterion 4.186581 Sum squared resid 228.3281 Schwarz criterion 4.286937 Log likelihood -133.0639 Hannan-Quinn criter. 4.226178 F-statistic 425.3625 Durbin-Watson stat 2.185324 Prob(F-statistic) 0.000000

Interpretación de la información:

• Root mean squared error: RECM. • Mean Absolute Error: EAM. • Porcentaje del error absoluto medio: PEAM. • Theil Inequality Coefficient: U. • Bias Proportion + Variance Proportion + Covariance proportion: 1.

70

80

90

100

110

120

130

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

INDICE_SAF ± 2 S.E.

Forecast: INDICE_SAFActual: INDICE_SAForecast sample: 2003M01 2012M05Adjusted sample: 2003M02 2012M05Included observations: 112Root Mean Squared Error 10.66962Mean Absolute Error 7.132881Mean Abs. Percent Error 7.311081Theil Inequality Coefficient 0.053690 Bias Proportion 0.342986 Variance Proportion 0.262880 Covariance Proportion 0.394134

Page 26: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

26

Tema 2. Modelos de alisado exponencial. 2.1. Introducción.

En el siguiente tema se muestran algunos métodos de predicción de series temporales que, al igual que el análisis clásico, se basan sólo en los valores pasados de la variable. Son métodos adecuados cuando hay pocas observaciones. 2.2. Tipos de modelos. 2.2.1 Alisado exponencial simple.

Este método se aplica a variables económicas con una media constante. Se supone que el modelo subyacente tras la variable es:

Yt = β1 + ut,

es decir, la variable fluctúa en torno a una constante y no presenta tendencia ni componente estacional. Si una variable Yt es sometida a un proceso de alisado exponencial simple, resulta una variable alisada St. Teóricamente, St se obtiene de la siguiente forma:

St = δ Yt + (1- δ) δ Yt-1 + (1- δ)2 δ Yt-2 +... donde 0<δ<1 es un parámetro que oscila en torno a 0,01 y 0,30. Si δ está cercano a 1, el método no es adecuado ya que nos indicaría que Yt tiene tendencia. St es una media aritmética ponderada de infinitos valores, ya que la suma de las ponderaciones es igual a 1: Σj (1- δ)j δ = δ /1-(1- δ) = 1 Dichas ponderaciones decaen de forma exponencial a través del tiempo.

Para calcular St se necesitan infinitos valores de la variable, lo cual no es factible. Por ello, se realiza la siguiente operación:

St = δ Yt + (1- δ) δ Yt-1 + (1- δ)2 δ Yt-1 +... (1- δ) St-1 = (1- δ)δ Yt-1 + (1- δ)2 δ Yt-2 + (1- δ)3 δ Yt-3 +...

St -(1- δ) St-1 = δ Yt St = δ Yt + (1- δ) St-1

Una vez obtenida la variable alisada St, las predicciones se obtienen de la siguiente forma: t

Yt

St

Predicción:

)1(^

tY 1 2 . . . T

T+1

Y1

Y2

.

.

.

YT

S1=δY1+(1-δ) S0

S2=δY2+(1-δ) S1

.

.

.

ST=δYT+(1-δ) ST-1

11

^)1( SY = . . .

TT SY =)1(^

Page 27: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

27

Si sólo existe información hasta T, entonces: TT SmY =)(^

.

Para iniciar el proceso es necesario asignar un valor a S0. El programa EVIEWS supone que S0 es igual a la media de las (T+1)/2 primeras observaciones de la variable Yt si T es un número impar, o a la media de las T/2 primeras observaciones de Yt si T es par. * Actualización de predicciones Si se observa el valor YT+1 es posible actualizar las predicciones, ya que ahora se puede calcular:

ST+1 = δ YT+1 + (1- δ) ST = )1(1^

+TY

)1(1^

+TY = )2(1^

+TY Ejemplo:

Con datos mensuales correspondientes a la variable tipo de interés de los descubiertos en cuenta corriente aplicados por las entidades de crédito para el periodo 2008:01-2008:11.

a) Obtenga predicciones para enero y febrero del 2009.

Alpha: δ = 0.1780 *Mean: S2008:11= 20.97048 Predicciones:

97048.20)2(11:2008

^=Tipo y 97048.20)3(11:2008

^=Tipo

20.76

20.80

20.84

20.88

20.92

20.96

21.00

21.04

2008M01 2008M04 2008M07 2008M10

TIPO

Sample: 2008M01 2008M11 Included observations: 11 Method: Single Exponential Original Series: TIPO Forecast Series: TIPOSM

Parameters: Alpha 0.1780 Sum of Squared Residuals 0.067904 Root Mean Squared Error 0.078569

End of Period Levels: Mean 20.97048

Page 28: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

28

b) Si en diciembre del 2008 el tipo de interés es del 20,47% actualice la predicción para el siguiente mes. S2008:12 = 0.1780 * Tipo2008:12 + (1-0.1780) * S2008:11= 20.88

88.20)1(12:2008

^=Tipo .

2.2.2. Alisado exponencial doble (Método de Brown).

En este caso se supone que la variable presenta tendencia lineal y carece de estacionalidad, es decir, el modelo teórico correspondiente es: Yt = β1 + β2 t + ut

y la ecuación de predicción es: )(^

mtY = at + bt * m donde: at = 2 St’ – St’’ bt = [δ/(1- δ)] (St’ – St’’) S’t=δYt+(1-δ) S’t-1 S’’t=δS’t+(1-δ) S’’t-1

El proceso de predicción es el siguiente: a) Con los datos correspondientes a la variable Y, se genera los valores correspondientes a S’t, S’’t, at y bt:

t Yt S’t S’’t at bt 1 2 . . . T

Y1 Y2

.

.

.

YT

S’1=δY1+(1-δ) S’0

S’2=δY2+(1-δ) S’1

.

.

.

S’T=δYT+(1-δ) S’T-1

S’’1=δ S’1+(1-δ) S’’0

S’’2=δ S’2+(1-δ) S’’1

.

.

.

S’’T=δ S’T+(1-δ) S’’T-1

a1=2 S1’ – S1’’ a2=2 S2’ – S2’’ . . . aT=2 ST’ – ST’’

b1= [δ/(1- δ)] (S1’ – S1’’) b2= [δ/(1- δ)] (S2’ – S2’’) . . . bT= [δ/(1- δ)] (ST’ – ST’’)

b) Posteriormente las predicciones de la variable Y con información hasta T, se obtendrían de la siguiente forma:

)1(^

TY = aT + bT *1; )2(^

TY = aT + bT *2;...; )(^

mY T = aT + bT *m

b) Si se observa el valor para Yt+1, se actualizarían las predicciones de la siguiente forma:

S’T+1= δYT+1+(1-δ) S’T

S’’T+1= δ S’T+1+(1-δ) S’’T

aT+1=2 S’T+1 – S’’T+1 bT+1= [δ/(1- δ)] (S’T+1 – S’’T+1)

)1(1

^

+TY = aT+1 + bT+1 *1; )2(1

^

+TY = aT+1 + bT+1 *2;...; )(1

^mY T + = aT+1 + bT+1 *m

Al inicio del proceso de predicciones es necesario nuevamente fijar unos valores iniciales de S’0

y S’’0. Las alternativas que se pueden seguir son las siguientes: a) S’0 = S’’0 = Y1

Page 29: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

29

b) S’0 = S’’0 =−Y

c) Estimar el modelo: Yt = β1 + β2 t + ut, y utilizar los parámetros estimados ^

1β y ^

2β , como a0 y b0, respectivamente. Ejemplo:

Sample: 1995 2009 Included observations: 15 Method: Double Exponential Original Series: CONSUMO Forecast Series: CONSUMSM

Parameters: Alpha 0.9990 Sum of Squared Residuals 4076.614 Root Mean Squared Error 16.48558

End of Period Levels: Mean 819.2061

Trend -14.92030

Obtenga predicciones del consumo para el periodo 2010-2011: Alpha: δ = 0.9990 Mean: a2009 = 819,2061 Trend: b2009 =-14,92030

1*20092009^

)1(2009^

2010 baConsumoConsumo +== = 804,2858 * 109 €

2*20092009^

)2(2009^

2011 baConsumoConsumo +== = 789,3655 * 109 € 2.2.3. Método de Holt-Winters sin estacionalidad.

Es un método aplicable a modelos del tipo: Yt = β1 + β2 t + ut

y la ecuación de predicción es: )(^

mY T = at + bt * m, donde: at = δ1Yt + (1- δ1) (at-1 + bt-1) bt = δ2 (at –at-1) + (1- δ2) bt-1 Los valores iniciales a0 y b0, se pueden obtener estimando por MCO:

Yt = β1 + β2 t + ut

Para actualizar las predicciones:

300

400

500

600

700

800

900

95 96 97 98 99 00 01 02 03 04 05 06 07 08 09

CONSUMO

Page 30: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

30

aT+1 = δ1YT+1 + (1- δ1) (aT + bT) bT+1 = δ2 (aT+1 –aT-1) + (1- δ2) bT

)1(1

^

+TY = aT+1 + bT+1 *1 Ejemplo:

Sample: 1995 2009 Included observations: 15 Method: Holt-Winters No Seasonal Original Series: CONSUMO Forecast Series: CONSUMSM

Parameters: Alpha 1.0000

Beta 1.0000 Sum of Squared Residuals 3477.068 Root Mean Squared Error 15.22513

End of Period Levels: Mean 819.2060

Trend -15.02300

Obtenga predicciones del consumo para el periodo 2010-2011: Alpha: δ1 = 1 δ2 = 1 Mean: a2009 = 819,2060 Trend: b2009 =-15,02300

1*20092009^

)1(2009^

2010 baConsumoConsumo +== = 804,183* 109 €

2*20092009^

)2(2009^

2011 baConsumoConsumo +== = 789.16* 109 € 2.2.4. Método de Holt-Winters con estacionalidad.

Este método se aplica cuando la variable tiene tendencia lineal y estacionalidad: (1) Hipótesis multiplicativa: Yt = (β1 + β2 t) * Et + ut

(2) Hipótesis aditiva: Yt = (β1 + β2 t) + Et + ut

En este método se proponen tres ecuaciones de alisado, cuyas expresiones son las siguientes, según se suponga una hipótesis multiplicativa o aditiva:

(1) Hipótesis multiplicativa:

at = δ1(Yt /Et-L)+ (1- δ1) (at-1 + bt-1) bt = δ2 (at –at-1) + (1- δ2) bt-1

Et = δ3 (Yt /at) + (1- δ3) Et-L

(*Nota : L es el número de periodos dentro del año. Si los datos son mensuales L=12 y si son trimestrales L=4). La ecuación de predicción es:

)(^

mtY = (at + bt * m) * Et+m-L (2) Hipótesis aditiva: at = δ1(Yt -Et-L)+ (1- δ1) (at-1 + bt-1) bt = δ2 (at –at-1) + (1- δ2) bt-1

Page 31: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

31

Et = δ3 (Yt - at) + (1- δ3) Et-L

La ecuación de predicción es:

)(^

mtY = (at + bt * m) + Et+m-L

Ejemplo: Utilizando la variable correspondiente al número de viajeros para el periodo muestral 2008:06-

2012:06:

a) Indique qué métodos de alisado exponencial se pueden utilizar. • Método de Holt Winters con estacionalidad: Hipótesis aditiva. • Método de Holt Winters con estacionalidad: Hipótesis multiplicativa.

b) Obtenga predicciones para el periodo 2012:06-2012:12, con la información que se le

proporciona:

• Hipótesis multiplicativa: Sample: 2008M06 2012M06 Included observations: 49 Method: Holt-Winters Multiplicative Seasonal Original Series: VIAJEROS Forecast Series: VIAJERSM

Parameters: Alpha 0.4500

Beta 0.0000 Gamma 0.0000

Sum of Squared Residuals 1.03E+12 Root Mean Squared Error 145049.5

End of Period Levels: Mean 7029727.

Trend 13024.58 Seasonals: 2011M07 1.386098 2011M08 1.480794 2011M09 1.237784 2011M10 1.084036 2011M11 0.716772 2011M12 0.661782 2012M01 0.566573 2012M02 0.683435 2012M03 0.827159 2012M04 1.016477 2012M05 1.119982 2012M06 1.219107

3,000,000

4,000,000

5,000,000

6,000,000

7,000,000

8,000,000

9,000,000

10,000,000

11,000,000

II III IV I II III IV I II III IV I II III IV I II

2008 2009 2010 2011 2012

VIAJEROS

Page 32: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

32

Mean: a2012:06= 7029727 Trend: b2012:06 = 13024.58 Seasonals: E2011:07= 1.386098,...., E2012:06=1.219107

)1(06.2012^Y = (a2012.06 + b2012.06 * 1) * E2011.07 = 9761944 viajeros

)2(06.2012^Y = (a2012.06 + b2012.06 * 2) * E2011.08 = 10448151 viajeros . . .

• Hipótesis aditiva:

Sample: 2008M06 2012M06 Included observations: 49 Method: Holt-Winters Additive Seasonal Original Series: VIAJEROS Forecast Series: VIAJERSM

Parameters: Alpha 0.6500 Beta 0.0000 Gamma 0.0000

Sum of Squared Residuals 1.43E+12 Root Mean Squared Error 171093.7

End of Period Levels: Mean 7071203. Trend 13024.58 Seasonals: 2011M07 2613732. 2011M08 3255197. 2011M09 1618088. 2011M10 579182.0 2011M11 -1919117. 2011M12 -2295493. 2012M01 -2947705. 2012M02 -2156083. 2012M03 -1177500. 2012M04 121170.5 2012M05 825567.7 2012M06 1482961.

Mean: a2012:06= 7071203 Trend: b2012:06 = 13024.58 Seasonals: E2011:07= 2613732,...., E2012:06= 1482961

)1(06.2012^Y = (a2012.06 + b2012.06 * 1) + E2011.07 = 9697960 viajeros

)2(06.2012^Y = (a2012.06 + b2012.06 * 2) + E2011.08 = 10352449 viajeros . . .

Page 33: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

33

c) Interprete los valores de los parámetros beta y gamma obtenidos para la hipótesis multiplicativa y la aditiva.

• Hipótesis multiplicativa: bt = δ2 (at –at-1) + (1- δ2) bt-1; δ2 = 0, bt = bt-1

Et = δ3 (Yt /at) + (1- δ3) Et-L ; δ3 = 0, Et = Et-L • Hipótesis aditiva:

bt = δ2 (at –at-1) + (1- δ2) bt-1; δ2 = 0, bt = bt-1

Et = δ3 (Yt-at) + (1- δ3) Et-L ; δ3 = 0 ; Et = Et-L

d) Señale el modelo de alisado que realice mejores predicciones. Y

• Elección del mejor método RECMHW_Hipótesis mulltiplicativa=145049.5 RECMHW_Hipótesis aditiva= 171093.7

Se elige HW con estacionalidad multiplicativa, ya que es el que presenta una menor RECM.

Page 34: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

34

Tema 3. Modelos estocásticos de series temporales. 3.1. Introducción.

El objetivo de este tema es establecer las bases teóricas para poder realizar predicciones bajo un enfoque estocástico de las series temporales. Bajo esta filosofía de modelización, la serie temporal es considerada como la realización de un proceso estocástico. Un proceso estocástico se expresa como ,...2,1, =tYt , y se define como una colección de variables aleatorias ordenadas de acuerdo con el parámetro tiempo:

- Variables aleatorias: Y1, Y2,..., Yt,...

De esta forma, una serie temporal es una colección de observaciones muestrales, cada una correspondiente a una variable del proceso:

- Realización: Y1*, Y2*,..., Yt*,...

Cada una de las variables Yt que configuran un proceso estocástico tendrá su propia función de distribución con sus correspondientes momentos (media, varianza, etc.). Asimismo, cada par de esas variables tendrán su correspondiente función de distribución conjunta y sus funciones de distribución marginales. Esto mismo ocurrirá, ya no para cada par de variables, sino para conjuntos más amplios de las mismas. De esta forma, para caracterizar un proceso estocástico deberíamos especificar las funciones de distribución conjunta de cualquier conjunto de variables: cualesquiera que fueran los valores de (t1, t2,....tm) y cualquiera que fuera el valor de "m".

Habitualmente, conocer esas funciones de distribución resulta complejo de forma que, para

caracterizar un proceso estocástico, basta con especificar la media y la varianza para cada Yt y la covarianza para variables referidas a distintos valores de t: a) Esperanza matemática:

µt = E(Yt) E(Y1), E(Y2), ..., E(Yt),...

b) Función de autocovarianza:

γt,t+k = cov (Yt, Yt+k) = E[(Yt- µt) (Yt+k- µt+k)]

cuando t=s se obtiene la varianza:

γt,t = Var (Yt) = E[(Yt- µt)2]

A partir de cov (Yt, Yt+k), Var (Yt) y Var (Yt+k) se obtiene la función de autocorrelación simple:

ρt,t+k = )()(

),cov(

ktYVartYVarktYtY

+

+

• Estacionariedad y ergodicidad

Para poder hacer inferencia sobre un proceso estocástico, a partir de una realización del mismo,

es necesario que éste cumpla las propiedades de estacionariedad y ergodicidad.

Page 35: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

35

a) Estacionariedad. Con respecto a la estacionariedad, ésta puede ser de dos tipos: estricta y amplia. Un proceso

estocástico es estacionario en sentido estricto o fuerte, si los vectores [Yt, Yt+1, Yt+2,..., Yt+k] y [Yt+m, Yt+m+1,..., Yt+m+k] poseen la misma función de distribución independientemente de t, k y m, es decir:

F [Yt, Yt+1, Yt+2,..., Yt+k] = F [Yt+m, Yt+m+1,..., Yt+m+k]

Ejemplo : F [Y2, Y3, Y4] = F [Y6, Y7, Y8], donde t=2, k=2 y m=4 Por otro lado, un proceso es estacionario en sentido amplio o débilmente estacionario cuando se

verifica que: a) µt = µ [Estacionariedad en media o débil de 1er orden] b) γt,t+k= γk [Estacionariedad en covarianza o débil de 2º orden]

Ej. cov (Y2, Y6) = cov (Y7, Y11)= γ4

c) La varianza es finita y constante a lo largo del tiempo: γ0 = Var(Yt) = E[(Yt- µ)2]= σ2= cov (Yt,Yt), para todo t. [Estacionariedad en varianza]

La función de autocorrelación simple en estos procesos estacionarios es:

ρk= )()(

),cov(

0 ktt

kttk

YVarYVar

YY

+

+=γγ

La representación gráfica de ρk se denomina correlograma. La estacionariedad en sentido estricto garantiza la estacionariedad en sentido amplio, pero no a

la inversa.

b) Ergodicidad. La ergodicidad es una propiedad necesaria para obtener estimaciones consistentes de los

momentos a partir de una realización de una serie temporal. Una condición necesaria, aunque no suficiente es que:

0lim =∞→ k

3.2. Modelos estacionarios lineales: ARMA (p,q). 3.2.1. Modelos autorregresivos de orden p: AR(p).

Los modelos autorregresivos de orden p se definen como: Yt = δ + tptpt YY εφφ +++ −− ...11 , donde los parámetros δφ yi son constantes y tε es

ruido blanco es decir, tε ~ N(0,σ2ε) y cov ( tε , sε ) = 0, y está incorrelacionado con Yt-i para todo i finito. Utilizando el operador L:

(1-φ 1L-...-φ pLp) Yt = δ + tε Casos particulares:

• Modelo AR(1) Un modelo AR(1) queda definido como:

ttt YY εφδ ++= −1

Para que el proceso sea estacionario en sentido amplio se requiere que | 1|<φ . Si ocurre esto:

(1- ttYL εδφ +=)

Page 36: Econometria II

Yt = 111

=−

+−

t

LL φε

φδ

• E(Yt) = E( ...)++ φδδ

• Var (Yt) = Var(1 φ

δ− L

finita para todo t.

• Función de autocovarianza:Para calcular esta función supongamos que

AR(1) se transforma en: t YY φ=)])([( − =−−= kttk EYYE µµγ

(Nota: Aquí se utiliza la no autocorrelación de • Función de autocorrelación simple:

kkk ρφφρρ ==== −− 22

1 ...

Si 0< 11 <φ entonces:

Si 01 1 <<− φ entonces:

• Modelo AR(2):

Un modelo AR(2) se define como:

Las condiciones de esta

o bien que las raíces de la ecuación:

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

...1 21

211 ++++

− −− tttLεφεφε

φδ

...)()()(...) 22

1 ++++ −− ttt EEE εφεφε =φ

δ−1

= µ, constante para todo t.

12 ...)()()

1()

1εφε

φε

φε

=++=−

=−

+ −tttt VarVarL

VarL

Función de autocovarianza: Para calcular esta función supongamos que 0=δ , lo que provoca que µ=0, entonces el modelo

ttY ε+−1 . La función de autocovarianza es:

111 )()()( −−−−− =+= kkttkttktt YEYYEYYE φγεφ

(Nota: Aquí se utiliza la no autocorrelación de tε con ktY − ).

Función de autocorrelación simple: kk φρφ =0 . La representación gráfica de kρ se denomina correlograma:

Un modelo AR(2) se define como:

Yt= ttt YY εφφ ++ −− 2211

(1- ttYLL εδφφ +=− )221

Las condiciones de estacionariedad son:

22

11

1

1

1

2

12

21

<<−<<−<−<+

φφφφφφ

o bien que las raíces de la ecuación:

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

36

, constante para todo t.

2

2

1 φσ ε

−= , constante y

, lo que provoca que µ=0, entonces el modelo

enomina correlograma:

Page 37: Econometria II

caigan dentro del círculo unidad. Si las raíces son complejas (a+bi), se exige que:

Si se cumplen las condiciones de estacionariedad:

• E(Yt) = 11 φφδ

−−• Función de autocovarianzaSuponiendo nuevamente, sin pé

()( 11 ttkttk YYEYYE −− == φγpara k=0, 2110 γφγφγ +=para k>0, 211 − += kk φγφγ

• Función de autocorrelación simple:

2211 −− += kkk ρφρφρ , Representación gráfica de la Función de autocorrelación simple (FAS): Correlogramas:

A partir de 1 −= kk ρφρ

=

2

11

12

1

1

1

φφρ

ρρρ

. Este sistema recibe el nombre

ecuaciones suministran un procedimiento para obtener los coeficientes del modelo AR(2) a partir de los coeficientes de correlación lineal:

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

λ2 - 0- 21 =φλφ

2

4

22

211 φφφλ +

−+

=

caigan dentro del círculo unidad. Si las raíces son complejas (a+bi), se exige que:

las condiciones de estacionariedad:

Función de autocovarianza Suponiendo nuevamente, sin pérdida de generalidad, que µ=0:

)()() 221122 kkkttkttkt EYEYYE −−−−−− ++=++ γφγφεφ

2γ +σ2ε

22 −kγ

de autocorrelación simple: para k>0.

Representación gráfica de la Función de autocorrelación simple (FAS):

221 −− + kρφ , si k=1 y k=2:

. Este sistema recibe el nombre de ecuaciones de Yule

ecuaciones suministran un procedimiento para obtener los coeficientes del modelo AR(2) a partir de los coeficientes de correlación lineal:

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

37

caigan dentro del círculo unidad. Si las raíces son complejas (a+bi), se exige que: 122 <+ ba .

)( kttYE −ε

de ecuaciones de Yule-Walker. Estas

ecuaciones suministran un procedimiento para obtener los coeficientes del modelo AR(2) a partir de

Page 38: Econometria II

Como se ha podido comprobar, el correlograma de un modelo pueden ser muy parecidos en algunos casos. Por ello, con el objeto de la posterior identificación del modelo subyacente tras los datos, se presenta la función de autocorrelación parcial.

• Función de autocorrelación parcial:

El coeficiente de correlación parcial de orden k: eliminando el efecto de los valores intermedios de Y sobre dicha correlación, es decir, sin el efecto de los retardos intermedios: Ymodelo AR(p), estaría compuesta por “p” coeficientes que se obtendría de la siguiente forma:

1) )1(,1φ , procedende de Y

2) )2(,2φ , procedente de

.

.

. p) )(, ppφ , procedente de Y

En resumen para un modelo AR(1):

Y para un modelo AR(2): fas

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

==

2

11

1

12

1

1

1

ρρρ

ρφφ

Como se ha podido comprobar, el correlograma de un modelo AR(1) y un modelo AR(2) pueden ser muy parecidos en algunos casos. Por ello, con el objeto de la posterior identificación del modelo subyacente tras los datos, se presenta la función de autocorrelación parcial.

Función de autocorrelación parcial:

ciente de correlación parcial de orden k: ,*kρ calcula la correlación entre Y

eliminando el efecto de los valores intermedios de Y sobre dicha correlación, es decir, sin el efecto de los retardos intermedios: Yt-1, Yt-2, ..., Yt-k+1. La función de autocorrelación parcial (FAP) de un modelo AR(p), estaría compuesta por “p” coeficientes que se obtendría de la siguiente forma:

, procedende de Yt = ttY εφδ ++ −1)1(,1 .

, procedente de Yt = ttt YY εφφδ +++ −− 2)2(,21)2(,1

, procedente de Yt = tptpptp YY εφφδ ++++ −− )(,1)(,1 ...

En resumen para un modelo AR(1):

Y para un modelo AR(2): fap

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

38

AR(1) y un modelo AR(2) pueden ser muy parecidos en algunos casos. Por ello, con el objeto de la posterior identificación del modelo subyacente tras los datos, se presenta la función de autocorrelación parcial.

calcula la correlación entre Yt y Yt-k eliminando el efecto de los valores intermedios de Y sobre dicha correlación, es decir, sin el efecto

. La función de autocorrelación parcial (FAP) de un modelo AR(p), estaría compuesta por “p” coeficientes que se obtendría de la siguiente forma:

Page 39: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

39

3.2.2 Modelos de medias móviles.

Los modelos de medias móviles son por definición estacionarios y se definen como: Yt = µ+εt-θ1εt-1-θ2εt-2-...- θqεt-q , MA(q)

Yt = µ+(1-θ1L -θ2L2-...- θqLq) εt

Casos particulares:

• Modelo MA(1): Yt = µ+εt-θεt-1, MA(1)

Yt = µ+(1-θL) εt

** E(Yt)= µ ** Función de autocovarizana (suponiendo que µ=0):

kγ =cov (Yt,Yt-k) = E(Yt*Yt-k) = E[ (εt-θεt-1) (εt-k-θεt-k-1)] Para k=0:

0γ =E(Yt*Yt) = E[ (εt-θεt-1) (εt-θεt-1)] = (1+ θ2) σε2

Para k=1:

Page 40: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

40

1γ =cov (Yt,Yt-1) = E(Yt*Yt-1) = E[ (εt-θεt-1) (εt-1-θεt-2)] = - θσε2

Para k>1: kγ =0. ** Función de autocorrelación simple: ρ1 = -θ / (1+ θ2); ρk=0 si k>1.

Ejemplo:

Los modelos de medias móviles deben de cumplir la condición de invertibilidad, que implica que

puedan transformarse en un modelo AR. En el caso del modelo MA(1), la condición de invertibilidad es: |θ|<1. Si esto ocurre:

Yt = µ + (1- θL) εt

Yt/(1- θL) = µ + εt

Yt+ θ Yt-1+ θ2 Yt-2 + ... = µ/(1- θ) + εt

Yt = µ/(1- θ) -θ Yt-1- θ2 Yt-2 - ...+ εt

De esta forma el modelo MA(1) se ha transformado en un AR( ∞ ). La condición de invertibilidad establece que este proceso AR de orden infinito tiene pesos que

van decreciendo al ir tomándose retardos adicionales. La no invertibilidad significa, por el contrario, que en esas circunstancias el proceso tiene pesos que van creciendo, incluso de forma explosiva, lo cual representa una característica no deseable y anti-intuitiva en una serie temporal.

La FAP de un proceso MA(1) invertible tiene infinitos valores distintos de cero, que van convergiendo a cero. Ejemplo:

Page 41: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

41

* Modelo MA (2): Yt = µ+εt-θ1εt-1-θ2εt-2, MA(2)

Yt = µ+(1-θ1L-θ22L) εt

** E(Yt)= µ ** Función de autocovarianza (suponiendo que µ=0):

kγ =cov (Yt,Yt-k) = E(Yt*Yt-k) = E[ (εt-θ1εt-1-θ2εt-2) (εt-k-θ1εt-k-1-θ2εt-k-2)] . Para k=0:

0γ =cov (Yt,Yt) = E(Yt*Yt) = (1+ θ12+ θ22) σε2.

Para k=1: 1γ =cov (Yt,Yt-1) = E(Yt*Yt-1) = E[(εt-θ1εt-1-θ2εt-2) (εt-1-θ1εt-2-θ2εt-3)] = = (- θ1+ θ1 θ2)σε2.

Para k=2: 2γ =(- θ2)σε2.

Para k>2: kγ =0. ** Función de autocorrelación simple: ρ1 = (- θ1+ θ1 θ2)/ (1+ θ12+ θ22) ρ2 = (- θ2)/ (1+ θ12+ θ22) ρk=0 si k>2. ** Condición de invertibilidad:

Para que un MA(2) sea invertible se ha de cumplir que la raíces de la ecuación:

0212 =−− ϑλϑλ , caigan dentro del círculo unidad.

** Ejemplos de funciones de autocorrelación simple y parcial para modelos MA(2) fas fap

Page 42: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

42

3.2.3 Modelos ARMA (p,q).

Un modelo ARMA (p,q) se define como: Yt = δ* + tptpt YY εφφ +++ −− ...11 -θ1εt-1-θ2εt-2-...- θqεt-q

(1- tq

qtp

p LLLYLL εϑϑϑδφφ )...1()... 2211 −−−−+=−−

Para un modelo ARMA(p,q), las condiciones de estacionariedad son determinadas por )(Lφ y las de invertibilidad por )(Lϑ . Casos particulares ** Modelo ARMA (1,1).

La expresión econométrica de un modelo ARMA (1,1) es: Yt = δ* + ttY εφ +−11 -θ1εt-1

(1- tt LYL εϑδφ )1() 11 −+=

La condición de estacionariedad es | 1φ |<1 y la condición de invertibilidad es | 1ϑ |<1. ** Modelo ARMA (2,2):

Yt = δ* + ttt YY εφφ ++ −− 2211 -θ1εt-1-θ2εt-2

(1- tt LLYLL εϑϑδφφ )1() 221

221 −−+=−

Las condiciones de estacionariedad son que las raíces de: λ2 - 0- 21 =φλφ

caigan dentro del círculo unidad. Y las condiciones de invertibilidad son que las raíces de:

0212 =−− ϑλϑλ , caigan dentro del círculo unidad.

3.3. Modelos no estacionarios: ARIMA (p,d,q) y modelos estacionales. 3.3.1 Modelos no estacionarios: ARIMA (p,d,q).

Las series económicas en general no son estacionarias. Esto puede ser debido a varias razones como, por ejemplo, la presencia de tendencia o de estacionalidad que provoca que la esperanza de la variable no sea constante y, por consiguiente, que no sea estacionaria en media; o bien que la variabilidad de la serie no sea constante, con lo que no sería estacionaria en varianza. Ejemplos de series económicas no estacionarias:

Deuda del Estado

0100000000200000000300000000400000000500000000600000000700000000

19

98M

01

19

98M

11

19

99M

09

20

00M

07

20

01M

05

20

02M

03

20

03M

01

20

03M

11

20

04M

09

20

05M

07

20

06M

05

20

07M

03

20

08M

01

20

08M

11

20

09M

09

20

10M

07

20

11M

05

20

12M

03

Page 43: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

43

Centrándonos en los modelos definidos en el epígrafe anterior, supongamos el caso de un

modelo AR(1) con φ =1. En esta situación el modelo no es estacionario: Yt = Yt-1 + εt, y se denomina “Paseo Aleatorio”.

Además cabe señalar, por una parte, que cualquier variable con tendencia no es estacionaria en

media y que cualquier variable que muestre una variable no homogénea no es estacionaria en varianza.

Indice de cotización de acciones de tecnología y telecomunicaciones

0

500

1000

1500

2000

2001

M01

2001

M09

2002

M05

2003

M01

2003

M09

2004

M05

2005

M01

2005

M09

2006

M05

2007

M01

2007

M09

2008

M05

2009

M01

2009

M09

2010

M05

2011

M01

2011

M09

Indice de cotización de acciones de materiales básicos industria y construción

0500

10001500200025003000

2001

M01

2001

M09

2002

M05

2003

M01

2003

M09

2004

M05

2005

M01

2005

M09

2006

M05

2007

M01

2007

M09

2008

M05

2009

M01

2009

M09

2010

M05

2011

M01

2011

M09

Consumo de electricidad

0

500

1000

1500

2000

2500

1995

M01

1996

M01

1997

M01

1998

M01

1999

M01

2000

M01

2001

M01

2002

M01

2003

M01

2004

M01

2005

M01

2006

M01

2007

M01

2008

M01

2009

M01

2010

M01

2011

M01

Page 44: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

44

No obstante, a veces con pequeñas transformaciones las series económicas no estacionarias se pueden convertir en estacionarias. Véase, por ejemplo el modelo correspondiente al paseo aleatorio:

Yt- Yt-1 = εt

Nota: ∆ Yt = Yt – Yt-1 = (1-L) Yt; ∆ 2Yt = (Yt – Yt-1) - (Yt-1 – Yt-2) = (1-2L+L2) Yt = (1-L)2 Yt

A un proceso Yt se le denomina ARIMA (p,d,q) si tras tomar primeras diferencias d veces ( ∆ d Yt = (1-L)d Yt) se obtiene un proceso estacionario: ARMA(p,q):

(1-φ 1L-...-φ pLp) (1-L)d Yt = δ* + )...1( 221

qqLLL ϑϑϑ −−−− εt

En algunos casos, al tomar diferencias, la serie sigue siendo no estacionaria en varianza. Una transformación que puede solucionar el problema es: ∆ lnYt.

Ejemplo de serie no estacionario en media ni en varianza:

• Test de raíces unitarias

a) Test de Dickey-Fuller:

Supongamos el modelo: Yt =δ + 1φ Yt-1 + εt, si el parámetro no cumple este requisito| 1φ |<1, la

variable no es estacionaria. No obstante, en el caso de que no sea estacionario lo habitual es que 1φ =1, ya que en el resto de casos la serie sería explosiva lo cual no es habitual en Economía. Por ello, si se plantea un test para verificar si es estacionario, las hipótesis serían las siguientes:

Ho: 1φ =1

H1: 1φ <1 Si el test que se aplica es el Dickey Fuller, el modelo que hay que estimar es:

∆ Yt = δ + γ Yt-1 + εt, donde γ1 = 1φ -1, luego el test se reduce a: Ho: γ=0 H1: γ<0

t= ^

1

^

1

γ

γ−S

No obstante, ahora los valores críticos son los procedentes de las tablas de MacKinnon (1996). Si se acepta H0, se dice que la variable no es estacionaria, y hay que tomar al menos una

diferencia. Una serie es integrada de orden p, I(p), o tiene p raíces unitarias, si para convertirla en estacionaria hay que tomar p diferencias.

Page 45: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

45

Con EVIEWS, el test de Dickey-Fuller se puede aplicar para los siguientes modelos: (1) Yt = 1φ Yt-1 + εt, (Modelo sin constante).

(2) Yt = δ + 1φ Yt-1 + εt, (Modelo con constante).

(3) Yt = δ1 + 1φ Yt-1 + δ2 t + εt ((Modelo con constante y tendencia).

b) Test de Dickey-Fuller aumentado Si la serie sigue un modelo AR(p) con p>1, se aplica el test de Dickey-Fuller aumentado: ∆ Yt = δ + γ1

Yt-1 + ∑−

=−∆

1

1

p

j

jtj Yβ + εt. Y el contraste es el mismo:

Ho: γ1=0 H1: γ<0

t= ^

1

^

1

γ

γ−S

Y los valores críticos son los procedentes de las tablas de McKinnon (1996). Ejercicio de aplicación del test de Dickey-Fuller:

28.0

28.5

29.0

29.5

30.0

30.5

31.0

31.5

1975 1980 1985 1990 1995 2000 2005 2010

EDAD_MATERNIDAD

Page 46: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

46

Null Hypothesis: EDAD_MATERNIDAD has a unit root Exogenous: Constant Lag Length: 0 (Automatic - based on SIC, maxlag=0)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic 1.149976 0.9972 Test critical values: 1% level -3.632900

5% level -2.948404 10% level -2.612874

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(EDAD_MATERNIDAD) Method: Least Squares Sample (adjusted): 1976 2010 Included observations: 35 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

EDAD_MATERNIDAD(-1) 0.021281 0.018505 1.149976 0.2584 C -0.559298 0.546674 -1.023091 0.3137

R-squared 0.038530 Mean dependent var 0.068953 Adjusted R-squared 0.009395 S.D. dependent var 0.117580 S.E. of regression 0.117027 Akaike info criterion -1.397382 Sum squared resid 0.451944 Schwarz criterion -1.308505 Log likelihood 26.45418 Hannan-Quinn criter. -1.366701 F-statistic 1.322445 Durbin-Watson stat 0.349789 Prob(F-statistic) 0.258420

Ho: γ1=0

H1: γ1<0 , t*= ^

1

^

1

γ

γ−S

= 1.149976, Valor crítico al 5%: -2.94, se acepta H0. La variable

“Edad media de la maternidad” al menos tiene una raíz unitaria. Se toma una diferencia regular sobre la variable “Edad_maternidad” y se vuelve a aplicar el test

de Dickey-Fuller:

Page 47: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

47

Ho: γ=0 H1: γ<0

t*= ^

1

^

1

γ

γ−S

= -3.397513, Valor crítico al 5%: -2.951125, se rechaza H0. Por lo que resulta que la

variable:

“(1-L) Edad_maternidad” es estacionaria. En definitiva la variable Edad_maternidad es I(1). 3.3.2. Modelos estacionales.

En variables económicas con una periodicidad inferior al año (por ejemplo, mensual o trimestral), los modelos estocásticos descritos anteriormente se pueden convertir en estacionales si los retardos de las variables aparecen cada “s” periodos, siendo “s” el número de periodos que tiene el año: 12 si son meses o 4 si son trimestres. De esta forma surgen los siguientes modelos estacionales: a) Modelos autorregresivos estacionales: AR(P)s

Null Hypothesis: D(EDAD_MATERNIDAD) has a unit root Exogenous: Constant Lag Length: 0 (Automatic - based on SIC, maxlag=0)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -3.397513 0.0181 Test critical values: 1% level -3.639407

5% level -2.951125 10% level -2.614300

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation Dependent Variable: D(EDAD_MATERNIDAD,2) Method: Least Squares Date: 08/30/12 Time: 11:57 Sample (adjusted): 1977 2010 Included observations: 34 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

D(EDAD_MATERNIDAD(-1)) -0.291318 0.085745 -3.397513 0.0018

C 0.032613 0.011471 2.842953 0.0077

R-squared 0.265096 Mean dependent var 0.013366 Adjusted R-squared 0.242130 S.D. dependent var 0.066812 S.E. of regression 0.058164 Akaike info criterion -2.794081 Sum squared resid 0.108257 Schwarz criterion -2.704295 Log likelihood 49.49938 Hannan-Quinn criter. -2.763461 F-statistic 11.54309 Durbin-Watson stat 1.676532 Prob(F-statistic) 0.001835

Page 48: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

48

Yt = δ + *1φ Yt-s + *

2φ Yt-2s+...+ *Pφ Yt-Ps+εt

(1- *1φ Ls- *

2φ L2s-... – *Pφ LPs)Yt= δ +εt,

* Caso Particular: AR(1)s

Yt = δ + *1φ Yt-s + εt

(1- *1φ Ls) Yt= δ +εt

Para un modelo AR(1)s la FAS se comporta como en el caso de un AR(1) pero a intervalos de s

retardos, en los retardos intermedios vale 0. Y la FAP tiene un único valor distinto de cero en el periodo s.

Ejemplo: Yt = δ + *1φ Yt-4 + εt

FAS FAP

b) Modelos de medias móviles estacionales: MA(Q)s

Yt = µ + tε - *1ϑ εt-s- *

2ϑ 2εt-2s-...- *Qϑ εt-Qs = µ +(1- *

1ϑ Ls- *2ϑ L2s-... – *

Qϑ LQs) εt

• Caso Particular: MA(1)s

Yt = µ + tε - *1ϑ εt-s = µ +(1- *

1ϑ Ls) εt

Ejemplo: Yt = µ +(1- *1ϑ L4) εt

FAS FAP

• Modelos ARMA(P,Q)s: (1- *

1φ Ls- *2φ L2s-... – *

Pφ LPs)Yt = δ*+(1- *1ϑ Ls- *

2ϑ L2s-... – *Qϑ LQs )εt

ts YL )(φ = δ*+ θ(Ls) εt

Page 49: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

49

• Modelos ARIMA (P,D,Q)s

tDss YLL )1)(( −φ = θ(Ls) εt

Son aquellos donde es necesario tomar D diferencias estacionales para que la variable siga un modelo ARMA (P,Q)s estacional.

Los modelos estacionales se pueden combinar con los vistos en los epígrafes anteriores. De ahí

surgen los modelos:

• ARIMA (p,d,q) *(P,D,Q)s

=−− tdDss YlLLL )1()1)(()( φφ δ*+ θ(L)θ(Ls) εt

)(Lφ y θ(L) conforman la parte regular, y )( sLφ y θ(Ls) la parte estacional.

Page 50: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

50

Tema 4: Análisis Box-Jenkins. 4.1. Identificación

En el tema anterior se han examinado las propiedades de algunos de los procesos estocásticos más usuales en las series económicas y se ha supuesto que los datos son realizaciones de tales procesos estocasticos. El análisis Box-Jenkins pretende conocer cuál es modelo teórico que genera la serie económica, con objeto de realizar predicciones de la misma. En particular, dicho análisis está compuesto por las siguientes etapas: identificación, estimación, validación y predicción. La etapa de indentificación trata de inferir cúal es el proceso estocástico que hay detrás de la serie temporal. Para ello, inicialmente, es necesario realizar un análisis de la estacionariedad de la serie, haciendo uso del test de Dickey-Fuller. En el caso de que la serie no sea estacionaria se realizan las oportunas transformaciones.

En la segunda etapa, se procede a determinar el orden de la parte autorregresiva y de las partes de medias móviles, tanto regular como estacional.

Como instrumentos de identificación surgen la FASE (AC) y la FAPE (PAC): Función de autocorrelación simple estimada y la función de autocorrelación parcial estimada, respectivamente:

La FASE:

=

+=

−−=

T

tt

T

ktktt

k

YY

YYYY

1

2

1^

)(

))((

ρ , es el coeficiente de correlación muestral para una

muestra de tamaño T. La secuencia de valores k

^

ρ (k=1,2,3,...) constituye el correlograma estimado. El número de k’s debe de estar en torno a 1/3 de la muestra.

A partir de estos coeficientes estimados, se puede realizar inferencia sobre la significación de los coeficientes teóricos. En concreto, un coeficiente de la función de autocorrelación simple teórica no

es significativo si se acepta H0: kρ =0.

Bajo H0, se puede demostrar que k

^

ρ ~ N (0,1/T), luego el contraste que se plantea es:

H0: kρ =0

H1: kρ ≠0

Se tipifica la variable, k

^

ρ / T/1 ~ N(0,1), por lo que la zona de aceptación de H0 es:

-1.96< k

^

ρ / T/1 > 1.96, es decir, -1.96 T/1^

kρ< <1.96 T/1 . E-Views aproxima y

proporciona unas bandas de +-2 T/1 .

Con respecto a los coeficientes de correlación parcial estimados ^

*kρ , su distribución es:

^*

kρ ~ N (0,1/T), luego *^

kρ / T/1 ~ N(0,1), es decir, nuevamente se pueden plantear contrastes del siguiente tipo para los coeficientes de autocorrelación parciales teóricos:

H0: k*ρ =0

H1: k*ρ ≠0

Se acepta H0 si -1.96 T/1 < *^

kρ <1.96 T/1 . Al igual que en el caso anterior, las bandas que

proporciona EViews son: +-2 T/1

Page 51: Econometria II

Ejemplo: Serie de consumo de cemento:

Tras la observación de los coeficientes estimados simpl

bandas el modelo que se supone que genera la variables es un:

Serie de petróleo: Transformación: D (petroleo,1)

En este caso se propone un modelo ARIMA (0,1,1) x (1,0,0)

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

Serie de consumo de cemento: Transformación: D (cemento,1,12)

Tras la observación de los coeficientes estimados simples y parciales que salen fuera de las bandas el modelo que se supone que genera la variables es un:

ARIMA (0,1,1) x (0,1,0)12

Transformación: D (petroleo,1)

En este caso se propone un modelo ARIMA (0,1,1) x (1,0,0)12.

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

51

es y parciales que salen fuera de las

Page 52: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

52

4.2. Estimación. Una vez identificado el modelo generador de la serie temporal es preciso estimar los parámetros del modelo. El proceso de estimación de modelos ARIMA es complejo. Por este motivo y dado el alcance introductorio del tema, en este epígrafe nos limitamos a indicar cómo se obtendrían las estimaciones de los modelos mediante la utilización del programa EVIEWS, y a interpretar dichas estimaciones.

Para estimar con EVIEWS un modelo AR(p):

ttYL εδφ +=)(

(1-φ 1 L - φ 2 L2- ... φ p Lp) Yt = tεδ + Hay que utilizar la siguiente secuencia de comando: Quick/ Estimate Equation:

A continuación en el cuadro en blanco, donde marca la flecha, hay que escribir: Y c AR(1) AR(2) ....AR(p):

De esta forma se obtendría las estimaciones de los parámetros del modelos:

p

^

2

^

1

^^,...,,, φφφδ

Ejemplo:

Page 53: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

53

Dependent Variable: D(AERONAVES,1) Method: Least Squares Sample (adjusted): 1993 2010 Included observations: 18 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 62306.58 15168.96 4.107505 0.0009 AR(1) 0.565905 0.213976 2.644717 0.0184 AR(2) -0.821485 0.303574 -2.706044 0.0163

R-squared 0.412501 Mean dependent var 51003.78 Adjusted R-squared 0.334167 S.D. dependent var 97286.84 S.E. of regression 79384.67 Akaike info criterion 25.55301 Sum squared resid 9.45E+10 Schwarz criterion 25.70141 Log likelihood -226.9771 Hannan-Quinn criter. 25.57347 F-statistic 5.265969 Durbin-Watson stat 1.834815 Prob(F-statistic) 0.018516

Inverted AR Roots .28-.86i .28+.86i

=== 2

^

1

^^ 0.565905; ; 62306.58 φφδ -0.821485

En el caso de los modelos MA(q): Yt = µ+εt-θ1εt-1 -θ2εt-2-...- θqεt-q Yt = µ+(1-θ1L -θ2L2-...- θqLq) εt

Se procede incialmente de igual forma, y en el recuadro en blanco se escribe :

Y c MA(1) MA(2) ...MA(q)

obteniéndo como resultado : ^

2

^

1

^,...,, θθµ −−

Ejemplo :

Dependent Variable: D(PEDIDOS,1,12) Method: Least Squares; Sample (adjusted): 2003M02 2012M06 Included observations: 113 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.084618 0.399388 -0.211869 0.8326

MA(1) -0.756689 0.083445 -9.068142 0.0000 MA(2) 0.485152 0.083526 5.808431 0.0000

R-squared 0.349082 Mean dependent var -0.062929 Adjusted R-squared 0.337247 S.D. dependent var 7.170403 S.E. of regression 5.837399 Akaike info criterion 6.392638 Sum squared resid 3748.275 Schwarz criterion 6.465046 Log likelihood -358.1840 Hannan-Quinn criter. 6.422020 F-statistic 29.49603 Durbin-Watson stat 1.793412 Prob(F-statistic) 0.000000

=−=−=^

21

^^ -0.756689; -0.084618; θθµ 0.485152

En el caso de los modelos ARMA (p,q) :

Page 54: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

54

(1-φ 1 L - φ 2 L2 - ...) Yt =µ+(1-θ1L -θ2L2-...- θqLq) εt

se realizaría una combinación de términos AR y MA, escribiéndose : Y c AR(1) AR(2) ....AR(p) MA(1) MA(2) ...MA(q)

Si los modelos son estacionales, y suponiendo el caso más general, modelos ARMA (P,Q)s :

(1- *1φ Ls- *

2φ L2s-... – *Pφ LPs)Yt = δ*+(1- *

1ϑ Ls- *2ϑ L2s-... – *

Qϑ LQs )εt

En el recuadro en blanco habría que escribir: * Con datos mensuales

Y c SAR(12) SAR(24)...SAR(12*P) SMA(12) SMA(24)...SMA(12*Q) * Con datos trimestrales

Y c SAR(4) SAR(8)...SAR(4*P) SMA(4) SMA(8)...SMA(4*Q) Por último, en los modelos mixtos que contienen parte regular y parte estacional habría que

utilizar una combinación de los términos anteriores. Por ejemplo, para estimar un modelo ARIMA (0,1,1) x (1,0,0)12, habría que escribir:

Y c MA(1) SAR(12)

Otros ejemplos: Dependent Variable: D(PETROLEO,1) Method: Least Squares Sample: 2000M01 2008M09 Included observations: 105 Convergence achieved after 9 iterations MA Backcast: 1999M12

Variable Coefficient Std. Error t-Statistic Prob.

C -1.443005 15.80527 -0.091299 0.9274 AR(12) 0.571530 0.073941 7.729536 0.0000 MA(1) -0.651506 0.075296 -8.652623 0.0000

R-squared 0.629857 Mean dependent var -0.847619 Adjusted R-squared 0.622599 S.D. dependent var 317.0477 S.E. of regression 194.7717 Akaike info criterion 13.40969 Sum squared resid 3869473. Schwarz criterion 13.48552 Log likelihood -701.0086 Hannan-Quinn criter. 13.44042 F-statistic 86.78464 Durbin-Watson stat 2.049783 Prob(F-statistic) 0.000000

Inverted AR Roots .95 .83+.48i .83-.48i .48+.83i .48-.83i .00+.95i -.00-.95i -.48+.83i -.48-.83i -.83-.48i -.83+.48i -.95

Inverted MA Roots .65

Page 55: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

55

Dependent Variable: D(IPC,1,12) Method: Least Squares Sample (adjusted): 2004M03 2009M03 Included observations: 61 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.018557 0.046061 -0.402883 0.6885

AR(1) 0.543799 0.118083 4.605221 0.0000 SAR(12) -0.642350 0.138179 -4.648690 0.0000

R-squared 0.541929 Mean dependent var -0.032377 Adjusted R-squared 0.526134 S.D. dependent var 0.389930 S.E. of regression 0.268420 Akaike info criterion 0.255402 Sum squared resid 4.178858 Schwarz criterion 0.359215 Log likelihood -4.789757 Hannan-Quinn criter. 0.296087 F-statistic 34.30901 Durbin-Watson stat 1.786637 Prob(F-statistic) 0.000000

Inverted AR Roots .93-.25i .93+.25i .68-.68i .68+.68i .54 .25-.93i .25+.93i -.25+.93i -.25-.93i -.68+.68i -.68+.68i -.93-.25i -.93+.25i

4.3. Validación.

Para que el modelo estimado sea aceptado como generador de la serie económica ha de cumplir los siguientes requisitos: a) Los residuos del modelo han de ser ruido blanco.

Es esencial que los residuos sean ruido blanco, ya que en caso contrario, implicaría que contienen información relevante para la estimación. Lo primero que debe de cumplir los residuos es la normalidad, para verificarla se aplica el test de Jarque Bera, cuyas hipótesis en este caso son:

H0: et~ Normal H1: et no se distribuye Normal

El estadístico del test es el siguiente: JB = T/6 (S2+ (K-3)2/4)~ X2(2)

donde: “s” es el coeficiente de asimetría y “k” el coeficiente de curtosis. Ejemplo:

En este ejemplo el valor del estadístico JB*=5.655 y el p-valor asociado 0.056, acepatarían H0, por lo que se puede admitir que los residuos se distribuyen según una normal.

Otro de los requisitos que ha de cumplir la serie de et es que no esté correlacionada entre sí, es decir, que los et sean independientes. Una forma de verificarlo es plantear contrastes de hipótesis para los coeficientes de las FAS y de la FAP:

0

1

2

3

4

5

6

-1000 -800 -600 -400 -200 0 200 400 600

Series: ResidualsSample 2006M02 2008M10Observations 33

Mean 5.422771Median 44.25943Maximum 600.9263Minimum -939.8059Std. Dev. 388.5662Skewness -0.955887Kurtosis 3.728750

Jarque-Bera 5.755695Probability 0.056256

Page 56: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

56

H0: kρ =0 H0: k

*

ρ =0

H1: kρ ≠0 H1: k

*

ρ ≠0 La serie de residuos es ruido blanco si al menos el 95% de los coeficientes estimados de su FAS

empírica y de su FAP empírica están dentro de las bandas: +-2/ T . También se puede realizar un contraste global de ausencia de correlación en los residuos, utilizando

el test de Ljung y Box: H0 : ρ1 = ρ2 =...= ρk = 0 H1: H0 no se cumple

El estadístico del test es en este caso :

Q= T(T+2) ∑=

+++−≈−

K

jqQPpk

jX

jT1

2))((

^2ρ

, donde p, P, q y Q son las partes autorregresivas y de

medias móviles de la variable de donde provienen los residuos.

Ejemplo: Indice de Consumo de productos alimenticios en Grandes Superficies

40

60

80

100

120

140

160

180

1996 1998 2000 2002 2004 2006 2008 2010

INDICE

Page 57: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

57

Aplicación del test de Dickey-Fuller * Variable LOGDIF: (1-L) (1-L12) log(INDICEt)

Null Hypothesis: LOGDIF has a unit root Exogenous: None Lag Length: 0 (Fixed)

t-Statistic Prob.* Augmented Dickey-Fuller test statistic -19.09945 0.0000

Test critical values: 1% level -2.582334 5% level -1.943229 10% level -1.615134 *MacKinnon (1996) one-sided p-values.

Estimación del modelo propuesto

Dependent Variable: D(LOG(INDICE),1,12) Method: Least Squares Sample (adjusted): 2001M04 2011M03 Included observations: 120 after adjustments Convergence achieved after 9 iterations Backcast: 2000M04 2001M03

Variable Coefficient Std. Error t-Statistic Prob. C -0.000553 0.000418 -1.323295 0.1883

AR(1) -0.678069 0.079536 -8.525273 0.0000 AR(2) -0.482609 0.079581 -6.064402 0.0000

MA(12) -0.910754 0.016492 -55.22537 0.0000

Residuos

0

2

4

6

8

10

12

14

-0.10 -0.05 0.00 0.05

Series: ResidualsSample 2001M04 2011M03Observations 120

Mean -0.000837Median -0.002172Maximum 0.051715Minimum -0.105775Std. Dev. 0.028366Skewness -0.476766Kurtosis 3.498752

Jarque-Bera 5.789890Probability 0.055302

Page 58: Econometria II

El modelo que se ha propuesto para la variable “Indice” es un ARIMA (2,1,0)x(0,1,1) Para verificar si los residuos son ruido blanco:

• Test de Jarque y Bera:

El estadístico del test es el siguiente: JB = T/6 (S2+ (K-3)2/4)~ X

JB*=5,789< 95.0,2)2(X , ya que p

Se concluye que los residuos se distribuyen según una normal.* Independencia de los resid

H0: ρ

H1: ρpara k=1,...,23.

La zona de aceptación de H

para más del 95% de los contrastes los coeficientes estimados de de aceptación, por lo que se verifica que los residuos no están correlacionados. Adicionalmente se aplica el test de Ljung y Box:

El estadístico del test es en este caso :

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

El modelo que se ha propuesto para la variable “Indice” es un ARIMA (2,1,0)x(0,1,1)

Para verificar si los residuos son ruido blanco:

Test de Jarque y Bera:

H0: et~ Normal H1: et no se distribuye Normal

El estadístico del test es el siguiente: /4)~ X2(2)

, ya que p-valor= 0.055.

Se concluye que los residuos se distribuyen según una normal. * Independencia de los residuos:

kρ =0 H0: ρ

kρ ≠0 H1: ρ

La zona de aceptación de H0 para todos los contrastes es: +-2/ T = +-

para más del 95% de los contrastes los coeficientes estimados de kρ y *kρ

de aceptación, por lo que se verifica que los residuos no están correlacionados. ente se aplica el test de Ljung y Box:

H0 : ρ1 = ρ2 =...= ρ23 = 0 H1: H0 no se cumple

El estadístico del test es en este caso :

Q= 120(120+2) ∑=

−≈−

23

1

2323

^2

j

jX

jT

ρ

Q*=29019< 95.0,2)23(X , ya que p-valor= 0.087,

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

58

El modelo que se ha propuesto para la variable “Indice” es un ARIMA (2,1,0)x(0,1,1)12.

k

*

ρ =0

k

*

≠0

182. Se comprueba que

están dentro de la zona de aceptación, por lo que se verifica que los residuos no están correlacionados.

Page 59: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

59

por lo que nuevamente se verifica que los residuos son independientes. En definitiva, se puede afirmar que los residuos resultantes de la estimación del modelo son ruido blanco.

b) Los coeficientes estimados han de ser estadísticamente significativos.

Los coeficientes del modelo propuesto han de ser estadísticamente significativos, para ello se utiliza el estadístico t-Student.

c) El modelo estimado ha de ser estacionario e invertible.

Ejemplo: Dependent Variable: D(IPC,1,12) Method: Least Squares Sample (adjusted): 2004M03 2009M03 Included observations: 61 after adjustments

Variable Coefficient Std. Error t-Statistic Prob. C -0.018557 0.046061 -0.402883 0.6885

AR(1) 0.543799 0.118083 4.605221 0.0000 SAR(12) -0.642350 0.138179 -4.648690 0.0000

R-squared 0.541929 Mean dependent var -0.032377 Adjusted R-squared 0.526134 S.D. dependent var 0.389930 S.E. of regression 0.268420 Akaike info criterion 0.255402 Sum squared resid 4.178858 Schwarz criterion 0.359215 Log likelihood -4.789757 Hannan-Quinn criter. 0.296087 F-statistic 34.30901 Durbin-Watson stat 1.786637 Prob(F-statistic) 0.000000

Inverted AR Roots .93-.25i .93+.25i .68-.68i .68+.68i .54 .25-.93i .25+.93i -.25+.93i -.25-.93i -.68+.68i -.68+.68i -.93-.25i -.93+.25i

El modelo estimado sólo tiene parte autorregresiva, de modo que sólo hay que analizar la

estacionariedad del mismo. Se han estimado un modelo ARIMA(1,1,0)x(1,1,0)12: (1- 1φ L) (1- 1φ * L12) (1-L) (1-L12) Indicet= δ +εt,

por lo que hay hay 13 raíces de la parte autorregresiva que han de cumplir las condiciones de estacionaridad. Estas raíces aparecen en la salida del ordenador como: “Inverted MA Roots”. Las raíces reales son en valor absoluto menores que uno, y el módulo de las complejas también es menor que uno, por ello, se pueden afirmar que el modelo estimado es estacionario.

Si estuvieramos en el caso de otro modelo con componentes autorregresivos y de medias móviles,

habría que analizar tanto la estacionariedad como la invertibilidad y las raíces aparecería recogidas, respectivamente, como “Inverted AR Roots” y como “Inverted MA Roots”. d) Aplicación del test de Ramsey.

Se aplica el test de Ramsey para verificar que el modelo no presenta alguno de los siguientes problemas:

a) Omisión de variables explicativas relevantes. b) Forma funcional incorrecta. c) Correlación entre los regresores y ε.

Si ocurre alguna de las situaciones anteriores: ε ~N (µ, σ2I). De esta forma, se plantea el siguiente contraste:

Page 60: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

60

Ho: ε ~N (0, σ2I) H1: ε ~N (µ, σ2I)

El estadístico es un test de la razón de verosimilitud: LR= 2(LnLsr – LnLr) ~ X2(p), donde p es el número de potencias de la variable ajustada incluidas.

Ejemplo:

Ramsey RESET Test:

F-statistic 0.700657 Prob. F(1,128) 0.404123 Log likelihood ratio 0.726041 Prob. Chi-Square(1) 0.394170

Test Equation: Dependent Variable: LOGDIF Method: Least Squares

Variable Coefficient Std. Error t-Statistic Prob.

C 0.000172 0.001239 0.139186 0.8895 FITTED^2 -0.713751 0.835045 -0.854746 0.3943

AR(1) -0.615101 0.079996 -7.689119 0.0000 AR(2) -0.415091 0.080874 -5.132542 0.0000

MA(12) -0.892562 0.024877 -35.87903 0.0000

LR*= 0.726041 < X2,0.95(1), se acepta H0, no existen errores de especificación.

e) Análisis de estabilidad: Test de Chow. El modelo que se estima no ha de presentar cambio estructural, para comprobarlo se puede

aplicar el test de Chow: H o: No existe cambio estructural H1: Existe cambio estructural

=F kTkFkTeeee

keeeeee*2,

2'21

'1

2'21

'1

)2/()(

/))('(−≈

−++−

Ejemplo aplicado al modelo estimado para D(LOG(INDICE),1,12)

Chow Breakpoint Test: 2005M06 F-statistic 1.633686 Prob. F(4,112) 0.170719

Log likelihood ratio 6.804879 Prob. Chi-Square(4) 0.146566

F*=1.633686, p-valor=0.17,

se acepta H0, no hay cambio estructural. f) Comparación con modelos alternativo.

La idoneidad del modelo estimado se compara con otros modelos alternativos.

Page 61: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

61

Ejemplo:

Se ha introducido con respecto al modelo estimado anteriormente para D(log(Indice),1,12) el

término AR(3), y los valores de los criterios de selección de modelos (Akaike y Shwarz) son mayores. Además el coeficiente que acompaña al término AR(3) no es significativo.

Dependent Variable: D(LOG(INDICE),1,12)

Method: Least Squares

Sample (adjusted): 2001M05 2011M03

Included observations: 119 after adjustments

Convergence achieved after 10 iterations

Backcast: 2000M05 2001M04

Variable Coefficient Std. Error t-Statistic Prob.

C -0.000533 0.000446 -1.193395 0.2352

AR(1) -0.664263 0.094519 -7.027864 0.0000

AR(2) -0.457173 0.104927 -4.357066 0.0000

AR(3) 0.049410 0.092418 0.534633 0.5939

MA(12) -0.908579 0.017635 -51.52011 0.0000

R-squared 0.622914 Mean dependent var -0.000943

Adjusted R-squared 0.609683 S.D. dependent var 0.046445

S.E. of regression 0.029016 Akaike info criterion -4.200799

Sum squared resid 0.095983 Schwarz criterion -4.084029

Log likelihood 254.9475 F-statistic 47.07966

Durbin-Watson stat 1.976743 Prob(F-statistic) 0.000000

4.4. Predicción.

La mejor predicción por puntos es aquella que se obtiene mediante la esperanza condicional del proceso:

)/( TmT IYE + A continuación se muestran cómo obtener predicciones puntuales para algunos modelos

estocásticos sencillos: • Modelo AR(1): Yt = δ + ttY εφ +−11

YT+1 = δ + 11 ++ TTY εφ

E (YT+1/IT) = δ + TY1φ

1

^

+TY = ^

δ + TY^

2

^

+TY = ^

δ + 1

^^

1 +TYφ Si se predice:

Page 62: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

62

TTT YYY −=∆ ++ 1

^

1

^

TTT YYY +∆= ++ 1

^

1

^

Si se predice:

)log()log()log( 1

^

1

^

TTT YYY −=∆ ++

)log()log()log( 1

^

1

^

TTT YYY +∆= ++

))log()log((1

^1

^

TT YYT eY +∆

++=

• Modelo AR(2): Yt = δ + ttt YY εφφ ++ −− 2211

YT+1 = δ + TTT YY εφφ ++ −121

E (YT+1/IT) = δ + TY1φ + 12 −TYφ

1

^

+TY = ^

δ + TY^

1φ + 1

^

2 −TYφ

2

^

+TY = ^

δ + 1

^^

1 +TYφ + TY^

• Modelo MA(1): Yt = µ+εt-θ1εt-1

YT+1 = µ+εT+1-θ1εT ; E (Yt+1/IT) = µ-θ1εT ; 1

^

+TY = ^

µ - Te^

YT+2 = µ+εT+2-θ1εT+1 ; E(Yt+2/IT) = µ ; 2

^

+TY = ^

µ

• Modelo MA(2): Yt = µ+εt-θ1εt-1- θ2εt-2

YT+1 = µ+εT+1-θ1εT - θ2εtT-1 ; E (Yt+1/IT) = µ-θ1εT -θ2 εT-1; 1

^

+TY = ^

µ - Te^

1ϑ - 1

^

2 −Teϑ

YT+2 = µ+εT+2-θ1εT+1 - θ2εtT ; E (Yt+2/IT) = µ-θ2 εT; 2

^

+TY = ^

µ - Te^

• Modelo ARMA (1,1): Yt = δ + ttY εφ +−11 - θ1εt-1 YT+1 = δ + 11 ++ TTY εφ - θ1εT

E (YT+1/IT) = δ + TY1φ - θ1εT

1

^

+TY = ^

δ + TY^

1φ - Te^

Page 63: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

63

Tema 5. Introducción a los modelos dinámicos.

5.1. Introducción. En la asignatura Econometría I se analizaron las características básicas del Modelo de

Regresión Lineal General (MRGL), que bajo ciertos supuestos nos permite modelizar relaciones causales entre una o varias variables explicativas (causa) y una variable explicada (efecto). En ese momento aludimos de forma muy somera a una de las posibles clasificaciones de los modelos econométricos, en concreto a la que hace referencia a la dependencia temporal de la variable explicada (yi) respecto de la/s variable/s explicativa/s (x1, …, xk). De forma más explícita, atendiendo a esa relación temporal, podemos hablar de modelos estáticos y dinámicos. Como ya sabemos, los primeros aluden a situaciones en la que la respuesta de la variable dependiente ante un cambio en una de las variables explicativas es instantánea, es decir no se produce a lo largo de un lapso de tiempo. Por ejemplo:

La expresión anterior corresponde a un modelo estático, puesto que el valor de queda determinado en cada periodo (t) por las condiciones exógenas en ese momento, es decir por el valor concreto que tomen la/s variable/s exógenas (explicativas) en ese momento temporal (t). Ese es el tipo de modelos que se abordaron en Econometría I.

En cambio los modelos dinámicos recogen el hecho de que en muchas ocasiones las

reacciones económicas son retardadas. Entendiendo por retardo al lapso de tiempo que se produce entre un cambio en una (o más) de las variables explicativas y la respuesta de la variable endógena (explicada).

Ejemplo de modelo dinámico:

Donde es, por ejemplo, el gasto en ropa durante las rebajas, que será función del ahorro en el mes “t”, en el mes previo “t-1” y dos meses antes “t-2”. Por tanto los modelos dinámicos surgen debido a la necesidad de tomar en consideración que lo que ocurre en el pasado puede influir a lo que ocurre en el futuro, es decir existen retardos en el comportamiento de los agentes económicos. De esta forma los valores de Y a lo largo del tiempo describen la trayectoria temporal de la reacción económica.

En los siguientes epígrafes de este tema vamos a profundizar en el conocimiento de las causas

que generan la aparición de modelos dinámicos, así como las principales características de éstos.

5.2. Causas que generan retardos. Se puede hablar de cuatro grandes fuentes de generación de retardos: 1) Causas psicológicas: La reacción de los agentes económicos ante un cambio en el valor

de una variable explicativa suele presentar una cadencia en el tiempo, es decir no se altera drásticamente, debido principalmente a la existencia de hábitos e incertidumbre.

a) Hábitos: Un aumento en el precio del pan no se traduce, normalmente, en dejar de comer pan, sino en un ajuste progresivo de la cantidad demandada del bien.

b) Incertidumbre: Los agentes económicos suelen formarse expectativas sobre la evolución futura de las variables, condicionando en tal sentido su

Page 64: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

64

comportamiento. Ejemplo: Una subida del Euribor no tiene porque ir acompañada de una caída inmediata de la demanda de pisos, si se espera una caída posterior del Euribor.

2) Tecnológicas: Los avances tecnológicos pueden favorecer cambios que no se puedan implementar instantáneamente en los procesos productivos. Por ejemplo el desarrollo de los vehículos eléctricos provocará un cambio paulatino (no instantáneo) en el parque automovilístico. Otro ejemplo son las aplicaciones de la telefonía móvil.

3) Institucionales: La existencia de determinados tipos de regulaciones puede condicionar la velocidad de reacción en determinados comportamientos. Por ejemplo la regulación de determinadas materias por parte del Estado no es en muchos casos instantánea ante los cambios en la realidad socioeconómica. Esto ocurre por ejemplo en las regulaciones relativas a las TICs.

4) Inercia en agregados económicos: Algunas variables económicas muestran inercia o

persistencia, es decir el valor que toman en un periodo es muy similar al de periodos sucesivos, como por ejemplo el PIB.

5.3. Modelo de retardos distribuidos. Atendiendo a lo visto hasta ahora podemos distinguir entre: Modelos estáticos: Las variables explicativas son contemporáneas con la variable endógena. ⋯ t = 1, 2, 3,..,,T.

ó ⋯ ∀i = 1, 2, 3,…,n.

Modelos dinámicos: Dentro de éstos podemos encontrar dos grandes subdivisiones atendiendo al comportamiento respecto al tiempo de las variables explicativas y de la variable endógena. Así hablaremos de:

a) Modelos de retardos distribuidos: Son aquellos en los que la o las variables explicativas

exógenas aparecen tanto en el momento actual (valores contemporáneos) como en momentos anteriores del tiempo (valores retardados). En otras palabras son modelos en los que la influencia de las variables exógenas sobre la explicada (endógena pura) no se agota de un único periodo, sino que perdura en el tiempo. Por ejemplo tendríamos el siguiente modelo:

De forma abreviada podemos expresar un modelo de retardos distribuidos como:

donde1: = ⋯

En el ejemplo concreto planteado tendríamos (con sólo dos retardos):

1 Al término se le denomina operador polinomial de retardos.

Page 65: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

65

donde: =

Gráficamente el ajuste de un modelo con retardos distribuidos se podría representar como:

Un ejemplo de este tipo de modelos es el de la relación entre inversión en capital de una empresa o una economía y el nivel de producción, puesto que el efecto del nivel de inversión se reflejará en la cuantía de la producción durante varios periodos de tiempo posteriores a la inversión. O el efecto de la variación del precio del petróleo sobre el precio de los alimentos.

Modelos de retardos distribuidos finitos (MRDF): Hablaremos de MRDF en

el caso en el que el número de retardos sea finito, es decir el efecto total de un impulso en una variable explicativa se reparte en un número finito de periodos posteriores de tiempo. ∑ ∀j <∞

Modelos de retardos distribuidos (infinitos) –MRD-: En el caso en el que el número de retardos sea infinito, es decir el efecto total de un impulso en una variable explicativa se reparte en infinitos periodos posteriores de tiempo.

En este caso resultaría imposible estimar el modelo (por sus infinitos términos) salvo que impongamos algún supuesto sobre la distribución o evolución de los coeficientes (β). Los supuestos más empleados son los de Koyck y Jorgenson, que veremos a lo largo del tema 6.

b) Modelos autorregresivos2: Son aquellos en los que la variable endógena o explicada aparece

como explicativa retardada uno o más periodos de tiempo. De esta forma se pretende enriquecer el modelo mediante la inclusión de la información sobre la relación entre la variable endógena y ella

2 Autoregressive en inglés.

t-3 t-2 t-1 t t+1 t+2 t+3 ……..……….………..

Tiempo

Demanda T

β1

β2

β3 ∑ efecto total

Page 66: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

66

misma en el pasado. En este caso la variable endógena retardada debe ser considerada como un regresor estocástico.

5.4. Características de los modelos dinámicos.

Como se ha subrayado en los epígrafes previos, en un modelo dinámico las variaciones en una variable endógena se reparten a lo largo del tiempo, de forma que en éstos modelos podremos hablar de relaciones a corto plazo y de relaciones a largo plazo, siendo los valores de Y a lo largo del tiempo los que describirán la trayectoria temporal de la reacción económica.

• Tipos de trayectoria. En un modelo dinámico un cambio en una variable explicativa retardada produce un cambio en el valor de la variable explicada3 que se puede representar en el tiempo describiendo lo que se denomina la trayectoria temporal de la reacción. Esta trayectoria puede ser monótona o bien oscilatoria.

La trayectoria temporal se “agotará” cuando la variable endógena tome un valor de

equilibrio a largo plazo; entendiendo por situación de equilibrio a largo plazo aquella en la que el valor de la variable endógena (Y) no cambia4.

a) Trayectoria Monótona: Una trayectoria es monótona cuando es o bien creciente o bien

decreciente a lo largo de todo el periodo muestral, es decir cuando no presenta oscilaciones. Esto será así cuando la raíces características del sistema sean reales positivas.

Creciente Decreciente

3 Partiendo de una situación de desequilibrio. 4 En esa situación de equilibrio se cumplirá que: ∗ , que si se incluye en nuestro modelo dinámico: ", arrojará la siguiente expresión de equilibrio a largo plazo: #∗ $$% &$%'&∗ () (1.4.1) Este modelo dinámico en situación de equilibrio guarda gran similitud con un modelo estático, de ahí que se suela afirmar que a todo modelo dinámico le corresponde un modelo estático, pero no a la inversa, puesto que hay infinitas trayectorias temporales que pueden conducir a una misma situación de equilibrio a largo plazo.

t

Raiz positiva

t

Yt Yt

Page 67: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

67

b) Trayectoria oscilatoria (u oscilante): En el caso en el que las raíces características sean reales negativas la trayectoria sería oscilatoria (con forma de dientes de sierra), y si fueran complejas conjugadas daría lugar a una componente oscilatoria (cíclica).

• Condición de estabilidad: Tal como vimos anteriormente, en un modelo estático el valor

de la variable endógena es una cantidad fija en función del valor que toma la/s variables exógenas, puesto que no habrá una distribución de retardos5. Así, sea el modelo estático:

si ⋯ ∗, el valor de es único para cada periodo: ∗ ∗ En cambio, en el siguiente modelo, que es autorregresivo: "

podremos afirmar que se cumple la condición de estabilidad cuando el comportamiento de en el largo plazo no sea explosivo, es decir cuando el efecto de una variable en un periodo sobre el de sus valores futuros se agota con el tiempo (∑ * ∞). Así un modelo será estable cuando:

a) Ante una variación puntual en el valor de una variable explicativa, la variable dependiente retorna a su valor de equilibrio.

b) Ante una variación permanente en el valor de una variable explicativa, la variable dependiente evoluciona hacia un nuevo valor de equilibrio.

En términos generales diremos que un sistema es estable (o amortiguado) cuando los módulos de todas las raíces características6 son inferiores a “1”. En caso contrario el sistema sería explosivo. Gráficamente, los sistemas representados en la página anterior son todos estables.

Como ejemplo de sistemas explosivos podemos plantear:

5 Si no se tiene en cuenta el término de error (ut). 6 En una ecuación dinámica analizaremos la ecuación característica que resulta de la parte autorregresiva del modelo.

Yt

t t

Yt Yt

Page 68: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

68

El gráfico de la izquierda representa una trayectoria monótona explosiva (raíz positiva>1), y el de la derecha una trayectoria oscilante explosiva (raíz negativa<-1).

Veamos esto analíticamente. Si obviamos el término de error en un modelo autorregresivo

tendremos (suponiendo que la trayectoria temporal se extiende desde el momento “1” hasta el momento “t”):

" + " + "" " … "

La tendencia será estable si el límite cuando t tiende a ∞ es “0” (lim∞ 0=0). Es decir cuando: lim1→ ="=0 si |%$| * 1 De ahí que |"| * 1sea la condición de estabilidad del sistema.

Veamos un ejemplo genérico: Determine, partiendo de la ecuación característica, qué condiciones deben cumplir los valores de los parámetros para que podamos hablar de estabilidad del siguiente modelo: Solución: Si reescribimos la expresión anterior de forma que los términos que describen la trayectoria temporal se encuentren en el lado izquierdo de la igualdad (y prescindiendo del término de perturbación) tendríamos: 5 5 En este modelo la ecuación característica vendría definida por: 6 5 6 5 0 Las posibles soluciones a este polinomio se obtendrán de:

6, 6 89 42 Por tanto, para que se pueda hablar de estabilidad en el modelo deberán cumplirse las siguientes restricciones:

• || * 1. • || * 2. • * 1. • 5 * 1.

Veamos ¿por qué?: Para que el modelo sea estable las soluciones del polinomio que representa la ecuación característica, según vimos más arriba, tienen que cumplir |<$| * 1 y |<&| * 1.

Page 69: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

69

Además como:

6 >?@A>?B@C>B 6 >?A>?B@C>B

Entonces: 5<$ ∗ <& D& (término independiente de la ecuación característica) De lo que se puede inferir que: || * 1 De forma similar como: <$ <& D$ Entonces: || * 2 Por último puesto que:

6 9 42 * 1

Entonces:

A>?B@C>B * 1 5 >? (1.4.1)

Si tenemos en cuenta que: || * 2 Entonces ||2 * 1

Por lo que la desigualdad (1.4.1) recoge en ambos miembros términos positivos, que al ser elevados al cuadrado harán que se mantenga la relación: * 1. Análogamente, puesto que:

6 59 42 E 51

Se infiere: 9 42 * 1 2

Como: ||2 E 51

Page 70: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

70

Podemos concluir que: 44 * 1 4

D& 5 D$ * 1

• Multiplicadores: Los multiplicadores cuantifican el efecto que tendrá una variación unitaria en una variable explicativa sobre la variable explicada7. En otras palabras muestran el efecto de una variación en sobre transcurrido un determinado número de periodos de tiempo. Supongamos que tenemos el siguiente modelo:

Podremos cuantificar un conjunto de multiplicadores diferentes, para cada período de tiempo, así como un multiplicador total8, que resultará de agregar los multiplicadores obtenidos para cada período de tiempo. Desde una perspectiva más amplia podemos distinguir los siguientes tipos de multiplicadores (en un modelo dinámico)9:

a) Multiplicador de impacto (o multiplicador de corto plazo):

F ∆∆

Éste equivale al multiplicador en el modelo estático, puesto que es el cambio que se produce en la variable explicada ante un cambio en una variable explicativa en el momento temporal en que se produce. A este multiplicador también se le denomina derivada a corto plazo, puesto que se puede definir por analogía con la expresión anterior como: GG

b) Multiplicadores intermedios de orden q:

FH ∆@H∆

Éstos cuantifican el impacto sobre la variable explicada de un cambio en una variable explicativa en un momento “q” períodos después de que se produzca el cambio en la variable explicativa.

7 En un contexto de modelos estáticos Keynes definió los multiplicadores como la relación entre el efecto (Y) y su causa (X). En un modelo estático tal como: El multiplicador tomará el valor:

IJ?KILBK . 8 El cálculo de este tipo de multiplicadores sólo tiene sentido si el modelo es estable, puesto que en caso contrario no podremos confiar en la validez real de la cuantificación obtenida. 9 En general a los parámetros se les denomina coeficientes de reacción.

Page 71: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

71

c) Multiplicador total (o multiplicador de largo plazo): ∆@

Resulta de la agregación de todos los multiplicadores intermedios hasta el momento “T”, o lo que es lo mismo representa la reacción total de la variable explicada ante un cambio en la variable explicativa (variable endógena retardada o exógena). A este multiplicador también se le denomina derivada a largo plazo, puesto que se puede definir por analogía con la expresión anterior como: G∗G∗

Siendo ∗y ∗ situaciones de equilibrio. El cálculo de los multiplicadores dinámicos planteados requiere el conocimiento de las condiciones iniciales. En función del objetivo perseguido por el análisis habrá que fijar unas u otras condiciones iniciales:

a) Si se pretende analizar las condiciones dinámicas del modelo (estabilidad, monotonía, etc.) es necesario partir de las condiciones iniciales que caracterizan a una situación de equilibrio. Los multiplicadores resultantes se denominan multiplicadores dinámicos o de equilibrio, y representan una alternativa a la ecuación característica para analizar las propiedades dinámicas características del sistema.

b) Si se pretenden analizar el efecto de una medida de política económica, se requerirán las condiciones reales (mediante simulación) como condiciones iniciales de interés.

Ejemplo: Determine los multiplicadores dinámicos en el siguiente modelo de consumo agregado:

M 5,04 0,66P 0,28M

En este modelo macroeconómico tendríamos los siguientes valores para los multiplicadores: Multiplicador de impacto (corto plazo):

GMGP 0,66

a) Multiplicadores intermedios:

• De primer orden: M → M: 0,66 ∗ 0,28 0,1848. • De segundo orden: M → M: 0,66 ∗ 0,28 0,052. • De tercer orden: M → M+: 0,66 ∗ 0,28+ 0,014. • … • De orden q-ésimo: MH → MH: 0,66 ∗ 0,28H

b) Multiplicador total (a largo plazo): Multiplicador total (o multiplicador de largo plazo):

∆@H∆S

Page 72: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

72

Resulta de la agregación de todos los multiplicadores intermedios hasta el momento “q”, o lo que es lo mismo representa la reacción total de la variable explicada ante un cambio en la variable explicativa. En el modelo dinámico planteado la derivada a largo plazo adoptaría el valor: G∗G∗ 1 5 "

Lo que implica que en el largo plazo el impacto total de cambios en X2 sobre Y será igual a TBU.

Teniendo en cuenta la condición de equilibrio a largo plazo que obtuvimos en (1.4.1), tendremos que el multiplicador total será:

0,661 5 0,28 0,916

o alternativamente: ∑ 0,66 ∗ 0,28S 0,661 0,28 0,28∞S 0,28+ ⋯ 0,28S 0,66 ,W 0,916.

Esto implica que transcurridos dos periodos se ha producido el 97,9%, resultante de sumar

0,66+0,1848+0,052) y dividir el resultado (0,8968) entre el multiplicador total (0,916) del total del impacto de la inversión sobre el consumo.

En resumen, lo que nos indican estos multiplicadores es que un incremento de una unidad en los ingresos de los hogares se traduce en un aumento de 0,66*0,28 unidades en el consumo al transcurrir el primer momento temporal (1 año, 1 mes, etc.), y que en el largo plazo ese efecto de los ingresos se acumula hasta conseguir un aumento del consumo de 0,916. Es decir según este modelo cuando los consumidores ajustan su comportamiento (en el largo plazo, cuando t→ ∞) terminan destinando casi el 92% de sus incrementos de renta a consumo.

- Retardo medio y retardo mediano: Al igual que hacíamos en estadística cuando

definíamos medidas de tendencia central (media, mediana, etc.) y dispersión (varianza) en lo que sigue vamos a proceder definiendo estas medidas en el contexto de los modelos de retardos distribuidos.

• Retardo medio: La idea que subyace en el cálculo del retardo medio es la de informarnos

si el impacto, sobre la variable endógena de una variación de la exógena, está muy concentrado o diluido en el tiempo. En concreto, el retardo medio se define como el promedio ponderado de todos los retardos que se especifican en un modelo. En otras palabras, es una media ponderada del impacto a lo largo del tiempo de cada retardo. Para cuantificar este promedio tendremos que definir las ponderaciones (wj), que de una forma sencilla podemos definir como:

Y ∑ ∞

En otras palabras, esas ponderaciones corresponden a una normalización de los coeficientes, puesto que al dividir cada coeficiente por la suma total de coeficientes, cada coeficiente normalizado nos estará indicando la proporción del efecto total ( ∑ ∞ ) que se produce en cada momento temporal (j). De esta forma si todos los tienen el mismo signo entonces: 0 * Y * 1 y ∑ Y∞ =1. Como señala Otero (1994) “…la ventaja de operar con las ponderaciones (Yen vez de con los es que la estructura temporal del retardo puede describirse mediante funciones de distribución de probabilidad y aprovechar los resultados de la Estadística Teórica en esta área”. En el caso del modelo de Koyck (que veremos en el tema 6): Z[ [∑ [∞[\$ %[]]$^% =%[$ 5 %

Page 73: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

73

Por tanto el retardo medio que será la suma de esas ponderaciones tomará el valor:

_Y ∞

_"1 5 " ∞

1 5 "_" 1 5 "`" 2" 3"+ ⋯b ∞

1 5 "``" " "+ ⋯b `" "+ ⋯b `"+ ⋯b= UU. En el ejemplo presentado anteriormente (página 14) para medir la relación entre consumo e ingresos, que venía expresada mediante la siguiente ecuación: M 5,04 0,66P 0,28M El retardo medio será el resultado de: 0,281 5 0,28 ≅ 0,39

lo que implica que el retardo medio se sitúa en torno a 0,39 años (o en la unidad temporal en la que vengan expresadas las variables del modelo). En otras palabras, un cambio en los ingresos afectará al consumo agregado, por término medio, casi 5 meses10 después.

• Retardo mediano: Es el tiempo (retardo) necesario para que se produzca el 50% del efecto (reacción) de los cambios en la variable explicativa sobre la variable explicada. O, lo que es lo mismo, el tiempo que tarda en producirse la mitad del impacto sobre la variable explicada ante una variación en la variable explicativa. En términos algebraicos tendríamos que el retardo mediano adoptaría la expresión:

"de 0,5 → 0 ∗ fgh" fgh0,5 → ) ijk], lijk%

Siguiendo con el ejemplo anterior, el retardo mediano en el ejemplo del modelo de consumo sería:

0 fgh0,5fgh0,28 0.544

Por tanto el retardo mediano es 0,544 años, es decir aproximadamente seis meses y medio. Es importante resaltar que en el caso en que se quiera calcular, por ejemplo, el momento en el que se produce el 30% de la reacción (percentil 30) habría que calcular:

0 fgh0,7fgh0,28 0.280

10 Resulta de multiplicar 0,39 por los meses de un año (12).

Page 74: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

74

Tema 6: Especificación y Estimación de MRD.

6.1. Introducción. En el tercer epígrafe del tema 5 vimos la diferencia entre los modelos con retardos distribuidos finitos (MRDF) e infinitos (MRD). Recordemos, un MRDF adoptará la forma general:

H

En cambio un MRD infinitos:

Es importante resaltar que la formulación de un MRD infinitos no implica que haya infinitos términos sino que el efecto de los retardos es muy persistente en el tiempo y sólo se diluyen una vez hayan transcurrido un número muy elevado de periodos. Obviamente un serio problema al que se enfrenta el investigador cuando intenta estimar los MRD infinitos es el de la dificultad para estimar una sucesión muy elevada de parámetros a partir de un conjunto finito (y en muchas ocasiones muy reducido) de observaciones. De ahí la necesidad de imponer restricciones a priori para acotar el número de términos [ a estimar11.

En el tema 6 vamos a profundizar en esos tipos de modelos, analizando cómo estimar las distintas variantes que se pueden presentar de cada uno de ellos. Comenzaremos en el epígrafe 2 con los MRDF, distinguiendo entre la estimación de sus parámetros imponiéndo (epígrafe 6.2.1.) o no (epígrafe 6.2.2.) restricciones sobre los mismos.

6.2. MRDF.

6.2.1. MRDF sin restricciones (o no restringido).

Partiendo de la expresión vista anteriormente para el MRDF, y suponiendo que se cumplen las propiedades vistas en los temas de Econometría I para el modelo de regresión lineal general (MRLG), tendríamos:

H

En este contexto si conocemos el valor de q, es decir si la longitud en el tiempo del retardo es conocida la estimación del modelo se llevaría a cabo tal como se planteó en el mencionado MRLG, sin que se plantearan dificultades especiales.

Pero la estimación de MRDF sin imponer restricciones a los parámetros no resulta, en general, de gran utilidad práctica debido a la dificultad para conocer “q” a priori. Si truncamos artificialmente el modelo para un determinado número de retardos sin estar avalados por un

11 Otra operación útil en el análisis de series temporales es el de “primera diferencia” que se define como: ∆') ')-')$ Esta operación guarda una relación estrecha con el operador de retardos: ∆') $ 5 ') Análogamente: ∆&') $ 5 &') $ 5 & &') ') 5 &')$ ')&

Page 75: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

75

conocimiento previo de la longitud del retardo estaríamos ante el riesgo de cometer un error de especificación por omisión de variables relevantes (o inclusión de irrelevantes), lo que invalida los coeficientes obtenidos por MCO, pues serían sesgados, al igual que lo sería la varianza residual (en el caso de inclusión de variables irrelevantes el estimador será insesgado pero no eficiente).

Una forma de actuar en este caso es aplicar MCO a las especificaciones que resultan de

considerar recursivamente valores crecientes para el número de retardos (q=0, 1, 2, 3,…), es decir actuaremos buscando una especificación con el número adecuado de retardos, con las dificultades aparejadas a esto; pararemos en el momento en que los coeficientes que obtengamos cambien de forma substancial entre dos regresiones consecutivas. En otros términos, cuando se comience a observar un comportamiento errático en los valores de los parámetros. Este procedimiento si bien es muy flexible presenta un gran inconveniente, que resulta de que cuanto mayor sea el número de retardos incluidos mayor será la probabilidad de correlación entre los regresores (multicolinealidad, debida a la similitud de los valores retardados de la variable/s entre sí), lo que conduce a una estimación imprecisa por MCO, puesto que los errores (desviaciones) estándar de los estimadores tienden a ser grandes (es decir el estimador por MCO en este contexto no es eficiente) en relación con los coeficientes estimados, lo que nos llevaría (a través de los correspondientes “t” test) a rechazar –artificialmente- la significatividad de algún/os coeficiente/s. Igualmente es probable que la hipótesis de independencia entre los términos de perturbación sea difícil de mantener (habrá correlación serial12), y análogamente los estimadores por MCO no serán adecuados ya que, en general, no se disponen de series temporales largas, por lo que al tener que estimar muchos parámetros con pocas observaciones dispondremos de pocos grados de libertad (disminuyendo así la precisión de las estimaciones); igualmente la introducción de sucesivos retardos hace que se pierdan observaciones.

Otro procedimiento para detectar el tamaño “idóneo” de q es el de comparar el coeficiente de

determinación corregido (o ajustado) de las especificaciones que resultan de considerar recursivamente valores crecientes para el número de retardos. Siendo el coeficiente de determinación corregido:

op 1 5 qMor 5 6qMsr 5 1 1 5 r 5 1r 5 6 1 5 o 1 5 6r 5 6 r 5 1r 5 6 o

De forma similar se puede recurrir al criterio de información de Akaike (AIC)13: tPMu 2us ln wqMos x

De tal forma que, partiendo de un valor máximo Q (siempre que conozcamos alguno), siendo u y z, se elegirá de entre las especificaciones que hayamos formulado la que presente menor valor en el cálculo de este criterio. Alternativamente, partiendo de un valor para Q, se pueden especificar modelos con alternativos valores de q y contrastar mediante un test de significación conjunta de los últimos Q-q coeficientes, si éstos son o no diferentes de 0. En el momento en que el contraste permita rechazar la no significatividad de los coeficientes (es decir, aceptar su significatividad) habremos conseguido una solución para la longitud de q. Todas estas alternativas tienen ventajas e inconvenientes, y en general la elección de uno u otro criterio dependerá del analista. Por ejemplo la aplicación del criterio de Akaike tiende a la inclusión por

12 Recuérdese que el término correlación serial de las perturbaciones entre periodos es sinónimo del de autocorrelación. 13 Este criterio de selección entre especificaciones alternativas ya se estudió dentro del contenido de la asignatura Econometría I.

Page 76: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

76

exceso de variables explicativas, aunque, a diferencia del método recursivo, nos evita tener que determinar por nosotros mismos en qué momento debemos parar de incluir retardos.

6.2.2. MRDF con restricciones.

Las dificultades que plantea la estimación de los MRDF en el caso de que no se impongan restricciones sobre los parámetros lleva a la necesidad de plantear, en muchos casos, MRDF a los que se les impone a priori una determinada forma temporal; aunque con esto tengamos que perder parte de la flexibilidad en la estimación El objetivo de la imposición de restricciones será por tanto minimizar todo lo posible el número de parámetros a estimar, reduciendo de esta forma potenciales problemas de multicolinealidad entre los regresores.

Las aplicaciones empíricas en este campo han aportado un conjunto amplio de hipótesis acerca

de las posibles formas temporales que se pueden imponer a priori a un MRDF. Vamos a presentar las más utilizadas en la práctica, distinguiendo las que resultan de asumir que los parámetros están afectados por un sistema de ponderaciones (suponiendo una determinada estructura para esas ponderaciones), de las que parten de aproximar los mediante las ordenadas de una función polinomial.

6.2.2.1. Ponderaciones.

Dentro de las posibles ponderaciones que se les puede asignar vamos a distinguir las decrecientes (retardo aritmético y geométrico) y las que primero crecen y después descienden (retardo en forma de V invertida). El caso de los retardos geométricos lo abordaremos en la segunda parte del Tema 6 para dar más coherencia a la estructura expositiva. Veamos, por tanto, a que nos referimos cuando hablamos de una estructura aritmética de retardos y una en forma de V invertida.

• Retardo aritmético14: Implica que los coeficientes decrecen de acuerdo con una

progresión aritmética. Fue Fisher (1937) el que expuso la posibilidad de que las ponderaciones siguieran este tipo de progresión. Según su planteamiento si se puede asumir que los efectos de la variable explicativa retardada son insignificantes a partir del cuarto periodo tendríamos que estimar la siguiente especificación15:

5 4 3 2+ C/15

A partir de esa expresión tomaríamos el contenido del paréntesis como “la variable explicativa” estimando de esta forma . En cuanto al número de retardos, para obtenerlo podríamos especificar modelos con diferente número de retardos y determinar qué modelo resulta conjuntamente más explicativo. Para obtener el valor de cada una de las ponderaciones simplemente plantearemos que las ponderaciones (Y) siguen una progresión aritmética asignándole el valor 1/∑ YH@ al mayor de los retardos y de forma creciente conforme nos acercamos en el tiempo al momento “t”.

• Retardo en forma de V invertida: De Leew muy posteriormente (1962) planteó otra ley de formación de ponderaciones que da lugar a una estructura temporal que tiene forma de V invertida

14 Sirva como recordatorio que en una progresión aritmética cada término es el anterior aumentado (o disminuido) en una misma cuantía (a la que denominaremos razón de la progresión aritmética). 15 En esta especificación el multiplicador de impacto sería /3, el de segundo orden sería /5 y el total .

Page 77: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

77

(Λ). En concreto, si se puede asumir que los efectos de la variable explicativa retardada son insignificantes a partir del quinto periodo tendríamos que estimar la siguiente especificación16:

2 3 3+ 2C |/12 A partir de esa expresión tomaríamos el contenido del paréntesis como “la variable explicativa” estimando de esta forma .

Esto no quiere decir que éstas sean las únicas leyes de formación “validas”, sino que son dos de las más observadas y fáciles de poner en práctica. Otra posible alternativa es observar el comportamiento de los datos y tratar de buscar una ley de formación que se aproxime lo mejor posible al comportamiento temporal observado de la/s variable/s.

6.2.2.2. Polinomios. En la modelización de algunos fenómenos económicos el número (longitud) de retardos puede

ser muy alto, lo que (como vimos anteriormente) puede generar problemas de colinealidad entre los regresores17. Para solventar estos problemas en esa subsección vamos a recurrir a un supuesto bastante extendido en términos de modelización de retardos, que es el de suponer que la estructura real de distribución de los coeficientes de los retardos puede ser aproximada por un polinomio18 de orden p – que, en principio, debe ser de orden no muy elevado19-. A este tipo de retardos distribuidos polinomiales se les suele denominar retardos de Almon20. De esta forma lo que estamos suponiendo es una determinada función polinomial para la distribución de los retardos:

∀_ 0,1,2,… , u y ∀u E (5.3.2.1)

El éxito de esa formulación reside en su flexibilidad, puesto que una función polinomial, dentro de un intervalo dado, permite aproximar cualquier otra función sin necesidad de que el número de regresores sea demasiado elevado (es decir sin que el grado del polinomio sea excesivamente alto). Hay una cuestión, no obstante, de mucha relevancia en la asunción de esta hipótesis de Almon, y es la de determinar cuánto deben valer p y q. Esto lo veremos una vez que hayamos clarificado cómo estimar los valores de con base en este supuesto. Para ello tendremos que ir dándole valores a j: + ⋯ ~ 2 2 +2+ ⋯ ~2~ + 3 3 +3+ ⋯ ~3~

16 El multiplicador de largo plazo o multiplicador total sería, también en este caso, el valor de . 17 Estos problemas pueden ser especialmente marcados en el caso en que se trabaje con variables macroeconómicas, pues éstas, al ser agregados, suelen mantener mayor estabilidad en el tiempo. 18 Esta aproximación se basa en el Teorema de Weierstrass, según el cual si una función (f) está acotada en un intervalo cerrado podremos aproximarla por un polinomio. 19 Si fuera elevado es como si no tuviéramos restricciones, por lo que volveríamos al problema inicial, invalidando el procedimiento. 20 Recibe esta denominación porque fue S. Almon en su publicación de 1965 “The distributed lag between capital appropriations and expenditures” (Econometrica, n. 33, pp. 178-196) el que la desarrolló. En concreto la aplicó a un modelo en el que se explicaba la dotación de reservas que realizaban un elevado número de empresas de diferentes sectores de actividad, durante los diferentes trimestres del periodo 1953-1961.

[ ] $[ &[& [ ⋯ [

Page 78: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

78

H u u +u+ ⋯ ~u~

En el gráfico 2.3.2 se han representado dos de las posibles distribuciones polinomiales que pueden aproximar a la distribución de los . En concreto en el gráfico de la izquierda se muestra una representación del valor de los en el tiempo cuando el mejor ajuste es un polinomio de segundo grado, y en la parte derecha cuando es más realista emplear un polinomio de tercer grado.

Gráfico 2.3.2. Representación de la hipótesis de Almon. Sustituyendo las ponderaciones en la expresión general del MRDF obtenemos lo siguiente:

+ ⋯ H 2 3+ ⋯ uH 2 3+ ⋯ uH + 2+ 3++ ⋯ u+H … ~ 2~ 3~+ ⋯ u~H (6.3.2.2)

Por tanto, cada término de la ecuación se compone de una combinación lineal de retardos de la variable explicativa. Este modelo puede ser estimado sin problemas por MCO o por MCG (Mínimos Cuadrados Generalizados); éste último método de estimación se empleará en el caso en que los residuos presenten problemas de autocorrelación (y en general en el caso en el que las perturbaciones sean no esféricas -como consecuencia de “problemas” en la matriz de varianzas y covarianzas de las perturbaciones-).

Es interesante subrayar que en el modelo original de retardos distribuidos finitos teníamos q+1 parámetros a estimar y, sin embargo, en el modelo transformado siguiendo la hipótesis de Almon sólo tenemos p+1 (siendo * u. En otras palabras, se ha reducido el número de parámetros a estimar (en q-p parámetros), que fue nuestro objetivo prioritario –para reducir potenciales problemas de multicolinealidad-. En la práctica esa “reducción” del número de parámetros a estimar al pasar del modelo original al que asume la hipótesis de Almon (q-p) equivale a aplicar restricciones de igualdad a “0” sobre esos q-p parámetros.

• Determinar p y q. Consecuencias de p y q erróneos. Dos cuestiones inmediatas que surgen al plantear la hipótesis de Almon son: ¿Cómo determinar el grado del polinomio, es decir cómo determinar el valor de “p”? y ¿Cómo determinar el número de retardos, es decir como determinar el valor de “q”?. Si no se conocen esos valores partiendo de la Teoría económica, habrá que realizar contrastes de hipótesis sobre modelos alternativos para diferentes valores de p y q hasta alcanzar un modelo lo más satisfactorio posible.

j

|

|j

Page 79: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

79

6.3. Especificación y estimación de MRD infinitos. En la primera parte del tema hemos analizado el caso en el que los retardos del modelo tienen

una estructura finita, es decir la influencia sobre la variable explicada de la variable o variables explicativas no es significativa después de un determinado número (q) de períodos. Pero la mayoría de los fenómenos económicos requieren de un supuesto menos restrictivo. Además, incluso en el caso de que podamos asumir una estructura temporal finita para los retardos, existe una elevada dificultad para estimar estos modelos puesto que, en general, tendremos que recurrir a una forma polinomial, lo que implica la dificultad de determinar un valor para el orden del polinomio y para la longitud de los retardos. Para resolver estas cuestiones en esta última parte del tema plantearemos como alternativa los modelos cuya estructura de retardos es infinita.

Una primera aproximación para estimar este tipo de modelos de infinitos retardos es la

estimación ad hoc. La estimación de los parámetros en un modelo con retardos distribuidos infinitos partiendo de este método implica suponer que la variable explicativa X y sus retardos no son variables aleatorias o no están correlacionadas con el término de perturbación. Si esto es cierto podremos aplicar MCO empleando un modelo secuencial en el que se irán introduciendo progresivamente un mayor número de retardos de X. ¿Qué problemas plantea esto?

a) No hay conocimiento previo de la longitud máxima del retardo. b) Cuanto mayor sea la longitud del retardo menor será el número de grados de libertad

para estimar. Tal como se subrayó en la introducción del tema, estimar un número muy elevado de parámetros partiendo de un número de observaciones, por lo general, reducido resulta difícil o incluso, en muchos casos, imposible.

c) Los valores de los retardos suelen presentar problemas de autocorrelación y multicolinealidad.

Para evitar esto la literatura relativa a los modelos de retardo ha planteado la posibilidad de que

la sucesión de parámetros se aproxime por una sucesión indefinida que siga una ley de formación conocida y que, precisamente, el conocimiento de esa ley de formación permita que la especificación quede determinada por un número reducido de parámetros. En las dos secciones de este epígrafe vamos a ver algunas de esas leyes de formación.

En el cuarto epígrafe de este tema se pretende dar un paso más en la comprensión de los

MRD infinitos al aportar una visión de este tipo de modelos desde la óptica de su aplicabilidad en el contexto de los modelos de Teoría Económica. Es decir, acercaremos los modelos de retardos distribuidos a la lógica de comportamiento de los agentes económicos.

Finalizaremos el tema presentando en el epígrafe 5 las técnicas habitualmente empleadas para

la estimación de los MRD. Con este último epígrafe daremos por concluido el análisis de modelos dinámicos.

6.3.1. MRD infinitos: Modelo de retardo geométrico (Koyck)21.

Una de las leyes de formación de los retardos, en un MRD infinitos, más extendidas en la literatura es la que considera que la sucesión de coeficientes para las variables decrecen de acuerdo a una progresión geométrica. Al modelo resultante de aplicar este tipo de suposición (transformación) se le conoce como modelo de Koyck. Esa transformación parte de la idea de suponer que todos los tienen el mismo signo –no cambian- y siguen una progresión geométrica decreciente (de razón

21 Recordemos que en una progresión geométrica cada término es el anterior multiplicado (o dividido) en una misma cuantía (a la que denominaremos razón de la progresión geométrica).

Page 80: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

80

%). En otras palabras, esta hipótesis implica que a medida que el número de retardos aumenta menor es la influencia de la variable retardada sobre la variable explicada (Yt). Así, partiendo de un MRD infinitos que se expresa de forma genérica como:

]') ++ ⋯ El modelo de retardos geométricos se obtiene del cumplimiento de la siguiente relación: < %<$ con 0 * " * 1

y asumiendo que todos los tienen el mismo signo. La condición 0 * " * 1 se impone para garantizar que ∑ [∞ es convergente22 (de esta forma evitamos que los valores pasados de X tengan más impacto sobre Y conforme retrocedemos en el tiempo). En otros términos la restricción sobre "implica que la reacción es estable (|| * 1 y que la trayectoria es monótona (>0). A " se le conoce como la tasa de descenso del impacto y (1 5 ") será la velocidad de ajuste; puesto que cuanto mayor sea " más lenta será la reacción de la variable explicada ante un cambio en la explicativa, y viceversa. Utilizando esta transformación de Koyck nos aseguramos que la suma total de impactos sobre la variable explicada sea una cantidad finita23. En concreto el impacto (en el momento j) se podrá expresar como: [ %[] Por lo que podríamos escribir: [ %[$ %[]

Así el modelo de retardos geométrico adoptaría la expresión:

"∞

∀|"| * 1 En este modelo el multiplicador de impacto (o de corto plazo) sería , ¿Pero cuánto valdría el multiplicador total (o de largo plazo)?. Recordemos que, por definición, el multiplicador de largo plazo resulta de la agregación de todos los multiplicadores intermedios, o lo que es lo mismo representa la reacción total de la variable explicada ante un cambio en la variable explicativa. En este sentido el multiplicador total será: ]$ % %& % ⋯ ]$ 5 %

Veamos con un modelo de demanda de dinero24 (simplificado) cómo se obtiene esta

transformación: o "o "o ⋯ ~0, I (6.3.1.1)

22 La condición de que " E 0 no es imprescindible, podríamos aplicar la condición |"| * 1, aunque se suele imponer pues es más realista desde un punto de vista práctico, ya que si no imponemos que " E 0 el signo de los coeficientes se alternarían entre positivos y negativos (lo cual es bastante inusual). 23 Este tipo de especificación resulta de escasa operatividad cuando los efectos retardados se manifiestan suavemente al principio. 24 Siendo o la Renta Permanente.

Page 81: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

81

Pero la expresión anterior sigue teniendo infinitos retardos, por lo que seguiremos sin poder estimarla. Sin embargo mediante dos simples pasos podemos derivar una especificación que resulta estimable. Para ello, en primer lugar, retardamos un periodo la ecuación (6.3.1.1) y la multiplicamos por la tasa de descenso del impacto (también denominado factor de descuento temporal), obtenemos: " " "o "o "+o+ ⋯ " (6.3.1.2)

Si a la expresión (6.3.1.1) le restamos la (6.3.1.2), y agrupamos, obtenemos el siguiente modelo, que es el resultado de aplicar la transformación de Koyck:

5 " 1 5 " o 5 " 1 5 " o%)$ 5 " 1 5 " o%)$ (6.3.1.3) Empleando la nomenclatura de nuestro modelo genérico tendríamos: 1 5 " %#)$ (6.3.1.4) A este tipo de ecuación se le denomina forma autorregresiva (AR), puesto que aparece la variable endógena retardada como variable explicativa) o forma final del retardo distribuido. Este es un Modelo Dinámico Autorregresivo (1,0), teniendo en cuenta que la forma genérica para cualquier Modelo Dinámico Autorregresivo (n,m), siendo n y m el número de retardos de la variable endógena y de la exógena, respectivamente, es: ⋯ D$#)$ ⋯ D#) Además es importante reseñar que la transformación de Koyck nos conduce a un modelo cuyo término de perturbación presenta una estructura MA(1).

A partir de la expresión (6.3.1.3) podremos estimar el valor de , " (coeficiente de ). Por tanto mediante la transformación de Koyck hemos pasado de un modelo en el que habría que estimar infinitos parámetros a uno en el que sólo hay que estimar ,]%. De ahí que mediante la transformación de Koyck podamos obtener el valor del multiplicador de impacto y del de largo plazo de forma sencilla. Además habremos reducido los potenciales problemas de multicolinealidad.

El valor de α, partiendo de los obtenidos en la transformación de Koyck, será:

∗ 1 5 " ⇒ ∗1 5 " En el gráfico (6.3.1.1) se muestra una representación de la distribución de los retardos en una transformación tipo Koyck, para distintos valores posibles de ".

Page 82: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

82

Gráfico 6.3.1.1. Retardos tipo Koyck

Pero esos beneficios no son gratuitos, puesto que ahora tendremos que enfrentarnos a dificultades a la hora de estimar este tipo de modelo transformado: la variable endógena retardada que actúa como explicativa (Y1está correlacionada con el nuevo término de perturbación ε1 u1 5λu1, y este último puede presentar problemas de autocorrelación, y los estimadores –como consecuencia de la presencia de estimadores estocásticos- serán sesgados e inconsistentes (sesgadez asintótica), por lo que sería conveniente recurrir a la estimación por Variables instrumentales. Volveremos más tarde sobre esta cuestión. Otras cuestiones aparejadas a esta transformación son:

a) Supone una trayectoria exponencial (al seguir los retardos una progresión geométrica).

b) El fundamento económico de esta transformación se suele cuestionar puesto que la transformación parte de un procedimiento matemático para facilitar la obtención de los valores de los parámetros en un modelo de infinitos retardos.

Una vez obtenido el valor de los parámetros podemos calcular medidas de tendencia del

impacto de los retardos, es decir podemos analizar las características dinámicas de este modelo: a) Estabilidad: Para determinar la estabilidad calcularemos:

- ∑ [∞[] * ∞ : ∑ ∞ ∑ ∞ "= ∑ "∞ =(1+" ⋯ "= 1 5 " * ∞

- i[→∞ [ lim→∞ " lim→∞ " ]

b) Tipo de trayectoria: Como " E 0 todos los tienen el mismo signo, por lo que la trayectoria es monótona (no oscilante).

c) Retardo medio: En el caso del modelo de Koyck las ponderaciones vendrán definidas por la expresión:

Z[ [∑ [∞[\] %[]]$^% =%[$ 5 %

0

2

4

6

8

10

12

0 1 2 3 4 5 6 7 8 9 10

Retardos

Lambda=0,9

Lambda=0,7

Lambda=0,5

Lambda=0,3

Page 83: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

83

Siendo esta ponderación la proporción en el momento “j” del impacto (multiplicador) de largo plazo o total. Por tanto el retardo medio que será la suma de esas ponderaciones (multiplicadas por el momento temporal en el que se producen) tomará el valor:

_Y ∞

_"1 5 " ∞

1 5 "_" 1 5 "`" 2" 3"+ ⋯b ∞

1 5 "`" " "+ ⋯b `" "+ ⋯b `"+ ⋯b=1 5 " UU UBU UU ⋯

="`1 " " ⋯b $

En el ejemplo presentado en el tema 5 para medir la relación entre consumo e inversión, que venía expresada mediante la siguiente ecuación: M 5,04 0,66P 0,28M El retardo medio valdrá: 0,281 5 0,28 ≅ 0,39

lo que implica que el retardo medio se sitúa en torno a 0,39 años (o en la unidad temporal en la que vengan expresadas las variables del modelo). En otras palabras, un cambio en la inversión afectará al consumo agregado, por término medio, casi 5 meses25 después. Además el modelo será estable, puesto que " 0,28* 1, y su trayectoria será monótona, puesto que " E 0. El retardo medio también podemos calcularlo haciendo uso del operador de retardos. Veamos cómo: ++ ⋯= " " "++ ⋯

′ " 2" 3"+ ⋯ 1 " " "+ ⋯=

T¡$%

1′ " 2" 3"+ ⋯= `" " "+ ⋯b `" "+ ⋯b `"+ ⋯b=

¢ "1 5 " "1 5 " "+1 5 " ⋯£ 1 5 " `" " "+ ⋯b

1 5 " "1 5 "

Por tanto el retardo medio: ¤′

¤ ¥¡?^¦ ¦?^¦¥¡?^¦ $.

25 Resulta de multiplicar 0,39 por los meses de un año.

Page 84: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

84

d) Retardo mediano: Recordemos que es el tiempo (retardo) necesario para que se produzca el 50% del efecto (reacción) de los cambios en la variable explicativa sobre la variable explicada26:

∑ T§§\¡∑ T§§\¡ =0,5

O, lo que es lo mismo, el tiempo que tarda en producirse la mitad del impacto sobre la variable

explicada ante una variación en la variable explicativa. En términos algebraicos tendríamos que el retardo mediano adoptaría la expresión:

0 ∑ Z 0,5 ∑ %[$ 5 % =0,5= 1 5 "`1 " " ⋯b Suma de los elementos de una progresión geométrica

limitada=1 5 " Ude^?∗UU 0,5 ⇒ $ 5 % ], l

⇒ "de 1 5 0,5 ⇒ 0 ∗ fgh" fgh0,5 → 0 fgh0,5fgh"

De esta forma el retardo mediano en el ejemplo del modelo de consumo: 0 ©ª«,|©ª«,W 0.544 años

Por tanto el retardo mediano es 0,544 años, es decir aproximadamente seis meses y medio. Nótese que si quisiéramos calcular en qué momento se ha acumulado el 70% de la reacción (es decir el decil siete, o percentil setenta) tendríamos que calcular:

" 0,3 → 0 ∗ fgh" fgh0,3 → 0 ijk], ijk%

En nuestro ejemplo, el retardo que acumula el 70% de la reacción sería: 0 ©ª«,+©ª«U ©ª«,+©ª«,W 0.946 años

6.3.2. MRDI: Modelo de retardo racional general (Jorgenson).

El modelo de retardos distribuidos geométricos es bastante restrictivo en cuanto a la distribución de los retardos. Por lo que es oportuno proponer un MRD infinitos más general, y que de esta forma permita abarcar más casuísticas.

En este sentido una aproximación más general27 que podemos adoptar para facilitar la

estimación de un MRD infinitos es la propuesta por Jorgenson (1966), que emplea lo que se conoce como estructura de retardo racional general, y cuya expresión es:

(6.3.2.1)

26 Vamos a denotar por “rm” el momento en el que se alcanza el 50% del cambio total. 27 Y que además permite mantener las ventajas del MRDF en la forma polinomial de Almon.

#) ∗ ¬­ ') ()

Page 85: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

85

con ~0, I , y donde y t son dos polinomios en L (operador de retardos) de orden m y n, respectivamente, siempre que m<n y que los polinomios no posean raíces comunes. La expresión anterior también se puede presentar como: ∗ (6.3.2.2)

donde ¤®¯®. La expresión del polinomio es: ++ ⋯ y t 5 5 5 ++ 5⋯5 °° Si asumimos un valor de ] $, desarrollando la expresión (6.3.2.1) obtenemos: 5 5 5⋯5 °° ⋯ t #) $#)$ &#)& ⋯ #)]') $')$ &')& ⋯ ') ­() (6.2.2.3) donde ∗1 5 5 5⋯5°. De forma simplificada podemos expresar el modelo como:

#) #)

$ [[] ')[ ­()

El modelo de retardos de Koyck se puede obtener como un caso particular de esta estructura de retardos racional general (puesto que resultará de excluir los valores retardados de la variable exógena). La única restricción que impone Jorgenson es que m<n, es decir el número de retardos en la variable exógena sea menor que el de la endógena retardada.

Una vez obtenido el valor de los parámetros podemos calcular medidas de tendencia del impacto de los retardos, es decir podemos analizar las características dinámicas de este modelo:

a) Estabilidad: En este tipo de modelos las condiciones de estabilidad vendrán determinadas

por: - Las raíces de la ecuación característica, que no es más que la solución homogénea

de una ecuación en diferencias; puesto que el modelo de Jorgenson equivale a una ecuación en diferencias de orden n (al ser un modelo autorregresivo de orden n): "° 5 "° 5⋯5 ° 0, se tendrá que cumplir que las raíces: |"| * 1.

- Las raíces del polinomio de retardos correspondiente a la parte autorregresiva del modelo (retardos en Yt).

1 5 5 5 ++ 5⋯5 °° 0, se tendrá que cumplir que las raíces son: |1/6| * 1 y, por tanto, que |6| E 1.

Page 86: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

86

b) Tipo de trayectoria: La trayectoria vendrá determinada también a partir de las raíces de la

ecuación característica y del polinomio de retardos, de tal forma que se pueden presentar las siguientes situaciones:

- Raíces positivas: Trayectoria monótona. - Raíces negativas o complejas: Trayectoria oscilante.

c) Multiplicador total: En este caso se puede demostrar que el multiplicador total (suma de los coeficientes de reacción28), cuyos valores se obtienen por simulación en las aplicaciones empíricas, valdrá:

1t1 + ⋯ 1 5 5 5⋯5 °

d) Retardo medio: Vendrá determinado por la expresión: ±$$ ¬±$¬$ 5 ­±$­$ ,

′=¬±­¬­±`­b& ¬±­ 5 ­±­

Dividiendo la expresión anterior por D(L) tenemos: ² ¬²­ ­¬ 5 ­²­ ² 5 t²t

Que evaluado en un valor de L=1 nos dará: ²$$ ¬²$¬$ 5 ­²$­$

puesto que la derivada de D(L) valdrá: ′=" 2" 3" ⋯, y D(1) es el valor del

polinomio cuando hacemos L=1: ∑ " =¤¯=multiplicador total.

e) Retardo mediano: Hay que hacerlo de forma empírica, es decir acumulando los

multiplicadores intermedios hasta alcanzar la mitad del impacto total (dividiendo el multiplicador de impacto total entre dos). Esto se debe a que no hay una fórmula genérica que nos permita obtenerlo.

Al igual que ocurría con la transformación de Koyck el fundamento económico de esta transformación se suele cuestionar puesto que la transformación parte de un procedimiento matemático para facilitar la obtención de los valores de los parámetros en un modelo de infinitos retardos.

Veamos el siguiente ejemplo (tabla 6.3.2.1) en el que se puede observar la diferencia de resultados que se obtienen de especificar, alternativamente, un modelo de retardos distribuidos tipo Koyck y uno de retardo de estructura racional general. En el ejemplo se analiza el comportamiento de 28 Recordemos que también se les puede denominar multiplicadores dinámicos.

Page 87: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

87

la inversión en viviendas (en logaritmos; logInv) como función del crecimiento en el precio de las mismas. Los resultados obtenidos de estimar empleando MCO se presentan en la siguiente tabla:

Tabla 6.3.2.1 Variables explicativas Retardos de Koyck Retardos racionales

Preciot

logInvt-1

Preciot-1

Constante

3,108 (0,933) 0,340

(0,132) -

-0,010 (0,018)

3,256 (0,970)

0,547 ( " (0,152) -2,936 (0,973) -0,578 (0,307)

Número de observaciones 41 40 ³& ajustado 0,375 0,504 Multiplicador total 4,688 0,706

Fuente: Wooldridge (2005, pág. 681). Los resultados muestran que el coeficiente de la variable endógena retardada es significativo, y que el coeficiente de determinación ajustado es mayor en el caso de que se incluya este término (es decir, cuando asumamos una estructura de retardos racional), por tanto el impacto total de la variable explicativa es mucho menor29 que el que muestra la estimación que supone una estructura de retardos tipo Koyck. Lo que es más si realizamos el contraste ´: 0, obtendremos que tanto a un nivel de significación del 1%, como del 5%, como del 10% no podremos rechazar la hipótesis nula, y por tanto no podemos rechazar que el impacto a largo plazo sea distinto de cero. Veamos otro ejemplo:

Partiendo del siguiente modelo dinámico:

51 5 0,9 0,1 µ En el que las unidades temporales son trimestres. Determine:

a) El multiplicador total. b) El retardo medio. c) Los coeficientes de para j = 0,1, 2, 3

Para contestar a estas cuestiones en primer lugar es conveniente diferenciar los valores del polinomio B(L) = 5L y A(L) = 1− 0,9L + 0,1L2. Las raíces del polinomio A(L) (6,55 y 2,45) son mayores de uno y en consecuencia el modelo es estable y la trayectoria monótona (>0).

a) Obtención del multiplicador total:

29 En el modelo de retardo racional el impacto total =T¡@T?¶¡ .

Page 88: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

88

1 1t1 1 5 5 51 5 0,9 0,1 25

En cuanto a los multiplicadores de impacto e intermedios:

El Multiplicador intermedio de orden 1 (efecto un periodo después): m1=5 ∗ 1 0,9 ∗ 0 5 0,1 ∗ 0 5 m2=0 0,9 ∗ 5 4,5 m3=0,9 ∗ 4,5 5 0,1 ∗ 5 3,55

Más exactamente teniendo en cuenta que para el retardo de orden 3 el impacto es 3,55 se tendrá, vía una proporcionalidad: 12,5-9,5=3 ⇒ 3/3,55=0,84, por tanto el retardo mediano serán 2,84 trimestres (8 meses y medio aprox.).

b) El retardo medio:

∑ U§∞§\?∑ U§∞§\? ·′· ¤′¤ 5 ¯′¯ || 5 ¸,¹@∗,,¹@, º 1 5 53,5 4,5 trimestres

c) Los coeficientes de para j = 0,1, 2, 3.

Partiendo de: t 51 5 0,9 0,1

Podemos obtener la siguiente igualdad: 1 5 0,9 0,1 1 5 0,9 0,1 1 5 0,9 0,1+…+1 5 0,9 0,12=5L Reagrupando tendremos: 5 0,9 5 0,9 0,1 ⋯ 5 0,9 0,1 5 Resolviendo las diferentes igualdades, término a término, obtendremos: =0 5 0,9=5→ 5 5 0,9 0,1 0 → 4,5 + 5 0,9 0,1 0 → + 3,55

A partir de esa información sobre el polinomio D(L), el modelo que perseguíamos obtener como solución a este apartado será:

Yt=(5L + 4,5 +3,55+ + ........)Xt + ut

Yt=5 + 4,5 +3,55+ + .......+ ut

Page 89: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

89

6.4. Justificación en términos de teoría económica de los MRD.

Hasta ahora hemos evaluado distintos tipos de MRD sin tomar en consideración la información a priori que puede aportar la Teoría Económica, y que puede ayudarnos a formular especificaciones que permitan caracterizar los procesos de toma de decisiones por parte de los agentes económicos. En otras palabras, podemos llegar a una determinada especificación de un modelo de retardos a través de simplificaciones que faciliten el proceso de estimación, tal como habíamos hecho hasta ahora (epígrafes previos de este tema) o, por otro lado, a través de un determinado supuesto sobre el comportamiento de los agentes económicos. En esta sección vamos a centrarnos en este segundo enfoque de planteamientos teóricos que conducen a una especificación dinámica, analizando dos tipos de hipótesis de comportamiento: ajuste parcial (subepígrafe 6.4.1) y expectativas adaptativas (subepígrafe 6.4.2). Ambas hipótesis tienen como factor común suponer una estructura de retardos geométrica. Por tanto en este epígrafe tratamos de superar la falta de fundamento económico de las especificaciones tipo Koyck y Jorgenson.

Para ejemplificar el fundamento de esas hipótesis sobre el comportamiento de los agentes

económicos pensemos en el siguiente modelo: M P» P ¼

Donde M es el consumo de los hogares, P» es la renta disponible de los hogares, P es la riqueza de los hogares al comienzo del periodo y ¼el tipo de interés. En las relaciones establecidas en ese modelo se parte de la idea, a priori, que un aumento de la renta disponible no tiene porque reflejarse en su totalidad en un aumento del consumo, y que el consumo no cambie inmediatamente al hacerlo la renta, sino que haya un proceso de ajuste –más o menos rápido- en el tiempo. Esas dos posibles situaciones son las que tienen su manifestación en la hipótesis de expectativas adaptativas (para modelizar cómo se incorpora la renta al consumo) y la hipótesis de ajuste parcial (para modelizar el proceso de ajuste del consumo ante una variación en la renta).

6.4.1. Modelo con rigideces. Hipótesis de ajuste parcial HAP).

La primera de las hipótesis que vamos a analizar es la que da lugar a los modelos de ajuste parcial (Nerlove, 1956), en los que los retardos distribuidos son consecuencia de rigideces en el comportamiento económico (por ejemplo como consecuencia de hábitos), es decir a la falta de flexibilidad en el comportamiento de determinadas variables económicas. Es muy importante subrayar que vamos a suponer la permanencia en el tiempo de cualquier cambio exógeno, de forma que no haya incertidumbre acerca del futuro (en otras palabras, no existe incertidumbre respecto a la evolución futura de las expectativas).

Si partimos de un modelo en el que el valor de equilibrio a largo plazo de una variable #)

(que denotaremos por ∗) es función de una serie de condiciones exógenas: ∗ (6.4.1.1) Puesto que el valor de equilibrio a largo plazo es inobservable, no podremos estimar los

parámetros de la expresión anterior (6.4.1.1). Por tanto es necesario formular algún tipo de hipótesis sobre cómo se produce el ajuste de #) para llegar a la situación de equilibrio a largo plazo (#)∗). Si hacemos el supuesto de ajuste parcial llegamos a dos expresiones alternativas en función de cómo se mida el tiempo. En modelos en los que el tiempo se expresa de forma discreta tendremos:

5 ½. ∗ 5 (6.4.1.2) En modelos en los que el tiempo se expresa de forma continua tendremos:

Page 90: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

90

»J» ½. `∗0 5 0 5 1b (6.4.1.3)

Con 0 * ½. * 1, para que el modelo sea estable e incluir la condición de no negatividad, es decir para garantizar su convergencia.

¿Cómo interpretar esta hipótesis de ajuste parcial? La expresión de la hipótesis implica suponer que el cambio que se produce en la variable bajo análisis Y de un momento temporal al siguiente guarda una relación de proporcionalidad con la diferencia entre el valor a largo plazo de Y y el nivel real del último periodo previo (. Es decir se explica a partir de un proceso de ajuste parcial marcado por ½. . Puesto que, como señalamos antes, la hipótesis de ajuste parcial se traduce en términos dinámicos en un modelo de retardos geométricos, y siguiendo la nomenclatura del modelo de retardos geométricos por excelencia (retardos de Koyck), podemos expresar la hipótesis de ajuste parcial como30:

∀0 * " * 1 (6.4.1.4) donde, recordemos, " es la tasa de descenso del impacto (coeficiente o parámetro de ajuste) y (1 5 ") es la velocidad de ajuste .

Como aplicación podemos pensar, por ejemplo, en el caso en el que una persona fije el nivel “óptimo” (o valor de largo plazo) de ahorro en función de su salario. Si reagrupamos la expresión (6.4.1.4), tendremos: 1 5 "∗ " (6.4.1.5) Que también podemos expresar como: 5 " 1 5 "∗ 1 5 " 1 5 "∗ ⇒ ∗ U®JKU (6.4.1.6)

De esta forma podemos expresar la hipótesis de ajuste diciendo que el nivel real actual de ahorro es una media ponderada del nivel óptimo o nivel deseado y el nivel real del último periodo (previo al actual). Si ahora incorporamos la expresión (6.4.1.1) en la (6.4.1.5) llegamos a:

1 5 " 1 5 " " 1 5 " 1 5 " 1 5 " " (6.4.1.7)

Que es el modelo autorregresivo. En (6.4.1.4) podemos observar que si =1 entonces se deduce que el nivel real de ahorros es fijo, no cambia de periodo a periodo; sin que, por tanto, tenga importancia la diferencia con su valor deseado u óptimo, puesto que #) #)$y su diferencia con el nivel deseado sería siempre la misma, es decir implica suponer que el nivel de ahorro es fijo. En términos generales, en ese caso, podemos afirmar que el valor de #) no cambia, independientemente de que cambien las variables exógenas. En cambio, si =0, podemos inferir que #) #)∗, en consecuencia el nivel de ahorros en cada periodo es igual al deseado. Es decir el nivel óptimo se alcanza periodo a periodo, o, otras palabras, el ajuste es instantáneo. Por tanto cuanto mayor es el valor de mayor es el grado de rigidez, es decir más lento es el proceso de ajuste, y viceversa para valores de " cercanos a 0.

30 Centrándonos en la expresión correspondiente a un modelo en tiempo discreto.

#) 5 #)$ $ 5 %#)∗ 5 #)$

Page 91: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

91

Atendiendo al ejemplo planteado en la introducción al epígrafe la hipótesis de ajuste parcial

implica que ante un descenso en el nivel de renta del consumidor/a éste intentará mantener el nivel de consumo deseado, en el corto plazo, y en el largo plazo tendrá que adaptarse al nivel de consumo correspondiente al nuevo nivel de renta. En términos algebraicos esto vendría representado por:

M 5 M "M∗ 5 M

La única diferencia del modelo de ajuste parcial y el de Koyck reside en el término de perturbación, puesto que en el modelo de ajuste parcial el término de perturbación no presentará problemas de autocorrelación si es ruido blanco.

En cuanto a las características dinámicas del modelo, éste será estable y con trayectoria monótona (al igual que en el modelo de Koyck). Respecto a los multiplicadores, teniendo en cuenta la expresión (6.4.1.7) llegamos a los siguientes valores para los multiplicadores: ¾] 1 5 " ¾$=1 5 ""=m" ¾&=1 5 ""=m"

¾¿ TUU =, esto resulta obvio si tenemos en cuenta que ∗ , es

decir que la relación entre y el valor de equilibrio a largo plazo viene determinada por el coeficiente . De forma análoga:

Retardo medio: UU

6.4.2. Modelo con incertidumbre. Hipótesis de expectativas adaptativas (HEA)31.

En el contexto de la Economía las decisiones tomadas por los agentes económicos suelen responder a un esquema de formación de expectativas acerca del valor que pueden tomar determinadas variables en función de su comportamiento pasado, puesto que los agentes se enfrentan en general a un alto grado de incertidumbre. Ese proceso de formación de expectativas se basa en la información acumulada durante un determinado número de periodos; de ahí que los modelos de retardos distribuidos pueden ayudar a modelizar el esquema de formación de expectativas. Así, como alternativa a la hipótesis de ajuste parcial, en la que suponíamos rigideces en el comportamiento económico, pero certidumbre acerca de las expectativas, ahora vamos a plantear, basándonos en la Teoría Económica, el caso en el que existe incertidumbre sobre el valor futuro de equilibrio (largo plazo)32 que puede alcanzar la variable explicativa. En este contexto abordaremos el estudio de la denominada hipótesis de expectativas adaptativas (Cagan, 1956). Analicemos este modelo desde un punto de vista algebraico. Si partimos de un modelo en el que el nivel de la variable endógena depende de un valor no observado de expectativas de la exógena À (valor esperado de ) tendremos: À (6.4.2.1)

31 También se emplean las denominaciones “expectativas adaptables”, “expectativas progresivas” y “aprendizaje por error”. Esta modelización fue extendida gracias a los trabajos seminales de Cagan (1956) y Friedman (1957). 32 Cuando hay incertidumbre sobre el valor futuro que puede adoptar una variable, el agente económico actuará de acuerdo con las expectativas que se forme en relación a la evolución futura de determinadas variables económicas.

Page 92: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

92

Al ser el valor de las expectativas un valor inobservable no podremos estimar los parámetros del modelo, por lo que recurriremos a la hipótesis de expectativas adaptativas, que se puede formular como33:

∀0 * " * 1 (6.4.2.2) Las expectativas se revisan (actualizan) en función de las desviaciones observadas entre el valor corriente de X () y el valor esperado en un periodo previo. Así si el valor observado para X en el momento t es mayor que la expectativa que se había formado respecto a ese valor en un periodo anterior se revisarán al alza las expectativas (À será mayor que À ). En este sentido, si =1 entonces de (6.4.2.2) se está asumiendo que las expectativas acerca de la variable no cambian en el tiempo (son estáticas), puesto que À À .Por el contrario si =0 las expectativas son totalmente adaptativas (100% adaptativas) puesto que el valor que se espera en el futuro para será igual al realmente observado en el momento actual (À , lo que implícitamente supone obviar la información que llevó a generar las expectativas en el pasado. Es decir, valores cercanos a 0 de lambda implican mayores cambios en las expectativas. Desde la óptica del ejemplo planteado en la introducción al epígrafe la hipótesis de expectativas adaptativas se ajustaría perfectamente a la teoría de renta permanente, que parte de la idea de que las decisiones de consumo se toman en función de la renta esperada (P» que en términos genéricos se puede denotar como À), que sería la renta permanente. En este contexto la hipótesis implica que la renta permanente de los hogares se ajusta con cierto retraso (que vendrá regulado por el valor de ") a las variaciones de la renta corriente, es decir: PÀ 5 PÀ "P» 5 PÀ Volviendo a la notación genérica empleada, la igualdad (6.4.2.2) se puede expresar también como: À 1 5 " "À (6.4.2.3) Si partimos de un momento temporal inicial muy alejado en el pasado del momento actual (t) obtendremos una expresión para el valor que adopta el valor esperado de X (À, sin más que ir sustituyendo en la expresión los valores retardados hasta llegar al momento temporal inicial (0): À 1 5 " "1 5 " "1 5 " ⋯ (6.4.2.4)

Es decir: À ∑ " 1 5 " (6.4.2.5)

Por tanto el valor esperado de À es una media ponderada, con ponderaciones decrecientes, de los valores pasados de . Esas ponderaciones siguen una progresión geométrica de razón "34, es decir los coeficientes decrecen a una tasa " a medida que retrocedemos en el tiempo.

33 Esta es la aproximación discreta que resulta de sustituir en: GÀ0G0 1 5 "`0 5 À0b La derivada por una diferencia finita. 34 La suma de las ponderaciones, por construcción, será igual a la unidad, al igual que ocurría en el modelo de

Koyck: ∑ "∞ 1 5 " UU 1.

À 5 À 1 5 " 5 À

Page 93: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

93

Para proceder a la estimación de los parámetros de (6.4.2.1) y de " tendremos que introducir en la expresión (6.4.2.1) el valor de las expectativas sobre X (6.4.2.5), puesto que À es inobservable, obteniéndose: #) ∑ %[$ 5 %[] ')[ () (6.4.2.6) O lo que es lo mismo:

1 5 " 1 5 "`" " ⋯b (6.3.2.7) Al modelo descrito por esta expresión (6.4.2.7) se le conoce como forma de retardos distribuidos. Si sobre la anterior expresión (que tiene infinitos retardos) aplicamos la transformación de Koyck, para hacerla estimable, obtendríamos: 1 5 " 1 5 " " ` 5 "b (6.4.2.8) o de forma equivalente35: 1 5 " 1 5 " " (6.4.2.9) Esta última expresión es análoga a (6.3.1.4), que es la especificación que obtuvimos cuando restringimos, mediante la transformación de Koyck, un MRD infinitos. Al igual que señalábamos entonces, es importante volver a subrayar que la expresión (6.4.2.9)36 hace referencia a una forma autorregresiva en la que el término de perturbación (a diferencia de lo que ocurría en el modelo de ajuste parcial) presenta un esquema MA(1) de autocorrelación. Este modelo autorregresivo podría, en principio, estimarse por MCO o por Mínimos Cuadrados en 2 Etapas (MC2E)37. Sin embargo en la sección 6.5 (más adelante) veremos que este tipo de modelos llevan aparejados una serie de complicaciones a la hora de su estimación que hacen que en muchas ocasiones estos métodos de estimación nos conduzcan a estimadores que no son consistentes, salvo que se hagan una serie de asunciones. En lo que concierne a las características dinámicas, tendremos que el modelo es estable y la trayectoria monótona, puesto que 0 * " * 1. Respecto a los multiplicadores, éstos valdrán: ¾] 1 5 " ¾$=1 5 ""=m" ¾&=1 5 ""=m"

… ¾¿ TUU =, esto resulta obvio si tenemos en cuenta que À . Retardo medio:

UU

35 El modelo de ajuste parcial se puede generalizar, incluyendo variables explicativas adicionales. Sin embargo, si añadimos nuevas variables explicativas en el modelo de expectativas adaptativas se originan problemas de sobreidentificación (habrá más ecuaciones que incógnitas en la forma estructural del sistema). 36 Si en una especificación de este tipo las variables aparecen expresadas en logaritmos, podríamos interpretar 1 5 " como la elasticidad a corto plazo y como la elasticidad a largo plazo. Puesto que de (3.2.2.) podemos ver que: fr 1 5 " 1 5 "fr "fr 37 Si los residuos estuvieran autocorrelacionados los estimadores de la primera etapa de la estimación por MC2E serían inconsistentes.

Page 94: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

94

6.5. Estimación de modelos dinámicos autorregresivos.

Por centrarnos en uno de los modelos cuya aplicación suele resultar más realista en términos de disponibilidad de datos y ajuste a fenómenos económicos vamos a profundizar en el análisis de los modelos dinámicos autorregresivos, particularizando en el modelo más extendido de este tipo (modelo de Koyck).

Partiendo de un modelo autorregresivo tipo Koyck: #) ]') %#)$ ε1

donde ε1 () 5 %()$, y $ 5 %]; siendo ε1 ruido blanco. Este tipo de modelos (autorregresivos) plantean por su propia definición una cuestión previa ¿Podemos tratarlos como un modelo de regresión lineal clásico? La respuesta es no, puesto que los modelos autorregresivos incluyen la variable explicada retardada como explicativa, y, por tanto, contiene un regresor estocástico. Vamos a analizar esta particularidad incidiendo especialmente en dos posibles situaciones, cuando los términos de error no estén autocorrelacionados y cuando sí lo estén, evaluando las implicaciones de esto en términos de la estimación mediante MCO de los parámetros del modelo. Recordemos, como paso previo para una mejor comprensión de este epígrafe, que tal como se vio en el último tema de la asignatura Econometría I, en el caso en el que los términos de error estén autocorrelacionados estaríamos en presencia de lo que se conocen como perturbaciones no esféricas, puesto que partiendo de:

Á¼ Ã′ ÃÄÅÅÅÅÅÆ

ÄÅÅÅÅÆuu...uÇÈ

ÈÈÈÉ `…°b

ÇÈÈÈÈÈÉ

ÄÅÅÅÅÆ Ã Ã … ðà à … ð. . … .. . … .. . … .ð ð … ð ÇÈ

ÈÈÈÉ

ÄÅÅÅÅÆ Ã Ê 0 … ð Ê 0Ã Ê 0 … ð Ê 0. . … .. . … .. . … .ð Ê 0 ð Ê 0 … ÇÈ

ÈÈÈÉ=Ë

Siendo Ω una matriz simétrica y semidefinida positiva resultante de que Cov(ui,uj)=E(uiuj)Ê0, para ∀Ì Ê _. ¿Cuáles son las consecuencias para las propiedades del estimador por MCO de (ÍÎÏÐ) de la existencia de perturbaciones no esféricas?

a) El estimador ÑÒÓÔ sigue siendo lineal. e insesgado.

b) El estimador ÑÒÓÔ no es óptimo.

c) Las propiedades asintóticas de ÍÎÏÐ se mantienen, puesto que será consistente.

d) Puesto que ÕÖÍÎÏÐ Ê ′ los estadísticos “t” y “F” quedan invalidados.

Page 95: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

95

Debido a la no optimalidad del estimador ÍÎÏÐ se suele recurrir al estimador ÍÎÏ×

(estimador por Mínimos Cuadrados Generalizados); que es un estimador ELIO y cuya expresión es:

ÍÎÏ×='′Ë$'$'′Ë$Ù

Se puede demostrar (no se presenta por claridad expositiva) que la diferencia entre la varianza de ÑÒÓÔ y la de ÑÒÓÚ es una matriz semidefinida positiva, por lo que la varianza de los estimadores por Mínimos Cuadrados Generalizados será siempre menor que la de los estimadores por Mínimos Cuadrados Ordinarios. Una vez repasadas las posibles consecuencias de la presencia de perturbaciones no esféricas vamos a centrarnos en dos posibles situaciones: cuando los términos de error no estén autocorrelacionados y cuando si lo estén; evaluando las implicaciones de esto en términos de la estimación mediante MCO de los parámetros del modelo. Esquema de las posibles situaciones:

- () no autocorrelacionado: Este sería el caso en modelos como el de ajuste parcial en el que sea ruido blanco.

- () autocorrelacionado38: Este sería el caso en modelos con expectativas adaptativas en el que sea ruido blanco. Aquí podemos el caso en el que la autocorrelación sea de tipo AR(1) o MA(1).

6.5.1. Términos de error (residuos) no autocorrelacionados.

En el modelo de Koyck, si podemos suponer que el término de error (Û)) no está autocorrelacionado podríamos, en principio, emplear los estimadores MCO para obtener el valor de los tres parámetros (, , ", puesto que el estimador MCO mantendría sus buenas propiedades (el estimador de , , " sería consistente y el de su varianza también).

Sin embargo, en el modelo anterior #)$ es una variable aleatoria (estocástica)39, puesto que depende del término de error (Ü#)$, ε1 Ê ]; esto introduciría un sesgo en la estimación mediante muestras finitas salvo que pudiéramos suponer la independencia entre y ε1. En otras palabras, esto implica que aunque ε1 ≡ ~0, P°, al existir un regresor que es estocástico el estimador por MCO es sesgado en muestras pequeñas:

38 En el caso de análisis se series financieras, por ejemplo para intentar pronosticar la evolución del valor de una acción o de la inflación, se puede presentar autocorrelación en el tiempo de la varianza del término de perturbación al margen de en el propio término de perturbación. A esta autocorrelación se le denomina Heteroscedasticidad Condicional Autorregresiva (da lugar a los modelos ARCH – Autoregressive Conditional Heteroskedasticity-), si la varianza del error está correlacionada con el término de error al cuadrado del periodo anterior (ejemplo de ARCH(1)): σ1 α αu1 En cambio estaremos en presencia de Heteroscedasticidad Condicional Autorregresiva General (da lugar a los modelos GARCH – Generalized Autoregressive Conditional Heteroskedasticity-), si la varianza del error está correlacionada con el término de error al cuadrado y su varianza en varios periodos anteriores. En otras palabras estos modelos se utilizan cuando la varianza (variaciones=volatilidad) de las series se modifica con el tiempo. El caso más simple de modelo GARCH es el GARCH(1,1) que se representa algebraicamente como sigue: σ1 α αu1 γσ1 Podemos general la expresión anterior para formular un modelo GARCH (p,q) a través de la expresión: σ1 α αu1 ⋯ αàu1à γσ1 ⋯ γáσ1á El modelo GARCH(1,1) es equivalente a uno ARCH(2) y el GARCH (p,q) es equivalente al GARCH(p+q). 39 La variable exógena X puede tomarse como no aleatoria.

Page 96: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

96

ÃÑ Ã`²′b , puesto que Ã`²b Ê 0, es decir Ã`/b Ê 0

Y además es inconsistente, puesto que lim°⟶Ñ Ê .

No obstante si pudiésemos suponer la no autocorrelación40 los sesgos disminuirían en el

caso de muestras grandes (propiedades asintóticas). No lo vamos a demostrar, por simplicidad, pero se puede llegar a obtener que el sesgo del estimador MCO de %, partiendo de un modelo del tipo:

" ε1

depende en gran medida del tamaño muestral41:

qµãhg"Ñ 2 ∗ "sÂFÂñgFµã0¼Âf Así, cuanto mayor sea el tamaño muestral, menor será el sesgo cometido al utilizar MCO, pero este sesgo no desaparecerá por lo que el estimador seguirá siendo inconsistente. lim°⟶Ñ fÌF` ²²b fÌF fÌF å1r ²æ fÌF`1r²b

Si $'²(=0 ⇒ lim°⟶Ñ⇒la estimación por MCO es consistente.

Comprobemos si ′=0 42:

#) ] ]') %#)$ Û) ⇒ #)$ ] ]')$ %#)& Û)$ Ã`#)$, Û)b=Ã`] ]')$ %#)& Û)$Û)b ]ÜÛ) ]Ü')$Û) %Ü#)&Û) ÜÛ)$Û)=0+0+0+0=0 En este contexto, teniendo en cuenta que si el error estándar es asintóticamente eficiente y con distribución Normal asintótica, los test de verificación de restricciones resultan aplicables (si los regresores no son estocásticos); además el estimador por máxima verosimilitud será igual al estimador por mínimos cuadrados ordinarios.

En caso de que los regresores sean estocásticos podemos recurrir a la estimación por variables instrumentales, tal como mostramos (por simplicidad expositiva) en el subepígrafe siguiente.

6.5.2. Términos de error (residuos) autocorrelacionados.

Si en el modelo expresado en forma de retardo distribuido: ⋯

40 Es sinónimo a afirmar que los términos de perturbación son regulares. 41 Este sesgo disminuiría si se incluyera en el modelo una variable exógena significativa (X), puesto que entonces la influencia de sobre sería menor. 42 Teniendo en cuenta que estamos bajo el supuesto que los residuos no están autocorrelacionados.

Page 97: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

97

el término de perturbación no estuviera autocorrelacionado43, su correspondiente forma autorregresiva ε1 () 5 %()$ estaría autocorrelacionada puesto que: Ãε1, ε1@ Ã` 5 "@ 5 "b 5"Ã Ê 0 Esta presencia de autocorrelación en la forma autorregresiva trae aparejada la no optimalidad del estimador por MCO, puesto que la varianza no será mínima, además puesto el sesgo no desaparecerá asintóticamente44: lim°⟶Ñ Ê ,ademáslim°→∞

ÕÖÍÎÏÐ Ê0 ⇒la estimación por MCO es inconsistente.

Esa inconsistencia invalidará los contrastes habituales que se realizan sobre los parámetros del modelo (t y F). Es importante subrayar que el estimador MCO es inconsistente en el contexto de un modelo con variable dependiente retardada y errores autocorrelacionados solamente si el término de error (ut) sigue un modelo AR(1) estable.

¿Cómo proceder para obtener estimaciones consistentes?

Podemos utilizar MVI (para superar los problemas de derivados de la estocasticidad -aleatoriedad- de los regresores) y MCG para superar los problemas de ineficiencia45 debidos a la presencia de autocorrelación): Una primera opción, cuando existen variables explicativas endógenas (retardadas), consiste en recurrir a la obtención de estimadores consistentes por el método de Variables Instrumentales (VI)46, o su versión de MC2E. Este método consiste en buscar variables que sirvan de instrumento para reemplazar variables que están correlacionadas con el término de perturbación. De esta forma lo que pretendemos es sustituir la variable “problemática” con otra (o una combinación de otras) que esté muy relacionada con ella pero que a su vez sea independiente (no esté correlacionada) del término de perturbación. Esta forma de proceder en la obtención de los estimadores tiene como inconveniente que si bien los estimadores que obtengamos son insesgados, asintóticamente no son eficientes, puesto que, en el caso en el que los términos de error (residuos) están autocorrelacionados, la estimación por variables instrumentales se centra en resolver los problemas de colinealidad entre los regresores y el término de error.

En términos algebraicos, el problema que pretendemos resolver es el siguiente: fÌF`1r²b Ê 0

Teniendo en cuenta que si estimamos por variables instrumentales la matriz de regresores

Xt=[1, Xt,Yt-1] se reemplaza por Zt=[1, Xt, Zt].

43 En la mayoría de las modelizaciones económicas los términos de error están autocorrelacionados. 44 Respecto al coeficiente de determinación (R2), éste sigue manteniendo su validez a pesar de la existencia de autocorrelación en los residuos, siempre que los datos sean estacionarios y débilmente dependientes. Esto es así porque en series temporales con datos estacionarios (y débilmente dependientes) las varianzas de los errores y la variable dependiente no cambian a lo largo del tiempo. 45 Recuérdese que un estimador es más eficiente que otro cuando tiene menor varianza que ese otro, y por tanto es más preciso. 46 El estimador por Variables Instrumentales es un caso particular del estimador por Mínimos Cuadrados en 2 Etapas, siendo ambos estimadores consistentes.

Page 98: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

98

El estimador mediante variables instrumentales del vector de parámetros del modelo será ìÑíî ï²ï′ -que será un estimador consistente-, donde Z incluye a las variables que actúan

como instrumento de la/s variable/s del modelo original47. Por analogía con lo que vimos en la estimación por MCO, el estimador del vector de parámetros ìÑ se distribuirá asintóticamente como una normal:

ìÑîí °→ðññò `ì, `ï²²ï²ïï²bb Ese vector estimado será consistente si la matriz de variables instrumentales cumple que: lim°→ ó′° 0 y lim°→ ó′L° 0

¿Cómo proceder si tenemos más de un instrumento para un regresor estocástico? En este caso recurriremos a la estimación por Mínimos Cuadrados en 2 Etapas (MC2E). En la

primera tendremos que estimar (por MCO) la variable en función de las variables instrumentales (y las variables predeterminadas del modelo original)48.

En la segunda etapa incluiremos el valor estimado (ajustado) para en la ecuación original, lo que nos permitirá obtener estimaciones consistentes (por MCO) de la ecuación original:

1) ô õ ÷ï ÷ï 2) "ô ε1 Esta metodología se puede aplicar tanto a modelos tipo Koyck, como Jorgenson y, en general,

cualquier modelo dinámico autorregresivo. Este procedimiento no ha resuelto el problema de la autocorrelación de los residuos. No

obstante partiendo del estimador por VI y aplicando cualquiera de los procedimientos iterativos que veremos más adelante podemos resolver esta cuestión; de esta forma podremos corregir la falta de eficiencia del estimador por VI. Si estamos en presencia de autocorrelación, ¿cómo estimar ese modelo si se comporta siguiendo el esquema AR(1)?

Este procedimiento no es más que una forma de corregir los problemas de autocorrelación en el contexto de que los términos de perturbación sigan un esquema AR(1). Para aplicarlo supongamos que partimos del modelo:

ttttttt uuuYXY ερλβα +=+++= −− 110 , (1)

se retarda el modelo un periodo, se multiplica por ρ y se resta al anterior, resultando:

tttttt YYXXY ερλρβρα +−+−+−= −−− )()()1( 2110 (2) Este modelo puede escribirse como:

ttttttt XYYXYY εαβλραβλ +−−−=−−− −−−− )()( 102101 (3)

47 Este vector de características será al menos tan grande (en número de variables) como X. Recordemos que las condiciones que debe de cumplir el vector Z son: no sea ninguna de de las que están en el modelo, estar correlacionado con la variable a la que sustituye y independiente de u. 48 Excluyendo, obviamente, el regresor estocástico.

Page 99: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

99

El método iternativo de Hatanaka se inicia partiendo de una estimación consistente de los parámetros , , ". Por ejemplo, se parte de las estimacones obtenidas por VI. La primera estimación se inicia sustituyendo , , ". por estimaciones de VI y se estima a continuación øpor MCO, el valor de ø estimado se utiliza en el modelo (2) para volver a estimar, , ", que se vuelven a sustituir en (3) para volver a estimar ø. Si la diferencia entre el nuevo ø estimado, øù, y el anterior, øù, es pequeña, |øù5øù|<0,001, se detiene el proceso y nos quedamos con las últimas estimaciones de, , ". Los estimadores obtenidos con este procedimiento son estimadores consistentes y más eficientes que los obtenidos por VI.

¿Cómo estimar ese modelo si se comporta siguiendo el esquema MA(1)?. Para resolver esta cuestión una primera vía es actuar como en el caso en el que el esquema seguido es un AR(1), o bien recurrir al procedimiento de Zellner-Geisel (1970), basado en incorporar al procedimiento de estimación el hecho de que el término de perturbación sigue un esquema MA(1), con el objetivo de que se produzca un aumento en la eficiencia asintótica del estimador. Veamos en qué consiste el procedimiento de Zellner-Geisel: Definamos una variable: ×) #) 5 (). Por tanto: ×)5%×)$ #) 5 ()5%#)$ 5 ()$ Partiendo de un modelo tipo Koyck: " , tenemos: ú5"ú 5 5" 5 = " 5 " 5 5" " ⇒ ú "ú ⇒ ú ""ú " "ú=

… ú " … "HH "HúH= ïH"HúH ⇒ #) ûü%ü×)ü ()

Si se conoce el valor de % se puede calcular ûü=∑ %ü')üü[] y %ü, y entonces podríamos

estimar por MCO sin que ello implicara ninguna limitación. Para conocer el valor de " se puede recurrir al procedimiento de Hildreth-Lu, es decir, seleccionar el valor de % entre una parilla de posible valores (-0,9, -0.8,...,0.8,0.9) que produce un menor SBIC o AIC.

Daremos por resuelto el problema cuando los tests de autocorrelación nos permitan rechazar la presencia de autocorrelación. Si aplicando estos procedimientos no conseguimos corregir los problemas de autocorrelación, debemos plantearnos la posibilidad de que el problema no reside en la autocorrelación de los residuos sino en una especificación inadecuada del modelo dinámico.

• MC no lineales (ARMAX): En un modelo tipo Jorgenson:

(6.2.2.1)

) ∗ ¬­ ') ()

Page 100: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

100

Se aplica la misma estructura de retardos a la variables endógena (#)) que al término de perturbación. Una forma de flexibilizar el modelo es permitir que el término de error tenga una estructura de retardos propia: ­) ¬') Ï() La anterior expresión se conoce como modelo ARMAX, que de forma detallada se puede expresar como: ⋯ °° ⋯ 5 ý 5 ý 5⋯5 ýHH Si no incluye regresores () estamos en presencia de un ARMA. En términos generales la notación empleada ARMAX (p, q) indica que el número de términos retardados en la parte AR es “p” (­)), y el número de retardos en la parte MA (Ï()) es “q”. Si el modelo no incluyera términos de media móvil, podríamos estimar por MCO obteniendo estimaciones consistentes. Pero al existir perturbaciones de media móvil, el modelo se convierte en no lineal (es no lineal en los parámetros), lo que hará necesario recurrir a Mínimos Cuadrados No Lineales en vez de MCO. Este sistema se resolverá empleando algún tipo de algoritmo de optimización numérica (Newton-Raphson, Gauss-Newton, Scoring, etc..), puesto que haremos para resolver el problema será maximizar el logaritmo de la función de verosimilitud numericamente. Sus resultados serán estimadores que no son ELIO, aunque si suponemos la normalidad de las perturbaciones obtenemos que el estimador por Mínimos Cuadrados No Lineales (MCNL) presenta las mismas propiedades que el estimador por MV (máxima-verosimilitud). Esto implica que si las perturbaciones son normales el estimador MCNL es consistente, asintóticamente normal y asintóticamente eficiente. En otras palabras, una opción para corregir los problemas de autocorrelación es la de asumir un esquema ARMAX (modelos dinámicos autorregresivos con retardos distribuidos) en los que la modelización ARMA implica tener que recurrir a MCNL.

Page 101: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

101

Tema 7: Modelos multiecuacionales.

7.1. Introducción.

En los modelos analizados hasta el momento había una sola variable dependiente que se expresaba como función lineal de una o más variables explicativas –modelos de regresión uniecuacionales- pero en la realidad económica las relaciones de interdependencia suelen ser más complejas, puesto que en los modelos de regresión uniecuacionales subyace el supuesto que existe, potencialmente, una relación causa-efecto unidireccional de las variables explicativas (causa) sobre la variable dependiente (efecto). Sin embargo para modelizar la realidad de algunos de los procesos económicos que se observan en un determinado mercado es necesaria la evaluación de un conjunto de ecuaciones, no de una sola. Cuando esto ocurre estaremos en presencia de los que se denominan modelos multiecuacionales.

En este ámbito de los modelos multiecuacionales (sistema de ecuaciones) es frecuente

encontrarnos en la situación en la que algunas variables explicadas de las diferentes ecuaciones del modelo aparecen al mismo tiempo como explicativas en otras ecuaciones del sistema, de forma que las variables Y están determinadas por las X y algunas de las X están determinadas por las Y, o sea hay una relación bidireccional o simultánea. En este caso estaríamos hablando de un sistema de ecuaciones simultáneas, pero es oportuno aclarar que no todo modelo multiecuacional constituye un sistema de ecuaciones simultáneas, puesto que para que sean simultáneas es necesario que todas las ecuaciones del sistema se requieran para poder obtener los valores de una determinada variable endógena. En los modelos de ecuaciones simultáneas, a diferencia de los modelos uniecuacionales, no es posible estimar los parámetros de una ecuación aisladamente sin tener en cuenta la información proporcionada por las demás ecuaciones del sistema. En un modelo de ecuaciones simultáneas los términos de error (perturbación) están correlacionados (contemporáneamente), y, a priori, todas las variables endógenas pueden aparecer en todas las ecuaciones del modelo. Como consecuencia de la presencia de variables endógenas que actúan a su vez como exógenas aparece el problema de los regresores estocásticos en algunas (o todas) las ecuaciones que integran el sistema, lo que dificulta la estimación del modelo por Mínimos Cuadrados Ordinarios, puesto que implica la aparición de problemas de sesgadez en los parámetros estimados.

Esa dificultad, así como el mero hecho de estar en presencia de un sistema de ecuaciones, y no

de una sola ecuación, plantea la necesidad de profundizar en los aspectos relacionados con la obtención de estimaciones para los parámetros de este tipo de modelos multiecuacionales, así como sus posibles consecuencias en términos de verificación de hipótesis y predicción. En otras palabras lo que vamos a plantear en este tema es una extensión de nuestro Modelo de Regresión Lineal General (MRLG) al caso de un sistema de ecuaciones.

Pensemos en un ejemplo basado en la función de demanda, en el que es lógico plantear que la

demanda de un bien depende del precio, pero que éste a su vez depende (simultáneamente) de la demanda del bien (de tal forma que precio y cantidad se determinan como resultado de las fuerzas de mercado). Y por tanto, el precio y la cantidad constituyen variables endógenas (puesto que sus valores se determinan dentro del sistema). Por su parte la renta disponible constituye una variable exógena, puesto que su valor no se determina dentro del sistema. En términos algebraicos deberíamos plantear un modelo con tres ecuaciones (sistema de ecuaciones simultáneas): demanda del bien, oferta del bien y una ecuación que define el equilibrio del mercado del producto:

þM» +o `7.1.1bMª `7.1.2bMª M» `7.1.3b

donde M» es la cantidad demandada del bien, es el precio del bien y o es la renta disponible.

Page 102: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

102

En un sistema como el anterior la ecuación [7.1.1] representa el comportamiento de los demandantes, la [7.1.2] el comportamiento de los oferentes y la [7.1.3] el equilibrio del mercado.

• Definiciones y Notación. Para facilitar la exposición de las secciones posteriores vamos a clarificar las notaciones y

definiciones que seguiremos en relación a los sistemas de ecuaciones y sus componentes. Cabe recordar que en un modelo las variables predeterminadas (exógenas y endógenas

retardadas49) influyen sobre la variable dependiente (endógena), pero no son influidas por ésta. Sin embargo en el caso en que queramos modelizar la existencia de relaciones económicas en las que el comportamiento de determinadas variables endógenas venga determinado por el de otras también endógenas tendremos que recurrir a un sistema de ecuaciones simultáneas en el que no se cumplirá lo anterior, y que constará al menos de tantas ecuaciones como variables endógenas. La necesidad de que conste de al menos tantas ecuaciones como variables endógenas resulta de que de no ser así estaríamos en presencia de un sistema incompleto (no completo) y por tanto los valores de las variables que se pretenden explicar (endógenas) no estarían determinados. Desde un punto de vista analítico podríamos representar cualquier modelo multiecuacional como50: )′')′ ()′ ]) Donde t indica cada una de las observaciones (t=1,…,T), y donde tenemos m variables endógenas y K variables predeterminadas. Esta expresión representa la forma estructural del modelo51 (ecuaciones estructurales o de comportamiento, debido a que muestra la estructura de una economía o el comportamiento de los agentes económicos), puesto que define una clase de estructuras. La estimación de los parámetros que componen y , que es el objetivo primario de cualquier análisis econométrico, dará lugar a una estructura concreta, es decir a una estimación de la forma estructural. Esa forma estructural se compone de las siguientes matrices:

… ÷ ÷ … ÷÷ ÷ … ÷… … … …÷ ÷ … ÷+

… … … … … … … … … =0

Cada columna de H y de B contiene el vector de parámetros en una ecuación concreta, y cada fila afecta a una variable específica52. En términos de nuestro modelo genérico y en relación con la obtención de los valores de los parámetros del modelo (estimación del modelo), tal como se afirmó

49 Suponemos, como punto de partida, que las variables endógenas retardadas no representan regresores estocásticos, para lo cual es necesario suponer que los términos de perturbación no están autocorrelacionados, puesto que si lo estuvieran la variable endógena retardada estaría correlacionada con el termino de perturbación ut, y en consecuencia la variable endógena retardada no podría considerarse como una variable predeterminada. 50 Las letras griegas Η y B son los caracteres en mayúsculas correspondientes a las minúsculas ÷ y . 51 Esta modelización no implica que en los modelos que se observan en la realidad económica todas las variables estarán presentes en todas las ecuaciones, tal como se verá en las aplicaciones prácticas. 52 Los vectores columna , y tienen una dimensión m en cada periodo t,. Igualmente es un vector columna, pero de dimensión K. Respecto a H y B son matrices de orden mxm y kxm, respectivamente.

Page 103: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

103

más arriba necesitamos que el sistema sea completo, lo que en términos algebraicos implica que el determinante de la matriz de coeficientes de #) sea distinto de cero (|| Ê ]. ÷ ÷ ⋯ ÷ x1 x1 ⋯ x1 u1 0 t=1,…,T

÷ ÷ ⋯ ÷ x1 x1 ⋯ x1 u1 0 t=1,…,T . . . ÷ ÷ ⋯ ÷ x1 ⋯ x1 u 1 0 t=1,…,T

En el caso del ejemplo presentado en la sección introductoria tendríamos la siguiente

representación del modelo:

þM» 5 5 5 +Ìã 5 0Mª 5 5 5 0M» Mª M

² M, ² Ìã, 1 ´ w 1 15 5x w5+ 05 5x

² u1, u1

Al igual que hemos considerado en las secciones anteriores, podemos tomar una de las variables X como constante (=1), actuando de esta forma como término independiente. Respecto al vector de perturbaciones para las distintas ecuaciones partiremos del supuesto de que tiene las “buenas” propiedades usuales pero teniendo en cuenta que estamos trabajando con un sistema de ecuaciones, en el que potencialmente existen relaciones entre las ecuaciones implicadas, es decir:

a) Ã ], ∀0. Esta propiedad implica que la esperanza matemática de los términos de

error de todas las ecuaciones (m ecuaciones) son iguales a cero. b) Ã Ã ,

Lo que implica que Á¼ ò , ∀0. Donde Σ es una matriz simétrica definida positiva.

c) ÃS² 0, ∀0 Ê ã.

d) Las perturbaciones siguen una distribución normal: ()~ (0,)

Respecto a las variables hacemos los siguientes supuestos: a) Las variables exógenas se supone que son no estocásticas. b) Las variables predeterminadas se han observado sin error. Respecto a los parámetros los supuestos son: a) Los parámetros estructurales son estables, es decir no dependen de t.

Page 104: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

104

b) Existen restricciones a priori sobre los parámetros, lo cual hace que no necesariamente todos los parámetros aparecen en el sistema.

En consecuencia, la expresión de la matriz de varianzas y covarianzas del vector de términos

de perturbación sería:

Á¼ Á¼…=

+ … + … … … … … … + …

La condición (respecto a los términos de perturbación) ¿,¿ implica la

posibilidad de correlación contemporánea (en el mismo momento temporal) entre los términos de error de cualesquiera dos ecuaciones diferentes, que vendría recogida por los valores de , y que de existir no cambiaría en el tiempo. Como subrayamos anteriormente esta correlación contemporánea es la cuestión esencial sobre la que reside la construcción de modelos en los que se consideran varias ecuaciones simultáneamente y no se estiman de forma aislada. La existencia de esta correlación contemporánea hace que un cambio en la perturbación aleatoria de una ecuación del modelo afecta al valor de otra perturbación, afectando de esta forma a las restantes variables endógenas, puesto que todas éstas se determinan simultáneamente.

Partiendo del ejemplo anterior:

þM» +Ìã `7.1.1bMª `7.1.2bM M» `7.1.3b

Tal como habíamos indicado, las ecuaciones que conforman el sistema se denominan

ecuaciones estructurales y sus parámetros son los parámetros estructurales. En este sistema tendremos dos variables endógenas, C y P, y una exógena (Disp), ya que el valor de esta última viene dado. Nótese que en cada ecuación tendremos una variable que actúa como dependiente, cuyo parámetro será igual a 1 (en la matriz de coeficientes de la variable endógena), lo que supone una normalización implícita de los parámetros del sistema.

Si expresamos C y P en función únicamente de las variables predeterminadas (en este

caso sólo tenemos una), es decir si expresamos las variables endógenas en función de las predeterminadas (ya sean exógenas o endógenas retardadas, pero en ningún caso las endógenas no retardadas) y de las perturbaciones estocásticas, imponiendo la condición de equilibrio, llegaremos a lo que se conocen como ecuaciones en forma reducida del modelo estructural (cuyos parámetros se denominan parámetros de la forma reducida53). En el ejemplo anterior, para obtener la forma reducida, bastará con seguir los siguientes pasos:

1) Imponemos la condición de equilibrio entre oferta y demanda [7.2.3), que implica igualar

las ecuaciones `7.2.1b y `7.2.2b, y despejamos el valor de la variable endógena P: ) $ 5 $& 5 & & 5 &) ($) 5 (&)& 5 & `7.1.4b

que puede ser escrito de forma más sucinta como:

53 A los coeficientes de la forma reducida también se les conoce como multiplicadores de impacto o de corto plazo, porque mide el cambio inmediato que se produce en la variable endógena ante un cambio unitario en el valor de la variable exógena.

Page 105: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

105

) $ &) $)`7.1.5b

2) Si sustituimos `7.2.5b en `7.2.2b obtendremos: M Ìã ! Ï ") $) (&)`7.1.6b

De tal forma que las ecuaciones `7.2.5b y `7.2.6b son ecuaciones expresadas en su forma reducida.

Nota: En caso de que se ignore la simultaneidad en la obtención de los valores de las

variables endógenas se estaría violando un supuesto fundamental del modelo de regresión clásico (el de regresores no estocásticos). En concreto el que establece la necesidad de que el término de error esté incorrelacionado con cada una de las variables explicativas, y por tanto los estimadores que se obtuvieran por MCO no serían insesgados.

Por ejemplo en el siguiente modelo: #M M +Ìã CsµF `7.1.7bM M +Ìã `7.1.8b

Si aumenta, también lo hará M y, en consecuencia, M (si es positivo), por tanto un aumento en ha generado un aumento en M, es decir en una de las variables explicativas. Esta violación de un supuesto esencial conduce a estimaciones sesgadas de los parámetros de los modelos. Esta misma problemática se puede inferir de la observación de las expresiones `7.1.5b y `7.1.6b, puesto que en ambos casos vemos como se produce una simultaneidad en el modelo, derivada de que el valor de ambas variables endógenas (precio y cantidad) dependen tanto de ($) como (&) (y no sólo de uno de esos términos de perturbación como era el caso en los modelos uniecuacionales), a esto se le denomina sesgo de simultaneidad de las ecuaciones (resultante del problema de la endogeneidad).

En términos generales, como ya vimos, la expresión de la forma reducida del modelo estructural es la siguiente: #) ¬') () ⇒ #) 5$$¬') $$() ⇒ #) %') Û) `&. &.'b Esa expresión matricial representa al siguiente modelo en forma reducida: (x1 (x1 ⋯ (x1 Û1 (x1 (x1 ⋯ (x1 Û1

. (x1 (x1 ⋯ (x1 Û 1 ∀t=1,…,T

En lo que respecta a las hipótesis respecto al vector de perturbaciones para la forma

reducida éstas son las mismas que las formuladas para la forma estructural del modelo. Además, si denotamos por Ω a la matriz de varianzas y covarianzas de las perturbaciones del modelo en su forma reducida se puede demostrar que ésta mantiene la siguiente relación con la matriz de varianzas y covarianzas de las perturbaciones del modelo en su forma estructural:

Page 106: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

106

Ë′ Teniendo en cuenta que #) 5$$¬') $$() ⇒ Û) $$() , siendo el vector de perturbaciones de la forma reducida y el vector de perturbaciones de la forma estructural.

Una cuestión esencial en la caracterización del modelo es la forma que adopte la matriz de

coeficientes de las variables endógenas (). Veamos posibles alternativas:

a) La matriz es diagonal:

÷ 0 … 00 ÷ … 0… … … …0 0 … ÷

En este caso sólo tendremos una variable endógena en cada ecuación del sistema, lo que da como resultado la aparición de un tipo particular de modelos multiecuacionales, en concreto a los denominados sistemas de ecuaciones aparentemente no relacionadas, que serán objeto de tratamiento en el próximo epígrafe.

Se denomina sistema de ecuaciones aparentemente no relacionadas porque los términos de error son los que están relacionados pero las ecuaciones no tienen porque interactuar entre sí. Por ejemplo las funciones de demanda de dos bienes, si bien no tienen por qué estar directamente relacionadas entre sí, un shock de demanda puede afectar a la demanda de ambos bienes, puesto que los términos de error de las ecuaciones para los distintos bienes tendrán un componente común, que dará lugar a correlación contemporánea entre ellos.

b) La matriz es triangular: #$ #& … #$# Ü*(Ö*ó$Ü*(Ö*ó&…Ü*(Ö*ó ,

1 0 … 0÷ 1 … 0… … … … …÷ ÷ … 1 0÷ ÷ … ÷ 1-

Es decir: x1 x1 ⋯ x1 u1 0

÷ x1 x1 ⋯ x1 u1 0 . . . ÷ ÷ ⋯÷ x1 x1 ⋯ x1 u 1 0

Y la matriz de varianzas y covarianzas correspondiente a las perturbaciones contemporáneas de cada una de las ecuaciones es diagonal (covarianzas nulas, en el mismo periodo, entre los términos de perturbación de diferentes ecuaciones), es decir no existe correlación contemporánea entre los términos de error:

Σ 0 … 00 … 0… … … …0 0 …

Page 107: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

107

Entonces estaremos en presencia de otro tipo particular de sistemas de ecuaciones simultáneas, que son los denominados sistemas recursivos (también denominados triangulares o causales). De forma sucinta (puesto que veremos este tipo de modelos un poco más adelante) podemos caracterizar a este tipo de sistemas porque contienen una variable endógena en la primera ecuación, dos en la segunda (la endógena de la primera ecuación más otra), tres en la tercera y así sucesivamente hasta contener “m” variables endógenas en la última. Las dos principales características de este tipo de modelos son:

1) Se pueden emplear métodos econométricos muy sencillos para su estimación, puesto que bastará con ir sustituyendo recursivamente el valor de las variables endógenas en las ecuaciones sucesivas, de ahí le viene el nombre de sistemas recursivos. De hecho se pueden emplear MCO para estimar ecuación a ecuación puesto que la no correlación contemporánea de los términos de perturbación de las diferentes ecuaciones provoca que las variables endógenas que aparecen como regresores no estén correlacionadas con el término de perturbación, lo que hace que las estimaciones obtenidas sean consistentes. A diferencia de los sistemas de ecuaciones simultáneas debido a que no depende de ninguna otra variable endógena no vendrá determinado por pero si al contrario, de forma que se puede afirmar que en cada ecuación hay dependencia causal unilateral. Esto es consecuencia de que depende de pero no de , puesto que por definición Cov(, 0.

2) Todas las ecuaciones que conforman el sistema son identificables (profundizaremos en la cuestión de la identificabilidad en el epígrafe 7.3), al ser todas distintas unas de otras.

c) Si la matriz no es diagonal ni triangular, estamos ante un modelo de ecuaciones más

general que se denomina sistema de ecuaciones interdependientes, y que serán objeto de amplio estudio en el último epígrafe. Se denominan interdependientes porque todas las ecuaciones del sistema son necesarias para obtener una solución de equilibrio del sistema.

7.2. Sistemas de ecuaciones no simultáneas:

7.2.1. Sistemas de ecuaciones aparentemente no relacionadas (SURE).

Planteamiento:

Se denomina sistema de ecuaciones aparentemente no relacionadas porque los términos de

error son los que están relacionados pero las ecuaciones no tienen porque interactuar entre sí. En otras palabras, la relación se produce de forma indirecta (a través de los términos de perturbación) aunque aparentemente las ecuaciones del sistema no guardan relación directa entre sí.

Por ejemplo, como subrayamos más arriba, las funciones de demanda de dos bienes distintos.

Además de las correlación contemporánea entre los términos de perturbación, podemos pensar que las elasticidades precio y renta de esos bienes pueden ser iguales, lo que llevaría a la estimación conjunta de las funciones de demanda de ambos bienes, de forma que podamos imponer restricciones de igualdad para contrastar si estamos en lo cierto. En este contexto si estimamos simultáneamente ambas ecuaciones ganaremos en eficiencia, pues estaremos “aprovechando” en mayor medida la información de la que dispongamos.

Igualmente podemos pensar, como ejemplo adicional, en un modelo en el que se trata de

explicar el volumen de gastos municipales en los tres grandes bloques que la componen (de tal forma que la suma de las partidas representen el 100% del gasto), siendo el gasto en cada una de éstas partidas representa la variable dependiente de sendas ecuaciones.

Page 108: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

108

La representación algebraica de este tipo de sistemas será la siguiente: # ' (

Donde las dimensiones de las respectivas matrices serán: en el caso de Y y u Tm*1, y en el caso de X será

Tm*∑ 6 . La matriz X estará compuesta de submatrices ', una por cada ecuación. Téngase en cuenta que esto es así porque tal como subrayamos en el epígrafe anterior los sistemas de ecuaciones SURE aparecerán cuando la matriz (de coeficientes de las variables endógenas) es diagonal, y por tanto sólo tenemos una variable endógena por ecuación:

,,,,,,,,,…………---------

= 0 … 00 … 0… … … …0 0 … ,……

-

,,,,,,,,,…………

---------

y la matriz de varianzas y covarianzas del vector de perturbaciones aleatorias (u):

φ Σ⊗ P

,,,,,, … … … … … … … … … … … … … … … … … … … …… … … … … … … … … …

------

Siendo cada bloque diagonal la matriz de varianzas y covarianzas del vector de error de cada

una de las ecuaciones consideradas en el modelo.

- Estimación: Una cuestión esencial es la estimación de este tipo de modelos es el de la modelización de las

correlaciones de los términos de error de las diferentes ecuaciones, pues éste es el vínculo entre las ecuaciones del sistema. En relación a esa matriz de covarianzas de los términos de error de todas las ecuaciones vamos a hacer una serie de supuestos simplificadores:

1) En cada ecuación el término de error es homoscedástico y no presenta autocorrelación: ò P , ∀Ì Ì, 2,… ,F. Siendo m el número de ecuaciones incluidas en el modelo.

2) Sólo existe correlación contemporánea entre los términos de error de diferentes ecuaciones.

Page 109: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

109

ò P , ∀Ì Ê _,Ì, _ Ì, 2,… ,F.

En este contexto podemos recurrir a la estimación por MCO; si estimamos ecuación a ecuación, sin tener en cuenta que pertenecen a un sistema, obtendremos estimaciones insesgadas (y consistentes), aunque ineficientes, introduciendo un sesgo en la varianza.

- Estimación cuando 0 Σ⊗ P es conocida:

Para evitar estos problemas de ineficiencia teniendo en cuenta lo que habíamos visto en el tema 6, podemos recurrir a la estimación por MCG54. De hecho el modelo de ecuaciones aparentemente no relacionadas puede ser visto como un caso especial de los Mínimos Cuadrados Generalizados:

ÑÒÓÚ ²0′0y

El estimador que se obtiene es lineal insesgado y óptimo. Obviamente cuanto mayor sea la covarianza entre los términos de perturbación mayor será la ganancia de emplear MCG en vez de MCO.

- Estimación cuando 0 Σ⊗ P es desconocida: Al igual que vimos cuando analizábamos MCG en el tema anterior, aquí tendremos que

enfrentarnos a que, en general, existe desconocimiento de los valores de la matriz de varianzas y covarianzas de las perturbaciones (φ), lo que nos llevará a recurrir a los denominados métodos de estimación por MCGF. Operaríamos de forma muy similar a como lo hicimos en el tema 6, pero teniendo en cuenta que ahora nos enfrentamos a un sistema de ecuaciones (no a una sola ecuación).

Siendo 2 una estimación de cada uno de los elementos de 0, resulta que el estimador por MCGF de los parámetros adopta la expresión: ÑÒÓÚ3 ²04′04 `7.2.1b A este estimador se le conoce como estimador MCG de Zellner (SURE). Como alternativa al estimador MCG de Zellner se ha propuesto en la literatura un procedimiento iterativo, cuyas propiedades asintóticas son más deseables. Es importante subrayar que en caso de que no exista correlación contemporánea entre los términos de error, el método de estimación más eficiente es el de los MCG. En consecuencia parece lógico plantearse en primer lugar un test (contraste estadístico) que nos permita verificar si existe o no correlación contemporánea entre los residuos, es decir si las covarianzas contemporáneas son o no iguales a cero (si son iguales a cero no habrá correlación contemporánea: ´: 0)55. Para realizar este contraste podemos recurrir, por ejemplo, al test de los multiplicadores de Lagrange.

54 Generalised Least Squared (GLS). 55 La hipótesis alternativa ( se plantearía en términos de si al menos una de las covarianzas es distinta de cero.

Page 110: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

110

- Estimación de sistemas de ecuaciones aparentemente no relacionadas con autocorrelación:

Sea el sistema: y1

con , , ,, donde ruido blanco.

Debido a la presencia de autocorrelación la matriz de varianzas y covarianzas valdrá: ò Ω , ∀Ì Ê _,Ì, _ Ì, 2, … ,F.

Para obtener estimaciones consistentes y eficientes podemos recurrir a un procedimiento que resulta de seguir los siguientes pasos:

a) Estimamos cada una de las ecuaciones del sistema por MCO, y se obtiene una estimación del coeficiente de autocorrelación (ø) de los residuos recurriendo al procedimiento que se prefiera de entre los señalados en la asignatura Econometría I, es decir: Partiendo de los residuos obtenidos de la estimación del modelo por MCO: Se obtiene el valor de ø2; una vez obtenida la estimación para ø se transforman los datos (al

igual que vimos en el caso de los modelos dinámicos) mediante las transformaciones de Prais-Winsten. De esta forma eliminamos los problemas de autocorrelación.

b) Al modelo con las ecuaciones transformadas se le vuelve a aplicar MCO para obtener una estimación de la matriz de varianzas y covarianzas ().

c) Partiendo de los datos transformados y de la matriz de varianzas y covarianzas estimada ya podremos proceder a la aplicación de MCGF.

Alternativamente podemos actuar modelizando la autocorrelación introduciéndola en el

modelo a estimar (es decir añadiendo una esquema AR(1), MA(1), ARMA(1,1), etc…) y estimar.

7.2.2. Estimación de modelos recursivos.

Los sistemas de ecuaciones recursivos, como se mencionó en la introducción de este tema presentan como características esenciales:

a) La matriz es triangular:

÷ 0 … 0÷ ÷ … 0… … … …÷ ÷ … ÷

b) La matriz de varianzas y covarianzas correspondiente a las perturbaciones

contemporáneas de cada una de las ecuaciones es diagonal (covarianzas nulas de los términos de perturbación):

Σ 0 … 00 … 0… … … …0 0 …

Partamos del siguiente ejemplo, que constituye un sistema recursivo básico:

Page 111: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

111

X1 u1 ÷ X1 u1 Con:

E[′] Σ w 00 x

La forma estructural anterior se puede expresar en forma reducida como: 5X1 u1 5÷X1 ÷u1 X1 u1 ⇒ ÷X1 5 ÷u1 5 X1 u1 ⇒ ÷ 5 X1 u1 5 ÷u1

La primera ecuación de la forma estructural no plantea problemas puesto que la variable exógena X1 no está, por definición, correlacionada con el término de perturbación. Por su parte no está correlacionada con u1 puesto que sólo es función de u1 , y u1 no está correlacionada con u1 (por definición, al ser la matriz de varianzas y covarianzas diagonal), por lo que si estimamos por MCO la segunda ecuación estructural, en la que hacemos depender de y X1, obtendríamos estimadores consistentes. Adicionalmente si podemos asumir que el término de perturbación se distribuye según una Normal, los estimadores por MCO de los parámetros son iguales a los máximo-verosímiles, garantizando que la matriz de varianzas y covarianzas asintótica sea eficiente, es decir sea la menor posible (de entre las de todos los estimadores lineales e insesgados). Por tanto la utilización de MCO por separado a cada una de las ecuaciones nos proporcionará estimaciones apropiadas de los parámetros del sistema. 7.3. Modelos de ecuaciones simultáneas (interdependientes).

Vamos a analizar en este epígrafe cómo estimar, en general, los denominados modelos de

ecuaciones simultáneas (como caso particular de los modelos multiecuacionales), también denominados interdependientes porque se requiere la información de todas sus ecuaciones para llegar a una solución para el sistema. Para esto vamos a comenzar empleando un ejemplo que ha gozado de enorme difusión en la literatura econométrica, y que no es otro que el modelo planteado por Haavelmo56, que permite sintetizar muy bien la casuística propia de este tipo de modelos.

La contribución en términos de modelos de ecuaciones simultáneas está íntimamente

relacionada con los postulados de la Teoría Económica Keynesiana. En concreto lo que Haavelmo propone es estimar la propensión marginal a consumir (la proporción de renta que se destina al consumo) en vez de en una sola ecuación de demanda, tal como la planteara Keynes,

M oµr0Â mediante un sistema de ecuaciones que añade, a la ecuación anterior, la de comportamiento de la renta, consiguiendo de esta forma que la renta sea también una variable endógena. Tendríamos el siguiente sistema57: Ï) ] $³6)Ö) () ³6)Ö) Ï) 7) En estas ecuaciones Ï) representa el gasto de consumo total, ³) representa el total del ingreso, y el gasto de inversión total del país (7)) es igual al ahorro total (8)). 56 Este tipo de desarrollos contribuyó a que Haavelmo obtuviera el premio nobel de Economía. 57 En el modelo original Haavelmo empleó en lugar de .

Page 112: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

112

En este modelo partimos de las siguientes hipótesis básicas:

1) ()~0, ; E(()()@[)=0, ∀_ Ê 0. 2) 7) y () no están correlacionados (son independientes) –Cov(7), ())=0-, ya sea por el carácter

fijo de la variable inversión o, de no ser así, simplemente porque se distribuyen independientemente.

Obviamente el problema que se plantea es que al ser un sistema de ecuaciones simultáneas o es un regresor estocástico, por tanto no se puede suponer la independencia de esta variable del

término de perturbación, y en consecuencia el estimador por MCO de la propensión marginal a consumir será sesgado e inconsistente.

Para comprobar los problemas que plantea la utilización de MCO en el modelo de ecuaciones

planteado por Haavelmo, obtengamos su forma reducida:

M 1 5 1 5 P 11 5 `7.3.1b

o 1 5 1 5 P 11 5 P

1 5 11 5 P 11 5 `7.3.2b De ahí que Cov(o , )= E[[o 5 Eo] [o 5 Eo]]=E[ ¿$:$u1]=

E[¿&$:$]= ;B

T? Ê 0, y por tanto ³)() no son independientes.

Debido a esa correlación entre la variable endógena (Rt) y el término de perturbación el

estimador Ñ es un estimador inconsistente de . Puesto que: Ñ ∑Ï)Ï<³)³<∑³)³<B ∑ *))∑)B =

∑Ï))∑)B ; denotando las letras minúsculas las desviaciones respecto a

la media. Si sustituimos Ct por su valor obtenemos: Ñ ∑]@$³6)Ö)@())∑³)³<B $ ∑)()∑)B `7.3.3b

puesto que ∑¼=0 y ∑³))∑)B 1.

Partiendo del valor obtenido para la estimación de Ñ(Ñ), podemos analizar la potencial inconsistencia del estimador calculando el límite en probabilidad de la expresión `7.3.3b:

fÌFÑ fÌF`βb plim ¢∑ r1u1∑ r1 £ plim`βb plim @∑ r1u1n∑ r1n A

β i∑)()i∑BB `7.3.4b Donde los dos cocientes de la expresión `7.3.4b representan, respectivamente, la covarianza de R y u y la varianza de R. Puesto que Cov(R,u) y Var(R) son positivas y 0<β<1 el fÌFÑ es siempre mayor que β, de forma que Ñsiempre sobreestimará el verdadero Ñ. Por tanto la interdependencia de las ecuaciones (que da lugar al sesgo de ecuaciones simultáneas) en un sistema de ecuaciones simultáneas

Page 113: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

113

invalida las buenas propiedades de los estimadores por MCO (insesgadez y consistencia), lo que nos llevará a tener que recurrir a métodos de estimación alternativos. Estos métodos de estimación se pueden clasificar en dos grandes grupos atendiendo a la información de que dispongamos. Así podemos distinguir entre:

a) Métodos de Información limitada: Que implican estimar ecuación a ecuación (Mínimos

Cuadrados Recursivos, MCI, Variables instrumentales, Mínimos Cuadrados en dos etapas, Máxima verosimilitud con información limitada).

b) Métodos de Información completa: Que implican estimar simultáneamente todo el conjunto de ecuaciones (Mínimos Cuadrados en 3 etapas y Máxima verosimilitud con información completa).

Antes de comenzar con los métodos de estimación para sistemas de ecuaciones simultáneas hay que abordar el problema de la identificación. Un sistema de ecuaciones simultáneas será identificado cuando es posible obtener valores numéricos de cada parámetro en cada ecuación, lo que implica que las ecuaciones son observacionalmente distinguibles. En caso de que las ecuaciones se parezcan mucho entre sí no podremos llegar a valores numéricos para los parámetros.

Esta cuestión puede ser analizada desde un punto de vista gráfico. Para ello partamos el

sistema de ecuaciones de oferta, demanda y equilibrio en función de cantidad58:

þM» `7.3.5bMª `7.3.6bM M» `7.3.7b

Donde * 0, en la medida que un mayor precio del producto, normalmente, reducirá la demanda (por parte de los compradores) del mismo; E 0 y los términos de error y representan factores que afectan a la demanda y oferta, respectivamente, del bien bajo análisis y que no han sido incluidos en las correspondientes ecuaciones, y que se suponen están independiente e idénticamente distribuidos con media cero y varianza constante, no existiendo correlación entre ambos términos de perturbación. El equilibrio entre demanda y oferta en el mercado se alcanzará cuando se cumpla la identidad `7.4.7b, lo que implica igualar `7.4.5b y `7.4.6b: = De lo que se puede deducir que: ?KBKCBTB `7.3.8b

Si sustituimos este precio de equilibrio en la ecuación de oferta, obtenemos:

M 5 5 5 5 `7.3.9b ¿Cuál sería la consecuencia de intentar estimar `7.4.5b por MCO?

Ñ ∑ Ds∑ s`7.3.10b

58 En las ecuaciones `7.3.5b y `7.3.6b no se ha incluido término independiente por claridad expositiva.

Page 114: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

114

Sustituyendo `7.3.8b y `7.3.9b en `7.3.10b

Ñ ~→ å;E?B @;EBBCBTBBæ åCB;E?B @TB;EBBCBTBB æ CB;E?B @TB;EBB;E?B @;EBB `7.3.11b De la expresión `7.3.11b se infiere que la estimación por MCO de aporta un valor que no

se puede considerar sea la elasticidad de la demanda, sino un promedio ponderado de la elasticidad de la demanda (&) y la elasticidad de la oferta (&), con ponderaciones constituidas por la varianza de los términos de error de la ecuación de demanda y de oferta. Sólo en el caso en el que la varianza del error de la ecuación de demanda sea muy pequeño (→ ]) o el de la ecuación de oferta tienda a ser muy grande (→ ∞), la estimación por MCO de aportaría una estimación consistente de la elasticidad de la demanda. Lo contrario ocurriría con la elasticidad de la oferta (B → 0? → ∞). Los casos intermedios representarían situaciones en las que un analista podría pensar que se ha estimado una ecuación de demanda y otro una ecuación de oferta, sin que ninguno estuviera en lo cierto, puesto que MCO nos ha proporcionado una mixtura entre ambos modelos, al haberse generado un sesgo de ecuaciones simultáneas.

Gráficamente (Figura 7.3.1), vamos a partir de un momento temporal “0” que vendrá

representado por el punto de equilibrio –entre oferta y demanda- (p0,c0). Asumamos ahora que en el momento “1” se ha producido un pequeño shock negativo de demanda y uno positivo grande en la oferta, de tal forma que habrá un desplazamiento de la curva de demanda hacia abajo y de la curva de oferta hacia arriba, aproximándonos al nuevo punto de equilibrio (p1,c1). El shock negativo por el lado de la demanda implicaría un cambio en por ejemplo como consecuencia de un cambio en los ingresos (variable no incluida como regresor en el modelo, por lo que estaría recogida por el término de perturbación) de los agentes económicos analizados o de sus gustos. Por el lado de la oferta el shock positivo podría venir de la mano en la mejora en las condiciones climáticas, implantación de procesos de producción más eficaces, etc., lo que produciría un aumento en el valor de .

En el momento “2” se ha producido un pequeño shock negativo de demanda y otro negativo

en la oferta (por ejemplo como consecuencia de una huelga o regulaciones que limiten las posibilidades de producción), de tal forma que habrá un desplazamiento de la curva de demanda y de oferta hacia abajo, hasta el nuevo punto de equilibrio (p2,c2). En el momento “3” suponemos un pequeño shock positivo en la demanda y uno mayor negativo en la oferta, que nos lleva al punto (p3,c3).

El estimador por MCO trata de ajustar una línea a través de los puntos F), *)G)$H . Por tanto para poder obtener un estimador consistente de & si encontramos una

variable que sea capaz de desplazar la curva de oferta sin desplazar simultáneamente la curva de demanda (esa variable será nuestro instrumento y por tanto procederemos a estimar por MC2E para obtener estimadores consistentes). En otras palabras, si la curva de oferta se desplaza en el tiempo debido a shocks de oferta (cambios climáticos, etc) y la demanda permanece relativamente estable los puntos trazan una curva de demanda, de ahí que se diga que la curva de demanda se ha identificado (y podremos conocer el valor de . En cambio, si la curva de demanda se desplaza en el tiempo debido a shocks de demanda (cambio en las preferencias de los consumidores, etc) y la oferta permanece relativamente estable los puntos trazan una curva de oferta, de ahí que se diga que la curva de oferta se ha identificado.

Page 115: Econometria II

Figura 7.3.1. Representación gráfica del impacto de diferentes shocks en un sistema de

ecuaciones simultáneas de oferta y demanda de un bien. 7.3.1. Identificación.

Partiendo del ejemplo planteado en la subsección anteri

que teníamos un sistema de ecuaciones constituido por ecuaciones de oferta y demanda, ¿en qué consistiría el problema de la identificación?. La respuesta a esa pregunta se encuentra en la respuesta a esta otra pregunta (Gujarati, 2004): la función de oferta?”, partiendo de que conocemos solamente información sobre “P” y “C”. En otros términos, ¿podemos garantizar que los parámetros que estamos estimando corrfunción de oferta o a otra función?. Desde un punto de vista del sistema expresado en su forma reducida las anteriores preguntas equivalen a responder esta otra: partiendo de que podemos estimar la forma reducida, ¿podemos obtener estimacionepartiendo de estimaciones de la forma reducida?podemos encontrarnos frente a tres posibles situaciones:

a) No es posible obtener los parámetros estructurales

los parámetros de la forma reducida (la ecuación está

b) En el caso en el que si se pueda obtener una o más estimaciones de los parámetros de la forma estructural de la ecuación a partir de los paren presencia de una ecuación identificada. Dentro de esta categoría podemos distinguir dos posibles situaciones:

Notas de Antonio Caparrós Ruiz y Oscar D. Marcenaro

.1. Representación gráfica del impacto de diferentes shocks en un sistema de ecuaciones simultáneas de oferta y demanda de un bien.

Identificación.

Partiendo del ejemplo planteado en la subsección anterior -ecuaciones `7un sistema de ecuaciones constituido por ecuaciones de oferta y demanda, ¿en qué

consistiría el problema de la identificación?. La respuesta a esa pregunta se encuentra en la respuesta a nta (Gujarati, 2004): “¿cómo se sabe si se está estimando la función de demanda o

, partiendo de que conocemos solamente información sobre “P” y “C”. En podemos garantizar que los parámetros que estamos estimando corr

función de oferta o a otra función?. Desde un punto de vista del sistema expresado en su forma reducida las anteriores preguntas equivalen a responder esta otra: partiendo de que podemos estimar la

podemos obtener estimaciones de los parámetros de la forma estructural partiendo de estimaciones de la forma reducida?. La respuesta a esta cuestión no es única, así podemos encontrarnos frente a tres posibles situaciones:

No es posible obtener los parámetros estructurales partiendo de las estimaciones de los parámetros de la forma reducida (la ecuación está subidentificada o no identificada

En el caso en el que si se pueda obtener una o más estimaciones de los parámetros de la forma estructural de la ecuación a partir de los parámetros estimados para la forma reducida estaremos en presencia de una ecuación identificada. Dentro de esta categoría podemos distinguir dos posibles

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

115

.1. Representación gráfica del impacto de diferentes shocks en un sistema de

7.3.5b a `7.3.7b-, en el un sistema de ecuaciones constituido por ecuaciones de oferta y demanda, ¿en qué

consistiría el problema de la identificación?. La respuesta a esa pregunta se encuentra en la respuesta a “¿cómo se sabe si se está estimando la función de demanda o

, partiendo de que conocemos solamente información sobre “P” y “C”. En podemos garantizar que los parámetros que estamos estimando corresponden a la

función de oferta o a otra función?. Desde un punto de vista del sistema expresado en su forma reducida las anteriores preguntas equivalen a responder esta otra: partiendo de que podemos estimar la

s de los parámetros de la forma estructural . La respuesta a esta cuestión no es única, así

o de las estimaciones de subidentificada o no identificada).

En el caso en el que si se pueda obtener una o más estimaciones de los parámetros de la ámetros estimados para la forma reducida estaremos

en presencia de una ecuación identificada. Dentro de esta categoría podemos distinguir dos posibles

Page 116: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

116

b.1) Es posible obtener una estimación numérica única de los parámetros estructurales partiendo de las estimaciones de los parámetros de la forma reducida (la ecuación está exactamente identificada). b.2) Los parámetros de la forma reducida nos permiten obtener más de un valor numérico para algunos (o todos los) parámetros de la ecuación en su forma estructural (la ecuación está sobreidentificada59).

Al proceso de determinación de las posibilidades de obtener los parámetros de la forma estructural partiendo de estimaciones de la forma reducida se le denomina el problema de la identificación, y es una cuestión central en muchos análisis econométricos.

Vamos a plantear un ejemplo muy sencillo que nos va a permitir tener una visión intuitiva de

en qué consiste el problema de la identificación. Así si planteamos un modelo de oferta y demanda: # M ÷ M ÷ En este sistema de ecuaciones si E 0 estaríamos ante una curva de demanda, y si * 0

(la segunda ecuación) sería una curva de oferta. Por tanto es necesaria información adicional, en forma de restricciones, para poder identificar qué ecuación actúa dentro del modelo como ecuación de oferta y cuál de ecuación de demanda.

Podríamos pensar en el ejemplo anterior en términos de cómo alcanzar una solución, es decir

cómo estimar sus parámetros estructurales. La cuestión es que como veremos a continuación las ecuaciones no son identificables, pues tendremos más incógnitas a resolver (4) que ecuaciones (2). En otras palabras no hay forma de obtener valores para las cuatro incógnitas de los parámetros estructurales a partir de solamente dos coeficientes de la forma reducida. Esto es equivalente, desde un punto de vista de la Teoría Económica, a afirmar que más de una teoría puede ser representada con ese sistema, lo que los hace observacionalmente equivalentes, no habiendo forma de diferenciar con qué teoría concreta se corresponde, de ahí que se pueda afirmar que la estructura es no identificable. Veamos esto algebraicamente:

Forma estructural # 5M 5 ÷ M 5 5 ÷ De lo que obtenemos la siguiente forma reducida: ÷ 5 ÷1 5 , µãµf¼µDÌgGµµuÌfÌI¼Ìg`7.3.12b

M ÷ 5 ÷1 5 , µãfÂDÂr0ÌGÂGGµµuÌfÌI¼Ìg`7.3.13b Que se puede expresar de forma simplificada como: Π `7.3.14b M Π `7.3.15b

con Π T?BKB?K??T?BTB? ; y Π TB?K??KB?T?BTB? .

Como hemos subrayado en el sistema formado por las ecuaciones en forma reducida `7.3.12b y `7.3.13b los dos coeficientes contienen cuatro parámetros estructurales, lo que implica que

59 Lo que implica la posibilidad de obtener infinitas soluciones para los parámetros.

Page 117: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

117

es un sistema indeterminado o subidentificado (puesto que las dos ecuaciones que lo integran están subidentificadas)60, puesto que no podremos obtener estimaciones únicas de los parámetros de la forma estructural (cuatro) a partir de los parámetros del sistema en su forma reducida (dos). Un sistema sólo estará identificado si se pueden obtener los parámetros de la forma estructural a partir de los parámetros de la forma reducida, es decir si tenemos al menos (puesto que podemos tener más –en ese caso estaríamos ante un sistema sobreidentificado) el mismo número de coeficientes en la forma reducida que de parámetros en la forma estructural.

Ante este desfase entre el número de parámetros a estimar y la información disponible para

estimarlos cabe como solución para poder identificar los parámetros de las ecuaciones estructurales añadir información en una de las ecuaciones, que es equivalente a imponer restricciones sobre las restantes ecuaciones –del sistema-. En otras palabras habrá que tener en cuenta información adicional (esa información adicional en una ecuación respecto a la otra u otras del sistema implicará restricciones para el resto de las ecuaciones del sistema) para poder identificar el valor de esos parámetros.

¿Qué tipo de información podemos incluir en la estimación del sistema estructural para hacerlo identificable?

a) Normalización: Ya hablamos más arriba de esta cuestión, que resulta simplemente de

que en cada ecuación tiene que haber una variable explicada (endógena) cuyo coeficiente es igual a la unidad.

b) Identidades: Algunas de las ecuaciones del sistema pueden presentar la característica de que todos sus coeficientes son conocidos, como ocurre con las ecuaciones que recogen condiciones de equilibrio y las identidades contables.

Por otro lado podemos recurrir a información obtenida fuera de la muestra, que puede adoptar

diferentes formas:

c) Imponer restricciones sobre los parámetros del sistema estructural: c.1) Bien aplicando restricciones de exclusión: Es decir eliminando variables de una de las ecuaciones. En el ejemplo del modelo de demanda y oferta podemos, por ejemplo emplear una variable instrumental para el precio (por ejemplo: temperatura de la ciudad donde viven los consumidores) en la ecuación de oferta, que no se incluya en la ecuación de demanda, por tanto de la exclusión en esta última derivará la posibilidad de identificar los parámetros del modelo. c.2) Restricciones que implican la imposición de valores concretos para algunos parámetros de un modelo, como por ejemplo igualar a cero la ordenada en el origen, o que la suma de dos parámetros sea igual a “1”. Veamos este ejemplo en el que igualaremos a cero la ordenada en el origen de la ecuación de oferta:

Forma estructural # 5M 5 ÷ M 5 5 ÷

De lo que obtuvimos la siguiente forma reducida:

60 Esto ocurre cuando diferentes conjuntos de valores de los coeficientes estructurales son compatibles con un mismo conjunto de información. La implicación de esta situación es que una ecuación en forma reducida es compatible con diferentes ecuaciones estructurales o hipótesis, dificultando conocer cuál es la hipótesis que se está investigando (Gujarati, 2004).

Page 118: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

118

÷ 5 ÷1 5 C1 MB?N??NB?M?BMB? v1

Si en ese modelo imponemos una restricción nula sobre, por ejemplo, el término independiente de la ecuación de demanda (÷), lo que equivale a obligar a pasar esa recta por el origen de coordenadas, tendremos: Π T?BKB?T?BTB? `7.3.16b

Π KB?T?BTB? `7.3.17b

De ahí que 5P??PB?. De esta forma podemos afirmar que la ecuación de demanda es identificada,

gracias a la restricción que se ha impuesto. Si sustituimos ese valor de Ñ en `7.3.5b y `7.3.6b llegamos a: Π+ T?BKB?@Q??QB?TB? `7.3.18b

ΠC KB?@Q??QB?TB? `7.3.19b Entonces: ΠC 5M÷M M

ΠCΠC Π 5ΠC÷ ⇒ ΠC Πβ 5η

En una ecuación tenemos dos incógnitas, por lo que el sistema es indeterminado, porque la ecuación de oferta es inidentificable.

d) Imponer restricciones sobre la matriz de varianzas y covarianzas del sistema en su

forma estructural: Este es el caso, por ejemplo, de los denominados sistemas recursivos, en los que la matriz de varianzas y covarianzas correspondiente a las perturbaciones contemporáneas de cada una de las ecuaciones es diagonal (covarianzas nulas de los términos de perturbación). Otro ejemplo resultará de analizar el ejemplo del sistema de ecuaciones de oferta y demanda de un bien. Si conocemos el valor del parámetro (por ejemplo mediante su estimación por el método de variables instrumentales –implicando una restricción de exclusión en la ecuación de oferta-) podríamos calcular:

2 M» 5 Ñ

Ese valor estimado de la matriz de residuos poblacionales será consistente, por lo que si empleamos esa estimación de los residuos como instrumento (puesto que está muy correlacionado con la variable explicativa endógena de la ecuación de oferta –el precio-) junto con el instrumento que habíamos empleado para obtener el valor de Ñ, podremos obtener estimaciones consistentes de los parámetros de la ecuación de oferta. Pero para que esto sea así junto con la restricción de exclusión antes mencionada habremos tenido que suponer que 2 no está correlacionado con 2 (es decir, 2» no está correlacionado

Page 119: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

119

con 2S), para que podamos emplear 2» como instrumento en la ecuación de oferta, obteniendo así estimadores consistentes de los parámetros estructurales de esa ecuación. De ahí que para llegar a la identificación hemos tenido que imponer restricciones sobre la matriz de covarianzas.

e) Incluir nuevas variables en el modelo: Esta información adicional también puede

ayudar a la identificación de los parámetros del modelo. Veamos esto algebraicamente. Para ello en el sistema constituido por las ecuaciones [7.4.5] a [7.4.7] añadamos una variable explicativa adicional en la ecuación de demanda, así tendremos: M» +P `7.3.20bMª `7.3.21b donde P representan los ingresos del demandante (variable exógena), * 0, + E 0 y >0. Empleando la condición de equilibrio entre oferta y demanda obtenemos: +P De donde: ΠP `7.3.22b

con %$ 5 && ; y BK?KTBCB .

Y sustituyendo el valor del precio en equilibrio `7.3.22b en, por ejemplo, la ecuación `7.3.21b, llegamos a la siguiente ecuación en forma reducida: M ΠP `7.3.23b M ΠP

Con %& 5 &&&; y CBBK?KTBCB

Por tanto tenemos tres parámetros estructurales a estimar (, +, y dos coeficientes de la forma reducida, lo que implica que la ecuación de demanda está subidentificada, al ser imposible encontrar una solución para todos los coeficientes estructurales. No obstante para el parámetro estructural de la ecuación de la función de oferta () si es posible encontrar un valor único a partir de los coeficientes de la forma reducida, por lo que esa ecuación será exactamente identificada. Puesto que:

& %&%$

¿Cómo determinar si una ecuación es identificada, subidentificada (inidentificada) o

sobreidentificada, es decir cuáles son los criterios para la identificación? Para lograr este objetivo tendremos que recurrir a las condiciones de identificación que son de

dos tipos61: condiciones de orden y condiciones de rango. ¿Por qué se denominan así a estas condiciones? Simplemente porque para poder estimar los parámetros de una ecuación (y por tanto que la ecuación sea identificada) se tiene que cumplir dos condiciones:

61 Para la identificación podríamos proceder como hasta ahora, es decir analizando las restricciones en las ecuaciones del sistema, pero este método se hace muy tedioso cuando el número de regresores y/o ecuaciones aumenta, puesto que requiere el cálculo de la forma reducida.

Page 120: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

120

a) El número de instrumentos para la ecuación es al menos tan grande como el número de variables endógenas que actúan como explicativas. A esta se le conoce como condición de orden.

b) Las filas de E(ZtXt’) –siendo X la matriz de variables predeterminadas más los instrumentos y Z la matriz de variables predeterminadas más las endógenas que actúan como explicativas- tienen que ser linealmente independientes. Ésta es conocida como la condición de rango (puesto que implica que el rango de la matriz ZtXt’ es completo).

Antes de entrar de lleno en cuáles son estas condiciones vamos a discutir brevemente el planteamiento que nos llevará a definir las condiciones de orden y de rango. Partamos de un modelo en su forma estructural:

) ¬') () `7.3.24b Donde Η y son, respectivamente, matrices de coeficientes – de orden (n*n) y (n*m)- y ut un vector de perturbaciones de orden (n*1); ') contiene las variables predeterminadas e ) todas las variables endógenas, por tanto de E(Xtut’)=0. ⇒ ) 5$$¬') $$() `&. . &lb

⇒ #) %') Û) `&. . &Ub

A) Condiciones de Orden:

Teniendo en cuenta que las restricciones empleadas usualmente son las de exclusión, la

condición de orden implicará que el número de restricciones de exclusión sea al menos igual (o mayor) que el número de ecuaciones menos 1 (q ≥M-1).

De esta forma podemos sintetizar las condiciones de orden como sigue. Sea M el número de

ecuaciones en el sistema (igual al número de variables endógenas), y q el número de variables (del total) que no están incluidas en la ecuación (ya sean endógenas o predeterminadas). La condición de orden implicará:

a) Si q < M - 1, entonces el sistema es subidentificado. b) Si q = M - 1, entonces el sistema es exactamente identificado. c) Si q > M - 1, entonces el sistema es sobreidentificado.

Estas condiciones se pueden expresar de otra forma si diferenciamos entre variables

endógenas y predeterminadas (exógenas y endógenas retardadas) incluidas y excluidas en el modelo. Si diferenciamos en M el número de variables endógenas incluidas en la ecuación (que denotaremos como M*) y el número de variables endógenas excluidas en la ecuación (M**), y por analogía descomponemos K en K* (número de variables predeterminadas incluidas en la ecuación incluyendo, si es el caso, la ordena en el origen –intersección-) y K** (número de variables predeterminadas excluidas en la ecuación), la condición de identificabilidad q ≥M-1 se pueden expresar en otros términos. Así, teniendo en cuenta que q= M**+K**, como además M= M*+ M**-1, tendremos: M**+K**≥ M*+ M**-1, lo que equivale a la condición K**≥ M*-1 (el número de variables predeterminadas excluidas de la ecuación sea igual o mayor que el número de variables endógenas incluidas en la ecuación menos una):

a) Si K**<M*-1, entonces la ecuación es subidentificada. b) Si K**=M*-1, entonces la ecuación es exactamente identificada. c) Si K**>M*-1, entonces la ecuación es sobreidentificada.

Page 121: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

121

Ésta es una condición necesaria pero no suficiente. Aunque tendremos que implementarla para poder distinguir si la ecuación es identificada o sobreidentificada. De esta forma tendremos que, mediante las condiciones de orden, determinar qué ecuaciones son identificadas o sobreidentificadas, y a esas les aplicaremos las condiciones de rango. Las condiciones de orden son necesarias pero no suficientes, porque se han formulado basándonos en el número de ecuaciones (K+q), pero esto no garantiza que todas las ecuaciones sean linealmente independientes. En otras palabras, una ecuación que cumpla la condición de orden de identificabilidad puede no estar identificada si no todas las variables predeterminadas excluidas de una ecuación (incluidas en el sistema) sean independientes.

B) Condiciones de Rango: En un modelo con M ecuaciones (con M variables endógenas) una ecuación está identificada si

y sólo si se puede formar un determinante no nulo de orden M-1, a partir de los coeficientes de las variables endógenas y predeterminadas excluidas de esa ecuación, pero incluidas en las otras ecuaciones del modelo.

a) Si no se puede formar al menos un determinante no nulo de orden M-1, a partir de los

coeficientes de las variables endógenas y predeterminadas excluidas de esa ecuación, pero incluidas en las otras ecuaciones del modelo la ecuación es subidentificada (puesto que el rango de la matriz será menor que M-1).

b) Si la matriz formada a partir de los coeficientes de las variables endógenas y predeterminadas excluidas de la ecuación -que se está identificando-, pero incluidas en las otras ecuaciones del modelo, presenta al menos una matriz cuadrada de orden M-1⇒la ecuación es identificada. En otras palabras esta condición de rango permite afirmar que hay una sola solución para los parámetros estructurales partiendo de los parámetros dados de la forma reducida. Será exactamente identificada cuando sólo haya un determinante distinto de cero de rango igual a M-1.

c) En cambio será superidentificada cuando haya más de un determinante distinto de cero

de rango igual a M-1.

Veamos a efectos prácticos una forma sencilla de aplicar las condiciones de rango: Partamos, en primer lugar, de uno de los modelos planteados más arriba: #M 5 5 M 5 +Ìã 5CsµF `7.1.7bM 5 5 M 5 +Ìã `7.1.8b Para determinar si se cumplen o no las condiciones de rango tendremos que construir una

tabla con tantas filas como ecuaciones y tantas columnas como variables hay contenidas en la forma estructural del modelo. De tal forma que si en una ecuación aparece una determinada variable su casilla tendrá un valor distinto de 0, y 0 en caso contrario. En el ejemplo que venimos empleando tendremos:

Const Ï$) Ï&) ) H6) Ecuación `&. $.&b 5 1 5 -+ 5C Ecuación `&. $.Vb 5 5 1 -+ 0 La condición de orden nos permite determinar que la ecuación `7.1.7b no es identificada (es

subidentificada puesto que K**(=0)<M*-1 (=1)), por lo que no habrá que analizarla en relación a las condiciones de rango. Respecto a la ecuación `7.1.8b tendremos que proceder eliminando la fila de

Page 122: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

122

la correspondiente ecuación y las columnas para las que la casilla de la ecuación son distintas a cero. En nuestro ejemplo concreto tendremos:

H6) 5C

Cómo último paso tendremos que comprobar si hay al menos M – 1 filas y columnas cuyos elementos son todos distintos de cero, para saber si es identificada. En nuestro caso tenemos “1” filas y columnas con valores distintos de cero, por lo que la ecuación es exactamente identificada. Obviamente en el caso de que se imponga la restricción sobre C de que su valor es 0, la ecuación no sería indentificable.

Veamos esto mismo desde una perspectiva alternativa: #M M +Ìã CsµF `7.1.7bM M +Ìã `7.1.8b

a) Condiciones de orden:

En la primera ecuación tenemos que: K**(predeterminadas excluidas)=0<M*-1 (variables endógenas incluidas)=1.

En la segunda ecuación tenemos que: K**=M*-1 =1. Por tanto la primera ecuación es subidentificada y la segunda exactamente identificada.

b) Condiciones de rango: Para la primera ecuación:

A=å + C + 0 æ; R=W0000X; A*R=00 ø`tob ] * Î5 $, en consecuencia la

ecuación es subidentificada.

Para la segunda ecuación:

A=å + C + 0 æ; R=W0001X;A*R=C0 ø`tob $ Î5 $, en consecuencia la

ecuación es identificada, pues ø`tob 1 Y 5 1 y no hay más de un determinante distinto de cero que cumple la condición, por lo que es exactamente identificada.

7.3.2. Estimación y validación. Para las ecuaciones simultáneas, la aplicación del método de mínimos cuadrados ordinarios

(MCO) resulta en estimadores sesgados y con errores cuadrados medios que pueden ser bastante elevados, especialmente en muestras pequeñas. De aquí que se utilizan procedimientos especializados tales como la estimación recursiva, los mínimos cuadrados en dos y tres etapas (MC2E, MC3E), o bien la estimación máximo verosímil con información limitada (LIML, de Limited-Information Maximum Likelihood) o con información completa (FIML, de Full-Information Maximum Likelihood). Estos métodos de estimación se pueden clasificar en dos grandes grupos atendiendo a la información de que dispongamos:

a) Métodos de Información limitada: Que implican estimar ecuación a ecuación (Mínimos

Cuadrados Recursivos, MCI, Variables instrumentales, Mínimos Cuadrados en dos etapas, Máxima verosimilitud con información limitada).

Page 123: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

123

Estos métodos, al realizar la estimación ecuación a ecuación, no tienen en cuenta la información relativa a la especificación de las otras ecuaciones del sistema, de forma que no tiene en cuenta cuáles son las restricciones de identificación de las otras ecuaciones. En cambio los métodos de información completa utilizan toda la información que existe en el sistema de cada una de las ecuaciones, lo que permite que las estimaciones con estos métodos sean, además de consistentes, asintóticamente eficientes.

b) Métodos de Información completa: Que implican estimar simultáneamente todo el conjunto de ecuaciones (Mínimos Cuadrados en 3 etapas y Máxima verosimilitud con información completa).

¿Cómo estimar los parámetros de un sistema de ecuaciones simultáneas? Para tener una visión esquemática de cuáles son los métodos de estimación, tendremos que

distinguir, además de los sistemas recursivos (y de los SURE), entre sistemas con ecuaciones exactamente identificadas y superidentificadas, y la forma de abordar la estimación, es decir ecuación a ecuación (métodos de información limitada) o estimación simultanea de todas las ecuaciones (métodos de información completa). Así tendremos:

Cuadro 7.3.2: Estimación de parámetros en sistemas multiecuacionales

Sistemas SURE Sistemas recursivos

Resto de sistemas de ecuaciones simultáneas

Identificadas Superidentificadas

(al menos una de las ecuaciones)

MCG-Zellner MCO MCI/MC2E

VI (en sus diferentes variantes según se estime ecuación a

ecuación o de forma simultánea)

Ecuación a Ecuación:

MC2E/MVIL

Estimación simultánea:

MC3E/MVIC Los dos primeros casos presentados en el cuadro anterior (SURE y sistemas recursivos) ya han

sido analizados, por lo que nos centraremos a continuación en los restantes casos62. A) Métodos de Información limitada: También denominados métodos uniecuacionales,

porque implican estimar ecuación a ecuación. Así estimaremos cada ecuación del sistema individualmente, teniendo en cuenta las restricciones a las que esté sujeta (para hacerla identificable) sin tener en cuenta en esta fase de estimación las restricciones que afecten a las otras ecuaciones del sistema. No obstante para la fase previa de identificación si se habrá tenido en cuenta la información proporcionada por las restantes ecuaciones del sistema. Dentro de esta familia de métodos de estimación tenemos63: Mínimos Cuadrados Recursivos, MCI, Variables instrumentales, Mínimos Cuadrados en dos etapas, Máxima verosimilitud con información limitada).

Es importante subrayar que sólo se podrán estimar los parámetros de un sistema de ecuaciones

simultáneas siempre que ninguna de sus ecuaciones sea no identificada (subidentificada). En caso de que la ecuación sea identificada (exactamente identificada) el método apropiado es el denominado de los Mínimos Cuadrado Indirectos (MCI)64. En cambio, en el caso de ecuaciones sobreidentificadas el método de estimación más aplicado es el de los Mínimos Cuadrados en 2

62 Las propiedades de los estimadores para sistemas de ecuaciones simultáneas no se suelen conocer en el caso de que se trabaje con muestras finitas, por lo que nos referiremos a las propiedades asintóticas. 63 Se han desarrollado otros métodos de estimación pero su análisis se escapa de los objetivos de este texto. 64 En inglés se expresa como Indirect Least Squares (ILS).

Page 124: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

124

Etapas (MC2E)65, aunque este último también se puede aplicar con ecuaciones exactamente identificadas.

A.1) Mínimos Cuadrado Indirectos (MCI): Este método consiste en la obtención de las estimaciones de los parámetros estructurales a

partir de las estimaciones por MCO de los parámetros de la forma reducida. En concreto para obtener la estimación por MCI tendremos que dar los siguientes pasos:

1) Obtener la forma reducida para las ecuaciones. 2) Estimar, por MCO, la matriz de coeficientes de la forma reducida ZÍ , en cada una de

las ecuaciones de la forma reducida del sistema (los estimadores serán consistentes puesto que no habrá regresores estocásticos al ser todas las variables explicativas predeterminadas).

3) A partir de las relaciones algebraicas existentes entre los coeficientes de la forma reducida y de la forma estructural se deducen los valores de los coeficientes de la forma estructural (que serán únicos, puesto que la ecuación es exactamente identificada) a partir de los coeficientes obtenidos en el primer paso.

Estos estimadores serán funciones continuas de estimadores consistentes, por lo que

serán estimadores consistentes y asintóticamente eficientes, aunque esto no implica que sean insesgados.

Es importante insistir en la idea que el método de los MCI sólo puede emplearse para estimar

los parámetros estructurales de la ecuación (o ecuaciones) que esté exactamente identificadas, pero no permitirá estimar las ecuaciones que aún perteneciendo al mismo sistema no estén exactamente identificadas. Además a medida que en un sistema el número de ecuaciones sea elevado este método de estimación se hace tedioso, por lo que no se suele emplear. Como alternativa se emplea el método de los MC2E. Hay que subrayar que el problema de simultaneidad no es sino una forma de endogeneidad, por tanto, al igual que ocurría con los problemas de omisión de variables relevantes y de errores de medida, el método de estimación más empleado será el de variables instrumentales.

En el caso de ecuaciones sobreidentificadas no se puede aplicar MCI porque para cada

parámetro de la forma estructural podremos encontrar dos o más valores a partir de la forma reducida. A.2) Variables Instrumentales (VI): En el caso en que al menos una de las variables explicativas esté correlacionada con los

términos de perturbación, lo que se suele dar con mucha frecuencia en el caso de los modelos multiecuacionales, como vimos en secciones precedentes los estimadores por MCO no serán consistentes. En ese caso podemos recurrir a los estimadores por Variables Instrumentales, que, recordemos, se basan en buscar variables (Z) que sustituyan a las que están correlacionados con el término de perturbación por otras que no lo estén y que a su vez estén muy correlacionadas con las variables a las que sustituyen. En términos algebraicos el problema que se plantea es fÌF`1r²b Ê 0

Para solventarlo buscamos una (o más variables) Z que cumplan que lim°→ ó′° 0 y lim°→ ó′L° existe y es una matriz no singular.

Teniendo en cuenta que si estimamos por variables instrumentales la matriz de regresores

Xt=[1, Xt,Yt-1] se reemplaza por Zt=[1, Xt,Zt].

65 En inglés se expresa como Two Stage Least Squares (TSLS).

Page 125: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

125

El estimador mediante variables instrumentales del vector de parámetros del modelo será ìÑ ï²ï′, donde Z incluye a las variables que actúan como instrumento de la/s variable/s del modelo original66. Por analogía con lo que vimos en la estimación por MCO, el estimador del vector de parámetros ìÑ se distribuirá asintóticamente como una normal:

ìÑîí °→ðññò `ì, `ï²²ï²ïï²bb De esta forma los estimadores por VI son consistentes. Veamos un ejemplo de aplicación de este método VI. En concreto apliquémoslo al modelo de Haavelmo: Ï) ] $³6)Ö) () ³6)Ö) Ï) 7)

En este ejemplo, la correlación que observábamos entre la renta y el término de perturbación en la ecuación reducida, plantea problemas de consistencia del estimador por MCO. Para evitar esto podemos recurrir al método de estimación por VI, pero ¿qué variable utilizar como instrumento? En este caso un firme candidato es la inversión (7)), puesto que está correlacionada con la renta pero, en principio, no con las perturbaciones. De esta forma: Xt=[1, Rentat] se reemplaza por Zt=[1, It]; y el estimador quedaría: :Í7Õ=û²'$û² El estimador por variables instrumentales de la renta será más eficiente en la medida en que el instrumento y la renta estén más correlacionados. La única dificultad, en general compleja de resolver, es buscar una variable que pueda servir como instrumento. Una opción para “soslayar” este problema es recurrir a un caso particular de estimación por variables instrumentales, como es el de los Mínimos Cuadrados en Dos Etapas (MC2E), en el que se utilizan los valores predichos de la variable endógena que causa los problemas como instrumento de esa variable, en el que los valores predichos se obtienen a partir de una regresión en el que los regresores son todas las variables predeterminadas en el sistema completo, que por ser predeterminadas son no estocásticas.

A.3.) Mínimos cuadrados en dos etapas:

Recordemos que este método se puede aplicar tanto para ecuaciones identificadas67 como

sobreidentificadas. La idea que subyace tras este método de estimación (tal como habíamos subrayado en el tema

3) es reemplazar el regresor endógeno (estocástico), cuya correlación con el término de perturbación genera los sesgos en la estimación por MCO, por uno que no sea estocástico y por tanto esté incorrelacionado con el término de perturbación. Para obtener los estimadores por MC2E habrá que implementar las dos etapas siguientes68:

1) Obtener los valores predichos de la variable endógena de interés (que a su vez será

regresor en al menos otra de las ecuaciones del sistema) regresando esta variable respecto a todas las variables predeterminadas del sistema (mediante MCO). Esto es equivalente a estimar las ecuaciones en forma reducida y obtener los valores predichos (ajustados) para las variables endógenas.

66 Este vector de características será al menos tan grande (en número de variables) como X. Recordemos que las condiciones que debe de cumplir el vector Z son: estar correlacionado con X, pero ser independiente de u. 67 En el caso de ecuaciones exactamente identificadas los resultados obtenidos por MC2E y MCI coincidirán. 68 Emplearemos el álgebra suponiendo un sistema con dos ecuaciones simultáneas en el que la primera está sobreidentificada y la segunda no.

Page 126: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

126

4&) MÍ MÍ'$) MÍ '&)

2) El valor predicho para la variable endógena en la primera etapa se incluirá como regresor sustituyendo ésta en la forma estructural original. De esta forma el valor ajustado o predicho actúa como proxy o instrumento del valor real de la variable endógena. Una vez realizado esto se procede a estimar por MCO. De esta forma conseguiremos que los coeficientes obtenidos sean consistentes69. Ù$¿ $4&) ¬') ()

Es importante que el modelo ajustado en la primera etapa presente una alta bondad del ajuste (R2), para que el valor predicho y el real de la variable endógena sean próximos (estén muy correlacionados), es decir el valor ajustado o predicho sea un buen instrumento de su valor real. Además en ese caso los resultados por MCO y por MC2E serán muy similares. También podríamos emplear otras variables como proxies o instrumentos para la variable endógena (en cuyo caso estaríamos en presencia de una estimación por VI en sentido puro, que se analizó en la subsección anterior).

A.3.1) Mínimos cuadrados en dos etapas con autocorrelación:

A.3.1.1) En el caso de modelos sin variables endógenas retardadas: Partiendo de la nomenclatura empleada hasta ahora: y1 Η

⇒ y1 tï `´ b åæ ⇒ tï `´ b åæ Siendo los elementos de la matriz A de coeficientes estructurales, partamos de un esquema de autocorrelación del tipo:

, ø, ,, con ruido blanco. En este contexto la autocorrelación genera problemas de falta de eficiencia, afectando así a

los test de verificación de hipótesis, pero no afecta a la consistencia. Si partimos, al igual que hicimos en el tema 3, de la transformación de Prais-Winsten para cada una de las ecuaciones del modelo:

, 5 ø, ÷, 5 ø, , 5 ø, , , con t[2 y |ø|<1 [7.4.10] Para obtener una estimación consistente de ø podemos emplear el coeficiente de autocorrelación muestral de orden 1 para los residuos obtenidos por MCO:

ø\4 ∑ 2,2,∑ 2,

69 Sin embargo en muestras pequeñas el estimador por MC2E puede ser sesgado, puesto que aunque las variables predeterminadas por definición son no estocásticos los ]Í serán estocásticos al ser función de las perturbación aleatoria y por tanto Ù2$¿ también será función de la perturbación aleatoria.

Page 127: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

127

Siendo Û4,) una estimación de la perturbación que surge de un modelo en el que se han obtenido estimaciones consistentes de mediante MC2E. Pero, ¿qué variables instrumentales emplear? El problema de correlación se presenta entre , y ,, por tanto tendremos que instrumentalizar , para lo que emplearemos el valor estimado para (Í en una regresión en la que todas las variables exógenas actúen como instrumento. Siguiendo a Greene (1998) el modelo se puede estimar siguiendo los pasos que se detallan a continuación:

a) Estimar los parámetros de la forma reducida (M) con (X’X)-1X’Y y obtener estimaciones consistentes de (Í a partir de los correspondientes instrumentos.

b) Calcular ø2 utilizando MC2E, a partir de lo cual podremos obtener

ø\4 ∑ 2,2,∑ 2,

c) Partiendo de los valores de Í y de los valores obtenidos para ø\4 , derivaremos estimaciones

por MCGF de los parámetros de la forma estructural transformada que se mostró en [7.4.10]. El estimador resultante se puede demostrar que es asintóticamente eficiente.

A.3.1.2) En el caso de modelos con variables endógenas retardadas: En este caso ni la forma reducida obtenida en la etapa a), ni las subsiguientes

estimaciones de ø serán consistentes, puesto que habrá regresores estocásticos. ¿Es posible solventar esto? La respuesta es sí; para ello bastará con llevar a cabo la etapa a) anterior pero considerando a las variables endógenas retardadas como puramente endógenas (obviando su retardo), es decir sacarlas fuera del vector de variables predeterminadas, puesto que en la primera etapa sólo se requiere estimaciones consistentes de ø, no eficientes70. De esta forma en la etapa b) se obtienen estimaciones consistentes, aunque no eficientes. Esos residuos consistentes serán los que se empleen en la estimación de los valores ø. A partir de estos ø\4 acometo la tercera etapa, derivando estimaciones por MCGF en las que se obtienen estimaciones para los parámetros de las variables endógenas retardadas como si éstas fueran puramente endógenas. De esta forma se obtienen estimaciones que no son totalmente eficientes, puesto que no se ha estimado la forma reducida completa y el estimador de ø no es eficiente. Para resolver esto se puede recurrir a un procedimiento de iteración en la última etapa.

Veamos con un ejemplo de la relación de ejercicios cómo deberíamos proceder a efectos

prácticos a la hora de llevar a cabo una estimación por MC2E.

A.4) Máxima Verosimilitud con Información Limitada (MVIL)71.

Al igual que los estimadores anteriores se basa en la estimación ecuación a ecuación. La idea que subyace detrás de este estimador es la de obtener estimaciones que maximicen la función de verosimilitud con respecto a todos los parámetros desconocidos del modelo. A este estimador también se le denomina ratio de varianza mínima. Debido a la complejidad de su estimación (en cuanto al cálculo de la función de verosimilitud), el profesor Schmidt desarrolló una forma “sencilla” de obtener estimadores idénticos a los MVIL. Los pasos a seguir partiendo de una ecuación perteneciente a un sistema de ecuaciones simultáneas, como la que se presenta a continuación, son los siguientes

70 Greene (1998). 71 Limited Information Maximum Likelihood (LIML).

Page 128: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

128

Partiendo de la ecuación anterior realizamos particiones del rango de valores de , para cada valor de las correspondientes particiones estimo un valor de que denotaremos por ~^?, y que será igual a la diferencia entre el valor observado de y el valor de correspondiente a la partición (~^? 5 ~^?). A continuación se regresa el valor de cada ~^, respecto a todas las variables predeterminadas, obteniéndose para cada estimación una suma de cuadrados de residuos (SCR). Para determinar el estimador MVIL elegiremos aquel valor que minimice el ratio de diferencias entre pares de estimaciones, es decir el valor de que minimice la expresión: _Ó`abdc_Ó`abd§_Ó`abdc ∀Ì, _

En el caso de ecuaciones exactamente identificadas los resultados obtenidos por MVIL, MC2E y MCI coincidirán. El estimador MVIL es un estimador consistente, que, en el caso de que la ecuación a la que se aplique sea exactamente identificada, además será un estimador asintóticamente eficiente y con distribución normal asintótica.

B) Métodos de información completa: También denominados métodos de sistemas, puesto que implican estimar simultáneamente todo el conjunto de ecuaciones, teniendo en cuenta, por tanto, las restricciones que afectan a todas las ecuaciones del sistema; de ahí que se reciban el nombre de métodos de información completa. Dentro de este conjunto de métodos destacaremos los Mínimos Cuadrados en 3 etapas y Máxima verosimilitud con información completa. Es importante subrayar que los métodos de información completa en principio son preferibles que los de información limitada por su mayor riqueza en información, sin embargo esto les hace requerir mucho más recursos computacionales (ralentizando su estimación) además de hacerlos más difíciles de resolver puesto que las soluciones que proporcionan son no lineales en los parámetros. Además los potenciales errores de especificación que existan en una o más ecuaciones del sistema serán transmitidos al resto del sistema por su filosofía de estimación; por todo ello se suele recurrir más a la estimación mediante métodos de información limitada.

B.1) Mínimos Cuadrados en Tres Etapas (MC3E)72.

Este método de estimación fue propuesto por Theil y Zellner (1962). El estimador (MC3E) se puede considerar una combinación de los métodos de estimación en dos etapas (MC2E) y los mínimos cuadrados generalizados (MCG). El primer método de estimación me permitirá obtener estimaciones consistentes, y el segundo estimaciones eficientes. Para la obtención del estimador MC3E tendremos que seguir las dos etapas del estimador por MC2E y añadir una etapa adicional. Veamos esto partiendo de un sistema de ecuaciones:

1) Elijo variables instrumentales para obtener una estimación de Y (en la forma reducida). A

continuación obtenemos estimaciones, mediante mínimo cuadrados en dos etapas, de ÑÒÓd en cada una de las m ecuaciones: βôîí=ï²ï².

2) A partir de los parámetros de la forma reducida se obtienen los parámetros de la forma

estructural (de las m ecuaciones del sistema), y partiendo de esas estimaciones se obtiene una estimación de los residuos en cada ecuación ( 5 βôîí, y se calcula la covarianza entre ellos:

72 Three Stages Least Square (3SLS).

Page 129: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

129

ø\eù f ∑ 4c4§c,§cg ∀Ì, _ 1,… ,F (ecuaciones)

3) Partiendo de esa estimación de los valores de la matriz de varianzas y covarianzas

podemos obtener el estimador MCG73 mediante la expresión (04 está constituida por los elementos estimados de ø\eù74: ÑÒÓ+d ïÑ ²04ïÑïÑ′04

Este estimador cumple los requisitos de los estimadores por variables instrumentales, por lo

que implícitamente será consistente:

plim $hïÑ′0i¿= plim ¸$h∑ ïÑi¿¾j$ º ]

Además es un estimador asintóticamente eficiente (de entre todos los estimadores

obtenidos por VI), y en el caso de que las perturbaciones sigan una distribución normal el estimador MC3E tiene la misma distribución asintótica que el estimador MVIC, que veremos en la siguiente subsección.

A pesar de sus ventajas no está exento de inconvenientes, que básicamente radican en que

requiere disponer de una cantidad elevada de información; además si se comete un error de especificación en alguna ecuación, ese error afecta a las estimaciones de los coeficientes de las restantes ecuaciones, cosa que no ocurre en los métodos de información limitada, pues al estimarse en esos últimos ecuación a ecuación el error de especificación de una ecuación no afectaría a los coeficientes estimados en las restantes ecuaciones. A pesar de esto es más rápido computacionalmente que MVIC y, en el caso de que existan correlaciones entre las perturbaciones aleatorias de distintas ecuaciones estructurales, es más conveniente que MVIC.

B.2) Máxima Verosimilitud con Información Completa (MVIC)75.

Este método de estimación se emplea (aunque con menor frecuencia que MC2E y MC3E) cuando se quiere obtener estimaciones máximo verosímiles en un sistema de ecuaciones con términos de perturbación que se distribuyen según una normal; dando lugar a estimadores eficientes. De hecho son los más eficientes posibles para la estimación de un sistema de ecuaciones simultáneas. La idea que subyace tras este método de estimación es que, partiendo de nuestra formulación del sistema de ecuaciones simultáneas, podemos calcular la función de densidad conjunta del vector formado por todas las variables endógenas condicionado al valor de las variables predeterminadas, y al maximizar esa función de verosimilitud conjunta obtendremos el estimador por MVIC.

Este estimador pertenece a la familia de los métodos de estimación por variables instrumentales, por la forma en que se implementa. Veamos cómo se puede obtener el estimador MVIC: ÑÒíîÓ ïѲ04ïïÑ′04

73 También denominado método de Aitken. 74 oµDé¼Gµãµuµ0 Σ⊗ P. 75 Full information Maximum Likelihood (FIML).

Page 130: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

130

Siendo ûͲ04$=

,,

2ïÑ 2ïÑ … 2ïÑ2ïÑ 2ïÑ … 2ïÑ2+ïÑ+ 2+ïÑ+ … 2+ïÑ+… … … …2ïÑ 2ïÑ, … 2ïÑ--=ûÍ′

y ûÍ[ `'ÎÍ ['[b. Teniendo en cuenta que YÍ corresponde con la forma reducida que se estima a partir de las ecuaciones en forma estructural, tal que: YÍ 5$Í$¬Í

y ø\eù f ∑ 4c4§c,§cg=AlcócmnÍ lcó§mopcg Σôqr.

Nuestro estimador por Máxima Verosimilitud con Información Completa consistirá en maximizar la función de distribución conjunta de y1 tï (función de verosimilitud) respecto a los coeficientes estructurales (A) y la matriz de covarianzas 0.

En el caso en que el modelo sea exactamente identificado el estimador por MCI coincide

con el estimador MVIC. Además en caso de ser exactamente identificado el estimador MVIC produce los mismos valores para las estimaciones que el estimador por Variables Instrumentales y el estimador por MC2E. En cambio si el modelo está sobreidentificado la estimación por Variables Instrumentales, MC2E y MVIC no son equivalentes, siendo en este caso MVIC el más eficiente.

El estimador por MVIC es asintóticamente insesgado y eficiente. Igualmente es más

eficiente que los estimadores obtenidos por métodos de información limitada. Además, en el caso en el que las perturbaciones estén normalmente distribuidas el estimador MC3E tiene la misma distribución asintótica que MVIC (Greene, 1998), lo que unido a que al ser MC3E computacionalmente más fácil de implementar hace que se suela implementar MC3E con mayor frecuencia que MVIC.

7.4. Simulación y predicción.

Simulación:

Respecto a la simulación, la problemática que encierra puede ser vista de forma muy sencilla a partir de un ejemplo. Así supongamos que tenemos el siguiente sistema de ecuaciones de demanda de dos bienes (bien 1 y bien 2):

#M M + M M + Partiendo de este modelo, en primer lugar tendremos que estimar los valores de los parámetros, a partir de lo cual predecir los valores de M. Pero para predecir M es necesario conocer los valores de M. Para poder afrontar esta cuestión tendremos que obtener la forma reducida del sistema: #M M M M+ M M M M+ Dando valores a y podríamos obtener sucesivas predicciones de M y M a partir de este modelo. La cuestión es ¿conocemos los valores de '$ y '& para el periodo de predicción?. En el caso de que no conozcamos por ninguna vía esos valores tendremos que simularlos, por ejemplo extrapolando su valor a partir de una técnica univariante (como las vistas en la asignatura Métodos Econométricos Aplicados a la Empresa I), o bien haciendo una serie de hipótesis sobre cuál puede ser

Page 131: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

131

la evolución futura de los valores de esas variables. De ahí que se hable de simulación, en lugar de predicción.

Predicción: a) Predicción a partir de información subjetiva: Cuando no tengamos ninguna fuente de información histórica en la que apoyarnos, tendremos

que recurrir, en general, a la información proporcionada por los agentes (carácter subjetivo). Así podemos recurrir a diferentes fuentes de información subjetiva:

- Encuestas de actitudes o sentimientos. - Encuestas en las que los individuos manifiestan sus intenciones o expectativas. Por

ejemplo las intenciones de inversión en infraestructuras de las administraciones públicas o los empresarios, o las de particulares, relativas a la compra de bienes duraderos.

- Discusión en grupo de la que surge información (brainstorming: lluvia de ideas). - Combinación de las opiniones de expertos para obtener previsiones más globales. Por

ejemplo predicción de alumnos que se van a presentar a un examen a partir de la opinión individual de los profesores que imparten en cada uno de los grupos.

- Previsiones de expertos con retroalimentación. En esto se basa por ejemplo el método Delfos, dentro del cual se procede recogiendo la información de un panel de expertos que al ser agrupada pasa de nuevo a los expertos para que, en función de las previsiones globales, reformulen sus previsiones.

b) Predicción a partir del alisado de series temporales: Este tipo de predicción hace referencia a procedimientos basados en la existencia de

información histórica. Las técnicas más habituales son: - Fórmulas ad-hoc de predicción. En este contexto las predicciones se obtienen mediante

algún mecanismo automático, que se establece a priori y que sigue un esquema de cálculo recursivo. Por ejemplo los métodos de las medias móviles y el alisado exponencial.

- Ajuste de tendencias. Constituye el enfoque clásico de series temporales, y se basa en la descomposición de la serie temporal en sus componentes de tendencia, estacionalidad y ciclo.

- Análisis temporal de procesos estocásticos (enfoque moderno del tratamiento de series temporales). Basado en el análisis del comportamiento estocástico de una serie.

c) Predicción a partir de relaciones entre variables: - Análisis de correlación entre variables (ejemplo: correlaciones entre agregados

macroeconómicos). - Modelos de simulación determinista (ejemplo: tablas input-output). - Establecimiento de analogías: Cuando hay fenómenos económicos similares en

diferentes ubicaciones espaciales. Por ejemplo la elasticidad precio de la demanda de aceite de oliva puede ser muy similar en países mediterráneos (por la similitud en dietas y renta per capita).

- Modelos econométricos uniecuacionales o multiecuacionales: Establecen relaciones de causalidad, incluyendo un componente aleatorio (término de perturbación).

Como ejemplo vamos a realizar la simulación que tienen colgado en el Campus Virtual.

Page 132: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

132

Bibliografía Angrist, J. D. (1990). “The Draft Lottery and Voluntary Enlistment in the Vietnam Era”, NBER

Working Papers 3514. Cagan, P. (1956). “The Monetary Dynamics of Hyperinflations”, en M. Friedman (ed.) Studies in the

Quantity Theory of Money, University of Chicago Press, Chicago. Friedman, M. (1957). A Theory of the Consumption Function. National Bureau of Economic Research,

Princeton University Press, Princeton. Greene, W. (1998). Introduction to Econometrics. Ed. Prentice Hall, Madrid. Hamilton, J. D. (1994). Time series Analysis. Princeton University Press, New Jersey. Ljung, G. y Box, G. “On a Measure of Lack of Fit in Time Series Models”. Biometrika, 66, pp. 265-

270. Marcenaro, O. D. (2008). Manual de iniciación al manejo del programa informático EVIEWS y sus

aplicaciones econométricas. Universidad de Málaga. Newey, W. y West, K. (1987). A Simple Positive Semi-Definite, Heteroskedasticity and

Autocorrelation Consistent Covariance Matrix. Econometrica, 55, pp. 703–708. Novales, A. (2000). Econometría. Ed. McGraw Hill, Madrid. Otero, J. M. (1993). Econometría. Series temporales y Predicción. Ed. AC, Madrid. White, H. (1980). A Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for

Heteroskedasticity. Econometrica, 48, pp. 817–838. Wooldridge, J. (2005). Introducción a la Econometría. Un enfoque moderno. (2ª Edición). Editorial

Thomson, Madrid. Zellner, A. (1962). “An efficient method of estimating seemingly unrelated regression equations and

tests for aggregation bias”. Journal of the American Statistical Association, 57: pp. 348–368.

Page 133: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

133

Apéndice A: Alfabeto griego. Letras griegas Α α Alfa Β β Beta Γ γ Gamma ∆ δ Delta Ε ε Épsilon Ζ ζ Dseta Η η Eta Θ θ Theta Ι ι Iota Κ κ Kappa Λ λ Lambda Μ µ My Ν ν Ny Ξ ξ Xi Ο ο Ómicron Π π Pi Ρ ρ Ro Σ σ Sigma Τ τ Tau Υ υ Ípsilon Φ φ Fi Χ χ Ji Ψ ψ Psi Ω ω Omega

Page 134: Econometria II

Notas de Econometría II Antonio Caparrós Ruiz y Oscar D. Marcenaro-Gutiérrez

134

Nota: La Depresión de los años 30 y el multiplicador de Haavelmo:

Continuando con el estudio del modelo y las propuestas keynesianas, vamos a analizar ahora el efecto del consumo público, de los gastos y los ingresos del estado, sobre la demanda agregada.

No hay ningún mecanismo automático que haga que la renta de equilibrio coincida con la

producción de pleno empleo. La renta de equilibrio -en otras palabras, el valor de los bienes y servicios que el sistema tiende a producir- está determinada por la demanda agregada. Si ésta estuviese formada exclusivamente por el consumo privado y la inversión de los empresarios, sería mucha casualidad que coincidiesen producción real y producción de pleno empleo; los deseos de ahorro de las familias y las expectativas de los empresarios no tienen por qué conjuntarse en la proporción y cuantía exacta requeridas. Es más, si en algún momento coincidiesen, el resultado sería muy inestable ya que las expectativas de los empresarios cambian continuamente, cíclicamente.

Los economistas neoclásicos consideraban que el sistema económico mostraba una

tendencia natural hacia un equilibrio con pleno empleo. Contrariamente a esas previsiones, la Gran Depresión de los años treinta puso en evidencia que era posible contemplar una situación estable de depresión y que el desempleo podía permanecer durante largos períodos.

Pero el pesimismo del análisis keynesiano vino acompañado de la receta para la corrección de

esas situaciones: la política fiscal del gobierno -la manipulación de los impuestos y los gastos del sector público- podía reconducir la demanda agregada hasta la altura exacta que permitiera una producción sostenida de pleno empleo.

Los gastos del gobierno están formados por sus compras de bienes y servicios y por las

transferencias: las pensiones de invalidez y jubilación, subsidios de desempleo y subvenciones a las empresas, entre otras. En general, los gastos del Estado suponen un aumento de la demanda agregada. La determinación de la cuantía de esos gastos es una decisión política exógena, es decir, independiente de la renta; por tanto puede ser considerada como de cuantía fija. Pero la cuantía puede ser ajustada para que la producción real coincida con la producción de pleno empleo.

La incidencia de los gastos del gobierno sobre la renta real también recibe el nombre de efecto

multiplicador. Un aumento en los gastos del gobierno por valor de 100 puede provocar un aumento en la renta de 500.

Pero no se puede olvidar que existen también ingresos públicos. Los impuestos, al detraer

dinero de las rentas de las familias, desplazan la demanda agregada en sentido descendente. La consiguiente disminución en la renta real se verá afectada igualmente por el efecto multiplicador. A pesar de todo, el efecto conjunto de una subida igual en los gastos públicos y en los impuestos será beneficioso. Este efecto es el llamado "multiplicador de Haavelmo”. La explicación es que los impuestos están no sólo haciendo disminuir el consumo sino provocando además una disminución en los ahorros. Si todo lo que detrae el gobierno en forma de impuestos es gastado, el efecto sobre la demanda agregada será ascendente, la cantidad ahorrada en el sistema disminuirá, y la renta real subirá.


Top Related