econometria i

110
UNIVERSIDAD NACIONAL DE PIURA FACULTAD DE ECONOMIA DEPARTAMENTO ACADEMICO DE ECONOMIA .

Upload: tarrgo

Post on 24-May-2015

9.564 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Econometria i

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE ECONOMIA

DEPARTAMENTO ACADEMICO DE ECONOMIA

.

Page 2: Econometria i

CAPITULO I

MODELOS DINÁMICOS

1. INTRODUCCIÓN

1.1. JUSTIFICACIÓN

La necesidad de incluir la dinámica temporal en los modelos es:

Existencia de desfases en la disponibilidad de información que hacen que las•decisiones se tomen en base a datos del pasado.

Las decisiones se toman tras un proceso de evaluación que genera un desfase entre la•información evaluada y la acción final.

Determinados procesos complejos necesitan de un periodo de ejecución que,•nuevamente desfasa la acción final de la información valorada.

Existencia de medidas o acciones que tienen efecto en más de un periodo.•

La consideración explícita de la evolución pasada como una expectativa de los valores•presentes.

Existencia de procesos progresivos de ajuste hasta niveles deseados u óptimos.•

Sabemos que las variables económicas tienen bastante inercia, lo que hace que unavariable dependa de su propio pasado, además de otras causas. Así por ejemplo: para tratarde explicar el comportamiento de la inflación , tendría sentido introducir como variables

explicativas, junto con la tasa de crecimiento monetario , retardo de la propia tasa de

inflación:

Es importante observar que la existencia de una relación dinámica entre variables, asícomo su mayor o menor persistencia (número de retardos precisos para representarla),dependen crucialmente de cual sea la frecuencia de observación de los datos que se empleanen la estimación. Por ejemplo, si una variable influye sobre otra no sólo

contemporáneamente, sino también durante los dos meses siguientes, entonces la relaciónsería dinámica si el investigador utiliza datos mensuales, pero resultará estática si utilizasedatos anuales.

Page 3: Econometria i

2

Y X X Yt t t t t= + + +− −β β β ε1 2 1 3 1

Y Xt t t= +β ε1

Y Yt t t= +−β ε3 1 β β1 2 0= =

∆ ∆Y Xt t t= +−β ε1 1

1.2. TIPOS DE MODELOS

Una tipología de modelos uniecuacionales dinámicos (Basado en Hendry, Pagan ySargan, 1984)), el modelo ADL(1,1) es:

donde es exógena débil en relación a los parámetros de interés , y elZt ( )β β β1 2 3, y

error es: .( )ε σ εt N~ ,0 2

Aún cuando todos los modelos tienen una varianza del error, el modelo anterior es

denominado modelo de "tres parámetros". Pese a que es una ecuación muy simple, el modeloADL(1,1) incluye representaciones esquemáticas de nueve distintos tipos de modelosdinámicos como casos especiales. La tabla siguiente presenta estos 9 tipos.

Tipo de modelo EcuaciónRestricciones en

ADL(1,1)

1º Regresión estática β β2 3 0= =

2º Serie de tiempounivariante

3ºEn diferencias / tasade crecimiento

β β β3 2 11= = −;

Page 4: Econometria i

3

Tipo de modelo EcuaciónRestricciones en

ADL(1,1)

Y Xt t t= +−β ε2 1β β1 3 0= =

Y X Xt t t t= + +−β β ε1 2 1 β3 0=

Y X Yt t t t= + +−β β ε1 3 1 β2 0=

Y X u u ut t t t t t= + = +−β β ε1 3 1 β β β2 1 3= −

( )( )∆Y X X Yt t t t t= + − − +− −β β ε1 3 1 11 βi∑ = 1

Y X Yt t t t= + +− −β β ε2 1 3 1 β1 0=

4º Indicadoradelantado (leadingindicator)

5º Retardosdistribuidos(distributed lags)

6º Ajuste parcial

7º Common factor(errorautocorrelacionado)

8º Mecanismo deCorrección del Error

9º Forma reducida(dead start)

Los nueve modelos describen muy diferentes estilos de retardos y respuestas de largoplazo de y desde x, tiene diferentes ventajas y desventajas como descripciones decomportamientos de series de tiempo, están diversamente afectados por varios problemas demala especificación, y finalmente, conducen a diferentes estrategias de modelización yestimación.

Los modelos 1º a 4º son claramente modelos de un parámetro, mientras 5º a 9º son dedos parámetros. Con los supuestos planteados, todos menos el modelos 7º son estimables porMínimos Cuadrados Ordinarios (mientras 7º requiere un procedimiento iterativo por mínimoscuadrados). Cada modelo puede ser interpretado como un modelo "por derecho propio", otambién como una derivación (o una aproximación) del modelo ADL(1,1).

La generalización de cada "tipo" en términos de un número mayor de lags y/o variosregresores naturalmente aproximan los casos entre sí. En el cuadro se plantean los modelosmás simples para resaltar sus diferencias y sus propiedades específicas.

De todas maneras, las restricciones necesarias para obtener los distintos casos (aúnsuponiendo modelos con mayor número de lags y/u otros regresores) en general son difícilesde justificar. Aún cuando pueden, en ocasiones, existir argumentos teóricos relevantes paraexplicar una forma específica, es siempre preferible testear el modelo seleccionado versus laforma general no restringida (el ADL(1,1)), lo que contribuye a evitar errores deespecificación importantes.

Page 5: Econometria i

4

1.3. CLASIFICACIÓN

1.3.1. MODELOS INGENUOS DE EXPECTATIVAS

Los modelos más antiguos de expectativas empleaban valores pasados de las variablesrelevantes, o bien sencillas extrapolaciones de los mismos, como medición de las variablesesperadas.

Consideremos el modelo:

A menos que se especifique de otra manera, las expectativas se forman con base en losperiodos anteriores de tiempo. Por lo tanto, el modelo sume:

es decir, la compañía cree que la utilidades del próximo periodo serán iguales a las de éste.

Un modelo sencillo de extrapolación indicaría que los beneficios del siguiente periodose elevarán en una cantidad igual a la del último incremento. Es decir,

Otro modelo de extrapolación sería indicar que las utilidades se elevarán en unporcentaje igual al del último aumento. Esto da:

En todos los casos se sustituye en el modelo la utilidad esperada por su fórmula deformación de expectativas, quedando:

como la formación de expectativas se deriva del exterior y son ajenas al modelo económico,estas expectativas se consideran exógenas. Por lo tanto, el modelo se estima por mínimoscuadrados ordinarios.

Page 6: Econometria i

5

ttt eXY ++= *10 βα

)( *11

*1

*−−− −=− tttt XXXX λ

∑∞

=−−−=

01

* )1(i

it

i

t XX λλ

Es necesario modificar de manera adecuada la formación de expectativas, cuando secuenta con datos trimestrales o mensuales; porque existen fluctuaciones estacionales. Porejemplo, las ventas de diciembre de este año serían comparables con las del mismo mes delaño pasado, debido a la temporada navideña. La formación de expectativas quedaría:

obsérvese que se comparan meses o trimestres correspondientes y que se toma comoparámetro el último aumento porcentual.

No se recomiendan estos modelos, sin embargo, su uso es frecuente como puntos dereferencia para juzgar los datos de cualquier encuesta sobre expectativas.

1.3.2. MODELOS ECONOMÉTRICOS DINÁMICOS

Los planteamientos teóricos que conducen a una especificación dinámica son:

Modelo de EXPECTATIVAS ADAPTABLES. Cagan (1956).

Modelo de AJUSTE PARCIAL Nerlove (1956).

Modelo de EXPECTATIVAS RACIONALES. Munth (1960, 1961).

Aº Modelo de Expectativas Adaptativas

El nivel de la variable endógena depende de un valor no observado deYtexpectativas de la exógena , así:X t

*

Las expectativas se revisan o actualizan en función de las desviacionesobservadas en el pasado, así:

Resolviendo la anterior ecuación diferencial se obtiene:

Sustituyendo el valor de la expectativa en la 1ª ecuación:

Page 7: Econometria i

6

t

i

it

i

t eXY +−+= ∑∞

=−−

0110 )1( λλβα

11110 )1()1( −−− −−+−++= ttttt eeYXY λλλβλα

Transformado la expresión anterior, queda:

EJEMPLO:

P. Cagan propuso un modelo analítico en el que la demanda de saldosmonetarios reales se hacía depender del valor esperado de la tasa de inflación futura:

El mecanismo de expectativas adaptativas, utilizado por Cagan (así como M.Friedman en su Teoría de Consumo), es:

que postula que los agentes modifican la expectativa a partir de las expectativas delperiodo anterior y considerando el error de predicción cometido.

Si las expectativas de inflación son estáticas y no se⇒hacen depender del error de predicción que se haya cometido.

Si las expectativas de inflación son totalmente⇒adaptativas, ya que se adapta como valor esperado de la inflaciónfutura el valor que la tasa de inflación ha tomado en este período.Se ignora la información que condujo a formar las expectativaspasadas.

Si en el mecanismo de expectativas se colocan todas las variables de expectativaen el primer miembro, nos queda:

Si se incorporan las expectativas adaptativas al modelo, se tiene el siguienteprocedimiento:

1º Se retarda el modelo un periodo, así:

( )π λ π λπt t t+ − − =1 1* *

Page 8: Econometria i

7

ttt eXY ++= 10* βα

)( 1*

1 −− −=− tttt YYYY γ

)( 1101 −− −++=− ttttt YeXYY βαγ

2º Se multiplica el modelo retardo por ( 1 - ), nos da:

3º Restamos el modelo menos el modelo retardado, dando:

4º Simplificando y reemplazando por la formación de expectativas, nos queda elmodelo transformado siguiente:

Dado que el modelo transformado involucra una regresión de sobre

, esto se conoce como modelo autorregresivo.

Bº Modelo de Ajuste Parcial de Nerlove

Las variables exógenas determinan el valor óptimo o deseado de la variableX t

endógena. . Por ejemplo:Yt*

Sólo se alcanza una parte del valor óptimo en cada periodo, matemáticamente:

Sustituyendo la primera expresión en la segunda:

Despejando el valor corriente de la endógena:

Page 9: Econometria i

8

tttt eYXY γγγβγα +−++= −110 )1(

K Y ut t t* ( )= + +β β1 2 1

K K K Kt t t t− = − < <− −1 1 0 1 2δ δ( ) ( )*

K K K

KK K

t t t

t

t t

= + −

=− −

δ δ

δ

δ

*

*

( )

( )

1

11

1

K Y K ut t t t= + + − +−δβ δβ δ δ1 2 11 3( ) ( )

EJEMPLO:

Supongamos que el nivel de capital deseado en la economía, , es una funciónKt*

del nivel de producto :Yt

Si un investigador quisiera proceder a estimar cómo varía el stock de capitaldeseado u óptimo, según la economía transcurre a través de una época de recesión o

de expansión, tendría el grave problema de no disponer de observaciones de .Kt*

Añadimos al modelo anterior una ecuación que describe el mecanismo por el queel stock de capital se ajusta a su nivel deseado. Supongamos:

postula que el stock de capital observado varía de un período a otro en una proporciónde su distancia con respecto al stock deseado.

Si En cada período el stock de capital es igual a su valor deseado.δ = 1 ⇒(Economía donde el stock de capital no está sujeto aimportantes costes de ajuste).

El stock de capital no cambia.δ = 0 ⇒

La ecuación ( 2 ) se puede rescribir:

donde el stock de capital es una combinación lineal convexa del valor deseado y desu valor previo.

Al reemplazar ( 1 ) en ( 2 ) tenemos:

Una vez estimado el modelo, el parámetro se obtiene del coeficiente de ,δ Kt−1

mientras que se obtendría dividiendo el coeficiente de por el valor de yβ2 Yt δ β1

a partir del término independiente estimado.

Page 10: Econometria i

9

ttt eXY ++= *10 βα

)( 1*

−= ttt XEX θ

...**...** 22112211 ++++++= −−−− tttttt bbXaXaX εεε

ttttttt ebbXaXaY ++++++++= −−−− ...)**...**(* 2211221110 εεεβα

Y Y ut t t= + <−β β1 1 1( )

~ ( )β

ββMCO

t t

T

t

T

t t t

t

t t

T

t

T

TYY

Y

Y u Y

Y

Y u

Y

= =+

= +−

− −

∑∑

12

12

2

1 1

12

12

12

2

2

La ecuación ( 3 ) es la demanda de capital a corto plazo y la ecuación ( 1 ) es lademanda de capital a largo plazo.

Cº Modelo de Expectativas Racionales de Munth

El nivel de la variable endógena depende de las expectativas racionalesYt

formadas sobre el valor de la exógena , así:X t*

Las expectativas racionales se forman con toda la información disponible hastael periodo anterior:

La esperanza condicional viene representada por un proceso ARMA:

El modelo inicial se convierte en un modelo dinámico:

2. VARIABLE ENDÓGENA REZAGADA

Si aparecen valores retardados de la variable endógena, dejaría de cumplirse uno de lossupuestos bajo los que desarrollamos las teorías de estimación e inferencia del modeloeconométrico, pues algunas de las variables explicativas serían variables aleatorias (ya queYtlo es).

El modelo:

donde u es un proceso de ruido blanco y el estimador de mínimos cuadrados ordinarios es:

Page 11: Econometria i

10

E Y u Y E Y Y E uS S t

T

S t

T

S( / ) ( / ) ( )− − − −∑ ∑= =1 12

21 1

2

2

0

Y utst s

s

= −=

∑ β0

Y Y u

u u

t t t

t t t

= + <

= +

β β

ρ ε1

1

1

Var e er ada E X u s

Var Exogena E X u s

t S t

t S t

.Pr det min ( )

. ( )

⇒ = ≥

⇒ = ∀−

0 0

0

el estimador será insesgado si y sólo si se cumple: .E

Y u

Y

t t

T

t

T

⎢⎢⎢⎢

⎥⎥⎥⎥

=1

2

12

2

0

Si la distribución de u fuera independiente de para todo par (t,s), entonces se tendríaYspara s = 2, ..., T

entonces, el estimador de mínimos cuadrados ordinarios sería insesgado.

Sin embargo, (1) muestra que las distribuciones de y no son independientes,Yt us

puesto que si el valor absoluto de es inferior a la unidad, entonces:β

como depende de y de valores retardados de ; por lo tanto, el estimador de mínimosYt ut utcuadrados del modelo (1) será, en general, sesgado.

El problema se complica sustancialmente cuando aparecen valores retardados de lavariable endógena como variables explicativas y, además el término de error tieneautocorrelación:

la variable explicativa está correlacionada con , y a su vez, está correlacionada con ;Yt−1 ut−1 utentonces una de las variables explicativas del modelo está correlacionada con el término deerror, por lo que ya no se tiene . No podemos garantizar la consistencia delE Y ut t( )− =1 0estimador de mínimos cuadrados ordinarios.

Por lo tanto, el estimador mínimo cuadrado de los coeficientes del modelo para que seaconsistente es que se tenga para todo y para todas las variablesE X ut S t( )− = 0 s ≥ 0explicativas del modelo se tiene:

Page 12: Econometria i

11

Y Y X ut t t t= + + + <−β β β β1 2 1 3 2 1 1( )

′ =

−⎡

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

− −

∑ ∑

∑ ∑

X X

T Y X

Y Y X

X

t

T

t

T

t

T

t t

T

t

T

1 12 2

12

21

2

2

2

~( ) ( )β βMCO X X X u= + ′ ′−1 2

p pX X

T

X u

Tp

X X

Tp

X u

TMCOlim~

lim lim limβ β β= +′⎛

⎝⎜⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥ = +

′⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥

′⎛⎝⎜

⎞⎠⎟

− −1 1

2.1. EL TÉRMINO DE ERROR NO TIENE AUTOCORRELACIÓN

El modelo especificado es:

cuyas variables explicativas y término de error satisfacen las siguientes propiedades:

1º No existe autocorrelación, es decir: .E u E uu IT u T( ) , ( )= ′ =0 2σ

2º es determinista, es decir: .X t E X u tt t( ) ,= ∀0

3º aunque es estocástica, si , depende de , , ...,E Y ut t( )− =1 0 Yt−1 β 2 1< Yt−1 ut−1 ut−2

pero no de , y si este proceso es un ruido blanco, entonces se tiene el resultadoutcitado.

4º matriz simétrica, definida positiva, donde:pX X

TXXlim

′⎛⎝⎜

⎞⎠⎟

= Σ

Esta condición se satisface bajo el supuesto , siempre que existan las varianzasβ2 1<

y covarianzas de las variables explicativas e .X t Yt−1

Sabemos que:

aplicando probabilidad límite nos da:

Page 13: Econometria i

12

1 Si , entonces seE u E uu I E X u y pX X

Tu T i XX( ) , ( ) , ( ) lim= ′ = ′ =′⎛

⎝⎜⎞⎠⎟ = < ∞0 02σ Σ

tiene que : .pX u

T Klim′⎛

⎝⎜⎞⎠⎟ = 0

2 Si , entonces se tieneE u E uu I E X u y pX X

Tu T i XX( ) , ( ) , ( ) lim= ′ = ′ =′⎛

⎝⎜⎞⎠⎟ = < ∞0 02σ Σ

que: ′

⎯ →⎯X u

TN

D

u XX( , )0 2σ Σ

p MCO XX Klim~β β β= + =−Σ 1 0

(~

)β βMCO

X X

T

X u

T− =

′⎛⎝⎜

⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

−1

TX X

T

X u

TMCO(

~)β β− =

′⎛⎝⎜

⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

−1

( ) ( ) ( )( )T N NMCO

D

XX u XX u XX(~

) , ,β β σ σ− ⎯ →⎯⎯ =− −

Σ Σ Σ1 2 2 1

0 0

( )~,β β

σMCO

D u

XXNT

⎯ →⎯⎯⎛

⎝⎜

⎠⎟

⎝⎜

⎠⎟

−2

según el teorema de Mann-Wald1 nos queda:

por lo tanto, el estimador de mínimos cuadrados ordinarios es consistente.

A veces no se está interesado en la distribución de un estimador, sino en la de unafunción del mismo. De la ecuación (2) deducimos:

multiplicando por la raíz de T nos da:

aplicando el teorema de Mann-Wald2 tenemos:

Esta distribución sólo es rigurosamente válida según tienda el tamaño muestral a infinito.

En la práctica, se realiza la aproximación siguiente:

1º Pasando y a la derecha, entonces:T β

en muestras grandes.

2º Para muestras suficientemente grande, el límite de es ; entonces, laΣ XX

′X X

T

matriz puede sustituirse por .Σ XX

′X X

T

Page 14: Econometria i

13

( ) ( )Var X XMCO u

~β σ= ′

−2 1

GCP SYS GCP ut t t t= + + +−α α α0 1 2 1

Por lo tanto, la matriz de covarianzas se aproxima a:

En cuanto el término de error esté libre de autocorrelación, está justificado el uso demínimos cuadrados en un modelo que incluye retardos de la variable endógena. Puede utilizarsela matriz de covarianzas habitual de dicho estimador, quien tiene además una distribuciónnormal en muestras grandes, por lo que los resultados de inferencia estadística sonaproximadamente válidas.

Lo anterior es válido con independencia del número de retardos de la variable endógenaque aparecen como variables explicativas.

EJEMPLO 1:

Se tiene información trimestral para el periodo 1959 - 1996 de las variablessiguientes:

GCP Gasto de consumo personal.IPD Ingreso personal disponible.SYS Sueldos y salarios.R Tasa de interés activa promedio

especificamos la función consumo siguiente:

se estima por mínimos cuadrados ordinarios y se obtiene el siguientes resultado:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints ========================================================== Variable Coefficient Std. Error t-Statistic Prob. ========================================================== C -9.587087 2.659345 -3.605055 0.0004 SYS 0.173464 0.020306 8.542600 0.0000 GCP(-1) 0.891955 0.014170 62.94613 0.0000 ==========================================================R-squared 0.999935 Mean dependent var 1854.654 Adjusted R-squared 0.999934 S.D. dependent var 1471.192 S.E. of regression 11.97949 Akaike info criteri 7.824331 Sum squared resid 20808.68 Schwarz criterion 7.885085 Log likelihood -576.0005 F-statistic 1108462. Durbin-Watson stat 1.992817 Prob(F-statistic) 0.000000 ==========================================================

Page 15: Econometria i

14

$..

.ρ = − = − =12

11 99281692505

20 00359153747518

DW

( )h =

−= <0 00359153747518

148

1 148 0 0002007925183780 0443569947499 1645.

.. .

( )QBP = = <148 0 001 0 000184 3842. . .

para determinar si mínimos cuadrados ordinarios es el método de estimación adecuado debemosverificar autocorrelación:

h de Durbin:

.H Ausencia de autocorrelacion orden0 1: º

se estima el rho:

se calcula el estadístico h y se compara con el estadístico de la tabla normal, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

Box Pierce:

.H Ausencia de autocorrelacion orden m0:

se obtiene del Eviews:

Correlogram of Residuals==============================================================Sample: 1959:2 1996:1 Included observations: 148 ============================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob ============================================================== .|. | .|. | 1 0.001 0.001 0.0002 0.989 .|* | .|* | 2 0.083 0.083 1.0538 0.590 ============================================================== m = 1

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

Page 16: Econometria i

15

( )QBP = + = <148 0 001 0 083 1025685 5992 2. . . .

LM = <0 000186 384. .

LM = <1071686 599. .

m = 2

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

Breusch-Godfrey:

.H Ausencia de autocorrelacion orden m0:

m = 1

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ===================================================== F-statistic 0.000181 Probability 0.989287 Obs*R-squared 0.000186 Probability 0.989120 =====================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ===================================================== F-statistic 0.521517 Probability 0.594744 Obs*R-squared 1.071686 Probability 0.585176 =====================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se acepta la hipótesis nula.

Concluimos que el método de estimación de mínimos cuadrados ordinarios es eladecuado.

Page 17: Econometria i

16

GCP SYS R GCP ut t t t t= + + + +−α α α α0 1 2 3 1

$..

.ρ = − = − =12

11 9974120053

20 00129399735245

DW

( )h =

−= <0 00129399735245

148

1 148 0 000571070246960 0164527854599 1645.

.. .

EJEMPLO 2:

Especificamos la función consumo siguiente:

se estima por mínimos cuadrados ordinarios y se obtiene el siguientes resultado:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints ========================================================= Variable Coefficient Std. Error t-Statistic Prob. ========================================================= C -8.224413 2.632759 -3.123876 0.0022 SYS 0.256588 0.034484 7.440758 0.0000 R -1.823686 0.619578 -2.943434 0.0038 GCP(-1) 0.834550 0.023897 34.92267 0.0000 =========================================================R-squared 0.999938 Mean dependent var 1854.654 Adjusted R-squared 0.999937 S.D. dependent var 1471.192 S.E. of regression 11.67493 Akaike info criteri 7.779419 Sum squared resid 19627.77 Schwarz criterion 7.860425 Log likelihood -571.6770 F-statistic 778035.5 Durbin-Watson stat 1.997412 Prob(F-statistic) 0.000000 =========================================================

para determinar si mínimos cuadrados ordinarios es el método de estimación adecuadodebemos verificar autocorrelación:

h de Durbin:

.H Ausencia de autocorrelacion orden0 1: º

se estima el rho:

se calcula el estadístico h y se compara con el estadístico de la tabla normal, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

Page 18: Econometria i

17

( )QBP = − = <148 0 002 0 000793 3842. . .

( )( )QBP = − + = <148 0 002 0 088 1142607 5992 2. . . .

Box Pierce:

.H Ausencia de autocorrelacion orden m0:

se obtiene del Eviews:

Correlogram of Residuals==============================================================Sample: 1959:2 1996:1 Included observations: 148 ============================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob ============================================================== .|. | .|. | 1 -0.002 -0.002 0.0008 0.977 .|* | .|* | 2 0.088 0.088 1.1739 0.556 ==============================================================

m = 1

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

Breusch-Godfrey:

.H Ausencia de autocorrelacion orden m0:

m = 1

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 0.000834 Probability 0.977003 Obs*R-squared 0.000863 Probability 0.976564 =========================================================

Page 19: Econometria i

18

LM = <0 000863 384. .

LM = <1241676 599. .

Y Y X ut t t t= + + + <−β β β β1 2 1 3 2 1 1( )

u ut t t= +−ρ ε1

Y Y ut t t= +−β 2 1

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 0.600709 Probability 0.549810 Obs*R-squared 1.241676 Probability 0.537494 =========================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se acepta la hipótesis nula.

Concluimos que el método de estimación de mínimos cuadrados ordinarios es el adecuado.

2.2. EL TÉRMINO DE ERROR TIENE AUTOCORRELACIÓN

El modelo especificado es:

y sigue un patrón de autocorrelación de primer orden, es decir:

donde es ruido blanco.ε t

La existencia de autocorrelación en el término de error hace que la propiedad del caso

anterior no se satisfaga. . Por ejemplo: Asumamos en (1) que ,( )( )E Y ut t− ≠1 0 β β1 3 0= =

entonces el modelo queda:

tenemos:

Page 20: Econometria i

19

( ) ( )( ) ( ) ( )( ) ( ) ( )( )( ) ( ) ( ) ( )( ) ( )( ) ( )( )

E Y u E Y u u E Y u E u u

E Y u E Y u E u u

E Y u E Y u E u E u

E Y u E Y u

E Y u E Y u

E Y

t t t t t t t t t

t t t t t t

t t t t t t t

t t t t u

t t t t t u

− − − − −

− − − −

− − − −

− −

− − −

= + = +

= + +

= + +

− =

− + =

1 2 2 1 2 2 1

1 2 2 1 1

1 2 2 12

1

1 2 22

1 2 2 12

β β

β ρ ε

β ρ ε

β ρσ

β ρ ε ρσ

( ) ( ) ( )( ) ( )

( ) ( )

( )( )

t t t t t t u

t t t t u

t t u

t t

u

u E Y u E Y

E Y u E Y u

E Y u

E Y u

− − − −

− −

− − =

− =

− =

=−

1 2 2 1 2 22

1 2 12

2 12

1

2

2

1

1

ρβ β ε ρσ

ρβ ρσ

ρβ ρσ

ρσ

ρβ

( )p

p

Y u

T

p

Y

T

MCO

t t

T

t

Tlim

~

lim

lim

β β2 2

12

12

2

= +

⎜⎜⎜⎜

⎟⎟⎟⎟

⎜⎜⎜⎜

⎟⎟⎟⎟

como depende de a través del modelo, pero y están relacionados con laYt−1 ut−1 ut−1 ut

estructura autoregresiva del término de error. En consecuencia y están correlacionados;Yt−1 utpor lo tanto, el estimador de mínimos cuadrados es sesgado.

Sabemos que:

y si los momentos muestrales convergen en probabilidad a sus análogos poblacionales, elnumerador y el denominador son diferentes de cero; por lo tanto, el estimador de mínimoscuadrados no es consistente. Es decir, el sesgo no desaparece al aumentar el tamaño muestral.

El procedimiento para obtener estimaciones consistentes de un modelo de este tipo seconoce como estimador de variables instrumentales.

Una variable instrumental es una variable que satisface tres condiciones:Zt

1º No está incluida en el modelo como variable explicativa.

Page 21: Econometria i

20

( )~βVI Z X Z Y= ′ ′

−1

[ ] [ ]X Y X Z X Xt t t t= =− −1 11 1

~

~

~

β

β

β

1

2

3

12 2

12

1 12

12

21

2

2

2

1

2

12

2

1⎡

⎢⎢⎢

⎥⎥⎥

=

−⎡

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

− − − −

∑ ∑

∑ ∑ ∑

∑ ∑ ∑

∑VI

t

T

t

T

t

T

t t

T

t t

T

t

T

t t

T

t

T

t

T

t t

T

t t

T

T Y X

X X Y X X

X X Y X

Y

X Y

X Y

2º Está incorrelacionada con el término de error .( )( )E Z ut t = 0

3º Está correlacionada con la variable para la cual hace de instrumento.

En cuanto a la correlación que debe existir entre una variable instrumental y la variableexplicativa para la que se utiliza, como instrumento, cabe observar lo siguiente:

1º Es importante que dicha correlación exista, porque la variable instrumental sustituyeparcialmente a la variable endógena rezagada en la estimación del modeloeconométrico.

2º Dicha correlación no puede ser muy importante, sino también existiría una correlaciónapreciable entre la variable instrumental y el término de error (esto motivó la necesidadde la variable instrumental).

El primer retardo de la variable exógena satisface estas tres condiciones,( )X t−1

también podría utilizarse el segundo retardo como variable instrumental; la diferencia( )X t−2

es que la relación entre esta variable y se hace más indirecta.Yt−1

En general, en el vector X tan sólo habrá unas variables que no satisfagan la condición, y son estas variables las que necesitan de variables instrumentales. Es decir, los( )E Xu = 0

vectores X y Z tendrán en común aquellas variables que están incorrelacionadas con el términode error. El estimador de variables instrumentales viene dado:

donde Z denota la matriz T x K de observaciones muestrales de las variables que componen elvector Z y suponemos que es invertible. Para el ejemplo:′Z X

el estimador de variables instrumentales es:

la matriz dista de ser simétrica.′Z X

El estimador de variables instrumentales del modelo, en general, es sesgado porque lavariable aparece en la matriz ; pero el estimador es consistente bajo las condicionesYt−1 ′Z X

de la proposición siguiente:

Page 22: Econometria i

21

( )E Z u t

pZ X

Tp

Z Z

T

t K

ZX ZZ

′ = ∀

′⎛⎝⎜

⎞⎠⎟ = ∑

′⎛⎝⎜

⎞⎠⎟ = ∑

0

lim , lim

( )p pZ X

T

Z u

Tp

Z X

Tp

Z u

TVIlim~

lim lim limβ β β= +′⎛

⎝⎜⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥ = +

′⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥

′⎛⎝⎜

⎞⎠⎟

− −1 1

( )p VI ZX Klim~β β β= + ∑ =−1 0

( )E Z u t

pZ X

Tsimetrica definida positiva

pZ Z

Tno gular

t K

ZX

ZZ

′ = ∀

′⎛⎝⎜

⎞⎠⎟ = ∑

′⎛⎝⎜

⎞⎠⎟ = ∑

0

lim ,

lim sin

( )pZ u

Ty

Z u

TNK K u ZZlim ,

′⎛⎝⎜

⎞⎠⎟ =

′≈ ∑0 0 2σ

Sea Z una matriz T x K de observaciones de las variables , quizáZ Z ZK1 2, ,...,

aleatorias. Sea la fila t de Z y supongamos que se tiene:′Zt

ambas matrices son singulares y finitas, entonces tenemos:

reemplazando por los supuestos nos da:

la consistencia de proviene de la ausencia de correlación entre instrumentos y término de~βVI

error, con independencia de que éste tenga o no autocorrelación.

En ausencia de autocorrelación, podemos caracterizar la distribución asintótica de~βVI

de la forma siguiente:

Dado el modelo , donde es el vector de variables explicativas, queY X ut t t= ′ +β X tpuede incluir algunos retardos de la variable endógena, y , el término de error es un ruidoutblanco, sea X la matriz T x K de observaciones de las variables , y supongamosZ Z ZK1 2, ,...,que:

el teorema de Mann - Wald asegura que bajo los tres supuestos mencionados se tiene:

y como:

Page 23: Econometria i

22

( )TZ X

T

Z u

TVI

~β β− =

′⎛⎝⎜

⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

−1

( ) ( ) ( )

( ) ( )

( )

T N

T N

NT

VI ZX K u ZZ

VI K u ZX ZZ ZX

VI

u

ZX ZZ ZX

~,

~,

~,

β β σ

β β σ

β βσ

− ≈ ∑ ∑

− ≈ ∑ ∑ ∑′⎛

⎝⎜⎞⎠⎟

≈ ∑ ∑ ∑′⎛

⎝⎜

⎠⎟

− −

− −

1 2

2 1 1

21 1

0

0

( ) ( ) ( )[ ]VarTVI

u

ZX ZZ ZX

σ= ∑ ∑ ∑

′− −

21 1

( ) ( ) ( ) ( )[ ]VarT

Z X

T

Z Z

T

Z X

TZ X Z Z Z XVI

u

u

σσ=

⎝⎜

⎠⎟

′⎛⎝⎜

⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

′⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥ = ′ ′ ′

′− −− −

2 1 1

2 1 1

( ) ( )~~ ~

σβ β

u

VI VIY X Y X

T K

2 =−

′−

converge en distribución a:

Por lo tanto, este resultado justifica que en muestras grandes se utilice como matriz decovarianzas del estimador de variables instrumentales:

y se utiliza las matrices de momentos muestrales , para aproximar sus límites′Z X

T

′Z Z

Trespectivos de ; reemplazando nos da:∑ ∑ZX ZZ,

El parámetro se estimaría dividiendo la suma residual por el número de grados deσ u

2

libertad ( T-K ). Los residuos deben calcularse utilizando las variables originales del modelo,es decir:

Este resultado no puede generalizarse fácilmente al caso en que el término de errortiene autocorrelación, por lo que suele utilizarse la matriz de covarianza anterior incluso en talcaso, aun a sabiendas que no es sino una aproximación.

Se ha presentado el estimador de variables instrumentales como si se dispusiese de unnúmero de instrumentos igual al número de variables explicativas, entonces no existe diferencia

Page 24: Econometria i

23

entre instrumentos y variables instrumentales.

Generalmente, se dispondrá de un número mayor de instrumentos que de variablesinstrumentales, situación que se denomina " sobreidentificación"; por lo tanto, habría muchasformas de construir las variables instrumentales que precisamos para obtener consistencia.

La matriz de covarianzas del estimador de variables instrumentales depende de losvalores de éstas, por lo que el modo en que los instrumentos se “combinan” para generarvariables instrumentales influye sobre la eficiencia de un estimador de variables instrumentalesrespecto a otro estimador de su misma clase.

Consideremos el modelo siguiente:

en el que las variables , supuestos deterministas, están incorrelacionados con

el término de error, y son instrumentos válidos. Pero sólo necesitamos una variable instrumentalpara , y se trataría de buscar cuál de todas las posibles minimiza la varianza del estimador

resultante. Además cualquier combinación lineal de los

instrumentos es asimismo un instrumento válido.

Una posibilidad consiste en generar la variable instrumental que presente mayorcorrelación con , entonces estimamos una regresión auxiliar de esta variable sobre los tresYt−1

instrumentos de que disponemos, para obtener la variable generada , que será una~Yt−1

combinación lineal de , y y, como tal, una variable instrumental válida.X t1 1− X t2 1− X t3 1−

La utilización del vector genera el denominado estimador de( )′ = −Z Y X X Xt t t t t

~, , ,1 1 2 3

mínimos cuadrados en dos etapas .( )~βMC E2

El estimador de mínimos cuadrados bietápicos es el estimador lineal de variablesinstrumentales eficiente, en el sentido de tener mínima matriz de covarianza entre losestimadores que utilizan como variables instrumentales combinaciones lineales de losinstrumentos disponibles.

La aplicación del método de mínimos cuadrados bietápicos requiere los siguientespasos:

1º Estimar una regresión auxiliar de sobre los tres instrumentos de que

disponemos, para obtener la variable predicha , que será una combinación lineal~Yt−1

de y, como tal, es una variable instrumental válida.

2º Se sustituye en el modelo original por y se estima el modelo transformado~Yt−1

Page 25: Econometria i

24

GCP IPD GCP ut t t t= + + +−α α α0 1 2 1

$.

.ρ = − = − =12

117096162998

20145191850101

DW

( )h =

−= >0145191850101

148

1 148 0 0006172052005891852993577 1645.

.. .

por mínimos cuadrados ordinarios.

EJEMPLO 3: Especificamos la función consumo siguiente:

se estima por mínimos cuadrados ordinarios y se obtiene el siguientes resultado:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints ========================================================= Variable Coefficient Std. Error t-Statistic Prob. ========================================================= C 0.248943 1.870295 0.133104 0.8943 IPD 0.193060 0.022728 8.494528 0.0000 GCP(-1) 0.801910 0.024844 32.27830 0.0000 =========================================================R-squared 0.999934 Mean dependent var 1854.654 Adjusted R-squared 0.999933 S.D. dependent var 1471.192 S.E. of regression 12.00206 Akaike info criteri 7.828095 Sum squared resid 20887.16 Schwarz criterion 7.888850 Log likelihood -576.2790 F-statistic 1104297. Durbin-Watson stat 1.709616 Prob(F-statistic) 0.000000 =========================================================

para determinar si mínimos cuadrados ordinarios es el método de estimación adecuadodebemos verificar autocorrelación:

h de Durbin:

.H Ausencia de autocorrelacion orden0 1: º

se estima el rho:

se calcula el estadístico h y se compara con el estadístico de la tabla normal, de la formasiguiente:

Por lo tanto, se rechaza la hipótesis nula

Page 26: Econometria i

25

( )QBP = = <148 0145 3106615 3842. . .

( )QBP = + = >148 0145 0168 7 285250 5992 2. . . .

Box Pierce:

.H Ausencia de autocorrelacion orden m0:

se obtiene del Eviews:

Correlogram of Residuals==============================================================Sample: 1959:2 1996:1 Included observations: 148 ============================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob ============================================================== .|* | .|* | 1 0.145 0.145 3.1700 0.075 .|* | .|* | 2 0.168 0.150 7.4631 0.024 ==============================================================

m = 1

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se rechaza la hipótesis nula

Breusch-Godfrey:

.H Ausencia de autocorrelacion orden m0:

m = 1

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 3.191138 Probability 0.076143 Obs*R-squared 3.208674 Probability 0.073249 =========================================================

Page 27: Econometria i

26

LM = <3208674 384. .

LM = >6 741162 599. .

( )~

~

~

~

.

.

.

α

α

α

αVI Z X Z Y=

⎢⎢⎢

⎥⎥⎥

= ′ ′ =

−⎡

⎢⎢⎢

⎥⎥⎥

−0

1

2

1

4191603

0 298547

0 686558

( ) ( )~~ ~

.σβ β

u

VI VIY X Y X2

148 31654665=

−′

−=

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 3.412127 Probability 0.035678 Obs*R-squared 6.741162 Probability 0.034370 =========================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se rechaza la hipótesis nula.

Concluimos que mínimos cuadrados ordinarios no es el método de estimaciónadecuado y debemos aplicar el método de variables instrumentales de la siguiente forma:

Primero creamos los grupos y a continuación se convierten en matrices, tenemos losgrupos siguientes:

G1 = [ 1 IPD GCP(-1) ] X ≡

G2 = [ GCP ] Y≡

G3 = [ 1 IPD IPD(-1) ] Z≡

Obtenemos el estimador de los coeficientes de variables instrumentales, así:

a continuación se calcula el estimador de la varianza de la perturbación, de la siguientemanera:

Page 28: Econometria i

27

( ) ( ) ( )( )Var Z X Z Z Z XVI u

~ ~. . .

. . .

. . .

β σ= ′ ′ ′ =

− −

⎢⎢⎢

⎥⎥⎥

− −2 1 1

6861411 0 093411 0101153

0 093411 0 002198 0 002403

0101153 0 002403 0 002628

( )t

t

t

tVAR

VI

i

i

~

~

~

~

~

α

α

α

α

α

α=

⎢⎢⎢

⎥⎥⎥

= =

⎢⎢⎢

⎥⎥⎥

0

1

2

-1.60019686721

6.36810211651

13.3934789812

GCP IPD R GCP ut t t t t= + + + +−α α α α0 1 2 3 1

ahora se estima la varianza de los estimadores de variable intsrumental, así:

con esta información podemos calcular el t estadístico para cada estimador de variableinstrumental, de la forma siguiente:

EJEMPLO 4:

Especificamos la función consumo siguiente:

se estima por mínimos cuadrados ordinarios y se obtiene el siguientes resultado:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints ========================================================= Variable Coefficient Std. Error t-Statistic Prob. ========================================================= C 2.046243 2.649849 0.772211 0.4413 IPD 0.214902 0.032202 6.673643 0.0000 R -0.495999 0.517889 -0.957733 0.3398 GCP(-1) 0.778189 0.035086 22.17975 0.0000 =========================================================R-squared 0.999935 Mean dependent var 1854.654 Adjusted R-squared 0.999933 S.D. dependent var 1471.192 S.E. of regression 12.00548 Akaike info criteri 7.835259 Sum squared resid 20754.96 Schwarz criterion 7.916265 Log likelihood -575.8092 F-statistic 735778.3 Durbin-Watson stat 1.679188 Prob(F-statistic) 0.000000 =========================================================

para determinar si mínimos cuadrados ordinarios es el método de estimación adecuadodebemos verificar autocorrelación:

Page 29: Econometria i

28

$..

.ρ = − = − =12

11 67918769606

20160406151972

DW

( )h =

−= >0160406151972

148

1 148 0 00123099578102215786848852 1645.

.. .

( )QBP = = <148 016 37888 3842

. . .

( )( )QBP = + = >148 016 018 8591901 5992 2. . . .

h de Durbin:

.H Ausencia de autocorrelacion orden0 1: º

se estima el rho:

se calcula el estadístico h y se compara con el estadístico de la tabla normal, de la formasiguiente:

Por lo tanto, se rechaza la hipótesis nula.

Box Pierce:

.H Ausencia de autocorrelacion orden m0:

se obtiene del Eviews:

Correlogram of Residuals===========================================================Sample: 1959:2 1996:1 Included observations: 148=========================================================== Autocorrelation Partial Correlation AC PAC Q-Stat Prob =========================================================== .|* | .|* | 1 0.160 0.160 3.8730 0.049 .|* | .|* | 2 0.180 0.158 8.8008 0.012 =========================================================== m = 1

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se acepta la hipótesis nula

m = 2

se calcula el estadístico q y se compara con el estadístico de la tabla chi cuadrado, de la formasiguiente:

Por lo tanto, se rechaza la hipótesis nula.

Page 30: Econometria i

29

LM = >4 341279 384. .

LM = >9 252508 599. .

Breusch-Godfrey:.H Ausencia de autocorrelacion orden m0:

m = 1

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 4.321373 Probability 0.039423 Obs*R-squared 4.341279 Probability 0.037199 =========================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se rechaza la hipótesis nula

m = 2

se obtiene del Eviews:

Breusch-Godfrey Serial Correlation LM Test: ========================================================= F-statistic 4.734702 Probability 0.010219 Obs*R-squared 9.252508 Probability 0.009791 =========================================================

se calcula el estadístico LM y se compara con el estadístico de la tabla chi cuadrado, de laforma siguiente:

Por lo tanto, se rechaza la hipótesis nula.

La estimación de mínimos cuadrados ordinarios presenta autocorrelación y el modelotiene dos variables exógenas, entonces el método adecuado es mínimos cuadrados en dosetapas.

En el Eviews escribimos el comando siguiente:

TSLS GCP C IPD R GCP(-1) @ C IPD IPD(-1) R R(-1)

se obtiene del Eviews:

Page 31: Econometria i

30

Y X X X ut t t S t S t= + + + + +− −β β β β1 2 2 3 2 1 2...

Dependent Variable: GCP Method: Two-Stage Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints Instrument list: C IPD IPD(-1) R R(-1) ========================================================= Variable Coefficient Std. Error t-Statistic Prob. ========================================================= C 1.645073 2.834786 0.580316 0.5626 IPD 0.194944 0.059191 3.293451 0.0012 R -0.269375 0.765920 -0.351701 0.7256 GCP(-1) 0.799938 0.064501 12.40185 0.0000 =========================================================R-squared 0.999935 Mean dependent var 1854.654 Adjusted R-squared 0.999933 S.D. dependent var 1471.192 S.E. of regression 12.02149 Sum squared resid 20810.34 F-statistic 733707.8 Durbin-Watson stat 1.711471 Prob(F-statistic) 0.000000 =========================================================

3. VARIABLE EXÓGENA REZAGADA

Si el modelo es del tipo:

no se incumplen las hipótesis básicas del modelo lineal general, porque las distintas variablesexplicativas del modelo de regresión son todas deterministas.

En este modelo aparecen tan sólo dos posibles dificultades:

1º Los retardos consecutivos de una variable económica tienden a estar correlacionadosentre sí, tanto más cuanto mayor sea la estructura de autocorrelación de dicha variable.Cuanto mayor sea la correlación entre los retardos de , más importante será laX tpresencia de alto grado de multicolinealidad.

2º Cuando la estructura de retardos es de orden infinito, entonces es imposible estimardirectamente el modelo, porque no tendríamos observaciones suficientes para ello.Para estimar este modelo es imprescindible imponer a priori algún tipo de restricciónentre los coeficientes, de modo que el modelo pueda transformarse en otro con unnúmero reducido de variables explicativas.

En la formación de expectativas, otros modelos utilizan el total de la historia,asignando pesos específicos que decrecen a los valores anteriores, a medida que se retrocedehacia el pasado distante. Estos se conocen como modelos de expectativas de rezagosdistribuidos.

Page 32: Econometria i

31

YXkIXXk ')'()(ˆ 1−+=β

)1/(0

+=∑=

− rXZr

i

itt ∑∑==

−=r

i

i

r

i

itit pXpZ00

∑=

−=r

i

itt XZ0

r

rt LLLLW ωωωωω +++++= ...33

2210

ttt eXLWY += )(*α

π γ πt i t ii

K

+ −=

= ∑10

*

Las posibles soluciones al problema de estimación en presencia de variables exógenasretardadas son los siguientes:

1º Utilizar estimadores adecuados en el caso de multicolinealidad severa(ESTIMADORES CRESTA).

2º Elaborar una única variable transformada, por ejemplo:

3º Estimar con distribuciones de retardos.

3.1. RETARDOS FINITOS

Consideremos el siguiente modelo de Demanda de saldos reales:

el mecanismo de expectativas adaptativas es:

también se puede expresar de la siguiente forma:

Esto recibe el nombre de rezago distribuido finito, ya que el número de valoresrezagados o pasados es finito. son los pesos específicos que se asignan a

estos valores pasados.

El modelo de rezago distribuido finito se obtiene sustituyendo la ecuación de ajustede expectativas en el modelo original, el resultado es el siguiente:

Page 33: Econometria i

32

M

Pu u ut

t

i t ii o

K

t i t ii o

K

t i t ii o

K

t= + + = + + = + +−=

−=

−=

∑ ∑ ∑β β γ π β β γ π β β π1 2 1 2 1*

∑=

−+=r

i

iLirLW0

)1()(

2/)1()1()(1

0

rsconLirLiLWr

si

is

i

i =−+++= ∑∑=

=

∑=

++++=r

i

iq

q LiiiLW0

2210 )...()( γγγγ

),0()...()(0

22210∑

=

≈+++++=r

i

i

i

i

q

q NconLiiiLW υσυυγγγγ

multiplicando y simplificando se obtiene:

en términos de sumatoria sería:

Los retardos consecutivos de una variable económica tienden a estar correlacionadosentre sí, tanto más cuanto mayor sea la estructura de autocorrelación de dicha variable; porlo tanto, cuanto mayor sea la correlación entre los retardos de , más importante será la

presencia de alto grado de multicolinealidad.

Existen planteamientos alternativos de distribuciones de retardos finitos, por ejemplo:

1º Aritmética:

2º V Invertida:

3º Almon:

4º Shiller:

Page 34: Econometria i

33

jkn

conLBALW kj

iq

k

kjkkjk .1

2)cossen()(

0 +=⎥

⎤⎢⎣

⎡++= ∑

=

πθθθβ

5º Armónicas:

Consideraremos a Almon que generalizó para el caso en que sigue un polinomio

de grado r en i. Esto se conoce como rezago de Almon o polinomial. Se denota como PDL(K, r), donde PDL significa una distribución polinomial de rezagos, K es la longitud derezagos y r es el grado del polinomio. Por ejemplo, si r = 2, escribimos:

Sustituyendo el PDL en el modelo transformado, se obtiene:

definiendo:

reemplazando en el modelo anterior, nos queda:

se estima el modelo por mínimos cuadrados ordinarios y se obtiene los estimados de , luego

a partir del polinomio se calcula los valores de .

Al reducir el número de parámetros a estimar, se simplifica el modelo original ydisminuye el riesgo de alto grado de multicolinealidad en el modelo auxiliar, aunque al seréste más restrictivo, cabe la posibilidad que el modelo resultante auxiliar no esté bienespecificado, lo que originaría sesgos en las estimaciones de sus parámetros.

Aunque todos los desarrollos se han realizado considerando una sola variable exógena X tcon varios retardos, los polinomios anteriores se pueden aplicar a estructuras más complejasde retardos distribuidos en distintas variables exógenas y en la endógena.

Los rezagos polinomiales suponen tres tipos de problema:

1º Problemas de distribuciones de cola prolongada.- es difícil captar distribuciones deretardo de colas prolongadas, como la que se observa en el gráfico.

Page 35: Econometria i

34

GCP IPD ut i t ii

m

t= + +−=∑α β

0

Para resolver este problema puede utilizarse un polinomio por tramos, o bien

un polinomio para la inicial y un rezago de Koyck o geométrico para la última

parte.

2º Problema en la elección de la longitud del retardo K.- Schmidt y Waud sugieren

escoger K con base en la máxima: Frost efectuó una simulación experimentalutilizando este criterio y descubrió un importante sesgo hacia arriba en la longitud delrezago. Por lo tanto, para corregir el sesgo Frost sugiere utilizar relaciones F mayoresque 1, es decir, F = 2.

3º Problemas para escoger r, el grado del polinomio.- Si se especifica en forma correctala longitud K del rezago, entonces lo que se hace es iniciar con un polinomio de gradolo suficientemente alto (cuarto o quinto grado) e ir hacia atrás (forma secuencial) hastarechazar la hipótesis nula (no significancia).

EJEMPLO 5:

Especificamos la función consumo siguiente:

primero se elige el retardo óptimo, estimando por mínimos cuadrados ordinarios la funciónconsumo con cero retardos, un retardo, dos retardos y así sucesivamente; finalmenteelegimos la mejor estimación. mediante los criterios de información.

En el Eviews se escribe los comandos siguientes:

LS GCP C IPD

LS GCP C IPD IPD(-1)

LS GCP C IPD IPD(-1) IPD(2)

LS GCP C IPD IPD(-1) IPD(2) IPD(-3)

Page 36: Econometria i

35

LS GCP C IPD IPD(-1) IPD(2) IPD(-3) IPD(-4)

.............................................................

De las estimaciones de Eviews construimos el siguiente cuadro:

================================================

M T AKAIKE SCHWARZ R 2

================================================ 0.000000 148.0000 0.999459 9.916938 9.957441 1.000000 148.0000 0.999550 9.739763 9.800517 2.000000 147.0000 0.999595 9.640053 9.721425 3.000000 146.0000 0.999625 9.568611 9.670790 4.000000 145.0000 0.999656 9.489712 9.612887 5.000000 144.0000 0.999687 9.399949 9.544315 6.000000 143.0000 0.999712 9.323912 9.489665 7.000000 142.0000 0.999728 9.270235 9.457576

8.000000 141.0000 0.999739 9.236198 9.445330 9.000000 140.0000 0.999744 9.221678 9.452807 10.00000 139.0000 0.999755 9.185458 9.438794 11.00000 138.0000 0.999768 9.136352 9.412107 12.00000 137.0000 0.999772 9.122193 9.420585 13.00000 136.0000 0.999779 9.097349 9.418598 14.00000 135.0000 0.999786 9.072103 9.416432 15.00000 134.0000 0.999789 9.063944 9.431580 16.00000 133.0000 0.9998067 8.978877 9.370052 17.00000 132.0000 0.9998066 8.984089 9.399037 18.00000 131.0000 0.999804 9.003127 9.442089 19.00000 130.0000 0.999801 9.023694 9.486911 20.00000 129.0000 0.999797 9.045514 9.533234 ===============================================

elegimos el retardo 16 como el óptimo porque tiene el mayor coeficiente de determinaciónajustado, el menor Akaike y el menor Schwarz.

Se aplica el polinomio de retardos distribuidos y se estima por mínimos cuadradosordinarios, empezamos el proceso utilizando un polinomio de grado alto (sexto grado); y severifica si el coeficiente correspondiente a este grado es significativo.

Si no lo es, entonces disminuimos un grado el polinomio y se vuelve a verificar lasignificancia.

Si lo es, entonces esa es la estimación adecuada.

El comando para estimar es:LS GCP C PDL(IPD, 16, 6)

el eviews nos muestra el resultado siguiente:

Page 37: Econometria i

36

( )t tPDLβ 07

1832573 19791240 95 125= < =. .. ,

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ================================================== Variable Coefficient Std. Erro t-Statistic Prob. ================================================== C -6.339855 3.600894 -1.760634 0.0807 PDL01 -0.012270 0.030316 -0.404748 0.6864 PDL02 -0.005282 0.013266 -0.398128 0.6912 PDL03 0.009811 0.009862 0.994854 0.3217 PDL04 0.000367 0.000950 0.386271 0.7000 PDL05 -0.000659 0.000472 -1.396955 0.1649 PDL06 -9.23E-06 1.30E-05 -0.709186 0.4795 PDL07 9.78E-06 5.33E-06 1.832573 0.0692 ==================================================

Verificamos si el coeficiente del sexto grado del polinomio es significativo, de laforma siguiente:

H PDL0 07 0:β =

Por lo tanto, no es significativo.

Entonces disminuimos un grado el polinomio y volvemos a verificar la significanciadel coeficiente del grado cinco del polinomio.

El comando para estimar es:LS GCP C PDL(IPD, 16, 5)

el eviews nos muestra el resultado siguiente:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ================================================== Variable Coefficient Std. Erro t-Statistic Prob. ================================================== C -6.050610 3.630943 -1.666402 0.0981 PDL01 0.034509 0.016505 2.090798 0.0386 PDL02 -0.008626 0.013262 -0.650385 0.5166 PDL03 -0.007747 0.002358 -3.286186 0.0013 PDL04 0.000644 0.000946 0.680622 0.4974 PDL05 0.000202 4.09E-05 4.943113 0.0000 PDL06 -1.32E-05 1.30E-05 -1.016531 0.3113 ==================================================

Page 38: Econometria i

37

( )t tPDLβ 06

1016531 197897060 95 126= − < =. .. ,

Verificamos si el coeficiente del quinto grado del polinomio es significativo, de laforma siguiente:

H PDL0 06 0:β =

Por lo tanto, no es significativo.

Entonces disminuimos un grado el polinomio y volvemos a verificar la significanciadel coeficiente del grado cuarto del polinomio.

El comando para estimar es:

LS GCP C PDL(IPD, 16, 4)

el eviews nos muestra el resultado siguiente:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ========================================================= Variable Coefficient Std. Erro t-Statistic Prob. ========================================================= C -5.808098 3.623573 -1.602865 0.1114 PDL01 0.035690 0.016467 2.167386 0.0321 PDL02 0.003547 0.005701 0.622171 0.5349 PDL03 -0.007954 0.002349 -3.386001 0.0009 PDL04 -0.000308 0.000135 -2.278716 0.0244 PDL05 0.000206 4.08E-05 5.052374 0.0000 =========================================================R-squared 0.999819 Mean dependent var 2025.369 Adjusted R-squared 0.999812 S.D. dependent var 1456.228 S.E. of regression 19.97692 Akaike info criterion 8.871096 Sum squared resid 50682.82 Schwarz criterion 9.001487 Log likelihood -583.9279 F-statistic 140257.9 Durbin-Watson stat 0.484322 Prob(F-statistic) 0.000000 ========================================================= Lag Distribution of IPD i Coefficie Std. Error T-Statistic ============================================================ . *| 0 0.49948 0.04026 12.4056 . * | 1 0.22122 0.01176 18.8102 . * | 2 0.06149 0.01836 3.34862 *. | 3 -0.01368 0.02152 -0.63571 *. | 4 -0.03333 0.01861 -1.79085

Page 39: Econometria i

38

( )t tPDLβ 05

5052374 197881953470 95 127= < =. .. ,

GCP IPD IPD

IPD IPD IPD

IPD IPD IPD

IPD IPD IPD

IPD IPD IPD

IPD

t t t

t t t

t t t

t t t

t t t

t

= − + +

+ − −

− + +

+ + +

− + −

− +

− − −

− − −

− − −

− − −

5808098244 0 4994778688 0 221219823

0 06149146821 0 01368081228 0 0333281558

0 02153941711 0 00253887094 0 02470249744

0 03568957339 0 03118053171 0 01179812725

0 01689256324 0 04438414106 0 0552268856

0 02902875434 0

1

2 3 4

5 6 7

8 9 10

11 12 13

14

. . .

. . .

. . .

. . .

. . .

. .05954461717 0 240769915315 16IPD IPDt t− −+ .

GCP R IPD ut t i t i

i

m

t= + + +−=∑α α β0 1

0

*. | 5 -0.02154 0.01451 -1.48436 * | 6 0.00254 0.01370 0.18539 * | 7 0.02470 0.01553 1.59095 .* | 8 0.03569 0.01647 2.16739 .* | 9 0.03118 0.01536 2.03015 * | 10 0.01180 0.01400 0.84292 *. | 11 -0.01689 0.01589 -1.06299 *. | 12 -0.04438 0.02046 -2.16924 * . | 13 -0.05523 0.02297 -2.40470 *. | 14 -0.02903 0.01876 -1.54705 .* | 15 0.05954 0.01324 4.49886 . * | 16 0.24077 0.04599 5.23524 ============================================================ Sum of Lags 0.97433 0.00304 320.727 ============================================================

Verificamos si el coeficiente del cuarto grado del polinomio es significativo, de laforma siguiente:

H PDL0 05 0:β =

Por lo tanto, es significativo.

La estimación adecuada de la función consumo es la siguiente:

EJEMPLO 6:

Especificamos la función consumo siguiente:

se sigue el mismo procedimiento del ejemplo anterior.

Page 40: Econometria i

39

Determinamos el retardo óptimo:

================================================

M T AKAIKE SCHWARZ R 2

================================================ 0.000000 148.0000 0.999708 9.307039 9.367793 1.000000 148.0000 0.999729 9.240432 9.321438 2.000000 147.0000 0.999726 9.256498 9.358214 3.000000 146.0000 0.999724 9.270765 9.393379 4.000000 145.0000 0.999724 9.275053 9.418758 5.000000 144.0000 0.999730 9.258455 9.423444 6.000000 143.0000 0.999735 9.245726 9.432199 7.000000 142.0000 0.999739 9.236356 9.444513 8.000000 141.0000 0.999744 9.225159 9.455204 9.000000 140.0000 0.999746 9.222191 9.474332 10.00000 139.0000 0.999755 9.192085 9.466532 11.00000 138.0000 0.999767 9.147645 9.444613 12.00000 137.0000 0.999771 9.135508 9.455214

13.00000 136.0000 0.999777 9.111658 9.454324 14.00000 135.0000 0.999784 9.086885 9.452734 15.00000 134.0000 0.999787 9.078252 9.467514 16.00000 133.0000 0.9998052 8.993054 9.405961 17.00000 132.0000 0.9998051 8.998324 9.435112 18.00000 131.0000 0.999802 9.017919 9.478829 19.00000 130.0000 0.999799 9.038893 9.524168 20.00000 129.0000 0.999795 9.060936 9.570825 ===============================================

elegimos el retardo 16 como el óptimo porque tiene el mayor coeficiente de determinaciónajustado y el menor Akaike; si se considerará el criterio Schwarz el óptimo sería 1.

Elección del grado de polinomio óptimo:

El comando para estimar es:

LS GCP C R PDL(IPD, 16, 6)

el eviews nos muestra el resultado siguiente:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ================================================== Variable Coefficient Std. Erro t-Statistic Prob. ================================================== C -8.162016 5.836322 -1.398486 0.1645 R 0.499054 1.255326 0.397550 0.6916

Page 41: Econometria i

40

( )t tPDLβ 05

1804222 197928011660 95 124= < =. .. ,

( )t tPDLβ 06

0 970754 1979124109420 95 125= − < =. .. ,

PDL01 -0.010006 0.030947 -0.323329 0.7470 PDL02 -0.005299 0.013311 -0.398116 0.6912 PDL03 0.009571 0.009914 0.965390 0.3362 PDL04 0.000355 0.000954 0.372635 0.7101 PDL05 -0.000650 0.000474 -1.371854 0.1726 PDL06 -8.85E-06 1.31E-05 -0.676314 0.5001 PDL07 9.67E-06 5.36E-06 1.804222 0.0736 ==================================================

Verificamos si el coeficiente del sexto grado del polinomio es significativo, de laforma siguiente:

H PDL0 07 0:β =

Por lo tanto, el coeficiente del grado sexto del polinomio no es significativo,entonces estimamos el modelo considerando un polinomio de quinto grado y los resultadosdel Eviews son:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ================================================== Variable Coefficient Std. Erro t-Statistic Prob. ================================================== C -8.290242 5.888299 -1.407918 0.1616 R 0.612332 1.265014 0.484052 0.6292 PDL01 0.036662 0.017143 2.138648 0.0344 PDL02 -0.008603 0.013303 -0.646677 0.5190 PDL03 -0.007808 0.002368 -3.297102 0.0013 PDL04 0.000626 0.000950 0.659165 0.5110 PDL05 0.000202 4.11E-05 4.912057 0.0000 PDL06 -1.27E-05 1.30E-05 -0.970754 0.3335 ==================================================

Verificamos si el coeficiente del quinto grado del polinomio es significativo, de laforma siguiente:

H PDL0 06 0:β =

Por lo tanto, no es significativo.

El coeficiente del grado quinto del polinomio no es significativo, entonces estimamosel modelo considerando un polinomio de cuarto grado y los resultados del Eviews son:

Page 42: Econometria i

41

( )t tPDLβ 05

501515 1978970601990 95 126

= < =. .. ,

GCP R IPD

IPD IPD IPD

IPD IPD IPD

IPD IPD IPD

IPD IPD IPD

IPD

t t t

t t t

t t t

t t t

t t t

t

= − + +

+ + −

− − +

+ + +

+ − −

− −

− − −

− − −

− − −

− − −

8 423678855 0 7121166325 0 4874192342

0 214724703 0 05901103723 0 01343158555

0 03139067077 0 01873140654 0 005603336277

0 02759300405 0 03813936043 0 03306648629

0 01312077977 0 01602904374 0 04379195161

0 05465459393 0 0281813035

1 2 3

4 5 6

7 8 9

10 11 12

13

. . .

. . .

. . .

. . .

. . .

. . 8 0 06098590386

0 2431273314 15

16

IPD IPD

IPD

t t

t

− −

+

+

.

.

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1963:1 1996:1 Included observations: 133 after adjusting endpoints ================================================== Variable Coefficient Std. Erro t-Statistic Prob. ================================================== C -8.423679 5.885348 -1.431297 0.1548 R 0.712117 1.260543 0.564929 0.5731 PDL01 0.038139 0.017071 2.234169 0.0272 PDL02 0.003023 0.005791 0.521900 0.6027 PDL03 -0.008015 0.002358 -3.399155 0.0009 PDL04 -0.000286 0.000141 -2.024389 0.0450 PDL05 0.000205 4.09E-05 5.015150 0.0000 ==================================================

Verificamos si el coeficiente del cuarto grado del polinomio es significativo, de laforma siguiente:

H PDL0 05 0:β =

Por lo tanto, es significativo.

La estimación adecuada de la función consumo es la siguiente:

3.2. RETARDOS INFINITOS

Consideremos el modelo de Demanda de saldos reales:

el mecanismo de expectativas adaptativas es:

Page 43: Econometria i

42

π γ πt i t ii

+ −=

= ∑10

*

LLW

λ

λ

−=

1

1)(

positivoyenterorconL

LWr

r

)1(

)1()(

λ

λ

−=

nymdodepolinomiosLVyLUconLV

LULW gra)()(

)(

)()( =

en forma de sumatoria se expresa:

cuando el número de retardos es infinito es imposible estimar directamente el modelo,porque no tendríamos observaciones suficientes para ello.

Esto recibe el nombre de rezago distribuido finito, ya que el número de valoresrezagados o pasados es finito. son los pesos específicos que se asignan

a estos valores pasados.

Los modelos de rezago distribuido recibieron mayor atención en la década de 1950,cuando Koyck, Cagan y Nerlove sugirieron utilizar una distribución infinita de rezagos, conpesos específicos que se reducen en forma geométrica.

Para estimar este modelo es imprescindible imponer a priori algún tipo de restricciónentre los coeficientes, de modo que el modelo pueda transformarse en otro con un númeroreducido de variables.

Algunos planteamientos alternativos de distribuciones de retardos infinitos son:

1º Geométrica:

2º Pascal:

3º Racional:

4º Gamma:

Page 44: Econometria i

43

∑∞

=

− −Γ

=0

1 )exp()(

1)(

i

is Liis

LW

0exp)(0 1

<⎟⎠

⎞⎜⎝

⎛=∑ ∑

= =m

i

m

k

k

k pconipLW

5º Exponencial:

Si los decrecen de manera geométrica, es posible escribir:

entonces la suma de la serie infinita es , y si esta suma es igual a 1, se deberá tener

. Así,

Al sustituir esta expresión en el modelo original, nos da:

esto abarca una serie infinita y los valores infinitos anteriores de no se observan , es

preciso resolver este problema de alguna forma. Lo que se hace es dividir la serie en dospartes : el pasado observado y el no observado. Las series infinitas se escriben:

La primera parte se observa y se denota por medio de , la segunda parte puede

escribirse:

sustituyendo en el modelo, queda:

Page 45: Econometria i

44

M

PZ u

t

t

t

t

t= + + +β β γλ1 2 1

( )u N It u T≈ 0 2,σ

ln , , , , ln lnLM

PZ

T T M

PZ

t

t

t u

u

t

t

t

t

t

T

1 1 22

2 1 21

2

22

2

1

2β β γ λ π σ

σβ β γλ

⎛⎝⎜

⎞⎠⎟ = − − − − − −

⎛⎝⎜

⎞⎠⎟

=∑

( )

( )

~

~

~

β

β

γ

λ λ

λ

λ

λ λ

λλ

1

2

11

12

11

12 2

2

1

1

11

1

1

1

1

1

⎢⎢⎢

⎥⎥⎥

=

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

=

= =

=

=

=

∑ ∑

T Z

Z Z

Y

Z Y

Y

tt

T T

tt

T

t

tt

T

T

tt

T

t tt

T

t

tt

T

en realidad el parámetro c no interesa, dependen de .

Aplicaremos el método de estimación de máxima verosimilitud al modelo:

suponemos:

El logaritmo de la función de verosimilitud es:

se maximiza la función de verosimilitud con respecto a es equivalente aβ β γ λ1 2, , y

minimizar la suma residual. Por lo tanto, el estimador de máxima verosimilitud coincide conel estimador de mínimos cuadrados ordinarios.

Como el parámetro debe tomar valores en el intervalo (-1,1), entonces es posibleλhacer una partición de dicho intervalo, por ejemplo: -1, -0.9, ..., 0, 0.1, 0.2, ..., 1 y estimarel modelo por mínimos cuadrados ordinarios bajo cada uno de estos valores de ,λobteniendose:

Page 46: Econometria i

45

( )

( )I

T ZZ

t

Z ZZ

t Z

Zt

u

u

tt

T T

t t

t

T

tt

T

t

tt

Tt t

tt

T

T

t t−

=

=

= =

=

⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥

=

−+

⎛⎝⎜

⎞⎠⎟

+⎛⎝⎜

⎞⎠⎟

−+

∑ ∑

∑ ∑ ∑1

1

2

2

2

11

21 1

1

12

11

12

1 11

12 2

2 21 1

1

10

0

1

1

~

~

~~

~

β

β

γ

λ

σ

σ

λ λ

λβ

∂λλ γ

λ β∂

∂λλ γ

λ λ

λβ

∂λλ γ

⎛⎝⎜

⎞⎠⎟

+⎛⎝⎜

⎞⎠⎟

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

=

=

λ

β∂

∂λλ γ

σ

t

t

T

t t

t

T

u

Zt

T

1

21 1

2

1

2

1

0

0

2

En general, no tiene mucho sentido suponer que los coeficientes del modeloβ ioriginal alternan en signo, por lo que se supone inferior a la unidad en valor absoluto,λpero positivo; entonces, es el intervalo (0,1) el que se particiona.

Tras estimar el modelo suponiendo los diferentes valores de , se escoge aquelλvalor de que generó una suma residual menor o un coeficiente de determinación más alto.λLas estimaciones de y son las que se obtuvieron con dicho valor de .β1 β2 λ

Si queremos afinar más en los valores numéricos estimados, puede hacerse unasubdivisión de un intervalo alrededor del valor de inicialmente estimado, y repetir elλproceso.

La matriz de covarianzas apropiada es la inversa de la matriz de información, puesel estimador que se ha obtenido es, en realidad, el de máxima verosimilitud.

Para ello, habría que obtener la matriz de segundas derivadas de la función de

verosimilitud con respecto al vector de parámetros , puesto que ahora se( )β β γ λ σ1 22, , , , u

estiman todos simultáneamente. Dicha matriz de covarianzas es:

algunas observaciones:

1º La varianza del estimador es igual a , y es independiente de .~σu

22 2σ u

T

~,

~, ~ ~

β β γ λ1 2 y

2º La submatriz superior de orden 3 x 3 coincide con la matriz que se utilizó paraobtener el estimador de mínimos cuadrados ordinarios.

Para la estimación del modelo transformado se sigue el procedimiento siguiente:

1º Para cada valor de en el rango ( 0 , 1 ) se construyen las variables:

Page 47: Econometria i

46

( )GCP IPD ut i t ii

t= + +−=

∑α β0

1

( ) ( )GCP IPD uti

t ii

t= + − +−=

∑α λ λ1 20

es decir:

y así sucesivamente; y .

2º Estimamos el modelo transformado por el método de mínimos cuadrados ordinariosy obtenemos la suma de cuadrados residual.

3º Se escoge el valor de para el que la suma residual es mínimo y obtenemos los

valores correspondientes de como los estimados de mínimos cuadrados

que se desean.

4º Si queremos afinar más en los valores numéricos estimados, puede hacerse unasubdivisión de un intervalo alrededor del valor de inicialmente estimado, y repetirel proceso anterior.

Obsérvese que, dado que son funciones no lineales de , la estimación del

modelo transformado involucra el método de mínimos cuadrados no lineales. Sin embargo,para un valor dado de , tenemos un modelo lineal de mínimos cuadrados. Así, utilizamos

un procedimiento de búsqueda sobre . En la práctica, se elige en intervalos de 0.1 enel primer paso y de 0.01 en el segundo.

EJEMPLO 7:

Especificamos la función consumo siguiente:

Si los decrecen de manera geométrica, es posible escribir:

entonces la suma de la serie infinita es , y si esta suma es igual a 1, se deberá tener

. Así,

Page 48: Econometria i

47

( ) ( )λ αλ λ λ λGCP IPD uti

t ii

t−+

− −=

−= + − +∑11

10

11 3

( ) ( )GCP IPD GCP u ut t t t t= + − + + −− −α λ λ λ1 1 1

GCP IPD GCP ut t t t= + + +−α λ λ* *1

Y X u Y Z u= + = + +β α δ1 1

( ) ( ) ( )[ ] ( )~ ~ ~ ~ ~ ~β β β β β β χMCO VI VI MCO MCO VI rVar Var−

′− − ≈

−12

rezagamos un periodo el modelo y multiplicamos por :λ

restando (3) de (2):

o

el resultado es el modelo del ejemplo 3 y el proceso de estimación ya se conoce.

4. CONTRASTE DE EXOGENEIDAD DE HAUSMAN Y WU

Es aconsejable cuestionarse acerca de las propiedades de exogeneidad de las variablesexplicativas, pues, de no satisfacerse, obtendríamos estimadores inconsistentes.

Hausman (1978) y Wu (1973) sugieren escribir el modelo a estimar, distinguiendoentre las r variables explicativas que pueden estar coorrelacionadas con el término deY1

error de aquellas K-r variables cuya ortogonalidad a no se cuestiona:Z1 ut

y supongamos que se dispone de una lista de instrumentos para , en caso de que seY1

necesitasen.

El contraste consiste en:

1º Estimar el modelo por mínimos cuadrados ordinarios.

2º Estimar el modelo por el método de variables instrumentales o mínimos cuadradosen dos etapas.

3º La hipótesis que se plantea es:: Todas las variables explicativas del modelo original son exógenas.H0

4º El estadístico es:

Un valor elevado del estadístico rebatirá tal supuesto y mostraría la necesidad deutilizar un procedimiento de estimación de variables instrumentales.

Page 49: Econometria i

48

GCP IPD GCP ut t t t= + + +−α α α0 1 2 1

EJEMPLO 8:

Especificamos la función consumo siguiente:

se quiere verificar si la variable se puede tratar como exógena. Siguiendo elGCPt−1

procedimiento, primero se estima el modelo por mínimos cuadrados ordinarios:

Dependent Variable: GCP Method: Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints ============================================================

Variable Coefficient Std. Error t-Statistic Prob. ============================================================

C 0.248943 1.870295 0.133104 0.8943 IPD 0.193060 0.022728 8.494528 0.0000 GCP(-1) 0.801910 0.024844 32.27830 0.0000

============================================================R-squared 0.999934 Mean dependent var 1854.654 Adjusted R-squared 0.999933 S.D. dependent var 1471.192 S.E. of regression 12.00206 Akaike info criteri 7.828095 Sum squared resid 20887.16 Schwarz criterion 7.888849 Log likelihood -576.2790 F-statistic 1104297. Durbin-Watson stat 1.709616 Prob(F-statistic) 0.000000 ============================================================

A continuación se estima el modelo por el método de variables instrumentales omínimos cuadrados en dos etapas:

Dependent Variable: GCP Method: Two-Stage Least Squares Sample(adjusted): 1959:2 1996:1 Included observations: 148 after adjusting endpoints Instrument list: C IPD IPD(-1) ============================================================

Variable Coefficient Std. Error t-Statistic Prob. ============================================================

C -4.191603 2.619429 -1.600197 0.1117 IPD 0.298547 0.046882 6.368102 0.0000 GCP(-1) 0.686558 0.051261 13.39348 0.0000

============================================================R-squared 0.999925 Mean dependent var 1854.654 Adjusted R-squared 0.999924 S.D. dependent var 1471.192 S.E. of regression 12.86338 Sum squared resid 23992.65 F-statistic 960998.7 Durbin-Watson stat 1.358172 Prob(F-statistic) 0.000000 ============================================================

Page 50: Econometria i

49

( ) ( ) ( )[ ] ( )~ ~ ~ ~ ~ ~. .β β β β β β χMCO VI VI MCO MCO VIVar Var−

′− − = > =

−1

126 61844563805 384

Y X X Y Y Yt t t q t t p t p t= + + + + + + + + +− − − −δ β β β α α α ε0 1 1 1 1 2 2..... .....

( ) ( )A L Y B L Xt t t= + +δ ε

( )( )( ) ( )

YA L

B L

A LX

A Lt t

t= + +δ ε

( )Y D L X ut t t= + +γ

La hipótesis que se plantea es:: Todas las variables explicativas del modelo original son exógenas.H0

Por lo tanto, se rechaza la hipótesis nula.

5. INTERPRETACIÓN DE LOS MODELOS DINÁMICOS

Un modelo dinámico más general, representado por:

aplicando el operador de retardos se tendrá:

dividimos por A(L) el modelo y se obtiene:

se puede expresar:

Un modelo es estable cuando cumple alguna de las dos condiciones siguientes:

1º Ante una variación puntual en el valor de una variable explicativa, la variabledependiente retorna a su valor de equilibrio.

2º Ante una variación permanente en el valor de una variable explicativa, la variabledependiente evoluciona hacia un nuevo valor de equilibrio.

Se demuestra que para que un modelo dinámico sea estable las raíces del polinomioA(L) deben ser en valor absoluto mayores que la unidad.

Esta condición de estabilidad nos asegura que la suma de los coeficientes delpolinomio D(L) es finita, es decir, la serie es convergente. Por tanto el impacto sobre lavariable endógena es finito, pasado un tiempo se retorna al equilibrio o bien, se tiende haciaun nuevo equilibrio.

MULTIPLICADORES Y RETARDOS

Estos conceptos son importantes al analizar el efecto que, sobre la variable explicada,

Page 51: Econometria i

50

mY

X

t

t

0 0= =∂

∂β

mY

Xj

t

t j

j= ≠−

∂β

mY

Xj

t

t j

j= =−

∂δ

m mT jj

==

∑0

R M

j j

j

j

j

. .==

=

δ

δ

1

1

tiene una variación unitaria de la variable explicativa.

1º Multiplicador de Impacto o Contemporáneo: representa el cambio que se( )m0

produce en la variable endógena ante una variación unitaria de la exógena en( )Ytel período actual .( )X t

2º Multiplicador de Retardo j: cuantifica el efecto que sobre la variable( )jmendógena tiene una variación unitaria de la exógena en el período t-j .( )Yt ( )X t j−

en este caso no coincide, porque existe una dependencia implícita de las variablesdependientes retardadas.

Considerando el polinomio D(L) se tendrá que:

3º Multiplicador Total: es la suma de todos los multiplicadores.( )mT

para que un modelo tenga sentido económico el multiplicador total debe ser finito.Esto ocurrirá siempre que el proceso sea estable y viceversa.

4º Retardo Medio: se define como la media ponderada, por el retardo, de todos loscoeficientes del polinomio D(L) es decir,

La idea del retardo medio es informarnos si el impacto, sobre la variableendógena de una variación de la exógena, está muy concentrado o diluido en el

Page 52: Econometria i

51

GCP SYS GCP ut t t t= + + +−α α α0 1 2 1

( )

( ) ( ) ( )

GCP GCP SYS u

GCP LGCP SYS u

L GCP SYS u

GCPL L

SYSu

L

t t t t

t t t t

t t t

t t

t

− = + +

− = + +

− = + +

=−

+−

+−

−α α α

α α α

α α α

α

α

α

α α

2 1 0 1

2 0 1

2 0 1

0

2

1

2 2

1

1 1 1

GCP SYS R GCP ut t t t t= + + + +−α α α α0 1 2 3 1

tiempo.

5º Retardo Mediano: se define como el instante en que se alcanza el 50 % del impacto

total que se produce en debido a una variación en .Yt X t

EJEMPLO 1:

Se tenía la función consumo siguiente:

el modelo se puede transformar de la forma siguiente:

deducimos los multiplicadores, a saber:

M1MI = = 0.173464.α1

M1MD1 = = c(2)*c(3) = 0.154722.α α1 2

M1MD2 = = c(2)*c(3)^2 = 0.138005.α α1 22

..............

M1MLP = = c(2)/(1-c(3)) = 1.605471.α

α1

21−

Retardo Medio = = c(3)/(1-c(3)) = 8.2554.( )( )

( )( )

′−

′= −

−=

B

B

A

A

1

1

1

1

0

1 11

2

2

2

α

α

α

α

EJEMPLO 2:

Teníamos la función consumo siguiente:

el modelo se puede transformar de la forma siguiente:

Page 53: Econometria i

52

( )

( ) ( ) ( ) ( )

GCP GCP SYS R u

GCP LGCP SYS R u

L GCP SYS R u

GCPL L

SYSLR

u

L

t t t t t

t t t t t

t t t t

t t t

t

− = + + +

− = + + +

− = + + +

=−

+−

+−

+−

−α α α α

α α α α

α α α α

α

α

α

α

α

α α

3 1 0 1 2

3 0 1 2

3 0 1 2

0

3

1

3

2

3 3

1

1 1 1 1

deducimos los multiplicadores, a saber:

M2MISYS = = 0.256588.α1

M2MD1SYS = = c(2)*c(4) = 0.214135.α α1 3

M2MD2SYS = = c(2)*c(4)^2 = 0.178707.α α1 3

2

..............

M2MLPSYS = = c(2)/(1-c(4)) = 1.550845.α

α1

31−

M2MIR = = -1.823686.α2

M1MD1 = = c(3)*c(4) = -1.521957.α α2 3

M1MD2 = = c(3)*c(4)^2 = -1.270149.α α2 3

2

..............

M1MLP = = c(3)/(1-c(4)) = -11.02256. α

α2

31−

Retardo Medio = = c(4)/(1-c(4)) = 5.0441.( )( )

( )( )

′−

′= −

−=

B

B

A

A

1

1

1

1

0

1 12

3

3

3

α

α

α

α

Page 54: Econometria i

( )Y f X u t Tt t t= + =, , ,...,β 1 2

C Y ut t t= + +β β β1 2

3

Z e y Z X Xt

X

t t tt

2 3 3 42= =

Y Z Z ut t t t= + + +β β β1 2 2 3 3

CAPITULO II

MODELOS NO LINEALES

1. INTRODUCCIÓN

El modelo econométrico es del tipo:

donde es una función no lineal de los componentes de los vectores y .( )f X t ,β X t β

Una especificación no lineal de un modelo econométrico puede estar indicandola incertidumbre del investigador acerca de la verdadera relación entre las variables delmodelo. Por ejemplo:

la estimación del parámetro permitiría contrastar la hipótesis de dependencia linealβ3

o propensión marginal a consumir constante , frente a otras alternativas (la de( )β3 1=una menor sensibilidad del gasto en consumo a variaciones en la renta disponible

). Este modelo puede interpretarse como una primera especificación, para pasar( )β3 1<a estimar un modelo lineal si la hipótesis se acepta en una primera estimación delβ3 1=modelo.

Conviene distinguir entre varios tipos de no linealidades que pueden presentarseen la práctica. Por ejemplo:

1º Y e X X ut

X

t t tt= + + +β β β1 2 3 3 4

2

La no linealidad del modelo afecta únicamente a sus variables, pero no asus coeficientes. Asumimos que:

remplazamos en el modelo, nos da:

Por lo tanto, siempre que la no linealidad del modelo afecte únicamente

Page 55: Econometria i

54

( )g Y X u t Tt t t, , , ,..., .β = = 1 2

Y X ut t t= + +β β1 2 2*

Y X ut t t= + +β β1 2*

a sus variables explicativas, entonces queda resuelto mediante una transformaciónde datos.

2º Y X Y X ut t t t t+ = +β β1 2ln

La no linealidad del modelo afecta también a la variables endógena quehaga imposible expresarla de modo explícito como función de los vectores X ty . La forma funcional de tales modelos es una función implícita:β

3º Y e X ut t t= + +β β β1 2 2

3

La no linealidad del modelo afecta tan sólo a sus coeficientes pero no a susvariables. Podría el modelo expresarse de la siguiente forma:

pero no podrían recuperarse estimaciones de los coeficientes y , a no serβ2 β3

que se contara con información adicional acerca de sus valores numéricos(Ejemplo: suma o cociente fuesen conocidos).

4º ( )Y X ut t t= + +β β1 2ln

La no linealidad del modelo es en los coeficientes sin que ello presentedificultades serias de estimación; el modelo se expresa:

luego se recupera el valor de . Pero el valor de así obtenido( )β β β2 2

2$ $*

= e β2

no heredaría las propiedades estadísticas que pudiera tener el estimador de .eβ2

5º Y X ut t t= + +β β β1 2

3

Este modelo es otro modelo no lineal que no puede tratarse por métodoslineales.

A diferencia de los modelos lineales, en modelos no lineales el número deparámetros no coincide necesariamente con el número de variables explicativas, comoocurre en los modelos segundo, tercero y quinto.

Page 56: Econometria i

55

( )Y f X u t Tt t t= + =, , ,..., .β 1 2

( ) ( ) ( )Y f Xf X

u t Tt

t

t≈ +⎛

⎝⎜⎜

⎠⎟⎟

− + ==, $ , $ , ,..., .$β∂ β

∂ββ ββ β 1 2

( ) ( ) ( )Y f X

f X f Xu t Tt

t t

t− +⎛

⎝⎜⎜

⎠⎟⎟

≈⎛

⎝⎜⎜

⎠⎟⎟

+ == =, $ , $ ,, ,..., .$ $β

∂ β∂β

β∂ β

∂βββ β β β 1 2

( )Y

f Xu t Tt

t

t

*$

,, ,..., .≈

⎝⎜⎜

⎠⎟⎟

+ ==

∂ β∂β

ββ β 1 2

( ) ( )Y Y f X

f Xt t t

t*$, $ , $= − +

⎝⎜⎜

⎠⎟⎟

=β∂ β

∂βββ β

2. UNA APROXIMACIÓN LINEAL AL MODELO NO LINEAL

El modelo:

consistiría en obtener la mejor aproximación lineal (mediante un desarrollo en serie de

Taylor) de la función alrededor de un estimador inicial y estimar el modelo( )f X t ,β $βlineal resultante mediante mínimos cuadrados ordinarios.

Dicha aproximación es:

desplazando lo conocido al primer miembro, nos queda:

obteniéndose el modelo lineal:

donde,

denotamos por el vector gradiente en cada período dimensión K x 1 y por∂∂βf t ( )∂ β

∂βf X t ,

su valor en el punto .( )∂ β

∂β

f t$

β β= $

Dada una primera aproximación al estimador , se trata de construir la variable$β, así como las K variables que componen el valor del gradiente de la funciónYt

* ( )f X t ,β

Page 57: Econometria i

56

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )~$ $ $ $ $ $

, $$

$*β∂ β

∂β

∂ β

∂β

∂ β

∂β

∂ β

∂β

∂ β

∂β

∂ β

∂ββ

∂ β

∂ββ=

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎝⎜⎜

⎠⎟⎟

=⎛

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎝⎜⎜

⎠⎟⎟

− +⎛

⎝⎜⎜

⎠⎟⎟

− −

f f fY

f f fY f X

f

1 1

( ) ( ) ( ) ( ) ( ) ( ) ( )~$ $ $

$$

$ $$ $ $

$β∂ β

∂β

∂ β

∂β

∂ β

∂β

∂ β

∂ββ β

∂ β

∂β

∂ β

∂β

∂ β

∂β=

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎝⎜⎜

⎠⎟⎟

+⎛

⎝⎜⎜

⎠⎟⎟ = +

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎝⎜⎜

⎠⎟⎟

′− −

f f fu

f f f fu

1 1

( ) ( )( )( )

( )

∂∂β

∂ β

∂β

∂∂β

∂∂β

∂∂β

∂∂β

∂∂β

∂∂β

∂∂β

∂∂β

∂∂β

β

ββ

β

f f

f f f

f f f

f f f

f X

f X

f X

f X

K

K

T T T

K

T

= =

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

=

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

$

.....

.....

..... ..... ..... .....

.....

,

,

,

.....

,

1

1

1

2

1

2

1

2

2

2

1 2

1

2

en el punto .β β= $ ∂∂βfi K

t

i

, , ,...,=⎛⎝⎜

⎞⎠⎟1 2

Las “observaciones muestrales ” correspondientes a estas variables son función

de las observaciones muestrales de y del vector . A continuación se estima porY Xt t, $βmínimos cuadrados ordinarios el modelo lineal:

remplazando y simplificando nos da:

donde, es el residuo obtenido con la estimación inicial de . Asimismo( )$ , $u Y f X= − β $βtenemos que:

La estimación del parámetro se obtiene similar a un modelo lineal, es decir:σ u

2

donde .$~ ~

σ uu u

T K2 =

′− ( )~ ,

~u Y f X= − β

Si existe la matriz inversa de , entonces la distribución de( ) ( )∂ β∂β

∂ β∂β

f f~ ~⎛

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

probabilidad del estimador de mínimos cuadrados de esta aproximación lineal es:

Page 58: Econometria i

57

( ) ( )~,

~ ~

β β σ∂ β∂β

∂ β∂βMCO uN

f f≈

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎜⎜⎜

⎟⎟⎟

2

1

( )T K u

u

T K

−≈ −

$σσ

χ2

22

( )GCP f IPD u e ut t tIPD

tt= + = +, ,β β β β

0 1 01

( )∂∂β

∂∂β

ββ βf fe IPD e

t t IPD

t

IPDt t

0 10

1 1, ,⎛⎝⎜

⎞⎠⎟ =

( ) ( ) ( )

( ) ( )

Y f Xf f

f fu

GCP IPD e e IPD e

t t

t t

t t

t

t t

IPD IPD

tT T

− +⎡

⎣⎢⎢

⎦⎥⎥

+⎡

⎣⎢⎢

⎦⎥⎥

=

⎣⎢⎢

⎦⎥⎥

+⎡

⎣⎢⎢

⎦⎥⎥

+

+ ≈ +

= =

= =

, ,, $ , $

, ,

$ $ $

$ $

$ $

$ $

β β∂ β β

∂ββ

∂ β β∂β

β

∂ β β∂β

β∂ β β

∂ββ

β β β β β

β β β β

β β β β

β β

0 1

0 1

00

0 1

11

0 1

00

0 1

11

0 1 0 1 01 1

$β1IPD

tT u+

y

independiente de la distribución normal del vector .~β

Ejemplo 1:

Consideremos la estimación del modelo no lineal:

se tiene el vector gradiente:

si los valores iniciales son: y .β0 = GCP β1 0=

El modelo puede aproximarse linealmente, así:

reemplazando los valores iniciales y aplicando mínimos cuadrados ordinarios nos da elresultado de la primera iteración, éstos parámetros estimados vienen a ser la condición

Page 59: Econometria i

58

( )GCP f IPD u IPD ut t t t t= + = + +, , ,β β β β β β0 1 2 0 1

2

inicial para la estimación de la segunda iteración, así sucesivamente. Para elegir la mejorestimación tenemos:

APROXIMACIÓN APLICANDO TAYLOR ================================================= I T R2 AJUSTADO AKAIKE SCHWARZ ================================================= 1 149.00 0.9994612 9.9134183 9.9537398 2 149.00 0.9266390 14.414373 14.454694 3 149.00 1.0000000 17.463923 17.504244 4 149.00 0.9999888 17.463906 17.504228 5 149.00 0.9999185 17.383859 17.424181 6 149.00 0.9983820 17.112626 17.152947 7 149.00 0.9439979 14.579590 14.619912 8 149.00 -1.3941428 18.374217 18.414538 =================================================

La mejor estimación es la primera iteración, cuyo resultado es:

Dependent Variable: _Y+B01*B11*_X*EXP(B11*_X) Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 ======================================================= Variable Coefficient Std. Error t-Statistic Prob. ======================================================= EXP(B11*_X) -30.23673 4.542309 -6.656688 0.0000 B01*_X*EXP(B11*_X) 0.000502 9.59E-07 523.9418 0.0000 =======================================================R-squared 0.999465 Mean dependent var 1844.290 Adjusted R-squared 0.999461 S.D. dependent var 1471.661 S.E. of regression 34.16168 Akaike info criteri 9.913418 Sum squared resid 171552.0 Schwarz criterion 9.953740 Log likelihood -736.5497 Durbin-Watson stat 0.351869 =======================================================

Este procedimiento sólo dará buenos resultados si las condiciones iniciales estánpróximos a los verdaderos valores de y . (a priori no tenemos mucha información).α β

Ejemplo 2:

Consideremos la estimación del modelo no lineal:

Page 60: Econometria i

59

( )( )∂∂β

∂∂β

∂∂β

ββ βf f fIPD IPD IPD

t t t

t t t

0 1 211 2 2, , , , ln

⎛⎝⎜

⎞⎠⎟ =

( ) ( ) ( ) ( )

( ) ( )

Y f Xf f f

f f

t t

t t t

t t

− +⎡

⎣⎢⎢

⎦⎥⎥

+⎡

⎣⎢⎢

⎦⎥⎥

+⎡

⎣⎢⎢

⎦⎥⎥

⎣⎢⎢

⎦⎥⎥

+⎡

⎣⎢⎢

⎦⎥⎥

= = =

=

, , ,, , $ , , $ , , $

, , , ,

$ $ $

$

β β β∂ β β β

∂ββ

∂ β β β∂β

β∂ β β β

∂ββ

∂ β β β∂β

β∂ β β β

∂β

β β β β β β

β β β

0 1 2

0 1 2

00

0 1 2

11

0 1 2

22

0 1 2

00

0 1 2

1

( )

( ) ( )

= =

+⎡

⎣⎢⎢

⎦⎥⎥

+

+ ≈ + + +

$ $

$ $ $

, , $

$ $ ln $ ln

β β β

β β β

β∂ β β β

∂ββ

β β β β β β

1

0 1 2

22

1 2 0 1 2 12 2 2

fu

GCP IPD IPD IPD IPD IPD u

t

t

t t t t t t t

se tiene el vector gradiente:

se asume que y estimamos por mínimos cuadrados ordinarios el modelo lineal yβ2 1=nos da:.

Dependent Variable: _Y Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 ==================================================== Variable Coefficient Std. Error t-Statistic Prob. ==================================================== C -30.23673 4.542309 -6.656688 0.0000 _X 0.926281 0.001768 523.9418 0.0000 ====================================================R-squared 0.999465 Mean dependent var 1844.290 Adjusted R-squared 0.999461 S.D. dependent var 1471.661 S.E. of regression 34.16168 Akaike info criteri 9.913418 Sum squared resid 171552.0 Schwarz criterion 9.953740 Log likelihood -736.5497 F-statistic 274515.0 Durbin-Watson stat 0.351869 Prob(F-statistic) 0.000000 ====================================================

Por lo tanto, los valores iniciales son: ,β0 = -30.2367319005 β1 = 0.926280822995

y . .β2 1=

El modelo puede aproximarse linealmente, así:

reemplazando los valores iniciales y aplicando mínimos cuadrados ordinarios nos da elresultado de la primera iteración, éstos parámetros estimados vienen a ser la condicióninicial para la estimación de la segunda iteración, así sucesivamente. Para elegir la mejorestimación tenemos:

Page 61: Econometria i

60

( ) ( )( )SR Y f Xt tt

T

$ , $β β= −=∑

2

1

APROXIMACIÓN APLICANDO TAYLOR ================================================= I T R2 AJUSTADO AKAIKE SCHWARZ ================================================= 1 149.00 0.9999972 9.2161800 9.2766621 2 149.00 0.9999964 9.2114934 9.2719756 3 149.00 0.9999975 9.2114927 9.2719748 4 149.00 0.9999974 9.2114927 9.2719748 5 149.00 0.9999974 9.2114927 9.2719748 6 149.00 0.9999974 9.2114927 9.2719748 =================================================

La mejor estimación es la tercera iteración, cuyo resultado es:

Dependent Variable: _Y+M2B13*M2B23*_X^M2B23*LOG(_X) Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 ========================================================== Variable Coefficient Std. Error t-Statistic Prob. ========================================================== C 51.69951 7.023200 7.361247 0.0000 _X^M2B23 0.556281 0.023068 24.11473 0.0000 M2B13*_X^M2B23*LOG(_X 1.058673 0.004776 221.6437 0.0000 ==========================================================R-squared 0.999997 Mean dependent var 16939.23 Adjusted R-squared 0.999997 S.D. dependent var 15017.00 S.E. of regression 23.97097 Akaike info criteri 9.211493 Sum squared resid 83892.67 Schwarz criterion 9.271975 Log likelihood -683.2562 F-statistic 29041974 Durbin-Watson stat 0.755780 Prob(F-statistic) 0.000000 ==========================================================

3. MÍNIMOS CUADRADOS NO LINEALES

El procedimiento de mínimos cuadrados no depende en modo alguno de lalinealidad del modelo, por lo que es aplicable en condiciones más generales.

La lógica del método de mínimos cuadrados es escoger valores de los

parámetros de modo que se minimice la suma residual:β

Page 62: Econometria i

61

( ) ( )( )( ) ( )( )

SISTEMA

DE

ECUACIONES

NORMALES

SRY f X

f

SRY f X

f

SR

t tt

Tt

t tt

Tt

∂ β

∂ββ

∂∂β

∂ β

∂ββ

∂∂β

$

$ , $$

$

$ , $$

.............................................................

1 1 1

2 1 2

2 0

2 0

= − −⎛

⎝⎜⎜

⎠⎟⎟ =

= − −⎛

⎝⎜⎜

⎠⎟⎟ =

=

=

( ) ( )( )$

$ , $$

β

∂ββ

∂∂βK

t tt

Tt

K

Y f Xf

= − −⎛

⎝⎜⎜

⎠⎟⎟ =

⎪⎪⎪⎪⎪

⎪⎪⎪⎪⎪

=∑2 0

1

( )( ) ( )Y f X

f

t tt

Tt

K− ==∑ , $

$

β∂ β

∂β1

0

( ) ( ) ( )∂ β

∂β

∂ β

∂ββ

fY

ff X

$ $

, $⎛

⎝⎜⎜

⎠⎟⎟

=⎛

⎝⎜⎜

⎠⎟⎟

( )∂ β

∂β

fu i K

t

it

T

t

$$ , ,..., .

=∑ = ∀ =

1

0 1 2

( ) ( )∂ β

∂β

∂ β

∂β

fu

fu

t

t

T

t K

$$

$$

=∑ =

⎝⎜⎜

⎠⎟⎟

=1

0

Tomando derivadas con respecto a cada uno de los componentes del vector se$βtiene:

siendo y escalares.∂∂βf t

i$ ( )( )Y f Xt t− , $β

Este sistema se abrevia:

en forma matricial:

Como , entonces rescribimos:( )$ , $u Y f Xt t t= − β

o matricialmente:

Page 63: Econometria i

62

La solución al sistema de ecuaciones normales es el estimador de mínimoscuadrados no lineales (MCNL).

El estimador de mínimos cuadrados del modelo para t = 1, 2,( )Y f X ut t t= +,β

..., T. es aquel vector de coeficientes que genera un vector de residuos ortogonal a cada$β

uno de los componentes del vector gradiente de la función evaluado en .( )f X t ,β$β

Una diferencia muy importante con el modelo lineal es que, en modelos en que

la función no dependen linealmente del vector , sus derivadas parciales( )f X t ,β βtampoco serán, en general, funciones lineales de los componentes del vector .β

Esta peculiaridad de los modelos no lineales genera, a su vez, una serie dedificultades:

1º El hecho de que el estimador de MCNL dependa del vector Y, y en consecuenciadel vector u en forma no lineal; entonces, en general, será sesgado. Laspropiedades del estimador de MCNL vendrán de su posible relación con elestimador de máxima verosimilitud.

2º La solución a un sistema de ecuaciones no lineales puede no ser única y, por tanto,un modelo no lineal puede poseer varios estimadores mínimo cuadráticos. Pudieraser que el estimador de mínimos cuadrados no existiese, pues un sistema deecuaciones no lineales no siempre tiene solución (diferente al caso lineal).

Hay que resolver el sistema de ecuaciones normales o el problema de optimizacióndel que éstas proceden por métodos numéricos (algoritmos), como por ejemplo:

1º De Búsqueda.-

Es aplicable cuando K, número de parámetros a estimar, es pequeño (unoo dos) y el rango de sus valores admisibles está acotado.

El algoritmo consiste:i) Construir una partición de dicho intervalo.

ii) Evaluar la función en cada uno de los puntos de la partición.( )F βiii) Elegir como estimador aquel punto que proporciona un valor numéricoβ

más pequeño de la función .( )F β

2º Del Descenso Más Rápido.-

Una estrategia posible para tratar de minimizar el valor de la función ( )F θ

Page 64: Econometria i

63

( )$ $ $θ θ λ θ λ1 0 0 0= − ∇ >F

( )[ ] ( )$ $ $ ln $θ θ θ θn n n nI L= + ∇− −

−1 1

1

1

consiste en desplazarnos de un vector inicial a otro , de acuerdo con laθ 0 θ1

expresión:

donde la elección del parámetro , que se conoce como longitud de paso, esλ > 0crucial para reducir efectivamente el valor de . En efecto, si el valor de( )F θ λ

fuese excesivamente grande, entonces pudiera ser que , lo cual( ) ( )$ $ $ $F Fθ θ1 0>implicaría que el algoritmo podría no converger.

3º Newton - Raphson.-

Supongamos que disponemos de una estimación del mínimo de una$θ n $θfunción continuamente diferenciable. Si consideramos un entorno pequeño del

punto el valor numérico de F en un punto de dicho entorno puede aproximarse$θ nmediante un desarrollo en serie de Taylor de orden 2.

Este algoritmo se utiliza de un modo iterativo, utilizando la nuevaestimación como punto de partida en cada etapa del algoritmo y llevando a caboiteraciones hasta que se satisfagan los criterios de convergencia que elinvestigador haya estipulado.

Lo utilizan los mínimos cuadrados general y máxima verosimilitud.

4º De Scoring.-

Diseñado para el caso en que se pretende obtener el estimador de máximaverosimilitud, este algoritmo se basa en la propiedad de que la esperanzamatemática de la matriz hessiana de la función de verosimilitud (matriz deinformación cambiada de signo) tiene una expresión analítica más sencilla que lapropia matriz de derivadas segundas.

Como aproximación, se ha sugerido sustituir la matriz de derivadassegundas por la matriz de información, teniéndose el llamado algoritmo de “scoring ”:

Las ventajas son:i) Converge más lentamente que el algoritmo de Newton - Raphson.ii) La matriz de información es siempre definida positiva, entonces no hay

problema en seguir una dirección inapropiada.

Page 65: Econometria i

64

( ) ( ) ( )[ ]F SR Y f Xt tt

T

θ β β= = −=∑ ,

1

2

∂∂β

∂∂β

f ft

t

Tt⎛

⎝⎜

⎞⎠⎟⎛⎝⎜

⎞⎠⎟′⎡

⎢⎢

⎥⎥=

∑1

$ $β β∂∂β

∂∂β

∂∂βn n

t

t

Tt

n

t

t

T

t

n

f f fu= +

⎛⎝⎜

⎞⎠⎟⎛⎝⎜

⎞⎠⎟′⎡

⎢⎢

⎥⎥

⎛⎝⎜

⎞⎠⎟

⎣⎢

⎦⎥−

=−

= −

∑ ∑11

1

1

1 1

( )Varf f

u

t

t

Ttβ σ

∂∂β

∂∂β

=⎛⎝⎜

⎞⎠⎟⎛⎝⎜

⎞⎠⎟′⎡

⎢⎢

⎥⎥=

∑2

1

1

Una vez lograda la convergencia, el estimador alcanzado tiene como matrizde covarianzas la inversa de la matriz de información.

5º Gauss - Newton.-

Es una variante del algoritmo de Newton - Raphson, útil cuando se trata deestimar por mínimos cuadrados un modelo no lineal, en el que la función objetivoes:

el algoritmo de Gauss - Newton consiste en ignorar el término que contiene lasegunda derivada de en el hessiano (Porque su contribución es muy pequeña);f tentonces se sustituye el hessiano por la matriz simétrica, definida positiva:

por lo que el algoritmo de Gauss - Newton resulta:

Si se logra la convergencia del algoritmo, el estimador resultante tienedistribución asintótica normal, con esperanza igual a , y matriz de covarianzas:β

donde el parámetro se estima mediante , donde K denota elσ u

2( )

$$

σβ

u

SR

T K2 =

−número de coeficientes estimados.

En el caso de un modelo de regresión lineal, la expresión anterior delalgoritmo Gauss- Newton se reduce, como es lógico, a la que proporciona elestimador de mínimos cuadrados ordinarios:

Page 66: Econometria i

65

$β = ′⎛⎝⎜

⎞⎠⎟

⎛⎝⎜

⎞⎠⎟

=

=∑ ∑X X X Yt tt

T

t tt

T

1

1

1

( ) ( ) ( )Var

f X f X

u

t

t

Tt$

, $ , $

β σ∂ β

∂β

∂ β

∂β=

⎝⎜⎜

⎠⎟⎟

⎝⎜⎜

⎠⎟⎟

′⎡

⎢⎢⎢

⎥⎥⎥=

∑2

1

1

( )$$ $

$ , $σ βu

u u

T Kdonde u Y f X2 =

′−

= −

( ) ( )p

T

f f

T

lim$ $

1 ∂ β

∂β

∂ β

∂β

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

( ) ( )[ ]( ) ( )[ ]

∂ α β

∂αα

∂ α β

∂βα

β β

β β

SRY e e

SRY e X e

t

X X

t

T

t

X

t

X

t

T

t t

t t

$, $$

$, $$

$ $

$ $

= − − =

= − − =

=

=

2 0

2 0

1

1

Cuando el tamaño muestral crece, el estimador de mínimos cuadrados obtenidopor alguno de los algoritmos numéricos tiene una distribución normal, con esperanzaβy matriz de covarianza:

donde el parámetro se estima:σ u

2

Los habituales contrastes de hipótesis mediante estadísticos t o F son válidos, sinmás que utilizar las expresiones anteriores en el cálculo de la matriz de covarianzas. Lascondiciones bajo las que los resultados anteriores son válidas incluyen la existencia de

un único mínimo global de la función y la no singularidad de la matriz límite.( )SR β

Ejercicio:

Las condiciones de optimalidad para la obtención del estimador MCNL serían:

que carecen de solución explícita. Suponiendo que el sistema pudiera resolverse, lamatriz de covarianzas estimada de las estimaciones sería:

Page 67: Econometria i

66

( ) ( ) ( )Var f f

e X e

X e X e

u t tt

T

u

X

t

T

t

X

t

X

t

T

tt

T

X

t t

t t

$, $ $, $ $, $α β σ α β α β σα

α α

β β

β β

= ∇ ∇′⎡

⎣⎢

⎦⎥ =

⎢⎢⎢⎢

⎥⎥⎥⎥

=

=

= =

∑∑ ∑

∑ ∑2

1

1

2

2

1

2

2

1

2 2

1

2

( )$

$$

σα β

u

t

X

t

T

Y e

T

t

2

2

1

2=

−=∑

GCP IPD ut t t= + +β β β0 1

2

β β β0 1 230 23673 0 926281 1= − = =. .

donde,

Ejemplo 2:

Estimar el modelo siguiente:

si la condición inicial es:

Aplicando mínimos cuadrados no lineales en el Eviews se obtiene el resultadosiguiente:Dependent Variable: GCP Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 Convergence achieved after 24 iterations GCP=C(1)+C(2)*IPD^C(3) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) 51.69854 7.024917 7.359310 0.0000 C(2) 0.556285 0.023101 24.08103 0.0000 C(3) 1.058672 0.004783 221.3328 0.0000 ============================================================R-squared 0.999738 Mean dependent var 1844.290Adjusted R-squared 0.999735 S.D. dependent var 1471.661S.E. of regression 23.97097 Akaike info criteri 9.211493Sum squared resid 83892.66 Schwarz criterion 9.271975Log likelihood -683.2562 Durbin-Watson stat 0.755779============================================================

Page 68: Econometria i

67

GCP e utIPD

tt= +β β

01

( )( )( )

L eu

u

T

Y f Xu

t t

t

T

β σπσ

σβ

,,

22

21

21

2

2

2

1=⎛

⎝⎜

⎠⎟

∑−−

⎣⎢⎢

⎦⎥⎥=

Ejemplo 1:

Estimar el modelo no lineal siguiente:

si los valores iniciales son: y . Aplicando mínimos cuadrados no linealesβ0 = GCP β1 0=en el Eviews se obtiene el resultado siguiente:

Dependent Variable: GCP Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 Convergence achieved after 4 iterations GCP=C(1)*EXP(C(2)*IPD) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) 1844.284 121.1642 15.22136 0.0000 C(2) 0.000156 1.96E-05 7.966532 0.0000 ============================================================R-squared 0.446024 Mean dependent var 1844.290 Adjusted R-squared 0.442256 S.D. dependent var 1471.661 S.E. of regression 1099.070 Akaike info criteri 16.85565 Sum squared resid 1.78E+08 Schwarz criterion 16.89597 Log likelihood -1253.746 Durbin-Watson stat 0.000443 ============================================================

4. EL ESTIMADOR DE MÁXIMA VEROSIMILITUD

La obtención del estimador de máxima verosimilitud precisa de un determinadosupuesto acerca de la distribución de probabilidad del término de error.

Supongamos que , la función de verosimilitud muestral es:( )u N Iu T≈ 0 2,σ

y su logaritmo, evaluado en es:( )$, $β σ u

2

Page 69: Econometria i

68

( ) ( )ln $, $ ln ln $$

$LT T

SRu u

u

β σ π σσ

β2 222

22

1

2= − − −

( ) ( )( )SR Y f Xt tt

T

$ , $β β= −=∑

1

2

( ) ( ) ( )( ) ( ) ( )

( ) ( )( ) ( )

∂ β σ

∂β σ

∂ β

∂β σβ

∂ β

∂β

∂ β σ

∂σ σ σβ

ln $, $

$ $

$

$, $

$

ln $, $

$ $ $, $

L SRY f X

fK ecuaciones

L TY f X ecuacion

u

u u

t tt

Tt

K

u

u u u

t tt

T

2

2 21

2

2 2 41

2

1

2

10

2

1

20 1

= − = − =

= − + − =

=

=

( )$

$

σβ

u

SR

T

2 =

donde,

Por lo tanto,

! Si el parámetro no depende de ninguno de los parámetros , entonces escoger elσ u

2 β

vector de parámetros que maximice la función de verosimilitud (o su logaritmo) es$β

equivalente a escoger el vector que minimice la suma residual .$β ( )SR $β

! Si el término de error sigue una distribución de probabilidad Normal y si su varianzaes independiente de los componentes del vector , entonces los estimadores deβmáxima verosimilitud y de mínimos cuadrados, si existen, coinciden.

Las condiciones necesarias para la maximización de la función de verosimilitud son:

cuyas soluciones proporcionan las estimaciones de máxima verosimilitud del vector y elβparámetro bajo la hipótesis de normalidad.σ u

2

La última ecuación genera la estimación de máxima verosimilitud de :σ u

2

después de la estimación del vector .β

La matriz de covarianzas del estimador de máxima verosimilitud puede aproximarse,

Page 70: Econometria i

69

( )

( )

( )

∂∂β∂β σ

∂ β∂β∂β

∂∂β∂β σ

∂∂β

∂∂β

∂∂β∂σ σ

∂ β∂β

∂∂β∂σ

∂∂σ ∂σ σ

βσ

∂∂σ ∂σ σ

2

2

2 2

21

2

2 4

2

2

2

2 2 4 6

2

2 2 4

1

2

1

2

1

20

2 2

ln ln

ln ln

ln ln

L SRE

L f f

L SRE

L

L T SRE

L T

u u

t

i

t

jit

T

u u u

K

u u u u u u u

′= −

′⇒

′⎛⎝⎜

⎞⎠⎟ = −

= ⇒⎛

⎝⎜

⎠⎟ =

= ⇒⎛

⎝⎜

⎠⎟ =

=∑

( )( ) ( )

I

f f

T

uu

K

K

u

β σ σ

∂ β

∂β

∂ β

∂β

σ

,

$ $

22

4

10

02

=

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥

( )( ) ( )

Var

f f

T

uMV

u K

K

u

$, $

$ $

β σσ

∂ β

∂β

∂ β

∂β

σ

2

2

1

4

0

02

=

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

⎢⎢⎢

⎥⎥⎥

⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥

para muestras grandes, por la inversa de la matriz de información. Para calcular dicha matriz,se obtiene las derivadas de segundo orden del logaritmo de la función de verosimilitud y secalcula su esperanza matemática. Es decir:

donde, y es el gradiente de la suma residual y su matriz hessiana,( )∂ β

∂βSR ( )∂ β

∂β∂β

2SR

′formada por las derivadas de segundo orden.

De la segunda esperanza se concluye, que las estimaciones de máxima verosimilitud

del vector y del parámetro son independientes según crece el tamaño muestral.β σ u

2

La matriz de información es:

si invertimos y sustituimos los parámetros desconocidos por sus estimaciones, se obtiene:

Page 71: Econometria i

70

GCP IPD ut t t= + +β β β0 1

2

β β β0 1 230 23673 0 926281 1= − = =. .

si se cumple que:

1º el término de error siga una distribución de probabilidad normal.2º el tamaño de la muestra sea suficientemente grande.

3º la matriz sea no singular.( ) ( )∂ β

∂β

∂ β

∂β

f f$ $⎛

⎝⎜⎜

⎠⎟⎟

′⎛

⎝⎜⎜

⎠⎟⎟

En la práctica sólo se dispone de muestras finitas, por lo que la matriz anterior es sólouna aproximación a dicha matriz de covariazas.

Ejemplo 2:

Estimar el modelo siguiente:

si la condición inicial es:

Aplicando máxima verosimilitud en el Eviews se obtiene el resultado siguiente:

System: SYS01 Estimation Method: Full Information Maximum Likelihood (Marquardt) Sample: 1959:1 1996:1 Included observations: 149 Total system (balanced) observations 149 Convergence achieved after 32 iterations ============================================================= Coefficient Std. Error t-Statistic Prob. ============================================================= C(1) 51.76558 16.63088 3.112619 0.0022 C(2) 0.556083 0.035386 15.71498 0.0000 C(3) 1.058713 0.007116 148.7785 0.0000 =============================================================Log Likelihood -683.2562 Determinant residual covariance 563.0384 =============================================================Equation: GCP=C(1)+C(2)*IPD^C(3) Observations: 149 R-squared 0.999738 Mean dependent var 1844.290Adjusted R-squared 0.999735 S.D. dependent var 1471.661S.E. of regression 23.97097 Sum squared resid 83892.72Durbin-Watson stat 0.755801 =============================================================

Page 72: Econometria i

71

GCP e utIPD

tt= +β β

01

Y X u= + +α β λ

XXλ

λ

λ=

− 1

Ejemplo 1:

Estimar el modelo no lineal siguiente:

si los valores iniciales son y .β0 1844= =GCP . β1 0=

Aplicando mínimos cuadrados no lineales en el Eviews se obtiene el resultado siguiente:

System: SYS02 Estimation Method: Full Information Maximum Likelihood (Marquardt) Sample: 1959:1 1996:1 Included observations: 149 Total system (balanced) observations 149 Convergence achieved after 15 iterations ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) 1844.290 122.1742 15.09558 0.0000 C(2) 0.000156 2.69E-05 5.792957 0.0000 ============================================================Log Likelihood -1253.746 Determinant residual covariance 1191749. ============================================================Equation: GCP=C(1)*EXP(C(2)*IPD) Observations: 149 R-squared 0.446020 Mean dependent var 1844.290 Adjusted R-squared 0.442252 S.D. dependent var 1471.661 S.E. of regression 1099.074 Sum squared resid 1.78E+08 Durbin-Watson stat 0.000443 ============================================================

5. TRANSFORMACIÓN DE BOX - COX

El modelo es:

que se encuentra en un gran número de estudios recientes es la transformación Box - Cox,

Page 73: Econometria i

72

( )λ

λ

λ

λ

λ

λ

= ⇒ =

= ⇒ =

= − ⇒ =

0

1

11

X Log X

X X

XX

( )lim lim lim ln lnλ

λ

λ

λ

λ

λ

λλ

→ → →

−=

−= =

0 0 0

1 1

1

X d X dX X X

GCP IPD ut t t= + +β β β0 1

2

Si es conocido entonces es una regresión lineal que puede estimarse por mínimosλcuadrados. Por ejemplo, si:

otros valores de dan lugar a otras muchas formas funcionales diferentes.λ

Si se toma como un parámetro desconocido, la regresión se convierte en no linealλen los parámetros. Aunque ninguna transformación la reduciría a la linealidad, los mínimoscuadrados no lineales no plantean complicaciones. En la mayoría de los casos, podemosesperar que el valor estimado por mínimos cuadrados de esté entre -2 y 2. Por tanto,λhabitualmente se estima buscando en este rango con incrementos de 0.1.λ

Cuando es igual a cero, la transformación se efectúa utilizando la regla de L’Hopital:λ

Si se encuentra un mínimo de la suma de cuadrados y se desea mayor precisión, sepueden examinar las áreas a derecha e izquierda del óptimo actual con incrementos de 0.01y así sucesivamente. Una vez que se ha localizado el valor óptimo de las estimaciones deλmínimos cuadrados, el residuo medio cuadrático y este valor de constituyen lasλestimaciones por mínimos cuadrados no lineales de los parámetros (y, si se da normalidad enlos errores, las de máxima verosimilitud).

Una vez que se ha determinado el valor óptimo de , a veces es tratado como si fueseλun valor conocido en los resultados de mínimos cuadrados. Pero es una estimación de un$λparámetro desconocido; entonces los errores estándar de mínimos cuadrados siempreinfraestimarán los errores estándar asintóticos correctos.

Ejemplo 2:

Estimar el modelo siguiente:

aplicando el algoritmo de búsqueda tenemos el cuadro siguiente:

Page 74: Econometria i

73

GCP IPD ut t t= + +β β0 1 ln

GCPIPD

ut tt= +−⎛

⎝⎜⎜

⎠⎟⎟ +β β

λ

λ

0 1

1

GCP IPD ut t t= + +β β0 1

GCPIPD

ut tt= +−⎛

⎝⎜⎜

⎠⎟⎟ +β β

λ

λ

0 1

1

MODELO λ S. R.

0 34267075

0.1 27992884

0.2 22300599

0.3 17235346

0.4 12827798

0.5 9093879.

0.6 6035293.

0.7 3640734.

0.8 1887626.

0.9 744174.1

1 171552.0

1.1 126052.1

1.2 561070.0

1.3 1428841.

se elige la estimación con menor suma residual siendo el resultado:Dependent Variable: GCP Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C 104.4731 3.722355 28.06639 0.0000 (IPD^1.1-1)/1.1 0.427658 0.000700 611.2752 0.0000 ============================================================R-squared 0.999607 Mean dependent var 1844.290Adjusted R-squared 0.999604 S.D. dependent var 1471.661S.E. of regression 29.28306 Akaike info criteri 9.605227Sum squared resid 126052.1 Schwarz criterion 9.645549Log likelihood -713.5894 F-statistic 373657.4Durbin-Watson stat 0.523119 Prob(F-statistic) 0.000000============================================================

Page 75: Econometria i

74

GCPIPD

ut tt= +−⎛

⎝⎜⎜

⎠⎟⎟ +β β

λ

λ

0 1

1

Aplicando el algoritmo de búsqueda para el intervalo ]1.0,1.1[ tenemos los resultadossiguientes:

MODELO λ S. R.

1.01 144034.0

1.02 121743.7

1.03 104635.3

1.04 92662.35

1.05 85778.41

1.06 83936.76

1.07 87090.47

se elige la estimación siguiente:

Dependent Variable: GCP Method: Least Squares Sample: 1959:1 1996:1 Included observations: 149 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C 53.99643 3.089224 17.47896 0.0000 (IPD^1.06-1)/1.06 0.582905 0.000778 749.1422 0.0000 ============================================================R-squared 0.999738 Mean dependent var 1844.290Adjusted R-squared 0.999736 S.D. dependent var 1471.661S.E. of regression 23.89557 Akaike info criteri 9.198595Sum squared resid 83936.76 Schwarz criterion 9.238917Log likelihood -683.2953 F-statistic 561214.1Durbin-Watson stat 0.756293 Prob(F-statistic) 0.000000============================================================

6. CONTRASTE DE RESTRICCIONES

6.1. RESTRICCIONES LINEALES

Si ( elemento de holgura o discrepancia ) incluso si la hipótesis fueseH d R r0: $= −βcierta, no debe esperarse que el vector de discrepancia fuese exactamente igual a cero, almenos debido al error muestral. Por lo tanto, la tarea del investigador debe decidir si dicho

Page 76: Econometria i

75

( ) ( ) ( )( ) ( ) ( ) ( )

E d E R r RE r R r

Var d Var R r RVar R R X X R

q

u

= − = − = − =

= − = ′ = ′ ′−

$ $

$ $

β β β

β β σ

0

2 1

( )[ ]W d Var d d q= ′ ≈−1 2χ

vector de discrepancia es suficientemente grande como para hacer imposible el mantenimientode la hipótesis nula.

El vector de discrepancia es una función lineal del estimador , que tiene una$βdistribución normal; entonces d tendrá una distribución normal, bajo la hipótesis nula.

Si es cierta, se tiene:H0

Estos resultados sugieren la realización del contraste de utilizando el criterio deH0

Wald:

En la práctica se desconoce el valor de , por lo que se divide W, que depende tanσ u

2

sólo de la estimación de mínimos cuadrados ordinarios del vector de coeficientes, por otra

forma cuadrática que depende sólo de la estimación de ; como ambas estimaciones sonσ u

2

independientes entre sí, el cociente de ambas formas cuadráticas se distribuyen como F.

6.2. RESTRICCIONES NO LINEALES

Si y suponemos que la matriz de orden q x K, con tiene( )H R r0: β =( )∂ β

∂βR

q K<

rango igual a q (menos restricciones que parámetros, y que las restricciones no sonredundantes).

El contraste se lleva a cabo en función del tamaño del vector de discrepancia

, existiendo algunas diferencias:( )( )d R r= −$β

1º es función no lineal, entonces no es igual a , pero por la( )R $β ( )( )E R $β ( )RE $βconsistencia del estimador de mínimos cuadrados ordinarios, podemos afirmar:

( ) ( )p R R plim $ lim $β β=

2º no se puede mantener la distribución en muestras finitas para la forma cuadráticaχ 2

Page 77: Econometria i

76

( ) ( )[ ]

( ) ( )F

SR SR

q

SR

T K

F

R

q T K=

≈−

$ $

$ ,

β β

β

( ) ( ) ( ) ( )R RR$ $β β

∂ β∂β

β β≅ +⎛

⎝⎜⎜

⎠⎟⎟ −

( )( ) ( ) ( ) ( )Var R

RVar

R$ $β∂ β∂β

β β∂ β∂β

≅⎛

⎝⎜⎜

⎠⎟⎟ −

⎝⎜⎜

⎠⎟⎟

( )[ ] ( )[ ] ( )[ ]R r VarR R r q$ $ $β β β χ− −

′≈

−12

utilizada en la construcción de los estadísticos t o F. (Debido a la no linealidad).

6.3. CONTRASTE F

Si se estima el modelo por mínimos cuadrados mediante la aproximación lineal vista(serie de Taylor) la distribución del estadístico:

no es conocida en muestras finitas.

6.4. CONTRASTE WALD

La dificultad reside en el cálculo de la varianza de la diferencia , que es( )R r$β −

función no lineal del estimador . Para calcular, se obtiene una aproximación lineal:$β

siendo matriz q x K y la varianza de se aproxima:∂∂βR ( )R $β

El estadístico:

para cuyo cálculo sólo precisamos del estimador sin restringir, y que es asintóticamenteequivalente a q veces el estadístico F.

Page 78: Econometria i

CAPITULO III

VARIABLE DEPENDIENTE CUALITATIVA Y LIMITADA

1. MODELOS DE ELECCION DISCRETA

Los modelos de elección discreta consideran una variable indicadora dependiente.Esta variable indicadora podrá tomar dos o más valores, si toma sólo dos valores (ceroo uno) se trata de una variable dicotómica.

Existen numerosos ejemplos de variables explicadas, a saber:

o

Existen también muchos métodos de analizar los modelos de regresión en lo queel valor de la variable dependiente es cero o uno. Por ejemplo: el modelo de probabilidadlineal, la función discriminante, modelo probit y modelo logit.

1.1. MODELO DE PROBABILIDAD LINEAL

Se utiliza para denotar un modelo de regresión en el que la variable dependienteY es dicotómica, y toma el valor de uno o cero. Por simplicidad, asumiremos una solavariable explicativa (X).

La variable Y es una variable indicadora que denota la ocurrencia o no ocurrenciade un evento.

El modelo se describe como:

con .

La esperanza condicional , se interpreta como la

probabilidad de que ocurre el evento, dado .

El valor calculado de Y a partir de la ecuación de regresión ( ) nos da

la probabilidad estimada de que ocurre el evento, dado un valor específico para X. Enla práctica, estas probabilidades estimadas pueden encontrarse fuera del rango admisible(0, 1).

Page 79: Econometria i

78

Las razones por las cuales no se puede aplicar mínimos cuadrados ordinarios son:

1º La no normalidad de las perturbaciones.-

Dado que toma los valores de 1 o 0 entonces los errores en la

regresión tomará los valores siguientes:

En realidad los siguen una distribución binomial. Aunque el método de

mínimos cuadrados ordinarios no requiere esto, se asumen con fines de inferenciaestadística. Por lo tanto, existe un problema con la aplicación de las pruebasusuales de significancia.

El supuesto de normalidad no es tan crítico, porque las estimacionespuntuales de mínimos cuadrados ordinarios siguen siendo insesgados; además,a medida que aumenta indefinidamente el tamaño de la muestra los estimadoresde mínimos cuadrados ordinarios tienden por lo general a tener una distribuciónnormal.

Por lo tanto, para muestras grandes, la inferencia estadística de losmodelos de probabilidad lineal seguirá el procedimiento usual de mínimoscuadrados ordinarios bajo el supuesto de normalidad.

2º La varianza de la perturbación es heterocedástica.-

Las probabilidades respectivas de los eventos son:

se tiene que:

sacando factor común ( ) y simplificando nos da:

también se puede expresar de la siguiente forma:

Page 80: Econometria i

79

La varianza de es heterocedástica porque depende de la esperanza

condicional de , que depende del valor que tome .

Los estimados de mínimos cuadrados ordinarios de no serán eficientes.Es posible utilizar el procedimiento siguiente para estimar el modelo:

I.- Se estima el modelo (ecuación 1) por mínimos cuadrados ordinarios y a

continuación se calcula .

II.- Se estima por mínimos cuadrados ponderados el modelo transformadosiguiente:

se soluciona el problema heterocedástico, pero subsiste los otros.

3º La predicción cae fuera de los limites ( 0 , 1 ).-

La crítica más importante se refiere a la propia formulación, que laesperanza condicional puede estar fuera de los límites (0,1).

El gráfico de la siguiente página revela la acumulación de puntos sobre y . Es fácil que los valores predichos se encuentren fuera del

intervalo (0,1) y que los errores de predicción sean muy grandes.

Existen dos métodos para saber si los estimadores están efectivamente

entre 0 y 1; son:

Page 81: Econometria i

80

1.- Estimar el modelo de probabilidad lineal por mínimos cuadrados

ordinarios y ver si los se encuentran entre 0 y 1, si alguno de ellos es

menor a cero entonces se supone que para estos casos es cero; si son

mayores a 1, se suponen iguales a uno.

2.- Diseñar una técnica de estimación que garantice que las probabilidadescondicionales estimadas de estén entre 0 y 1. Los modelos Logit y

Probit garantizarán que todas las probabilidades estimadas se encuentrenentre los límites lógicos 0 y 1.

4º La medida de bondad de ajuste.-

El coeficiente de determinación considerado tiene un valor limitado en losmodelos de respuesta dicotómica.

El coeficiente de determinación será alto, únicamente cuando la dispersiónespecífica esté muy cercana a los puntos A y B del gráfico anterior, puesto queen este caso es fácil fijar la línea recta uniendo los dos puntos. En este caso el

predicho está muy cerca de 0 o 1.

John Aldrich y Forrest Nelson plantean que el uso del coeficiente dedeterminación como un estadístico resumen debe evitarse en aquellos modelosque contengan variables dependientes cualitativas.

1.2. EJEMPLO

El modelo especificado es:

Las variables se definen:

NOMBRE DEFINICIÓN UNIDAD DEMEDIDA

CAPAGO CAPACIDAD DE PAGO NUEVOS SOLES

CLIENTE CONDICIÓN DEL CLIENTE PUNTUAL = 1MOROSO = 0

EDAD EDAD DEL CLIENTE AÑOS

GARANTÍA MONTO DE LA GARANTÍA NUEVOS SOLES

INTERÉS TASA DE INTERÉS EFECTIVAMENSUAL

PORCENTAJE

Page 82: Econometria i

81

NOMBRE DEFINICIÓN UNIDAD DEMEDIDA

NUMCUOTA NÚMERO DE CUOTAS

PERÍODO DURACIÓN DEL PRÉSTAMO MESES

PRÉSTAMO MONTO DEL PRÉSTAMO NUEVOS SOLES

SEXO SEXO MASCULINO = 1FEMENINO = 0

VALCUOTA VALOR DE LA CUOTA NUEVOS SOLES

Para estimarlo se dispone de información estadística recopilada de una instituciónfinanciera del Departamento de Piura.

El método de estimación es mínimos cuadrados ponderados y el procedimientoa seguir es el siguiente:

1º Estimar el modelo por mínimos cuadrados ordinarios

Se escribe en el Eviews:LS CLIENTE C EDAD PRESTAMO SEXO PERIODO

a continuación se oprime ENTER y nos da el resultado siguiente:

Dependent Variable: CLIENTE Method: Least Squares Sample: 1 60 Included observations: 60 =========================================================== Variable Coefficient Std. Error z-Statistic Prob. =========================================================== C -0.815473 0.306770 -2.658258 0.0103 EDAD 0.014550 0.005161 2.819315 0.0067 PRESTAMO 1.89E-05 9.95E-06 1.895651 0.0633 SEXO 0.159441 0.110854 1.438297 0.1560 PERIODO 0.064383 0.022997 2.799581 0.0070===========================================================R-squared 0.332861 Mean dependent var 0.516667Adjusted R-squared 0.284341 S.D. dependent var 0.503939S.E. of regression 0.426316 Akaike info criteri 1.212381Sum squared resid 9.995971 Schwarz criterion 1.386910Log likelihood -31.37144 F-statistic 6.860387Durbin-Watson stat 1.511575 Prob(F- statistic) 0.000149===========================================================

Page 83: Econometria i

82

2º Se realiza la estimación de la probabilidad de la siguiente forma:

Abrir la ecuación Procs Forecast OK y se muestra un gráfico y el⇒ ⇒ ⇒software crea un icono con el nombre que se le colocó a la estimación(CLIENTEF).

Para observar los resultados de la variable CLIENTEF se da dos clic ypaquete nos muestra lo siguiente:

CLIENTEF==========================================================

Modified: 1 60 // fit(f=actual) clientef 1 0.417364 1.104751 0.155492 0.803627 0.554091 6 0.814965 0.515421 0.486014 0.909758 0.899076 11 0.475652 0.765374 0.770710 1.321578 0.987106 16 0.536256 0.575847 1.014905 0.341672 0.405989 21 0.230938 0.643846 0.488985 0.437800 0.606510 26 0.259805 0.262450 0.206271 0.085420 0.620479 31 0.717948 -0.136817 0.397171 0.315820 0.243069 36 0.389929 0.804237 0.755200 0.045541 0.188897 41 0.618349 0.155769 0.417060 0.830059 0.278586 46 1.075758 0.486799 0.248942 0.408926 0.518848 51 0.317095 0.186445 0.067943 0.465541 0.483412 56 0.673622 0.643638 0.507839 0.651220 0.545000==========================================================

3º Estimamos la varianza generándola de la siguiente forma:GENR W = CLIENTEF * ( 1 - CLIENTEF )

y el Eviews nos da el siguiente resultado:

W=====================================================

Modified: 1 60 // w=clientef*(1-clientef) 1 0.243171 -0.115724 0.131314 0.157811 0.247074 6 0.150797 0.249762 0.249804 0.082099 0.090738 11 0.249407 0.179577 0.176716 -0.424990 0.012728 16 0.248686 0.244247 -0.015127 0.224932 0.241162 21 0.177606 0.229308 0.249879 0.246131 0.238656 26 0.192306 0.193570 0.163723 0.078124 0.235485 31 0.202498 -0.155536 0.239426 0.216078 0.183987 36 0.237884 0.157440 0.184873 0.043467 0.153215 41 0.235993 0.131505 0.243121 0.141061 0.200976 46 -0.081498 0.249826 0.186970 0.241706 0.249645 51 0.216546 0.151683 0.063327 0.248813 0.249725 56 0.219855 0.229368 0.249939 0.227132 0.247975=====================================================

Page 84: Econometria i

83

4º Por último, se estima el modelo transformado por mínimos cuadrados ordinarios,es decir, se aplica mínimos cuadrados ponderados. El comando que se aplica esel siguiente:

Quick Estimate Equation escribir en la pantalla en blanco lo siguiente:⇒ ⇒CLIENTE C EDAD PRESTAMO SEXO PERIODO, luego clic en OPTIONS

se marca WEIGHTED LS / TSLS y en Weight se escribe: 1 / SQR( W ) ⇒ ⇒OK OK y se muestra el siguiente resultado:⇒

Dependent Variable: CLIENTE Method: Least Squares Sample: 1 60 Included observations: 55Excluded observations: 5Weighting series: 1/SQR(W) ========================================================== Variable Coefficient Std. Error z-Statistic Prob. ========================================================== C -0.861520 0.236827 -3.637769 0.0007 EDAD 0.014138 0.005080 2.782852 0.0076 PRESTAMO 2.84E-05 1.09E-05 2.597112 0.0123 SEXO 0.187273 0.106147 1.764279 0.0838 PERIODO 0.064795 0.019214 3.372355 0.0014==========================================================Weighted Statistics==========================================================R-squared 0.639966 Mean dependent var 0.496512Adjusted R-squared 0.611163 S.D. dependent var 0.632757S.E. of regression 0.394567 Akaike info criteri 1.064452Sum squared resid 7.784153 Schwarz criterion 1.246937Log likelihood -24.27243 F-statistic 13.15823Durbin-Watson stat 1.394854 Prob(F- statistic) 0.000000==========================================================Unweighted Statistics==========================================================R-squared 0.290121 Mean dependent var 0.490909Adjusted R-squared 0.233330 S.D. dependent var 0.504525S.E. of regression 0.441760 Sum squared resid 9.757613Durbin-Watson stat 1.391563==========================================================

Las variables edad, préstamo y periodo son significativas al 5% (Prob < 0.05) yla variable sexo es significativa al 10 % (Prob < 0.10) y el modelo es estadísticamentesignificativo al 5 % (Prob < 0.05).

Page 85: Econometria i

84

Se predice dentro de la muestra con la instrucción siguiente:

Abrir la ecuación Procs Forecast OK y se muestra un gráfico y el software⇒ ⇒ ⇒crea un icono con el nombre que se le colocó a la estimación (CLIENTEF1).

Para observar los resultados de la variable CLIENTEF1 se da dos clic y paquetenos muestra lo siguiente:

CLIENTEF1========================================================= Modified: 1 60 // modproblin.fit(f=actual) clientef1 1 0.453183 1.264643 0.135592 0.836835 0.598836 6 0.850146 0.519971 0.488047 1.081373 0.993891 11 0.530495 0.822073 0.907713 1.590984 0.994447 16 0.531559 0.572147 0.991846 0.311970 0.395700 21 0.185995 0.640793 0.466289 0.421358 0.568752 26 0.200522 0.216839 0.177498 0.057164 0.580712 31 0.705757 -0.186881 0.349757 0.259422 0.188732 36 0.333220 0.805080 0.713630 0.020425 0.178108 41 0.585508 0.103903 0.390143 0.822291 0.239000 46 1.073549 0.468637 0.223544 0.397997 0.464635 51 0.294014 0.161586 0.019346 0.446526 0.426291 56 0.618380 0.623329 0.494666 0.619459 0.525189=========================================================

y los resultados se comparan con los valores observados de la variable endógena,obteniendose 42 predicciones correctas ( 20 para CLIENTE = 1 y 22 PARA CLIENTE= 0) y nos da un Coeficiente de Bondad de Conteo de 70 %.

1.3. MODELO LOGIT Y PROBIT

Un enfoque alternativo es suponer un modelo de regresión:

no se observa ( se conoce como variable " latente " ).

Lo que se observa es una variable indicadora definida por:

La diferencia entre la especificación (2) y el modelo de probabilidad lineal es queen este último se analizan las variables dicotómicas tal como son, en tanto que en (2) sesupone la existencia de una variable latente subyacente para la que se observa una

Page 86: Econometria i

85

evidencia dicotómica. Ejemplo:

1º la persona tiene o no empleo.

la propensión o capacidad de encontrar empleo.

2º si la persona compra o no un automóvil.

el deseo o capacidad de adquirir un automóvil.

por lo tanto, las variables explicativas de (2) contendrán variables que expliquen amboselementos.

Supongamos que , esto nos permite fijar la escala de .

Combinando (2) y (3) obtenemos:

donde F es la función de distribución acumulada de u.

Si la distribución de u es simétrica, entonces , la expresiónanterior se puede escribir:

Los Observados son sólo realizaciones de un proceso binomial cuyas

probabilidades están dadas por (4) y que varían de un ensayo a otro (de pendiendo de), entonces la función de verosimilitud se puede escribir:

La forma funcional para F en (4) dependerá de la suposición en torno al términode error u.

Se ha creado un problema de estimación porque es no lineal no solamente en

sino también en los ; entonces, no se puede estimar mediante mínimos cuadrados

ordinarios. En esta situación, es preciso recurrir al método de máxima verosimilitud paraestimar los parámetros.

El método de máxima verosimilitud consiste en la maximización de la función deverosimilitud (ecuación 5) para el modelo LOGIT y PROBIT y ésto se logra por mediode métodos no lineales de estimación. La función de verosimilitud es cóncava (no tiene

Page 87: Econometria i

86

Cliente X ui i i= + +α β

múltiples máximos) y, por lo tanto, cualquier valor inicial de los parámetros será útil. Escostumbre comenzar las iteraciones para el modelo logit y probit con los estimados delmodelo de probabilidad lineal.

Si la información disponible es sobre familias individuales, donde si una

familia posee una casa y si no la posee; entonces el modelo a estimar es (5) por

el método de máxima verosimilitud.

1.3.1. CONSTRUCCIÓN DE UN MODELO LOGIT O PROBIT

Los requisitos para la construcción de un modelo logit o probit son:

1º Contar con una muestra representativa de clientes cumplidos e incumplidos, cuyotamaño mínimo se establece vía criterios estadísticos.

2º Contar con suficiente información de los clientes contenida en sus solicitudes decrédito o expedientes.

3º Seleccionar las posibles variables explicativas de la probabilidad de default de losclientes, en base al conocimiento o experiencia previa y a procedimientosestadísticos (test de significancia individual).

4º Escoger el modelo más apropiado en base a tests estadísticos sobre la "bondad deajuste" o "calidad predictiva" del modelo.

El procedimiento a seguir es:

1º El significado de las variables aparece en el ítem 1.2.

2º Buscar el mejor modelo explicativo de la probabilidad de default (cumplimiento)de los clientes, en base al siguiente procedimiento general:

2.1. Realización de regresiones bivariables y selección de variables explicativas segúnsigno y significancia estadística individual (escogemos las de probabilidad menordel 10 por ciento).

Se estiman varias regresiones de la siguiente forma:

para seleccionar la variable se requiere analizar: el signo correcto, la significancia

de (si es altamente significativo, significativo o relativamente significativo)β

y el (debe estar entre 0.2 y 0.6).R2

2.2. Comparación de correlaciones entre variables a fin de eliminar el problema de

Page 88: Econometria i

87

multicolinealidad. Entre las variables correlacionadas optamos por la de mayorR2 de Mc Fadden.

Una vez identificadas las variables más relevantes a partir de modelosbivariables, podemos descartar algunas de ellas en base a su correlaciones.Variables altamente correlacionadas (con coeficientes de correlación mayores a0.5) resultan redundantes, es decir, basta con que me quede con una de ellas enel modelo, ya que si las incluyo todas sus significancias estadísticas individualestienden a ser bajas (no se puede distinguir el impacto de cada una de ellas sobrela variable dependiente). El criterio práctico es eliminar las variablescorrelacionadas con menor significancia estadística individual en las regresionesbivariables, con menor R2 (Mc Fadden).

Para obtener la Matriz de Correlaciones entre variables, aplico:Quick/Group Statistics/Correlations

y se escribe el nombres de las variables seleccionadas en el ítem anterior.

2.3. Construcción de modelos multivariables en sus versiones logit, probit y linealincorporando las variables escogidas luego de los pasos 1 y 2. Los modelos sevan perfilando para dejar sólo las variables estadísticamente significativas(probabilidad menor del 10 por ciento).

Con las variables explicativas escogidas, luego de los pasos 2.1. y 2.2. seestima el modelo en su versión logit, probit o lineal. El modelo se perfila paradejar sólo las variables con signos adecuados y estadísticamente significativas(prob < 0.10).

2.4. Evaluación de los modelos alternativos en base a siguientes criterios arrojadospor el programa E-views:

1.- Signo correcto de los coeficientes.2.- Significancia estadística individual de los parámetros de acuerdo al

z-statistic y su probabilidad correspondiente.3.- Significancia conjunta del modelo.4.- Bondad de ajuste en base a R2 de Mc Fadden, Expectation-Prediction

Table, Goodness-of-Fit Test (Hosmer-Lemeshow).

A) Bondad de ajuste: La regla práctica nos dice que este valor debeencontrarse entre 0.2 y 0.6 para considerarseaceptable en el contexto de la modelación deprobabilidades.

Se han sugerido varias medidas de bondad de ajuste paraeste tipo de modelos, por ejemplo:

1.- La correlación entre CALF y CALFF al cuadrado:

Page 89: Econometria i

88

2.- Basada en la suma de cuadrados residual:

3.- Amemiya:

4.- Mc - Fadden:

= Función de Máxima Verosimilitud con

respecto a todos los parámetros. = Función de Máxima Verosimilitud cuando se

hace con la restricción

5.- Cragg - Uhler:

6.- R2 de conteo:

B) Expecation-Prediction Table: Esta prueba nos permite averiguarcuál es el porcentaje de acierto en laspredicciones que obtiene el modelo.

Page 90: Econometria i

89

C) Goodness-of-Fit Test: (test de Hosmer-Lemeshow). Esta pruebaparte de agrupar las observaciones enquantiles y evalúa el desempeño del modeloen cada uno de ellos en términos del númerode observaciones que predice el modelo quedeben ubicarse en cada quantil vs el númerode observaciones real.

Por defecto, me indica que lainformación se va a agrupar en 10 quantiles ogrupos según niveles. Lo ideal es que elnúmero total de observaciones por quantil seael más grande posible (prueba para muestrasgrandes).

Se recomienda hacer esta prueba conel mayor número posible de observacionesposible en cada quantil.

5.- Criterio de Hannan Quinn (por ser una "función de pérdida", convieneminimizarlo frente a los modelos alternativos).

Este es un criterio para comparar modelos alternativos. La regla esescoger el modelo con menor H-Q (no se aplica al MLP).

6.- Curva de Respuesta de Probabilidad de cada variable explicativa del

modelo.

Esta prueba es ratificatoria del test de significancia estadísticaindividual de las variables explicativas. Nos permite evidenciar medianteun gráfico ad hoc si cada una de estas variables tiene poder paradiscriminar entre buenos y malos pagadores, partiendo de un valor "c"como parámetro de corte entre quienes se consideran dentro de ambascategorías; usualmente este valor se sitúa en 0.5, es decir, quienes tienenuna probabilidad de cumplir menor o igual que 0.5 (50 por ciento), seasumen como malos clientes y los que tienen una mayor, buenos clientes.

2.5. Selección del modelo final en base a la perfomance relativa de éste al comparar,entre modelos alternativos, los resultados de los test sugeridos en el ítemanterior.

Lo primero que cabe destacar es que, en el caso del MLP, los efectosmarginales de las variables explicativas son constantes para todos los individuos,mientras que en los casos del logit y el probit, estos efectos son diferentes paracada individuo, dependiendo de los valores de las variables explicativas que locaracterizan.

Usualmente, en los modelos logit y probit se calculan los efectos

Page 91: Econometria i

90

marginales de una variable o regresor para cada individuo, a fin de tener una ideadel rango de variación de dichos efectos y se asume que el promedio de estosefectos individuales es una buena aproximación al "efecto marginal global" dela variable (si se quiere tener un número - resumen), lo cual, desde luego, partede la premisa de que se cuenta con una muestra suficientemente representativa.

Pese a que los parámetros j de cada regresor, en los modelos logit yprobit, no nos miden, por sí solos el, efecto marginal de dicho regresor, si nosindican la dirección (signo) del cambio inducido en la probabilidad por lavariable explicativa.

2.6. Una vez elegido el modelo final, cálculo de los efectos marginales respectivos

Los efectos de los cambios en las variables explicativas sobre lasprobabilidades de que cualquier observación pertenezca a uno de los dos grupos,son proporcionados por:

donde: y es la función de densidad normal

estándar.

1.3.2. MODELO LOGIT PARA DATOS AGRUPADOS

Si la distribución acumulada de es logística, se tiene el llamado modelo

LOGIT, es decir:

donde

Las probabilidades son:

Page 92: Econometria i

91

El cociente entre ambas probabilidades es:

aplicando logaritmo neperiano, nos da:

En el modelo de probabilidad lineal se supone como función lineal de las

variables explicativas; aquí, la razón logarítmica de momios o logit es una función linealde las variables explicativas.

Tiene las siguientes características:

1.- Dado que P va de 0 a 1, es decir, a medida que Z varía entre y el logitestá entre y . En otras palabras, aunque las probabilidades se encuentranentre 0 y 1, los logit no tienen estos límites.

2.- Aunque el logit es lineal en X, las probabilidades mismas no lo son, en contrastecon el modelo de probabilidad lineal, donde las probabilidades aumentanlinealmente con X.

3.- La interpretación del modelo logit es: mide el cambio en logit por un cambio

unitario en X, es decir, nos muestra cómo varía la factibilidad del logit en favorde poseer una casa a medida que X cambia en una unidad.

Si es relativamente grande y si cada observación en una clase de , está

distribuida en forma independiente como una variable binomial, entonces:

por lo tanto, el término de perturbación en el modelo logit es heterocedástico y el métodode estimación adecuado es mínimos cuadrados ponderados.

El procedimiento para estimar una regresión logit (7) es:

Page 93: Econometria i

92

( 1 ) Para cada nivel de , se calcula la probabilidad estimada de poseer una casa

como .

( 2 ) Para cada valor de , obténgase el logit como:

( 3 ) Para solucionar el problema de heterocedasticidad, se transforma así:

donde las ponderaciones , porque se distribuye normal

con varianza igual a si es suficientemente grande.

( 4 ) Estimar el modelo transformado utilizando mínimos cuadrados ordinarios (es unmodelo sin intercepto).

( 5 ) Establecer los intervalos de confianza y/o las pruebas de hipótesis en el marcousual de mínimos cuadrados ordinarios, pero manteniendo en mente que todas lasconclusiones serán validas, si la muestra es razonablemente grande. Parapequeñas muestras los resultados estimados deben interpretarse cuidadosamente.

1.3.3. MODELO PROBIT PARA DATOS AGRUPADOS

Si los errores siguen una distribución normal, se tiene un modelo PROBIT (o

NORMIT), es decir:

donde es un índice de conveniencia no observable que está determinado por una o

varias variables explicativas, así:

y t es la variable normal estandarizada, es decir, t se distribuye .

Es razonable suponer que para cada familia hay un nivel crítico o umbral del

índice, , tal que si excede a , ocurre el evento, de lo contrario no sucederá. El

Page 94: Econometria i

93

umbral al igual que no es observable, pero si se supone que esta distribuido

normalmente con la misma media y varianza. Por lo tanto, es posible estimar losparámetros y los valores del índice no observable. Es decir, la probabilidad sería:

Como representa la probabilidad de que un evento ocurra, P se mide por el

área de la curva normal estándar desde hasta . Para obtener la información de

, como también de y , tomamos el inverso de la función de distribución

probabilística acumulada normal.

Se ha creado un problema de estimación porque es no lineal no solamente en

sino también en los ; entonces, no se puede estimar mediante mínimos cuadrados

ordinarios.

Si es relativamente grande y si cada observación en una clase de , está

distribuida en forma independiente como una variable binomial, entonces:

por lo tanto, el término de perturbación en el modelo probit es heterocedástico y elmétodo de estimación adecuado es mínimos cuadrados ponderados.

El procedimiento para estimar una regresión probit es:

( 1 ) Para cada nivel de , se calcula la probabilidad estimada de poseer una casa

como .

( 2 ) Dado , obténgase el índice de utilidad como:

( 3 ) Para solucionar el problema de heterocedasticidad, se transforma así:

Page 95: Econometria i

94

donde las ponderaciones , porque se distribuye normal

con varianza igual a si es suficientemente grande.

( 4 ) Estimar el modelo transformado utilizando mínimos cuadrados ordinarios (es unmodelo sin intercepto).

( 5 ) Establecer los intervalos de confianza y/o las pruebas de hipótesis en el marcousual de mínimos cuadrados ordinarios, pero manteniendo en mente que todas lasconclusiones serán validas, si la muestra es razonablemente grande. Parapequeñas muestras los resultados estimados deben interpretarse cuidadosamente.

Si la información esta agrupada o replicada (observaciones repetidas), entoncesse puede obtener información sobre la variable dependiente y el índice de utilidad; porlo tanto, el modelo a estimar se aplica mínimos cuadrados ponderados.

1.3.4. MODELO LOGIT VERSUS MODELO PROBIT

Desde el punto de vista teórico, la diferencia entre ambos modelos es ladistribución de probabilidades (normal para el modelo probit y logística para el modelologit); ambas distribuciones están muy próximas entre sí, excepto en los extremos, lalogística tiene colas ligeramente más planas, es decir, la curva normal o probit se acercaa los ejes más rápidamente que la curva logística. Por esta razón, no es probable obtenerresultados muy diferentes, a menos que las muestras sean grandes.

Sin embargo, los estimados de los parámetros de ambos métodos no son

directamente comparables; porque la distribución logística tiene una varianza y la

distribución normal tiene una varianza de 1. Entonces ambos coeficientes se relacionande la siguiente forma:

Amemiya sugiere multiplicar los estimados LOGIT por 1/1.6 = 0.625 porque estatransformación produce una aproximación más cercana entre la distribución logística yla función de distribución normal estándar. Es decir, la relación sería:

También sugiere que los coeficientes del modelo de probabilidad lineal

Page 96: Econometria i

95

y los coeficientes del modelo logit se relacionan así:

Aplicando regla de tres simple logramos encontrar la relación entre loscoeficientes del modelo probit y el modelo de probabilidad lineal, que nos da:

Si se tiene muestras de tamaños desiguales, no se afectan la estimación de loscoeficientes de la variables explicativas del modelo logit, pero si se afecta el términoconstante. Este resultado no es valido para el modelo probit ni para el modelo deprobabilidad lineal. Si el modelo estimado se utiliza para propósitos de predicción, esnecesario ajustar el término constante.

Desde el punto de vista práctico, es generalmente utilizado con preferencia elmodelo logit sobre el modelo probit.

2. MODELOS DE ELECCIÓN MÚLTIPLE

Existen varias formas en que se pueden analizar este problema:

1º Con datos no ordenados: se utiliza cuando las alternativas que presenta lavariable endógena no indican ningún orden. Puedenser:

1.1. Multinomial, se utiliza cuando los regresores del modelo hacen referencia a lasobservaciones muestrales, por lo que varían entre observaciones pero no entrealternativas.

1.2. Condicional, se utiliza cuando los regresores del modelo hacen referencia a lasalternativas, por lo que sus valores varían entre alternativas pudiendo hacerlo ono entre observaciones.

2º Con datos ordenados: se utiliza cuando las alternativas de la variableendógena representan un orden entre ellas.

Generalizaremos los resultados anteriores a casos en los que los individuos hacenelecciones entre tres o más alternativas mutuamente excluyentes.

Un modelo multinomial de respuesta cualitativa se define de la siguiente forma:

Page 97: Econometria i

96

( ) ( )P Y j F X i n y j mi Y i= = = =* , ; , ,..., , ,..., .θ 1 2 1 2

Ysi Y j

si Y j i n y j mij

i

i i

= =

= ≠ = =

⎧⎨⎩

1

0 1 2 1 2; , ..., , ,..., .

ln lnL Y Fij

j

m

i

n

ij

i

===∑∑

01

∂θ

ln.

L= 0

( ) ( )P Y j X p S j= =,θ

Asume que la variable dependiente toma valores {0, 1, 2, ..., }, entoncesYi mi + 1 miel modelo multinomial vendrá dado:

donde y son vectores de variables independientes y parámetros respectivamente.X * θDe esta forma, depende de un i en particular cuando los individuos tienen diferentesmiconjuntos de elección. Para definir el estimador de en el modelo usualmente seθ

definen variables binarias, de la forma:Σ in = 1 ( )mi + 1

La función de verosimilitud viene definida como:

donde el estimador insesgado de se define como una solución a la ecuación:$θ θ

Los modelos multinomiales de respuestas cualitativas se pueden clasificar enmodelos ordenados y no ordenados.

2.1. MODELOS ORDENADOS

Un modelo ordenado se define como:

para alguna medida de probabilidad p, sobre X y , y una secuencia finita de intervalosθ

sucesivos que depende sobre X y tal que .{ }S j θ U Sj j = ℜ

En los modelos ordenados, los valores que Y toma, corresponden a una particiónsobre la línea real. A diferencia de modelo no ordenado, donde la particióncorrespondería a particiones no sucesivas sobre la línea real o a particiones dedimensiones mayores sobre el espacio euclidiano. En la mayoría de las aplicaciones, elmodelo ordenado toma la forma:

Page 98: Econometria i

97

( ) ( ) ( )P Y j X F X F X j mj j j j m= = − ′ − − ′ = = −∞ ≤ = ∞+ + +, , ; , ,..., ; ; ;α β α β α β α α α α1 0 1 10 1

( ) ( ) ( )P Y j X X i n y j mi ijk

m

ij i

i

= = ′⎡

⎣⎢

⎦⎥ ′ = =

=

∑ exp exp ; , ,..., , ,...,β β0

1

1 2 0 1

U con jij ij ij= + =µ ε , , ,0 1 2

( ) ( )( ) ( )

( )( )

( ) ( ) ( )

P Y P U U U U

P Y P

P Y

i i i i i

i

i

i

i i i

= = > >

= = + − > + − >

= =+ +

2

2

2

2 1 2 0

2 2 1 1 2 2 0 0

2

0 1 2

,

,

exp

exp exp exp

ε µ µ ε ε µ µ ε

µ

µ µ µ

Para alguna distribución F, se puede definir un modelo Logit ordenado o Probitordenado.

2.1.1. MODELO LOGIT

El modelo logit multinomial se define como:

Mc Fadden (1974) considera el siguiente modelo multiecuacional derivado delproblema del consumidor. Considere a un individuo i cuyas utilidades están asociadascon tres alternativas, de la forma siguiente:

donde no es una función estocástica sino deterministica. Por otro lado, es el usualU ij ε ijtérmino aleatorio de error. De esta forma, el individuo elige aquella alternativa en la queobtiene la mayor utilidad. El multinomial logit se puede derivar del problema de

maximizar la utilidad sí y sólo sí los son independientes y la función de distribuciónε ij

de viene dada por De esta manera, la probabilidad de que el iε ij ( )[ ]exp exp .ε ijindividuo elija una alternativa j, será:

y tomará una forma parecida a la definición del modelo logit multinomial sí hacemos

y .µ µ βi i iX2 0 2− = ′ µ µ βi i iX1 0 1− = ′

2.2. MODELOS NO ORDENADOS

Se enfocara el caso en que las alternativas no están ordenadas.

Page 99: Econometria i

98

P X P X P Xi i i i i i1 1 1 2 2 2 3 3 3= + = + = +α β α β α β

( )Prob Y j Pe

e

i ij

X

X

j

j

j i

j i

= = =′

=

β

β

0

1

Pe e

Pe

e e

Pe

e e

X X

X

X X

X

X X

i i

i

i i

i

i i

0 0

0

1

1 1

1

1 1 2 2

1 1

1 1 2 2

1 1

1 1 2 2

=+ +

=+ +

=+ +

+ +

+

+ +

+

+ +

α β α β

α β

α β α β

α β

α β α β

2.2.1. MODELO LINEAL DE PROBABILIDAD

Si asumimos que hay tres opciones j = 1, 2, 3, escribimos el modelo:

es la probabilidad de que el individuo i elegirá la j ésima opción, mientras que Pji X ies el valor de X para el j ésimo individuo.

Para estimar cada una de las tres ecuaciones en el modelo por mínimos cuadradosordinarios, no es necesario ejecutar las tres regresiones lineales de probabilidad.

Dado que las probabilidades estimadas están restringidas para sumar 1, losinterceptos estimados para sumar 1 y los parámetros de pendiente para sumar 0.

Entonces, sólo se necesita ejecutar dos de las tres regresiones de mínimoscuadrados. La solución para los parámetros de la tercera ecuación se deriva de lasprimeras dos.

2.2.2. MODELO LOGIT

En este tipo de modelos las alternativas de la variable respuesta indican lapertenencia de las observaciones a un determinado grupo sin incorporar informaciónordinal. La formulación de un Logit Multinomial queda recogida a través de la siguienteecuación:

Donde para el caso sencillo de un modelo en el que la variable endógena presentatres posibles alternativas de elección y sólo existe una variable explicativa en lamodelización, la probabilidad asociada a cada una de las alternativas posibles de eleccióntomarían las siguientes expresiones:

con .P P P0 1 2 1+ + =

Page 100: Econometria i

99

( ) ( )( )

f X X af X

ob X a> =

>Pr

( ) ( )Prob X aa

> = −−⎛

⎝⎜⎞⎠⎟

= −1 1Φ Φµ

σα

( ) ( )( )

( )( )

( ) ( )f X X a

f X eXX

> =−

=−

=

⎛⎝⎜

⎞⎠⎟

−⎛⎝⎜

⎞⎠⎟

− − − −

1

2

1

1

1

21

2 2

2

2

Φ Φ Φα

πσ

α

σφ

µ

σ

α

µ

σ

3. MODELO CON VARIABLE DEPENDIENTE LIMITADA

Existen un gran número de datos cuya observación nos muestra que estánlimitados o acotados de alguna forma. Este fenómeno lleva a dos tipos de efectos: eltruncamiento y la censura.

El efecto de truncamiento ocurre cuando la muestra de datos es extraídaaleatoriamente de una población de interés, por ejemplo, cuando se estudia el ingreso yla pobreza se establece un valor sobre el cual el ingreso se encuentra por encima o pordebajo del mismo.. De esta forma, algunos individuos podrán no ser tenidos en cuenta.

Por otro lado, censurar es un procedimiento en el cual los rangos de una variableson limitados a priori por el investigador; este procedimiento produce una distorsiónestadística similar al proceso de truncamiento.

3.1. MODELO TRUNCADO

Una distribución truncada es la parte de una distribución no truncada antes odespués de un valor específico; imagínese por ejemplo que nosotros deseamos conocerla distribución de los ingresos anteriores a 100,000 o el número de viajes a una zonamayores de 2, ésta será tan sólo una parte de la distribución total.

Si una variable continua aleatoria X, tiene una función de densidad deprobabilidades, y a es una constante, entonces:

si X tiene una distribución normal con media y desviación estándar , entonces:µ σ

donde y es función de densidad acumulativa, entonces laαµ

σ=

−a( )Φ α

distribución normal truncada será:

donde será la función de densidad de probabilidades normal estándar. La distribuciónφnormal estándar truncada con y para a igual a -0.5, 0 y 0.5, será:µ = 0 σ = 1

Page 101: Econometria i

100

[ ] ( )E X truncamiento = +µ σλ α

[ ] ( )( )var X truncamiento = −σ δ α2 1

( )( )

( )

( )( )( )

λ αφ α

α

λ αφ α

α

=−

>

=−

−<

1

1

Φ

Φ

si el truncamiento ocurre en X a

si el truncamiento ocurre en X a

( )( ) ( )ln ln ln lnLn

Y Xa X

i ii

i

n

i

=−

+ − − ′ − −− ′⎛

⎝⎜⎞⎠⎟

⎣⎢⎤

⎦⎥=∑∑

22

1

212

2

2

1

π σσ

ββ

σΦ

Si con constante, entonces la media vendrá dada por:[ ]X N≈ µ σ, 2 µ

y la varianza por:

donde . Por otro lado, nosotros observamos que:( )α µ σ= −a /

Tomando el logaritmo de la distribución normal truncada, y al realizar la suma delos logaritmos de estas densidades, se obtiene:

Las condiciones necesarias para maximizar ln L serán:

Page 102: Econometria i

101

( )

∂β

β

σ

λ

σ

∂σ σ

β

σ

α

σ

ln

ln

L Y XX

L Y X X

i i i

i

n

i

i i i i

i

n

=− ′

−⎡⎣⎢

⎤⎦⎥

=

=−

+− ′

−⎡

⎣⎢⎢

⎦⎥⎥

=

=

=

21

2 2

2

4 21

0

1

2 2 20

Y si Y Y Y si Y= ≤ = >0 0 0* * *

( ) ( )Pr Pr *ob Y ob Y= = ≤ =−⎛⎝⎜

⎞⎠⎟

= −−⎛⎝⎜

⎞⎠⎟

0 0 1Φ Φµ

σ

µ

σ

donde y .αβ

σi

i ia X=

− ( )( )

λφ α

αi

i

i

=−1 Φ

3.2. MODELO CENSURADO

Un procedimiento normal con datos microeconómicos, consiste en censurar lavariable dependiente. Cuando la variable dependiente es censurada, los valores en undeterminado rango son todos transformados a un valor singular. De esta forma, sidefinimos una variable aleatoria y transformada de la variable original como:

El gráfico de la distribución censurada es:

La distribución correspondiente a será: ( )Y N* ,≈ µ σ 2

si y tiene la densidad de , entonces la distribución tiene partes discretas yY * > 0 Y *

Page 103: Econometria i

102

( ) ( )( )E Y a= + − +Φ Φ1 µ σλ

( ) ( ) ( ) ( )[ ]Var Y = − − + −σ δ α λ2 21 1Φ Φ

yx u si m

ii i i=

+ + ≥⎧⎨⎩

β β0 1 y

m si y < mi*

i i*

i

continuas, donde la probabilidad total será de 1como se requiere. Para lograr esto, seasigna la probabilidad total en la región censurada al punto de censuramiento.

La media de una variable censurada vendrá dada por:

y la varianza:

d o n d e : ; ;( ) ( )Φ Φ Φa

ob Y a−⎡

⎣⎢⎤⎦⎥

= = ≤ =µ

σα Pr * λ

φ=

−1 Φ

.δ λ λα= −2

3.3. MODELO TOBIT

El modelo Tobit se originó en el estudio de consumo de bienes no perecederos porparte de las economías domésticas; el importe dedicado al consumo de estos bienes seanula en el caso de familias que no pueden dedicar un mínimo de renta a la adquisiciónde este tipo de productos. Así, el modelo Tobit es de la forma:

en el que el valor es el límite mínimo por debajo del cual la variable endógena nomipuede caer. Este modelo puede considerarse como uno de elección binaria, en el que lavariable endógena toma valores dependientes de las exógenas o bien un mínimo que nodepende de éstas.

Supongamos que se observa si , y no si . Entonces, se

definirá como:

asume que .

Page 104: Econometria i

103

Se le llama modelo Tobit o probit de Tobin o modelo censurado de regresiónnormal, debido a que se censura (no se permite observar) algunas observaciones de

(aquellas que ). El objetivo es estimar los parámetros y .

Ejemplo

1.- Se especifica la demanda de automóviles de la siguiente forma:

donde Son los gastos en automóviles y x el ingreso. En la muestra habríaun gran número de observaciones para las cuales los gastos en automóviles soncero. El modelo censurado de regresión se puede especificar como:

2.- Si existen observaciones sobre varias personas, de las cuales sólo algunas tienenempleo, podemos especificar el modelo:

Caso horas trabajadas,•

Caso salarios,•

Método de estimación

La estimación de y mediante mínimos cuadrados ordinarios no se puedeβ σutilizar con observaciones positivas , pues cuando se escribe el modelo:

el término de error no tiene media cero. Dado que las observaciones con

se omiten, esto supone que sólo se incluyen en la muestra las observaciones para las

Page 105: Econometria i

104

cuales . Por lo tanto, la distribución de es normal truncada y su media no

es cero. La Distribución normal truncada es:

donde la función de densidad estándar normal es:

y la función de distribución acumulada estándar normal es:

Un método de estimación que se sugiere comúnmente es el de máximaverosimilitud, que es el siguiente:

si maximizamos la función de verosimilitud con respecto a y , obtendremos losβ σestimados de máxima verosimilitud de estos parámetros.

Los modelos Tobit se refiere a modelos censurados o truncados donde el rangode la variable dependiente se restringe de alguna forma.

Dado el creciente uso de los modelos tipo Tobit, Amemiya realizó la laboriosatarea de clasificar, los modelos Tobit de acuerdo con similitudes en la función deverosimilitud. La caracterización de los tipos de modelos Tobit es la siguiente:

Page 106: Econometria i

105

TIPO VARIABLE DEPENDIENTE

Y1 Y2 Y3

1 CENSURADO - -

2 BINARIO CENSURADO -

3 CENSURADO CENSURADO -

4 CENSURADO CENSURADO CENSURADO

5 BINARIO CENSURADO CENSURADO

Page 107: Econometria i

y x x x ut t t k kt t= + + + +β β β1 1 2 2 ....

y X ut t t= +β

CAPITULO IV

MODELOS MULTIECUACIONALES

1. INTRODUCCIÓN

En el modelo básico de regresión y para cualquier punto muestral t tenemos:

expresándolo en matrices nos da:

donde,

escalar del valor de la variable endógena en el punto t. yt ⇒vector fila 1 x K de los valores de todas las exógenas en el puntoX t ⇒t.

vector columna K x 1 de parámetros del modelo.β ⇒u escalar de la variable aleatoria en el punto t.⇒

Para el conjunto de todos los valores muestrales ( t = 1, 2, ..., T), la

correspondiente expresión matricial, es:

siendo,

Y vector columna T x 1 de valores de la endógena.⇒X matriz T x K de valores de las exógenas. ⇒

vector columna K x 1 de parámetros del modelo.β ⇒U vector columna T x 1 de las perturbaciones aleatorias.⇒

En el contexto de un modelo multiecuacional con g variables endógenas y k

exógenas (o predeterminadas), una ecuación cualquiera que incluyese todas las variables

y en la que la endógena cuyo comportamiento quisiésemos explicar fuera (ecuación

h-ésima) adopta la siguiente expresión:

considerando nulo el coeficiente de en el segundo miembro, es decir, .

En forma matricial resulta:

Page 108: Econometria i

108

donde,

vector fila de los valores de todas las endógenas en el punto t. ⇒vector columna de los valores de los parámetros de las variables⇒endógenas del modelo.

vector fila de los valores de todas las exógenas en el punto t.⇒vector columna de los parámetros de las variables exógenas del⇒modelo.

Para el conjunto de todos los valores muestrales ( t=1,2,...,T), puede expresarse

la misma ecuación matricialmente de la siguiente forma:

siendo,

vector columna de todos los valores muestrales de la variable⇒endógena h.

Y matriz de todos los valores muestrales de las variables endógenas⇒del modelo, excepto la variable h.

vector columna de los valores de los parámetros de las variables⇒endógenas del modelo.

X matriz de todos los valores muestrales de las exógenas del modelo.⇒vector columna de los parámetros de las variables exógenas del⇒modelo.

vector columna de las perturbaciones aleatorias.⇒

Para el modelo en su conjunto, referido a todos los valores muestrales, la

expresión matricial será:

que viene a ser la FORMA ESTRUCTURAL del modelo, pasamos al primer

miembro y nos queda:

sacamos factor común Y por la derecha, tenemos:

despejándose las g endógenas del sistema de g ecuaciones, da:

Page 109: Econometria i

109

viene a ser la FORMA REDUCIDA del modelo.

1.1. TIPOS DE MODELOS MULTIECUACIONALES

Los modelos multiecuacionales se clasifican:

1º Modelos Recursivos (o en cadena causal (Wold) o recurrente)

Cada variable endógena depende, además de las variables predeterminadas

específicas de cada ecuación, de otras endógenas, pero sin que existan relaciones

recíprocas de causalidad; así:

o sea, influye sobre , pero no se da la relación de causalidad inversa, de

sobre . Es adecuado el procedimiento de estimación de los mínimos cuadrados

ordinarios, porque los términos de error de las ecuaciones están incorrelacionadas

entre sí.

2º Modelos Bloque Recursivo o Bloque Recurrente

Las ecuaciones pueden repartirse en grupos tales que entre ellas su

relación es de carácter recursivo; ejemplo:

la tercera ecuación (un bloque) determina a partir de y (otro bloque),

sobre las que no influye, aunque éstas si lo hagan simultáneamente entre sí. Si el

primer bloque está identificado, estas ecuaciones pueden estimarse utilizando la

técnica de los mínimos cuadrados en dos etapas y para el segundo bloque es

preciso utilizar el procedimiento de los mínimos cuadrados ordinarios.

3º Modelos interdependientes o de ecuaciones simultáneas

Existen relaciones causales múltiples entre todas las variables endógenas

del sistema. Ejemplo:

Page 110: Econometria i

110

La simultaneidad de ecuaciones no permite un tratamiento aislado de cada

una de las ecuaciones. En este caso, que existe correlación entre los términos de

error de varias ecuaciones, es conveniente proceder a una estimación conjunta de

parámetros. El método adecuado de estimación depende de la identificación de

cada ecuación del modelo.

4º Modelos de ecuaciones aparentemente no relacionadas

Se trata típicamente de ecuaciones similares referidas a diversas partes de

un total (por ejemplo, tasas de actividad por grupos de sexo y edad, demanda de

diferentes productos, etc.), que impide una independencia total entre las

perturbaciones de cada ecuación y las de las restantes del sistema. Ejemplo:

Los modelos de ecuaciones aparentemente no relacionadas (Seemingly

unrelated equations) presentan correlación entre los términos de error de las

ecuaciones del modelo; por lo tanto, el método adecuado de estimación es

mínimos cuadrados trietápicos.

Si las perturbaciones de cada ecuación no están relacionadas entre sí (están

incorrelacionadas) no existirá, evidentemente, ninguna relación entre las tres

ecuaciones; entonces la estimación minimocuadrática ordinaria es perfectamente

apropiada.

2. ESPECIFICACIÓN DE UN MODELO MULTIECUACIONAL

En el proceso de construcción de un modelo multiecuacional es conveniente

realizar un diagrama causal, esto es, un grafo en el que mediante flechas se indican

cuáles son las variables causa y cuáles las efecto o explicadas (endógenas). Las

perturbaciones aleatorias son variables latentes o no observables, de naturaleza aleatoria,

que influyen sobre las variables endógenas y que se representan dentro de un círculo

para indicar que no son medibles directamente. Las interrelaciones entre las variables

predeterminadas, o entre las perturbaciones aleatorias se representan mediante líneas que

unen las variables relacionadas.

Las variables endógenas son aquellas a las que apunta alguna flecha en un

diagrama causal, y las predeterminadas son aquellas variables medibles de las que parte

alguna flecha pero a las que no apunta ninguna.

El modelo se formula a partir del diagrama causal, y, si las relaciones son lineales,