apuntes de econometria i

Upload: jorge-ipanaque

Post on 12-Jul-2015

955 views

Category:

Documents


10 download

DESCRIPTION

Econometría I

TRANSCRIPT

Econometra IAutores:1 Jose Miguel Benavente Andrs Otero Javiera Vsquez Agosto 2007

1 Cualquier

error es responsabilidad exclusiva de los autores.

ndice general1. Introduccin 2. Modelo de Regresin Lineal2.1. Anlisis de Regresin . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1. Qu es una regresin? . . . . . . . . . . . . . . . . . . . . 2.1.2. Relaciones estadsticas versus relaciones determinsticas . . 2.1.3. Regresin versus Causalidad . . . . . . . . . . . . . . . . . 2.1.4. Regresin versus Correlacin . . . . . . . . . . . . . . . . . 2.2. Anlisis de regresin con dos variables . . . . . . . . . . . . . . . 2.2.1. Funcin de regresin poblacional (FRP) . . . . . . . . . . 2.2.2. Especicacin estocstica de la funcin de regresin poblacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3. Funcin de regresin muestral . . . . . . . . . . . . . . . . 2.2.4. Propiedades de un Estimador . . . . . . . . . . . . . . . . 2.3. Modelo de regresin con dos variables . . . . . . . . . . . . . . . . 2.3.1. Mtodo de Mnimos Cuadrados Ordinarios . . . . . . . . . 2.3.2. Supuestos detrs del mtodo MCO . . . . . . . . . . . . . 2.3.3. Errores estndar de los Estimadores Mnimos Cuadrados Ordinarios . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

5 88 8 9 10 10 14 16 16 18 21 24 24 31 35

2.3.4. Estimador Mnimo Cuadrado Ordinario de 2 . . . . . . . 2.4. Modelo de Regresin con k variables . . . . . . . . . . . . . . . . 2.4.1. Representacin Matricial del Modelo de Regresin Lineal . 2.4.2. Estimador Mnimo Cuadrados Ordinarios . . . . . . . . . . 2.5. Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . . 2.5.1. Propiedad de mejor estimador lineal insesgado . . . . . . . 2.5.2. Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . . 2.6. Geometra del Estimador MCO . . . . . . . . . . . . . . . . . . . 2.7. Bondad de Ajuste y Anlisis de Varianza . . . . . . . . . . . . . . 2.7.1. Modelo de Regresin Lineal en Desvos . . . . . . . . . . . 2.7.2. Anlisis de Varianza . . . . . . . . . . . . . . . . . . . . .

36 38 38 39 41 42 42 44 45 45 47 48 50 53 61 61 63 65 67 74 75 76 80 80

2.7.3. Bondad de Ajuste: R2 y R2 . . . . . . . . . . . . . . . . .2.8. Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.1. Test t (Una hiptesis lineal) . . . . . . . . . . . . . . . . . 2.8.2. Test F (Conjunto de hiptesis lineales) . . . . . . . . . . . 2.8.3. Intervalos de Conanza . . . . . . . . . . . . . . . . . . . . 2.8.4. Test de Normalidad (Test de Jarque-Bera) . . . . . . . . . 2.9. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.1. Medicin de la precisin de la prediccin . . . . . . . . . . 2.10. Estimacin Mximo Verosmil (EMV) . . . . . . . . . . . . . . . . 2.10.1. Propiedades de los estimadores MV . . . . . . . . . . . . . 2.10.2. Estimacin MV . . . . . . . . . . . . . . . . . . . . . . . . 2.11. Inferencia en el contexto MV . . . . . . . . . . . . . . . . . . . . . 2.11.1. Test de Razn de Verosimilitud (LR) . . . . . . . . . . . . 2

2.11.2. Test de Wald (W) . . . . . . . . . . . . . . . . . . . . . . . 2.11.3. Test del Multiplicador de Lagrange (LM) . . . . . . . . . . 2.12. Algunas acotaciones respecto a la estimacin y la inferencia MV .

81 81 85

3. Forma Funcional y Especicacin3.1. Regresores Estocsticos en el Modelo de Regresin Lineal . . . . . 3.2. Incorporacin de No Linealidades . . . . . . . . . . . . . . . . . . 3.2.1. Test de No Linealidades Omitidas (Test de Reset) . . . . . 3.3. Variables Dummies o cualitativas . . . . . . . . . . . . . . . . . . 3.3.1. Posibles usos de las variables Dummies . . . . . . . . . . .

8787 89 90 92 97

3.4. Variable Dependiente Rezagada . . . . . . . . . . . . . . . . . . . 101 3.4.1. Ejemplo y advertencias sobre el uso de variable dependiente rezagada como regresor . . . . . . . . . . . . . . . . . . . . 103 3.5. Seleccin de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . 105 3.5.1. Ejemplo: Retornos a la educacin, diferencias entre hombres y mujeres . . . . . . . . . . . . . . . . . . . . . . . . . 106 3.6. Regresin Particionada . . . . . . . . . . . . . . . . . . . . . . . . 109 3.7. Omisin de Variables Relevantes . . . . . . . . . . . . . . . . . . . 110 3.7.1. Impacto sobre el Insesgamiento . . . . . . . . . . . . . . . 110 3.7.2. Impacto sobre la Varianza . . . . . . . . . . . . . . . . . . 111 3.7.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 3.8. Inclusin de Variable Irrelevantes . . . . . . . . . . . . . . . . . . 114 3.8.1. Impacto sobre Insesgamiento . . . . . . . . . . . . . . . . . 114 3.8.2. Impacto sobre Varianza . . . . . . . . . . . . . . . . . . . 114

3.8.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

3

3.9. Perturbaciones no Esfricas . . . . . . . . . . . . . . . . . . . . . 117 3.9.1. Consecuencias de estimacin por MCO . . . . . . . . . . . 118 3.9.2. Estimacin Eciente: Mnimos Cuadrados Generalizados . 118 3.9.3. Test de Hiptesis . . . . . . . . . . . . . . . . . . . . . . . 119 3.9.4. Estimacin cuando es desconocida: Mnimos Cuadrados Factibles . . . . . . . . . . . . . . . . 120 3.9.5. Heterocedasticidad . . . . . . . . . . . . . . . . . . . . . . 121 3.9.6. Autocorrelacin . . . . . . . . . . . . . . . . . . . . . . . . 130

4. Problemas con los datos

149

4.1. Multicolinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 4.1.1. Multicolinealidad Exacta y Multicolinealidad Aproximada 4.1.2. Deteccin de Multicolinealidad 151

. . . . . . . . . . . . . . . 151

4.1.3. Otros mtodos de deteccin de multicolinealidad . . . . . . 153 4.1.4. Remedios contra la Multicolinealidad . . . . . . . . . . . . 155 4.2. Error de Medicin . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 4.2.1. Estimacin por Variables Instrumentales . . . . . . . . . . 159 4.2.2. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . 160

4

Captulo 1 IntroduccinEconometra es la ciencia que aplica mtodos matemticos y estadsticos al anlisis de datos econmicos, con el objetivo de dotar de una base emprica a una teora econmica, para as refutarla o vericarla. Aunque la econometra parece ser tan antigua como la misma ciencia econmica, slo en 1930 se crea la Sociedad Economtrica, la cual sistematiz su estudio y prctica. En 1933 se lanza el primer nmero de Econometrica en el que Ragnan Frish (uno de los fundadores de la Sociedad Economtrica, a quin de hecho, se le acredita el haber acuado el trmino .Econometra") destaca: "La experiencia ha mostrado que cada uno de estos tres puntos de vista, el de la estadstica, la teora econmica y las matemticas, es necesario, pero por si mismo no suciente para una comprensin real de las relaciones cuantitativas de la vida econmica modera. Es la unin de los tres aspectos lo que constituye una herramienta de anlisis potente. Es la unin lo que constituye la econometra". Sin embargo, las metodologas aplicadas en econometra (los tres puntos de vista de Frish), no han sido utilizados exclusivamente por la ciencia econmica. Otras ciencias naturales tambin han aprovechado sus ventajas. Sin embargo, en el campo del comportamiento econmico adquieren especial particularidad y relevancia, en tanto el ambiente y el comportamiento econmicos, son esencialmente no-experimentales, colocndonos en situaciones donde todas las variables relevantes parecen moverse constantemente y donde existen factores impredecibles que pueden alterar los resultados. Es por esto que la econometra es esencialmente una ciencia no determinstica, donde se reconoce la existencia de factores esencialmente impredecibles que determinan nuestras conclusiones.

5

Capitulo 1: Introduccin

Econometra I FEN, Universidad de Chile

La metodologa economtrica se puede detallar (a grandes rasgos) segn lo enuncia la Figura 1. En primer lugar contamos con una teora econmica que busca validez. Para ella, es necesario encontrar su equivalente modelo economtrico (relaciones matemticas que describan el comportamiento de los agentes involucrados). Para estimar entonces dicho modelo, se necesita de la ecuacin resultante del modelo, los datos que ella implica y los supuestos bajo los cuales se construye. Slo una vez que contamos con dichos ingredientes se procede a estimar cuantitativamente las predicciones o implicancias expuestas por la teora econmica inicial. Luego, se debe realizar inferencia o pruebas de hiptesis, las cuales nos indicarn si nuestros resultados son estadsticamente signicativos. Si la respuesta es si, entonces slo queda realizar las predicciones pertinentes y las recomendaciones de poltica asociadas. Si la respuestas es no, entonces, debemos revisar los posibles errores que existan a nivel de teora o metodologa.

TEORIA ECONOMICA

MODELO ECONOMETRICO

ECUACION

DATOS

SUPUESTOS

ESTIMACION

INFERENCIA Y PRUEBA DE HIPOTESIS

SI

NO

PREDICCIONES Y RECOMENDACIONES DE POLITICA

TEORIA VERIFICADA

6

Capitulo 1: Introduccin

Econometra I FEN, Universidad de Chile

Esta breve descripcin no es ms que una somera vista a lo que realmente implica hacer econometra. El camino no est exento de dicultades (en trminos de la calidad de los datos, de la dicultad de medir las variables que la teora indica, de los supuestos que realizamos, etc), sin embargo, esto, ms que una dicultad, implica un desafo.

7

Captulo 2 Modelo de Regresin Lineal2.1. Anlisis de Regresin2.1.1. Qu es una regresin?La regresin es un elemento fundamental en la Econometra, corresponde a un estudio de dependencia entre una variable dependiente y una o ms variables explicativas. El anlisis de regresin tiene como objeto estimar y/o predecir el promedio poblacional de la variable dependiente para valores jos de la(s) variable(s) explicativa(s). Por ejemplo, observemos la Figura 1, en el eje de las abscisas tenemos nuestra variable explicativa (X): notas controles, y en el eje de las ordenadas tenemos nuestra variable dependiente (Y): nota examen.

Notas de los controles Figura 1: Distribucin de las Notas del Examen vs. Promedio Notas de Controles

8

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Podemos observar dos cosas: primero, para cada nota posible en los controles (3.0, 4.0,..) tenemos un rango o distribucin de notas en el examen y segundo, el promedio de notas en el examen es mayor mientras mayores son notas de los controles. Esto ltimo se puede apreciar al trazar una recta que una los valores promedios de notas en examen para cada nota en los controles (linea negra del la Figura 1), la que corresponde a la recta de regresin. Esta nos permite, para cada nivel de edad, predecir la estatura promedio correspondiente.

2.1.2. Relaciones estadsticas versus relaciones determinsticasLa calidad de un producto, por ejemplo el vino, depender de como fue su cosecha y por lo tanto, de variables como la temperatura al que estuvo expuesta la uva, la cantidad de lluvia, sol y los fertilizantes. La relacin entre estas variables explicativas y la calidad del vino tiene una naturaleza estadstica, ya que si bien estas variables ayudan al productor de vino a saber ms o menos como ser la cosecha, no podr predecir en forma exacta la calidad del producto debido a los errores involucrados en estas variables y porque pueden haber otros factores difciles de medir que estn afectando la calidad del vino. La variable dependiente, en este caso la calidad del vino, tiene una variabilidad aleatoria, ya que no puede ser explicada en su totalidad por las variables explicativas. En la econometra nos interesa la dependencia estadstica entre variables, donde tratamos con variables aleatorias, es decir, variables que tienen una distribucin de probabilidad. La dependencia determinstica, por el contrario, trata relaciones como la ley de gravedad de Newton1 , las que son exactas (no tienen naturaleza aleatoria).ley de gravedad de Newton plantea que toda partcula en el universo atrae a cualquier otra partcula con una fuerza directamente proporcional al producto de sus masas e inversamente 1 proporcional al cuadrado de la distancia entre ellas: F=k( mrm2 ), donde F=fuerza, m1 y m2 2 son la masa de las dos partculas, r es la distancia y k una constante de proporcionalidad. Esta es una relacin determinstica, ya que para valores de masas, distancia y constante sabemos exactamente a la fuerza que se atraen estas partculas. Si alguna de las variables estuviera medida con error, la ley de Newton pasa a ser una relacin estadstica, y F se convierte en una variable aleatoria.1 La

9

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.1.3. Regresin versus CausalidadEs importante tener claro que la regresin es una relacin estadstica, que no implica causalidad apriori. En el ejemplo del vino, no hay una razn estadstica para suponer que la lluvia no depende de la calidad del vino. Pero nuestro sentido comn nos hace considerar como variable dependiente la calidad del vino y no la lluvia. Es importante recordar de aqu en adelante que una relacin estadstica no puede por s misma implicar en forma lgica una causalidad.

2.1.4. Regresin versus CorrelacinEl Anlisis de Correlacin est estrechamente relacionado con el de regresin aunque conceptualmente son dos cosas muy diferentes. El anlisis de correlacin tiene como objetivo medir el grado de asociacin lineal entre dos variables, medida a travs del coeciente de correlacin. Por ejemplo, se puede estar interesado en medir el grado de correlacin entre aos de educacin y salario. En cambio, el anlisis de regresin trata de estimar o predecir el valor promedio de salario para un nivel dado de educacin. Las diferencias fundamentales son que, en el anlisis de regresin, tenemos una variable dependiente y una o ms explicativas, la que son tratadas en forma asimtrica: la variable dependiente es aleatoria, tiene una distribucin de probabilidad, en cambio las variables explicativas toman valores jos. En el anlisis de correlacin las variables son tratadas de forma simtrica: la correlacin entre educacin y salario es igual a la correlacin entre salario y educacin. Adems ambas variables son aleatorias. As, si x e y son dos variables aleatorias, el coeciente de correlacin se dene de la siguiente manera:

yx =

E {[x E(x)] [y E(y)]} var(x)var(y)

=

xy 2 2 x y

Lo que se calcula para una muestra de la siguiente forma:

yx = con X =1 n n i=1

n i=1 n i=1 1 n

xi X2

yi Yn i=1

xi X yi .

yi Y

2

xi e Y =

n i=1

De ahora en adelante denotaremos con un a los estimadores de un estadstico obtenidos a partir de informacin muestral. 10

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ejemplo 1: Portales de Internet, correlacin entre nmero de visitas y valor dela empresa:

Ejemplo 2: Correlacin entre Empleo y Producto (serie de tiempo):

11

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ejemplo 3: Correlacin entre Producto per-capita y ranking ftbol:

Ejemplo 4: Correlacin entre temperatura media del da y estudiantes ausentesa clases:

12

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Algunas precauciones con el coeciente de correlacin: Cuidado cuando el grado de correlacin muestral depende de solo unas pocas observaciones. El coeciente de correlacin mide una relacin lineal. Por lo tanto, una variable puede depender de otra an cuando la correlacin sea cero si la relacin es no lineal. Correlacin no implica causalidad econmica, es slo una relacin estadstica. Correlacin puede indicar relacin espuria. No olvidar que la correlacin muestral es una variable aleatoria y que por lo tanto, el coeciente por si slo no garantiza la existencia de una relacin estadstica entre las series.

13

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.2. Anlisis de regresin con dos variablesPara esta seccin asumiremos que existe una variable dependiente (Y) que es explicada por slo una variable (X). Consideremos el siguiente ejemplo. En la Tabla 1 se presentan datos de salarios y nivel de educacin para una poblacin de 60 individuos 2Tabla 1: Salarios y Aos de EducacinSalario (Y) 16000 32868 50000 80000 100000 150000 219120 300000 547800 166199 Aos de Educacin (X)

8

E(Y|X)

18260 36520 54780 82170 109560 170000 273900 365200 730400 204532

9

15000 40000 58000 90000 120000 182600 280000 380000 913000 230956

10

15000 40000 60000 90000 120000 188973 328680 434120 821700 233164

11

20000 50000 73040 100000 140000 219120 365200 500000 1064558 281324

12

20000 54780 80000 100500 160000 257880 400000 550000 1460800 342662

13

21912 60000 89000 120000 200000 300000 500000 650000 1500000 382324

14

35000 73040 100000 140000 230000 400000 600000 883085 1826000 476347

15

40000 90000 105000 180000 280000 434686 730400 1000000 2487041 594125

16

60000 120000 165784 250000 365200 600000 1095600 1643400 4000000 922220

17

La poblacin tiene 10 niveles distintos de educacin, que van desde 8 a 17. Para cada uno de estos niveles tenemos 9 individuos con distintos salarios. A pesar de la variabilidad en los salarios para cada nivel educacional considerado, en promedio el salario se incrementa a medida que los aos de educacin aumentan. Esto ltimo se puede vericar al calcular el promedio para cada nivel de educacin, lo que se presenta en la ltima linea de la Tabla 1, estos corresponden a los valores esperados condicionales, ya que dependen de los valores dados de la variable X. En la Figura 2, los valores medios condicionales estn marcados con una cruz. La unin de estos valores representa la Recta de regresin poblacional, donde el trmino poblacional se reere a que estamos trabajando con el total de la poblacin.4000000 salario 2000000 3000000

Recta de regesin poblacional (RRP)

1000000

0

x8

x

x10

x

x

x

x

x

x

x

12Escolaridad

14

16

18

Figura 2: Distribucin de los salarios para distintos niveles de educacin.

poblacin de 60 individuos puede parecer un poco pequea, pero por el momento consideremos que estas familias son el total existente

2 Una

14

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Denicin: La curva de regresin poblacional es simplemente el lugar geomtrico de las medias condicionales de la variable dependiente para los valores jos de la(s) variable(s) explicativa(s).

En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de forma simtrica en torno al valor promedio para cada valor X, desde ahora asumiremos que esto si se cumple, tal como lo podemos apreciar en la Figura 3.

Figura 3: Ingreso semanal y Gasto semanal. Distribucin simtrica

En este ejemplo, se ve la relacin entre ingreso semanal y gasto en consumo semanal, para cada nivel de ingreso se tiene un rango de gasto que se distribuye en forma simtrica entorno al valor promedio condicional de gasto.

15

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.2.1. Funcin de regresin poblacional (FRP)De lo anterior es claro que la media condicional E(Y|Xi ) es funcin de Xi , donde Xi es un valor dado de X:

E(Y |Xi ) = f (Xi )

(2.1)

donde f() es una funcin cualquiera, en el ejemplo anterior era una funcin lineal. La ecuacin (2.1) se denomina Regresin Poblacional. Que forma tiene f() es una pregunta emprica, aunque muchas veces la teora nos puede ayudar bastante. Supongamos que en nuestro ejemplo anterior el salario esta relacionado linealmente con la educacin, as podemos suponer que la funcin de regresin poblacional E(Y|Xi ) es una funcin lineal de Xi , es decir:

E(Y |Xi ) = 1 + 2 Xi

(2.2)

donde 1 y 2 se denominan coecientes de regresin. As el objetivo es estimar 1 y 2 a partir de datos de X e Y.

2.2.2. Especicacin estocstica de la funcin de regresin poblacionalEn los dos ejemplos anteriores veamos que a medida que se incrementa la variable explicativa (educacin o ingreso), el valor promedio de la variable dependiente (salario o gasto) tambin se incrementaba. Sin embargo, este patrn se da solo a nivel de promedios. A nivel individual esto no es necesariamente cierto. En la Tabla 1 podemos ver que el individuo que gana menos ingreso con 9 aos de educacin, gana menos que el individuo con 8 aos de educacin con mayor salario. Existe una dispersion de los valores individuales de Yi en torno al promedio condicional de esta variable. De esta forma, podemos denir:

ui = Yi E(Y |Xi )o

Yi = E(Y |Xi ) + ui

(2.3)

donde ui es una variable aleatoria no observable que toma valores positivos o negativos. Este trmino surge pues no se puede esperar que todas las observaciones 16

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Yi sean igual al promedio condicional a Xi .Recordemos que la regresin es una relacin estadstica, a pesar de conocer los valores de Xi , esto no nos permite predecir en forma exacta Yi . Lo que no podemos explicar debido a que tiene naturaleza aleatoria se representa a travs de ui , denominado trmino de error estocstico. Entonces siguiendo el ejemplo de la Figura 3, podemos decir que el gasto de una familia individual (Yi ) corresponde a la suma de dos componentes: E(Y|Xi ), que corresponde a la media de gasto de todas las familias con el mismo nivel de ingresos Componente Determinstico

ui Componente AleatorioSi E(Y|Xi ) es lineal en Xi , podemos escribir la ecuacin (2.3) de la siguiente forma:

Yi = E(Y |Xi ) + ui = 1 + 2 Xi + uiTomando el valor esperado condicional en Xi a la ecuacin (2.4):

(2.4)

E(Yi |Xi ) = E[E(Y |Xi )|Xi ] + E(ui |Xi ) = E(Y |Xi ) + E(ui |Xi )Debido a que E(Yi |Xi ) = E(Y |Xi ), implica que:

(2.5)

E(ui |Xi ) = 0

(2.6)

As, el supuesto de que la recta de regresin pasa a travs de las medias condicionales de Y, implica que la media condicional de ui es cero.

17

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.2.3. Funcin de regresin muestralEn la mayora de los fenmenos econmicos a estudiar, no disponemos de las observaciones totales de la poblacin, como hemos supuesto hasta ahora. En la prctica se tiene alcance nada ms que a una muestra de los valores de Y que corresponden a unos valores jos de X. En este caso tenemos que estimar la funcin de regresin poblacional en base a informacin muestral. Los datos poblacionales asociados a la Figura 3 son los siguientes:Tabla 2. Ingreso familiar Y|X 80 100 120 Gasto en 55 65 79 consumo 60 70 84 familiar 65 74 90 semanal 70 80 94 (Y) 75 85 98 88 Media Condicional 65 77 89 (X) y 140 80 93 95 103 108 113 115 101 Gasto 160 102 107 110 116 118 125 113 en consumo 180 200 110 120 115 136 120 140 130 144 135 145 140 125 137 (Y). 220 135 137 140 152 157 160 162 149 240 137 145 155 165 175 189 161 260 150 152 175 178 180 185 191 173

Supongamos que nosotros no conocemos estos datos, es decir, no tenemos acceso a las observaciones correspondientes a la poblacin total. Tenemos a nuestra disposicin slo una muestra (Tabla 3), la que ha sido obtenida de forma aleatoria de la poblacin. Es importante notar que a partir de una poblacin podemos sacar una gran cantidad de muestras en forma aleatoria y en la realidad nosotros observamos solo una de ellas. Debido a esta variabilidad en las muestras podremos estimar la FRP pero no de manera precisa. Para ejemplicar esto supongamos que adems de la muestra en la Tabla 3 se saco otra muestra (Tabla 4) a partir de la informacin poblacional.Tabla 3. Muestra aleatoria de la poblacin en tabla 2. Y X 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 Tabla 4. Muestra aleatoria de la poblacin en tabla 2. Y X 55 80 88 100 90 120 80 140 118 160 120 180 145 200 135 220 145 240 175 260

18

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Al gracar los datos de las Tablas 3 y 4 obtenemos los diagramas de dispersion en la Figura 4. En este diagrama se han trazado dos rectas de regresin muestral: FRM1 corresponde a la primera muestra y FRM2 corresponde a la segunda. Como vemos, no es posible asegurar cual de las dos rectas muestrales representa mejor la recta de regresin poblacional. Entonces es importante tener en mente que las rectas de regresin muestral representan la recta de regresin poblacional, pero debido a uctuaciones muestrales pueden ser consideradas slo como una aproximacin. Como contraparte muestral la funcin de regresin muestral puede escribirse como:

Yi = 1 + 2 Xi

(2.7)

donde Yi es el estimador de E(Y|Xi ), 1 es el estimador de 1 y 2 es el estimador de 2 .

Figura 4: Rectas de Regresin basadas en dos muestras distintas

Denicin: Un estimador es una regla, frmula o mtodo que dice cmo determinar el parmetro poblacional a partir de la informacin suministrada por la muestra disponible.De igual manera que para el caso poblacional la funcin de regresin muestral 19

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

tambin tiene una representacin estocstica:

Yi = 1 + 2 Xi + ui

(2.8)

Entonces, el objetivo del Anlisis de Regresin es estimar la Funcin de regresin poblacional:

Yi = 1 + 2 Xi + uicon base en la Funcin de regresin muestral:

(2.9)

Yi = 1 + 2 Xi + ui Esta aproximacin se puede ver en la Figura 5:

(2.10)

Figura 5: Rectas de Regresin muestral y poblacional

En trminos de la funcin de regresin muestral, la Yi observada puede ser expresada como:

Y i = Y i + ui

(2.11)

y en trminos de la funcin de regresin poblacional puede ser expresada como:

Yi = E(Y |Xi ) + ui20

(2.12)

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

En la gura 5 podemos notar que para todo Xi a la derecha del punto A, Yi sobreestima E(Y |Xi ). De igual manera, para cualquier punto a la izquierda de A, Yi subestima E(Y |Xi ). Esta sobreestimacin y subestimacin del modelo poblacional es inevitable debido a las uctuaciones muestrales. Cmo se puede construir la funcin de regresin muestral para 1 2 que este lo ms cerca de los valores verdaderos (poblacionales) de y 1 y 2 ?

2.2.4. Propiedades de un EstimadorUn estimador, siendo funcin de la muestra, es una variable aleatoria y tiene su propia distribucin de probabilidad. Las propiedades de los estimadores son las siguientes: 1. Se denomina sesgo a la diferencia entre el valor esperado del estimador y su verdadero valor: E() . De esta forma, se dice que es un estimador insesgado si E() = . 2. El estimador es eciente o de mnima varianza si no hay ningn otro esti mador insesgado que tenga una varianza menor que . En general se trata de utilizar estimadores de varianza pequea, pues de este modo la estimacin es ms precisa. 3. El Error Cuadrtico Medio (ECM) es una propiedad de los estimadores que mezcla los conceptos de eciencia e insesgamiento. El ECM de se dene como:

ECM () = E[( )2 ]Lo que se puede expresar equivalentemente de la siguiente manera:

ECM () = V ar() + [Sesgo()]2 4. La ltima propiedad de un estimador es la consistencia. El estimador es consistente si converge (en el limite) al verdadero valor del parmetro. Se dice que la sucesin de variables aleatorias X1 , X2 ,...,Xn converge en probabilidad a la variable aleatoria (o constante) X si: > 0,n

l P r[|Xn X| < ] = 1 m

Esto se denota plim Xn = X . Dos reglas tiles al respecto son: 21

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

plim

X Y

= plimX plimY

plim (X Y )=plimX plimY

Ejemplo: Tenemos una variable yi que esta compuesta por la suma de un componente jo o determinstico (c) y un componente aleatorio(ui ):

yi =2 Si ui N (0, u ), entonces:

ccomponente f ijo

+

uicomponente aleatorio

= E(yi ) = c 2 V (yi ) = E[(yi E(yi ))2 ] = E[u2 ] = u i22

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ahora consideremos el siguiente estimador de la esperanza de yi , la media muestral:

1 1 = Y = (y1 + y2 + ... + yn ) = n nVeamos que propiedades tiene este estimador:

n

yii=1

Insesgamiento: E() = E() = E Y 1 = E (y1 + y2 + ... + yn ) n 1 = (E(y1 ) + E(y2 ) + ... + E(yn )) ndado que E(yi ) = E(c) + E(ui ) = c,0

E() = c =

Eciencia: V ar()1 siempre se cumple que es ms eciente (menor vari anza) que 1 . igual que 1 , el error cuadrtico medio de ambos estimadores es igual a la varianza del estimador, de esta forma tiene menor error cuadrtico medio que 1 .

Error Cuadrtico Medio: Como es un estimador insesgado de al

Consistencia: es un estimador consistente dado que: plim() = plim(Y ) = c Ya que si l n V ar(Y ) = 0 plim(Y ) = c. m

23

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.3. Modelo de regresin con dos variables2.3.1. Mtodo de Mnimos Cuadrados OrdinariosDe la seccin anterior tenamos que el error estimado era:

ui = Y i Y i = Yi 1 2 Xi

(2.13)

es decir, los residuos son simplemente la diferencia entre los valores verdaderos y estimados de Y. Si queremos que la funcin de regresin muestral sea lo ms cercana posible a la poblacional, debemos tratar de escoger los coecientes de regresin (los 's) de forma tal que los errores sean lo ms pequeos posible. De acuerdo a esto un criterio para escoger la funcin de regresin muestral podra ser minimizar la suma de los los errores: ui = (Yi Yi ), sin embargo este criterio no es muy bueno. Observemos la Figura 6, existe una gran diferencia en la magnitud de los errores, sin embargo en la suma de los errores todos reciben el mismo peso. Debido a esto es posible que la suma de los errores sea muy pequea cercana a cero, incluso cuando la dispersion de los errores en torno a la funcin de regresin muestral es alta.

Figura 6: Mnimos Cuadrados Ordinarios

24

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Este problema puede ser solucionado al considerar la suma de los errores al cuadrado como criterio a minimizar, en este caso los errores ms lejos reciben un mayor peso:

u2 = i =

(Yi Yi )2 (Yi 1 2 Xi )2(2.14)

El Mtodo de Mnimos Cuadrados Ordinarios (MCO) escoge 1 y 2 de forma tal que para una muestra dada, u2 sea lo ms pequeo posible. iEntonces el problema que este mtodo propone resolver es el siguiente: 1 ,2

m n

(Yi 1 2 Xi )2

(2.15)

las condiciones de primer orden de este problema son:

= 2 1 u2 i = 2 2

u2 i

(Yi 1 2 Xi ) = 2 (Yi 1 2 Xi )Xi = 2

ui = 0 ui Xi = 0

(2.16) (2.17)

Simplicando (2.16) y (2.17) obtenemos las ecuaciones normales:

Yi = n 1 + 2 Yi Xi = 1

Xi Xi2

(2.18) (2.19)

Xi + 2

Debemos resolver un sistema con dos ecuaciones y dos incgnitas. De la ecuacin (2.18) podemos despejar 1 :

1 =reemplazando (2.20) en (2.19):

Yi 2 n

Xi

(2.20)

Yi X i =

Yi 2 n

Xi

Xi + 2

Xi2

(2.21)

De esta forma, el estimador de 2 es:

n Yi Xi Xi Yi 2 = n Xi2 ( Xi )225

(2.22)

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

El que puede ser escrito de la siguiente forma (hacerlo):

2 =

xi y i x2 i1 n n i=1

(2.23)

donde xi = Xi X e yi = Yi Y , con X = Reemplazando (2.22) en (2.20):

Xi e Y =

1 n

n i=1

Yi

1 =

Xi2 Yi Xi Xi Yi n Xi2 ( Xi )2 = Y 2 X

(2.24) (2.25)

Los resultados (2.23) y (2.25) podran haber sido obtenidos de igual forma, expresando inicialmente el modelo de regresin en desviaciones con respecto a la media. El modelo de regresin original es:

Yi = 1 + 2 Xi + ui si le restamos el promedio de esta:

Y = 1 + 2 X + ui

(2.26)

y recordando que el valor esperado del trmino de error es 0, tenemos el siguiente modelo de regresin lineal expresado en desviaciones con respecto a la media:

(Yi Y ) = 2 (Xi X) + ui y i = 2 x i + ui As el problema de Mnimos Cuadrados Ordinarios es:

m n 2

(yi 2 xi )2

La condicin de primer orden de este problema es:

u2 i 2

= 2

(yi 2 xi )xi = 0

As obtenemos el mismo estimador de 2 , encontrado en (2.23), y 1 se obtiene simplemente despejando la ecuacin (2.26):

1 = Y 2 X26

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

que corresponde a lo mismo en la ecuacin (2.25). Una vez estimados los coecientes de regresin mediante MCO y utilizando la informacin muestral, la recta de regresin muestral (Yi = 1 + 2 Xi ) puede ser obtenida fcilmente.

Ejemplo 1: Disponemos datos de una empresa qumica sobre el gasto que ella realiza en Investigacin y Desarrollo (I+D) y las ganancias anuales de esta compaa: Ao 1990 1991 1992 1993 1994 1995 Gasto en I+D (Millones de dlares) 2 3 5 4 11 5 Ganancia Anual (Millones de dlares) 20 25 34 30 40 31

Ahora debemos debemos determinar de que forma como cambia el promedio condicional de la variable dependiente (Ganancias) cuando cambia el valor jo de la variable explicativa (Gasto en I+D).

La forma muestral de la recta de regresin: E(Yi |Xi ) = 1 + 2 Xi requiere determinar el valor estimado de estos parmetros, para lo cual utilizaremos el mtodo27

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

de mnimos cuadrados ordinarios:

n Yi Xi Xi Yi 2 = n Xi2 ( Xi )2

2 =

Yi Xi nXY Xi2 n(X)2

Utilicemos los datos para obtener los clculos necesarios para computar el estimador de 2 : Ao (n=6) 1990 1991 1992 1993 1994 1995 Suma Gasto en I+D (X ) (Millones de dlares) 2 3 5 4 11 5 X =30 Ganancia Anual (Y ) (Millones de dlares) 20 25 34 30 40 31 Y =180

XY 40 75 170 120 440 155 XY =1000

X2 4 9 25 16 121 25 X 2 =200

X = nX X = 30 6 X=5 Y = nY Y = 180 6 Y = 30De esta forma,

Media de los valores de la variable dependiente

Media de los valores de la variable independiente

1000 6 5 30 2 = 200 6 (5)2 1000 900 = 200 150 100 = 50 2 = 2 1 = Y 2 X = 30 2 5 = 30 10 1 = 20De esta forma, la recta de regresin muestral estimada es:

Y = 20 + 2 X28

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Con esta ecuacin en mano, el gerente de I+D de esta compaa puede predecir el promedio en ganancias futuras anuales a partir de la cantidad presupuestada de gasto en Investigacin y Desarrollo. Por ejemplo, si la compaa presupuesta gastar 8 millones de dlares en I+D el prximo ao, entonces debe ganar aproximadamente 36 millones de dlares durante este ao.

Ejemplo 2: Tenemos los siguientes datos de portales de internet, con los cuales queremos ver el impacto promedio del nmero de visitas en el valor de la empresa:AOL Yahoo Lycos Cnet Juno Web NBC Internet Earthlink El sitio Promedio Suma 1 2 vempresa 134844 55526 5533 4067 611 4450 2195 1225 26056.4 2381.1 -20076.8 visitas 50 38 28 8 8 16 5 2 19.4 y-ybar 108787.6 29469.6 -20523.4 -21989.4 -25445.4 -21606.4 -23861.4 -24831.4 x-xbar 30.6 18.6 8.6 -11.4 -11.4 -3.4 -14.4 -17.4 (y-ybar)*(x-xbar) 3331621.0 548871.8 -177014.1 250129.1 289441.1 72921.5 343007.3 431445.1 5090422.9 (x-xbar)^2 937.9 346.9 74.4 129.4 129.4 11.4 206.6 301.9 2137.9 ygorro 98976.5 70403.7 46593.1 -1028.3 -1028.3 18020.3 -8171.5 -15314.7 26056.4 ugorro 35867.5 -14877.7 -41060.1 5095.3 1639.3 -13570.3 10366.5 16539.7 0

29

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Utilizando estos datos tenemos:n

(Xi X)2 = 2137,9i=1 n

(Yi Y )(Xi X) = 5090422,9i=1

5090422,9 2 = = 2381,1 2137,9 1 = 26056,4 2381,1 19,4 = 20076,8

30

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.3.2. Supuestos detrs del mtodo MCO En el anlisis de regresin nuestro objetivo no es slo obtener los valores de 1 y 2 sino tambin hacer inferencia sobre los verdaderos 1 y 2 . Nos interesa saber que tan cerca estn 1 y 2 de sus contraparte poblacional o que tan cerca esta Yi de la verdadera E(Y|Xi ). La Funcin de regresin poblacional: Yi = 1 +2 Xi +ui , nos muestra que Yi depende de Xi y ui . As, los supuestos hechos para estas dos variables son fundamentales para lograr una interpretacin vlida de los valores estimados de la regresin. Mientras no se especique la forma como se generan Xi y ui , no hay forma de hacer inferencia estadstica sobre Yi ni sobre 1 y 2 .

Supuesto 1: Modelo de regresin lineal, el modelo de regresin es lineal enparmetros:

Yi = 1 + 2 Xi + ui

Supuesto 2: Los valores de X son jos, X se supone no estocstica. Esto implica que el anlisis de regresin es un anlisis de regresin condicional,condicionado a los valores dados del regresor X.

Supuesto 3: El valor medio del error ui es igual a cero. Dado el valor deX, el valor esperado del trmino de error ui es cero:

E(ui |Xi ) = 0Lo que nos dice este supuesto es que los factores que no estn considerados en el modelo y que estn representados a travs de ui , no afectan sistemticamente el valor de la media de Y. Es decir, los valores positivos de ui se cancelan con los valores negativos de ui . De esta forma, el efecto promedio de ui sobre Y es cero. Ver Figura 7.

31

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Figura 7: Distribucin condicional del trmino de error ui

Supuesto 4: Homocedasticidad o igual varianza de ui . Dado el valor deX, la varianza de ui es la misma para todas las observaciones:

var(ui |Xi ) = E[ui E(ui )|Xi ]2 = E(u2 |Xi ) por supuesto 3 i = 2En la Figura 8 podemos apreciar el signicado del supuesto de homocedasticidad, la variacin alrededor de la recta de regresin es la misma para todos los valores de X. Esto implica que la funcin de densidad del trmino de error ui es la misma.

Figura 8: Homocedasticidad

32

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Por el contrario, el la Figura 9 observamos el caso cuando la varianza del trmino de error varia para cada Xi , en este caso particular la varianza del error aumenta en la medida que Xi crece.

Figura 9: Heterocedasticidad

Esto se conoce como Heterocedasticidad o varianza desigual, lo que se expresa de la siguiente manera:2 var(ui |Xi ) = i

(2.27)

Supuesto 5: No existe autocorrelacin entre los errores. Dado dos valoresde X, Xi y Xj , con i= j, la correlacin entre ui y uj es cero:

cov(ui , uj |Xi , Xj ) = E{[ui E(ui )]|Xi }{[uj E(uj )]|Xj } = E(ui |Xi )(uj |Xj ) = 0Si en la Funcin de regresin poblacional Yi = 1 + 2 Xi + ui , ui esta correlacionado con uj , entonces Yi no depende solamente de Xi sino tambin de uj . Al imponer le supuesto 5 estamos diciendo que solo se considerar el efecto sistemtico de Xi sobre Yi sin preocuparse de otros factores que pueden estar afectando a Y, como la correlacin entre los u's.

Supuesto 6: La covarianza entre ui y Xi es cero E(ui Xi ) = 0:cov(ui , Xi ) = = = = = E[ui E(ui )][Xi E(Xi )] E[ui (Xi E(Xi )] por supuesto E(ui ) = 0 E(ui Xi ) E(ui )E(Xi ) por supuesto E(Xi ) no estocastica E(ui Xi ) por supuesto E(ui ) = 0 033

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Como mencionamos en la seccin 2.2.2 se supone que X y u tienen una inuencia separada sobre Y (determinstica y estocstica, respectivamente), ahora si X y u estn correlacionadas, no es posible determinar los efectos individuales sobre Y. Este supuesto se cumple automticamente si X es no estocstica y el supuesto 3 se cumple.

Supuesto 7: El nmero de observaciones n debe ser mayor que el nmero de parmetros por estimar. El nmero de observaciones tiene que sermayor que el nmero de variables explicativas, de otra forma no se puede resolver el sistema de ecuaciones. Supongamos que tenemos una sola observacin para nuestra variable dependiente y nuestra variable explicativa (Y1 y X1 ), el modelo de regresin es tal que tiene intercepto, es decir:

Y1 = 1 + 2 X1 + u1el estimador MCO de 2 es :

2 =

xi yi x2 i

donde xi = Xi X e yi = Yi Y , sin embargo con una observacin X1 = X e Y1 = Y , as 2 no esta determinado y as tampoco podemos determinar 1 .

Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en

una muestra deben ser iguales, var(X) debe ser un nmero nito positivo. Si las X son las mismas Xi = X , de esta forma ni 2 ni 1 pueden ser estimados.

Supuesto 9: El modelo de regresin esta correctamente especicado.Esto es muy importante, ya que por ejemplo la omisin de variables importantes en el modelo, o la eleccin de la forma funcional inadecuada, o la consideracin de supuestos estocsticos equivocados sobre las variables del modelo, harn cuestionable la validez de la interpretacin de la regresin estimada. (Aspectos que veremos ms adelante).

34

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.3.3. Errores estndar de los Estimadores Mnimos Cuadrados OrdinariosComo vimos en la seccin 2.3.1, los valores estimados para 1 y 2 dependen de los datos muestrales, sin embargo, los datos cambian de una muestra a otra y as los valores estimados tambin, por eso es necesario tener una medida que nos permita decir que tan cercano son los valores estimados a los valores poblacionales de los parmetros. La medida que utilizaremos para medir la precisin del estimador es el error estndar, que es la desviacin estndar de la distribucin muestral del estimador, la que a su vez es la distribucin del conjunto de valores del estimador obtenidos de todas las muestras posibles de igual tamao de una poblacin dada. Recordemos el estimador MCO de 2 :

2 =

xi y i x2 i

donde yi = 2 xi +ui (modelo poblacional en desviaciones con respecto a la media). De esta forma reemplazando yi en el estimador de 2 :

2 =

xi (2 xi + ui ) x2 i x2 ui x i i = 2 + 2 xi x2 i ui x i = 2 + x2 i

Aplicando valor esperado a la expresin anterior:

E(2 ) = 2 + E

ui x i x2 i E(ui )xi = 2 + por x2 i = 2 por supuesto 3

supuesto 2(2.28)

La ecuacin (2.28) nos dice que en valor esperado el estimador MCO de 2 es igual a su verdadero valor. Esta propiedad del estimador MCO se conoce como insesgamiento.

35

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ahora procedamos a calcular la varianza de el estimador MCO de 2 : var(2 ) = E[2 E(2 )]2 = E(2 2 )2

= E

[

xi ui ]2 [ x2 ]2 i 2 x2 i

Por supuesto 4 E(u2 ) = 2 y por supuesto 6 E(ui uj ) = 0, esto implica que: i

var(2 ) =

(2.29)

2.3.4. Estimador Mnimo Cuadrado Ordinario de 2Ahora debemos estimar el parmetro poblacional 2 , como este corresponde al valor esperado de u2 y ui es una estimacin de ui , por analoga: i

n pareciera ser un estimador razonable. Pero los errores de MCO, estn estimados imperfectamente si los comparamos con los errores poblacionales, ya que dependen de una estimacin de 1 y 2 . Veamos esto con ms detalle:Partiendo del Regresin poblacional expresado en desviaciones con respecto a la media:

=

2

n i=1

u2 i

yi = 2 xi + (ui u)y recordando tambin que:

(2.30) (2.31)

ui = yi 2 xi Al sustituir (2.30) en (2.31), se obtiene:

ui = 2 xi + (ui u) 2 xi Elevando al cuadrado la expresin anterior, aplicando sumatoria y tomando valor esperado:

E

u2 i

= E(2 2 )2

x2 + E i

(ui u)2 2 E (2 2 )(i) (ii)

xi (ui u)

= var(2 )

x2 + (n 1)var(ui ) 2E i

x i ui x2 i

xi (ui u)

= 2 + (n 1) 2 2 2 = (n 2) 236

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

(i) E

(ui u)2

= E = E = E = E = E = E = n 2

(u2 2ui u + u2 ) i u2 2u i u2 2u i ui + nu2 n ui + nu2 n 2 ui 2nu2 + nu2 u2 nu2 i u2 i n ui n2

n 2 n = (n 1) 2

(ii) E (2 2 )

xi (ui u)

= E (2 2 ) = E

xi (ui u)

x i ui xi (ui u) x2 i ( xi ui )2 x i ui x i = E u 2 xi x2 i = 2Por lo tanto se dene el estimador de la varianza 2 como:

2 =

u2 i n2

(2.32)

De forma tal que, 2 es un estimador insesgado de 2 :

2 =

1 E n2

u2 = 2 i

37

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.4. Modelo de Regresin con k variablesAhora abandonemos la simplicacin de solo usar dos variables, de ahora en adelante generalizaremos el modelo de regresin lineal para que pueda tener hasta k variables explicativas. Aclaracin: haremos un cambio de notacin, cada observacin i de la variable dependiente ser denotada por yi y cada observacin i de una variable explicativa, por ejemplo X1 , ser denotada por x1i . Ahora las variables en minscula no signica que estn en desvos. El Modelo de Regresin Poblacional en este caso es:

yi = 1 + 2 x2i + 3 x3i + ... + k xki + ui

i = 1, ..., n

2.4.1. Representacin Matricial del Modelo de Regresin LinealEl modelo con k variables explicativas puede ser expresado en notacin matricial. En efecto, cada variable explicativa xj , con j=1,..., k, es un vector columna de dimensin n, al igual que la variable dependiente y el trmino de error. De este modo, el modelo puede ser reescrito de la siguiente forma: y1 1 x21 x31 xk1 u1 y2 1 x22 x32 xk2 u2 . = . 1 + 2 + 3 + ... + k + . . . . . . . . . . . . . . . .

yn

1

x2n

x3n

xkn

un

Donde las variables explicativas se pueden agrupar en una sola matriz de dimensin nk, que denotaremos simplemente como X, de esta manera el modelo se expresa de la siguiente forma: u1 1 1 x21 x31 xk1 y1 y2 1 x22 x32 xk2 2 u2 . = . . . .. . . + . Y = X + u(2.33) . . . . . . . . . . . . . . .

yn

1 x2n x3n

xkn

k

un

donde Y es un vector de dimensin n1, X es la matriz de variables explicativas de dimensin nk y u es un vector correspondiente al trmino de error con dimensin n1. 38

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ahora debemos expresar la distribucin del trmino de error en trminos matriciales: E(u1 ) E(u2 ) E(u) = = 0 . . n1 .

E(uu ) =

E(un ) E(u2 ) E(u1 u2 ) 1 E(u2 u1 ) E(u2 ) 2 . . . . . . E(un u1 ) E(un u2 ) E(u1 un ) E(u2 un ) . .. . . . E(u2 ) n

=

2 0 0 0 2 0 . . .. . . . . . . . . 2 0 0

= 2 I nn

De los supuestos 3, 4 y 5, tenemos entonces que el trmino de error tiene la siguiente distribucin:

u

n1

0 , 2 I

nn

(2.34)

2.4.2. Estimador Mnimo Cuadrados OrdinariosEl mtodo de MCO, plantea que los parmetros del modelo pueden ser estimados minimizando la suma de los errores al cuadrado (SE ( )), la que en trminos matriciales equivale a:n

SE () =i=1

u2 = u u i

donde u = Y X . Entonces el problema de minimizar la suma de los errores al cuadrado se expresa de la siguiente forma: n m SE () = m (Y X ) (Y X ) n

= m Y Y 2 X Y + X X n

SE () = 2X Y + 2X X = 0 = (X X)1 X Y39

(2.35)

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

De (2.35) tenemos:

X (Y X ) = 0 X u = 0 (2.36) es la condicin de ortogonalidad.

(2.36)

De esta forma, el vector de parmetros estimados se obtiene de resolver el siguiente sistema de ecuaciones normales: X X = X Y 1 1 1 x2,1 x2,2 x2,3 x3,1 x3,2 x3,3 . . . . . . . . . xk,1 xk,2 xk,3 1 x2,n x3,n . .. . . . xk,n 1 x2,1 1 x2,2 1 x2,3 . . . . . . 1 x2,n x3,1 xk,1 x3,2 xk,2 x3,3 xk,3 . . .. . . . . . x3,n xk,n 1 2 3 . . . k 1 y1 x2,n y2 x3,n y3 . . .. . . . . . xk,n ynn i=1

1 1 1 x2,1 x2,2 x2,3 = x3,1 x3,2 x3,3 . . . . . . . . . xk,1 xk,2 xk,3 n. . .

n i=1 n i=1 n i=1

x2,i x3,i xk,i

n i=1

x2,i x2 2,i n x3,i x2,i i=1 . . . xk,i x2,i

n i=1 n i=1

x3,i n i=1 x2,i x3,i n 2 i=1 x3,i . .. . . . n i=1 xk,i x3,i

n i=1

xk,i n i=1 x2,i xk,i n i=1 x3,i xk,i . . .n i=1

x2 k,i

1 2 3 . . . k

=

n i=1

yi n yi x2,i i=1 n i=1 yi x3,i . . . yi xk,i

n i=1

Es importante recordar que el estimador MCO esta denido solo cuando la matriz (X'X) es invertible, lo que ocurre siempre y cuando: 1. Las k columnas de la matriz X sean linealmente independientes. 2. Se disponga al menos de tantas observaciones como variables explicativas, es decir: n k .(Supuesto 7) Pongamos atencin en el segundo supuesto, cuando n=k la matriz X tiene dimensin kk, por lo tanto salvo que no se cumpla el supuesto 8, X es invertible, y de esta forma (X X)1 = X 1 (X )1 y por lo tanto:

= (X X)1 X Y = X 1 (X )1 X Y = X 1 Y40

(2.37)

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

el vector de residuos u = Y X = Y X(X 1 Y ) = Y Y = 0n , de esta forma el ajuste es perfecto, ya que todos los residuos son cero, la suma residual de igual forma toma el mnimo valor posible, cero. Sin embargo, esta no es una caracterstica deseable, el ajuste perfecto ocurre porque tenemos una muestra muy reducida. Esto trae como consecuencia poco robustez e imprecisin en las estimaciones. Si escogemos una nueva muestra, del mismo tamao que la anterior, obtendremos otro estimador con suma residual 0, que puede diferir en forma arbitraria del anterior.Para lograr estimaciones precisas de los parmetros, es necesario tener un nmero de observaciones notablemente superior al de las variables explicativas. La diferencia n-k se conoce como el nmero de grados de libertad de la estimacin.

2.5. Propiedades del estimador MCO Notemos que el vector es un vector aleatorio, ya que depende del vector de errores: = (X X)1 X Y = (X X)1 X (X + u) = + (X X)1 X u E() = E() + E[(X X)1 X u] = + (X X)1 X E(u)La esperanza de es el mismo parmetro, ya que este es un constante (valor poblacional), y por supuestos 2 y 3 el segundo trmino de la expresin anterior es cero, (2.38)

E() =

(2.39)

Es decir, el estimador MCO es insesgado, tal como lo habamos mostrado en la ecuacin (2.28). De (2.38) podemos denir el error de estimacin o sesgo como:

= (X X)1 X u

41

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Ahora calculemos la varianza de : var() = = = = = = E[( E()) ( E()) ] E[( ) ( ) ] E[(X X)1 X uu X(X X)1 ] (X X)1 X E(uu )X(X X)1 (X X)1 X ( 2 In )X(X X)1 2 (X X)1

(2.40)

Para poder estimar la varianza de necesitamos reemplazar 2 en (2.40) por su estimador insesgado: 2 = uu nk

2.5.1. Propiedad de mejor estimador lineal insesgado Se dice que , es el mejor estimador lineal insesgado (MELI) de si se cumple lo siguiente:1. El lineal, es decir, es una funcin lineal de una variable aleatoria, como la variable y en el modelo de regresin.

2. Es insesgado, es decir, su valor esperado, E(), es igual a el verdadero valor, .3. Tiene varianza mnima dentro de la clase de todos los estimadores lineales insesgados; un estimador insesgado como varianza mnima es conocido como un estimador eciente.

2.5.2. Teorema de Gauss-MarkovProposicin: El estimador MCO es el estimador lineal insesgado ptimo, en elsentido de que cualquier otro estimador lineal e insesgado tiene una matriz de covarianza mayor que la del estimador MCO. Es decir, el estimador MCO es MELI.

Demostracin: Sea = Ay un estimador lineal de , donde A es una matriz

42

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

kn. Denotemos A = A (X X)1 X , de modo que:

= [A + (X X)1 X ]Y = [A + (X X)1 X ](X + u) = AX + + [A + (X X)1 X ]uAplicando esperanza a la expresin anterior:

E() = AX + + [A + (X X)1 X ]E(u) = AX + El estimador ser insesgado solo si la matriz A es tal que AX=0kk . De esta forma:

= + [A + (X X)1 X ]uy su matriz de covarianza ser:

cov() = E[( )( ) ] = E{([A + (X X)1 X ]u)([A + (X X)1 X ]u) } = 2 AA + 2 (X X)1 cov()

Como la matriz AA es semidenida positiva, se concluye la diferencia entre la covarianza de y es una matriz semidenida positiva, con lo que la covarianza de es mayor o igual a la covarianza de

43

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.6. Geometra del Estimador MCORecordemos que el modelo de regresin muestral tiene la siguiente expresin:

Y = X + ula que puede ser reescrita de la siguiente forma:

Y = P Y + MY

(2.41)

donde P se denomina matriz de proyeccin y se dene de la siguiente manera:

P = X(X X)1 XAdems se tiene que M=I-P. De acuerdo a la ecuacin (2.36) el estimador MCO es tal que los errores son ortogonales a las X, es decir se deben escoger los parmetros de forma tal que el vector de errores sea ortogonal al espacio formados por las variables explicativas. As, el estimador MCO nos permite descomponer Y en dos trminos ortogonales entre si: el primer componente puede ser escrito como una combinacin lineal de las columnas x y el segundo es un componente ortogonal a X (el trmino de error), tal como lo muestra (2.41). Esto se representa grcamente en la Figura 10.Y

MY

x1

PY 0x2

Col X

Figura 10: Descomposicin Ortogonal de Y

El trmino P Y alternativamente se puede ver como la proyeccin de Y en el espacio barrido por las X's y M Y como la proyeccin de Y es el espacio ortogonal a las X's. 44

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.7. Bondad de Ajuste y Anlisis de VarianzaEl objetivo de esta seccin es introducir un criterio de ajuste de nuestra regresin, es decir, un criterio que nos indique cuan bien se ajusta nuestro modelo a la muestra. En principio, podramos pensar que la suma de los residuos cuadrados, es decir, nuestro criterio original de ajuste, es una buena opcin: a menor sea ste, mejor es nuestro ajuste. Sin embargo, la suma de los residuos cuadrados puede ser arbitrariamente escalada al multiplicar la variable dependiente (Y) por el factor de escala deseado, lo cual invalida su uso como criterio de ajuste. Por ello, se ha desarrollado un criterio que elimine el problema anterior. Dicho estadstico ya no se basar en la magnitud de un valor (como la suma de los cuadrados de los residuos), sino que intentar preguntarse si la variacin de las variables independientes (X) explica la variacin de la variable independiente, como veremos ms adelante. Para ello analizaremos con un poco ms de profundidad el modelo de regresin lineal en desvos con respecto a la media y presentaremos la llamada descomposicin de varianza (o anlisis de varianza), ambos, insumos fundamentales para obtener nuestro estadstico de bondad de ajuste.

2.7.1. Modelo de Regresin Lineal en DesvosSea el modelo poblacional usual con k variables:

yi = 1 + 2 x2i + 3 x3i + + k xki + uidonde i = 1 . . . n y cuya contraparte estimada es:

(2.42)

yi = 1 + 2 x2i + 3 x3i + + k xki + ui

(2.43)

Luego, si sumamos para todas las observaciones y dividimos a ambos lados por el tamao muestral n, tenemos:

Y = 1 + 2 x2 + 3 x3 + + k xkpor lo cual:

(2.44)

1 = Y 2 x2 + 3 x3 + + k xk45

(2.45)

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

La ecuacin (2.45) muestra que el trmino independiente de una regresin queda determinado por el resto de los k-1 coecientes involucrados. Finalmente, note que restando las ecuaciones (2.43) y (2.44) obtenemos:

yi Y = 2 (x2i x2 ) + 3 (x3i x3 ) + + k (xki xk ) + ui

(2.46)

la cual es una expresin similar a (2.43), excepto por dos importantes diferencias. Primero, el modelo no posee constante y segundo, las variables se encuentran expresadas en desvos con respecto a la media. A pesar de ello, note que los coecientes y los residuos son los mismos en ambos modelos. De lo anterior surge un importante corolario respecto del trmino constante de nuestro modelo. En general, el inters del investigador se centra en el impacto de los regresores sobre la variable dependiente, por lo cual, el trmino constante no es ms que una correccin que garantiza que los promedios muestrales de ambos miembros del modelo economtrico coincidan. Para transformar en desvos con respecto a la media un modelo en trminos matriciales, introduciremos una matriz fundamental para el anlisis de esta seccin. Denotaremos por M 0 una matriz de n n, denida como: 1 1 1 0 0 1 1 1 1 n n 0 1 0 1 1 1 1 1 1 1 ii n M 0 = I = . . . . . . . . . . = . n . .. . . . n . . . . . nn n . . . . . . . . . . .

0 0

1

1 1

1

1 n

1 n

1 n 1 n . . .

1 n

1

donde I es la identidad (nn) e i corresponde al vector unitario de dimensin n. Dicha matriz es singular, simtrica (M 0 '=M 0 ) e idempotente (M 0 M 0 =M 0 ). En general, M 0 es conocida como matriz de desvos, ya que resta a cada columna de la matriz involucrada, su media aritmtica. Por ejemplo, es fcil comprobar que: n y1 Y yi y1 i=1 y2 1 n yi y2 Y 1 i=1 0 M Y = Y ii Y = . = . . . . . n n . . . n yn Y yn i=1 yi Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en trminos de desvo con respecto a la media como:

M 0 Y = M 0 X + M 0 u

(2.47)

46

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.7.2. Anlisis de VarianzaSuponga entonces el siguiente modelo poblacional:

Y = X + udonde Y corresponde a una vector n 1, X corresponde a nuestra matriz de regresores que incluye un trmino constante, tal que X es de n k y u corresponde a nuestro vector de errores de n 1. Buscamos entonces denir la variacin de la variable dependiente (Suma de los cuadrados totales = TSS) como3 :n

T SS =i=1

(Yi Y )2

(2.48)

Para encontrar entonces una expresin para (2.48), de la ecuacin (2.47) tenemos que nuestro modelo estimado en desvos con respecto a la media es:

M 0Y = M 0X + M 0u con lo cual, al particionar nuestra matriz X en X = [i X2 ], nuestro vector de parmetros en = [1 2 ] y considerando que M 0 i = 0 y que M 0 u = u, tenemos que:

M 0Y

= M 0 i1 + M 0 X2 2 + M 0 u 0 2 + u = M X2

(2.49)

Luego, para formar la TSS(suma de los cuadrados totales o la suma de los cuadrados de las desviaciones de Y con respecto a su media), de la ecuacin (2.48), multiplicamos por Y' la ecuacin (2.49):

Y M 0Y

= = = 0 Y M Y = T SS =

Y (M 0 X2 2 + u) 0 (X + u) (M X2 2 + u) 0 X M X2 2 + X u + u M 0 X2 2 + u u 2 X M 0 X2 2 + u u 2 ESS + RSS

(2.50) (2.51)

donde el segundo y el tercer trmino desaparecen gracias a que los residuos estimados son, por construccin, ortogonales a las variables explicativas 4 . La igualdadque para dicha denicin utilizamos los cuadrados de la desviaciones, ya que la suma de las desviaciones es siempre cero. 4 Ya que X u = X (Y X ) = X Y X Y = 0. 3 Note

47

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

anterior es conocida como la descomposicin de varianza. El trmino de la izquierda corresponde a TSS o la suma de los cuadrados de las desviaciones de la variable dependiente. En otras palabras, la variabilidad de Y. En la derecha se encuentra la variabilidad de las variables independientes o regresores y la variabilidad de los errores. Cul es entonces el objetivo?: descomponer la varianza de la variable dependiente aquella parte que es explicada por la regresin (ESS) de aquella parte explicada por los residuos (RSS). Por qu?: porque intuitivamente, la regresin se ajusta mejor si las desviaciones de Y se explican en su mayor parte por desviaciones de X y no por desviaciones de los residuos.

2.7.3. Bondad de Ajuste: R2 y R2Denimos entonces la bondad de ajuste del modelo a travs del siguiente estadgrafo llamado tambin coeciente de determinacin:

R2 =

ESS T SS

(2.52)

es decir, como la proporcin de la varianza de Y que es explicada por la varianza de la regresin. Alternativamente:

R2 = 1

RSS T SS

(2.53)

Note que:1. El coeciente de determinacin es siempre menor a 1. Ello porque RSS T SS y por lo tanto RSS 1. T SS 2. El anlisis de varianza anterior fue derivado bajo el supuesto que el modelo inclua una constante (por ello utilizbamos la matriz M 0 ). En dicho caso, necesariamente R2 0. En caso de que el modelo no incluya una constante, se debe utilizar la frmula (2.5.2) utilizando TSS=Y'Y (sin desvos). 3. Al agregar regresores al modelo, el R2 nunca decrecer (se mantendr constante o aumentar) 4. No es claro cuan bueno sea como predictor de ajuste. Para ver este ltimo punto, suponga que usted posee el siguiente modelo poblacional: Y = 1 + 2 X + u 48

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

donde X es un vector (n 1). Suponga ahora que restamos X a ambos lados de nuestro modelo. Obtenemos entonces:

Y X = 1 + X + uSi 2 1, entonces es fcil vericar que el R2 del primer modelo ser cercano a 1, mientras que el del segundo sera cercano a cero, a pesar de que los modelos son matemticamente equivalentes. A pesar de lo anterior, en trabajos aplicados, el R2 es ampliamente utilizado, por lo cual se recomienda su publicacin. Retrocedamos ahora al punto tres. El nos dice que el coeciente de determinacin probablemente crecer al incluir regresores. Ello plantea incentivos a incluir regresores no relevantes para nuestro modelo, con el n de obtener un mejor ajuste. Porqu sucede esto?, ya que al incluir regresores, la RSS necesariamente decrece (o en el mejor de los casos se mantiene), mientras que la TSS permanece constante. Por esta razn se cre el coeciente de determinacin ajustado, el cual corrige el R2 original por los grados de libertad del numerador y el denominador. Entonces, denimos el R2 ajustado (R2 ) como:

u u/(n k) R2 = 1 Y M Y /(n 1)o equivalentemente:

(2.54)

(n 1) R2 = 1 (1 R2 ) (n k)

(2.55)

49

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.8. InferenciaUna vez que hemos estimado nuestra regresin muestral, es necesario preguntarse cuan buena aproximacin es dicha regresin de la poblacional. Para que la aproximacin sea cercana, es condicin necesaria que los parmetros incluidos en la regresin muestral sea estadsticamente distintos de cero (en caso contrario, no pertenecen a la regresin poblacional). As, uno de nuestros objetivos puede ser el testear la signicancia individual de los parmetros. Pero lo anterior es slo una de las preguntas que como investigadores podemos estar interesados en responder. Por ejemplo, en la estimacin de la funcin de produccin de una rma, que asumimos Cobb Douglas (Y = AK L eu o en logaritmo ln Y = ln A + ln K + ln L + u), podemos estar interesados en descubrir si la rma presenta rendimientos constantes, crecientes o decrecientes a la escala, lo cual se reejar en que + > o 1. Por lo tanto, ello podra ser otra hiptesis interesante de plantearse. Tambin podra ser interesante descubrir si todos los parmetros a la vez son distintos de cero, o de algn valor determinado. La gama de preguntas posibles respecto del valor de los parmetros es slo acotada por la pregunta que el investigador desee responder. Nuestro objetivo es, por lo tanto, desarrollar los mtodos de inferencia y contraste de hiptesis que nos permitan responder, en el contexto de una regresin muestral particular, las preguntas anteriores. Dos notas precautorias. En esta seccin nos ocuparemos de restricciones o hiptesis lineales sobre los coecientes. Restricciones no lineales son ms escasas en econometra aplicada y se desarrollan en contexto de un modelo particular. Segundo, en todo lo que se reere a este apartado, asumiremos que los errores de nuestra regresin muestral siguen una distribucin normal (ya veremos porqu). Entonces, sea nuestro modelo poblacional

Y = X + udonde X es una matriz de (n k ),u e Y son vectores (n 1) y es vector de (k 1). Sean entonces las siguientes hiptesis: 1. H0 : i = 0 Plantea que el regresor Xi no posee inuencia alguna sobre Y. Este es el test ms comn y nos referiremos a l como test de signicancia. 50

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2. H0 : i = i0 Plantea que el regresor Xi posee un impacto determinado por i0 sobre Y. 3. H0 : i + j =1 Plantea que la suma de los regresores Xi y Xj poseen un impacto conjunto de magnitud 1. 4. H0 : i = j Plantea que los regresores Xi y Xj poseen el mismo impacto sobre Y. 5. H0 : i =0 i=2. . . k Plantea que todos los regresores conjuntamente, excepto la constante, son cero. 6. H0 : l =0 donde el vector ha sido particionado en dos (l y p ) con dimensiones (kl 1) y (kp 1) respectivamente, tal que kl + kp = k . Plantea entonces que un subconjunto de parmetros son estadsticamente no signicativos. Todas las hiptesis anteriores pueden ser resumidas en la siguiente expresin:

R = rdonde R es una matriz de (q k ) constantes conocidas (ceros o unos), cuyo objetivo ser seleccionar los parmetros a testear, cuyo nmero de las, q, representa el nmero de restricciones. A su vez, r es un vector de dimensin q y contiene el real al cual es restringido cada parmetro. Veamos como sern las matrices R y r en cada una de nuestras hiptesis: 1. R =[0. . . 010 . . . 0]; r=0; q=1 donde 1 se encuentra en la i-sima posicin 2. R =[0. . . 010 . . . 0]; r=i0 ; q=1 donde 1 se encuentra en la i-sima posicin 3. R =[0. . . 010 . . . 010 . . . 0]; r=1; q=1 donde 1 se encuentra en la i-sima posicin y en la j-sima posicin. 4. R =[0. . . 010 . . . 0-10 . . . 0]; r=0; q=1 donde 1 se encuentra en la i-sima posicin y en la j-sima posicin. 5. R =[0q1 Ik1 ]; r=0; q=k 1 6. R =[0ki kj Iki ]; r=0; q=ki 51

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Entonces, nuestra hiptesis nula corresponde a:

H0 : R = r

(2.56)

con lo cual, slo nos resta derivar el test que nos permita rechazar o no rechazar nuestra nula. La construccin del estadgrafo es como sigue. Dado que MCO (bajo los supuestos relevantes) es insesgado, tenemos que E() = , por lo tanto, E(R) = R , mientras que la varianza de R corresponde a

V [R] = E[R( )( ) R ] = RV ar()R = 2 R(X X)1 RNecesitamos an un supuesto ms para determinar la distribucin muestral de nuestra nula. Dado que es funcin de u y u N (0, 2 ), entonces N (, 2 (X X)1 ) 2 1 y por lo tanto R N (r, R(X X) R ), entonces:

N [, 2 (X X)1 ]y

(2.57)

R N [R, 2 R(X X)1 R ]y si la nula R = r es cierta:

(2.58)

(R r) N [0, 2 R(X X)1 R ]

(2.59)

luego estandarizamos, con lo cual:

(R r) 2 R(X X)1 R

N [0, 1]

(2.60)

Adems, se puede demostrar que (hacerlo)5 :

uu 2 (nk) 2Luego, se puede demostrar que (hacerlo)6 :

(2.61)

(R r) [ 2 R(X X)1 R ]1 (R r) 2 q5 Basta

(2.62)

con recordar que si x corresponde a un vector de realizaciones normales (0,1), por lo cual x N (0, 2 I) y A corresponde a una matriz simtrica e idempotente de rango n, entonces 1 2 2 x Ax n . Finalmente, recuerde que u = M Y = M u y que el rango de una matriz simtrica e idempotente es su traza. 6 Basta con recorder que si el vector x, de dimensin n, es tal que x N (0, ), entonces, x 1 x 2 . n

52

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

luego, combinando los dos resultados anteriores, se puede demostrar que (hacerlo)7 :

[(R r) [R(X X)1 R ]1 (R r)]/q F(q,nk) u u/(n k)

(2.63)

El test expuesto en (2.63) corresponde a la forma general del test F. Dicho test es de utilidad para testear cualquier hiptesis de la forma expuesta en (2.56). A continuacin veremos subcasos de dicho test general.

2.8.1. Test t (Una hiptesis lineal)Reescribiendo el test F como:

[(R r) [RV ar()R ]1 (R r)] F(q,nk)y haciendo el reemplazo respectivo de R y r correspondientes a las hiptesis 1 o 2 (H0 : i = 0 = i0 ), llegaremos a:

F =

( i0 )2 V ar(i )

F (1, n k)

(2.64)

Recordando que t2 es una caso particular de una F con un grado de libertad en el numerador, tenemos que:

t=

i0 V ar(i )

tnk

(2.65)

Lo anterior es conocido como el test t (test de signicancia) y en su versin ms utilizada corresponde a t = , donde se busca testear la hiptesis nula de que el parmetro es cero. El test t tambin cubre los casos 3. y 4.. En el caso 3. por ejemplo (H0 : i +j =1), el estadgrafo corresponder a:V ar(i )

t=

i + j 1 V ar(i ) + 2Cov(i , j ) + V ar(j )

tnk

(2.66)

La distribucin t es simtrica y se aproxima a la normal para tamaos de muestrasun poquito de lgebra y recordar como se construye una distribucin F(q, n-k) a partir de la divisin de dos 2 con grados de libertad q en el numerador y n-k en el denominador.7 Slo

53

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

grandes, sin embargo, la t posee colas ms gruesas que la normal (lo cual es ms pronunciado en muestras pequeas: n30). La siguiente gura expone la relacin entre la distribucin t y la normal:Probabilidad

Distribucin Normal

Distribucin t

0

Nota precautoria:Toda la derivacin anterior se basa en el estricto supuesto de normalidad de los errores. En caso de que los mismos no distribuyan normal, la distribucin del test F (y por lo tanto el del t) es desconocida en muestras nitas. Sin ema bargo, es posible demostrar que t N (0, 1), es decir, que el test t distribuye asintticamente normal. Luego, los valores crticos de t y (normal estndar) se encuentran sumamente cerca si n-k30, por lo cual, en trminos prcticos no importa mucho cual de ellas escojamos para los valores crticos (a menos que la muestra sea especialmente pequea). Finalmente, nos queda examinar los criterios de rechazo del test y los niveles de conanza. Como usted recordar de sus clases de estadstica, lo anterior depende de como especiquemos la hiptesis alternativa. A continuacin, pasamos a revisar este punto. 54

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Criterio de Rechazo y Nivel de ConanzaUna vez que hemos calculado el valor del test para nuestra nula particular (o valor calculado ), resta calcular el valor crtico o el valor que nos indica la tabla t. Dicho valor crtico nos dir si nuestra nula es falsa o si no podemos armar que lo es. La eleccin de dicho valor crtico se toma desde la tabla de distribucin t y el nmero debe ser escogido tomado en cuenta el nivel de signicancia escogido (1 %, 5 % o 10 %), el cual a su vez determina el nivel de conanza del test (99 %, 95 % o 90 %, respectivamente). El nivel de conanza posee una explicacin intuitiva: Nuestro estadgrafo es funcin de la muestra con lo que estamos trabajando, por lo cual, si contramos con una gran nmero de ellas y con cada una pudisemos calcular nuestro estadgrafo, el nivel de conanza indica el porcentaje de veces que calculamos nuestro estadgrafo en que realmente no rechazamos lo cierto o rechazamos correctamente lo falso. La forma en que se distribuya la probabilidad de rechazo, es decir, el nivel de signicancia, depende de nuestra hiptesis alternativa. A continuacin revisamos dicho asunto. Test de una cola Supongamos que nuestra hiptesis es:

H0 : i = io H1 : i > iodonde i0 R. En dicho caso, el estadgrafo es calculado segn lo propuesto en la seccin anterior. El punto est en como acumulamos la probabilidad de rechazo. En este caso, el total de la probabilidad de rechazo se acumula en la cola derecha de la distribucin, como lo muestra la siguiente gura8 :qu en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel de signicancia, nos indica hasta donde puedo tolerar un valor mayor a io , por lo cual, carecera de sentido que la zona de rechazo se encuentre en la cola izquierda de la distribucin. Por ejemplo, si io =0, la distribucin de nuestro estadgrafo se centra en cero (vea la frmula), por lo cual la hiptesis alternativa correspondera a que el parmetro es positivo. el punto es cun positivo puedo aceptar que sea?.8 Por

55

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Probabilidad

Se Rechaza (5%) No se Rechaza

por lo tanto, rechazaremos nuestra hiptesis nula de que el coeciente es cero contra la hiptesis alternativa que el parmetro es mayor que io , si el valor calculado del test es mayor al valor crtico de la tabla t. En el caso que H1 sea que el parmetro es menor a io , entonces la probabilidad de rechazo se concentra en la cola izquierda y se rechaza la nula en el caso que el valor calculado sea menor que el valor crtico de la tabla t.

Test de dos colasSupongamos que nuestra hiptesis es:

H0 : i = io H1 : i = ioEn este caso estamos repartiendo uniformemente la probabilidad de rechazo en ambas colas de la distribucin como lo muestra la siguiente gura (al 95 % de conanza):

56

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Probabilidad

Se Rechaza (2,5%)) No se Rechaza

Se Rechaza (2,5%)

Por lo tanto, rechazaremos la nula si el valor calculado es en mdulo mayor que el valor crtico de tabla. Note que en este caso, la probabilidad de rechazo se reparte un partes iguales en ambas colas. Ello se justica en que la distribucin t corresponde a una distribucin simtrica.

Error de Tipo I, Error de Tipo II, Tamao y Potencia de un testAntes de continuar, veremos cuatro conceptos estadsticos importantes que nos indican caractersticas de nuestro test. 1. Error de Tipo I (ETI): Corresponde a la probabilidad de rechazar la nula cuando es cierta. 2. Error de Tipo II (ETII): Corresponde a la probabilidad de aceptar la nula cuando es falsa. 3. Tamao del Test: Corresponde la probabilidad de cometer ETI. Se dene como el nivel de signicancia del test (). 4. Potencia del Test: Corresponde a la probabilidad de rechazar la nula cuando es falsa. Se dene como Potencia =1-ETII. El ptimo para el investigador sera minimizar ambos tipos de errores y tener un test con un menor tamao y mayor potencia posibles, sin embargo, note que el 57

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

tamao del test y por lo tanto, el ETI, es una variable endgena al investigador, en tanto que l decide con que nivel de conanza trabajar. Luego, el objetivo se transforma en, dado un nivel de conanza, minimizar la ocurrencia de ETII. Intuitivamente, si usted escoge un nivel de signicancia pequeo (1 %, por ejemplo), sus zonas de rechazo sern pequeas, con lo cual, inevitablemente, la zona de no rechazo crece, lo cual implica que por minimizar el ETI, ha aumentado el ETII.

P-valueOtra forma alternativa al valor crtico de tabla para rechazar o no rechazar nuestra nula, corresponde al uso de los llamados p-values, los cuales son reportados en cualquier paquete estadstico. El p-value (p) se dene como:

p = p(tcalculado ) = P (|Z| |tcalculado |) = 2(1 (|tcalculado |))

(2.67)

es decir, el p-value representa la probabilidad de que el valor crtico (t de tabla, en nuestro caso), sea mayor al valor t calculado, es decir, describe el nivel de significancia exacto asociado a un resultado economtrico en particular. Por ejemplo, un p-value de 0.07 indica que un coeciente es estadisticamente signicativo en un nivel de 0.07 (o con un 93 % de conanza).

Ejemplo:Suponga el siguiente Modelo de Regresin Lineal Simple:

Yi = 1 + 2 Xi + ui

para i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y: Y X 2 0 5 10 6 18 7 20

El estimador MCO de 1 y 2 es el siguiente:

=

1 2

=

4 48 48 824

1

20 298

=

2,1935 0,2338

La matriz de varianzas y covarianzas de es: V () = u (X X)1 2 0,436 = 2 4 48 48 8241

=58

0,180866 0,010536 0,010536 0,000878

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

Primero veamos el ajuste de este modelo, es decir, en que grado la variable x 2 explica a la variable y , para lo cual calculemos el R2 y R :

R2 = 1 R2

RSS =1 T SS

u2 i 0,436 =1 = 0,969 4 14 (Yi Y )2 i=1 u2 /2 i = 0,953 4 2 i=1 (Yi Y ) /34 i=1

4 i=1

RSS/2 = 1 =1 T SS/3

Como podemos ver, el grado de ajuste del modelo es bastante bueno, como el modelo incluye constante, el R2 se puede interpretar como la proporcin de la variabilidad de la variable independiente que es explicada por la variabilidad de la variable dependiente, la que en este caso alcanza un 97 %. Ahora veamos si estos parmetros estimados son signicativos a un 95 % de conanza, para lo cual realizaremos un test t de signicancia a cada uno de ellos:

1. Test de signicancia de 1 :

H0 : 1 = 0 H1 : 1 = 0 t= 1 V ar(1 ) t2

De esta forma, el valor calculado para el estadstico t es: 2,193548387 tc = = 5,157850523 0,180866 El valor de tabla del estadstico t a un 95 % de conanza y con dos grados de libertad es 4,303.Probabilidad

Se Rechaza (2,5%))

No se Rechaza

Se Rechaza (2,5%)

t(2)=4,303

t(2)=4,303

tc=5,158

59

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

De esta forma, se rechaza la hiptesis nula de que 1 =0, y por lo tanto el parmetro estimado resulta ser estadsticamente signicativo. 2. Test de signicancia de 2 : H0 : 2 = 0 H1 : 2 = 0 t= 2 V ar(2 ) t2

De esta forma, el valor calculado para el estadstico t es:

0,233870968 = 7,892762865 tc = 0,000878El valor de tabla del estadstico t a un 95 % de conanza y con dos grados de libertad es 4,303.Probabilidad

Se Rechaza (2,5%))

No se Rechaza

Se Rechaza (2,5%)

t(2)=4,303

t(2)=4,303

tc=7,893

De esta forma, se rechaza la hiptesis nula de que 2 =0, y por lo tanto el parmetro estimado resulta ser estadsticamente signicativo.

3. TAREA: Testee la siguiente hiptesis nula: H0 : 1 2 = 2 H1 : 1 2 = 2

60

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.8.2. Test F (Conjunto de hiptesis lineales)Los casos 6. y 5. corresponden a un conjunto de hiptesis a testear. En el caso 5. corresponda a un subconjunto particular de parmetros, mientras que el caso 6. corresponda a la nula de que todos ellos eran cero, menos la constante. En dichos casos se aplica la frmula del test F segn la ecuacin (2.63) y los criterios de rechazo siguen lo expuesto en la seccin anterior. Sin embargo, en ambos casos podemos derivar expresiones alternativas para nuestro test.

Todas las pendientes del modelo son cero: En este caso, se puededemostrar que el test F puede expresarse como:

F =

ESS/(k 1) F(k1,nk) RSS/(n k)

(2.68)

o alternativamente, utilizando la denicin del R2 :

F =

R2 /(k 1) F(k1,nk) (1 R2 )/(n k)

(2.69)

Un subconjunto de las pendientes del modelo son cero: En estecaso, se puede demostrar que el test F puede expresarse como:

F =

( u u u)/k2 u F (k2 , n k) u u/(n k)

(2.70)

donde u denotan los residuos MCO restringidos (donde k2 representa el nmero de regresores que han sido restringidos a cero), mientras que u representan los residuos del modelo MCO original.

2.8.3. Intervalos de ConanzaUna forma alternativa (o mejor dicho complementaria) de examinar la signicancia estadstica de un parmetro ( o un conjunto de ellos) es a travs de intervalos de conanza (IC). Ellos nos indican, dado un nivel de conanza, el rango de valores admisibles del coeciente que se estima. Los niveles de conanza generalmente utilizados son 99 %, 95 % y 90 % (al igual que en los test de hiptesis), 61

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

donde el tamao de los mismos es necesariamente decreciente9 .

Una manera natural de obtener el IC asociado a i es a travs del test t asociado. Vimos entonces que l corresponde a: i i0 V ar(i ) tnk

entonces, si deseamos un IC del (1-) % de conanza (es decir, de % de signi cancia) para el parmetro i , basta obtener de las tablas de distribucin el valor correspondiente, es decir: i i0 1 = P r Z/2 Z1/2 V ar(i ) i i0 = P r Z1/2 Z1/2 i ) V ar(

= P r i Z1/2

V ar(i ) i0 i + Z1/2

V ar(i )

donde la tercera expresin se obtiene de despejar i0 de la segunda. Note que el intervalo ha sido construido en base a una distribucin simtrica (como la t o la normal), por lo cual el valor de tabla a escoger debe corresponder a /2. Note adems que dicho intervalo est construido slo en base a constantes conocidas. Una vez construido, se puede contrastar la nula (H0 : i = i0 ) al nivel de signicancia sencillamente observando si i0 pertenece al intervalo (en cuyo caso no rechazamos la nula) o se encuentra fuera de l (en cuyo caso rechazamos la nula)10 . Nuevamente, la validez de dicho intervalo de conanza depende crticamente del supuesto de distribucin de los errores. En el caso que el valor Z se obtenga de la tabla t, como ya sabemos, estamos suponiendo que los errores siguen una distribucin normal. Un caso ms general es utilizar los valores crticos de la distribucin normal estndar. Tambin es posible derivar regiones de conanza, es decir, IC de conanza simultneos para una conjunto de parmetros, sin embargo, su utilizacin es escasams exacta es mi estimacin del rango posible, con menos conanza puedo armar estar en lo correcto. 10 Una forma fcil de verlo es pensando en =0, es decir, que la variable x no ayuda a i0 i explicar y .9 Intuitivamente, ya que a

62

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

en econometra aplicada (a menos que su pregunta puntual lo requiera!). Finalmente derivaremos el intervalo de conanza para la varianza de los errores. Sabemos de la ecuacin (2.61) que:

uu 2 nk 2 (n k) 2 2 nk 2 (2.71)

Utilizando la misma lgica que utilizamos para el IC de un parmetro , tenemos 2 que el IC para corresponde a: (n k) 2 (n k) 2 2 2 2 nk, nk,1 = (1 )(2.72)

2 Note que los valores crticos utilizados corresponden a 2 nk,1 y nk, , ya que 2 la distribucin es una distribucin asimtrica.

2.8.4. Test de Normalidad (Test de Jarque-Bera)Consideramos ahora el problema de utilizar los momentos de los residuos MCO para hacer inferencia sobre la distribucin de los errores poblacionales. Dado que algunas de las propiedades de MCO y de la inferencia dependen del supuesto de normalidad en los errores, es importante poseer un contraste para dicho supuesto. Como es sabido, la distribucin normal es simtrica y mesocrtica. La simetra implica que el tercer momento poblacional E(u3 ) en torno a la media, es cero. El hecho que sea mesocrtica implica que la kurtosis es 3 (es decir, el ancho de las colas de la distribucin, el cual se mide utilizando el cuarto momento en torno a la media). Recordemos entonces que el coeciente de simetra poblacional se dene como: E(u3 ) S= 3 ( 2 ) 2 mientras que la kurtosis (o coeciente de):

E(u4 ) K= ( 2 )2

63

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadgrafo, construido bajo la nula de normalidad:

JB = n

S (K 3)2 + 6 24

2 (2)

a

Donde los estimadores muestrales del coeciente de asimetra y kurtosis se obtienen al considerar que un estimador natural de:

r = E[r ] ucorresponde a:

1 mr = n

n

ur ii=1

Note que el estadgrafo est denido en trminos del exceso de kurtosis, por lo cual, a menor sea el valor, menor es la probabilidad de rechazar la nula de normalidad. Note adems que el estadstico es esencialmente no constructivo, en trminos de que no nos indica que camino seguir en caso de rechazar la nula, adems de que no rechazar normalidad no implica conrmar su existencia. Sin embargo, en la prctica corresponde al test ms utilizado.

64

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2.9. PrediccinLa prediccin es una de las herramientas ms atractivas y utilizadas en Econometra. Si el modelo que hemos escogido conrma la teora en consideracin, es decir, a sobrevivido a las pruebas de hiptesis, podemos utilizar el modelo estimado Y = X para predecir. La prediccin se puede efectuar para un valor puntual de la variable dependiente, y 0 , correspondiente a un valor dado de los regresores, x0 , o predecir el valor esperado E[y 0 /x0 ] condicional a las variables explicativas. Supongamos primero que queremos predecir un valor individual de Y, y 0 , asociado a un vector de regresores x0 con j = 1, 2..., k de dimensin 1 k . j De acuerdo con el modelo economtrico se tiene que y 0 = 1 +x0 2 +.....+x0 k +u0 . 2 k Para predecir el valor de y 0 podemos utilizar la estimacin MCO del modelo, y 0 = x0 . De esta forma, el error de prediccin estar dado por :

e0 = y 0 y 0 = x0 ( ) + u0En donde se distinguen dos fuentes del error de prediccin El error en la estimacin del vector El error estocstico inherente al modelo u0 Sin embargo, si consideramos que el estimador MCO es insesgado y mantenemos los supuestos de nuestro modelo de regresin lineal, es trivial mostrar que el valor esperado del error de prediccin ser cero. Adems, podemos calcular la varianza del error de prediccin:

V ar(e0 ) = E[x0 ( )( ) x 0 + 2x0 ( )u0 + u0 u 0 ]2 2 V ar(e0 ) = + x0 (X X)1 x 0

La varianza del error de prediccin depender de la matriz de regresores X de dimensin n k que se utiliz para obtener las estimaciones de . Sabemos que a mayor dispersion de las variables explicativas menor varianza tendrn nuestras estimaciones MCO11 . Adems depender del vector x0 que hemos asumidoposible y se recomienda derivar una expresin para la varianza del error de prediccin utilizando un modelo con 2 regresores. En est expresin se aprecia claramente la dependencia de la varianza del error de prediccin con la dispersion en torno a la media de las variables explicativas.11 Es

65

Capitulo 2: Modelo de Regresin Lineal

Econometra I FACEA, Universidad de Chile

2 conocido y del parmetro , el cual no conocemos y deber ser reemplazado por 2 su estimador si es que queremos construir un intervalo de conanza para la prediccin y 0 .

Bajo supuestos de normalidad del trmino de error, el error de prediccin es una combinacin lineal de dos variables normales por lo tanto tiene una distribu2 cin Normal(0, e ). Por lo tanto, por una razonamiento anlogo al de las secciones anteriores se tiene que:

y0 y02 (1 + x0 (X X)1 x 0 )

N (0, 1)

y0 y02 (1 + x0 (X X)1 x 0 )

tnk

Por lo tanto, dada una prediccin puntual y 0 y una estimacin de la desviacin estndar del error de prediccin podemos construir un intervalo de conanza para el valor de y 0 :

P r[y 0 t1/2,nk

V ar(e0 ) y 0 y 0 + t1/2,T k

V ar(e0 )] = 1

Consideremos ahora que el investigador no est interesado en predecir el valor de la variable endgena y 0 , si no tan solo su valor esperado E(y 0 ) = x0 . La prediccin, al igual que en el caso anterior, ser x0 . La diferencia es que el error de prediccin en este caso estar denido por e = E[y 0 ] x0 = x0 x0 = x0 ( ). Calculando entonces la varianza (Hacerlo!) de este nuevo error de prediccin podemos construir ahora un intervalo de conanza para E(y 0 ) de la misma forma que antes.

E[y 0 ] y 02 (x0 (X X)1 x 0 )

N (0, 1)

E[y 0 ] y 02 (x0 (X X)1 x 0 )

tnk

P r[y 0 t1/2,nk

V ar(e0 ) E[y 0 ] y 0 + t1/2,T k

V ar(e0 )] = 1

2 Donde utilizamos V ar(y