apuntes econometria i

95

Click here to load reader

Upload: pedro-cango

Post on 25-Nov-2015

106 views

Category:

Documents


10 download

TRANSCRIPT

  • UNIVERSIDAD COMPLUTENSEMADRID

    Facultad de CienciasEconmicas y Empresariales

    ECONOMETRA I

    http://www.ucm.es/info/ecocuan/ectr1

    GUIN - APUNTES ADICIONALES

    Jos Alberto Mauricio

    Departamento de Economa Cuantitativa http://www.ucm.es/info/ecocuan

  • GUIN PGINA II

    COPYRIGHT 2000-2010 Jos Alberto Mauricio http://www.ucm.es/info/ecocuan/jam Este documento puede utilizarse exclusivamente como instrumento para la docencia ocial de la asignatura ECONOMETRA I

    que se imparte en la Facultad de Ciencias Econmicas de la Universidad Complutense de Madrid. No se permite almacenar, reproducir o distribuir por medio alguno, ni tampoco utilizar este documento en cualquier sentido, fuera de los trminos mencionados anteriormente. La obtencin de este documento (Ectr1-JAM-Guion.pdf) en la direccin de Internet

    http://www.ucm.es/info/ecocuan/jam/ectr1

    implica la aceptacin de que su uso estar limitado a los trminos anteriores. ltima revisin: 21 de septiembre de 2010.

  • CONTENIDO Y BIBLIOGRAFA

    GUIN PGINA III

    CONTENIDO

    PRLOGO 1

    Regresin Lineal: De Simple a Mltiple......................................................... 2 Notacin............................................................................................................ 6

    T1 ESPECIFICACIN Y ESTIMACIN DEL MODELO LINEAL GENERAL 9

    1.1 Hiptesis Clsicas ......................................................................................... 11 1.2 Mnimos Cuadrados Ordinarios ................................................................... 23 1.3 Propiedades estadsticas.............................................................................. 28 1.4 Propiedades algebraicas............................................................................... 30 1.5 Error Estndar de la Regresin .................................................................... 31 1.6 Datos en desviaciones con respecto a la media ........................................ 32 1.7 Regresin particionada y correlacin parcial ............................................. 32

  • CONTENIDO Y BIBLIOGRAFA

    GUIN PGINA IV

    1.8 Normalidad ..................................................................................................... 33 1.9 Mxima Verosimilitud .................................................................................... 36

    T2 CONTRASTES DE HIPTESIS Y PREVISIN 38

    2.1 Contrastes de varias hiptesis..................................................................... 39 2.2 Contrastes de una nica hiptesis .............................................................. 41 2.3 Intervalos de confianza ................................................................................. 49 2.4 Restricciones lineales ................................................................................... 51 2.5 Algunos contrastes como elementos de diagnosis................................... 52 2.6 Previsin......................................................................................................... 53

    T3 EXTENSIONES 55

    3.1 Transformaciones lineales............................................................................ 55 3.2 Multicolinealidad............................................................................................ 56 3.3 Errores de especificacin ............................................................................. 59 3.4 Variables explicativas binarias..................................................................... 62

  • CONTENIDO Y BIBLIOGRAFA

    GUIN PGINA V

    APUNTES ADICIONALES PARA EL TEMA 1 71

    A.1 MCO en modelos sencillos ........................................................................... 71 A.2 Coeficientes de determinacin..................................................................... 73 Matrices inversas particionadas....................................................................... 75 A.3 Datos en desviaciones con respecto a la media ........................................ 76 A.4 Regresin particionada y correlacin parcial ............................................. 81

  • CONTENIDO Y BIBLIOGRAFA

    GUIN PGINA VI

    BIBLIOGRAFA

    TEMA 1

    J.M. WOOLDRIDGE (2006): CAPTULOS 2 Y 3. SECCIONES 6.2 Y 6.3. APNDICES E1 Y E2. M. VERBEEK (2004): SECCIONES 2.1, 2.2, 2.3, 2.4 Y 3.1.

    F. HAYASHI (2000): SECCIONES 1.1, 1.2, 1.3 Y 1.5.

    TEMA 2

    J.M. WOOLDRIDGE (2006): CAPTULO 4. SECCIN 6.4. APNDICE E3. M. VERBEEK (2004): SECCIONES 2.5, 2.9 Y 3.3.

    F. HAYASHI (2000): SECCIN 1.4.

    TEMA 3

    VER INDICACIONES AL FINAL DE CADA APARTADO DEL GUIN.

  • ECONOMETRA I PRLOGO

    GUIN PGINA 1

    PRLOGO

    The key question in most empirical studies is: Have enough other factors been held fixed to make

    a case for causality? Rarely is an econometric study evaluated without raising this issue. In most

    serious applications, the number of factors that can affect the variable of interest such as []

    wages is immense, and the isolation of any particular variable may seem like a hopeless effort.

    However, we will eventually see that, when carefully applied, econometric methods can simulate

    a ceteris paribus experiment. [] As we will see throughout this text, accounting for other

    observed factors, such as experience, when estimating the ceteris paribus effect of another

    variable, such as education, is relatively straightforward. We will also find that accounting for

    inherently unobservable factors, such as ability, is much more problematic. It is fair to say that

    many of the advances in econometric methods have tried to deal with unobserved factors in

    econometric models.

    J.M. WOOLDRIDGE

    Introductory Econometrics A Modern Approach 2006

  • ECONOMETRA I PRLOGO

    GUIN PGINA 2

    REGRESIN LINEAL: DE SIMPLE A MLTIPLE

    Como se vio en la Denicin 2.2 de la Introduccin a la asignatura, una dicultad asociada con la evaluacin del efecto causal de una variable X sobre otra variable Y utilizando solamente datos sobre X e Y, tiene que ver con que Y puede depender de otros factores

    observables relacionados con X que no se consideran explcitamente en el anlisis. Si estos factores pudieran incluirse de forma explcita en la investigacin de una posible relacin

    causal entre X e Y (en un "modelo"), entonces al menos dicha dicultad no estara presente. Para verlo, considrese (en la lnea de la Denicin 2.2 de la Introduccin) la respuesta total de Y ante una variacin de cuanta X en X, X X W X V XY F X F W F V + + , junto con la respuesta total de Y ante una variacin de cuanta W en W, W W X W V WY F W F X F V + + . En la Denicin 2.2 se vieron las implicaciones de considerar individualmente tan slo la primera de estas expresiones. Sin embargo, ambas pueden escribirse conjuntamente como

  • ECONOMETRA I PRLOGO

    GUIN PGINA 3

    [ ] [ ] [ ] [ ]

    X X X XV

    WW W W

    Y X W F VF

    FY X W V

    + XWXW XWFY XW V

    , [A]

    o bien, de manera ms compacta y explcita, como

    [ ] [ ] [ ] [ ]

    [ ] [ ] [ ] [ ]Efectos Totales

    1

    Efectos Directos Efectos Indirectos

    .

    V

    V

    F

    F

    + = = +

    XW XW XW

    XW XW

    Y XW F V

    XW F XW V

    [B]

    Esta expresin (que puede considerarse una extensin de la ecuacin [4] en la Denicin 2.2 de la Introduccin) pone de maniesto que [ ] [ ] [ ]1 XW XWXW Y F siempre que O bien 0VF = , de manera que V no inuya directamente sobre Y, O bien [ ] =XWV 0 , de manera que V no vare sistemticamente ni con X ni con W.

  • ECONOMETRA I PRLOGO

    GUIN PGINA 4

    Por lo tanto, si las inuencias no observables recogidas en V son independientes tanto de X como de W, entonces el efecto causal de X sobre Y (al igual que el de W sobre Y, que tambin podra tener cierto inters) se puede evaluar de manera able a partir de [A]-[B] utilizando datos sobre Y, X y W, a pesar de que X y W estn relacionadas entre s.

    Por el contrario, como se vio en la Denicin 2.2 de la Introduccin, el efecto causal de X sobre Y no podra evaluarse ablemente a partir tan slo de la primera ecuacin en [A] (incluso suponiendo que 0XV = ), a menos que o bien 0WF = , o bien 0XW = . La ventaja de incluir a W en un anlisis de causalidad de X sobre Y, reside justamente en que la inclusin de W elimina la necesidad de asumir ciertas hiptesis (como 0WF = , o

    0XW = ) que pueden resultar difciles o imposibles de justicar en la prctica. Esta conclusin sugiere que en un anlisis de causalidad sobre Y es recomendable considerar explcitamente tantas inuencias observables como sea posible y razonable, a pesar de que en ltima instancia quizs interese evaluar el efecto directo o causal de tan

    slo una de dichas inuencias.

  • ECONOMETRA I PRLOGO

    GUIN PGINA 5

    En este sentido, el modelo RLS del Ejemplo 2.8 de la Introduccin puede ampliarse para

    recoger explcitamente otras inuencias directas sobre Y adicionales a la inuencia lineal de X. Esta ampliacin da lugar a un modelo de regresin lineal mltiple (RLM), en el que todas las inuencias que recibe Y se resumen mediante una expresin matemtica del tipo 1 2 2 3 3 ... K KY X X X U = + + + + , [C] donde 2X , 3X , ..., KX son 1K variables explicativas observables, posiblemente relacionadas entre s. Por su parte, U representa todas las inuencias (observables y no observables) sobre Y que no estn recogidas en 1 2 2 3 3 ... K KX X X + + + + . Observacin tcnica (prescindible): A partir de [C], las respuestas totales de Y ante variaciones de cuanta jX en

    jX ( 2, 3, ..., )j K= pueden escribirse conjuntamente (en la lnea de la ecuacin [A]) como

    [ ] [ ]

    2 2

    3 3

    2

    2 3.2 .2 2

    2.3 3 .3 3

    2. 3.K K

    KX X

    X XK

    X XK K K K

    X X XY U

    Y UX X X

    Y UX X X

    = + XY XX

    ""

    # ## # % # #"

    [ ]

    XU

    , [D]

  • ECONOMETRA I PRLOGO

    GUIN PGINA 6

    o bien, de manera ms compacta y explcita (en la lnea de la ecuacin [B]), como

    [ ] [ ] [ ]

    [ ] [ ] [ ]

    2

    Efectos Totales

    12

    Efectos Directos Efectos Indirectos

    .

    = + = = +

    X X

    X

    Y XX U

    XX XX U

    [E]

    Esta expresin (que puede considerarse una extensin de [6] en el Ejemplo 2.8 de la Introduccin) indica que [ ] [ ]1 2 =XXX Y siempre que [ ] =XU 0 , es decir, siempre que U en [C] no vare sistemticamente con ninguna variable explicativa. Por lo tanto, si las inuencias recogidas en U son independientes de todas las variables explicativas, entonces tanto 2 como 3 , ..., K pueden evaluarse de manera able a partir de [E] utilizando datos sobre Y, 2X , 3X , ..., KX . Por el contrario, como se vio en el Ejemplo 2.8, 2 no podra evaluarse ablemente a partir tan slo de la primera ecuacin en [D] (incluso suponiendo que

    2 0XU = ), a menos que .2 0j jX = para todo 3, ...,j K= . La ventaja de incluir a 3X , ..., KX junto con 2X en [C] en relacin con un anlisis de causalidad de 2X

    sobre Y, reside justamente en que la inclusin de 3X , ..., KX elimina la necesidad de asumir ciertas hiptesis (como que bien 0j = , o bien .2 0jX = , para todo 3, ...,j K= ) que pueden resultar difciles de justicar en la prctica.

    NOTACIN

    Las variables aleatorias (v.a.s) se representan con letras maysculas 1 12( , , ...)Y X ; sus

    valores observados se representan con las letras minsculas correspondientes 1 12( , , ...)y x .

  • ECONOMETRA I PRLOGO

    GUIN PGINA 7

    En general, las matrices se representan con letras maysculas en negrilla ( , , , ...)X A incluso si sus componentes no son v.a.s. Los vectores se representan con letras minsculas

    en negrilla 2( , , , ...)y x . Un vector se representa con una letra mayscula slo cuando sus componentes son v.a.s ( , , , ...,Y Y U cuyos valores observados se representan como

    , , , ...y y u ). Todos los vectores se consideran vectores columna. Se utiliza el smbolo (como en , , , ... A c ), en lugar de un superndice T, como smbolo de trasposicin. Las cantidades escalares (matrices de dimensin 1 1 ) se representan en cursiva ( 23 , , , , ...t F ). Los momentos muestrales (estadsticos) se representan como X (media), 2SX (varianza),

    SXY (covarianza) y RXY (coeciente de correlacin lineal simple); sus valores observados (calculados) se representan con los mismos smbolos en minscula.

    Las v.a.s (como estimadores y estadsticos de contraste) que dependen a su vez de una

    coleccin W de v.a.s, se representan con un subndice W ( 2 , , , ...FW WW ); sus valores calculados a partir de una observacin (datos) w sobre W dada se representan sin dicho subndice ( 2 , , , ...F ). El smbolo E[ ] representa la esperanza de una v.a. (escalar, vectorial o matricial). El

  • ECONOMETRA I PRLOGO

    GUIN PGINA 8

    smbolo Var[ ] representa la varianza de una v.a. cuando dicha v.a. es escalar, en cuyo caso a veces se emplea el smbolo [ ] , o bien una matriz de varianzas-covarianzas cuando dicha v.a. es vectorial, en cuyo caso a veces se emplea el smbolo [ ] (en negrilla). El smbolo Cov[ , ] (Cv[ , ] ) representa la covarianza (estimada) entre dos v.a.s de cualquier tipo. Los smbolos [ ] W y [ ]W representan estimadores (que dependen de W) de la varianza correspondiente, cuyos valores observados (estimaciones) se representan como [ ] y [ ] (sin el subndice W), o simplemente como Vr[ ] . El smbolo (ms grande que el smbolo anterior) se emplea con mucha frecuencia para representar un sumatorio como 1Ni= .

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 9

    TEMA 1 ESPECIFICACIN Y ESTIMACIN DEL MODELO LINEAL GENERAL

    Se pretende cuanticar una supuesta relacin estocstica unidireccional entre cierta variable Y (variable dependiente) y 1K variables 1 2, , ..., KX X X (variables explicativas), sobre las que se dispone de una coleccin de datos o muestra

    1 11 12 1

    2 21 22 21 2

    1 2

    [ , , , ..., ]

    K

    KK

    N N N NK

    y x x x

    y x x x

    y x x x

    w y x x x

    ""

    # # # #"

    .

    Observacin preliminar I: Con el n de simplicar el lgebra matricial que se utiliza en la denicin y el anlisis del modelo lineal general (MLG), para especicar un modelo con trmino constante (como un modelo RLS, o un modelo RLM como [C]) la matriz w anterior se dene de manera que 1 1ix ( 1, 2, ...,i N= ) ( 1 [1, 1, ..., 1] x ). En este caso solamente hay 1K variables explicativas "reales" ( 2X , ..., KX , como en el modelo RLM [C]), ya que 1X es de hecho una constante "articial".

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 10

    Las N las de datos 1 2[ ... ]i i i iKy x x x ( 1, 2, ..., )i N= en w pueden referirse a N entidades observables en un momento dado (datos de seccin cruzada; ver Ejemplo 2.5 en la Introduccin a la asignatura), o bien a N momentos consecutivos de la historia de una

    nica entidad observable (datos de series temporales; ver Ejemplo 2.7 en la Introduccin).

    La estimacin numrica de los parmetros 1 2, , ..., K en un modelo como [C] es un problema de fcil solucin prctica (Seccin 1.2).

    No obstante, la cuestin central acerca de los parmetros 1 2, , ..., K no reside tanto en cmo calcular numricamente estimaciones de todos ellos, sino sobre todo en cul es el

    grado de abilidad o precisin de dichas estimaciones. Una posibilidad para calibrar ese grado de precisin (especialmente en entornos no experimentales), consiste en plantear ciertas hiptesis acerca de los elementos del modelo en el que guran 1 2, , ..., K , y derivar las conclusiones a las que conducen dichas hiptesis. La validez de esas conclusiones depender de si las hiptesis utilizadas son razonables, especialmente en comparacin con las caractersticas muestrales de los datos empleados.

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 11

    1.1 HIPTESIS CLSICAS

    H1 Linealidad con respecto a los parmetros

    Los datos disponibles son una realizacin particular de una coleccin de variables aleatorias

    1 11 12 1

    2 21 22 21 2

    1 2

    [ , , , ..., ]

    K

    KK

    N N N NK

    Y X X X

    Y X X X

    Y X X X

    W Y X X X

    ""

    # # # #"

    tal que

    1 1 2 2 1... ( 1, 2, ..., )K

    i i i K iK i j ij ijY X X X U X U i N == + + + + = + = , [1] donde 1 2, , ..., K son K parmetros cuyos valores (desconocidos) son los mismos en todos los puntos muestrales, y iU (1 )i N es una perturbacin aleatoria no observable asociada con el -simoi punto muestral.

    Observacin preliminar II: Para modelos con trmino constante, 1 1iX ( 1, 2, ...,i N= ) ( 1 [1, 1, ..., 1] X ).

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 12

    La ecuacin [1] puede escribirse como

    = +Y X U , [2] donde

    ""

    # # ## # # #"

    111 12 11 1 1

    2 2 221 22 2 2

    1 11

    1 2

    , , ,

    K

    K

    N N K NK

    N K NN N NK N

    X X XY U

    Y UX X X

    Y UX X X

    =

    X

    XY X U

    X

    ,

    o bien como

    ( 1, 2, ..., )i i iY U i N= + =X , [3] donde 1 2[ , , ..., ]i i i iKX X X X es la -simai la de la matriz X. Observacin 1: Una X con un subndice puede representar, segn el contexto, una columna o una la de la matriz X. Por ejemplo, 1 2[ , , ..., ] (1 )j j j NjX X X j K X es la -simaj columna ( 1)N de X; los subndices j y k se emplean para representar columnas (variables) de X. Por otro lado, 1 2[ , , ..., ] (1 )i i i iKX X X i N X es un vector columna ( 1)K cuyo traspuesto es la -simai la (1 )K de X (ver la ecuacin [3] anterior); los subndices i y t se emplean para representar las (entidades observables o momentos) de X.

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 13

    Observacin 2: El MLG tiene trmino constante cuando 1 1 para todo 1, 2, ...,iX i N = . En este caso, [1] queda 1 2 2 1 2... ( 1, 2, ..., ),

    Ki i K iK i j ij ijY X X U X U i N == + + + + = + + = [1]

    donde 1 es el trmino constante y 2, ..., K son las pendientes del modelo. Las ecuaciones [2] - [3] siguen siendo vlidas en este caso, redeniendo la matriz X para que su primera columna sea ahora 1 [1, 1, ..., 1]X (de manera que la -simai la de X sea ahora 2[1, , ..., ]i i iKX X X ):

    12 1

    22 2

    2

    1

    1

    1

    K

    K

    N NK

    X X

    X X

    X X

    X

    ""

    # # #"

    .

    Observacin 3 - Muy importante: El MLG es lineal porque los parmetros que guran en su lado derecho lo hacen de forma lineal (a lo sumo, estn multiplicados por un trmino que no depende de ningn parmetro del modelo), como en [1] y [1]. No obstante, en el MLG pueden aparecer cualesquiera transformaciones lineales y no lineales de las variables originales de inters, como en los ejemplos siguientes (donde Q y P representan variables originales):

    Modelo lineal 1 2i i iQ P U = + + . [M1] Modelo log-log o logartmico 1 2ln lni i iQ P U = + + . [M2] Modelo log-lineal o semilogartmico 1 2ln i i iQ P U = + + . [M3] Modelo lineal-log 1 2 lni i iQ P U = + + . [M4]

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 14

    Modelo recproco 11 2i

    i iPQ U = + + . [M5] Modelo cuadrtico 21 2 3i i iiQ P P U = + + + . [M6] Modelo con interaccin 1 2 1 3 2 4 1 2( )i i i i i iQ P P P P U = + + + + . [M7]

    [M1]-[M7] son casos particulares del MLG con trmino constante [1] (como puede comprobarse deniendo adecuadamente iY , ijX y K en cada caso). [M1] implica que una variacin absoluta unitaria en iP tiene el mismo efecto sobre iQ con independencia de los valores de partida de iQ y de iP . Esto no es as en [M2]-[M7]; ver Tabla 1 y Figura 1 (ver tambin el Apndice A en Ectr1-JAM-Intro.pdf). Los modelos [M1]-[M7] pueden combinarse entre s para formular modelos RLM que resultan muy exibles en la prctica; ver Ejercicio n 1.

    TABLA 1 Efectos "Ceteris Paribus" y Elasticidades en Diferentes Modelos de Regresin Lineal

    Modelo Efecto "Ceteris Paribus" Elasticidad

    [M1] 2 2i

    i

    Qi iP

    Q P = = 2 iiPQ

    [M2] 2 2% %i i

    ii

    Q Qi iPP

    Q P = 2

    [M3] 2 2% (100 )i

    i

    Qi i iP

    Q Q P = 2 iP

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 15

    [M4] ( )212 100 %i iiQ i iPP Q P = 12 iQ [M5] ( )2212 100 %i ii iQ i iPP P Q P = 12 i iQ P [M6] 2 32

    i

    i

    QiP

    P = +

    2 3( 2 )i

    i

    Pi QP +

    [M7] 1

    2 4 2i

    i

    QiP

    P = +

    12 4 2( )

    i

    i

    Pi QP +

    Observacin 4: Modelos como 21 1 21i i i iQ P P U = + + y 1 20 1 2i ii iQ P P U = + son no lineales con respecto a sus parmetros (ninguno de ellos es un caso particular del MLG). Un modelo como 1 20 1 2 i

    Ui i iQ P P e

    = es equivalente (tomando el logaritmo neperiano en ambos lados) a 0 1 1 2 2ln ln lni i i iQ P P U = + + + , con 0 0ln , que s es lineal con respecto a los parmetros 0 , 1 y 2 . En general, un modelo de regresin es no lineal cuando ni es lineal en su formulacin original, ni se puede convertir en un modelo lineal mediante alguna transformacin.

    Observacin 5 - Muy importante: En ltima instancia, la nalidad de escoger una forma funcional concreta o de transformar las variables de inters en un modelo de regresin, es obtener un modelo cuyas perturbaciones tengan unas propiedades estadsticas (ver H3, H4 y H5) que garanticen la validez de los mtodos de inferencia (estimacin, contrastes de hiptesis y previsin) que vayan a ser utilizados. Tambin deben tenerse en cuenta las implicaciones de cada forma funcional sobre el signicado de los efectos ceteris paribus de cada variable explicativa de inters.

  • ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG

    GUIN PGINA 16

    2 0 >

    1 2[M1]: i iQ P = +

    2 0

    ( )1 2 1 2[M2]: ln ln exp lni i i iQ P Q P = + = +

    21 0