ejercicios de econometria iii

41
EJERCICIOS PROPUESTOS DE ECONOMETRIA III MODELOS DE RESPUESTA CUALITATIVA Y MODELOS DE VARIABLE DEPENDIENTE LIMITADA Por Beatriz GONZÁLEZ LÓPEZ-VALCÁRCEL Jorge V. PÉREZ RODRÍGUEZ (LICENCIATURA EN ECONOMIA) Octubre 2007

Upload: jacqueline-solano

Post on 24-Nov-2015

246 views

Category:

Documents


18 download

TRANSCRIPT

  • EJERCICIOS PROPUESTOS DE ECONOMETRIA III

    MODELOS DE RESPUESTA CUALITATIVA Y

    MODELOS DE VARIABLE DEPENDIENTE LIMITADA

    Por

    Beatriz GONZLEZ LPEZ-VALCRCEL

    Jorge V. PREZ RODRGUEZ

    (LICENCIATURA EN ECONOMIA)

    Octubre 2007

  • 1

    PARTE I.

    PROBLEMAS PROPUESTOS 1. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar frente a no poseerlo, puede escribirse mediante una relacin lineal definida por el siguiente modelo: iii Eys 004.00002.007.0 ++= donde, si es una variable dicotmica que vale uno si el individuo i-simo posee un seguro y cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado. Si la renta bruta anual fuese de 4 millones de pesetas y la edad del asegurado de 30 aos, entonces: a) Cul es la probabilidad de NO poseer un seguro?. b) Cul es el incremento de probabilidad, si la renta de dicho individuo aumentase en

    200.000 pesetas?. 2. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda en propiedad o no (Y) dependa de variables como los ingresos de los individuos (INGRESOS, en miles de pesetas mensuales); si trabaja (TRABFIJO), que es una variable dicotmica que toma el valor uno si el cabeza de familia trabaja y cero en caso contrario; el sexo (SEXO), que tambin es dicotmica, tomando valor 1 si es hombre y cero si es mujer; y la edad (EDAD), que representa la edad del cabeza de familia. El siguiente cuadro recoge los valores de dichas variables para dos individuos elegidos al azar de la muestra.

    i Y Sexo Edad Ingresos Trabfijo 9 18

    1 0

    1 0

    39 46

    250 80

    0 0

    Adems, se conocen los siguientes resultados de la estimacin de un modelo logit y probit:

    Variables Logit Probit Constante Sexo Edad Ingresos Trabfijo

    -4.73 0.16 0.01 0.0194 0.02

    -2.66 0.16 0.004 0.0113 0.015

    Se pide: a) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para

    los dos individuos. b) Calcular los ODDS de cada individuo, para cada modelo. c) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el

    individuo 18 en el modelo probit.

  • 2

    3. Obtener la expresin del algoritmo de Newton-Raphson mediante los minimos cuadrados, y para el modelo: t

    xt uey t += , siendo ut una perturbacin aleatoria iid.

    4. Un banco pretende caracterizar las empresas que cumplen puntualmente todos los plazos de devolucin de los crditos que reciben. Tras crear una variable Yi, que toma valor 1 cuando las empresas cumplieron dichos compromisos y cero en caso contrario, se estimaron los siguientes modelos:

    iiii

    i

    iiii

    xxxp

    p

    xxxY

    321

    321

    90.062.032.066.11

    ln

    057.0049.0018.0069.0

    +=

    ++=

    donde x1i es el ratio (en porcentaje) entre el valor nominal de la deuda viva de la empresa y el valor total del activo; x2i es el ratio (en porcentaje) entre los beneficios despus de impuestos y el valor total del activo; y x3i es el valor del activo (como indicador del tamao de la empresa). Se pide: a) Qu modelos han sido estimados?. b) Interprtense los coeficientes estimados en ambos modelos. c) Suponga que el individuo i-simo posee los siguientes valores de las

    variables: 6.0,%8.7,%7.9 321 === iii xxx . Calcule la probabilidad de que se incumplan los compromisos en ambos modelos. Adems, obtenga los efectos marginales.

    5. En una encuesta realizada en junio de 2001 a diez alumnos de 4 curso se les pregunt si aprobaron o no la asignatura de Macroeconoma, as como la calificacin que obtuvieron en la asignatura de Econometra, con los siguientes resultados:

    Aprobaron Macroeconoma

    Calificacin Econometra

    S S No S No No S S No No

    8 8 6 6 6 5 5 4 4 4

    Se pide: a) Especificar y estimar por mnimos cuadrados ordinarios un modelo lineal que evale

    el efecto que la calificacin de Econometra tiene sobre la probabilidad de aprobar Macroeconoma.

  • 3

    b) Interpretar los valores estimados para cada uno de los coeficientes del modelo. Cul es la calificacin que debe alcanzarse en Econometra para tener una probabilidad de 0.80 de aprobar Macroeconoma?.

    c) Obtener una estimacin eficiente del modelo especificado en a). d) Si un alumno obtuvo 9.5 en Econometra, Cul es la probabilidad de aprobar

    Macroeconoma?. 6. Demostrar que las estimaciones de mnimos cuadrados ordinarios de los modelos lineales de probabilidad en el caso de alternativas mltiples:

    3333

    2222

    1111

    iii

    iii

    iii

    uxPuxP

    uxP

    ++=++=++=

    satisfacen =

    =3

    1

    1i

    i y =

    =3

    1

    0i

    i . 7. Sea 1N el nmero de individuos con 1=iY y 2N el nmero de individuos con 0=iY , demostrar que el 2R de Effron es equivalente a ( )

    =

    N

    iii PYNN

    N

    1

    2

    21

    1 .

    8. Suponga una distribucin ( ),~ Nz , la cul se encuentra truncada en el punto 4.605. Se sabe que [ ] 956.4605.4 =>zzE y el grado de truncamiento es del 95%. Calcule y . 9. Suponemos que la demanda de entradas a los conciertos (VENTAS) que se celebran en una ciudad depende del precio (PRECIO), de las condiciones meteorolgicas (METEO), que pueden ser favorables (0) o desfavorables (1) y del renombre del grupo que acta, medido en una escala de 1 a 5 (RATING). Los conciertos se celebran en un recinto que tiene capacidad para 23.000 espectadores. Se ha estimado el modelo y los resultados son:

    +---------------------------------------------+ | Limited Dependent Variable Model - CENSORED | | Maximum Likelihood Estimates | | Dependent variable VENTAS | | Weighting variable ONE | | Number of observations 90 | | Iterations completed 6 | | Log likelihood function -522.4057 | | Threshold values for the model: | | Lower=-infinity Upper=23000.0000 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Primary Index Equation for Model Constant 29588.03508 590.39079 50.116 .0000 PRECIO -4.879326375 .16399481 -29.753 .0000 2952.8667 RATING 1940.032493 122.51143 15.836 .0000 3.1555556 METEO -4513.019466 268.57781 -16.803 .0000 .18888889

    Disturbance standard deviation Sigma 923.1196055 81.283308 11.357 .0000

    Se pide:

    a) Calcular los efectos marginales evaluados en la media de las variables.

  • 4

    b) Si un grupo posee un rating igual a 5, y acta en un da con meteorologa favorable y un fan paga un precio de 5000 ptas., cules son las predicciones de la ventas considerando la censura?.

    10. En el modelo TOBIT: iii uxy += '* , A qu ser igual el valor obtenido para [ ]

    i

    iii

    xyxyE

    > 0,/ *

    ?. Y si [ ]

    i

    iii

    xyxyE

  • 5

    13. Con los resultados de una encuesta de la Fundacin FOESSA realizada en 1960, se elabora un modelo logit para explicar la posesin o no de un autmovil en un colectivo de 2414 personas. Como variable explicativa se considera la autoasignacin de los individuos a una clase social. Las clases son: alta, media alta, media, media baja y baja. Se obtienen los siguientes resultados:

    ( ) (10.46) (0.52) (0.52) (0.52) (0.51)se DDDDy iiiii

    ..69.1117.488.268.122.1 4321 =

    siendo, D1 (1=clase media alta), D2 (1=clase media), D3 (1=clase media baja) y D4 (clase baja). Calcular la probabilidad que pronostica el modelo para la posesin de automvil en cada una de las cinco clases. 14. En el anlisis de los resultados de un plan de ocupacin en donde la variable dependiente Y se le asigna el valor 1 cuando el individuo ha encontrado trabajo y 0, en caso contrario; se especifica un modelo logit que incorpora, adems de un trmino independiente, las siguientes variables explicativas: la edad del individuo (Et) y la experiencia profesional (EPt). Con este objetivo, se realiza una encuesta a 379 individuos, obteniendo la siguiente informacin:

    E=0,EP=0 E=0,EP=1 E=1,EP=0 E=1,EP=1 Total

    Respuestas Afirmativas (Y=1)

    68 50 14 19 151

    Total Respuestas 89 83 43 164 379

    Donde: Et=1 para ms de 40 aos, y 0 para menos de 40 aos. EPt=1 sin experiencia, y 0 con experiencia. Se pide: a) Si con los datos de la encuesta tuviera que estimar el modelo, escriba los elementos de

    la matriz de datos X y los del vector de la variable endgena del modelo necesarios para dicho fin.

    b) Una vez realizada la estimacin por el mtodo de mxima verosimilitud, se obtienen

    las siguientes estimaciones de los parmetros (entre parntesis aparecen los errores estndar):

    ( ) ( ) ( )26.098.0,26.023.2,22.030.1 210 ===

    Cul ser la probabilidad estimada por el modelo de que encuentre trabajo un individuo menor de 40 aos y sin experiencia?.

    15. Se quiere estudiar si los clientes de un banco utilizan o no los cajeros automticos. El estudio se hace para una muestra de 100 individuos. Se pide: a) Proponer un modelo logit que estudia esta relacin en funcin de si los clientes tienen

    ms o menos de 35 aos, de si su nivel de ingresos anuales es superior o no a 1.750.000 ptas y del nivel de movilidad del cliente. (NOTA: Se considera que un cliente es mvil si en el periodo de 10 aos ha vivido como mnimo en tres ciudades).

  • 6

    Definir las variables de manera que la categora base sea un individuo de menos de 35 aos, no mvil y con un nivel de ingresos menor a 1.750.000.

    b) Comenta los problemas de la estimacin por MCO de este modelo y las posibles soluciones.

    c) La estimacin por mxima verosimilitud proporciona los siguientes resultados:

    Parmetros t Constante Aos Ingresos Movilidad TEST RV

    -0.880 -0.882 1.216 1.129 2=18.915

    -1.733 -1.621 2.468 2.223

    1) Interpreta los resultados. 2) Cul es el aumento de probabilidad asociado a la edad? (se conoce que 47 de los

    100 individuos utilizarn los cajeros). 3) Cul es la probabilidad de que un individuo de 28 aos, con un nivel de ingresos

    anual de 2.600.000 y no mvil, utilice los cajeros automticos?. 16. Retomando el ejercicio 1. Si la renta bruta anual fuese de 3 millones de pesetas y la edad del asegurado de 30 aos, entonces, cul es la respuesta correcta?: a) Es la probabilidad de poseer un seguro igual al 79% y la varianza de la perturbacin

    en el modelo transformado bajo heterocedasticidad para este individuo es igual a la unidad?.

    b) Es el incremento de probabilidad igual a 0.07 cuando aumentan en mil pesetas las renta de los individuos?.

    c) Es la probabilidad de no poseer un seguro igual al 21% y la varianza de la perturbacin en el modelo de probabilidad transformado igual a 0.1659?.

    17. Para explicar la eleccin del tipo de centro (privado o pblico) en el mbito de la enseanza universitaria, se ha estimado por MCO un modelo de regresin utilizando como variable dependiente a CENTRO (=1, privado). Por otro lado, las variables explicativas empleadas son: EDUCP (=1 si el cabeza de familia tiene estudios universitarios) y, adems, cuatro categoras de renta definidas por las siguientes variables ficticias: RENTA1 (=1, renta familiar < 1000), RENTA2 (=1, renta familiar entre 1000-1500), RENTA3 (=1, renta familiar entre 1500-2000), RENTA4 (=1, renta familiar entre 2000-3000). La renta familiar est expresada en miles de pesetas y se toma como categora base las rentas familiares superiores a 3000. a) Qu diferencias sustanciales hay en la especificacin y estimacin de este modelo

    frente a un modelo no lineal?. b) )Qu significado tiene un valor -0.0815 para el parmetro de la variable RENTA1?.

  • 7

    18. Con el fin de predecir la crisis de las compaas de seguros en Estados Unidos se elaboraron distintos modelos logit utilizando diversos ratios considerando que la empresa puede quebrar o no. Uno de estos modelos, relacionaba el ratio del inmovilizado sobre el neto patrimonial (X1), las inversiones en filiales sobre el neto patrimonial (X2), y la variacin de los ingresos procedentes de las operaciones (X3). Los resultados ms simples obtenidos determinan que el ndice estimado es igual a: iiii XXXZ 321 4967.00312.00040.0 ++= conocindose que el valor del logaritmo de verosimilitud del modelo sin restringir es 919 y el modelo restringido 900. Se pide: a) Verificar si el modelo es significativo globalmente. b) Cul es la probabilidad de que una empresa de seguros quiebre suponiendo los ratios

    entre el inmovilizado/neto patrimonial y las inversiones en filiales/neto patrimonial sean la unidad y la variacin en los ingresos sea nula?.

    c) Suponga ahora, que se estima otro modelo logit aadiendo una nueva variable, que representa la variacin en el ratio reservas/primas totales (X4), tal que

    iiiii XXXXZ 4321 0382.05674.00240.00380.0 +++=

    Cul sera la probabilidad de que la empresa quiebre cuando el ratio de reservas es unitario, X1=1.5, X2=1 y X3=0?.

    19. Demostrar que tanto en el modelo probit como logit, si denotamos por L0 el valor de la funcin de verosimilitud que se obtiene cuando slo se estima una constante, restringiendo los dems coeficientes a cero, se tiene: ( ) ( )[ ]ppppNL += 1ln1lnln 0 donde p es la proporcin de observaciones muestrales con 1=iY . Puede extenderse este resultado a otros modelos?. 20. Sea el siguiente modelo no lineal:

    tx

    t uey t ++= 21 Suponiendo normalidad en la distribucin del trmino de perturbacin del modelo, as como homocedasticidad y no autocorrelacin, obtenga las expresiones analticas de los algoritmos numricos de optimizacin, tanto por MC como por MV, para: a) Descenso ms rpido. b) Newton-Raphson. c) Gauss-Newton. d) Scoring.

  • 8

    21. Sea un modelo de regresin truncada con truncacin superior en el punto a0. Deduzca su funcin de verosimilitud. 22. Se ha estimado un modelo probit de eleccin de modo de transporte para ir al trabajo (1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre), con coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La constante estimada es 0.2. Calcule la probabilidad estimada por el modelo de que una mujer de 60 aos vaya a trabajar en su coche. 23. Sea un modelo de probabilidad lineal dicotmico con una sola variable explicativa X: iii UXY ++= . Demuestra que es heterocedstico, y calcula la expresin de las varianzas de las perturbaciones. 24. Calcula la esperanza de la distribucin de una variable X que es N(200, 120) y censurada inferiormente en el punto a=200. 25. Formula la hiptesis de independencia de las alternativas irrelevantes en el contexto de un modelo que incorpora dicha hiptesis. Pon un ejemplo para explicar intuitivamente dicha hiptesis e indica qu consecuencias tiene su incumplimiento. 26. Lee lo que sigue, que es un resumen extractado de un artculo, para contestar las preguntas. Autores: Enrique Garca Prez y Benjamn Manchado. Ttulo: Un modelo economtrico del fraude acadmico en una universidad espaola Resumen: El fraude acadmico es un fenmeno que, en un futuro prximo, adquirir gran inters en Espaa, debido a la implantacin de los Reglamentos de Disciplina Acadmica en las Universidades. En el presente trabajo emprico se estudian los factores determinantes de las modalidades de fraude global y fraude especfico en exmenes, mediante la estimacin de modelos de eleccin discreta logit multinomiales, a partir de una muestra obtenida en la Facultad de Ciencias Econmicas y Empresariales de una universidad espaola. La variable que desempe el papel de endgena (FRAUDE) poda tomar los siguientes valores: 0 si el alumno declar que no cometi fraude, 1 si el alumno admiti defraudar en exmenes pero no en trabajos, 2 si declar haber engaado slo en trabajos, y 3 si respondi afirmativamente en ambas preguntas. El nmero de observaciones para cada categora de la variable fue de 78, 87, 18 y 60, respectivamente. Mediante esta variable endgena, estudiamos aquellos factores que permiten discriminar entre no engaar (categora 0), fraude especfico (categoras 1 y 2) y generalizado (categora 3). Las variables explicativas incluidas en las especificaciones que se propusieron trataron de aproximarse a los beneficios y costes esperados del comportamiento, elegido en cada caso por los alumnos, de fraude acadmico. Se podra distinguir, al igual que en Nowell y Laufer (1997), entre caractersticas individuales y de la clase de cada estudiante. Kerkvliet (1994), por su parte, emplea variables de rendimiento acadmico, hbitos personales y caractersticas socioeconmicas.

  • 9

    Las variables consideradas en el estudio son: - VERENGEX es una variable dicotmica que toma el valor 1 si el alumno observ a

    algn otro alumno defraudando en un examen, durante el tiempo que llevaba en la Universidad, y 0 si no lo observ.

    - COLECTIVO mide el nmero de alumnos que cada encuestado consider que defraudaban habitualmente en un examen, en distintos intervalos que son 0-1, 2-5, 6-10, 11-15 y ms de 15, tomando, por tanto, valores entre 1 y 5. En las encuestas de Bunn et al. (1992) y Mixon (1996) se recoge esta variable en forma de porcentaje pero, en nuestro caso, se consider ms conveniente esta codificacin.

    - AMIGOS se usa para recoger, de alguna forma, el entorno de amistades del alumno. La respuesta se codific como 1 si el alumno conoca a alguien que defraudase sistemticamente en los exmenes y 0, caso de no conocerlo.

    - SEVER responde a la pregunta sobre la severidad percibida en las sanciones impuestas por parte de la Universidad, en caso de detectarse el fraude acadmico. Se consider cuantitativa en orden creciente de severidad, entre los valores 1 y 5.

    - ESPONT recoge la importancia que las distintas situaciones contextuales tienen a la hora de producirse el fraude, ya fuera espontneamente o por temor (valor 1), frente al hecho de actuar de manera premeditada, que se recoge con el valor 0.

    - POSICION indica la influencia de la colocacin fsica en el aula sobre el fraude tomando valor 1 si se respondi afirmativamente y 0, en caso contrario. La influencia de la colocacin es una variable ampliamente sealada como influyente a la hora de analizar el fraude en el aula.

    - PROBLEMA es dicotmica con valores 1 si el fraude no era percibido como un problema o era un problema leve, y 0 si era considerado un problema.

    - SEXO recoge el sexo del encuestado, codificando 1 si era hombre y 0 si era mujer. Responda a las siguientes cuestiones y diga si se cumple en los modelos estimados: a) La percepcin de una baja probabilidad de ser sorprendido, implicara un menor

    coste esperado?. b) El nmero de alumnos que cada encuestado considera que defrauda, debera estar

    positivamente correlacionada con el fraude, ya que un mayor nmero de estudiantes implicados supondra que la probabilidad de ser sorprendido sera baja y, de esta forma, los costes no seran muy altos?.

    c) Que el alumno conozca a alguien que defrauda en un examen, influye de forma positiva a la hora de cometer el fraude en la Universidad?.

    d) Es de suponer que, a una mayor severidad percibida, le correspondera un mayor coste esperado, por lo que debera estar correlacionada de forma negativa?.

    e) Qu comportamiento espera de la variable ESPONT?. f) POSICION tiene una influencia positiva o negativa?. g) Se puede considerar que a menor conciencia moral del alumno (lo que significara

    un valor de PROBLEMA=1), la propensin a defraudar sera mayor, por lo que esta variable debera estar positivamente correlacionada con el fraude?.

    h) Existen diferencias significativas entre los hombres y las mujeres?. Cuantifquelo!.

    Los modelos economtricos que se emplearon para el anlisis de los datos fueron de los denominados modelos de eleccin discreta, concretamente, modelos logit multinomiales. Los resultados de la estimacin de los modelos logit multinomiales para FRAUDE son:

  • 10

    1 2 3 4 5 CONSTANTE 1 AMIGOS 1 VERENGEX 1 COLECTIVO 1 SEVER 1 PROBLEMA 1 SEXO 1 POSICION 1 ESPONT 1 CONSTANTE 2 AMIGOS 2 VERENGEX 2 COLECTIVO 2 SEVER 2 PROBLEMA 2 SEXO 2 POSICION 2 ESPONT 2 CONSTANTE 3 AMIGOS 3 VERENGEX 3 COLECTIVO 3 SEVER 3 PROBLEMA 3 SEXO 3 POSICION 3 ESPONT 3 CHI-CUADRADO (G.L.) N OBSERVACIONES % DE CLASIFICADOS CORRECTAMENTE

    -2,8630* (3,682) 0,3733 (0,975) 1,5398* (2,232) 0,5004* (2,921)

    ---

    ---

    ---

    ---

    ---

    -13,624 (0,068) 0,1112 (0,173) 11,866 (0,059) 0,1446 (0,494)

    ---

    ----

    ---

    ---

    ---

    -4,5128* (3,733) 1,2867* (2,875)

    1,9376** (1,756) 0,5720* (2,950)

    ----

    ----

    ---

    ---

    ---

    52,9518 (9)* 215

    47,44%

    -2,5341* (2,203) 0,3822 (0,903) 1,8674* (2,232) 0,4448* (2,400)

    -0,3633** (1,932) 0,7508 (1,636)

    ___

    ___

    -----

    -12,105 (0,090) -0,1901 (0,276) 10,968 (0,082) 0,1019 (0,338) -0,0752 (0,234) -0,1923 (0,290)

    ___

    ___

    ----

    -5,5000* (3,553) 1,2667* (2,630)

    2,0732** (1,807) 0,5533* (2,672) -0,2618 (1,224) 2,1469* (3,313)

    __

    ___

    ___

    59,8239 (15)* 187

    49,20%

    -2,4528* (2,074) 0,3764 (0,864) 1,9655* (2,306) 0,4360* (2,285)

    -0,4174* (2,063)

    0,8866** (1,888) -0,0079 (0,019)

    ___

    -----

    -12,301 (0,091) -0,2328 (0,335) 10,920 (0,081) 0,1707 (0,562) -0,1724 (0,516) -0,1007 (0,151) 0,6287 (0,919)

    ___

    ----

    -5,1343* (3,227) 1,2721* (2,506) 2,3030* (1,962) 0,4853* (2,245) -0,2636 (1,119) 2,2066* (3,316)

    -0,8960** (1,858)

    ___

    ___

    62,4953 (18)* 177

    49,72%

    -2,5955* (2,120) 0,3763 (0,861) 1,9866* (2,333) 0,4096* (2,110)

    -0,4361* (2,114)

    0,9177** (1,940) -0,0089 (0,022) 0,2926 (0,516)

    ----

    -12,426 (0,092) -0,2404 (0,346) 10,949 (0,081) 0,1503 (0,483) -0,1864 (0,554) -0,0772 (0,114) 0,6304 (0,921) 0,2299 (0,254)

    ---

    -6,0046* (3,456) 1,2121* (2,370) 2,3597* (2,005)

    0,4209** (1,904) -0,3072 (1,275) 2,2454* (3,375)

    -0,8724** (1,800) 1,3078 (1,510)

    _____

    65,2330 (21)* 177

    49,15%

    -2,6945** (1,796) 0,5822 (1,201) 2,7467* (2,401) 0,2768 (1,339)

    -0,4449** (1,931) 0,6835 (1,325) -0,5761 (1,273) 0,2736 (0,457) 0,2146 (0,461)

    -13,451 (0,093) 0,0064 (0,008) 10,704 (0,074) 0,2142 (0,625) -0,0979 (0,240) -0,1242 (0,165) 1,0165 (1,160) 0,6821 (0,583) -0,3490 (0,453)

    -6,2749* (3,352) 1,4919* (2,631)

    2,2295** (1,799) 0,4575* (1,964) -0,2480 (0,947) 1,8553* (2,669)

    -1,0986* (2,099) 1,1850 (1,330) 0,8445 (1,576)

    65,2276 (24)*

    154 49,35%

    Notas: Entre parntesis aparecen los t-valores asintticos en valor absoluto. Los coeficientes han sido normalizados para el valor de FRAUDE=0. * Indica significacin al 5%. ** Indica significacin al 10%.

  • 11

    27. Defina la funcin de razn de fallo e indique para qu se usa. Cmo es la funcin de razn de fallo en el caso de una distribucin exponencial?. Qu significa?. 28. Diferencia entre un modelo logit multinomial y un modelo logit condicional de McFadden. 29. Para el modelo logit multinomial, deduzca la expresin del efecto marginal de un cambio en la variables explicativa kx sobre la probabilidad de eleccin de la alternativa j, de entre las J del conjunto de eleccin. 30. Qu es truncacin incidental (llamada tambin truncamiento selectivo?. Defnala y ponga un ejemplo. 31. En un modelo logit multinomial no ordenado, hay tres alternativas (A, B y C), actuando la tercera como categora de referencia. Se ha estimado el modelo por mxima verosimilitud, con los resultados siguientes:

    21

    21

    26.03.12.0

    2.08.05.0

    xxPPLn

    xxPPLn

    C

    B

    C

    A

    +=

    +=

    Un conocido tuyo tiene 41 =x y 202 =x . Estima las probabilidades que, segn el modelo, tiene de elegir A, B y C. 32. Cul es el modelo probabilstico que especifica una razn de fallo constante?... . Para dicho modelo, aplicado a la duracin de la carrera de Econmicas, se tiene que la duracin media estimada de la carrera es 5,2 aos. Calcula el valor estimado de la funcin de supervivencia para t=4 aos e interpreta el resultado. 32. Se ha estimado un modelo probit de eleccin de modo de transporte para ir al trabajo (1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre), con coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La constante estimada es 0.2. Calcule la probabilidad estimada por el modelo de que un hombre de 47 aos vaya a trabajar en guagua. 33. Escribe la funcin de verosimilitud de un modelo tobit de regresin censurada con censuracin doble, inferior en a1 y superior en a2. 34. Con datos de una muestra de familias espaolas (renta; nmero de miembros que trabajan; habitat rural o urbano) queremos estimar la demanda de vivienda: gasto en compra de vivienda. Especifique los posibles modelos que podra utilizar y discuta las propiedades de unos y otros, indicando cul prefiere y por qu. 35. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados: Variable Coeficiente Error Estndar Datos del Individuo i

  • 12

    Constante 0.6 0.63 X1 -0.46 0.104 5 X2 0.72 0.032 4

    Calcula el efecto marginal de X1 sobre la probabilidad de que el individuo i elija la alternativa 1 (Y=1). 36. Sea la siguiente muestra de N=425 votantes. La variable dependiente representa el voto en un referendum sobre un nuevo impuesto especfico sobre la enseanza pblica (Y=1 =Si, Y=O= NO). La lista de variables independientes y resultados de la estimacin logit son: VARIABLE Definicin (para las variables dummy, categora =1) Coeficiente Error estndar CONSTANTE -23.15(*) 3.84 SEXO mujer 0.24 0.24 CASADO casado con esposo/a conviviente 1.13 1.13 OTRO separado, viudo, divorciado 1.09 1.47 E35-49 edad entre 35 y 49 aos 0.08 0.3 E50-64 edad entre 50 y 64 aos 0.61 0.41 E65 mas de 65 aos 1.04 0.79 PUB1 1 hijo estudiando en la escuela pblica 1.44(*) 0.34 PUB2 2 hijos estudiando en la escuela pblica 1.39(*) 0.35 PUB3 3 hijos estudiando en la escuela pblica 1.3(*) 0.42 PUB4 4 hijos estudiando en la escuela pblica 2.0(*) 0.58 PUB5 5 o ms hijos estudiando en la escuela pblica 2.16(*) 0.79 PRIV 1 o mas hijos estudiando en la escuela privada -0.56 0.42 MAESTRO si es maestro en escuela pblica o privada 3.07(*) 0.84 AOS Nmero de aos que lleva viviendo en la regin -0.02(*) 0.01 LRENTA LOG.(renta familiar anual en $) 2.14(*) 0.37 LPRECIO LOG(precio de la enseanza pblica en $) -1.21(*) 0.44 La ecuacin est estimada por MV (errores estndar asintticos entre parntesis, un * indica coeficiente significativo al 5%):

    a) Calcula el "score" o "logit" estimado de un hombre, no maestro, divorciado de 40 aos con sus 6 hijos en una escuela pblica gratuita que se ha mudado a la regin este mismo ao y tiene una renta de 10.000$. Calcula su probabilidad estimada de votar Si.

    b) Ahora repite los clculos si ese hombre no tuviera hijos. Compara los resultados!.

    c) Y si no tuviera hijos y fuera maestro de escuela?. d) Calcula el "riesgo relativo" de votar Si de los maestros respecto a los no

    maestros. Interprtalo. (Riesgo relativo = cociente entre los odd-ratios de ambas categoras).

    e) Interpreta el coeficiente de los aos de residencia. f) Si no estuvieran en el modelo las tres variables continuas, cmo se podra

    estimar?. 37. Tenemos los siguientes datos agrupados referidos a una muestra de 1000 empresas. Suponemos que la probabilidad de xito depende de X segn un modelo logit. X es una variable controlable por la empresa.

  • 13

    Nmero de grupo X Proporcin muestral de xitos en el grupo

    1 160 11 2 250 74 3 170 8 4 365 87 5 210 62 6 206 83 7 203 48 8 305 84 9 270 71

    10 340 79 Se pide: a) Si una empresa quiere alcanzar el xito el 95% de las veces, qu valor debe fijar

    para X?. b) Si cada unidad de X cuesta 20000 ptas., puede esperar la empresa que alcanzar su

    objetivo con un presupuesto de 8 millones de ptas.?. c) Segn el modelo estimado, cul es el valor marginal de la unidad 301 de X, en

    trminos del aumento de la probabilidad de xito?. 38. Pon un ejemplo de modelo de respuesta cualitativa: Binomial : Multinomial no ordenado:. Multinomial ordenado:. De decisin secuencial anidado:.. NOTA: Se trata de definir su variable dependiente y dar una idea de las variables independientes que podran intervenir 39. Demuestra que en el modelo logit estimado por MV la suma de las probabilidades estimadas por el modelo (para los n individuos de la muestra) es el nmero de individuos con Y=1. 40. Obtn el estimador MV del MLP binomial. 41. Hemos empleado modelos binomiales de eleccin discreta para estimar la probabilidad de la mujer casada de participar en el mercado laboral (Yi=1, SI trabaja; Yi=0, NO trabaja). La muestra contiene 753 mujeres, de las cuales trabajan 428. Las variables explicativas son la experiencia laboral en aos, el nivel educativo en aos y el nmero de hijos. Los coeficientes estimados aparecen en la tabla siguiente. Considera a la mujer i, sin hijos, que ha estudiado 10 aos y tiene una experiencia laboral de 1 ao y a la mujer media, y rellena la tabla .

    COEFICIENTES DE LOS MODELOS (BETA)

  • 14

    MLP PROBIT LOGIT MEDIA MUESTRAL CONSTANTE -0.084 -1.763 -2.946

    HIJOS -0.167 -0.486 -0.788 0.24 EDUCAC 0.04 0.122 0.201 12.3 EXPERI 0.018 0.055 0.096 10.6

    Probabilidad de trabajar estimada Efecto marginal sobre la prob de un ao

    ms de estudios MODELO Mujer i Mujer media Mujer i Mujer media MLP PROBIT XXXXXXX XXXXXXX LOGIT

    Adems, conocemos las probabilidades de trabajar estimadas: 0.3015, 0.3128, 0.334, 0.5587, 0.5808, 0.5878. Y, los efectos marginales sobre las probabilidades de trabajar son: 0.04, 0.0423, 0.0487. 42. La truncacin, hace que la varianza aumente o disminuya?. Discuta la pregunta. 43. Sea una variable Z distribuida ( ),N . Se sabe que la esperanza truncada con truncacin inferior en el punto a=25 es igual a 6.85. El grado de truncacin es del 90%. Calcular y . 44. Si tenemos una muestra censurada, qu crees que es mejor y por qu, estimar un modelo de regresin truncado o un modelo tobit censurado?. Discuta la pregunta. 45. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar frente a no poseerlo, puede escribirse mediante una relacin lineal definida por el siguiente modelo: iii Eys 004.00002.007.0 ++= donde, si es una variable dicotmica que vale uno si el individuo i-simo posee un seguro y cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado. Si la renta bruta anual fuese de 3 millones de pesetas y la edad del asegurado de 30 aos, entonces: a) Cul es la probabilidad de poseer un seguro?. b) Cul es el incremento de probabilidad, si la renta de dicho individuo aumentase en 100.000 pesetas?. 46. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda en propiedad o no (Y) dependa de variables como los ingresos (INGRESOS) de los individuos (en miles de pesetas mensuales); si trabaja (TRABFIJO), que es una variable dicotmica que toma el valor uno si el cabeza de familia trabaja y cero en caso contrario; el sexo (SEXO), que tambin es dicotmica, tomando valor 1 si es hombre y cero si es mujer; y la edad (EDAD), que representa la edad del cabeza de familia. El siguiente cuadro recoge los valores de dichas variables para dos individuos elegidos al azar de la muestra.

  • 15

    i Y Sexo Edad Ingresos Trabfijo 9 18

    1 0

    1 0

    39 46

    250 80

    0 0

    Adems, se conocen los siguientes resultados de la estimacin de un modelo logit y probit:

    Variables Logit Probit Constante Sexo Edad Ingresos Trabfijo

    -4.73 0.16 0.01 1.94 0.02

    -2.66 0.16 0.004 1.13 0.015

    Se pide: d) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para

    los dos individuos. e) Calcular los ODDS de cada individuo, para cada modelo. f) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el

    individuo 18 en el modelo probit. 47. Realizar un breve comparacin entre los algoritmos Scoring y Descenso Rpido. 48. Sea el siguiente modelo de ecuaciones simultneas:

    tttt

    ttttt

    uxyy

    uxxyy

    22221122

    12211112211

    ++=+++=

    cuya matriz de momentos (es desviaciones respecto a la media) es:

    y1 y2 x1 x2 y1 12 6 3 0 y2 6 16 2 4 x1 3 2 4 0 x2 0 4 0 1

    Se pide: a) Indentificar el sistema sin restricciones y estimar adecuadamente los parmetros de

    la segunda ecuacin del sistema. b) Identificar el sistema considerando la restriccin: 2111 = y estimar los

    coeficientes de la primera ecuacin considerando dicha restriccin. 49. Se ha relacionado el logaritmo del ndice Financial Times (FT) con el logaritmo del ndice Dow Jones (DJ), y obtenido los siguientes resutados por MCO:

    Estimacin de la ecuacin Dependent Variable: LOG(FT) Included observations: 153

    Variable Coefficient Std. Error t-Statistic Prob.

    C 1.098982 0.036141 30.40816 0.0000

  • 16

    LOG(DJ) 0.754361 0.007653 98.57209 0.0000

    R-squared 0.984697 Mean dependent var 4.639985Adjusted R-squared 0.984596 S.D. dependent var 0.395047S.E. of regression 0.049031 Akaike info criterion -3.179754Sum squared resid 0.363006 Schwarz criterion -3.140140

    Log likelihood 245.2512 F-statistic 9716.456Durbin-Watson stat 0.444218 Prob(F-statistic) 0.000000

    Test de raz unitaria para el residuo de la regresin

    PP Test Statistic -4.423605 1% -3.4743* 5% -2.8805 10% -2.5768

    *MacKinnon critical values for rejection of hypothesis of a unit root.

    Se pide: a) Especifique, si existe, el vector de cointegracin; as como el orden de cointegracin

    de las variables. b) Valorar la existencia de contegracin entre los dos ndices, en los tres niveles

    crticos de Engle y Granger, que son: 1% 0.511, 5% 0.386 y 10% 0.322. 50. En el modelo TOBIT: iii uxy += '* , cuando existe censura superior o inferior en cero, A qu ser igual el valor obtenido para [ ]

    i

    iii

    xyxyE

    0,/ *

    ?.

    51. Derivar la funcin de verosimilitud para el modelo: ( )2*** ,0~;0; Nysiyyy iiiiii >=+= y el correspondiente a ( )2*** ,0~;0; Nysiyyy iiiiii

  • 17

    incumplan los compromisos en ambos modelos. Adems, Obtenga los efectos marginales.

    53. Realcese una comparacin entre los algoritmos "Descenso Rpido" y "Gauss-Newton". 54. Atendiendo al enunciado del ejercicio 49, se han obtenido los siguientes resultados, aplicando el mtodo bietpico de Engle y Granger. Dependent Variable: DLOG(FTSE100) Sample(adjusted): 1988M08 2000M03 Included observations: 140 after adjusting endpoints Variable Coefficient t-Statistic DLOG(FT(-1)) 0.162826 1.990719DLOG(DJ(-1)) -0.099776 -2.778151DLOG(FT(-2)) -0.163138 -3.287065DLOG(DJ(-2)) 0.093377 2.706378DLOG(FT(-12)) -0.041340 -2.365320DLOG(DJ(-12)) 0.043033 2.350196RESID01(-1) -0.205430 -2.488271R-squared 0.83430 Durbin-Watson 2.011624

    Se pide a) Qu tipo de modelo ha sido estimado?. b) Escriba la ecuacin estimada y valore la posible existencia de una relacin de

    equilibrio a largo plazo. 55. Utilizando el siguiente sistema de ecuaciones:

    0

    0

    2122112

    1112211

    =+++=+++

    tttt

    tttt

    uxyy

    uxyy

    Se pide: a) Identificar el sistema de ecuaciones, si 0, 121211 === . b) Identificar el sistema de ecuaciones, si 2, 211211 === . 56. Sea el siguiente sistema de ecuaciones simultneas:

    tttt

    tttt

    uxxy

    uxxy

    22221122

    12211111

    ++=++=

  • 18

    en el que [ ] [ ] ( ) ( ) ( ) 0,cov,var,var,0 2122221121 ===== tttttt uuuuuEuE , y cuya matriz de momentos (en desviaciones respecto a la media) es:

    y1 y2 x1 x2 y1 120 80 20 45 y2 90 25 30 x1 10 5 x2 20

    Se pide: a) Estmense los parmetros del sistema de ecuaciones de forma eficiente. b) Manteniendo iguales las hiptesis iniciales, pero suponiendo que 22

    21 = , Cul

    sera la expresin del estimador del sistema de ecuaciones?. c) Manteniendo iguales las hiptesis iniciales, pero suponiendo que ( ) 1221 ,cov =tt uu , Cul sera la expresin del estimador para el sistema de

    ecuaciones?. 57. Suponemos que la demanda de entradas a los conciertos (VENTAS) que se celebran en una ciudad depende del precio (PRECIO), de las condiciones meteorolgicas (METEO), que pueden ser favorables (0) o desfavorables (1) y del renombre del grupo que acta, medido en una escala de 1 a 5 (RATING). Los conciertos se celebran en un recinto que tiene capacidad para 23.000 espectadores. Se ha estimado el modelo y los resultados son:

    +---------------------------------------------+ | Limited Dependent Variable Model - CENSORED | | Maximum Likelihood Estimates | | Dependent variable VENTAS | | Weighting variable ONE | | Number of observations 90 | | Iterations completed 6 | | Log likelihood function -522.4057 | | Threshold values for the model: | | Lower=-infinity Upper=23000.0000 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Primary Index Equation for Model Constant 29588.03508 590.39079 50.116 .0000

    PRECIO -4.879326375 .16399481 -29.753 .0000 2952.8667 RATING 1940.032493 122.51143 15.836 .0000 3.1555556 METEO -4513.019466 268.57781 -16.803 .0000 .18888889

    Disturbance standard deviation Sigma 923.1196055 81.283308 11.357 .0000

    Se pide: a) Calcular los efectos marginales evaluados en la media de las variables. b) Si un grupo posee un rating igual a 5, y acta en un da con meteorologa

    favorable y un fan paga un precio de 5000 ptas, cules son las predicciones de la ventas considerando la censura?.

    58. Suponga que una variable no observable, *iy , se encuentra censurada entre dos puntos a y b, siendo a

  • 19

    59. Se tiene la siguiente tabla de resultados para el modelo de regresin: iiiiii uCONSURBPLAZASPOTECIACCLPVP +++++= 54321 , donde LPVP=(logaritmo del precio de venta al pblico), CONSURB=(consumo urbano de gasolina), PLAZAS=(nmero de plazas), POTENCIA=(potencia) y CC=(centmetros cbicos del motor).

    +---------------------------------------------+ | Limited Dependent Variable Model - TRUNCATE | | Maximum Likelihood Estimates | | Dependent variable LPVP | | Weighting variable ONE | | Number of observations 89 | | Iterations completed 4 | | Log likelihood function 10.36396 | | Threshold values for the model: | | Lower= 14.7710 Upper=+infinity | | Observations after truncation 89 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Primary Index Equation for Model Constant 13.99540073 .23644489 59.191 .0000 . CC .2469698762E-03 .70523122E-04 3.502 .0005 2798.2135 POTENCIA .6146523460E-02 .15073046E-02 4.078 .0000 130.57303 PLAZAS .5854436861E-01 .26134858E-01 2.240 .0251 5.4494382 CONSURB -.4132447336E-01 .17188130E-01 -2.404 .0162 13.296629

    Disturbance standard deviation Sigma .2557355692 .24599767E-01 10.396 .0000 .

    Se pide:

    a) Obtn el valor del ratio inverso de Mills para el individuo medio. b) Calcula el efecto marginal evaluado en la media para la variable PLAZAS. c) A qu consideras es igual la varianza de la variable LPVP?. Calcula su valor.

    60. En un modelo logit multinomial no ordenado, que determina los perfiles diferenciados de los fumadores, los exfumadores y los que nunca han fumado, se dispone de informacin acerca de las variables: FUMA (=0 si fuma ; =1 si exfumador; =2 si nunca ha fumado); ALCOHOL (=1 si ha bebido en la ltima semana; 0 en otro caso); EDAD = Edad en aos cumplidos y SEXO (variable ficticia =1 hombre; 0 mujer).

    +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable FUMA | | Number of observations 6161 | | Iterations completed 6 | | Log likelihood function -5312.833 | | Restricted log likelihood -6156.510 | +---------------------------------------------+

    +--------+-------------+---------------+-------+--------+----------+ |Variable| Coefficient | Standard Error|b/St.Er.|P[|Z|>z]|Mean of X| +--------+-------------+---------------+-------+--------+----------+

    Characteristics in numerator of Prob[Y = 1] Constant -3.640533526 .19250329 -18.912 .0000 . SEXO .6886612269 .98854654E-01 6.966 .0000 .48401234 EDAD .4619101884E-01 .25459570E-02 18.143 .0000 43.751826 ALCOHOL -.4462521624 .90439443E-01 -4.934 .0000 .52410323

    Characteristics in numerator of Prob[Y = 2] Constant -.7178729803 .12564652 -5.713 .0000 . SEXO -1.084755046 .67757546E-01 -16.009 .0000 .48401234 EDAD .3373685387E-01 .18930611E-02 17.821 .0000 43.751826 ALCOHOL -.8573745420 .64989954E-01 -13.192 .0000 .52410323

    Se pide:

  • 20

    a) Evaluar la significacin conjunta del modelo. b) Estimar las probabilidades, para el individuo medio de la muestra, de ser

    fumador, exfumador y nunca haber fumado. c) Disponiendo de la siguiente informacin, evale las predicciones del modelo:

    Frequencies of actual & predicted outcomes Predicted outcome has maximum probability.

    Predicted

    ------ --------------- + ----- Actual 0 1 2 | Total ------ --------------- + ----- 0 1391 51 836 | 2278 1 342 102 452 | 896 2 793 38 2156 | 2987 ------ --------------- + ----- Total 2526 191 3444 | 6161

    d) Considerando el siguiente vector de variables explicativas para el i-simo

    individuo: [ ]13611' =ix , cul ser el odd de ser exfumador y de no haber fumado nunca?. Interprtelo.

    61. Se dispone de informacin sobre: LPRECIO = logaritmo del precio de mercado de la vivienda habitual en propiedad en 1998. PROPIE = 1 si la familia es propietaria de la vivienda; 0 en caso contrario. TRABFIJO = 1 si el cabeza de familia tiene trabajo fijo; 0 en caso contrario. SEXO = 1 si el cabeza de familia es hombre 0 en caso contrario. EDAD = edad del cabeza de familia en aos. HIJOS = n de hijos que conviven con la familia. INGRESO = ingresos familiares mensuales en 1997 (ingresos anuales / 12). EDUCA = aos de educacin del cabeza de familia. MOVIL = nmero de aos que llevan viviendo en la ciudad actual. Se estima un modelo de seleccin muestral, obtenindose los resultados siguientes:

    +----------------------------------------------------------+ | Sample Selection Model | | Probit selection equation based on PROPIE | | Selection rule is: Observations with PROPIE = 1 | | Results of selection: | | Data points Sum of weights | | Data set 1123 1123.0 | | Selected sample 697 697.0 | +----------------------------------------------------------+

    +-----------------------------------------------------------------------+ | Sample Selection Model | | Two stage least squares regression Weighting variable = none | | Dep. var. = LPRECIO Mean= 16.18272434 , S.D.= .8333333897 | | Model size: Observations = 697, Parameters = 9, Deg.Fr.= 688 | | Residuals: Sum of squares= 290.2310590 , Std.Dev.= .64950 | | Fit: R-squared= .391667, Adjusted R-squared = .38459 | | (Note: Not using OLS. R-squared is not bounded in [0,1] | | Model test: F[ 8, 688] = 55.37, Prob value = .00000 | | Diagnostic: Log-L = -683.6765, Restricted(b=0) Log-L = -861.4217 | | LogAmemiyaPrCrt.= -.850, Akaike Info. Crt.= 1.988 | | Standard error corrected for selection..... .68767 | +-----------------------------------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Constant 1.753797810 1.3912725 ***** TRABFIJO .4356437681 .68409420E-01 ***** .73027260 SEXO -.5062113124E-01 .66550751E-01 ***** .83500717 EDAD .8875735718E-02 .24876340E-02 ***** 41.364419 HIJOS -.7482653581E-01 .18528622E-01 ***** 1.8952654 EDUCA .2583800339E-01 .95730846E-02 ***** 13.298422 MOVIL .1485053775E-02 .21997061E-02 ***** 35.981349 LINGRESO 1.029119343 .10064208 ***** 13.015925 LAMBDA .4532492445 .15652247 ***** .29951337

    Se pide:

  • 21

    a) Comente brevemente el mtodo de estimacin de Heckman. Porqu se aplica en este caso? y Qu ratio inverso de Mills utilizara en este modelo?.

    b) Evale la significacin de los coeficientes estimados. Cul es la interpretacin del parmetro de la variable SEXO y EDAD?.

    c) A qu es igual la estimacin de ?. Por lo tanto, cree usted que debera aplicarse el modelo Tobit?.

    d) Cul es el precio medio de mercado de la vivienda habitual en propiedad en 1998?.

    62. Considere el siguiente sistema de ecuaciones simultneas:

    00

    00

    41144224114

    33332233223113

    23322221124423322

    11113311

    =++++=+++++

    =++++++=+++

    ttttt

    tttttt

    ttttttt

    tttt

    uxyyyuxxyyy

    uxxxyyyuxyy

    Se pide: a) Analizar la identificacin del sistema. b) Analizar la identificacin del modelo considerando la siguiente restriccin:

    0432 232313 =+ . 63. Defina la funcin de razn de fallo e indique para qu se usa. Cmo es la funcin de razn de fallo en el caso de una distribucin exponencial?. Cul es su significado en este caso?. 64. Se tiene el siguiente modelo no lineal simple: txt uey t += 1 . Utilizando los mnimos cuadrados no lineales, escriba los elementos del algoritmo de Newton-Raphson para la primera iteracin. 65. Demuestre que en el modelo logit binomial para N individuos, donde yi es una variable endgena que toma valor 0 o 1, y la funcin ndice es igual a ii xI = (siendo

    ix un vector fila que contiene las caractersticas del i-simo individuo y un vector de parmetros desconocidos), la funcin de verosimilitud puede escribirse como:

    ( ) [ ]=

    += =N

    i

    xxy

    i

    N

    iii

    eeL1

    11

    .

    66. Suponga que existe censura superior e inferior en los puntos a y b. Construya, bajo el supuesto de normalidad, el logaritmo de verosimilitud que permita, mediante su maximizacin, la estimacin de los parmetros en el modelo iii uxy += * . 67. A partir de la siguiente informacin sobre el nmero de visitas al mdico en las ltimas dos semanas (DVISITS), el sexo de las personas que han sido encuestadas (SEXO = 1 si es mujer y cero si es hombre), la edad del individuo en nmero aos divididos por 100 (EDAD), la edad al cuadrado (EDAD2), la renta anual en miles de pesetas (RENTA), si posee un seguro pblico (SPUB = 1 si posee seguro pblico y cero en caso contrario), y si est jubilado (JUBIL = 1 si est jubilado y cero en caso contrario).

  • 22

    Los resultados de la estimacin mximo verosmil son:

    +---------------------------------------------+ | Poisson Regression | | Maximum Likelihood Estimates | | Dependent variable DVISITS | | Weighting variable ONE | | Number of observations 1000 | | Iterations completed 7 | | Log likelihood function -973.6213 | | Restricted log likelihood -1178.649 | | Chi-squared 410.0552 | | Degrees of freedom 6 | | Significance level .0000000 | | Chi- squared = 551.23707 RsqP= .4429 | | G - squared = 699.07657 RsqD= .3697 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Constant -.7900618450 .11221447 -7.041 .0000 SEXO .2182756364E-01 .71371673E-01 .306 .7597 .48300000 EDAD .9496278280 .33929493 2.799 .0051 .41413000 EDAD2 .4508287253E-01 .43719734E-01 1.031 .3025 .26519850 RENTA .1594314240E-03 .24396592E-04 6.535 .0000 1442.4560 SPUB -.6376025892 .10604556 -6.013 .0000 .79700000 JUBIL 1.096445780 .20492877 5.350 .0000 .19700000

    Evaluando los resultados en la media, se pide:

    a) Cul es el valor medio del nmero de visitas al mdico en las ltimas dos

    semanas?. Y la varianza?. b) Cul es el efecto marginal de la variable EDAD?. c) Cul es la probabilidad de que el individuo medio no haya ido al mdico en

    los ltimos quince das?. Y, que haya ido 3 veces?. 68. Cul es el modelo probabilstico que especifica una razn de fallo constante?. Para dicho modelo, aplicado a la duracin de la carrera de Econmicas, se tiene que la duracin media estimada de la carrera es 5,2 aos. Calcula el valor estimado de la funcin de supervivencia para t=4 aos e interpreta el resultado.

    69. Suponga el siguiente modelo: ( ) ttt uxgy ++= , donde ( ) 1= tt xxg . Demuestre

    si existe o no, una solucin analtica al problema de maximizacin de la funcin del logaritmo de verosimilitud. 70. Se tiene el siguiente modelo no lineal simple: ttt uxy += 1 . Utilizando los mnimos cuadrados no lineales, escriba los elementos del algoritmo de Gauss-Newton para la primera iteracin. 71. En el siguiente modelo IS-LM:

    tttt

    ttt

    urMyLMuryIS

    2210

    110

    ::

    +++=++=

    donde yt es la renta, rt es el tipo de inters (ambas variables endgenas), Mt es la masa monetaria (como variable exgena), ( )211 ,0~ Nu t , ( )222 ,0~ Nu t y las covarianzas

  • 23

    entre los errores de ambas ecuaciones se denota por 12 . A qu es igual el sesgo de 1 ?.

    72. Sea 10,...,2,1,0=iy el nmero de veces que las personas han visitado un determinado balneario durante los dos ltimos aos. Se estima un modelo de Poisson considerando como variable explicativa el nmero de noches de estancia en ese lugar. Los resultados de mxima verosimilitud as como un listado para las primeras 10 observaciones de la muestra son los siguientes:

    +---------------------------------------------+ | Poisson Regression | | Maximum Likelihood Estimates | | Dependent variable VECES | | Weighting variable ONE | | Number of observations 3831 | | Iterations completed 7 | | Log likelihood function -7247.789 | | Restricted log likelihood -7518.572 | | Chi-squared 541.5661 | | Degrees of freedom 1 | | Significance level .0000000 | | Chi- squared = 12900.53321 RsqP= .0628 | | G - squared = 10168.03678 RsqD= .0506 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Constant -.3276808869 .24715869E-01 -13.258 .0000 NOCHES .4537878664E-01 .15657352E-02 28.982 .0000 10.552858

    Observation Observed Y Predicted Y Residual x(i)b 1 .00000 .99002 -.9900 -.0100 2 .00000 .99002 -.9900 -.0100 3 .00000 .99002 -.9900 -.0100 4 .00000 1.0360 -1.0360 .0353 6 .00000 .99002 -.9900 -.0100 7 3.0000 .99002 2.0100 -.0100 8 .00000 1.1871 -1.1871 .1715 9 7.0000 1.0360 5.9640 .0353 10 2.0000 .99002 1.0100 -.0100

    Se pide: a) Cul es el promedio de veces que han visitado el balneario?. b) Obtenga la probabilidades para el 6 y 10 individuo. Cul es la probabilidad de que un individuo (en media) venga ms de 1 vez?. c) Qu es la sobredispersin?. Contrastar la sobredispersin del modelo. Para ello, utilice las expresiones sugeridas por Cameron y Trivedi (1990): ii uz += y

    iii uz += , siendo ( )[ ] ( )2 2 iiiii yyz = .

    (1) Establezca las hiptesis nula y alternativa a contrastar en ambos casos y su significado.

    (2) Realice una evaluacin del rechazo o aceptacin, atendiendo a los siguientes

    resultados: 7725.4=z , =

    =N

    ii

    1

    2 4632 , =

    =N

    iiiz

    197.16915 , y finalmente

    7.49164911 =ee y 3.49502622 =ee son las sumas de cuadrados de los errores en el primer y segundo modelo, respectivamente. [NOTA: El lado derecho de ambas ecuaciones, tanto la constante en la primera ecuacin como i en la segunda ecuacin, est dividido por 2 ].

    73. Sea el siguiente sistema de ecuaciones aparentemente no relacionadas:

  • 24

    ttt

    ttt

    uxyuxy

    2222

    11111

    +=++=

    donde ( ) 211var =tu , ( ) tt xu 2222var = y ( ) 0cov 1221 ==ttuu . Bajo estas condiciones, estime los coeficientes de las ecuaciones, proporcionando la expresin de cada uno de ellos. 74. Sea ( )ii PBernoulliy ~ , siendo iP la probabilidad de que 1=iy . En el modelo lineal de probabilidad de observaciones repetidas en el que se forman m-grupos, cul es ( )jpvar , siendo jp la proporcin muestral de respuestas afirmativas dentro del grupo j-simo?. Si los grupos son del mismo tamao y, adems, cada uno de estos es igual a 10, cul ser la varianza mxima de dicha proporcin?. 75. Responda a las siguientes cuestiones: a) Se dispone de informacin sobre n individuos. Suponga que existe truncamiento inferior en el punto a y que ii uy += 0 , donde ( )2,0~ ui Nu . Obtenga las expresiones de

    LnL y 2u

    LnL

    en este modelo. b) Explique el significado del truncamiento inferior en el punto r, considerando que ( )ii Poissony ~ , siendo ( ) ii x= exp . Obtenga la expresin de [ ]ryyE ii . c) Qu diferencias sustanciales existen entre la censura y truncamiento?. Explquelo brevemente. 76. En el mtodo de Cutler y Ederer, el rango t se divide en K intervalos, j=1,..,K. Estos intervalos tienen igual amplitud. A partir de los siguientes resultados parciales:

    Estimated Survival Function Duration variable is DURACION EN EL PARO (EN DAS) Status is given by variable ESTADO Number of observations in stratum = 608 Number of observations exiting = 539 Number of observations censored = 69

    Survival Enter Cnsrd At Risk Exited Survival Rate Hazard Rate .0- 194.7 608 25 595 407 1.0000 ( .000) .0053 ( .000) 194.7- 389.3 176 23 164 79 .3165 ( .019) .0032 ( .000) 389.3- 584.0 74 5 71 22 .1645 ( .016) .0019 ( .000)

    584.0- 778.7 47 8 43 16 .1139 ( .014) .0023 ( .001) Se pide: a) Qu significa que la tasa hazard sea igual a 0.0032?. Y, Qu significa que la tasa de supervivencia sea igual a 0.1139?. c) Qu significa que el nmero de individuos censurados sea 5?. 77. Atendiendo al enunciado del ejercicio 61, se trata de especificar y estimar un modelo que explique la cantidad invertida en la vivienda habitual por parte de las familias. La estimacin del modelo en dos etapas de Heckman obtiene los siguientes resultados.

    +---------------------------------------------+ | Binomial Probit Model | | Maximum Likelihood Estimates |

  • 25

    | Dependent variable PROPIE | | Weighting variable ONE | | Number of observations 1123 | | Iterations completed 7 | | Log likelihood function -373.0777 | | Restricted log likelihood -745.3807 | | Chi-squared 744.6061 | | Degrees of freedom 2 | | Significance level .0000000 | | Results retained for SELECTION model. |

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Index function for probability Constant -2.227412200 .14573711 -15.284 .0000 . TRABFIJO 1.021115011 .12018962 8.496 .0000 .65805877 INGRESO .6585780215E-05 .39261072E-06 16.774 .0000 398436.14

    +----------------------------------------------------------+ | Sample Selection Model | | Probit selection equation based on PROPIE | | Selection rule is: Observations with PROPIE = 1 | | Results of selection: | | Data points Sum of weights | | Data set 1123 1123.0 | | Selected sample 697 697.0 | +----------------------------------------------------------+

    +-----------------------------------------------------------------------+ | Sample Selection Model | | Two stage least squares regression Weighting variable = none | | Dep. var. = LPRECIO Mean= 16.18272434 , S.D.= .8333333897 | | Model size: Observations = 697, Parameters = 9, Deg.Fr.= 688 | | Residuals: Sum of squares= 290.2310590 , Std.Dev.= .64950 | | Fit: R-squared= .391667, Adjusted R-squared = .38459 | | (Note: Not using OLS. R-squared is not bounded in [0,1] | | Model test: F[ 8, 688] = 55.37, Prob value = .00000 | | Diagnostic: Log-L = -683.6765, Restricted(b=0) Log-L = -861.4217 | | LogAmemiyaPrCrt.= -.850, Akaike Info. Crt.= 1.988 | | Standard error corrected for selection..... .68767 | | Correlation of disturbance in regression | | and Selection Criterion (Rho).............. .65910 | +-----------------------------------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Constant 1.753797810 1.3912725 1.261 .2075 . TRABFIJO .4356437681 .68409420E-01 6.368 .0000 .73027260 SEXO -.5062113124E-01 .66550751E-01 -.761 .4469 .83500717 EDAD .8875735718E-02 .24876340E-02 3.568 .0004 41.364419 HIJOS -.7482653581E-01 .18528622E-01 -4.038 .0001 1.8952654 EDUCA .2583800339E-01 .95730846E-02 2.699 .0070 13.298422 MOVIL .1485053775E-02 .21997061E-02 .675 .4996 35.981349 LINGRESO 1.029119343 .10064208 10.226 .0000 13.015925 LAMBDA .4532492445 .15652247 2.896 .0038 .29951337

    Se pide: d) Cul es la probabilidad de que el individuo medio tenga la vivienda en

    propiedad?. e) Y si el individuo medio tuviese un ingreso anual de 5 millones y tuviera

    trabajo fijo?. f) Existe sesgo de seleccin?. Explique brevemente el truncamiento selectivo

    en trminos de este modelo. 78. Sea el siguiente sistema de ecuaciones aparentemente no relacionadas:

    ttt

    ttt

    uxyuyy

    2222

    11111

    +=++=

    donde ( ) TIu 211var = , ( ) TIu 222var = y 012 = . Bajo estas condiciones, estime los coeficientes de las ecuaciones, proporcionando el valor de cada uno de ellos. 79. Sea el siguiente sistema de ecuaciones simultneas:

  • 26

    ttttt

    tttt

    uxxyyuxyy

    2332222122

    1111211

    +++=++=

    Estimar por MCI las ecuaciones del modelo, conociendo la siguiente matriz de productos cruzados de las variables:

    y1 y2 x1 x2 x3 y1 20 6 4 3 5 y2 10 3 6 7 x1 5 2 3 x2 10 8 x3 15

    80. Considere que ( )ii Poissony ~ , siendo ( )0exp ==i . Obtenga la expresin de [ ]ryyE ii > , siendo r el punto de truncamiento inferior. 81. Se dispone de informacin de una encuesta de Turismo para la isla de Tenerife en el ao 1999. La siguiente tabla de resultados recoge la estimacin de un modelo logit binomial para el nmero de VECES que un turista ha visitado la isla de Tenerife hasta 1999 (=0 si no la ha visitado hasta la vez presente; =1 si la visitado ms de una vez, sin incluir la presente). La regresin se realiza frente al nmero de noches (NOCHES) y el gasto en pesetas realizado en el viaje (GASTOS).

    MODELO I +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable VECES | | Weighting variable ONE | | Number of observations 2703 | | Iterations completed 4 | | Log likelihood function -1861.149 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Characteristics in numerator of Prob[Y = 1] Constant .1922286745 .38646475E-01 4.974 .0000

    MODELO II +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable VECES | | Weighting variable ONE | | Number of observations 2703 | | Iterations completed 6 | | Log likelihood function -1744.843 | +---------------------------------------------+

    +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    Characteristics in numerator of Prob[Y = 1] Constant -1.003536689 .10705899 -9.374 .0000 NOCHES .1276876219 .10680396E-01 11.955 .0000 10.794673 GASTOS -.6216886838E-06 .16365883E-06 -3.799 .0001 77314.730

    Predicted Values (* => observation was not in estimating sample.) Observation Observed Y Predicted Y Residual x(i)b Pr[Y=1]

    1 1.0000 2 1.0000 .00000 1.0000 -.1098 .4726 3 .00000 .00000 .0000 -.1103 .4724 4 1.0000 .00000 1.0000 -.1383 .4655

  • 27

    5 .00000 .00000 .0000 -.1098 .4726 6 1.0000 .00000 1.0000 -.1100 .4725 7 1.0000 .00000 1.0000 -.1099 .4726 8 1.0000 1.0000 .0000 .7837 .6865 9 1.0000 .00000 1.0000 -.2375 .4409 10 1.0000 .00000 1.0000 -.1100 .4725 11 1.0000 12 1.0000 .00000 1.0000 -.1100 .4725 13 1.0000 .00000 1.0000 -.1099 .4726 14 1.0000 1.0000 .0000 .9113 .7133 15 1.0000 1.0000 .0000 .7835 .6864 16 .00000 .00000 .0000 -.2375 .4409 17 1.0000 .00000 1.0000 -.1099 .4726 18 .00000 .00000 .0000 -.1102 .4725 19 1.0000 1.0000 .0000 .7835 20 1.0000 .00000 1.0000 -.1099 Se pide: a) En el Modelo I, Cunto vale la probabilidad del individuo 1?. Y la del 5?. b) Evaluar la significacin estadstica de los coeficientes del Modelo II. Globalmente, Es el Modelo II estadsticamente significativo?. c) En el Modelo II, calcular el efecto marginal de la variable NOCHES para el individuo medio. Interprete el resultado. d) En el Modelo II, Cul es la probabilidad estimada por el modelo de que el individuo 1 no haya venido y que el 11 haya venido al menos una vez?. Para ello, tenga en cuenta que el individuo 1 pasa 7 noches y dice que gasta solamente 400 pesetas; mientras que el 11 pasa 10 noches y gasta tambin 400 pesetas. Cules son sus valores predichos y residuos, respectivamente?. e) En el Modelo II, Cul es el odd de los individuos 19 y 20?. f) En el Modelo II, Cul es el efecto marginal de la variable GASTOS para los individuos 14 y 18?. Interprete el resultado. g) Si en toda la muestra existe un 45% de personas que visitaron ms de una vez la isla de Tenerife hasta 1999, cul es el % de aciertos y no aciertos del modelo II, para los primeros veinte individuos?. 82. Responda brevemente y de manera justificada a las siguientes cuestiones: 1.1) (0.5 puntos) Demuestre que el odd de un modelo logit binomial de k-variables

    explicativas no es independiente del resto de las variables (tanto continuas como discretas). Justifique su respuesta.

    1.2) (0.25 puntos) Sea ( ) 01 = ip . Cunto vale la probabilidad?. Y, Si 0

    1ln = i

    i

    pp ?.

    1.3) (0.25 puntos) En un modelo logit multinomial con tres alternativas ( 2,1,0=j ), A qu es igual el odd-ratio entre la alternativa 0 y 2?. Justifique su respuesta.

    1.4) (0.5 puntos) En el modelo de Poisson, si 0ln =ix , siendo 0 una constante, A qu es igual ( )1iYP sabiendo que 6,5,4,3,2,1,0=iy ?. Justifique su respuesta.

    1.5) (0.5 puntos) Es cierta la afirmacin de que en un modelo de regresin truncado, sea el truncamiento superior o inferior, el efecto marginal no es inferior con respecto al caso en que no exista truncamiento. Justifique su respuesta.

  • 28

    1.6) (0.5 puntos) Sea y una variable censurada inferiormente en 0. Si esta variable es ( )1,0N , entonces, A qu es igual [ ]yE ?.

    1.7) (0.5 puntos) Sea ( )1,0~ Ux una variable aleatoria truncada superiormente en el punto 31 y ( ) 1=xf , Cunto vale

    z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+

    TTME -.0979 .10528918E-01 -9.251 .0000 GC -.0114 .45838244E-02 -2.491 .0128 AASC 5.7753 .66299023 8.711 .0000 TASC 5.2830 .59420314 8.891 .0000 BASC 3.2163 .45585715 7.056 .0000 T_HINC -.0476 .12376830E-01 -3.843 .0001

    Y se dispone adicionalmente de la informacin del primer individuo de la muestra:

    Individuo 1 MODE TTME GC HINCAvin Tren

    Autobs Coche

    0 0 0 1

    69 34 35 0

    70 71 70 30

    35 35 35 35

    Se pide, calcular la probabilidad asignada por el modelo para la eleccin de ir en autobs. 85. Se dispone de la informacin sobre las siguientes variables: PRIV = decisin de tener al menos un hijo en colegio privado (=1,si; = 0, no). YRS = aos vividos en la comunidad. INC = Logaritmo de la renta. PTAX = logaritmo de los impuestos pagados sobre la propiedad. TAX = voto (0=no) sobre un impuesto de la propiedad. A continuacin, aparecen los resultados de la estimacin del siguiente modelo de Eleccin Discreta, en el que la variable endgena es TAX. +-----------------------------------------------------------------------+ | Dependent variable is binary, y=0 or y not equal 0 | | Ordinary least squares regression Weighting variable = none | | Dep. var. = TAX Mean= .6375000000 , S.D.= .4837550902 | | Model size: Observations = 80, Parameters = 5, Deg.Fr.= 75 | | Residuals: Sum of squares= 15.35904939 , Std.Dev.= .45253 | | Fit: R-squared= .169220, Adjusted R-squared = .12491 | | Model test: F[ 4, 75] = 3.82, Prob value = .00703 | | Diagnostic: Log-L = -47.5022, Restricted(b=0) Log-L = -54.9178 | | LogAmemiyaPrCrt.= -1.525, Akaike Info. Crt.= 1.313 | +-----------------------------------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Constant -.6501299531E-01 1.4267090 -.046 .9637 PRIV -.2026390498 .15401512 -1.316 .1883 .12500000 YRS -.3577810684E-02 .55246021E-02 -.648 .5172 8.7750000 INC .4727635679 .14558071 3.247 .0012 9.9677200 PTAX -.5698400912 .18646276 -3.056 .0022 6.9372738

    Normal exit from iterations. Exit status=0.

    +---------------------------------------------+ | Binomial Probit Model | | Maximum Likelihood Estimates | | Dependent variable TAX | | Weighting variable ONE | | Number of observations 80 | | Iterations completed 5 | | Log likelihood function -44.60409 | | Restricted log likelihood -52.38744 | | Chi-squared 15.56671 | | Degrees of freedom 4 | | Significance level .3659252E-02 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Index function for probability Constant -1.438212331 4.5332519 -.317 .7510 PRIV -.6254668928 .45015770 -1.389 .1647 .12500000 YRS -.9763633978E-02 .16139813E-01 -.605 .5452 8.7750000 INC 1.678640394 .58167049 2.886 .0039 9.9677200 PTAX -2.123845389 .75134583 -2.827 .0047 6.9372738

    Frequencies of actual & predicted outcomes Predicted outcome has maximum probability.

  • 30

    Predicted ------ ---------- + ----- Actual 0 1 | Total ------ ---------- + ----- 0 12 17 | 29 1 7 44 | 51 ------ ---------- + ----- Total 19 61 | 80

    Se pide: a) Cul es la probabilidad de votar NO para el primer individuo, sabiendo que su score es 0.2263?. Cul es la probabilidad de votar SI para el 10 individuo, sabiendo que su score es 0.9015?. b) Cul es el efecto marginal de las variables PTAX e INC, evaluado ste en la media de las observaciones individuales?. c) Si la probabilidad del individuo 8 fuese 0.6159, su renta fuese 2980.96 unidades monetarias, tuviese dos hijos en un colegio privado y los impuestos pagados sobre la propiedad fuesen de 148.41 unidades monetarias, cuntos aos habra vivido en la comunidad?. Suponga conocidos los valores de los parmetros obtenidos de la estimacin del modelo. d) Cul es el porcentaje de predicciones incorrectas?. 86. Sea 2,1,0=iy el nmero de veces de una variable Y. Se estima un modelo de Poisson, considerando como variables explicativas X1, X2 y X3. Los resultados de la estimacin son los siguientes:

    +---------------------------------------------+ | Poisson Regression | | Maximum Likelihood Estimates | | Dependent variable Y | | Weighting variable ONE | | Number of observations 15 | | Iterations completed 7 | | Log likelihood function -16.92002 | | Restricted log likelihood -20.22488 | | Chi-squared 6.609709 | | Degrees of freedom 3 | | Significance level .8543482E-01 | | Chi- squared = 9.40329 RsqP= .3283 | | G - squared = 11.77968 RsqD= .3594 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Constant .7551347557 .27109082 2.786 .0053 X1 .5086108632 .24598851 2.068 .0387 .26233333 X2 -.3799382583 .26275370 -1.446 .1482 -.20766667 X3 -.3219574305 .31345480 -1.027 .3044 -.30813333

    Se pide: a) Cul es la probabilidad para los individuos 1, 2 y 5 de la muestra, sabiendo que sus respectivos nmeros de veces son 1, 0 y 2, as como sus parmetros i son iguales a 0.36169, 0.44244 y 1.7826, respectivamente?. b) Cul es el efecto marginal de las variables X1 y X2, evaluado en la media de las observaciones individuales?. c) Suponiendo que el individuo 10 ha venido 0 veces, y la probabilidad estimada por el modelo es de 12.50%, Cunto vale la media y varianza condicional estimada por el modelo para este individuo?. 87. Suponga que un individuo tiene la posibilidad de elegir entre dos alternativas (=1 si la elige, =0 en caso contrario). Suponga tambin que los datos muestrales de 14 individuos se agrupan en 5 grupos para la variable jx . Estos datos aparecen resumidos

  • 31

    en la siguiente tabla para las proporciones muestrales jp , los valores de jx , las

    puntuaciones jj xx 10 += y el tamao muestral de cada grupo jn .

    jp jx jx jn 0.84 0.10 0.15 0.95 0.98

    6 4 3 8

    10

    1.72 -2.17 -1.66 3.00 4.30

    3 2 4 3 2

    Se pide que, con los datos anteriores, escriba la expresin del estimador eficiente usando esta informacin -en su forma matricial-, que es necesaria para estimar un modelo probit con observaciones repetidas. 88. Un estadio de ftbol, con capacidad para 60000 espectadores, se ha llenado el 25% de los partidos en l celebrados a lo largo de la competicin, con una cifra media de asistencia (incluidos los partidos en los que se llen el estadio) de 40000 espectadores. Cmo estimara la media y varianza de la demanda de localidades?. Cmo cambiara su respuesta si la cifra de 40000 espectadores no incluyese los partidos en que se llen el estadio?. Justifique brevemente su respuesta. 89. El logaritmo de la variable ingresos tiene distribucin normal, xy log= , con media y desviacin . Sabiendo que el grado de truncamiento es del 98% y que los ingresos de todos los hogares encuestados estn por encima de 100000 euros con media de 142000 euros para los ms acaudalados, tal que: [ ] [ ] 956.4605.4142log100log =>=> yyEyyE , Cul es el valor de y ?. Y el ingreso medio?. 90. Sea el siguiente modelo de ecuaciones simultneas:

    ttt

    tttt

    tttt

    icyuryi

    umyc

    +++=

    ++= 221

    1121

    donde las variables endgenas son tc (consumo), ii (inversin) e ty (renta). Las otras variables son predeterminadas ( tr es el tipo de inters, y tm es la masa monetaria), y itu , i=1,2, los residuos de ambas ecuaciones, distribuidos ( )2,0 iiid . Se pide: a) Identificar el modelo. b) Obtener la forma reducida para la ecuacin de consumo, inversin y renta.

  • 32

    PARTE II

    CUESTIONES TIPO TEST 1. Se ha estimado un modelo probit de eleccin de modo de transporte para ir al trabajo (1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre), con coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La constante estimada es 0.2. Segn el modelo, la probabilidad de que una mujer de 60 aos vaya a trabajar en su coche es:

    a) Menor del 90%. b) Mayor que la de un hombre de 30 aos. c) Menor que la del modelo logit equivalente. d) Ninguna de las anteriores.

    2. Sea un modelo de duracin del paro (en meses). Si la funcin de supervivencia estimada en t=4 vale 0.68:

    a) La probabilidad de estar ms de cuatro meses en paro es 0.68. b) La probabilidad de estar cuatro o menos meses en el paro es mayor que 0.68. c) La probabilidad de que pasados cuatro meses en paro se consiga trabajo en el

    siguiente intervalo de tiempo es 0.32. d) Ninguna de las anteriores.

    3. Creeemos que la nota media del expediente de un alumno de Economa depende linealmente del gnero (hombre=1), de la nota media del bachillerato, de las horas de estudio semanales y de caractersticas socioeconmicas del entorno familiar. Tenemos una muestra aleatoria de los alumnos que han pedido una beca entre cuyos requisitos se exige tener una nota media de expediente de 6 o mayor. Este es un caso de:

    a) Modelo tobit de regresin censurada con censuracin inferior en el punto 6. b) Modelo tobit de regresin censurada con doble censuracin, inferior en el punto

    6 y superior en el punto 10. c) Modelo de regresin truncada con truncacin inferior en el punto 6. d) Modelo de regresin truncada con doble truncacin, inferior en el punto 6 y

    superior en el punto 10. 4. En el caso anterior, el estimador del gnero de MCO es -0.8. Podemos interpretar que:

    a) En promedio y ceteris paribus los chicos tienen 0.8 puntos menos de media de expediente que las chicas.

    b) Considerando solo la poblacin de alumnos cuya nota media es igual o mayor que 6, en promedio y ceteris paribus los chicos tienen 0.8 puntos menos de media de expediente que las chicas.

    c) Como el estimador de MCO coincide en este caso particular con el de MV (por el teorema de Frobenius), podemos hacer inferencia a la poblacin, pero solo a la de mujeres ya que para ellas GENERO=0.

  • 33

    d) Ninguna de las anteriores. 5. Sea un modelo de probabilidad lineal dicotmico con una sola variable explicativa X:

    iii UXY ++= .

    a) Si se estima por MCO, los estimadores son insesgados, consistentes y eficientes. b) El valor esperado de la variable dependiente condicionada a X se interpreta

    como un score que es funcin no lineal de la probabilidad de Y=1. c) Es heterocedstico, siendo la varianza de las perturbaciones igual a

    )21()1( XX + . d) Ninguna de las anteriores.

    6. El modelo de utilidad aleatoria 2,1;'' =++= jcZU ijjiijij

    a) Supone que la funcin de utilidad que le reporta la alternativa j al individuo i es una funcin de distribucin.

    b) Implica, dados los supuestos habituales de racionalidad del consumidor, que la probabilidad de elegir la alternativa 1 es, en ltimo trmino, una funcin de densidad normal.

    c) Da lugar al modelo probit binomial si las utilidades aleatorias ij de ambas alternativas para el individuo i siguien distribuciones normales idnticas e independientes.

    d) Da lugar al modelo probit binomial si las utilidades aleatorias ij de ambas alternativas para el individuo i siguien distribuciones normales independientes, con idnticas varianzas entre individuos aunque con varianzas diferentes entre alternativas.

    7. Se ha estimado un modelo logit binomial con una constante (valor estimado = 2) y una variable explicativa X (coeficiente estimado = -0.8). El 35% de los individuos de la muestra ha elegido "actuar" (alternativa Y=1):

    a) El modelo estima que la probabilidad de que una persona caracterizada por X=2.5 elija "actuar" es exactamente del 50%.

    b) El odd-ratio de la variable X es 2.2255. c) Si X aumenta en una unidad, la probabilidad de "actuar" disminuye en 0.8. d) Si X aumenta en una unidad, el odd-ratio disminuye en 0.8.

    8. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados: Variable Coeficiente Error Estndar Individuo i Constante 1.7 0.3 X1 -0.5 0.04 4 X2 0.6 0.002 3

    El efecto marginal de X2 sobre la probabilidad de que el individuo i elija la alternativa 1 (Y=1= es:

    a) 0.6 b) 1.5

  • 34

    c) 0.08949 d) 0.817574

    9. En un modelo logit multinomial no ordenado con tres alternativas (la tercera es la de referencia), el efectto marginal de kx sobre la probabilidad de eleccin de la alternativa j es:

    a) jkijij PP )1( . b) )(

    1

    1=

    J

    hjkijikij PP .

    c) )(2

    1=

    h

    hkihjkij PP . d) Ninguna de las anteriores.

    10. En un modelo de regresin truncada con truncacin inferior, si el grado de truncacin estimado para los valores medios muestrales es 0.5:

    a) El efecto marginal sobre la esperanza de Y en la subpoblacin muestreada es 0.36338 veces el coeficiente de la regresin truncada estimado por MV.

    b) El efecto marginal sobre la esperanza de Y en la subpoblacin muestreada es 0.6366 veces el coeficiente de la regresin truncada estimado por MV.

    c) El efecto marginal sobre la esperanza de Y en la subpoblacin muestreada es 0.7978 veces el coeficiente de la regresin truncada estimado por MV.

    d) El efecto marginal sobre la esperanza de Y en la subpoblacin muestreada es el coeficiente de la regresin truncada estimado por MV.

    11. El concepto de truncamiento selectivo inferior consiste en que:

    a) Una variable solo se observa si otra variable con la que est correlacionada est por debajo de un valor fijo dado.

    b) Una variable solo se observa si otra variable con la que est correlacionada est por encima de un valor fijo dado.

    c) Es un modelo de regresin que mezcla el truncamiento con la censuracin. d) Es un modelo de regresin que ha pasado una selectividad previa de forma que

    los valores que no alcancen un determinado nivel de la variable endgena no pueden entrar en la muestra.

    12. Una variable X est distribuda N(200, 120). Est censurada inferiormente en el punto a=200. La esperanza de la distribucin censurada es:

    a) 295.7461. b) 312.8446. c) 162.7740. d) 185.3312.

    13. Con datos de las 3000 mayores empresas espaolas por volumen de ventas queremos estimar un modelo explicativo de las ventas (en logaritmo) vlido para todas las empresas espaolas, en funcin de los gastos en publicidad, la plantilla, dummies de sector y algunos ratios financieros. En este caso:

  • 35

    a) Los estimadores MCO son ELIO pero deben obtenerse mediante un algoritmo iterativo de optimizacin no lineal.

    b) Habr que utilizar MCG porque las perturbaciones son heterocedsticas. c) Como es una muestra censurada, debemos emplear el modelo tobit y estimarlo

    por MV. d) Como es una muestra truncada, debemos obtener el estimador MV del modelo

    de regresin truncada. 14. Considera la eleccin por el consumidor racional entre una cesta compuesta de bienes y las horas semanales de ocio. El IRPF grava en un porcentaje fijo las rentas del trabajo pero hay un mnimo exento:

    a) La frontera del conjunto de oportunidades tiene tres segmentos lineales y,

    dependiendo de la forma de las curvas de indiferencia, la combinacin ptima de ambos bienes puede ser una solucin de esquina, una de codo o dos tipos diferentes de tangencia.

    b) El conjunto de oportunidades tiene una frontera con agujeros. e) La frontera del conjunto de oportunidades es de tal forma que todos los

    individuos que deciden trabajar por debajo del lmite de horas sujeto al IRPF tendrn una solucin de esquina.

    d) En la especificacin economtrica del correspondiente modelo de horas trabajadas deberemos emplear un modelo tobit de regresin censurada con un punto de censuracin fijo igual al mnimo exento del impuesto.

    15. Sea una distribucin normal de media 20 y desviacin igual a 15, truncada superiormente en el punto 30:

    a) La media truncada es 15.45632 y la varianza truncada es inferior a 225. b) La media truncada es 15.45632 y la varianza truncada es superior a 225. c) La media truncada es 9.2065 y la varianza truncada es inferior a 225. d) Ninguna de las anteriores.

    16. Hemos estimado por MV un modelo de regresin truncada inferiormente en el punto a. El coeficiente estimado de la variable explicativa X:

    a) Es un estimador consistente del efecto marginal de X, sobre Y en la

    subpoblacin observada. b) Es un estimador consistente del efecto marginal de X, sobre Y correspondiente

    a la subpoblacin no observada. c) Es un estimador consistente del efecto marginal de X, sobre Y correspondiente

    a toda la poblacin. d) Es menor que el efecto marginal de X, sobre Y correspondiente a la

    subpoblacin observada. 17. Sea un modelo de oferta laboral de mujeres casadas, que explica las horas anuales trabajadas a partir de una muestra aleatoria de la poblacin que contiene trabajadoras y no trabajadoras. Una estrategia adecuada (consistente) de estimacin de los efectos del nmero de hijos pequeos sobre las horas ofertadas es:

  • 36

    a) Estimar por MV un modelo de dos ecuaciones, una probit que estima la probabilidad de trabajar y otra censurada (censuracin incidental segn la primera ecuacin) que estima las horas ofertadas.

    b) Estimar por MV un modelo de regresin truncada, con truncacin inferior en cero horas trabajadas.

    c) Estimar por MV un modelo tobit de regresin censurada, con censuracin inferior en cero horas trabajadas.

    d) Estimar primero por MCO un modelo de salarios con la submuestra de trabajadoras y luego un modelo de regresin censurada de las horas trabajadas