introducción a los modelos de elección discreta · introducción a los modelos de elección...

74
logo Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística - Departamento de Economía Grupo de Econometría Aplicada Universidad de Antioquia, Medellín II Escuela de Verano Centro de Estadística Aplicada a Estudios Socioeconómicos -CEAES- Agosto 4-6 de 2009

Upload: hanguyet

Post on 03-Aug-2018

228 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Introducción a los modelos de eleccióndiscreta

Santiago A. Gallón

Departamento de Matemáticas y Estadística− Departamento de EconomíaGrupo de Econometría Aplicada

Universidad de Antioquia, Medellín

II Escuela de VeranoCentro de Estadística Aplicada a Estudios Socioeconómicos −CEAES−

Agosto 4−6 de 2009

Page 2: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 3: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 4: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Motivación I

En la práctica se requiere explicar y predecir el comportamiento de lasdecisiones que realizan los individuos.En muchas situaciones las elecciones de los individuos son hechassobre un continuo de posibilidades, por ejemplo:

¿Cuánto gastar en la compra de un bien?¿Cuánto trabajar?

En otras situaciones las elecciones son hechas sobre un númerolimitado de posibilidades o alternativas⇒ elecciones discretas.

Trabajar o no trabajarEstudiar o no estudiar¿Dónde vivir?¿Cuál marca comprar?¿Cuál modo de transporte utilizar?,¿Por cuál candidato votar?, etcétera.

El conocimiento de los determinantes de este tipo de decisiones esimportante en el diseño de políticas socioeconómicas.

Page 5: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Motivación II

¿Qué es un modelo discreto?Son modelos en los cuales la variable dependiente toma valores discretos(Maddala, 1983).

Modelos de elección discretaModelos discretos que buscan describir el proceso de comportamiento de laselecciones de un agente (unidad) tomador(a) de decisiones entre un conjuntode alternativas.

También se conocen como:Modelos categóricosModelos cuantálesModelos de elección discretaModelos de elección cualitativaModelos de respuesta cualitativa

Page 6: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Aplicaciones:

Participación laboralAgremaciones laboralesLocalización de firmas y lugares de trabajoPrestamos bancariosFinanzasEnergíaMigraciónElección de modos de transporteCompra de bienes durablesDecisiones de inversiónInvestigación de mercadosLocalización de hogaresMatrimoniosDecisiones de nacimientosEducaciónLegislación y votacionesCriminología

Page 7: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 8: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Definiciones, notación y propiedades I

Unidad (individuo, familia, firma, banco,...) tomadora de decisiones,indexada por i = 1, . . . , n.Ci, conjunto de elección de la unidad conformado por Ji alternativas uopciones, indexadas por j = 1, . . . , Ji donde las alternativas deben ser:

Mutuamente exclusivas (elegir una alternativa implica no elegirninguna de las demás alternativas).Exahutivas (todas las posibles alternativas son incluídas).Finitas (el conjunto de elección es un conjunto contablefinitamente).

xij , vector de variables observadas relacionadas con la j-ésimaalternativa, conocidas como atributos, a las que se enfrenta la i-ésimaunidad.si, vector de variables observadas relacionadas con la unidad tomadorade decisiones (constantes para las alternativas).

Page 9: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Definiciones, notación y propiedades II

Uij , nivel de utilidad (“bienestar”, “felicidad”) de la i-ésima unidadobtenido a partir de la elección de la j-ésima alternativa. Dicha utilidadno es conocida por el investigador.Bajo el supuesto de que la unidad se comporta como un agentemaximizador de su utilidad, entonces éste elige la alternativa j sí y sólosí Uij > Uik, ∀j 6= k.Vij = V (xij , si,β), función observada por el investigador querelaciona los factores observables xij y si con la utilidad de la unidadtomadora de decisiones.Dado que existen factores no observados por el investigador, ésto esUij 6= Vij , entonces

Uij = Vij + εij

= V (xij , si,β) + εij(1)

donde εij es una secuencia de variables aleatorias i.i.d. con función dedensidad, f(εij).

Page 10: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Definiciones, notación y propiedades III

Probabilidad de elección de la j-ésima alternativa, ∀j 6= k

Pr j = Pr ij = Pr(Uij > Uik)

= Pr(Vij + εij > Vik + εik)

= Pr(εik − εij < Vij − Vik)

= Pr(εikj < Vij − Vik)

=

∫ Vij−Vi1

−∞

∫ Vij−Vi2

−∞· · ·∫ Vij−ViJ

−∞g(εij)dεij

(2)

donde εij = (εi1j , . . . , εiJj)′ es un vector de dimensión (J − 1), con

“. . .” sobre todas las alternativas excepto la j-ésima alternativa; yg(εij) su función de densidad.

Page 11: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Definiciones, notación y propiedades IV

Otra manera de derivar los modelos de elección discreta

y∗ij = h(xij ,β, εij) (3)

donde h(·) usualmente se define como h(xij ,β, εij) = x′ijβ + εijdonde x′ijβ es conocida como función índice.El individuo i elige la alternativa j, sí max(y∗i ) = y∗ij > 0 y no símax(y∗i ) ≤ 0, donde y∗i = (y∗i1, . . . , y

∗iJ)′.

En la práctica y∗ij es no observable (latente), para lo cual se define unavariable dummy, yij , dada por

yi =

j, sí max(y∗i ) = y∗ij > 0

0, sí max(y∗i ) ≤ 0

Page 12: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Definiciones, notación y propiedades V

Las probabilidades de elección para j = 1, . . . , J

Pr ij = Pr(yi = j|xij) = Pr(y∗ij > 0|xij)= Pr(h(xij ,β, εij) > 0|xij)= Pr(x′ijβ + εij > 0|xij)= Pr(εij > −x′ijβ|xij)= 1− F (−x′ijβ|xij)= F (x′ijβ)

= Fij

(4)

donde F es la función de distribución acumulada de ε (simétrica).

0 < Fij < 1,∑J

j=1Fij = 1.

Page 13: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos de elección binaria I

ObjetivoModelar el comportamiento de elección de los individuos cuando solamenteexisten dos (J = 2) alternativas.

Page 14: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos de elección binaria II

Maximización de la utilidad aleatoriaUtilidades derivadas de las elecciones (j = 1, 2)

Ui1 = Vi1 + εi1 = V (xi1, s1,β) + εi1

Ui2 = Vi2 + εi2 = V (xi2, s2,β) + εi2

Probabilidades de elección

Pr 1 = Pr i1 = Pr(Ui1 > Ui2)

= Pr(Vi1 + εi1 > Vi2 + εi2)

= Pr(εi2 − εi1 < Vi1 − Vi2)

= F (Vi1 − Vi2)

Pr 2 = Pr i2 = 1− Pr 1

= 1− F (Vi1 − Vi2)

Page 15: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos de elección binaria III

Función índice

y∗i = h(xi,β, εi) = x′iβ + εi

con yi = 1 sí y∗i > 0 y yi = 0 sí y∗i ≤ 0.Probabilidades de elección

Pr(yi = 1|xi) = Pr(y∗i > 0|xi)= Pr(x′iβ + εi > 0|xi)= Pr(εi > −x′iβ|xi)= 1− F (−x′iβ|xi)= F (x′iβ)

Pr(yi = 0|xi) = Pr(y∗i ≤ 0|xi) = 1− F (x′iβ)

Page 16: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 17: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Para calcular las probabilidades de elección se deben evaluar las integralesque las definen. Existen tres posibilidades:

Expresión de forma cerrada completa: Para ciertas especificaciones def(x′iβ) la integral puede calcularse de manera exacta (expresada apartir de una fórmula de “forma cerrada”).Simulación completa: Cuando la integral no puede resolverseanalíticamente, entonces ésta puede aproximarse por medio de técnicasde simulaciónSimulación y expresión de forma cerrada parcial: combinación de lasanteriores.

Page 18: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo de probabilidad lineal

Modelo de probabilidad lineal

Pr(yi = 1) = F (xi,β) + εi

yi = x′iβ + εi

con E(εi) = 0 y yi es una variable binaria que toma el valor de 1 si el eventoocurre y 0 en otro caso.

El valor ajustado, yi = x′iβ, puede tener valores fuera del rango (0, 1).El modelo es heterocedástico:

V ar(εi|xi) = x′iβ(1− x′iβ)2 + (1− x′iβ)(x′iβ)2

= x′iβ(1− x′iβ)

= E(yi)[1− E(yi)]

El modelo supone que la probabilidad de ocurrencia del evento siemprees la misma ante cambios en xi.

Page 19: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo de probabilidad lineal

Page 20: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo de probabilidad lineal

Page 21: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo Logit

Función logísticaSabemos que

Pr j = Pr ij = Pr(εik − εij < Vij − Vik)

= Pr(εikj < Vij − Vik)

Asumiendo que εij distribuye independiente e identicamente como unaGumbel (o de valor extremo tipo I) con f.d.p. y función de distribucióndadas por:

f(εij) = exp(−εij) exp(− exp(−εij))

F (εij) = exp(− exp(−εij)

entonces εikj = εik − εij sigue una distribución logistica:

F (εikj) = Λ(εikj) =exp(εikj)

1 + exp(εikj)

Page 22: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo Logit

Probabilidades de elección logitDespués de algunas manipulaciones algebráicas (véase, Train (2003),Maddala (1983), y Cameron y Trivedi (2005)) se tiene que:

Pr ij = F (x′iβ) = Λ(x′iβ) =exp(x′iβ)

1 + exp(x′iβ)

=1

1 + exp(−x′iβ)

donde la f.d.p está dada por

f(x′iβ) = Λ(x′iβ)[1− Λ(x′iβ)] =exp(x′iβ)

[1 + exp(x′iβ)]2

Page 23: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo Probit

Modelo ProbitAsumiendo que εij distribuye i.i.d. como una normal estándar y dadoque la diferencia entre variables aleatorias normales es normal,entonces:

F (Vij − Vik) = Φ(Vij − Vik) =

∫ Vij−Vik

−∞φ(εikj)dεikj

dondef(εikj) = φ(εikj) =

1√2π

exp(−ε2ikj/2)

Probabilidades de elección probit (asumiendo Vij − Vik = x′iβ)

Pr ij = F (x′iβ) = Φ(x′iβ) =

∫ x′iβ

−∞φ(z)dz

donde φ(z) = 1√2π

exp(−z2/2)

Page 24: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo Probit

Page 25: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Efectos marginalesUno de los objetivos de los modelos de elección discreta consiste endeterminar los efectos marginales de los cambios de las variablesregresoras sobre la probabilidad condicional:

∂E(yi|xi)∂xi

=

dF (x′iβ)

d(x′iβ)

β = f(x′iβ)β

Los efectos marginales difieren en el punto de evaluación xi y con laforma funcional F (·)

Modelo Probabilidad F (·) Efecto marginalLineal x′iβ β

Logit Λ(x′iβ) =exp(x′

iβ)

1+exp(x′iβ)

Λ(x′iβ)[1 − Λ(x′iβ)]β

Probit Φ(x′iβ) =∫ x′

iβ−∞ φ(z)dz φ(x′iβ)β

Efectos marginales promedio:

n−1∑n

i=1f(x′iβ)β ó f(x′iβ)β

Page 26: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 27: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

El resultado del modelo de elección binaria distribuye Bernoulli:

f(yi|x) = Pr iyi(1− Pr i)

1−yi , yi = 0, 1

= [F (x′iβ)]yi [1− F (x′iβ)]1−yi

Función de verosimilitud

L(β) = Pr(Y1 = y1, · · · , Yn = yn) =∏yi=1

F (x′iβ)∏yi=0

[1− F (x′iβ)]

=

n∏i=1

[F (x′iβ)]yi [1− F (x′iβ)]1−yi

Función log verosimil

lnL(β) =

n∑i=1

yi lnF (x′iβ) + (1− yi) ln[1− F (x′iβ)]

Page 28: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

βML tal que sea solución de la ecuación (no lineal)

∂ lnL(β)

∂β=

n∑i=1

yi − F (x′iβ)

F (x′iβ)[1− F (x′iβ)]f(x′iβ)xi = 0

donde f(x′iβ) =dF (x′

iβ)dx′

Matriz de segundas derivadas del lnL(β) (Hessiana)

∂2 lnL(β)

∂β∂β′=−

n∑i=1

[yi

F 2(x′iβ)+

1− yi[1− F (x′iβ)]2

]f2(x′iβ)xix

′i

+

n∑i=1

[yi − F (x′iβ)

F (x′iβ)[1− F (x′iβ)]

]f(x′iβ)xix

′i

con esperanza

E

(∂2 lnL(β)

∂β∂β′

)= −

n∑i=1

[f2(x′iβ)

F (x′iβ)[1− F (x′iβ)]xix

′i

]

Page 29: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Matriz de varianzas y covarianzas asintótica de βML

V (βML) = −E(∂2 lnL(β)

∂β∂β′

)−1=

n∑i=1

[f2(x′iβ)

F (x′iβ)[1− F (x′iβ)]xix

′i

]−1βML es consistente y βML

a∼ N(β, V (βML)).

Page 30: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Relación entre los modelos LP, logit y probit I

Relación entre los modelos Logit y probit

βlogit ≈ 1.6βprobit

Relación entre los modelos LP y probit

βLP ≈ 0.4βprobit excepto para la constante

βLP ≈ 0.4βprobit + 0.5 para la constante

Relación entre los modelos LP y logit

βLP ≈ 0.25βlogit excepto para la constante

βLP ≈ 0.25βlogit + 0.5 para la constante

Page 31: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Métodos iterativos para la estimación MLMétodo de Newton-Raphson

βt+1 = βt −

[(∂2 lnL(β)

∂β∂β′

)β=βt

]−1(∂ lnL(β)

∂β

)β=βt

Método Scoring

βt+1 = βt −

[E

(∂2 lnL(β)

∂β∂β′

)β=βt

]−1(∂ lnL(β)

∂β

)β=βt

Otros métodos:Algorítmo de Berndt-Hall-Hall-Hausman (BHHH).Algorítmo de Davidon-Fletcher-Powell (DFP).Algorítmo de Broyden-Fletcher-Goldfarb-Shanno (BFGS).

Page 32: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Medidas de bondad de ajuste e inferencia

R2 = 1− lnL(β)

lnL(y)

= 1−

∑ni=1

yi lnF (x′iβ) + (1− yi) ln[1− F (x′iβ)]

n[y ln y + (1− y) ln(1− y)]

donde y = n−1∑ni=1 yi.

ρyi,Fi=

∑ni=1(yi − y)(Fi(x

′iβ)− F )∑n

i=1(yi − y)2∑ni=1(Fi(x′iβ)− F )2

Inferencia

H0 : Qβ = c

dondeQ y c son una matriz y vector de constantes conocidas dedimensiones q ×K y q, respectivamente.

Page 33: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Para q = 1

Qβ − c√QV (βML)Q′

a∼ tn−K

Para q > 1

Wald = (Qβ − c)′[QV (βML)Q′]−1(Qβ − c) a∼ χ2q

LR = 2[lnL(βML)− lnL(βCML)]a∼ χ2

q

donde βCML denota el estimador de máxima verosimilitud restringidoobtenido de maximizar la función lnL sujeto a la restricciónQβ = c.

Page 34: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 35: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales

Modelos donde existen más de dos elecciones, (J > 2).Existen diferentes modelos de múltiple respuesta dependiendo de laespecificación de la forma funcional de las probabilidades de elección ydel tipo de variables regresoras que determinan la elección:

1 Regresores que varían entre las alternativas para un individuo(tiempo, color, tamaño y costos,...), xij .

2 Regresores invariantes entre las alternativas (edad, género,ingreso, nivel educativo,...), xi.

Page 36: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit multinomial -MNL-

Modelo logit multinomial -MNL-Probabilidades de elección

Pr ij = Pr(yi = j)

=exp(x′iβj)J∑k=1

exp(x′iβk)

, j = 1, . . . , J

Como∑Jj=1 Pr ij = 1 se requiere de la restricción β1 = 0 para

garantizar la identificación del modelo.

Función de verosimilitud

L =

n∏i=1

J∏j=1

(Pr ij)yij

Page 37: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit multinomial -MNL-

Función log-verosímil

lnL =

n∑i=1

J∑j=1

yij ln Pr ij

=

n∑i=1

J∑j=1

yij ln

(exp(x′iβj)∑Jk=1 exp(x′iβk)

)

βl,MNL tal que sea solución de la ecuación (no lineal)

∂ lnL

∂βl=

n∑i=1

J∑j=1

yijPr ij

∂ Pr ij∂βl

=

n∑i=1

(yil − Pr il)xi = 0, l = 1, . . . , J

Page 38: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit multinomial -MNL-

Matriz de segundas derivadas

∂2 lnL

∂βj∂β′l

= −n∑i=1

J∑j=1

∂ Pr ij

∂β′lxi

= −n∑i=1

Pr ij(δijl − Pr il)xix′i, j, l = 1, . . . , J.

donde δijl = 1 sí j = l y δijl = 0 sí j 6= l.

βMNL es consistente y

βMNLa∼ N

(β,

[E

(∂2 lnL

∂β∂β′

)]−1)

Page 39: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit multinomial -MNL-

Efectos marginales

∂ Pr ij∂xi

=exp(x′iβj)J∑k=1

exp(x′iβk)

βj −exp(x′iβj)(

J∑k=1

exp(x′iβk)

)2

J∑k=1

exp(x′iβk)βk

= Pr ijβj − Pr ij

J∑k=1

Pr ikβk

= Pr ij(βj − βi

)donde βi =

∑Jk=1 Pr ikβk

Page 40: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

Modelo logit condicional -CL-

Pr ij = Pr(yi = j)

=exp(x′ijβ)

J∑k=1

exp(x′ikβ)

, j = 1, . . . , J

Page 41: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

Función de verosimilitud

L =

n∏i=1

J∏j=1

(Pr ij)yij

Función log-verosímil

lnL =

n∑i=1

J∑j=1

yij ln Pr ij

=

n∑i=1

J∑j=1

yij ln

(exp(x′ijβ)∑Jk=1 exp(x′ikβ)

)

Page 42: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

βCL tal que sea solución de la ecuación (no lineal)

∂ lnL

∂β=

n∑i=1

J∑j=1

yijPr ij

∂ Pr ij∂β

=

n∑i=1

J∑j=1

yijPr ij

Pr ij(xij − xi)

=

n∑i=1

J∑j=1

yij(xij − xi) = 0

donde xi =∑Jk=1 Pr ikxik

Page 43: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

Matriz de segundas derivadas

∂2 lnL

∂β∂β′= −

n∑i=1

J∑j=1

yij∂xi

∂β′

= −n∑i=1

J∑j=1

Pr ij(xij − xi)(xij − xi)′

βCL es consistente y

βCLa∼ N

(β,

[E

(∂2 lnL

∂β∂β′

)]−1)

Page 44: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

Efectos marginales

∂ Pr ij∂xij

=exp(x′ijβ)

J∑k=1

exp(x′ikβ)

β −exp(x′ijβ)(

J∑k=1

exp(x′ikβ)

)2 exp(x′ijβ)β

= Pr ij(1− Pr ij)β

∂ Pr ij∂xil

= −exp(x′ijβ)(

J∑k=1

exp(x′ikβ)

)2 exp(x′ilβ)β

= −Pr ij Pr ilβ

Page 45: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

Independencia de las alternativas irrelevantes -IIA-Razones (cocientes) de disparidad (Odds ratio)

Pr ijPr ik

=exp(x′ijβ)/

∑Jj=1 exp(x′ijβ)

exp(x′ikβ)/∑Jj=1 exp(x′ijβ)

=exp(x′ijβ)

exp(x′ikβ)

= exp(x′ij − x′ik)β

Interpretación: cuántas veces es más probable de que ocurra el eventoyi = j relativo al evento yi = k.Los cocientes de disparidad tiene la propiedad de no afectarse enpresencia de alternativas adicionales o del cambio en los atributos de lasdemás alternativas =⇒ Propiedad de independencia de las alternativasirrelevantes -IIA-Esto se debe al supuesto de independencia de εij .

Page 46: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit condicional -CL-

EjemploSupóngase que un individuo es indiferente entre las opciones de viajaren auto o en bus (de color azul): Pc = Pba = 1/2⇒ Pc/Pba = 1.Ahora supóngase que hay una nuevo bus (de color rojo) y que elindividuo considera ambos buses iguales tal que: Pba/Pbr = 1.En el modelo logit los cocientes entre las probabilidades son igualesindependientemente de la presencia o no de otra alternativa, así lasúnicas probabilidades para las cuales Pc/Pba = 1 y Pbr/Pba = 1 sonPc = Pba = Pbr = 1/3.En la vida real se esperaría que el cociente Pba/Pc cambie con laintroducción de una nueva alternativa (bus de color rojo). Supóngaseque el individuo es indiferente de viajar en carro o bus Pc = Pb = 1/2y que es indiferente de entre el bus azul o rojo Pba = Pbr = 1/4. Estoimplica que Pba/Pbr = 1 y Pba/Pc = (1/4)/(1/2) = 1/2, violando elsupuesto IIA.

Page 47: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo probit multinomial -MNP-

Modelo probit multinomial -MNP-Función de densidad multivariada de εi = (εi1, . . . , εiJ)′ con mediacero y matriz de varianzas y covarianzas Σ, εi ∼ N(0,Σ):

f(εi) = φ(εi) = (2π)−J/2 |Σ|−1/2 exp[− 1

2ε′iΣ−1εi

]donde |Σ| es el determinante de Σ.Probabilidad de elección de la j-ésima alternativa, ∀j 6= k

Pr ij = Pr(Uij > Uik)

= Pr(Vij + εij > Vik + εik)

= Pr(εik − εij < Vij − Vik)

= Pr(εikj < Vij − Vik)

=

∫ Vij−Vi1

−∞

∫ Vij−Vi2

−∞· · ·∫ Vij−ViJ

−∞g(εij)dεij

con εij = (εi1j , . . . , εiJj)′ vector de dimensión (J − 1) y función de

densidad g(εij).

Page 48: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo probit multinomial -MNP-

Modelo probit multinomial -MNP-Como la diferencia de normales es normal, entonces

Pr ij = (2π)−(J−1)/2 |Ωj |−1/2∫ Vij1

−∞· · ·∫ VijJ

−∞exp

[− 1

2z′iΩ−1j zi

]dz

donde Vijk = Vij − Vik, ∀k = 1, . . . , J (k 6= j), y Ωj es la matriz devarianzas y covarianzas de εij de dimensión (J − 1).Con el fin de facilitar el cálculo de las probabilidades y asegurar laidentificación de los parámetros se requiere de la imposición derestricciones sobre Ωj (“estructuras de varianza”).Train (2003) propone un procedimiento de normalización fijando lavarianza de una de las diferencias de los errores con respecto a laalternativa j, εikj = εik − εij . Usualmente se asumen las diferenciascon respecto a la primera alternativa, εik1 = εik − εi1.La reducción del número de parámetros es una normalización queelimina aspectos irrelevantes de la matriz Σ.

Page 49: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo probit multinomial -MNP-

EjemploJ = 3 con errores εi = (εi1, εi2, εi3)′ y matriz de varianzas ycovarianzas

Σ =

σ11 σ12 σ13σ12 σ22 σ23σ13 σ23 σ33

Considérese la probabilidad de elegir la alternativa j = 1:Pr(εi2 − εi1 < Vi1 − Vi2 y εi3 − εi1 < Vi1 − Vi3), entonces

Ω1 =

[σ11 + σ22 − 2σ12 ·

σ11 − σ13 − σ12 + σ23 σ11 + σ33 − 2σ13

]Normalización

Ω∗1 =

[1 ·

(σ11−σ13−σ12+σ23)(σ11+σ22−2σ12)

σ11+σ33−2σ13

(σ11+σ22−2σ12)

]

Page 50: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit anidado -NLOGIT-

Modelo propuesto por McFadden (1978) para relajar el supuesto deindependencia de las alternativas irrelevantes -IIA- de los modelosmultinomiales logísticos (logit multinomial y logit condicional).Modelo apropiado cuando el conjunto de alternativas puedeparticionarse en subconjuntos, llamados nidos (nests). Es decir, cuandoexiste una clara estructura de anidación que consiste en:

1 En un primera etapa, el individuo elige entre un conjunto de elecciónconformado por L alternativas indexadas por l = 1, · · · , L.

2 Luego, condicionado a la elección de la l-ésima alternativa, el individuoelige entre un conjunto de elección conformado por Jl alternativasindexadas por j = 1, · · · , Jl (conjunto de alternativas anidadas en lal-ésima alternativa).

3 Y así sucesivamente...

La estructura de anidación se acostumbra ilustrarla por medio de un“diagrama de árbol de decisiones”.

Diagrama de árbol de decisión con dos niveles de anidación

Page 51: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit anidado -NLOGIT-

Elección︷ ︸︸ ︷1···︷ ︸︸ ︷

1 · · · J1 · · · · · ····l···︷ ︸︸ ︷

1 · · · Jl · · · · · ····L︷ ︸︸ ︷

1 · · · JLPropiedades:

1 Para cualquier par de alternativas que pertenecen al mismo nido, elcociente de las propabilidades es independiente de los atributos oexistencia de todas las otras alternativas. Es decir, el supuesto de IIA secumple dentro de cada nido.

2 Para cualquier par de alternativas en diferentes nidos, el cociente de laspropabilidades puede depender de los atributos de las otras alternativas enlos dos nidos. Es decir, en general el supuesto de IIA no se cumple paraalternativas en diferentes nidos.

Page 52: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-Utilidad de la i-ésima unidad obtenida a partir de la elección de laj-ésima alternativa perteneciente a la l-ésima elección (nido).

Uijl = Vijl + εijl

= (x′ij|lβl + z′ilγ) + εijl, j = 1, . . . , Jl, l = 1, . . . , L.

donde εi sigue una f.d. conjunta de valor extremo generalizada (GEV):

F (εi) = exp

−L∑l=1

Jl∑j=1

exp −εij/τl

τl

τl mide el grado de independencia entre los componentes noobservados de la utilidad para alternativas dentro del l-ésimo nido.1− τl puede emplearse como una medida de correlación.Cuando τl = 1, ∀l implica completa independencia entre todas lasalternativas en todos los nidos.

Page 53: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-Probabilidad conjunta de que la i-ésima unidad elija la j-ésimaalternativa perteneciente a la l-ésima elección

Pr ijl = Pr ij|l Pr il, j = 1, . . . , Jl, l = 1, . . . , L

Probabilidad de elección de la alternativa j condicionada a la elección l

Pr ij|l = Pr(yi = j|l)

=exp(x′ij|lβl/τl)

Jl∑k=1

exp(x′ik|lβl/τl)

, j = 1, . . . , Jl, l = 1, . . . , L

Probabilidad (marginal) de elección de la alternativa l

Pr il = Pr(yi = l)

=exp(z′ilγ + τlIil)

L∑m=1

exp(z′imγ + τmIim)

, l = 1, . . . , L

Page 54: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelo logit anidado -NLOGIT-

Modelo logit anidado -NLOGIT-

Iil = ln∑Jl

k=1 exp(x′ikβl/τl)

son los valores inclusivos para lacategoría l.Iil relaciona las probabilidades marginal y condicional trayendoinformación desde la probabilidad condicional hacia la probabilidadmarginal.τlIil tiene la interpretación de la utilidad esperada que el i-ésimoindividuo recibe de la elección entre las alternativas en el nido l.

Page 55: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales ordenados -OMM-

Modelo multinomial ordenadoModelos en los cuales existe un ordenamiento de la variabledependiente (discreta).Aplicaciones:

Clasificación del riesgo de activos financieros (“bajo”, “medio” y“alto” riesgo).Calificación de instituciones financieras (“AAA”, “AAB”, “AA2,“A”, “BBB”, “B”,...)Test de gustos.Encuestas de opinión (niveles de satisfacción).Nivel de habilidades laborales.Nivel de cubrimiento de programas sociales.

Page 56: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales ordenados -OMM-

Modelo multinomial ordenadoEl punto de partida de los modelos multinomiales ordenados es elmodelo de variable latente:

y∗i = x′iβ + εi

Para J alternativas se define la variable

yi = j sí αj−1 < y∗i ≤ αj , j = 1, . . . , J.

donde αj son parámetros de umbral con α0 = −∞ y αJ =∞.Probabilidades de elección

Pr(yi = j) = Pr(αj−1 < y∗i ≤ αj)= Pr(αj−1 < x

′iβ + εi ≤ αj)

= Pr(αj−1 − x′iβ < εi ≤ αj − x′iβ)

= F (αj − x′iβ)− F (αj−1 − x′iβ)

donde F (·) es la función de distribución acumulada de εi.

Page 57: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales ordenados -OMM-

Modelo logit ordenadoProbabilidades de elección

Pr(yi = j) = F (αj − x′iβ)− F (αj−1 − x′iβ)

= Λ(αj − x′iβ)− Λ(αj−1 − x′iβ)

=exp(αj − x′iβ)

1 + exp(αj − x′iβ)− exp(αj−1 − x′iβ)

1 + exp(αj−1 − x′iβ)

donde Λ(·) es la función de distribución acumulada logística.

Modelo probit ordenadoProbabilidades de elección

Pr(yi = j) = F (αj − x′iβ)− F (αj−1 − x′iβ)

= Φ(αj − x′iβ)− Φ(αj−1 − x′iβ)

donde Φ(·) es la función de distribución acumulada normal estándar.

Page 58: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales ordenados -OMM-

Page 59: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Modelos multinomiales ordenados -OMM-

La función lnL(β, α1, . . . , αJ−1) es

lnL(β,α) =

n∑i=1

J∑j=1

Ij(yi) ln Pr ij

=

n∑i=1

J∑j=1

Ij(yi) ln [F (αj − x′iβ)− F (αj−1 − x′iβ)]

donde

Ij(yi) =

1, sí yi = j;

0, en otro caso

Efectos marginales

∂ Pr(yi = j)

∂xi= [f(αj−1 − x′iβ)− f(αj − x′iβ)]β

donde f(z) = dF (z)/dz

Page 60: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 61: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Comandos de Stata:logit, logistic: Modelo logitprobit: Modelo probitclogit: Modelo logit condicionalmlogit: Modelo logit multinomialasmprobit, amprobit: Modelo probit multinomialnlogit: modelo logit anidadoologit: modelo logit ordenadosoprobit: modelo probit ordenados

Paquetes de R:stats: incluye los modelos logit y probitmlogit: Modelo logit multinomial y logit condicionalMNP: Modelo probit multinomial y probit ordenado

Otros software: Limdep, SAS, DCM bajo Ox, Eviews, etc.

Page 62: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Factores de riesgo asociados con el bajo peso al nacer189 observaciones, n = 189.Variables:

1 Peso al nacer (low): peso < 2500 gramos (low =1) y peso ≥ 2500gramos (low = 0)

2 Raza (race): blanca (race = 1), negra (race = 2), u otra (race = 3)3 Edad de la madre (age)4 Peso último perido mestrual (lwt)5 Fumó durante el embarazo (smoke)6 Historia laboral prematura (ptl)7 Historia de hipertensión (ht): sí (ht = 1) y no (ht = 0)8 Irritabilidad uterina (ui): sí (ui = 1) y no (ui = 0)

Modelo especificado

Pr ij =F (βageagei + βlwtlwti + βsmokesmokei + βptlptli + βhthti+ βuiuii + βrace2di,race=2 + βrace3di,race=3)

Page 63: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Determinantes de tener carro propio437 observaciones, n = 437.Variables:

1 Carro propio (owncar): 1 sí el estudiante tiene carro propio2 Edad del estudiante (age)3 Ingreso mensual (income)4 Género (male): masculino (male = 1) y femenino (male = 0)

Modelo especificado

Pr ij =F (βincomeincomei + βageagei + βmalemalei)

Page 64: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Elección de modos de transporteAnálisis de elección de modos de transporte para viajar entre Sydney yMelbourne, Australia (Hensher y Greene, 1995).210 observaciones, n = 210.Modos de transporte (J = 4 alternativas): aire, tren, bus o carro.Variables:

1 Elección de transporte (Mode)2 Medida de costo generalizado del viaje (GC).3 Costo en el vehículo (INVC).4 Tiempo de espera en el terminal de transporte, 0 para el carro (TTME).5 Tiempo de viaje (INVT).6 Ingreso familiar (HINC).

Page 65: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Elección de modos de transporte

Árbol de decisión de dos niveles

Modelo especificado

Uij =αavióndi,avión + αtrendi,tren + αbusdi,bus

+ βGCGCij + βTTMETTMEij + γHINCdi,aireHINCi + εij

donde di,j son constantes correspondientes a las elecciones.

Page 66: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Elección de restaurantesAnálisis de elección de tipos de restaurantes.Tipos de restaurantes (L = 3 alternativas): restaurantes de comidarápida, restaurantes familiares y restaurantes lujosos.300 familias, n = 210 para 3100 observaciones (n× L).Variables:

1 Variable identificadora de la familia (id)2 Elección (chosen): sí (chosen = 1) y no (chosen = 0)3 Elecciones de restaurantes (restaurant)4 Ingreso familiar (income).5 Costo promedio de la comida por persona (cost).6 Número de niños en la familia (kids).7 Calificación en la guiá de restaurantes locales (rating).8 Distancia entre el hogar y el restaurante (distance).

Page 67: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Elección de restaurantes

Árbol de decisión de dos niveles

Modelo especificado

Pr(restaurant|type) = Pr(βcost cost + βrating rating + βdistance distance)

Pr(type) = Pr(αiFast incFast + αiFancy incFancy + αkFast kidFast+ αkFancy kidFancy + τfastIfast + τfamilyIfamily + τfancyIfancy)

Page 68: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Registro de reparación de autos66 observaciones, n = 66.Variables:

1 Registro de reparación en 1977 (rep77): “poor”, “fair”, “average”, “good”y “excellent”.

2 Nacionalidad del auto (foreign): doméstico (foreign = 0) y extranjero(foreign = 1)

3 Variable proxy del tamaño del vehículo (length)4 Millas por galón (mpg)

Modelo especificado

Pr(yi = j) = Pr(αj−1 < y∗i ≤ αj)= Pr(αj−1 < βforeforeign + βlengthlength + βmpgmpg + εi ≤ αj)

Page 69: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Contenido

1 Motivación2 Definiciones3 Probabilidades de elección

Modelo de probabilidad linealModelo LogitModelo Probit

4 Estimación e inferencia5 Modelos de múltiple respuesta

Modelo logit multinomial -MNL-Modelo logit condicional -CL-Modelo probit multinomial -MNP-Modelo logit anidado -NLOGIT-Modelos multinomiales ordenados -OMM-

6 Estimación en Stata y R7 Tópicos

Page 70: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Tópicos I

Modelos multivariadosPanel de datosModelos de función índice no linealModelos de coeficientes aleatoriosModelos discretos-continuosModelos de autoselecciónModelos truncados y censuradosModelos de supervivencia (modelos de duración)Modelos semi y no paramétricosModelos de conteo

Page 71: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Bibliografia I

Amemiya, T., 1985.Advanced EconometricsHarvard University Press.

Cameron, C. and P. Trivedi, 2005.Microeconometrics: Methods and ApplicationsCambridge University Press.

Gourieroux, C. and P. Klassen, 2000.Econometrics of Qualitative Dependent VariablesCambridge University Press.

Hensher, D., J. Rose and W. Greene, 2005.Applied Choice Analysis: A PrimerCambridge University Press.

Maddala, G.S. 1983.Limited-Dependent and Qualitative Variables in EconometricsCambridge University Press, Cambridge

McFadden, D. and Manski, C. (Editors), 1981.Structural Analysis of Discrete Data and Econometric ApplicationsCambridge: The MIT Press.

Page 72: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Bibliografia II

Train, K., 1986.Qualitative Choice Analysis: Theory, Econometrics, and an Application to AutomobileDemandCambridge: The MIT Press.

Train, K., 2003.Discrete Choice Methods with SimulationCambridge University Press.

Amemiya, T., 1981.Qualitative Response Models: A SurveyJournal of Economic Literature, 19, 1483-1536.

McFadden, D., 1974.Conditional Logit Analysis of Qualitative Choice Behaviourin P. Zarembka (ed.), Frontiers in Econometrics, 105-142, Academic Press: New York.

McFadden, D., 1978.Modeling the Choice of Residencial Locationin A. Karlqvist, L. Lundqvist, F. Snickars, and J. Weibull (eds.), Spacial InteractionTheory and Planning Models, 75-96, North-Holland: Amsterdam.

Page 73: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

Bibliografia III

McFadden, D., 1984.Econometric Analysis of Qualitative Response Modelsin: Z. Griliches and M. Intriligator. (eds.), Handbook of Econometrics, Vol. 2,Amsterdam: North-Holland

McFadden, D., 2001.Economic ChoicesAmerican Economic Review, 91, 351-378.

Page 74: Introducción a los modelos de elección discreta · Introducción a los modelos de elección discreta Santiago A. Gallón Departamento de Matemáticas y Estadística Departamento

logo

Motivación Definiciones Probabilidades de elección Estimación e inferencia Modelos de múltiple respuesta Estimación en Stata y R Tópicos

GRACIAS!!!