econometria ii revisao
DESCRIPTION
Revisao de econometria IITRANSCRIPT
Inclusão de Variáveis Explicativas
� Assim:
� É a função de risco (hazard rate)� A função Φ pode, por exemplo, ser especificada
como exponencial:
),,(),( tXXt βφβλ =
como exponencial:
� Modelo de Cox: particiona a função risco, de tal forma que os parâmetros β das covariáveis podem ser estimados sem que se imponha uma restrição sobre a função de risco “básica”.
ββλ XeXt =),(
Modelo de Cox
� Tem-se:
� onde λ0 é a função de risco básica.
� Pode-se dizer que esta função corresponde ao risco para um indivíduo que apresenta as características médias dentro da amostra:
),()()( 0 βφλλ XtXt ×=
amostra:
� De qualquer modo, é necessário estimar:
� Conveniente por não gerar valores negativos que seriam incompatíveis com a noção de risco.
� Coeficientes β representam o efeito constante e proporcional a X sobre a probabilidade condicional do indivíduo apresentar a falha
ββφ XeX =),(
Coeficientes
� Então:
ββφλ=
∂∂=
∂∂
X
X
X
Xt ),(ln)(ln
� Limitação:� É necessário assumir que os riscos sejam proporcionais =
as diferenças entre os indivíduos dependem somente da relação entre os valores apresentados pelas covariáveis em cada momento do tempo e não são influenciados pela passagem do tempo (maior ou menor demora na ocorrência de falha)
STATA:
� stcox prod
� stcox prod, nohr
� stcox prod, basehc(hazard_base) basechazard(hazard_cumulat) basesurv(survival)
Modelos de Escolha Binária (Variável Dependente é Dummy):
LOGIT e PROBIT
Maria Dolores Montoya Diaz
Modelos LOGIT/PROBIT - Introdução
� Modelos de Regressão são adequados quando Y é contínua - valor de arrecadação, consumo, demanda, exportações, etc
� Porém, há situações em que se pretende modelar a decisão de pagar ou não dívidas contraídas,
a decisão de pagar ou não dívidas contraídas, comprar um objeto, votar em determinado candidato
Modelos LOGIT/PROBIT - Definição (1)
� Modelo:
Y* = a + b X + uonde
Y* = variável latente não observável
Y* = variável latente não observável
X = matriz de características dos indivíduos/empresas
Modelos LOGIT/PROBIT - Definição(2)
� Porém, observa-se na realidade:
>=
=0Y se dívidas, suas tecorretamen paga 1 *
Y
==
contrário caso 0
0Y se dívidas, suas tecorretamen paga 1iY
Modelos LOGIT/PROBIT - Definição(3)
� Então:Prob(Y=1) = Prob{ u> - (a + b X) }Prob(Y=1) = 1 - F{- (a + b X) }onde F é a função cumulativa de probabilidade
Obs: se a distribuição for simétrica como a Normal
Obs: se a distribuição for simétrica como a Normal e a Logística 1 - F( - z) = F(z)
Modelos LOGIT/PROBIT - Comparação com
MQO (1)
� Nestes casos:
� Modela-se a Probabilidade do indivíduo/empresa pagar, comprar, votar, etc. (tomar a decisão definida como 1)
bX)F(a1)i
Prob(Y +==
� Método de Mínimos Quadrados é inadequado
Modelos LOGIT/PROBIT - Comparação com
MQO (2)
� Verificar que:� Modelo Regressão
Yi = a + b Xi + ui
� Modelo com Dependente Binária:
� Modelo com Dependente Binária:
onde F é a distribuição cumulativa de probab.
bX)F(a1)i
Prob(Y +==
Modelos LOGIT/PROBIT - Interpretação dos
Resultados
� Comumente, trabalha-se com a probabilidade estimada = Prôb(Y=1)
� Efeitos marginais:
bbXafP
)(ˆ
×+=∂
� onde f é a função densidade de probabilidade
bbXafX
P )( ×+=
∂∂
Escolha Ordenada
� O modelo de escolha binária é adequado para modelar uma variável que pode assumir apenas dois valores: 0 e 1
� Porém, existem situações em que o objetivo é explicar uma variável dividida em várias categorias
� Exemplos:
� Pesquisas de opinião sobre qualidade de atendimento: � 1) Péssimo, 2) Regular, 3) Bom, 4) Excelente
� Auto-avaliação do estado da saúde� 1) Muito Bom, 2) Bom, 3) Regular, 4) Ruim, 5) Muito ruim
Escolha Ordenada
� Nestes casos, os valores associados a cada categoria (1 a 4, no primeiro exemplo ou 1 a 5 no segundo exemplo) podem ser vistos como resultantes de uma variável contínua, não observada como índice de saúde, satisfação, etc.
� O modelo de regressão não pode ser utilizado pois os
� O modelo de regressão não pode ser utilizado pois os valores da variável dependente refletem a ordenação/ranking, porém, a diferença entre a opção 1 e 2 não pode ser tratada igualmente à diferença entre 2 e 3, e assim sucessivamente
Escolha Ordenada
� A idéia será modelar Y* não-observável (a semelhança do que foi feito no caso do modelo de escolha binária)
� Ordered-probit e Ordered-logit (extensão dos modelos Probit e Logit, respectivamente)
� Y é a variável observada e Y* a variável latente
� Assim:Y* = a + b X + u
onde
Y* = variável latente não observável
X = matriz de características dos indivíduos/empresas
Variável Observada
� Porém, observa-se na realidade:
≤≤
≤≤
≤
= 32
21
1
* 2
* 1
* 0
αα
αα
α
Yse
Yse
Yse
iY
� Se, por exemplo, a variável observada puder assumir 5
valores distintos, existirão 4 pontos de corte α
>
≤≤
4
43
* 4
* 3
α
αα
Yse
Yse
i
Modelo
� Os pontos α correspondem aos limites que fazem com que os indivíduos se movam de uma categoria reportada para outra
� Assim como no caso dos modelos de escolha binária, os coeficientes dos modelos de escolha ordenada possuem
coeficientes dos modelos de escolha ordenada possuem importância limitada
� É necessário estimar os efeitos marginais� Representa o impacto de variações na variável explicativa (x)
sobre a probabilidade de escolha em cada uma das opções.
Exemplos
� Escolha da forma de aplicação dos recursos do fundo de pensão
� Autoavaliação do Estado de Saúde
Modelo de Contagem
� O modelo de contagem aplica-se a situações em que a variável explicada representa uma contagem de eventos
� Exemplos comuns na área de economia da saúde são medidas de utilização de serviços de saúde, tais como, número de visitas ao médico ou serviço de saúde realizadas em determinado período de tempo, número de realizadas em determinado período de tempo, número de internações, número de acidentes automobilísticos ou do trabalho, número de cigarros fumados, etc.
� A variável dependente é composta por números inteiros não-negativos
� A distribuição de valores é normalmente assimétrica, com grande quantidade de zeros
Modelo
� O modelo básico para dados de contagem assume que a probabilidade de ocorrência de um evento (λ) durante um determinado período de tempo é constante e proporcional à duração do tempo� λ é conhecido como a intensidade do processo
� Para construir um modelo econométrico onde a variável � Para construir um modelo econométrico onde a variável y seja dependente de um conjunto de variáveis explicativas x, usualmente assume-se que λ = exp (xβ)� A definição da intensidade do processo informa que a média de y, dado
x, é uma função exponencial de um índice linear das variáveis explicativas
� A função exponencial garante que a intensidade do processo, que pode ser interpretada como o número médio de eventos, dado x, seja sempre positiva.
Regressão de Poisson:
� Uma propriedade básica do modelo de Poisson é a, de equi-dispersion.� Isto significa que a média de y, dado x, é igual à variância de y, dado x.
� Para que a regressão de Poisson seja apropriada, esta hipótese deve estar refletida nos dados
� Na prática, entretanto, a distribuição de muitas variáveis de interesse da economia da saúde, como as medidas de utilização de serviços, economia da saúde, como as medidas de utilização de serviços, apresentam over-dispersion.
� Over-dispersion: a média da variável y é menor do que a sua variância.
� Estimador consistente de σ2 quando σ2 ≠ 1:
� Para corrigir os erros-padrao: multiplicá-los por
� Desdobramentos recentes dos modelos de contagem tratam da incorporação destas características – Negative Binomial (negbin), por ex.
∑=
−−−=n
iiyukn i
1
212 ˆ/ˆ)1(σ2σ
Interpretação dos coeficientes
� É preciso lembrar que os coeficientes relacionam-se à intensidade do processo, que é uma função não-linear dos valores de x
� Assim, os valores de β não estão mensurados na unidade de medida da variável y
Portanto, as inferências acerca dos impactos de uma � Portanto, as inferências acerca dos impactos de uma particular variável explicativa sobre y (número de visitas, internações, por exemplo) exige algumas transformações
� Efeitos Marginais
Exemplos
� Número de cigarros fumados diariamente
� Número de visitas a consultório médico