econometria clássica

60
Métodos Quantitativos II Mestrado em Economia Aplicada Faculdade de Economia e Administração Prof. Rogério Silva de Mattos ECONOMETRIA CLÁSSICA Notas de Aula

Upload: paul-anthony-newmann

Post on 10-Aug-2015

169 views

Category:

Documents


15 download

TRANSCRIPT

Page 1: Econometria Clássica

Métodos Quantitativos II Mestrado em Economia Aplicada

Faculdade de Economia e Administração

Prof. Rogério Silva de Mattos

ECONOMETRIA CLÁSSICA

Notas de Aula

Page 2: Econometria Clássica

1. INTRODUÇÃO

1.1 OBJETIVOS

Modelos econométricos

Mensuração

Verificação de teorias

Previsão

1.2 VISÕES DA ECONOMETRIA

Escola Clássica

Escola Inglesa

1.3 VISÃO ESTATÍSTICA

Modelo Populacional ↔ Modelo Gerador dos Dados (MGD)

Modelo Probabilístico ↔ Modelo Gerador dos Dados (MGD)

Page 3: Econometria Clássica

2. MODELO DE REGRESSÃO MÚLTIPLA

2.1 MODELO LINEAR GAUSSIANO (versão básica)

MGD: ikikii XbXbbY 221

Y variável dependente;

kXX ,,2 variáveis independentes ou explicativas;

j

ij

X

YEb

)( ou coeficiente de sensibilidade de Y em relação à Xj;

kikii XbXbbYE 221)( é a média de Y e representa um hiperplano

que corta o espaço euclidiano Rk;

Hipóteses Básicas

1. Y é uma função linear de kXX ,,2 ;

2. kXX ,,2 são variáveis não-estocásticas;

3. Cada jX não é uma função linear das demais sX ,

;,,1, , ksjsj ;

4. 0)( iE ;

5. 2)( iVar e ;0)( jiE ;,1, , njiji ;

6. ),0(~ 2Ni )),((~ 2

ii YENY .

Observações

Modelo linear vem da área de planejamento de experimentos, daí a

hipótese 2 que diz que cada Xj não é variável aleatória;

Hipótese 3, implica que cada jX não é combinação linear das

demais variáveis explicativas;

Hipóteses 4, 5, e 6 dizem respeito ao termo de erro aleatório i , que

apresenta as seguintes características: média nula (hip. 4);

homocedástico, pois possui variância constante (hip. 5);

não autocorrelacionado com os demais j (hip. 5);

distribuição normal (hip. 6), logo Yi também é normal com média

)( iYE e variância 2 ;

Page 4: Econometria Clássica

2.2 REPRESENTAÇÃO MATRICIAL

Assumindo n observações para Y, X2,...,Xk

MGD: XbY

onde:

n

n

Y

Y

Y 1

1

knn

k

kn

XX

XX

X

2

121

1

1

k

k

b

b

b 1

1

n

n1

1

XbYE )( .

Hipóteses Básicas Re-escritas

1. Vetor Y é função linear dos vetores colunas da matriz X;

2. X é uma matriz não-estocástica;

3. X possui posto completo igual a k;

4. 0)(E , onde 0 é um vetor n×1 de elementos nulos;

5. IEVar 2)()( , onde I é uma matriz identidade n×n;

6. ),0(~ 2IMN ),(~ 2IXbMNY ;

Observações

As hipóteses correspondem às anteriores para a versão não-

matricial;

Hipótese 3 implica que cada coluna de X não é uma combinação

linear exata das k-1 colunas restantes;

Hipóteses 4-6 dizem respeito ao vetor de erros aleatórios ;

Hipótese 6 diz que vetor segue uma distribuição normal

multivariada com vetor de médias 0 e matriz de variância-

covariância I2 ;

Hipótese 6 também diz que vetor Y segue uma distribuição

normal multivariada com vetor de médias Xb e matriz de

variância-covariância I2 ;

Page 5: Econometria Clássica

2.3 ESTIMADOR DE MÍNIMOS QUADRADOS ORDINÁRIOS

Conceitos

Modelo Amostral: ikikii XbXbbY ˆˆˆˆ221

Preditor Linear: kikii XbXbbY ˆˆˆˆ221

Resíduo: kikii

iii

XbXbbY

YY

ˆˆˆ

ˆˆ

221

Representação Matricial

Modelo Amostral: ˆbXY

Preditor Linear: bXY ˆˆ

Resíduo: bXYYY ˆˆˆ

onde:

n

n

Y

Y

Y

ˆ

ˆ

ˆ1

1

k

k

b

b

b

ˆ

ˆ

ˆ1

1

n

n

ˆ

ˆ

ˆ

1

1

Problema: A partir de n observações amostrais, achar estimadores kbb ˆ,,ˆ1

de boa qualidade para kbb ,,1 ;

Solução: Minimizar a soma dos quadrados dos resíduos n

i

i

1

ˆ para b , ou

seja, minimizar ˆˆ para b . Assim, encontra-se o estimador de mínimos

quadrados ordinários (EMQO):

YXXXb 1)(ˆ

Page 6: Econometria Clássica

Prova

Como se tem de minimizar uma função de b , usa-se as regras de

determinação de valores mínimos de funções diferenciáveis de várias

variáveis. Ou seja, acha-se as derivadas parciais da função, iguala-se estas

a zero e resolve-se o sistema resultante. Os passos são os seguintes:

1. XbXbYXbYY

XbXbYXbYXbYYbXYXbYbXYbXY

2

ˆ)ˆ)(ˆ()ˆ()ˆ(ˆˆ

2. Condição de 1ª. Ordem: 0ˆ22ˆ

ˆˆbXXYX

b

3. YXXXb 1)(ˆ EMQO para b.

4. Condição de 2ª. Ordem: )(2)ˆ(

ˆˆ2

2

kkXX

b definida positiva*

* Como X tem posto k, segue que a matriz quadrada X’X de ordem k×k também

apresenta posto k e, logo, é não singular. Sendo não singular, possui inversa. Além

disso, X’X é definida positiva ( 0 ,0 zXzXz ; veja-se, por exemplo, JD, 1988:

p. 484). Logo, b é ponto de mínimo absoluto para ˆˆ .

Nota: Derivação Vetorial

Seja a um vetor k 1 de constantes, A uma matriz k k de constantes e

b um vetor k 1 de variáveis. Então:

ab

ab

b

ba )()(

Abb

Abb2

)(

Exemplo: Vendas trimestrais de automóveis nos EUA (1959.I-1988.I).

MGD: ttttt CPIbRbYPbbS 4321

onde:

S = consumo pessoal de automóveis novos em US$ bilhões;

YP = renda pessoal em US$ bilhões;

R = taxa de juros trimestral (de título do Tesouro Americano);

CPI = índice de preços ao consumidor para novos carros (1983=100)

Modelo Empírico: tttt CPIRYPS 654,0586,10391,07,35ˆ

Page 7: Econometria Clássica

2.4 MÉDIA E VARIÂNCIA DOS EMQO

Resultado (R1): XXXbb 1)(ˆ

Prova:

XXXbXbXXXYXXXb 111 )()()()(ˆ .

Do que segue que XXXbb 1)(ˆ .

Média

0)()()()ˆ()ˆ( 11 EXXXXXXEbbEbViés ;

bbE )ˆ( .

Variância

R2: 12 )()ˆ( XXbVar

Prova

12

121

11

11

)(

)()()(

)()()(

])()[()ˆ(

XX

XXXIXXX

XXXEXXX

XXXXXXEbVar

Page 8: Econometria Clássica

2.5 PROPRIEDADES DOS EMQO

Eficiência

Eficiência Restrita: dadas as hipóteses 1-5, o EMQO é o mais

eficiente (não enviesado e com variância mínima) dentro da

classe dos estimadores lineares de b; ou seja, o EMQO é o

Melhor Estimador Linear Não Enviesado (MELNE) de b.

Nota: Um estimador linear é aquele que pode ser escrito como MYb~

, onde M é

uma matriz k n.

Prova (Teorema de Gauss Markov):

A prova só usa hipóteses 1-5. Sejam XXXA 1)( e C matrizes,

ambas de ordem k n. Por R1, Abb , e por R2, AAbVar 2)ˆ( .

Seja também YCAb )(~

um estimador linear alternativo de b.

Então, pode-se escrever )()())((~

CAXbCAXbCAb . Para

b~

ser não enviesado, ele tem de satisfazer:

bbCXICXbbCXbAXbbE )()~

( .

Logo, é preciso que 0CX . Supondo 0CX , então )()~

( CAbb

de modo que ])~

)(~

[()~

( bbbbEbVar pode ser desenvolvida como:

))((

))(()(])'()[()~

(

2 CACA

CAECACACAEbVar

Mas,

CCXX

CCCXXXXXCXXX

CCCAACAACACA

1

111

)(

)()()(

))((

Pois 0''CXCX . Então:

CCbVarCCXXbVar 212 )ˆ(])[()~

(

Nota: Resultados de álgebra matricial garantem que CC é semidefinida positiva. Será

0CC somente quando C = 0. Mas, neste caso bb ˆ~; logo, não pode haver outro

estimador linear, diferente do EMQO, que seja mais eficiente (não-enviesado e com

variância mínima).

Page 9: Econometria Clássica

Eficiência Irrestrita: Quando vale também a hipótese 6 (erros

normalmente distribuídos), o EMQO é o mais eficiente dentre todos

os estimadores (lineares e não-lineares). A prova envolve mostrar

que no caso de normalidade dos erros o EMQO é equivalente ao

Estimador de Máxima Verossimilhança (EMV).

Consistência

EMQO é consistente para b, ou seja, bbp )ˆlim( ;

Prova: Dadas as hipóteses 1-5 e R1, segue que:

n

Xp

n

XXb

n

X

n

XXpb

XXXpb

XXXbpbp

lim'

lim

])lim[(

))(lim()ˆlim(

1

1

1

1

Dado que X é não estocástica (hip. 2), segue que:

1)()(lim

kEXXE

n

Xp 0

Logo:

bbp )ˆlim(

Normalidade Assintótica (Propriedade MUITO IMPORTANTE!)

Quando n , )1,0(/)ˆ( ˆ Nbbjbjj ;

Ou seja, em amostras grandes, podemos aproximar a distribuição

de jb como uma normal, isto é: para n grande, ),(~ˆ 2ˆjbjj bNb ;

Logo, se a amostra é grande, não precisamos da hipótese 6.

Qualquer que seja a distribuição de i , podemos aplicar a teoria da

normal para o EMQO e os procedimentos de testes de hipótese;

Page 10: Econometria Clássica

2.6 QUALIDADE DO AJUSTAMENTO

Como avaliar se o modelo está aderindo bem aos dados ou não?

Estatísticas descritivas: 2R , 2R , Critério de Informação de Akaike (AIC)

e Critério de Schwarz (SC)

2

R

Mede o grau de ajustamento do modelo aos dados;

YYi = ii YY ˆ + YYi

ˆ

Desvio

Total

Desvio Não-

explicado

Desvio

Explicado

Elevando ao quadrado e agregando para todas as observações:

n

i

i YY1

2)(

= n

i

ii YY1

2)ˆ(

+ n

i

i YY1

2)ˆ(

Variação

Total

Variação

Não-

explicada

Variação

Explicada

Matricialmente: yyyy ˆˆˆˆ

onde: YYyn 1

YYyn

ˆˆ1

YYn

ˆˆ1

Grau de ajustamento

yy

yyR

ˆˆ2 ou yy

Rˆˆ

12

Propriedades

]1,0[2R ;

Bom ajustamento 12R ; Fraco ajustamento 02R ;

2R tende a aumentar sempre com novas variáveis explicativas;

2R nunca diminui com novas variáveis explicativas

Page 11: Econometria Clássica

2

R ou 2

R - ajustado

Corrige limitação do grau de ajustamento 2R

)(

)1(ˆˆ12

kn

n

yyR

Propriedades

22 RR se k = 1;

22 RR se k > 1;

2R pode diminuir se incluo variáveis pouco explicativas;

2R pode ser negativo;

Critério de Informação de Akaike – AIC

n

k

nAIC

2ˆˆlog

Propriedades

AIC ;

Quanto menor AIC, melhor o ajustamento;

AIC penaliza bem mais que o 2R a presença de variáveis

irrelevantes;

AIC valoriza mais a parcimônia.

Critério de Schwarz – SC

n

nk

nSC

logˆˆlog

Propriedades

SC ;

Quanto menor SC, melhor o ajustamento;

SC penaliza bem mais que o 2R a presença de variáveis irrelevantes;

SC também valoriza mais a parcimônia do que o AIC, penalizando

mais ainda o número de parâmetros/variáveis no modelo.

Page 12: Econometria Clássica

2.7 VARIÂNCIA RESIDUAL DA REGRESSÃO

)(2

iVar também é um parâmetro desconhecido do MGD;

Caminho natural de estimá-lo seria:

nn

n

i

i ˆˆˆ

ˆ 1

2

2

Problema: 2ˆ é um estimador enviesado de 2 ;

Solução: usa-se um corretor de viés que redunda em:

knknS

n

i

i ˆˆˆ

1

2

2

S 2

é a chamada variância residual e será usada em vários contextos,

por exemplo, o R 2 - ajustado pode ser escrito como:

2

22 1

YS

SR , onde:

1

)(1

2

2

n

YY

S

n

i

i

Y

S 2

também é usada para se estimar a matriz de variância-covariância

dos EMQO:

122

ˆ )( XXSSb

Page 13: Econometria Clássica

Exemplo: Consumo Anual Brasil 1960-2004

MGD: ttttt NEbIbGRbYbbCO 54321

Saída (Compactada) do Eviews Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45

Variable Coefficient Std. Error

Constante 23372214 9915664. Y 0.836903 0.031319

GR -0.789323 0.067470 I -0.737619 0.119547

NE -0.764959 0.105569

R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252

Nota: Dados anuais referentes ao Brasil; CO = consumo das famílias; Y = renda disponível das famílias; GR = gastos do governo; I = investimento direto; NE = Exportações líquidas

Observações

A coluna correspondente a “Std. Error” refere-se a:

1

ˆ bk

bSdiags

O modelo empírico é dado por:

tttt NEIGRYCO 765,0738,0789,0837,0214.372.23

Page 14: Econometria Clássica

2.8 RESULTADOS IMPORTANTES

Supondo que valem todas as hipóteses, inclusive a 6, de normalidade

dos erros :

R3. 22 ~/ˆˆkn ;

R4. 222 ~/)( knSkn ;

R5. ),0(~)ˆ( 2

jjj VNbb , onde jV é o j-ésimo elemento da diagonal

principal de 1)( XX ;

R6. 22 /)( Skn e )ˆ( jj bb são independentes;

R7. De R4-R6, segue que: kn

j

jjt

VS

bb~

)ˆ(

Prova: De R5, segue que )1,0(~/)ˆ( NVbb jjj . Agora

computando:

2

2

)(

)()ˆ(

kn

Skn

V

bb

j

jj ,

temos uma VA N(0,1) dividida pela raíz quadrada de uma VA 2

kn (dividida, por sua vez, por n k), ambas independentes, o que

resulta numa VA tn-k. Fazendo as simplificações necessárias,

obtém-se o resultado R7.

Page 15: Econometria Clássica

2.9 ESTIMAÇÃO INTERVALAR

Objetivo: achar intervalos de confiança para bj;

Em geral, usa-se intervalos bilaterais;

Critério: 1)ˆˆ( jHjjL bbbP ;

Ljb ,ˆ = limite inferior

Hjb ,ˆ = limite superior

1 = nível de confiança

Solução:

jbknjLj stbb ˆ,2/1,ˆˆ

jbknjHj stbb ˆ,2/1,ˆˆ

Prova: Defina jbVSs

jˆ . Então, usando R7, podemos escrever:

,2/1

ˆ

,2/1 kn

b

jj

kn ts

bbtP

j

1ˆˆ,2/1ˆ,2/1

jj bknjjbkn stbbstP

Multiplicando todos os componentes da tripla desigualdade por -1:

1ˆˆ,2/1ˆ,2/1

jj bknjjbkn stbbstP

e somando jb aos três componentes:

1ˆˆˆ,2/1ˆ,2/1

jj bknjjbknj stbbstbP

Page 16: Econometria Clássica

2.10 TESTES DE SIGNIFICÂNCIA DE PARÂMETROS E VARIÁVEIS

MGD: ikikii XbXbbY 221

Exemplos de hipóteses de interesse:

H0: b1 = 0 (E(Y) atravessa a origem do espaço Rk);

H1: b1 0 (E(Y) não atravessa a origem do espaço Rk);

H0: b2 = 0 (variações em X2 não explicam variações em Y);

H1: b2 0 (variações em X2 explicam variações em Y);

H0: b3 = 1 (variações em X3 produzem variações idênticas em Y);

H1: b3 1 (variações em X3 não produzem vars. idênticas em Y);

Conceitos e definições

= nível de significância = P(Erro Tipo I) = P(Rejeitar H0|H0 é V);

= P(Erro Tipo II) = P(Não Rejeitar H0|H0 é F);

Poder do teste = 1 - ;

Representação Geral H0: bj = b0j ; H1: bj b0j

Caso típico em econometria: b0j = 0;

Por R7, segue que knbjj tSbbj

~)ˆ( ˆ,0 ou knbtSb

j

~ˆˆ (caso b0j= 0);

Procedimentos do teste t (típico)

1. Enunciado das hipóteses: H0: bj = 0 ; H1: bj 0

2. Escolha de = nível de significância;

3. Cálculo de j

j

b

j

b S

bt

ˆ

ˆ

ˆ

4. Aplicação da regra de decisão pelo valor de prova (p-value):

Se ) || ( ˆjbkn tTP Não rejeito H0;

Se ) || ( ˆjbkn tTP Rejeito H0;

Page 17: Econometria Clássica

Exemplo: Consumo Anual Brasil 1960-2004

MGD: ttttt NEbIbGRbYbbCO 54321

Saída (Compactada) do EViews

Dependent Variable: CO

Method: Least Squares

Date: 06/24/05 Time: 11:01

Sample: 1960 2004

Included observations: 45

Variable Coefficient Std. Error t-Statistic Prob.

C 23372214 9915664. 2.357100 0.0234

Y 0.836903 0.031319 26.72190 0.0000

GR -0.789323 0.067470 -11.69886 0.0000

I -0.737619 0.119547 -6.170097 0.0000

NE -0.764959 0.105569 -7.246070 0.0000

R-squared 0.994985 Mean dependent var 8.19E+08

Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08

S.E. of regression 24391210 Akaike info criterion 36.96178

Sum squared resid 2.38E+16 Schwarz criterion 37.16252

Page 18: Econometria Clássica

2.12 TESTE F (SIGNIFICÂNCIA GERAL DA REGRESSÃO)

H0: 032 kbbb (nenhuma Xj explica variações em Y);

H1: pelo menos um 0jb (pelo menos uma Xj explica variações em

Y);

j = 2...,k-1;

Suponha válidas as hipóteses 1 a 6 e considere H0 verdadeira:

R8. 2

1

2

****

22

1

2 ~ˆˆˆˆ)ˆ( k

n

i i bxxbyyYY , onde **)1(

* XXxkn

é a matriz X em forma de desvios em relação à média com a primeira

coluna (referente à constante) excluída.

Prova: Ver [VA: pp. 59-60];

R9. knkF

kn

kyy,1~

)/(ˆˆ

)1/(ˆˆ

Prova Combinando R3 com R8:

knkFS

kyy

kn

Skn

k

yy,122

2

2~

)1/(ˆˆ

)(

)(

)1(

ˆˆ

Estatística de Teste:

)/(

)1/(

)/(ˆˆ

)1/(ˆˆ

knExplicadaNãoVariação

kExplicadaVariação

kn

kyyF

Regra de decisão pelo valor de prova:

o Dado uma escolha de :

Se )( ,1 FFP knk Não rejeito H0;

Se )( ,1 FFP knk Rejeito H0;

Page 19: Econometria Clássica

2.13 MULTICOLINEARIDADE

Caso 1: Modelo com 1 var. dependente e 2 vars. independentes:

iiii XbXbbY 33221

É fácil verificar que o EMQO neste caso seria:

2

32

2

3

2

2

323

2

32

2)())((

))(()(ˆ

iiii

iiiiiii

xxxx

xxyxxyxb

2

32

2

3

2

2

322

2

23

3)())((

))(()(ˆ

iiii

iiiiiii

xxxx

xxyxxyxb

33221ˆˆˆ XbXbYb

Colinearidade Perfeita

Coeficiente de correlação linear entre X2 e X3:

112

3

2

2

32

23

ii

ii

xx

xxr

Se 32 XX , com 0 (violação da hipótese 2):

o Os numeradores de 2b e 3b são iguais a 0;

o 12

23r 0)())(( 2

32

2

3

2

2 iiii xxxx

Logo, com 00ˆˆ32 bb , é impossível computar os EMQO 321

ˆ,ˆ,ˆ bbb .

Page 20: Econometria Clássica

Alta mas não perfeita colinearidade

É possível computar EMQO, pois hip. 2 não é violada;

Sejam as variâncias estimadas dos EMQO, (obtidas como os 2

últimos elementos da diagonal principal de 122

ˆ )( XXSSb

):

)1( 2

232

22ˆ2 rx

SS

ib

)1( 2

233

22ˆ3 rx

SS

ib

Seja 12

23r , mas considere que:

12

23r 2b

S e 3b

S

Logo:

12

23r 02b

t e 03b

t

Conseqüências da Multicolinearidade

Estatísticas t podem ficar artificialmente muito baixas;

Inclusive, é possível acontecer 12R com 02b

t e 03b

t , o que é

contraditório;

Soluções Alternativas

Retira-se uma das variáveis do modelo;

Trabalha-se com variáveis em diferenças:

o Exemplo:

Modelo de interesse: tttt WbYbbC 321

Se Yt e Wt muito correlacionadas, usa-se:

)()()( 113121 tttttttt WWbYYbCC

Page 21: Econometria Clássica

Caso 2: Modelo com 1 var. dependente e k-1 vars. independentes:

Multicolinearidade Perfeita

ikikii XbXbbY 221

Neste caso, não pode acontecer por exemplo:

kikii XXX 332

Ou seja, uma variável explicativa não pode ser linearmente

dependente das demais.

Alta mas não perfeita Multicolinearidade

Por exemplo, pode acontecer:

kikii XXX 332

Uma variável explicativa é “quase” linearmente dependente das

demais.

Page 22: Econometria Clássica

2.14 ESTIMAÇÃO POR MÁXIMA VEROSSIMILHANÇA (EMV)

Pela hipótese 6: )),((~ 2

ii YENY ;

Função densidade:

2

2

221

2 2

)(exp

2

1)( kikii

i

XbXbbYYf

Função de verossimilhança:

2

1

2

2212

2

1

2

1

2

)(exp

2

1

)(),,,(

n

i kikii

n

n

i

ik

XbXbbY

YfbbL

Em forma matricial:

2

2

2

2

2

)()(exp

2

1),(

XbYXbYbL

n

Log-verosssimilhança:

2

22

2

)(ln

22ln

2),(

XbXbYXbYXbYYnnb

Page 23: Econometria Clássica

Maximizando a log-verossimilhança

Condição de 1ª. Ordem:

0)~

22(2

12

bXXYXb

YXXXb 1)(

~

0~2

~~

~2 422

n

n

~~~ 2

onde: bXY~~

Condição de 2ª. Ordem: garante que o EVM de b e 2 é máximo

global (ver JD: p. 146).

Logo, o EMV de b (b~

) é o mesmo que o EMQO ( b ); e o EMV de 2 ( 2~ ) difere do usado antes para 2 ( 2S ) apenas no denominador;

Propriedades do EMV para pequenas amostras

b~

é não enviesado para b;

2~ é enviesado para 2 ;

A variância de b~

atinge o limite mínimo de Cramer-Rao, logo b~

é

também eficiente;

Propriedades do EMV para grandes amostras

b~

e 2~ são consistentes;

b~

apresenta normalidade assintótica;

Conclusão

Sob hipótese 6 de normalidade dos erros, EMQO e EMV são

equivalentes e portanto constituem o melhor estimador de b dentre os

estimadores lineares e os não-lineares.

Page 24: Econometria Clássica

2.15 PREVISÃO

Objetivo: acertar um valor de Y condicional a valores particulares de

kXX ,,2 ;

Previsão Pontual

Seja ]1[ 2 kfff XXx , então:

bxXbXbbY fkfkffˆˆˆˆˆ

221

o Previsão dentro da amostra:

nibxYY

XXxx

iif

kiiif

,,1 ˆˆˆ

]1[ 2

o Previsão fora da amostra:

iobxYY

XXxx

f

kf

ˆˆˆ

]1[

00

0200

Pelo T. Gauss-Markov:

o b é o melhor estimador linear de b;

o Logo, fY é um preditor ótimo de Yf;

Erro de previsão: fff YYe ˆ ;

o Note que: )()ˆ()ˆ( ffff YEbxbExYE ;

o Logo: ;0)ˆ()()ˆ()( fffff YEYEYYEeE

o Ou seja fY é um previsor não enviesado de fY .

Page 25: Econometria Clássica

Variância do erro de previsão: 2)( ffeVar

])(1[

)()ˆ(

])ˆ)(ˆ([))ˆ(()(

))ˆ(()ˆ(

12

1222

2

2

ff

ffff

ffff

fffff

xXXx

xXXxxbVarx

xbbbbxEbbxVarVar

bbxVarYYVar

Estimação da Variância do erro de previsão:

))(1( 122

fff xXXxSS

Resultados de interesse

Sejam válidas hips. 1-6. Considere os seguintes resultados:

R10. );1,0(~)ˆ( NeYY fffff

R11. 222 ~)( knffSkn ;

R12. fff YY )ˆ( e 22)( ffSkn são independentes;

R13. kn

f

fft

S

YY~

ˆ

Prova

Por R10, R11 e R12, segue que a razão:

kn

f

f

f

f

f

fft

S

YY

kn

SknYY~

ˆ

)(

)(ˆ

2

2

,

Fazendo-se as simplificações necessárias, temos o resultado R13.

Page 26: Econometria Clássica

Previsão Intervalar

Objetivo: Achar intervalo de confiança para fY de acordo com o

critério 1)ˆˆ( fHffL YYYP ;

Solução:

fknffH

fknffL

StYY

StYY

,2/1

,2/1

ˆˆ

ˆˆ

Prova

Usando R13, verificamos que:

1)ˆ

( ,2/1,2/1 kn

f

ff

kn tS

YYtP

De onde é imediato que, após manipulações algébricas simples:

1)ˆˆ( ,2/1,2/1 fknfffknf StYYStYP

Isto é:

1)ˆˆ( fHffL YYYP

Exemplo: Previsão do Consumo Anual Brasil 2005-2010

Modelo Econométrico:

tttt NEIGRYCO 781,0606,0686,0789,0820.589.29

ANO CÔL CÔ CÔH Y G I NE

2005 1046 1087 1128 1848 157 364 94

2006 1073 1114 1155 1907 165 382 97

2007 1095 1136 1177 1958 173 401 99

2008 1114 1156 1197 2008 182 421 101

2009 1132 1174 1215 2055 191 442 102

2010 1148 1190 1233 2102 201 464 102

Nota: Valores em R$ bilhões

Page 27: Econometria Clássica

3. USOS E EXTENSÕES DO MODELO DE REGRESSÃO MÚLTIPLA

3.1 COEFICIENTES PADRONIZADOS

Os coeficientes do MGD linear não podem ser comparados entre si;

Suas magnitudes dependem da escala de medida das variáveis

explicativas;

Solução: modelo com as variáveis padronizadas, isto é:

i

X

kkik

X

i

Y

i eS

XXb

S

XXb

S

YY

k

*22*

2

2

Relação entre coeficientes originais e padronizados:

Y

X

jjS

Sbb

j* j = 2,...,k.

Coeficientes padronizados são a-dimensionais, isto é, não possuem

uma unidade particular de medida;

A comparação entre coeficientes padronizados é possível porque

agora todas as variáveis apresentam a mesma média e variância;

3.2 ELASTICIDADES

Muito usada em microeconomia, a elasticidade mede a variação

relativa na variável dependente dada uma variação relativa numa

variável independente (com as demais constantes);

)()(

)(

i

ji

j

i

ji

ji

ij

YE

Xb

YE

X

X

YEE

No modelo linear, a elasticidade estimada é obtida como:

i

ji

jjiY

XbE

ˆˆˆ

Elasticidades no ponto médio:

Y

XbE

j

jjˆˆ

No caso do modelo log-log (todas as variáveis são medidas em

logaritmos), a elasticidade é constante para todo i = 1,...,n.

Page 28: Econometria Clássica

3.3 MODELOS NÃO-LINEARES

Modelo Linear: ikikii XbXbbY 221

Modelo Não-Linear: qualquer modelo que não é linear.

),,,( 2 ikiii XXFY

Modelos não-lineares intrinsecamente lineares (MNLIL):

o São lineares nos parâmetros ou ;

o Podem ser transformados em lineares nos parâmetros;

Modelos não-lineares intrinsecamente não-lineares (MNLINL):

o não podem ser transformados em lineares nos parâmetros.

Modelos intrinsecamente lineares

Modelo polinomial: i

k

ikiii XbXbXbbY 12

321

Modelo multiplicativo: *

212

i

b

ki

b

ikXXbY

Modelo log-log: ikikii XbXbbY lnlnln 221

o Note-se que o modelo log-log deriva do modelo

multiplicativo, porque:

11 lnbb 22 bb kk bb *ln ii

Modelo exponencial: )exp( 221 kikii XbXbbY

Modelo log-lin: lnln 221 kikii XbXbbY

Modelo recíproco: ikiki

iXbXbb

Y221

1

o Que pode ser transformado em:

kiki

i

XbXbbY

221

1

Modelo lin-log: ikikii XbXbbY lnln 221

Modelo interativo: iiiiii XXbXbXbbY )( 32433221

Page 29: Econometria Clássica

3.4 TESTE F PARA SIGNIFICÂNCIA DE BLOCOS DE VARIÁVEIS

Considere o MGD: iiiiii XbXbXbXbbY 554433221 ;

Teste de Hipótese:

o H0: 054 bb (X4 e X5 não são significativas);

o H1: 04b e/ou 05b (X4 e/ou X5 é/são significativa(s));

Definições:

o Modelo irrestrito (IR): iiiiii XbXbXbXbbY 554433221

o Modelo restrito(R): iiii XbXbbY 33221

o SQT = Soma dos Quadrados Totais = yyYYi

2)( ;

o SQE = Soma dos Quadrados Explicados: yyYYiˆˆ)ˆ( 2 ;

o SQR = Soma dos Quadrados dos Resíduos: ˆˆˆ 2

i ;

Estatística de Teste:

IRRIR knkk

IRIR

RIRRIR FknSQR

kkSQESQEF ,~

)(

)/()(

Regra de decisão pelo valor de prova:

o Dado uma escolha de :

Se )( , FFPIRRIR knkk Não rejeito H0;

Se )( , FFPIRRIR knkk Rejeito H0;

Page 30: Econometria Clássica

Exemplo: Modelo consumo vs renda e tendência quadrática

MGD: 2

4321 tbtbYbbC tt

H0: ;043 bb (termo de tendência não é significativo)

H1: 03b e/ou 04b (termo de tendência é significativo)

Implementação do teste com = 5%;

Usando-se n = 15 observações anuais, estimou-se:

Modelo irrestrito: 2

)43,1()59,1()35,6()56,16(

32,01,177,01,2ˆ ttYC tt

o 10,965.65IRSQE ;

o 17,77IRSQR ;

o 4IRk ;

Modelo restrito: tt YC)49,7()31,17(

77,03,2ˆ

o 24,898.65RSQE ;

o 2Rk

765,4)415(17,77

)24/()24,6589810,65965(F

0323,0)765,4( 11,2FP Rejeitamos H0 a 5% de significância

Page 31: Econometria Clássica

Caso Geral do Teste F para bloco de variáveis

MGD: ikikii XbXbbY 221

Divida o conjunto {X2,...,Xk} em 2 grupos, sendo um deles formado

por q < k 1 variáveis a serem testadas;

Agrupe as variáveis a serem testadas no final do MGD, re-

escrevendo-o como segue:

ikikiqkqkiqkqkii XbXbXbXbbY ,11,221

H0: 01 kqk bb ( kqk XX ,,1 são não-significativas);

H1: pelo menos um 0sb (pelo menos uma Xs, s = k q + 1,...,k, é

significativa);

Escolha um valor para ;

Estime os modelos irrestrito e restrito;

Compute:

)(

)/()(

IRIR

RIRRIR

knSQR

kkSQESQEF ;

Aplique a regra de decisão:

o Se )( , FFPIRRIR knkk Não rejeito H0;

o Se )( , FFPIRRIR knkk Rejeito H0;

Nota: modernos softwares econométricos, como o Eviews, implementam automaticamente

esse procedimento, sendo necessário informar apenas o grupo de q variáveis a serem

testadas em bloco;

Page 32: Econometria Clássica

3.5 VARIÁVEIS DUMMY

Variáveis qualitativas: que refletem estado, situação, classe, etc., ou

seja, eventos qualitativos que não podem ser medidos

numericamente;

Variável dummy: variável binária (assume valor 0 ou 1) usada para

representar, num modelo quantitativo/matemático como o MGD, as

influências de eventos qualitativos;

Variáveis dummy podem ser usadas no papel de dependente ou

independente num modelo econométrico. Veremos por ora só o

caso de variáveis dummy independentes;

Regressão com uma variável dummy

MGD: iii DbbY 21

Yi é uma variável quantitativa;

Di é uma variável dummy (qualitativa) que assume só valores 0 ou 1;

Exemplo: Estudo americano em escola secundária

n = 20 professores pesquisados;

Yi = renda do i ésimo professor;

Di = sexo do i ésimo professor (1 homem; 0 mulher);

Interpretação do MGD:

1)0|( bDYE ii é o salário médio/esperado de uma professora;

21)1|( bbDYE ii é o salário médio/esperado de um professor;

Modelo empírico: ii DY)7,2()15.3(

5,12,21ˆ

2,21ˆ)0(|ˆ1bDY ii ;

7,225,12,21ˆˆ)1(|ˆ21 bbDY ii ;

Hipótese de interesse: H0: 02b (não há discriminação sexual);

Page 33: Econometria Clássica

Regressão com duas variáveis dummy

MGD: iRiSii DbDbbY 321

Exemplo: Estudo americano em escola secundária (continuação)

n = 20 professores pesquisados;

Yi = renda do i ésimo professor;

DSi = sexo do i ésimo professor (1 homem; 0 mulher);

DRi = raça do i ésimo professor (1 branco(a) ; 0 negro(a));

Sexo\Raça Branco (B) Negro (N)

Homem (H) DS = DR = 1 DS=1, DR = 0

Mulher(M) DS = 0, DR = 1 DS = DR =0

Interpretação do MGD:

o 1)0|( bDDYE RiSii : sal. médio/esperado da M.N.;

o 21)0,1|( bbDDYE RiSii : sal. médio/esperado do H.N.;

o 31)1,0|( bbDDYE RiSii : sal. médio/esperado de uma M.B.;

o 321)1|( bbbDDYE RiSii : sal. médio/esperado do H.B.;

Modelo empírico: RiSii DDY)01,1()14,3()74,3(

74,003,12,19ˆ

o 2,19)0(|ˆRiSii DDY ;

o 23,2003,12,19)0,1(|ˆRiSii DDY ;

o 94,1974,02,19)1,0(|ˆRiSii DDY ;

o 97,2074,003,12,19)1(|ˆRiSii DDY ;

Nota: a rigor, não se somaria o coeficiente estimado 74,0ˆ3b porque ele se não

mostrou diferente de zero a 5% de significância. Apenas para fins ilustrativos é que

o incluímos;

Hipóteses de interesse:

o H0: 02b (não há discriminação sexual);

o H0: 03b (não há discriminação racial);

o H0: 032 bb (não há discriminação de qualquer tipo);

Page 34: Econometria Clássica

Regressão com 1 variável dummy e 1 variável quantitativa

MGD: iiii XbDbbY 321

Exemplo: Estudo americano em escola secundária (continuação)

n = 20 professores pesquisados;

Yi = renda do i ésimo professor;

Di = sexo do i ésimo professor (1 homem; 0 mulher);

Xi = número de anos de serviço do i-ésimo professor.

Interpretação do MGD:

o iiii XbbXDYE 31),0|( : salário médio/esperado da

professora como função do número de anos de serviço.;

o iiii XbbbXDYE 321 )(),1|( : salário médio/esperado do

professor como função do número de anos de serviço;

Modelo empírico: iii XDY)15,3()77,2()19,3(

53,012,15,19ˆ

o iiii XXDY 53,05,19),0(|ˆ ;

o iiii XXDY 53,067,20),1(|ˆ ;

Hipótese de interesse:

o H0: 02b (não há diferença, entre homens e mulheres, na

relação entre salário recebido e anos de serviço );

Page 35: Econometria Clássica

Variáveis dummy sazonais

MGD1: ttssttt DbDbDbaY ,112211

1,...,1 outro

0

1sj

jtD jt

s = comprimento do período sazonal:

s = 2 (semestral) s = 6 (bimestral)

s = 3 (quadrimestral) s = 12 (mensal)

s = 4 (trimestral)

bj = fator sazonal do j ésimo mês, bimestre, etc. (j = 1,...,s 1);

usa se só s-1 dummies p/evitar colinearidade perfeita c/a constante;

Normalização dos fatores sazonais

MGD2: 0

1

2211

s

j j

tststtt

b

DbDbDbaY

Verifica se que este modelo pode ser re escrito como:

MGD2: ttssttt DbDbDbaY *

,11

*

12

*

11

o Onde: 1,...,1

outro

0

1

1* sjst

jt

D jt

Exemplo: Sazonalidade trimestral (s=4); MGD: XbY , ]1[ DX n .

MGD1: tj jtjt DbaY3

1 MGD2: tj jtjt DbaY

3

1

*

0 0 0

1 0 0

0 1 0

0 0 1

0 0 0

1 0 0

0 1 0

0 0 1

321

D

DDD

111

100

010

001

111

100

010

001

*

3

*

2

*

1

D

DDD

Page 36: Econometria Clássica

4. VIOLAÇÃO DE HIPÓTESES BÁSICAS

4.1 AUTOCORRELAÇÃO SERIAL DOS ERROS

Violação da hipótese 5 ( 0),(),(),( jijiji CovCorE , i j);

Caso Geral

MGD: 0),(

221

ji

ikikii

uuCor

uXbXbbY para algum j i

Caso de Séries de Tempo

MGD: 0),(),(

221

jttjtt

tktktt

uuEuuCor

uXbXbbY j = 1, 2, ...

0),( jtt uuCor é chamada autocorrelação serial de j-ésima ordem;

Autocorrelação Serial de 1ª. Ordem (ACS1)

MGD: 0),( 1

221

tt

tktktt

uuCor

uXbXbbY

Razões para haver ACS1

o Inércia típica das variáveis econômicas;

o Variáves explicativas excluídas do MGD considerado:

MGD: tttt XbXbbY 33221

MGD considerado: ttt uXbbY 221

o Forma funcional incorreta:

MGD: tttt XbXbbY 2

321

MGD considerado: ttt uXbbY 21

o Defasagens excluídas:

MGD: ttttt YbXbXbbY 141,23221

MGD considerado: ttt uXbbY 221

Page 37: Econometria Clássica

Conseqüências da ACS1:

Propriedades do EMQO:

o b continua não enviesado para b;

o b (EMQO) não é mais o MELNE para b, logo é ineficiente;

Variância residual enviesada:

o )(ˆ 22 knuS t em geral subestima 2 ;

o Elementos de )(b

Sdiag ficam, em geral, subestimados;

o 2R e 2R ficam, em geral, superestimados;

o Estatísticas jj bjb

Sbt ˆˆˆ (j = 1,...,k) ficam, em geral,

superestimadas;

o Estatística F fica superestimada;

o Critérios de informação AIC e SC ficam em geral

subestimados;

Matriz de var-covar dos parâmetros:

o Com ACS1: ),,()()ˆ( ,1

12 tt xxCXXbVar ;

o ),( 1tt uuCor ;

o Computadores tipicamente reportam resultados calculados

com base na ausência de ACS1, isto é: 122

ˆ )( XXSSb

;

Verificando a presença/ausência de ACS1

Graficamente:

Termo de Erro com ACS1 Termo de erro Sem ACS1

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

0 0

Page 38: Econometria Clássica

Teste de Durbin-Watson

o Assuma que:

o MGD: 2

1

1

221

)(,0)(;0)( tttt

ttt

tktktt

VarECor

uu

uXbXbbY

o Onde ttt uu 1 é chamado processo AR(1) e

),( 1tt uuCor ;

o H0: 0 ; H1: 0 ;

o Estatística DW: )ˆ1(2

ˆ

)ˆˆ(

1

2

2

2

1

nn

t

t

n

t

tt

u

uu

DW

o Onde 2

112ˆˆˆˆ

t

n

ttt

n

t uuu ;

o Note-se que:

1ˆ 0DW

1ˆ0 20 DW

0ˆ 2DW

0ˆ1 42 DW

1ˆ 4DW

o Regra de decisão

Se Decidir

LdDW0 Rejeitar H0 (há ACS1 +)

UL dDWd Não decidir

UU dDWd 4 Não Rejeitar H0

LU dDWd 44 Não decidir

44 DWdL Rejeitar H0 (há ACS1 )

o Onde [dL,dU] = f (n,k’, );

Page 39: Econometria Clássica

Exemplo: Consumo Anual Brasil 1960 2004 Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45

Variable Coefficient Std. Error t-Statistic Prob.

C 23372214 9915664. 2.357100 0.0234 Y 0.836903 0.031319 26.72190 0.0000

GR -0.789323 0.067470 -11.69886 0.0000 I -0.737619 0.119547 -6.170097 0.0000

NE -0.764959 0.105569 -7.246070 0.0000

R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252 Log likelihood -826.6401 F-statistic 1983.966 Durbin-Watson stat 0.395263 Prob(F-statistic) 0.000000

o Considerando n = 45, k’ = 4 e = 0,05, dL=1,34 dU=1,72

Teste de Ljung Box (também para ACS de ordens maiores)

o H0: 021 m ; H1: pelo menos um 0j (j=1,...,m)

o Estatística de Ljung Box:

2

1

2

)2( m

am

j

j

LBjn

nnQ

Exemplo: Consumo Anual Brasil 1960 2004

Date: 06/06/06 Time: 10:58 Sample: 1970 2004 Included observations: 35

Autocorrelation Partial Correlation J AC

( j)

PAC Q-Stat (LB)

Prob

. |****** . |****** 1 0.725 0.725 20.017 0.000 . |**** . | . 2 0.525 -0.002 30.812 0.000 . |*** . *| . 3 0.345 -0.072 35.634 0.000 . |**. . | . 4 0.209 -0.034 37.451 0.000 . |* . . |* . 5 0.160 0.087 38.561 0.000

Page 40: Econometria Clássica

Estimador de Mínimos Quadrados Generalizados (EMQG)

MGD: 2

1

1

221

)(,0)(;0)( tttt

ttt

tktktt

VarECor

uu

uXbXbbY

Equação de diferenças generalizadas (EDG):

tktktt XbXbbY **

22

*

1

*

o Onde 1

*

ttt YYY , 1,

*

tjjtjt XXX e 1ttt uu ;

Então, estima se a EDG por MQO, obtendo se )ˆ,,ˆ,ˆ(ˆ2

*

1

*

kbbbb ;

o )1(ˆˆ *

11 bb ;

o Primeira observação: 2

1

*

1 1YY , 2

1

*

1 1jj XX

Representação matricial

MGD: uXbY ,

Note que 2)()( uuEuVar , porque há ACS1;

o Onde

1

1

1

1

331

32

2

12

nnn

n

n

n

nn;

Agora, seja a seguinte matriz:

21000

0100

010

001

nnH

o Pré multiplicando o MGD por essa matriz: HuHXbHY ;

o Seja Hu . Então, minimizando se uHHuiˆˆˆˆˆ 2 , tém se o

EMQG:

YXXXb 111 ) (~

o Note se que HH1 ;

o b~

é eficiente, consistente e normalmente distribuído

assintóticamente;

Page 41: Econometria Clássica

Estimação de ˆ (Método de Cochrane Orcutt ou CORC):

1. Estima se o MGD por MQO e obtém se )1(ˆ

tu ;

2. Estima se: ttt vuu ),1(1),1(),1(ˆˆˆˆ ;

3. Usa se ˆ para estimar EDG: tktktt XbXbbY ˆˆˆˆ **

22

*

1

* ;

4. Computa se: ktkttt XbXbbYu ˆˆˆˆ

221),2( ;

5. Repete se passos 2, 3 e 4 iterativamente até que:

0|ˆˆ| 1 (onde indica iteração);

Exemplo: Consumo Anual Brasil 1960 2004

Dependent Variable: CO

Sample (adjusted): 1971 2004

Included observations: 34 after adjustments

Convergence achieved after 22 iterations

Variable Coefficient Std. Error t-Statistic Prob.

C 1.22E+08 54126485 2.257963 0.0319

Y 0.769876 0.043924 17.52743 0.0000

GR -0.679646 0.062333 -10.90354 0.0000

I -0.828333 0.074674 -11.09262 0.0000

NE -0.932487 0.087990 -10.59761 0.0000

AR(1) 0.865912 0.070015 12.36746 0.0000

R-squared 0.997571 Mean dependent var 7.49E+08

Adjusted R-squared 0.997138 S.D. dependent var 1.75E+08

S.E. of regression 9368116. Akaike info criterion 35.10231

Sum squared resid 2.46E+15 Schwarz criterion 35.37167

Log likelihood -590.7392 F-statistic 2300.268

Durbin-Watson stat 2.156901 Prob(F-statistic) 0.000000

Estatística Q de Ljung Box

Date: 06/07/06 Time: 15:20

Sample: 1971 2004

Autocorrelation Partial Correlation J AC PAC Q-Stat Prob

. *| . . *| . 1 -0.094 -0.094 0.3309

. |* . . |* . 2 0.087 0.079 0.6192 0.431

. *| . . *| . 3 -0.110 -0.097 1.0987 0.577

. | . . | . 4 -0.016 -0.041 1.1097 0.775 . |* . . |* . 5 0.112 0.127 1.6421 0.801

Page 42: Econometria Clássica

4.2 HETEROCEDASTICIDADE

Violação da hipótese 5 ( 2)( iVar , i ; ou IEVar 2)()( );

Caso Geral

MGD: 2

221

)( ii

ikikii

uVar

uXbXbbY

Caso de Séries de Tempo

MGD: 2

221

)( tt

tktktt

uVar

uXbXbbY

Exemplo Gráfico: Caso de 1 variável explicativa X

Atualmente, heterocedasticidade ocorre em dados temporais e de

seção cruzada (cross section);

Page 43: Econometria Clássica

Consequências da Heterocedasticidade

Propriedades do EMQO:

o b continua não enviesado para b;

o b (EMQO) não é mais o MELNE para b, logo é ineficiente;

Variância residual enviesada:

o )(ˆ2

1

2 knuS i

n

i é um estimador enviesado de sigma2i;

o Elementos de )(b

Sdiag ficam enviesados;

o 2R e 2R ficam enviesados;

o Estatísticas jj bjb

Sbt ˆˆˆ (j = 1,...,k) ficam enviesadas;

o Estatística F fica enviesada;

o Critérios de informação AIC e SC ficam enviesados;

Matriz de var-covar dos parâmetros:

o Sob heterocedasticidade: ΜbVar 2)ˆ( , onde 1)( XXΜ ;

o Computadores tipicamente reportam resultados calculados

com base na ausência de heterocedasticidade, isto é: 122

ˆ )( XXSSb

;

Mínimos Quadrados Ponderados (MQP)

É um caso particular do EMQG;

MGD: 2

221

)( ii

ikikii

uVar

uXbXbbY

Supondo 2

i conhecida, transforma se o MGD segundo:

i

i

i

ki

k

i

i

ii

i uXb

Xbb

Y2

21

1

o Isto é: ikikiii XbXbWbY **

221

* ;

o No novo modelo, o termo iii u é homocedástico;

Prova: 11

)(2

2

2

i

i

i

ii

i

i uVaru

VarVar

Estima se o modelo transformado por EMQO.

Page 44: Econometria Clássica

Representação Matricial do EMQP

MGD: uXbY ,

Note que 2)()( uuEuVar , onde :

2

2

3

2

2

2

1

2

000

000

000

000

n

nn

;

Agora, seja a seguinte matriz:

n

nnH

100

01

0

001

2

1

;

o Pré multiplicando o MGD por essa matriz: HuHXbHY ;

o Seja Hu . Então, minimizando se uHHuiˆˆˆˆˆ 2 , tém se o

EMQP:

YXXXb 111 ) (~

o Note se que HH12 )( ;

o b~

é eficiente, consistente e normalmente distribuído

assintóticamente;

Quando 2

i é desconhecida

Assume se que é uma função das variáveis do modelo:

),,,()( 1

2

kiiiiii XXYcZcZuVar

Onde c é uma constante não nula.

Page 45: Econometria Clássica

Transforma se o MGD conforme:

i

i

i

ki

k

i

i

ii

i

Z

u

Z

Xb

Z

Xb

Zb

Z

Y2

21

1

É fácil verificar que:

cZ

cZuVar

ZZ

uVar

i

i

i

ii

i 1

Logo, no MGD transformado o termo de erro é homocedástico.

Exemplos de funções Zi que podem ser usadas:

o ii YZ ;

o jii XZ ;

o 2

jii XZ ;

o kikiii XcXcXcZ 2211 ;

Exemplo: Consumo Anual Brasil 1970 2004

Mínimos Quadrados Ponderados: Assumindo que Var(ut)=c.Yt

Dependent Variable: CO/SQR(Y)

Method: Least Squares

Date: 06/12/06 Time: 15:01

Sample (adjusted): 1970 2004

Included observations: 35 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

1/SQR(Y) 42489845 11564215 3.674252 0.0009

SQR(Y) 0.794932 0.032469 24.48296 0.0000

GR/SQR(Y) -0.664485 0.076533 -8.682316 0.0000

I/SQR(Y) -0.690385 0.115316 -5.986888 0.0000

NE/SQR(Y) -0.705055 0.110605 -6.374556 0.0000

R-squared 0.956610 Mean dependent var 21405.12

Adjusted R-squared 0.950824 S.D. dependent var 2459.812

S.E. of regression 545.4779 Akaike info criterion 15.57277

Sum squared resid 8926386. Schwarz criterion 15.79496

Log likelihood -267.5234 Durbin-Watson stat 0.336312

Page 46: Econometria Clássica

Verificando a Presença de Heterocedasticidade

Graficamente

Plotar ii X 2 , ii X 3 , ..., kii X ;

Plotar ii X 2

2 , ii X 3

2 , ..., kii X2 ;

Plotar tt ou tt

2 .

Teste de White

H0: não há heterocedasticidade;

Estatística de teste: 22 ~ q

a

nR , onde 1]2)1([ kkq ;

o O cômputo dessa estatística de teste envolve regredir os

quadrados dos resíduos de um MGD estimado por MQO

contra um conjunto V de variáveis formado por:

Todas as variáveis explicativas não redundantes;

Os quadrados dessas variáveis;

Os produtos cruzados entre si dessas variáveis;

Regra de Decisão

o Se )( 22 nRP q Não Rejeite H0;

o Se )( 22 nRP q Rejeite H0.

Page 47: Econometria Clássica

Ilustração do teste de White:

o MGD: iiii XbXbbY 33221 ;

o Estime por MQO e compute: iiii XbXbbY 33221ˆˆˆˆ ;

o Estime por MQO a regressão:

iiiiiiii wXXcXcXcXaXaa )(ˆ324

2

33

2

2233221

2 ;

o Compute )ˆˆˆˆ(1222 wwR para essa regressão;

o Compute a estatística de teste 2nR

o Escolha e aplique a regra de decisão.

Exemplo: Consumo Anual Brasil 1960 2004

Dependent Variable: CO

Method: Least Squares

Date: 06/24/05 Time: 11:01

Sample: 1960 2004

Included observations: 45

Variable Coefficient Std. Error t-Statistic Prob.

C 23372214 9915664. 2.357100 0.0234

Y 0.836903 0.031319 26.72190 0.0000

GR -0.789323 0.067470 -11.69886 0.0000

I -0.737619 0.119547 -6.170097 0.0000

NE -0.764959 0.105569 -7.246070 0.0000

R-squared 0.994985 Mean dependent var 8.19E+08

Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08

S.E. of regression 24391210 Akaike info criterion 36.96178

Sum squared resid 2.38E+16 Schwarz criterion 37.16252

Log likelihood -826.6401 F-statistic 1983.966

Durbin-Watson stat 0.395263 Prob(F-statistic) 0.000000

Page 48: Econometria Clássica

Exemplo: Consumo Anual Brasil 1960 2004

(Continuação)

Teste de Heterocedasticidade de White

White Heteroskedasticity Test:

F-statistic 16.41214 Prob. F(14,20) 0.000000

Obs*R-squared 32.19742 Prob. Chi-Square(14) 0.003755

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 06/12/06 Time: 14:57

Sample (adjusted): 1970 2004

Included observations: 35 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 3.22E+15 1.03E+15 3.118874 0.0054

Y -25802647 9318834. -2.768871 0.0118

Y^2 0.025064 0.009505 2.636992 0.0158

Y*GR -0.103383 0.038220 -2.704923 0.0136

Y*I -0.088866 0.047901 -1.855195 0.0784

Y*NE 0.067251 0.040232 1.671590 0.1102

GR 72030518 25197051 2.858688 0.0097

GR^2 0.134210 0.048908 2.744141 0.0125

GR*I 0.098590 0.089595 1.100397 0.2842

GR*NE -0.162626 0.113055 -1.438473 0.1658

I 68674186 35064179 1.958528 0.0643

I^2 0.043314 0.067828 0.638594 0.5303

I*NE 0.109893 0.141270 0.777892 0.4457

NE -89816669 21962399 -4.089565 0.0006

NE^2 -0.138321 0.103752 -1.333191 0.1975

R-squared 0.919926 Mean dependent var 4.78E+14

Adjusted R-squared 0.863875 S.D. dependent var 9.91E+14

S.E. of regression 3.66E+14 Akaike info criterion 70.20062

Sum squared resid 2.67E+30 Schwarz criterion 70.86719

Log likelihood -1213.511 F-statistic 16.41214

Durbin-Watson stat 2.029315 Prob(F-statistic) 0.000000

Page 49: Econometria Clássica

4.3 VARIÁVEIS INDEPENDENTES ESTOCÁSTICAS

Estudaremos este assunto com base na regressão simples:

MGD: iii bXaY

Violação da hipótese 2, isto é: iX é estocástica (é uma V.A.);

Situações em que X é uma V.A.:

o Erro de medida nas variáveis independentes;

o Variáveis independentes também dependem da dependente;

o Variável dependente defasada entre as independentes;

Nesses casos, é possível que 0),( ,XiiXCov e, se isso ocorre,

EMQO é enviesado e inconsistente:

Prova

o Seja a seguinte “forma em desvios”do MGD: iii ebxy ; onde

YYy ii , XXx ii e iie . Neste caso, o EMQO

para b é dado por:

222

)(ˆ

i

ii

i

iii

i

ii

x

exb

x

ebxx

x

yxb

o Computando o E(,) em ambos os lados: 2

)ˆ(i

ii

x

exEbbE

o Nada garante que bbE )ˆ( porque

][][][ 22

iiiiii xEexExexE . No entanto, aplicando o operador

plim(,) em ambos os lados:

2

,

22 lim

limlim)lim()ˆlim(

X

X

i

ii

i

iib

nxp

nexpb

x

expbpbp

o Fica claro que tudo depende de ,),( XiiXCov :

Se 0,X , então b é consistente para b (embora não

se possa determinar se é enviesado ou não);

Se 0,X , isto significa que b é inconsistente para b

(e, em decorrência, também enviesado para b);

Page 50: Econometria Clássica

Mínimos Quadrados de Variáveis Instrumentais (MQVI)

Seja X estocástica e 0),( ,eXiiXCov . Como estimar b já que

MQO é inconsistente neste caso?

Definição de instrumento: Seja Z uma V.A. tal que:

o 0lim ,ZX

ii

n

zxp ;

o 0lim ,Z

ii

n

ezp ;

o onde XXx ii e ZZz ii .

Então, o estimador MQVI dado por:ii

ii

zx

yzb~

é consistente para b;

Prova

o Novamente, seja o MGD em forma de desvio: iii ebxy .

Então, o EMQVI pode ser desenvolvido como:

o

ii

ii

ii

iiii

ii

iiii

ii

iii

ii

ii

zx

ezb

zx

ezzxb

zx

ezzbx

zx

ebxz

zx

yzb

)()(~

o Aplicando plim(,) a ambos os lados:

o bbnzxp

nezpbpbp

ZX

Z

ii

ii

,

,

lim

lim)lim()

~lim(

Caso Geral

MGD: ikikii XbXbbY 221

X2i,...,Xki são todas estocásticas;

Cada Xji (j = 2,...,k) é correlacionada com o termo de erro i;

Aplicar o MQVI neste caso envolve usar um instrumento para cada

variável independente; ii XZ 22 ,..., kiki XZ .

E usar o estimador geral de MQVI:

YZXZb 1)(~

Onde Z é a matrix n k de instrumentos para a matriz X;

Page 51: Econometria Clássica

5. INTRODUÇÃO A SISTEMAS DE EQUAÇÕES SIMULTÂNEAS

Trigve Haavelmo

(1911-1999)

Economista Norueguês

Premio Nobel de Economia de 1989

Abordagem probabilística em econometria

Sistemas de equações simultâneas

Objetivo: introduzir mais variáveis dependentes no MGD;

MGD: iiiii

iiiii

XXYbbY

XXYbbY

2222121121202

1212111212101

Terminologia:

o Y variáveis endógenas;

o X variáveis exógenas;

o b coeficientes das endógenas;

o coeficientes das exógenas

o Variáveis pré determinadas:

Exógenas;

Endógenas defasadas;

Média: iiii

iiii

XXYbbYE

XXYbbYE

222121121202

212111212101

)(

)(

Modelo Amostral: iiiii

iiiii

XXYbbY

XXYbbY

2222121121202

1212111212101

ˆˆˆˆˆ

ˆˆˆˆˆ

Preditor linear: iiii

iiii

XXYbbY

XXYbbY

222121121202

212111212101

ˆˆˆˆˆ

ˆˆˆˆˆ

Forma Estrutural x Forma Reduzida

Page 52: Econometria Clássica

Forma Estrutural: endógenas como função de endógenas e

pré determinadas;

MGD(FE): iiii

iiii

XYbbY

XYbbY

2121121202

1111212101

Forma Reduzida: endógenas como função de pré determinadas;

MGD(FR): iii

iii

wXY

wXY

2121202

1111101

Page 53: Econometria Clássica

Relação entre parâmetros da FE e da FR;

2112

21212

2112

1212

1

2112

21112121

2112

10212020

2112

11211211

2112

201210

10

1

1

11

11

bb

bw

bb

bw

bb

b

bb

bbb

bb

b

bb

bbb

iii

ii

i

Problema da Identificação

Definição: Em um SES uma equação está identificada quando é

possível obter se estimativas numéricas dos parâmetros estruturais a

partir de estimativas dos parâmetros da forma reduzida;

Status de identificação:

o Equação não identificada: não é possível;

o Equação identificada exatamente: obtém se uma única

estimativa dos parâmetros estruturais;

o Equação sobre identificada: obtém se mais de uma

estimativa dos parâmetros estruturais;

Sistema Identificado: quando todas as equações do SES estão

identificadas (exatamente ou sobreidentificadas);

Condição de Ordem (necessária) para identificação

Regra: Em um SES com M equações simultâneas, uma equação

estará identificada se o número de varáveis pré determinadas

excluídas da equação (K k) for maior ou igual ao número de

endógenas incluídas na equação (m) menos um ( 1mkK );

Exemplo: MGD:

(3)

(2)

(1)

3131303

2222121121202

1212212101

iii

iiiii

iiii

YbbY

XXYbbY

XYbbY

Equação M = 3 K = 2 Status

(1) m = 2 k = 1 K k = 1 = m 1 = 1: identificada exatamente

(2) m = 2 k = 2 K k = 0 < m 1 = 1: não identificada

(3) m = 2 k = 0 K k = 2 > m 1 = 1: sobre identificada

Page 54: Econometria Clássica

Condição de Posto (suficiente) para identificação

Regra: Em um SES com M equações em M variáveis endógenas,

uma equação é identificada se e somente se no mínimo um

determinante não nulo de ordem (M 1) (M 1) puder ser construído

a partir dos coeficientes das variáveis (endógenas e

pré determinadas) excluídas daquela equação particular mas

incluídas em outras equações do modelo;

Ilustração

iiiii

iiiii

iiiii

iiiii

XYbYbbY

XXYbbY

XXYbbY

XYbYbbY

4343242141404

3232131131303

2222121323202

1111313212101

Pela condição de ordem verifica se que:

Equação M = 4 K = 3 Status

(1) m = 3 k = 1 K k = 2 = m 1 = 2: identificada exatamente

(2) m = 2 k = 2 K k = 1 = m 1 = 1: identificada exatamente

(3) m = 2 k = 2 K k = 1 = m 1 = 1: identificada exatamente

(4) m = 3 k = 1 K k = 2 = m 1 = 2: identificada exatamente

Tabela de Coeficientes do Sistema

Eq. 1 Y1 Y2 Y3 Y4 X1 X2 X3

(1) b10 1 b12 b13 0 11 0 0

(2) b20 0 1 b23 0 21 22 0

(3) b30 b31 0 1 0 31 32 0

(4) b40 b41 b42 0 1 0 0 43

Page 55: Econometria Clássica

Pela condição de Posto:

o Equação (1):

43

32

22

01

00

00

A

Det(A) = 0, logo eq. (1) não está identificada;

o Equação (2):

4341

31

1

00

001

b

bA

Det(A) = 0, logo eq. (2) não está identificada;

o Equação (3):

4342

12

1

001

00

b

b

A

Det(A) = 0, logo eq. (3) não está identificada;

o Equação (4):

3231

222123

1113

1

0

b

b

A

o Det(A) 0, logo eq. (4) está identificada;

Procedimentos para aplicar a condição de posto

Passo 1: re escrever o SES com todas as variáveis e parâmetros do

lado esquerdo e só os erros aleatórios do lado direito;

Passo 2: montar a tabela de coeficientes do sistema;

Passo 3: construir para cada equação a matriz A respectiva (a partir

dos coeficientes nulos da linha correspondente à equação em

análise);

Regra Geral de Identificação

K k > m 1

Posto de A = M 1

Eq. Sobre identificada

K k m 1

Posto de A < M 1

Eq. Sub identificada

K k = m 1

Posto de A = M 1

Eq. Exatam. identificiada

K k < m 1

Eq. Não identificada

(Posto de A < M 1)

Page 56: Econometria Clássica

Problema da simultaneidade

MGD: iiiii

iiiii

XXYbbY

XXYbbY

2222121121202

1212111212101

Simultaneidade: quando há causalidade bidirecional entre

endógenas;

Problema: correlação da endógena do lado direito com o termo de

erro;

No MGD acima: 0),( 12 iiYCor e 0),( 21 iiYCor , logo:

o EMQO é inconsistente para estimar parâmetros das duas

equações;

Quando não há simultaneidade, é possível usar EMQO, desde que as

hipóteses básicas do SES sejam satisfeitas;

Estimação de SES

MGD:

MikiMkiMiMMMiMMMii

ikikigigii

ikikigigii

XXYbYbbY

XXYbYbbY

XXYbYbbY

11,11,110

221212121202

111111212101

Hipóteses Básicas:

o Relação linear entre as variáveis;

o Xjis são não estocásticas, j = 1,...,k;

o 0)( riE , 2)( rriVar , 0),( rjriCov para r = 1,...,M e i j;

o 0),( siriCov para r s; r = 1,...,M; s = 1,...,M;

o ),0(~ 2

rri N )),((~ 2

rriri YENY , r = 1,...,M.

Page 57: Econometria Clássica

Antes da estimação, verificar:

o Identificação;

o Simultaneidade;

Métodos de Informação Limitada: considera restrições

relacionadas apenas à equação de interesse;

o EMQO;

o Estimador de Mínimos Quadrados Indiretos (EMQI);

o Estimador de Mínimos Quadrados de 2 Estágios (EMQ2E);

Métodos de Informação Completa: considera restrições entre

equações;

o Estimador de Mínimos Quadrados de 3 Estágios (EMQ3E);

o Estimador de Máxima Verossimilhança com Informação

Completa (EMVIC);

Tipologia de SES:

o Equações não relacionadas

0),( 21

2222202

1111101

ii

iii

iii

Cov

XbY

XbY

o Equações aparentemente não relacionadas (SURE)

0),( 21

2222202

1111101

ii

iii

iii

Cov

XbY

XbY

Nota: neste caso, estima se por algum método sistêmico, o mais

usual sendo o MQ3E;

o Sistemas Recursivos

0),( 21

2222121121202

1212111101

ii

iiiii

iiii

Cov

XXYbbY

XXbY

Nota: observe que iii YEY 111 )( ; substituindo na 2ª. equação

implica que ;0),( 21 iiYCov

Page 58: Econometria Clássica

o Sistemas Bloco Recursivos

0),(),(),( 323121

3232131232131303

2222121121202

1212111212101

iiiiii

iiiiii

iiiii

iiiii

CovCovCov

XXYbYbbY

XXYbbY

XXYbbY

o Sistemas Simultâneos:

iiiii

iiiii

XXYbbY

XXYbbY

2222121121202

1212111212101

Nota: estima se por MQI ou MQ2E;

Mínimos Quadrados de 2 Estágios

Caso particular do EMQVI;

Serve para estimar equações exatamente ou sobre identificadas;

Seja o seguinte:

MGD: ttt

ttttt

YbbY

XXYbbY

2121202

1212111212101

É fácil verificar (pelas condições de ordem e de posto) que:

o 1ª. equação não está identificada;

o 2ª. equação está sobre identificada;

o Logo, só é possível estimar a 2ª. equação;

É fácil verificar também que devido à causalidade bidirecional

(simultaneidade) entre tY1 e tY2 , ocorre:

0),( 21 ttYCov ;

Page 59: Econometria Clássica

Estimação da 2ª. equação por MQ2E:

o 1º. Estágio: construção de instrumento para tY1 via forma

reduzida;

Forma Reduzida (FR): tttt

tttt

wXXY

wXXY

2221121202

1212111101

Estima se por MQO a 1ª. equação da FR:

ttt XXY 212111101ˆˆˆˆ

o 2º. Estágio: usa se tY1ˆ no lugar de tY1 para estimar a 2ª.

equação da FE por MQVI;

*

112120

212112120

21121202

ˆ

ˆˆ

)ˆˆ(

tt

ttt

tttt

Ybb

wbYbb

wYbbY

o Estima se usando as fórmulas de MQVI:

tt

tt

yy

yyb

11

12

21ˆ

ˆˆ 121220

ˆˆ YbYb

Nota: é possível mostrar que a formula acima para 21b é

equivalente ao estimador de MQO (ver PR pg. 402)

Observe se que tY1ˆ é de fato um instrumento para tY1 :

o 0ˆ

lim11ˆ

11

YY

tt

n

yyp ;

o 0)),((ˆ

lim *

11

*

11

tt

ttYECov

n

yp

Logo, EM2QE é um estimador consistente para os parâmetros

estruturais de equações exatamente ou sobre identificadas.

Page 60: Econometria Clássica

Exemplo: Consumo Anual Brasil 1970 2004

Estimação por EMQ2E

(Opção TSLS do Eviews em Quick\Estimate Equation)

Dependent Variable: CO

Method: Two-Stage Least Squares

Date: 06/20/06 Time: 11:05

Sample (adjusted): 1970 2004

Included observations: 35 after adjustments

Instrument list: GR NE

Variable Coefficient Std. Error t-Statistic Prob.

C 1.83E+08 28288823 6.469929 0.0000

Y 0.470996 0.023360 20.16266 0.0000

R-squared 0.954299 Mean dependent var 7.36E+08

Adjusted R-squared 0.952914 S.D. dependent var 1.87E+08

S.E. of regression 40600140 Sum squared resid 5.44E+16

Durbin-Watson stat 0.449011 Second-stage SSR 5.20E+17

Estimação da Forma Reduzida no 1º. Estágio

Dependent Variable: Y

Method: Least Squares

Date: 06/20/06 Time: 11:08

Sample (adjusted): 1970 2004

Included observations: 35 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 8.49E+08 51210803 16.57725 0.0000

GR 3.370831 0.449911 7.492219 0.0000

NE 1.672787 1.082381 1.545469 0.1321

R-squared 0.696523 Mean dependent var 1.17E+09

Adjusted R-squared 0.677556 S.D. dependent var 3.57E+08

S.E. of regression 2.03E+08 Akaike info criterion 41.17520

Sum squared resid 1.32E+18 Schwarz criterion 41.30852

Log likelihood -717.5660 F-statistic 36.72227

Durbin-Watson stat 0.593245 Prob(F-statistic) 0.000000