notas de aula · 2014-10-07 · econometria i ane034 notas de aula janeiro 2013 prof. rogério...

35
1 Econometria I ANE034 NOTAS DE AULA Janeiro 2013 Prof. Rogério Silva de Mattos Departamento de Economia Faculdade de Economia Universidade Federal de Juiz de Fora [email protected] http://www.ufjf.edu.br/rogerio_mattos

Upload: phunghanh

Post on 20-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

1

Econometria I ANE034

NOTAS DE AULA

Janeiro 2013

Prof. Rogério Silva de Mattos Departamento de Economia

Faculdade de Economia Universidade Federal de Juiz de Fora

[email protected] http://www.ufjf.edu.br/rogerio_mattos

2

1. AJUSTE DE CURVAS

1.1 MÉTODOS DE AJUSTE

Olhômetro

Máximo versus mínimo

Semi-médias

Mínimos desvios absolutos

Mínimos quadrados ordinários (MQO)

1.2 MÍNIMOS QUADRADOS ORDINÁRIOS

Definições

iY i-ésimo valor observado de Y

iX i-ésimo valor observado de X

Equação da reta: ii XbaY ˆˆ

Erro ou desvio: iii YY ˆˆ Desvio vertical do ponto observado

em relação à reta

Sejam dadas N observações para as variáveis Y e X.

Problema:

N

ib,a

1i

2

ˆˆ

ˆ Min ou

N

iiib,a

YY1i

2

ˆˆ)ˆ( Min ou

N

iib,a

XbaY1i

2

ˆˆ)ˆˆ( Min

)ˆ,ˆ Minˆˆ

baf(b,a

onde

N

ii XbaYbaf1i

2)ˆˆ( )ˆ,ˆ(

Solução: Aplicar técnicas de cálculo a várias variáveis

0)ˆˆ(2- ˆ

)ˆ,ˆ(

1i

N

ii XbaYa

baf

0)ˆˆ(2- ˆ

)ˆ,ˆ(

1i

i

N

ii XXbaYb

baf

3

Sugestão de exercício para casa:

0)ˆˆ(1i

N

ii XbaY

N

i

N

i

i YbXaN1i1

ˆˆ

0)ˆˆ(1i

i

N

ii XXbaY

N

ii

N

i

i

N

i

i XYbXaX1i1

2

1

ˆˆ

Fórmulas de MQO

2

11

2

111iˆ

N

i

i

N

i

i

N

i

i

N

i

i

N

ii

XXN

YXYXN

b

N

i

i

N

i

ii

XX

YYXX

b

1

2

1

)(

))((ˆ

N

X

bN

Y

a

N

i

i

N

i

i 11 ˆˆ XbYa ˆˆ

Versão Compactada das Fórmulas de MQO

N

i

i

N

i

ii

x

yx

b

1

2

1ˆ onde YYy

XXx

ii

ii

XbYa ˆˆ

EXERCÍCIO NUMÉRICO

Corolários

1.

N

i

1i

0

2.

N

ii X1i

0

3. YYYYN

i

N

iˆˆ

1i1i

Verificar os corolários no exercício.

Equações Normais

De MQO

4

1.3 QUALIDADE DO AJUSTAMENTO

Como avaliar se o modelo está aderindo bem aos dados ou não?

Estatísticas descritivas: 2R , 2R , Critério de Informação de Akaike (AIC)

e Critério de Schwarz (SC)

2

R

Mede o grau de ajustamento do modelo aos dados;

YYi = ii YY ˆ + YYi

ˆ

Desvio

Total

Desvio Não-

explicado

Desvio

Explicado

Elevando ao quadrado e agregando para todas as observações:

n

i

i YY1

2)(

=

n

i

ii YY1

2)ˆ(

+

n

i

i YY1

2)ˆ(

Variação

Total

Variação

Não-

explicada

Variação

Explicada

Grau de ajustamento (seja YYy ii ˆˆ )

n

i

i

n

i

i

y

y

R

1

2

1

2

2

ˆ

ou

n

i

i

n

i

i

y

R

1

2

1

2

2

ˆ

1

Propriedades

]1,0[2 R ;

Bom ajustamento 12 R ; Fraco ajustamento 02 R ;

2R tende a aumentar sempre com novas variáveis explicativas;

2R nunca diminui com novas variáveis explicativas

5

Refresco de Esperança, Variância e Somatório

1) Sejam Z e W duas VAs e c e d duas constantes reais.

Propriedades da Esperança

ccE )(

)()()( WEZEWZE

)()()( WEZEWZE

)()( ZcEcZE

dZcEdcZE )()(

)()()( WdEZcEdWcZE

)()()( WdEZcEdWcZE

Propriedades da Variância

Definição: ]))([()( 2ZEZEZVar

0)( cVar

)()()( WVarZVarWZVar se Z e W são independentes

)()()( WVarZVarWZVar se Z e W são independentes

)()( 2 ZVarccZVar

)()( 2 ZVarcdcZVar

)(),(2)()( 22 WVardWZcdCovZVarcdWcZVar se Z e W não são independentes

)(),(2)()( 22 WVardWZcdCovZVarcdWcZVar se Z e W não são independentes

Definição: ))]())(([(),( WEWZEZEWZCov

2) Sejam Zi e Wi duas variáveis, i = 1,...,n e c e d duas constantes reais.

Propriedades do somatório

nccn

i

1

n

i

i

n

i

i

n

i

ii WZWZ111

)(

n

i

i

n

i

i

n

i

ii WZWZ111

)(

n

i

i

n

i

i ZccZ11

n

i

i

n

i

i

n

i

ii WdZcdWcZ111

)(

n

i

i

n

i

i

n

i

ii WdZcdWcZ111

)(

6

2. MODELO DE REGRESSÃO SIMPLES

2.1 MODELO POPULACIONAL (ou GERADOR DOS DADOS)

MGD: iii bXaY

Y variável dependente;

X variável independente ou explicativa;

i = 1, ... ,n

j

i

X

YEb

)( ou coeficiente de sensibilidade de Y em relação à Xj;

ii bXaYE )( é a média de Y e representa um hiperplano que corta o

espaço euclidiano R2;

2.2 MODELO AMOSTRAL

iii XbaY ˆˆ

Estimador de

a a

b b

7

Hipóteses Básicas

1. Y é uma função linear de X;

2. X é uma variável não-estocástica;

3. 0)( iE ;

4. 2)( iVar e ;0)( jiE ;,1, , njiji ;

5. ),0(~ 2 Ni )),((~ 2ii YENY .

2.3 BOAS QUALIDADES DO EMQO

Teorema de Gauss-Markov

Se forem verdadeiras as hipóteses básicas 1, 2, 3 e 4, então os estimadores

de MQO, â e b são os melhores (eficientes) estimadores lineares não

enviesados (MELNE) de a e b.

Teorema Mais Restrito

Se for verdadeira também a hipótese 5, então os estimadores de MQO são

os melhores (eficientes) dentre os estimadores lineares e os não-lineares.

Mais um Teorema

Os estimadores de MQO são também consistentes.

2.4 PROPRIEDADES DESEJÁVEIS DO ESTIMADOR DE MQO

Não Enviesado

bbE )ˆ(

aaE )ˆ(

Variância Mínima

)~

()ˆ( bVarbVar onde b~

é q.q. outro estimador linear de b )~()ˆ( aVaraVar onde ã é q.q. outro estimador linear de a

Eficiente = Não Enviesado + Variância Mínima

8

Consistentes

bbp )ˆlim(

aap )ˆlim(

Onde “plim” quer dizer limite de probabilidade

0)ˆ(lim

)ˆ(lim)ˆlim(

bVar

bbEbbp

n

n

0)ˆ(lim

)ˆ(lim)ˆlim(

aVar

baEbap

n

n

2.5 MÉDIA E VARIÂNCIA DOS ESTIMADORES DE MQO

Fatos

YYy

XXx

ii

ii

iiiiii vbxXbabXaYYy

Re-escrevendo os EMQO

N

i

i

N

i

ii

N

i

i

N

i

ii

N

i

i

N

i

i

N

i

iii

N

i

i

N

i

ii

x

vx

b

x

vxxb

x

vbxx

x

yx

b

1

2

1

1

2

11

2

1

2

1

1

2

1

)(ˆ

Nota:

N

i

ii

N

i

i

N

i

ii

N

i

ii

N

i

ii xxxxvx11111

Logo:

N

i

i

N

i

ii

x

x

bb

1

2

9

Média

b

x

Ex

b

x

x

bEbEN

i

i

N

i

ii

N

i

i

N

i

ii

1

2

1

1

2

1

)(

)ˆ(

aXbEvEXbaXbvXbaEXbYEaE ii )ˆ()()ˆ()ˆ()ˆ(

Variância

Outro Fato:

N

i

i

N

i

ii

x

x

bb

1

2

N

i

i

N

i

i

N

i

i

N

i

i

N

ji

jiji

N

i

ii

N

i

i

N

i

ii

N

i

i

N

i

ii

xx

x

x

xxxE

x

xE

x

x

EbbEbVar

1

2

2

2

1

2

1

22

2

1

2

1

22

2

1

2

2

1

2

1

2

12

2

)ˆ()ˆ(

Logo:

N

i

ix

bVar

1

2

2

)ˆ(

Verificar que: 2

1

2

21)ˆ(

N

i

ix

X

NaVar

10

2.5 DISTRIBUIÇÃO DE PROBABILIDADE DO EMQO

Combinação linear:

N

i

iiNN WaWaWaWa1

2211

Teorema: Sejam Z1, Z2, ..., Zn VAs normalmente distribuídas. Então

toda combinação linear de Z1, Z2, ..., Zn é também uma VA normalmente

distribuída.

N

i

ii

N

i

ii

N

i

ii

N

i

iN

i

i

i

N

i

i

N

i

ii

YaYccycy

x

x

x

yx

b1111

1

2

1

2

1 )(ˆ

Verificar que:

N

i

iiYda1

ˆ

Pelo teorema segue que b e a são normalmente distribuídos, como segue:

N

i

ix

bNb

1

2

2

,~ˆ

2

1

2

21,~ˆ

N

i

ix

X

NaNa

2.5 VARIÂNCIA RESIDUAL

Conceito: Estimador de 2

2

ˆ1

2

2

NS

N

i

N

i

i

b

x

SbVarEstS

1

2

22ˆ ))ˆ((

2

1

2

22

ˆ

1))ˆ(( S

x

X

NaVarEstS

N

i

i

a

Erros-padrão:

2ˆˆ bb

SS

e 2

ˆˆ aa SS

11

2.5 INTERVALO DE CONFIANÇA DE a e b

Conceito: Medida de Incerteza

bL ˆ

bU ˆ

aL ˆ aU ˆ

Critério:

1)Pr(

1)Pr(

ˆˆ

ˆˆ

aa

bb

UaL

UbL

Solução

bnbStbL ˆ2,2/1ˆ

ˆ

bnbStbU ˆ2,2/1ˆ

ˆ

N

i

i

b

x

SS

1

2

2

ˆ

ana StaL ˆ2,2/1ˆˆ

ana StaU ˆ2,2/1ˆˆ

2

1

2

2

ˆ

1S

x

X

NS

N

i

i

a

Exercício Numérico

12

2.6 TESTES DE HIPÓTESES PARA a E b

Conceitos de Hipótese

Hipótese: Afirmação sobre algo desconhecido

Hipótese em Inferência Estatística: Afirmação sobre a população

Hipótese Nula (H0): afirmação de interesse a se testar

Hipótese Alternativa (H1): o oposto lógico da hipótese nula

Exemplos de Testes no Modelo de Regressão Simples

H0: a = 3 H0: b = 1

H1: a 3 H0: b 1

Testes Típicos do Modelo de Regressão Simples

Significância do componente autônomo

H0: a = 0 (componente autônomo é nulo)

H1: a 0 (componente autônomo não é nulo)

Significância da variável explicativa X

H0: b = 0 (variações em X não explicam variações em Y)

H0: b 0 (variações em X explicam variações em Y)

Implementação

Teste de significância do componente autônomo

1. Enunciado: H0: a = 0; H1: a 0

2. Escolha do nível de significância

3. Cálculo da estatística de teste: 2

ˆ

ˆ ~ˆ

n

a

a tS

at

4. Aplicar Regra de Decisão:

a. tC = t/2,n-2

13

b. Se CaC ttt ˆ , não rejeita-se H0

c. Se CaCa tttt ˆˆ ou , rejeita-se H0

Teste de significância da variável explicativa X

1. Enunciado: H0: b = 0; H1: b 0

2. Escolha do nível de significância

3. Cálculo da estatística de teste: 2

ˆ

ˆ ~ n

b

bt

S

bt

4. Aplicar Regra de Decisão:

a. tC = t/2,n-2

b. Se CbC ttt ˆ , não rejeita-se H0

c. Se CbCbtttt ˆˆ ou , rejeita-se H0

Exemplo Numérico

14

2.7. PREVISÃO COM O MODELO DE REGRESSÃO SIMPLES

Conceitos

Previsão Pontual: Uso do modelo econométrico de RS para calcular

valor da variável dependente Y (Yf) dado valor hipotético de X (Xf)

ff XbaY ˆˆˆ

Previsão Condicional: modelo econométricos pressupõem um valor

assumido ou previsto de X.

Previsão Intervalar: calculo de intervalo de confiança de (1-)% da

previsão (também chamado intervalo de previsão)

Previsão Dentro da Amostra: aplicação do modelo econométrico

assumindo os valores de X presentes na amostra

ii XbaY ˆˆˆ Ni ,...,1

Previsão Fora da Amostra: aplicação do modelo econométrico

assumindo valores hipotéticos de X normalmente diferentes dos

valores presentes na amostra

0ˆˆˆ XbaYo o = “out of sample” ou fora da amostra

2.8 PREVISÃO NA MÉDIA DENTRO DA AMOSTRA

(ou Estimação de E(Yi))

Previsor Pontual: ii XbaY ˆˆˆ

Objetivo: Acertar E(Yi)

alPopulacion ReAmostral Re

)(ˆˆˆta

iita

ii bXaYEXbaY

Não Enviesamento

15

)()ˆ()ˆ()ˆˆ()ˆ( iiiii YEbXaXbEaEXbaEYE

Logo, ii XbaY ˆˆˆ é um previsor não enviesado de ii bXaYE )( , quando

usamos os EMQO para estimar o modelo.

Variância de iY

)ˆ,ˆ(2

)ˆ)(ˆ(2)ˆ()ˆ(

)ˆ)(ˆ(2)ˆ()ˆ(

)ˆ()ˆ()ˆˆ())(ˆ(

2

ˆ

22

22

2222

ˆ

baCovXX

bbaaEXbbEXaaE

XbbaaXbbaaE

XbbaaEbXaXbaEYEYE

ibia

ii

ii

iiiiiYi

É possível mostrar que

2

2)ˆ,ˆ(

ix

XbaCov

(Ver nota 1). Logo:

22

22

2

22ˆ 2

1

i

i

i

i

iY x

XX

xX

x

X

ni

Sugestão de exercício para casa

Verificar que:

2

2

22ˆ

)(1

i

i

Y x

XX

ni

Distribuição de iY

Dado que a e b são normalmente distribuídos, e que o previsor

ii XbaY ˆˆˆ é uma combinação linear de ambos, segue que:

2

ˆ);(~ˆiYii YENY

Intervalo de Previsão na Média

Conceito: Intervalo de confiança da previsão na média, logo medida

de incerteza da previsão pontual na média.

Princípio: 1)ˆ)(ˆPr( ,, iHiiL YYEY

Limites do intervalo:

16

iYniiL StYY ˆ2,2/,ˆˆ

iYniiH StYY ˆ2,2/,ˆˆ

Onde:

2

2

22

ˆ

)(1S

x

XX

nSS

i

i

Yi

Exercício Numérico

2.9 PREVISÃO

Pode ser dentro ou fora da amostra. A previsão pontual é feita da

mesma maneira que na previsão da média. O que muda é o intervalo de

previsão.

Previsão Pontual: ff XbaY ˆˆˆ

Erro de Previsão: fff YYe ˆ

Não Enviesamento

0

)()ˆ()ˆ()ˆ()ˆ(

)ˆˆ()ˆ()(

ffff

ffffff

EbbEXaaEXbbaaE

XbabXaEYYEeE

Logo, ff XbaY ˆˆˆ é um previsor não enviesado de fY , quando

usamos os EMQO para estimar o modelo.

Variância do erro de previsão

Amostral ErroMGD do Erro

ˆ)(

ˆ)()(ˆ

fff

fffffff

YYE

YYEYEYYYe

17

Amostral Errodo Variância

MGD do Erro do Variância

2

22

22

222

)ˆ)((,2)ˆ)(()(

)ˆ)((2)ˆ)((

)ˆ)(()ˆ()(

fY

ffffff

ffffff

fffffff

YYECovYYEEE

YYEYYEE

YYEEYYEeVar

O último passo resulta de que 0)ˆ)(,(2 fff YYECov .

Verificar que: 2

2

2)(1

1

i

f

fx

XX

n

Distribuição do erro de previsão fe

Dadas as hipóteses 2 ( X não-estocástica) e 6 ( f é normalmente

distribuído), segue que Yf é normalmente distribuído. Além disso,

verificamos que o previsor ff XbaY ˆˆˆ também é normalmente distribuído.

Por definição, ef é uma combinação linear de Yf e fY , do que segue que:

2,0~ ff Ne

Intervalo de Previsão

Conceito: intervalo de confiança da previsão

Princípio: 1)ˆˆPr( ,, fHffL YYY

Limites do intervalo:

fnffL StYY 2,2/,ˆˆ

fnffH StYY 2,2/,ˆˆ

Onde:

2

2

22

ˆ

)(1S

x

XX

nSS

i

i

Yi

Exercício numérico

18

3. REGRESSÃO MÚLTIPLA

Motivação: a maior parte das variáveis econômicas não depende apenas de

uma, mas de várias outras variáveis.

3.1 MODELO POPULACIONAL (ou Gerador dos Dados)

MGD ikkii XbXbaY ...22

Yi – variável dependente

Xj (j = 2,...,k) – variáveis independentes ou explicativas

a – parâmetro (componente autônomo ou intercepto)

j

ij

X

YEb

)( - parâmetro (coeficiente de sensibilidade de E(Yi) a Xj)

Hipóteses Básicas (do MGD)

1. Yi é uma função linear de X2, ..., Xj como especificado

2. Xj (j = 2,...,k) são não-estocásticas

3. E(i) = 0 e Var(i) = 2

4. Cor(i, j) = 0 para i 0

5. (i) ~ N(0,2)

3.2 ESTIMADOR DE MÍNIMOS QUADRADOS ORDINÁRIOS

Conceitos

19

Modelo Amostral: ikikii XbXbaY ˆˆˆ22

Preditor Linear: kikii XbXbaY ˆˆˆˆ22

Resíduo: kikii

iii

XbXbaY

YY

ˆˆˆ

ˆˆ

22

Problema: A partir de n observações amostrais, achar estimadores de boa

qualidade para kbba ,,, 2 ;

Solução: Minimizar a soma dos quadrados dos resíduos

n

i

i

1

2 para

kbba ˆ,,ˆ,ˆ 2 . Como se tem de minimizar uma função de kbba ˆ,,ˆ,ˆ 2 , usa-se as

regras de determinação de valores mínimos de funções diferenciáveis de

várias variáveis. Ou seja, acha-se as derivadas parciais da função, iguala-se

estas a zero e resolve-se o sistema resultante. Assim, encontra-se o

estimador de mínimos quadrados ordinários (EMQO):

YXXXb 1)(ˆ

Onde:

k

k

b

b

a

b

ˆ

ˆ

ˆ

ˆ 2

1

kkn

k

k

kn

XX

XX

XX

X

2

222

121

1

1

1

n

n

Y

Y

Y

ˆ

ˆ

ˆ1

1

Exemplo: Vendas trimestrais de automóveis nos EUA (1959.I-1988.I).

MGD: ttttt CPIbRbYPbbS 4321

onde:

S = consumo pessoal de automóveis novos em US$ bilhões;

YP = renda pessoal em US$ bilhões;

R = taxa de juros trimestral (de título do Tesouro Americano);

CPI = índice de preços ao consumidor para novos carros (1983=100)

Modelo Empírico: tttt CPIRYPS 654,0586,10391,07,35ˆ

20

2.6 PROPRIEDADES DO EMQO

Dadas as hipóteses 1–4, o EMQO é o melhor estimador linear não

enviesado (MELNE ou BLUE em inglês) para os parâmetros a, b2,

..., bk.

Se valer também a hipótese 5, o EMQO é o melhor estimador

existente (dentre os lineares e os não lineares) para os parâmetros a,

b2, ..., bk.

Dadas as hipóteses 1–4, o EMQO é também um estimador

consistente para os parâmetros a, b2, ..., bk.

2.6 QUALIDADE DO AJUSTAMENTO

Como avaliar se o modelo está aderindo bem aos dados ou não?

Estatísticas descritivas: 2R , 2R , Critério de Informação de Akaike (AIC)

e Critério de Schwarz (SC)

2

R (Já vimos)

n

i

i

n

i

i

YY

YY

R

1

2

1

2

2

)(

)ˆ(

ou

n

i

i

n

i

i

YY

R

1

2

1

2

2

)(

ˆ

1

Propriedades

]1,0[2 R ;

Bom ajustamento 12 R ; Fraco ajustamento 02 R ;

2R tende a aumentar sempre com novas variáveis explicativas;

2R nunca diminui com novas variáveis explicativas

2

R ou 2

R - ajustado

Corrige limitação do grau de ajustamento 2R

)(

)1(

)(

ˆ

1

1

2

1

2

2

kn

n

YY

Rn

i

i

n

i

i

21

Propriedades

22 RR se k = 1;

22 RR se k > 1;

2R pode diminuir se incluo variáveis pouco explicativas;

2R pode ser negativo;

Critério de Informação de Akaike – AIC

n

k

nAIC

n

i

i2

ˆ

log 1

2

Propriedades

AIC ;

Quanto menor AIC, melhor o ajustamento;

AIC penaliza bem mais que o 2R a presença de variáveis

irrelevantes;

AIC valoriza mais a parcimônia.

Critério de Schwarz – SC

n

nk

nSC

n

i

ilog

ˆ

log 1

2

Propriedades

SC ;

Quanto menor SC, melhor o ajustamento;

SC penaliza bem mais que o 2R a presença de variáveis irrelevantes;

SC também valoriza mais a parcimônia do que o AIC, penalizando

mais ainda o número de parâmetros/variáveis no modelo.

2.5 VARIÂNCIA RESIDUAL

Conceito: Estimador de 2

22

kNS

N

i

1

2

2

Importância: Cálculo dos erros padrão dos estimadores de MQO

))ˆ((2ˆ bVarEstS

jb

))ˆ((2

ˆ aVarEstSa

Erros-padrão:

2ˆˆ

jj bbSS

e 2

ˆˆ aa SS

Obs: Em regressão múltipla, o cálculo dos erros padrão é mais

complexo através da álgebra elementar, e cada vez mais quanto maior o

valor de k. A solução na prática é o seu cálculo via álgebra matricial.

3.3 INTERVALO DE CONFIANÇA DE kbba ,,, 2

Conceito: Medida de Incerteza

jbL ˆ

jbU ˆ (j = 2,...,k)

aL ˆ aU ˆ

Critério:

1)Pr(

1)Pr(

ˆˆ

ˆˆ

aa

bb

UaL

UbLjj

Solução

jj bknjbStbL ˆ,2/1ˆ

ˆ

jj bknjbStbU ˆ,2/1ˆ

ˆ

N

i

i

b

x

SS

j

1

2

2

ˆ

akna StaL ˆ,2/1ˆˆ

akna StaU ˆ,2/1ˆˆ

N

i

i

a

x

X

NS

1

2

ˆ

1

23

Exemplo: Consumo Anual Brasil 1960-2004

MGD: ttttt NEbIbGRbYbbCO 54321

Saída (Compactada) do Eviews Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45

Variable Coefficient Std. Error

Constante 23372214 9915664. Y 0.836903 0.031319

GR -0.789323 0.067470 I -0.737619 0.119547

NE -0.764959 0.105569

R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252

Nota: Dados anuais referentes ao Brasil; CO = consumo das famílias; Y = renda disponível das famílias; GR = gastos do governo; I = investimento direto; NE = Exportações líquidas

Observações

A coluna correspondente a “Std. Error” refere-se a:

1

ˆ bk

bSdiags

O modelo empírico é dado por:

tttt NEIGRYCO 765,0738,0789,0837,0214.372.23

24

3.4 TESTES DE HIPÓTESES PARA a E b

Testes Típicos do Modelo de Regressão Simples

Significância do componente autônomo

H0: a = 0 (componente autônomo é nulo)

H1: a 0 (componente autônomo não é nulo)

Significância da variável explicativa Xj

H0: bj = 0 (variações em Xj não explicam variações em Y)

H0: bj 0 (variações em Xj explicam variações em Y)

Implementação

Teste de significância do componente autônomo

1. Enunciado: H0: a = 0; H1: a 0

2. Escolha do nível de significância

3. Cálculo da estatística de teste: kn

a

a tS

at ~

ˆ

ˆ

ˆ

4. Aplicar Regra de Decisão:

a. tC = t/2,n-k

b. Se CaC ttt ˆ , não rejeita-se H0

c. Se CaCa tttt ˆˆ ou , rejeita-se H0

d. Aplicação da regra de decisão pelo valor de prova (p-

value):

Se ) || ( ˆjbkn tTP Não rejeito H0;

Se ) || ( ˆjbkn tTP Rejeito H0;

Teste de significância da variável explicativa Xj

1. Enunciado: H0: bj = 0; H1: bj 0 (j = 2,...,k)

2. Escolha do nível de significância

25

3. Cálculo da estatística de teste: kn

b

j

bt

S

bt

j

j ~

ˆ

ˆ

ˆ

4. Aplicar Regra de Decisão:

a. tC = t/2,n-k

b. Se CbC ttt ˆ , não rejeita-se H0

c. Se CbCbtttt ˆˆ ou , rejeita-se H0

d. Aplicação da regra de decisão pelo valor de prova (p-

value):

Se ) || ( ˆjbkn tTP Não rejeito H0;

Se ) || ( ˆjbkn tTP Rejeito H0;

Exemplo: Consumo Anual Brasil 1960-2004

MGD: ttttt NEbIbGRbYbbCO 54321

Saída (Compactada) do EViews

Dependent Variable: CO

Method: Least Squares

Date: 06/24/05 Time: 11:01

Sample: 1960 2004

Included observations: 45

Variable Coefficient Std. Error t-Statistic Prob.

C 23372214 9915664. 2.357100 0.0234

Y 0.836903 0.031319 26.72190 0.0000

GR -0.789323 0.067470 -11.69886 0.0000

I -0.737619 0.119547 -6.170097 0.0000

NE -0.764959 0.105569 -7.246070 0.0000

R-squared 0.994985 Mean dependent var 8.19E+08

Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08

S.E. of regression 24391210 Akaike info criterion 36.96178

Sum squared resid 2.38E+16 Schwarz criterion 37.16252

26

3.5 TESTE F (SIGNIFICÂNCIA GERAL DA REGRESSÃO)

H0: 032 kbbb (nenhuma Xj explica variações em Y);

H1: pelo menos um 0jb (pelo menos uma Xj explica variações em

Y);

j = 2...,k-1;

Escolha do Nível de Significância :

Estatística de teste:

knk

n

i

i

n

i

i

n

i

i

FS

y

kn

kYY

F

,12

1

2

1

2

1

2

~

ˆ

)(ˆ

)1()ˆ(

Observe que:

)/(

)1/(

knExplicadaNãoVariação

kExplicadaVariaçãoF

Regra de decisão pelo valor de prova:

Se )( ,1 FFP knk Não rejeito H0;

Se )( ,1 FFP knk Rejeito H0;

Exemplo: Consumo Anual Brasil 19602004 Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45

Variable Coefficient Std. Error t-Statistic Prob.

C 23372214 9915664. 2.357100 0.0234 Y 0.836903 0.031319 26.72190 0.0000

GR -0.789323 0.067470 -11.69886 0.0000 I -0.737619 0.119547 -6.170097 0.0000

NE -0.764959 0.105569 -7.246070 0.0000

R-squared 0.994985 Mean dependent var 8.19E+08 Adjusted R-squared 0.994483 S.D. dependent var 3.28E+08 S.E. of regression 24391210 Akaike info criterion 36.96178 Sum squared resid 2.38E+16 Schwarz criterion 37.16252 F-statistic 1983.966 Prob(F-statistic) 0.000000

27

2.13 MULTICOLINEARIDADE

Modelo com 1 var. dependente e 2 vars. independentes:

iiii XbXbbY 33221

É fácil verificar que o EMQO neste caso seria:

2

32

2

3

2

2

323

2

32

2)())((

))(()(ˆ

iiii

iiiiiii

xxxx

xxyxxyxb

2

32

2

3

2

2

322

2

23

3)())((

))(()(ˆ

iiii

iiiiiii

xxxx

xxyxxyxb

33221ˆˆˆ XbXbYb

Colinearidade Perfeita

Coeficiente de correlação linear entre X2 e X3:

112

3

2

2

32

23

ii

ii

xx

xxr

Se 32 XX , com 0 (violação da hipótese 2):

o Os numeradores de 2b e 3b são iguais a 0;

o 12

23 r 0)())(( 2

32

2

3

2

2 iiii xxxx

Logo, com 00ˆˆ32 bb , é impossível computar os EMQO 321

ˆ,ˆ,ˆ bbb .

28

Alta mas não perfeita colinearidade

É possível computar EMQO, pois hip. 2 não é violada;

Sejam as variâncias estimadas dos EMQO, (obtidas como os 2

últimos elementos da diagonal principal de 122ˆ )( XXSSb

):

)1( 2

232

22ˆ2 rx

SS

ib

)1( 2

233

22ˆ3 rx

SS

ib

Seja 12

23 r , mas considere que:

12

23 r 2b

S e 3b

S

Logo:

12

23 r 02

ˆ b

t e 03

ˆ b

t

Conseqüências da Multicolinearidade

Estatísticas t podem ficar artificialmente muito baixas;

Inclusive, é possível acontecer 12 R com 02

ˆ b

t e 03

ˆ b

t , o que é

contraditório;

Soluções Alternativas

Retira-se uma das variáveis do modelo;

Trabalha-se com variáveis em diferenças:

o Exemplo:

Modelo de interesse: tttt WbYbbC 321

Se Yt e Wt muito correlacionadas, usa-se: )()()( 113121 tttttttt WWbYYbCC

29

3.4 TESTE F PARA SIGNIFICÂNCIA DE BLOCOS DE VARIÁVEIS

Considere o MGD: iiiiii XbXbXbXbbY 554433221 ;

Teste de Hipótese:

o H0: 054 bb (X4 e X5 não são significativas);

o H1: 04 b e/ou 05 b (X4 e/ou X5 é/são significativa(s));

Definições:

o Modelo irrestrito (IR): iiiiii XbXbXbXbbY 554433221

o Modelo restrito(R): iiii XbXbbY 33221

o SQT = Soma dos Quadrados Totais = yyYYi

2)( ;

o SQE = Soma dos Quadrados Explicados: yyYYiˆˆ)ˆ( 2 ;

o SQR = Soma dos Quadrados dos Resíduos: ˆˆˆ 2

i ;

Estatística de Teste:

IRRIR knkk

IRIR

RIRRIR FknSQR

kkSQESQEF

,~

)(

)/()(

Regra de decisão pelo valor de prova:

o Dado uma escolha de :

Se )( , FFPIRRIR knkk Não rejeito H0;

Se )( , FFPIRRIR knkk Rejeito H0;

30

Exemplo: Modelo consumo vs renda e tendência quadrática

MGD: 2

4321 tbtbYbbC tt

H0: ;043 bb (termo de tendência não é significativo)

H1: 03 b e/ou 04 b (termo de tendência é significativo)

Implementação do teste com = 5%;

Usando-se n = 15 observações anuais, estimou-se:

Modelo irrestrito: 2

)43,1()59,1()35,6()56,16(

32,01,177,01,2ˆ ttYC tt

o 10,965.65IRSQE ;

o 17,77IRSQR ;

o 4IRk ;

Modelo restrito: tt YC)49,7()31,17(

77,03,2ˆ

o 24,898.65RSQE ;

o 2Rk

765,4)415(17,77

)24/()24,6589810,65965(

F

0323,0)765,4( 11,2 FP Rejeitamos H0 a 5% de significância

31

3.5 VARIÁVEIS DUMMY

Variáveis qualitativas: que refletem estado, situação, classe, etc., ou

seja, eventos qualitativos que não podem ser medidos

numericamente;

Variável dummy: variável binária (assume valor 0 ou 1) usada para

representar, num modelo quantitativo/matemático como o MGD, as

influências de eventos qualitativos;

Variáveis dummy podem ser usadas no papel de dependente ou

independente num modelo econométrico. Veremos por ora só o

caso de variáveis dummy independentes;

Regressão com uma variável dummy

MGD: iii DbbY 21

Yi é uma variável quantitativa;

Di é uma variável dummy (qualitativa) que assume só valores 0 ou 1;

Exemplo: Estudo americano em escola secundária

n = 20 professores pesquisados;

Yi = renda do iésimo professor;

Di = sexo do iésimo professor (1 homem; 0 mulher);

Interpretação do MGD:

1)0|( bDYE ii é o salário médio/esperado de uma professora;

21)1|( bbDYE ii é o salário médio/esperado de um professor;

Modelo empírico: ii DY)7,2()15.3(

5,12,21ˆ

2,21ˆ)0(|ˆ1 bDY ii ;

7,225,12,21ˆˆ)1(|ˆ21 bbDY ii ;

Hipótese de interesse: H0: 02 b (não há discriminação sexual);

32

Regressão com duas variáveis dummy

MGD: iRiSii DbDbbY 321

Exemplo: Estudo americano em escola secundária (continuação)

n = 20 professores pesquisados;

Yi = renda do iésimo professor;

DSi = sexo do iésimo professor (1 homem; 0 mulher);

DRi = raça do iésimo professor (1 branco(a) ; 0 negro(a));

Sexo\Raça Branco (B) Negro (N)

Homem (H) DS = DR = 1 DS=1, DR = 0

Mulher(M) DS = 0, DR = 1 DS = DR =0

Interpretação do MGD:

o 1)0|( bDDYE RiSii : sal. médio/esperado da M.N.;

o 21)0,1|( bbDDYE RiSii : sal. médio/esperado do H.N.;

o 31)1,0|( bbDDYE RiSii : sal. médio/esperado de uma M.B.;

o 321)1|( bbbDDYE RiSii : sal. médio/esperado do H.B.;

Modelo empírico: RiSii DDY)01,1()14,3()74,3(

74,003,12,19ˆ

o 2,19)0(|ˆ RiSii DDY ;

o 23,2003,12,19)0,1(|ˆ RiSii DDY ;

o 94,1974,02,19)1,0(|ˆ RiSii DDY ;

o 97,2074,003,12,19)1(|ˆ RiSii DDY ;

Nota: a rigor, não se somaria o coeficiente estimado 74,0ˆ3 b porque ele se não

mostrou diferente de zero a 5% de significância. Apenas para fins ilustrativos é que

o incluímos;

Hipóteses de interesse:

o H0: 02 b (não há discriminação sexual);

o H0: 03 b (não há discriminação racial);

o H0: 032 bb (não há discriminação de qualquer tipo);

33

Regressão com 1 variável dummy e 1 variável quantitativa

MGD: iiii XbDbbY 321

Exemplo: Estudo americano em escola secundária (continuação)

n = 20 professores pesquisados;

Yi = renda do iésimo professor;

Di = sexo do iésimo professor (1 homem; 0 mulher);

Xi = número de anos de serviço do i-ésimo professor.

Interpretação do MGD:

o iiii XbbXDYE 31),0|( : salário médio/esperado da

professora como função do número de anos de serviço.;

o iiii XbbbXDYE 321 )(),1|( : salário médio/esperado do

professor como função do número de anos de serviço;

Modelo empírico: iii XDY)15,3()77,2()19,3(

53,012,15,19ˆ

o iiii XXDY 53,05,19),0(|ˆ ;

o iiii XXDY 53,067,20),1(|ˆ ;

Hipótese de interesse:

o H0: 02 b (não há diferença, entre homens e mulheres, na

relação entre salário recebido e anos de serviço );

34

Variáveis dummy sazonais

MGD1: ttssttt DbDbDbaY ,112211

1,...,1 outro

0

1

sjjt

D jt

s = comprimento do período sazonal:

s = 2 (semestral) s = 6 (bimestral)

s = 3 (quadrimestral) s = 12 (mensal)

s = 4 (trimestral)

bj = fator sazonal do jésimo mês, bimestre, etc. (j = 1,...,s1);

usase só s-1 dummies p/evitar colinearidade perfeita c/a constante;

Exemplo: Sazonalidade trimestral (s=4); MGD: XbY , ]1[ DX n .

MGD: tj jtjt DbaY

3

1

0 0 0

1 0 0

0 1 0

0 0 1

0 0 0

1 0 0

0 1 0

0 0 1

321

D

DDD

35

Notas

1. Prova do resultado

2

2)ˆ,ˆ(

ix

XbaCov

Por definição: )ˆ)(ˆ()ˆ,ˆ( bbaaEbaCov .

Notar que

n

i

i

n

i

ii

x

x

XXbbaa

1

2

1)ˆ(ˆ. Então:

2

1

2

2

1

2

12

1

2

1

2

1 1

2

1

2

1

1

2

1 1

2

1

2

1

1

2

11

2

1

2

1

1

2

1

2

1

2

1

1

2

1

1

2

1

)(

)ˆ,ˆ(

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

n

s

sii

n

i

i

n

i

ii

n

i

i

n

i

n

s

sii

n

i

i

n

i

ii

n

i

i

n

s

s

n

i

ii

n

i

i

n

i

ii

n

i

i

n

i

ii

n

i

i

n

i

ii

n

i

i

n

i

ii

n

i

i

n

i

ii

x

X

xn

x

x

X

xn

Ex

x

x

EX

xn

x

x

x

XE

xn

x

x

x

XE

x

x

x

x

XE

x

x

x

x

XEbaCov

Os 3 últimos passos seguem do fato que:

0)( siE para i s;

2)( siE para i = s

01

n

i

ix .