minicurso introdução à econometria...

77
Minicurso Introdução à Econometria Espacial Prof. Gervásio F. Santos & Daniela Lima Ramos Salvador, 14 de julho de 2014

Upload: dotuong

Post on 15-Nov-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

Minicurso

Introdução à Econometria Espacial

Prof. Gervásio F. Santos & Daniela Lima Ramos

Salvador, 14 de julho de 2014

Estrutura do Curso

• Informação espacializada e padrões espaciais

• O impulso teórico e a Nova Geografia Econômica

• As bases da Econometria Espacial?

• Sistema de Informações Geográficas (SIG)

• Análise Exploratória de Dados Espaciais

• Modelos Econométricos Espaciais

Informação espacializada e padrões espaciais

Saldo comercial industrial por Município - 2000

Crime no estado da Bahia

Fonte: Mapa da Violência, 2012

Existe um padrão espacial de ocorrência de homicídios no estado Bahia?

Retorno local à educação e habilidads no Brasil

Retornos da Educação nas Regioes Metropolitanas

Existe um padrão espacial de atração dos mais habilidosos no Brasil?

Fonte: Dissertação de Mestrado: Distribuição Espacial dos Efeitos dos Ganhos de Aglomeração

Sobre os Retornos à Educação no Brasil. Autora: Diana L. Gonzaga (2012)

Retornos da Educação, excluindo habilidades individais, nas Regioes Metropolitanas

Distribuição espacial da população de Salvadorpor cor/raça em 2010

Existe um padrão espacial de distribuição da população de Salvador por cor/raça?

Fonte: Censo 2010

As bases da Econometria Espacial?

Desenvolvimento Recente

• Os impulsos técnicos e teóricos em economia estão possibilitando que a interação entre agentes ou unidades espaciais possa ser medida

• Violações de pressupostos e aproximações entre diferentes abordagens teóricas em economia exigem cada vez mais das técnicas econométricas

• Teoria econômica: modelos sobre interação espacial, contágio, efeito spillover, externalidades, imitação, etc.

• Profusão de dados georreferenciados (GIS)

• Capacidade computacional

.. em busca do “espaço” na economia

• Von Thunen (1826): Modelo de uso da terra (a cidade isolada e abastecida porfazendeiros…custos de tranporte..

• Weber (1909) com o Triângulo de Localização e Hoteling (1926) com a análise dadistribuiçao geográfica de recursos naturais focalizam nas decisões estratégicas de localizaçao das empresas

• Alonso (1964): Resgata o modelo de Von Thunen substituindo fazendeiros portrabalhadores em seu caminho até o trabalho, e a cidade isolada por uma regiao comercialcentral….

• Hoover (1948): Associa o conceito de economias externas de Marshal à realidade daconcentraçao espacial

• Mills (1967): e Henderson (1974): introduz um modelo da economia como um sistemaurbano (coleção de cidades)

…..A modelagem da geografia econômica progrediu ao longo de dois caminhosindependentes. A Economia Urbana progrediu como parte da economia convencional, com uma modelagem meticulosa, mas negligenciou a explicação da formaçao das cidadese a relaçao espacial uma com a outra. … Proveniente da tradiçao Alemã, através dos seminários de Walter Isard (1956), a Ciência Regional, procurou desenvolver modelosvaliosos para planejamento (práticos), porém, pouco reconhecidos teoricamente entre oseconomistas por serem “descuidados” e vagos em relaçao às estruturas de mercado

A Nova Geografia Econômica e a Economia Espacial

• Dixit, A. and Stiglitz, J. (1977). Monopolistic competition and optimum product diversity. American Economic Review, 67, 297–308.

• Krugman, P. (1979) 'Increasing returns, monopolistic competition, and international trade'. Journal of International Economics 9, pp. 469–79. (NTT)

• Krugman, P. (1980) 'Scale economies, product differentiation, and the pattern of trade'. American Economic Review 70, pp. 950–59. (NTT)

• Krugman, P. (1991). Increasing returns and economic geography. Journal of Political Economy, 99, 484–99.

(NEG e o Modelo Centro-Periferia) - “O efeito do mercado doméstico” que Krugman descobriuna Nova Teoria do Comércio foi utilizado para a Nova Geografia Econômica , que explicaaglomercação como resultado da interação e retornos crescentes , custos de comércio e diferenciais de preços dos fatores”.

• (1995) 'Globalization and the inequality of nations,' (with Anthony J. Venables). Quarterly Journal of Economics 110, pp. 857–880.

• Krugman, P (1998). Space: the final frontier. Journal of Economic Perspective, v. 12, n. 2 p. 161-174.

• Fujita, M., Krugman, P. and Venables, A. (1999). The Spatial Economy: Cities, Regions, and International Trade. Cambridge, MA: MIT Press.

Qual é o perfil dos economistas que trabalham com economia espacial?

• São economistas que em geral reconhecem que não estão “sozinhos no planeta”......

..... Trabalhar com modelos sobre interação espacial, contágio, efeito spillover, externalidades, imitação e

outros, geralmente requer contato com abordagens teóricas diferentes e profissionais de outras áreas...

Referências Básicas

• Anselin, L. 1988. Spatial Econometrics: Methods and Models, (Dorddrecht: Kluwer Academic Publishers).

• Le Sage J. (1999). Spatial Econometrics. Department of Economics University of Toledo. (http://www.rri.wvu.edu/WebBook/LeSage/spatial/wbook.pdf)

• Almeida, E. S. (2012) Econometria Espacial Aplicada. Campinas, SP, Editora Alínea.

Por que Econometria Espacial?

Existência de Diferenças

• Poder existir padrões de interação socioeconômica entre os agentes num sistema (rico -> pobre!?)

• Pode existir características estruturais do sistema (...semiárido baiano!?)

Natureza multidirecional do padrão de interação produz efeitos espaciais

• Violação de pressupostos vitais do modelo clássico de regressão linear ...(variância não exógena de

regressores)

Econometria Espacial

A distinção entre econometria espacial e a econometria tradicional decorre do fato de que quandoos dados possuem um componente locacional doisproblemas surgem:

•Dependência espacial entre as observações

•A heterogeneidade espacial ocorre nosrelacionaments que estão sendo modelados

Heterogeneidade Espacial

• Refere-se à variação no relacionamento entre as variáveis no espaço

• Diz respeito a aspectos da estrutura socioeconômica no espaço

...... a instabilidade estrutural (heterogeneidade nos coeficientes β) implicaria em ter que uma estimativa do parâmetro para cada ponto no espaço

Heterogeneidade Espacial

....implicações para os modelos econométricos e procedimentos de estimação tradicionais (linear – MQO)

•Coeficientes variáveis (instabilidade estrutural)

•Variância não constante (heterocedasticidade)

•Formas funcionais diferentes para determinados subconjuntos de dados

.... novos desafios para a Teoria Econométrica

Dependência Espacial

• Em uma coleção de dados amostrais, a dependênciaespacial refere-se ao fato de que uma observaçãoassociada à localização i, depende de outrasobservações nas localizações j≠ i

yi = f(yj), i = 1,…, n j ≠ i

Autocorrelação Espacial: fundamento básico

• Por que esperar que uma amostra de dados em um ponto no espaço seja dependente de valoresobservados em outras localizações?

... erros de medida para observações em lugares contíguos podem causar dependência no espaço, uma vez que os limites administrativos da coleta de dados pode não refletir a natureza do processo gerador de dados ... ex.: taxas de desemprego superestimadas, quando trabalhadores podem se deslocar para áreas vizinhas,

... existe uma variedade de padrões de interação social difusão de tecnologia ou conhecimento... Imitação e outros

Sistema de Informações Geográficas (SIG)

Sistema de Informações Geográficas (SIG)

� Precisamos utilizar o SIG quando queremos:

• Informação sobre locais na superfície da Terra

• Conhecimento sobre onde alguma coisa se localiza

• Conhecimento sobre o que está em uma dada localização

� O SIG é um tipo de sistema de informações

� ... estabelecer a localização de um objeto requer que seja definida sua posição relativa a outro objeto ou a um sistema de coordenadas

Dados espaciais

• Ao trabalhar com econometria espacial precisamos utilizar dados geograficamente referenciados

• Utiliza-se arquivos GIS, em que os dados tem sua posição definida em relação à superfície da terra

• É necessária a utilização de um arquivo shapefile

Shapefile

� Refere-se ao arquivo com as informações que queremos trabalhar

� Onde podem ser obtidos?• Internet: IBGE, INPE, etc• Criado utilizando um software GIS (ArcGIS,

QuantumGIS, etc

Arquivos que compõem um shapefile

• .shp: Armazena a geometria das entidades, ou seja, ponto, linha ou polígono (área do município de Feira de Santana) - Arquivo dos vetores

• .dbf: Contém a informação descritiva das entidades. Arquivo de banco de dados

• .shx: Armazena as ligações entre as entidades e a sua geometria. Arquivo de índices

• .sbn/.sbx: Realizam as ligações entre as entidades vetoriais e a sua informação descritiva. Podem não existir caso não tinha sido feita uma operação de análise espacial

• .prj: Definição do sistema de projeção cartográfica. Existente quando o shapefile possuir um sistema de coordenadas associado

• .ain/.aih: Somente existem quando se procedem a operações de joining (concatenação) de banco de dados.

Geometrias

• Pontos: ex.: escolas, domicílios, árvores (pela duas coordenadas)

• Linhas: ex.: ruas, estradas, rios, etc

• Polígonos: ex.: bairros, estados, países

Geometrias do Bairro Centro de Salvador

• Pontos

• Linhas

• Polígonos

Softwares

• ArcGis

• QuantumGIS

• SpaceStat

• OpenGeoda

• IpeaGeo

https://geodacenter.asu.edu/

Diretório: Área de Trabalho/Minicurso/Material Econometria Espacial

Shape Bahia

Ir no Excel e abrir o arquivo DBF

O código dos municípios (COD_IBGE) e o ID são as informações relevantes. O restante são as variáveis socioeconômicas de cada município. O ID faz a comunicação entre o arquivo DBF e os demais. A ordem dos polígonos não pode ser alterada.

Abrir o Geoda

Abrir o arquivo .SHP (com a Geometria das entidades (no caso, os polígonos dos municípios

Ver os menus do Geoda. Em Maps, fazer mapa de desvio padrão da variável PIB2010

Abrir a tabela de dados

Fazer um cartograma

Exploratória de Dados Espaciais (AEDE)

Análise Exploratória de Dados Espaciais (AEDE)

• Discutir, sistematicamente, a distribuição espacial dos valores assumidos por uma dada variável (buscar padrões)

• Investigar a correspondência entre valores de uma variável e a localização da unidade regional que os apresenta

Fonte: SEI

AEDE

Base de Análise

•Relações de coincidência entre valores semelhantes e pontos semelhantes do espaço

•Incorporar a noção de vizinhança e contigüidade através de matrizes de pesos espaciais

Conceitos técnicos e estatísticos importantes

•Pesos espaciais

•Defasagem espacial

•Autocorrelação espacial

Matriz de Pesos Espaciais – W

• W representa uma certa estrutura espacial na qual uma determinada interação socioeconômica entre os agentes ocorre

• Tipos de W:

– Binária;

– Distância inversa;

– Econômica (fluxos de comércio, fluxos migratórios, etc.)

Matriz de Pesos Espaciais – W

• Matriz binária:

• Matriz de “zeros” e “uns”

• A unidade i é vizinha da unidade j se a célula aij da matriz de pesos espaciais apresentar valor 1

• Matriz normalizada – soma de cada linha é unitária

• Matrizes: rook, queen, bishop, k-nearest...

BA PE AL SE CE RN PI MA PB

BA 1 0 1 0 0 0 0 0

PE 1 1 1 0 0 0 0 0

AL 0 1 1

SE 1 1 1 0 0 0 0

CE 0 0 0 0 1 1 1 0

RN …

PI …

MA …

PB …

Matriz Binária

Matriz de pesos W

BA PE AL SE CE RN PI MA PB

BA 0 1 0 1 0 0 0 0 0 2

PE 1 0 1 1 0 0 0 0 0 3

AL 0 1 0 1 0 0 0 0 0 2

SE 1 1 1 0 0 0 0 0 0 3

CE 0 0 0 0 0 1 1 1 0 3

RN 0 0 0 0 1 0 1 0 1 3

PI 0 0 0 0 1 1 0 1 0 3

MA 0 0 0 0 1 0 1 0 0 2

PB 0 1 1 0 0 0 0 0 0 2

BA PE AL SE CE RN PI MA PB

BA 0 0.5 0 0.5 0 0 0 0 0 1

PE 0.3333 0 0.3333 0.3333 0 0 0 0 0 1

AL 0 0.5 0 0.5 0 0 0 0 0 1

SE 0.3333 0.3333 0.3333 0 0 0 0 0 0 1

CE 0 0 0 0 0 0.3333 0.3333 0.3333 0 1

RN 0 0 0 0 0.3333 0 0.3333 0 0.3333 1

PI 0 0 0 0 0.3333 0.3333 0 0.3333 0 1

MA 0 0 0 0 0.5 0 0.5 0 0 1

PB 0 0.5 0.5 0 0 0 0 0 0 1

W=

Matriz de Pesos Espaciais – W

• Matriz binária:

• Rook: somente fronteiras em comum com extensões não-nulas são consideradas

• Queen: fronteiras em comum com extensões não-nulas e nós comuns

• Bishop: somente nós comuns são considerados

Esquema explicativo dos conceitos de vizinhança Rook e Queen

RookRook QueenQueen

Matriz de Distância

BA PE AL SE CE RN PI MA PB

BA 0 150 250 100 350 300 350 400 280

PE 150 0 50 50 200 250 200 250 130

AL 250 50 0 50 200 100 100 250 100

SE 100 50 50 0 250 150 200 300 100

CE 350 200 200 250 0 150 100 200 100

RN 300 250 100 150 150 0 100 150 100

PI 350 200 100 200 100 100 0 150 150

MA 400 250 250 300 200 150 150 0 200

PB 280 130 100 100 100 100 150 200 0

BA PE AL SE CE RN PI MA PB

BA 0 0,007 0,004 0,01 0,003 0,003 0,003 0,003 0,004

PE 0,0067 0 0,02 0,02 0,005 0,004 0,005 0,004 0,008

AL 0,004 0,02 0 0,02 0,005 0,01 0,01 0,004 0,01

SE 0,01 0,02 0,02 0 0,004 0,007 0,005 0,003 0,01

CE 0,0029 0,005 0,005 0,004 0 0,007 0,01 0,005 0,01

RN 0,0033 0,004 0,01 0,007 0,007 0 0,01 0,007 0,01

PI 0,0029 0,005 0,01 0,005 0,01 0,01 0 0,007 0,007

MA 0,0025 0,004 0,004 0,003 0,005 0,007 0,007 0 0,005

PB 0,0036 0,008 0,01 0,01 0,01 0,01 0,007 0,005 0

distância inversa

BA PE AL SE CE RN PI MA PB

BA 0 200 300… …. … …. … ….

PE 200 0 545

AL 300 545 0

SE ..

CE …

RN …

PI …

MA

PB

Matriz de Comércio (transações em R$ ou toneladas)

Escolha da Matriz

• A escolha é mais “subjetiva” do que técnica

• Depende da teoria/definição sobre quem são os vizinhos relevantes

• Exemplo: fenômeno em que se espera que a estrutura espacial seja concentrada ao redor de localizações específicas – escolhe-se uma matriz em que os vizinhos sejam definidos como as localizações imediatamente adjacentes

• Se não houver, ex ante, base teórica suficiente para a escolha da matriz de pesos, pode-se criar diferentes matrizes e explorar a sensibilidade dos resultados em relação às diversas especificações

Autocorrelação Espacial

• Pode manifestar-se na variável dependente, nas variáveis explicativas ou no termo de erro– Incorporação de termos de defasagem– Wy, WX, Wu, representam o processo espacial

subjacente

Variável defasada espacialmente

BA PE AL SE CE RN PI MA PB

BA 0 0.1863 0.1118 0.2794 0.0798 0.0931 0.0798 0.0699 0.0998

PE 0.0921 0 0.2764 0.2764 0.0691 0.0553 0.0691 0.0553 0.1063

AL 0.0482 0.241 0 0.241 0.0602 0.1205 0.1205 0.0482 0.1205

SE 0.1266 0.2532 0.2532 0 0.0506 0.0844 0.0633 0.0422 0.1266

CE 0.0589 0.103 0.103 0.0824 0 0.1374 0.2061 0.103 0.2061

RN 0.0581 0.0698 0.1744 0.1163 0.1163 0 0.1744 0.1163 0.1744

PI 0.0508 0.089 0.178 0.089 0.178 0.178 0 0.1186 0.1186

MA 0.0673 0.1076 0.1076 0.0897 0.1345 0.1794 0.1794 0 0.1345

PB 0.0568 0.1222 0.1589 0.1589 0.1589 0.1589 0.1059 0.0795 0

Matriz de pesos espaciais PIB Estado PIB R$

BA 2000.00

PE 1500.00

AL 500.00

SE 300.00

CE 1000.00

RN 400.00

PI 150.00

MA 350.00

PB 250.00

0 0.1863 0.1118 0.2794 0.0798 0.0931 0.0798 0.0699 0.0998

0.0921 0 0.2764 0.2764 0.0691 0.0553 0.0691 0.0553 0.1063

0.0482 0.241 0 0.241 0.0602 0.1205 0.1205 0.0482 0.1205

0.1266 0.2532 0.2532 0 0.0506 0.0844 0.0633 0.0422 0.1266

0.0589 0.103 0.103 0.0824 0 0.1374 0.2061 0.103 0.2061

0.0581 0.0698 0.1744 0.1163 0.1163 0 0.1744 0.1163 0.1744

0.0508 0.089 0.178 0.089 0.178 0.178 0 0.1186 0.1186

0.0673 0.1076 0.1076 0.0897 0.1345 0.1794 0.1794 0 0.1345

0.0568 0.1222 0.1589 0.1589 0.1589 0.1589 0.1059 0.0795 0

*

2000.00

1500.00

500.00

300.00

1000.00

400.00

150.00

350.00

250.00

=

597.6381

552.888

703.6145

899.789

522.0314

569.7674

671.1864

643.4978

690.1484

PIB dos vizinhosponderado pela relaçãode vizinhança

Calcular um matriz de pesos espaciais no GeodaTools -> Weights -> Creates (escolher o arquivo shape)

Calcular um matriz analisar a matriz de pesos Ir em Bloco de Notas -> Abrir o arquivo DVPA_BA_2000_poligono. gal

Defasagem Espacial (Spatial Lag)

• Conceito diferente de séries de tempo• Wy: é a média de uma variável nos lugares vizinhos

(por exemplo: PIB dos vizinhos)• Exemplo:

– Gráfico de dispersão (PIB e PIB defasado espacialmente)

Criar duas variáveis defasadas espacialmenteWPIBPC2010

WN_IDHM2010•Table -> Add Variable ->WPIBPC2010•Table-> Add Variable ->WN_IDHM2010

•Table -> Variable Calculation -> Spatial Lag

Autocorrelação Espacial Global

• Gráfico de dispersão de Moran

– Plota-se em um gráfico o valor da variável contra a sua defasagem espacial

– Cada quadrante corresponde a um diferente tipo de autocorrelação espacial

– Coeficiente de autocorrelação espacial global:

• Inclinação da linha de regressão (pista!)

• Estatística I de Moran (considera desvios em relação à média)

Quadro esquemático do diagrama de dispersão de Moran

Estatística I de Moran

• Medida de autocorrelação espacial global:

• Inferência: pseudo-nível de significância– Permutações– Hipótese nula: aleatoriedade espacial

( )( )( )∑

∑∑∑∑ −

−−=

2yy

yyyyw

w

nI

i

jiij

ij

# de localidades# de localidades

Valor do atributo Valor do atributo em anem anááliselise

Peso Peso espacial espacial para para i,ji,j

Calcular o PIB per capita 2010

Table -> Add FileTable -> Field Calculation -> Bivariate

Valor observadoValor observado

Autocorrelação Espacial Local

• Análise baseada apenas nos procedimentos de Moran ignora a possibilidade de instabilidades locais no sistema global

• Caráter local dos processos espaciais

– Do global para o local

• Análise de clusters espaciais

• Indicador: LISA (local indicator of spatial analysis)

LISA

• Proporciona, para cada observação, uma indicação da existência de clusters espaciais (estatísticos) significativos, de valores similares, ao redor daquela observação

• Teste da hipótese nula de aleatoriedade local

LISA

• Relevante para identificação de clusters

espaciais locais significantes

– Autocorrelação espacial local positiva

• Diagnóstico de instabilidade local (outliers

espaciais)

– Autocorrelação espacial local negativa

LISA

• Medida de autocorrelação espacial local:

( )n

yym i

o

2−

=

( ) ( )yywm

yyI jij

o

i

i −−

= ∑j

ATENATENÇÇÃO: ÃO:

••Neste caso, somente os Neste caso, somente os

valores vizinhos a valores vizinhos a jj são são

incluincluíídosdos

••Como a soma Como a soma éé apenas em apenas em

jj, calcula, calcula--se um se um I para cada iI para cada i

LISA

• Valores positivos de Ii significam que existem clusters

espaciais com valores similares (altos ou baixos);

• Valores negativos de Ii significam que existem clusters

espaciais com valores diferentes entre a região e seus vizinhos

ClustersClusters espaciaisespaciais

OutliersOutliers espaciaisespaciais

Modelos Econométricos Espaciais

Supostos do MRLC

• S1) Relacionamento linear entre x e y

• S2) A matriz de regressores tem rank coluna pleno

(não existe relacionamento linear exato entre as

variáveis independentes)

• S3) Exogeneidade das variáveis independentes

• S4) Homocedasticidade e não-autocorrelação

• S5) No precesso gerador de dados as variáveis

explicativas (X) são fixadas em amostras repetidas

• S6) Os termos aleatórios são distribuídos normalmente

Violações dos supostos do MRLC

Dependência espacial entre as observações

• Viola o suposto S5 de que as variáveis explicativas sãofixadas em amostras repetidas e o suposto S4 de queos termos aleatórios são homocedásticos e não-autocorrelacionados

Heterogeneidade espacial

• Viola o suposto S1 de que existe um relacionamentolinear exato entre as observações de dados amostrais, pois o relacionamento varia à medida em que se move entre a amostra de dados espaciais

Modelo de Defasagem Espacial

• Autocorrelação na forma Wy

• Sugere um processo de difusão ou contágio– Difusão espacial quando um atributo é adotado por

uma população fixa– Espraiamento espacial no caso em que a própria

população espalha-se no espaço

εβρ ++= XWyy

Parâmetro da defasagem auto-regressiva

Modelo de Defasagem Espacial

• Conseqüência:– Mínimos Quadrados Ordinários (MQO) não gera

estimativas consistentes – Problema de omissão de variável relevante

Modelo de Erro Auto-regressivo Espacial

• Defasagem espacial no erro• Instrumento para detectar erros de especificação no

modelo– Ausência de variáveis explicativas– Heterocedasticidade– Variáveis não-observáveis

Modelo de Erro Auto-regressivo Espacial

• Formalmente:

Processo autoProcesso auto--regressivo regressivo

de primeira ordem: exprimede primeira ordem: exprime

uma autocorrelauma autocorrelaçção do erro maisão do erro mais

ampla, afetando todo o sistemaampla, afetando todo o sistema

(e.g. praga generalizada)(e.g. praga generalizada)

( )I

WuWuu

uXy

σε

εεγελ

β

,0~

ou +=+=

+=

Processo de mProcesso de méédiasdias

mmóóveis de primeira ordem:veis de primeira ordem:

ididééia de alcance localizadoia de alcance localizado

(e.g. polui(e.g. poluiçção de um rio)ão de um rio)

Modelo de Erro Auto-regressivo Espacial

• Conseqüência da omissão do problema no erro:• Os coeficientes estimados por MQO continuam não-

viesados, mas se tornam menos eficientes (os erros-padrão são maiores)

Defasagem nas Covariadas

• Autocorrelação pode ocorrer nas variáveis explicativas

ετβ ++= WXXy

Estratégia Básica

• Estimar modelo por MQO• Testar normalidade dos erros: Jarque-Bera• Diagnosticar dependência espacial

– Teste global: I de Moran (erro)– Testes específicos: Multiplicador de Lagrange (LM)

• Em caso de detecção de dependência espacial, re-estimar o modelo (aquele com menor p-valor nos testes LM)– Modelo de erro auto-regressivo espacial– Modelo de defasagem espacial

Resumo

• Estimação de modelos econométricos espacializados• Problemas possíveis:

– Termo de erro explicado pelo espaço– Defasagem espacial explicando os dados

• Testes para regimes espaciais (Moran, LM test, LMrobust test)

• Estimação por máxima verossimilhança