universidade federal do abc bacharelado em … · a figura 01 abaixo, ... o número n representa a...

21
UNIVERSIDADE FEDERAL DO ABC BACHARELADO EM PLANEJAMENTO TERRITORIAL TRABALHO FINAL ANÁLISE ESPACIAL DA INCIDÊNCIA DE DENGUE NO MUNICÍPIO DE SÃO PAULO João Vitor Macarini, Joyane Ferreira Silva, Nayara Oliveira e Rafael Yukio São Bernardo do Campo, 2015

Upload: vonga

Post on 13-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDADE FEDERAL DO ABC

BACHARELADO EM PLANEJAMENTO TERRITORIAL

TRABALHO FINAL

ANÁLISE ESPACIAL DA INCIDÊNCIA DE DENGUE

NO MUNICÍPIO DE SÃO PAULO

João Vitor Macarini, Joyane Ferreira Silva,

Nayara Oliveira e Rafael Yukio

São Bernardo do Campo,

2015

João Vitor Macarini, Joyane Ferreira Silva,

Nayara Oliveira e Rafael Yukio

ANÁLISE ESPACIAL DA INCIDÊNCIA DE DENGUE

NO MUNICÍPIO DE SÃO PAULO

Trabalho final da disciplina ‘Métodos e Técnicas de Análise da Informação para o Planejamento’, lecionada pela Profª Dra. Flávia Feitosa da Graduação de Planejamento Territorial, na Universidade Federal do ABC.

São Bernardo do Campo,

2015

SUMÁRIO

1. INTRODUÇÃO 2. METODOLOGIA 3. RESULTADOS E DISCUSSÃO

3.1. PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA 3.2. ANÁLISE DE REGRESSÃO CLÁSSICA 3.3. ANÁLISE DE REGRESSÃO ESPACIAL

4. CONCLUSÃO 5. REFERÊNCIAS BIBLIOGRÁFICAS

1. INTRODUÇÃO

O uso da inteligência geográfica é fundamental para a análise de informações

na área da saúde pública. A espacialização dos dados pode indicar um padrão

geográfico da doença, assim como pode a atrelar com outras variáveis no espaço.

MAGALHÃES (2012) mostra essa importância:

“O uso de técnicas de análise espacial na Saúde Pública é basilar para se compreender o perfil epidemiológico das doenças. As pesquisas quantitativas dos fenômenos que se manifestam no espaço utilizam­se da análise espacial associada a métodos estatísticos para investigar a ocorrência de correlações espaciais entre as unidades de análise, buscando identificar variáveis explicativas, como possíveis fatores de risco, objetivando compreender fenômenos relacionados à dinâmica da distribuição de doenças.” (MAGALHÃES, Gleidson)

A chamada Epidemiologia Geográfica é constituída pelo estudo dos padrões

de distribuição geográfica das doenças e suas relações com fatores socioambientais

­ desta forma, demandando uma visão territorial para a formulação de políticas

públicas. Por isso, neste trabalho, a variável dependente (doença) escolhida foi a

Dengue, com o objetivo de verificar sua estrutura espacial e identificar associações

plausíveis com as variáveis independentes (do território), como a rede de

distribuição de água, esgoto a céu aberto, renda e lixo domiciliar jogado. De acordo

com o Ministério da Saúde, a Dengue é uma:

“Doença febril aguda, que pode apresentar um amplo espectro clínico: enquanto a maioria dos pacientes se recupera após evolução clínica leve e autolimitada, uma pequena parte progride para doença grave. É a doença viral transmitida por mosquito que se espalha mais rapidamente no mundo, sendo a mais importante arbovirose que afeta o ser humano, constituindo­se em sério problema de saúde pública no mundo. Ocorre e dissemina­se especialmente nos países tropicais e subtropicais, onde as condições do meio ambiente favorecem o desenvolvimento e a proliferação do Aedes aegyptie Aedes albopictus.” (MINISTÉRIO DA SAÚDE, 2015)

Nos últimos anos, a dengue se tornou um dos principais desafios para a

saúde pública brasileira, devido ao número de casos e internações em municípios

de porte pequeno, médio e grande. Em 2015, a cidade de São Paulo bateu recorde

histórico da doença, o que configurou uma situação de epidemia (segundo a ONU) ­

e também o que a fez se tornar alvo da presente pesquisa.

2. METODOLOGIA

Diversas fontes de dados foram usadas na elaboração deste trabalho. Dentre

elas, o IBGE (total de domicílios ­ base universo do Censo 2010 ­ levantado apenas

para os domicílios particulares permanentes) e o Infocidade (informações de

incidência de Dengue a cada 100 mil habitantes, que são fornecidas pela Prefeitura

de São Paulo e coletadas pelo Instituto Adolfo Lutz de Saúde Pública). As

ferramentas utilizadas para a análise espacial da incidência foram: SPSS (cálculo

das correlações e regressão clássica), GeoDa (autocorrelação espacial), Quantum

GIS (manipulação de shapefiles e informações) e o Geographically Weighted

Regression (regressão espacial).

A partir do referencial teórico, os presentes pesquisadores elaboraram o

trabalho com dados de 2010, na escala distrital do município de São Paulo, Brasil. A

análise iniciou­se pela parte exploratória, onde foi verificada cada uma das variáveis

propostas. Após isso, foi realizada a regressão clássica, assim como a

autocorrelação espacial, que indicou que os dados estão correlacionados

espacialmente, necessitando portanto passarem por uma regressão espacial. Com

tal feito, algumas conclusões puderam ser feitas acerca das hipóteses iniciais e

alguns mapas foram gerados ­ na escala 1:200.000 ­ a partir das plotagens das

informações geradas pelo GWR.

3.1 PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA

Foram selecionados algumas variáveis que poderiam apresentar correlação

com os números de casos de dengue na cidade de São Paulo. A Figura 01 abaixo,

apresenta as variáveis selecionadas para iniciar os estudos de correlação com os

casos de dengue a cada 100 mil habitantes na cidade de São Paulo.

Figura 01: Diagramas com as variáveis selecionadas para pesquisa de correlação.

O levantamento de hipóteses fez­se necessário para que fossem iniciados as

investigações estatísticas. Os pressupostos levantados são citados a seguir:

­ As áreas de Aglomerados sub­normais são mais suscetíveis à incidência de

Dengue?;

­ A presença de esgoto a céu aberto, rede de distribuição e lixo nas ruas

contribuem para a proliferação da Dengue?;

­ As pessoas portadoras da doença estão carentes de assistência médica?;

­ Há uma correlação entre renda e a incidência de Dengue?;

­ O lixo acumulado em vias públicas ou em terrenos abandonados podem

influenciar na quantidade de casos de dengue?

Com o uso do software SPSS foram compilados as correlações da variável

dependente “Incidência de dengue 2010” com as variáveis independentes: esgoto

não ligado à rede, esgoto ligado à rede, números de Unidades Básicas de Saúde

(UBS), número de habitantes por número de UBS, lixo domiciliar jogado na rua,

renda per capita de meio à dois salários mínimos (s.m.), dois à dez s.m., dez à vinte

s.m. e número de habitantes sem rendimento. A correlação das variáveis

independentes com a dependente é dada a seguir pela Figura 02.

Figura 02: Correlação de Pearson

Observa­se que para correlação de Pearson, quanto mais próximo de 1

melhor é o modelo, os valores observados são baixos sendo que o maior número de

Pearson apresentado é de 0,312, que está relacionado com os lixos domiciliares

jogados. O número N representa a quantidade de amostras utilizadas por cada

modelo. Desse modo, foram refutados as análises das outras variáveis, sendo

aprofundado as pesquisas sobre a variável lixo domiciliar jogado. O Gráfico 01

abaixo apresenta o gráfico de dispersão das variáveis selecionadas.

Gráfico 01: Gráfico de dispersão entre os casos de dengue e o lixo domiciliar jogado.

Foram realizadas algumas correções sobre os dados da variável lixo

domiciliar jogado, objetivando uma melhor visualização dos dados nos gráficos de dispersão. Para tanto, realizou­se as transformações elevando­se a variável independente ao quadrado e extraindo­se seu exponencial. Os gráficos 02 e 03 apresentam essas transformações plotadas nos gráficos de dispersão.

3.2. ANÁLISE DE REGRESSÃO CLÁSSICA

Após a fase de análise exploratória, inicia a etapa de produção dos modelos

de regressão clássica e sua análise. Como concluído na fase anterior, a variável de

maior relevância para o trabalho é “lixo domiciliar jogado”.

O modelo construído relaciona a variável dependente “incidência de dengue”

com a variável independente “lixo domiciliar jogado”, realizada somente a regressão

simples. O R² atingido foi de 0,097, ou seja, o modelo explica aproximadamente

apenas 9% da variável dependente em relação à variável independente. O R

ajustado do modelo não apresenta muita diferença ao fazer o ajuste da introdução

da variável independente ao modelo. Em relação ao teste de Durbin­Watson, seu

resultado ideal é 2, o que significa independência dos resíduos, no caso, o resultado

alcançado foi muito satisfatório, 2,012.

A tabela ANOVA apresenta a soma dos erros ao quadrado, sendo assim, um

ponto negativo do modelo é o valor dos resíduos estar acima do valor do modelo,

isso significa que o modelo explica muito pouco, sendo a quantidade explicada pelo

modelo muito menor que a quantidade de resíduos existentes. Porém, o teste de

significância foi satisfatório, apresentando 99,8% de confiança. Quanto ao teste F, é

a variância que o modelo explica pelo que o modelo não explica, tal razão deve

obter um valor alto para ser aprovada, sendo maior que um pelo menos, no modelo

testado a razão atingiu o valor de 10,146, ou seja, passou no teste, mas não com

altos valores.

A tabela de coeficientes apresenta a equação do modelo, que é:

INCIDÊNCIA DE DENGUE = 49,691 + 45,945.LIXO ­ a cada 1% de domicílios que

deixa o lixo na rua sem coleta, gera um aumento de aproximadamente 46 casos de

dengue a cada 100 mil habitantes.

A mesma tabela apresenta o teste t, que deve ser diferente de zero para que

a hipótese nula seja refutada, no caso da regressão realizada o resultado é de

3,185, passando no teste. Os valores apresentados também encontram­se dentro

do intervalo de confianças de 95%, confirmando que seus valores são verdadeiros.

A análise das estatísticas de colinearidade não foram levadas em consideração

devido ao uso de somente uma variável para a construção do modelo.

O histograma acima é a representação da frequência dos erros, que se

aproxima da distribuição normal, apresentando a maioria dos valores próximo a zero

e a presença de um outlier maior que quatro.

O P – Plot, conforme indicado abaixo, nos mostra que os resíduos possuem

uma certa linearidade, porém os outliers influenciaram no deslocamento da reta.

Além disso, o gráfico de dispersão apresenta inconstância na variância, sendo outro

resultado que evidencia uma não perfeição do modelo.

P­Plot dos resíduos padronizados

Plot disperso dos resíduos padronizados

Índice de Moran das incidências de dengue

A partir do mapa acima, que espacializa a incidência de dengue no ano de

2010 por 100 mil habitantes através do Índice Local de Moran, pode­se observar

que existem três clusters de baixa incidência de dengue (leste, centro e sul) e um

cluster com alta incidência de dengue nos distritos e seus vizinhos. Observa­se que

o Índice Local de Moran é de 0,27, e nos clusters indicados acima, há maior

dependência espacial entre os distritos. Verificou­se através do teste de

pseudo­significância que, mesmo após 999 permutações aleatórias, o nosso valor

observado está “fora” da distribuição aleatória gerada, ou seja, podemos rejeitar a

hipótese nula de que não há auto correlação espacial.

Histograma, Teste de Pseudo­significância e Dispersão dos resíduos

Analisando a distribuição dos resíduos, verifica­se que sua distribuição se

assemelha a uma distribuição normal ­ que é a distribuição adequada ­ e, ao

verificar a dispersão dos erros, identifica­se que não há heterocedasticidade

significativa, ou seja, a variância não aumenta ou diminui de forma que prejudique o

modelo; os erros estão de certa forma distribuídos ao redor da linha de tendência,

apesar da presença dos outiliers, que desloca a reta. Com o teste de

pseudo­significância, verificou­se que mesmo após 999 permutações aleatórias, o

nosso valor observado está “fora” da distribuição aleatória gerada, ou seja, podemos

rejeitar a hipótese nula de que não há auto correlação espacial.

3.3 ANÁLISE DA REGRESSÃO ESPACIAL:

Regressão Clássica obtida pelo GWR

Através da análise da regressão clássica, o modelo obtido retornou um R²

(coeficiente de determinação) de 0,09, ou seja, isto significa que aproximadamente

9% da variável dependente (y= incidência de dengue) consegue ser explicada pela

variável independente presente no modelo, no caso, o lixo domiciliar jogado

(variável y). A estatística F é uma medida do quanto o modelo melhorou, comparado

ao nível de não precisão do modelo, ou seja, é a razão entre o modelo e seu erro.

Para que a estatística F seja boa, ela deve ter uma razão F grande, e neste caso,

ela tem um valor grande (10,1), com alta significância no nível de 0,01, ou seja,

altamente significativa. O critério de Akaike se baseia numa função de

verossimilhança, acrescida de uma penalidade associada ao numero de parâmetros

do modelo. Quanto menor ele for, melhor. Neste caso, seu valor é 1058.03. Quanto

maior o Log likelihood, melhor o ajuste do modelo. Neste caso, seu valor é ­527.017.

As variáveis têm estatística t maior que o t crítico (2,82), ou seja, podemos

rejeitar a hipótese nula, e são significativas, pois seus valores de significância estão

entre 0,01 e 0,001.

A multicolinearidade do modelo é 1.65 e, para ser adequada, deve estar o

quão mais próximo de 1 e ter limite 10, ou seja, nesse modelo a colinearidade não é

um problema.

Para o Índice de Moran, a hipótese nula é de que não há autocorrelação

espacial, porém, nesse caso, a hipótese foi rejeitada.

Spatial Lag:

Spatial Error:

A matriz de vizinhança escolhida para fazer as análises espaciais foi do tipo

queen, de grau 1, ou seja, foram considerados vizinhos os distritos que tocam

somente os distritos diretamente contíguos.

Tanto o spatial error ­ que atribui autocorrelação espacial aos erros dos

vizinhos ­ como o spatial lag ­ que atribui autocorrelação à média da variável

dependente dos vizinhos ­ melhoraram praticamente na mesma medida o modelo. O

R² que era de 0,09 passou a ser de 0,26 em ambos os modelos, ou seja, a

regressão espacial no caso da dengue em São Paulo, explica muito melhor do que

o modelo de regressão clássica. O Log Likelihood baixou um pouco, porém em

ambos os modelos seu valor foi ­519, variando apenas nos décimos. O critério de

Akaike ficou também praticamente igual nos dois modelos espaciais, e diferiram

pouco da regressão clássica, variando apenas 13 e 15 unidades. Em ambos os

modelos de regressão espacial, a significância das variáveis se mantiveram entre si,

havendo pouca variação, e em relação à regressão clássica, os níveis de

significância continuam bons e significativos. A variável "likelihood ratio test" obteve

também praticamente o mesmo valor (14) variando apenas em décimos, e possuem

satisfatório nível de significância.

Após feitas essas análises, foi feita a regressão espacial no GWR, na

tentativa de melhor resultados acerca dos que foram obtidos com o spatial lag e

spatil error, assim como a intenção de plotar mapas com as informações geradas.

Regressão Espacial obtida pelo GWR

O software Geographically Weighted Regression (GWR), que ajustou o modelo de

regressão a cada ponto observado ­ ponderando todas as demais observações

como função da distância a este ponto ­ mostrou uma melhora no R² apresentado

anteriormente, saltando de 26% para 35% no que se refere à explicação das

incidências da dengue. Além disso, mostrou também que a variável independente

(lixo domiciliar) variou bastante em sua amplitude (Range), tendo aproximadamente

um mínimo de ­5,95 e um máximo de 17,16.

Análise dos mapas plotados a partir do GWR

Após a análise feita pelo software Geographically Weighted Regression (GWR) ­

que parte de um ênfase nas diferenças (análise local) ­ foi possível ver as variações

espaciais modeladas de forma contínua, com os parâmetros variando no espaço. MAPA I ­ MAPA DO R QUADRADO LOCAL

O mapa do R quadrado local evidencia, notadamente, quais os distritos do

município de São Paulo que explicam mais a relação entre o lixo domiciliar jogado

nas ruas e as incidências de dengue no ano de 2010. Cruzando a informação com a

localização dos aglomerados subnormais ­ de acordo com o Censo 2010 ­ é notável

que os valores mais altos estão espalhados por toda capital, não importando se a

área é rural ou urbana e se possui mais habitantes de alta ou baixa renda. Porém, a

parte sul paulistana, onde há uma maior concentração de favelas, é a que explica

mais a relação entre a variável dependente e a independente ­ já a parte noroeste é

a que menos é explicada pelo modelo. É importante ressaltar que em muitos lugares

onde existem favelas, a relação entre as variáveis não apresentou significância, ou

seja, os betas podem ser iguais a zero, não podendo ser rejeitada a hipótese nula.

MAPA II ­ MAPA DOS BETAS: LIXO DOMICILIAR JOGADO

MAPA III ­ MAPA DA ESTATÍSTICA T: LIXO DOMICILIAR JOGADO

A partir dos mapas dos betas, é possível notar os locais de São Paulo que, a

cada 1% dos domicílios que deixam o lixo na rua sem coleta, geram um aumento de

aproximadamente 46% dos casos de dengue a cada 100mil habitantes. Há uma

concentração de valores mais altos na zona extremo sul da capital e valores

intermediários pelo resto do município (Centro e Zona Leste, por exemplo).

Analisando a tabela t de student, com nível de significância 0,05 (confiança

de 95%) e dois graus de liberdade, chega­se ao valor |2,92|. O mapa da estatística t

do lixo domiciliar jogado nas ruas ressalta, em vermelho, os distritos paulistas que

estão acima do valor estimado, ou seja, os betas são significantes e diferentes de

zero ­ e em azul, os que estão abaixo, explicando pouco ou praticamente nada da

relação entre lixo domiciliar e a dengue no município de São Paulo, podendo assim

ter valor zero, ou seja, são valores que não se pode rejeitar a hipótese nula.

4. CONCLUSÕES

As hipóteses que envolviam as variáveis UBS, esgoto a céu aberto, rede de

abastecimento de água e renda não foram corroboradas. A única hipótese

corroborada foi a de que o lixo domiciliar jogado possui uma relação com a

incidência de Dengue ­ e apenas em alguns distritos do município de São Paulo.

Os aglomerados subnormais não estão, como mostrado, necessariamente

localizados nos lugares que possuem maior a relação entre a incidência de Dengue

e o lixo domiciliar jogado.

5. REFERÊNCIAS BIBLIOGRÁFICAS GRUPO IG. Casos de dengue caem em São Paulo, mas situação segue epidêmica na cidade. 21 de Maio de 2015. Acessado em <http://ultimosegundo.ig.com.br/brasil/sp/2015­05­21/casos­de­dengue­caem­em­sao­paulo­mas­situacao­segue­epidemica­na­cidade.html> IBGE. Censo 2010. Acessado em 16 de junho de 2015 <http://censo2010.ibge.gov.br/> MAGALHÃES, Gledson. O Uso do geoprocessamento e da estatística nos estudos ecológicos em epidemiologia: o caso da dengue em 2008 na região metropolitana de Fortaleza. Revista Brasileira de Geografia Médica e da Saúde. 2012. MINISTÉRIO DA SAÚDE. Portal da saúde. Acessado em 10 de agosto de 2015 <http://portalsaude.saude.gov.br/index.php/o­ministerio/principal/secretarias/svs/dengue> PREFEITURA DE SÃO PAULO. Dados de incidência da dengue de 2010 por distritos. Acessado em 16 de junho de 2015 <www.prefeitura.sp.gov.br/cidade/secretarias/upload/chamadas/01­dengue_cc_ci_16_07_2014_1405629331.pdf>