universidade federal do abc bacharelado em … · a figura 01 abaixo, ... o número n representa a...
TRANSCRIPT
UNIVERSIDADE FEDERAL DO ABC
BACHARELADO EM PLANEJAMENTO TERRITORIAL
TRABALHO FINAL
ANÁLISE ESPACIAL DA INCIDÊNCIA DE DENGUE
NO MUNICÍPIO DE SÃO PAULO
João Vitor Macarini, Joyane Ferreira Silva,
Nayara Oliveira e Rafael Yukio
São Bernardo do Campo,
2015
João Vitor Macarini, Joyane Ferreira Silva,
Nayara Oliveira e Rafael Yukio
ANÁLISE ESPACIAL DA INCIDÊNCIA DE DENGUE
NO MUNICÍPIO DE SÃO PAULO
Trabalho final da disciplina ‘Métodos e Técnicas de Análise da Informação para o Planejamento’, lecionada pela Profª Dra. Flávia Feitosa da Graduação de Planejamento Territorial, na Universidade Federal do ABC.
São Bernardo do Campo,
2015
SUMÁRIO
1. INTRODUÇÃO 2. METODOLOGIA 3. RESULTADOS E DISCUSSÃO
3.1. PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA 3.2. ANÁLISE DE REGRESSÃO CLÁSSICA 3.3. ANÁLISE DE REGRESSÃO ESPACIAL
4. CONCLUSÃO 5. REFERÊNCIAS BIBLIOGRÁFICAS
1. INTRODUÇÃO
O uso da inteligência geográfica é fundamental para a análise de informações
na área da saúde pública. A espacialização dos dados pode indicar um padrão
geográfico da doença, assim como pode a atrelar com outras variáveis no espaço.
MAGALHÃES (2012) mostra essa importância:
“O uso de técnicas de análise espacial na Saúde Pública é basilar para se compreender o perfil epidemiológico das doenças. As pesquisas quantitativas dos fenômenos que se manifestam no espaço utilizamse da análise espacial associada a métodos estatísticos para investigar a ocorrência de correlações espaciais entre as unidades de análise, buscando identificar variáveis explicativas, como possíveis fatores de risco, objetivando compreender fenômenos relacionados à dinâmica da distribuição de doenças.” (MAGALHÃES, Gleidson)
A chamada Epidemiologia Geográfica é constituída pelo estudo dos padrões
de distribuição geográfica das doenças e suas relações com fatores socioambientais
desta forma, demandando uma visão territorial para a formulação de políticas
públicas. Por isso, neste trabalho, a variável dependente (doença) escolhida foi a
Dengue, com o objetivo de verificar sua estrutura espacial e identificar associações
plausíveis com as variáveis independentes (do território), como a rede de
distribuição de água, esgoto a céu aberto, renda e lixo domiciliar jogado. De acordo
com o Ministério da Saúde, a Dengue é uma:
“Doença febril aguda, que pode apresentar um amplo espectro clínico: enquanto a maioria dos pacientes se recupera após evolução clínica leve e autolimitada, uma pequena parte progride para doença grave. É a doença viral transmitida por mosquito que se espalha mais rapidamente no mundo, sendo a mais importante arbovirose que afeta o ser humano, constituindose em sério problema de saúde pública no mundo. Ocorre e disseminase especialmente nos países tropicais e subtropicais, onde as condições do meio ambiente favorecem o desenvolvimento e a proliferação do Aedes aegyptie Aedes albopictus.” (MINISTÉRIO DA SAÚDE, 2015)
Nos últimos anos, a dengue se tornou um dos principais desafios para a
saúde pública brasileira, devido ao número de casos e internações em municípios
de porte pequeno, médio e grande. Em 2015, a cidade de São Paulo bateu recorde
histórico da doença, o que configurou uma situação de epidemia (segundo a ONU)
e também o que a fez se tornar alvo da presente pesquisa.
2. METODOLOGIA
Diversas fontes de dados foram usadas na elaboração deste trabalho. Dentre
elas, o IBGE (total de domicílios base universo do Censo 2010 levantado apenas
para os domicílios particulares permanentes) e o Infocidade (informações de
incidência de Dengue a cada 100 mil habitantes, que são fornecidas pela Prefeitura
de São Paulo e coletadas pelo Instituto Adolfo Lutz de Saúde Pública). As
ferramentas utilizadas para a análise espacial da incidência foram: SPSS (cálculo
das correlações e regressão clássica), GeoDa (autocorrelação espacial), Quantum
GIS (manipulação de shapefiles e informações) e o Geographically Weighted
Regression (regressão espacial).
A partir do referencial teórico, os presentes pesquisadores elaboraram o
trabalho com dados de 2010, na escala distrital do município de São Paulo, Brasil. A
análise iniciouse pela parte exploratória, onde foi verificada cada uma das variáveis
propostas. Após isso, foi realizada a regressão clássica, assim como a
autocorrelação espacial, que indicou que os dados estão correlacionados
espacialmente, necessitando portanto passarem por uma regressão espacial. Com
tal feito, algumas conclusões puderam ser feitas acerca das hipóteses iniciais e
alguns mapas foram gerados na escala 1:200.000 a partir das plotagens das
informações geradas pelo GWR.
3.1 PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA
Foram selecionados algumas variáveis que poderiam apresentar correlação
com os números de casos de dengue na cidade de São Paulo. A Figura 01 abaixo,
apresenta as variáveis selecionadas para iniciar os estudos de correlação com os
casos de dengue a cada 100 mil habitantes na cidade de São Paulo.
Figura 01: Diagramas com as variáveis selecionadas para pesquisa de correlação.
O levantamento de hipóteses fezse necessário para que fossem iniciados as
investigações estatísticas. Os pressupostos levantados são citados a seguir:
As áreas de Aglomerados subnormais são mais suscetíveis à incidência de
Dengue?;
A presença de esgoto a céu aberto, rede de distribuição e lixo nas ruas
contribuem para a proliferação da Dengue?;
As pessoas portadoras da doença estão carentes de assistência médica?;
Há uma correlação entre renda e a incidência de Dengue?;
O lixo acumulado em vias públicas ou em terrenos abandonados podem
influenciar na quantidade de casos de dengue?
Com o uso do software SPSS foram compilados as correlações da variável
dependente “Incidência de dengue 2010” com as variáveis independentes: esgoto
não ligado à rede, esgoto ligado à rede, números de Unidades Básicas de Saúde
(UBS), número de habitantes por número de UBS, lixo domiciliar jogado na rua,
renda per capita de meio à dois salários mínimos (s.m.), dois à dez s.m., dez à vinte
s.m. e número de habitantes sem rendimento. A correlação das variáveis
independentes com a dependente é dada a seguir pela Figura 02.
Figura 02: Correlação de Pearson
Observase que para correlação de Pearson, quanto mais próximo de 1
melhor é o modelo, os valores observados são baixos sendo que o maior número de
Pearson apresentado é de 0,312, que está relacionado com os lixos domiciliares
jogados. O número N representa a quantidade de amostras utilizadas por cada
modelo. Desse modo, foram refutados as análises das outras variáveis, sendo
aprofundado as pesquisas sobre a variável lixo domiciliar jogado. O Gráfico 01
abaixo apresenta o gráfico de dispersão das variáveis selecionadas.
Gráfico 01: Gráfico de dispersão entre os casos de dengue e o lixo domiciliar jogado.
Foram realizadas algumas correções sobre os dados da variável lixo
domiciliar jogado, objetivando uma melhor visualização dos dados nos gráficos de dispersão. Para tanto, realizouse as transformações elevandose a variável independente ao quadrado e extraindose seu exponencial. Os gráficos 02 e 03 apresentam essas transformações plotadas nos gráficos de dispersão.
3.2. ANÁLISE DE REGRESSÃO CLÁSSICA
Após a fase de análise exploratória, inicia a etapa de produção dos modelos
de regressão clássica e sua análise. Como concluído na fase anterior, a variável de
maior relevância para o trabalho é “lixo domiciliar jogado”.
O modelo construído relaciona a variável dependente “incidência de dengue”
com a variável independente “lixo domiciliar jogado”, realizada somente a regressão
simples. O R² atingido foi de 0,097, ou seja, o modelo explica aproximadamente
apenas 9% da variável dependente em relação à variável independente. O R
ajustado do modelo não apresenta muita diferença ao fazer o ajuste da introdução
da variável independente ao modelo. Em relação ao teste de DurbinWatson, seu
resultado ideal é 2, o que significa independência dos resíduos, no caso, o resultado
alcançado foi muito satisfatório, 2,012.
A tabela ANOVA apresenta a soma dos erros ao quadrado, sendo assim, um
ponto negativo do modelo é o valor dos resíduos estar acima do valor do modelo,
isso significa que o modelo explica muito pouco, sendo a quantidade explicada pelo
modelo muito menor que a quantidade de resíduos existentes. Porém, o teste de
significância foi satisfatório, apresentando 99,8% de confiança. Quanto ao teste F, é
a variância que o modelo explica pelo que o modelo não explica, tal razão deve
obter um valor alto para ser aprovada, sendo maior que um pelo menos, no modelo
testado a razão atingiu o valor de 10,146, ou seja, passou no teste, mas não com
altos valores.
A tabela de coeficientes apresenta a equação do modelo, que é:
INCIDÊNCIA DE DENGUE = 49,691 + 45,945.LIXO a cada 1% de domicílios que
deixa o lixo na rua sem coleta, gera um aumento de aproximadamente 46 casos de
dengue a cada 100 mil habitantes.
A mesma tabela apresenta o teste t, que deve ser diferente de zero para que
a hipótese nula seja refutada, no caso da regressão realizada o resultado é de
3,185, passando no teste. Os valores apresentados também encontramse dentro
do intervalo de confianças de 95%, confirmando que seus valores são verdadeiros.
A análise das estatísticas de colinearidade não foram levadas em consideração
devido ao uso de somente uma variável para a construção do modelo.
O histograma acima é a representação da frequência dos erros, que se
aproxima da distribuição normal, apresentando a maioria dos valores próximo a zero
e a presença de um outlier maior que quatro.
O P – Plot, conforme indicado abaixo, nos mostra que os resíduos possuem
uma certa linearidade, porém os outliers influenciaram no deslocamento da reta.
Além disso, o gráfico de dispersão apresenta inconstância na variância, sendo outro
resultado que evidencia uma não perfeição do modelo.
Índice de Moran das incidências de dengue
A partir do mapa acima, que espacializa a incidência de dengue no ano de
2010 por 100 mil habitantes através do Índice Local de Moran, podese observar
que existem três clusters de baixa incidência de dengue (leste, centro e sul) e um
cluster com alta incidência de dengue nos distritos e seus vizinhos. Observase que
o Índice Local de Moran é de 0,27, e nos clusters indicados acima, há maior
dependência espacial entre os distritos. Verificouse através do teste de
pseudosignificância que, mesmo após 999 permutações aleatórias, o nosso valor
observado está “fora” da distribuição aleatória gerada, ou seja, podemos rejeitar a
hipótese nula de que não há auto correlação espacial.
Histograma, Teste de Pseudosignificância e Dispersão dos resíduos
Analisando a distribuição dos resíduos, verificase que sua distribuição se
assemelha a uma distribuição normal que é a distribuição adequada e, ao
verificar a dispersão dos erros, identificase que não há heterocedasticidade
significativa, ou seja, a variância não aumenta ou diminui de forma que prejudique o
modelo; os erros estão de certa forma distribuídos ao redor da linha de tendência,
apesar da presença dos outiliers, que desloca a reta. Com o teste de
pseudosignificância, verificouse que mesmo após 999 permutações aleatórias, o
nosso valor observado está “fora” da distribuição aleatória gerada, ou seja, podemos
rejeitar a hipótese nula de que não há auto correlação espacial.
3.3 ANÁLISE DA REGRESSÃO ESPACIAL:
Regressão Clássica obtida pelo GWR
Através da análise da regressão clássica, o modelo obtido retornou um R²
(coeficiente de determinação) de 0,09, ou seja, isto significa que aproximadamente
9% da variável dependente (y= incidência de dengue) consegue ser explicada pela
variável independente presente no modelo, no caso, o lixo domiciliar jogado
(variável y). A estatística F é uma medida do quanto o modelo melhorou, comparado
ao nível de não precisão do modelo, ou seja, é a razão entre o modelo e seu erro.
Para que a estatística F seja boa, ela deve ter uma razão F grande, e neste caso,
ela tem um valor grande (10,1), com alta significância no nível de 0,01, ou seja,
altamente significativa. O critério de Akaike se baseia numa função de
verossimilhança, acrescida de uma penalidade associada ao numero de parâmetros
do modelo. Quanto menor ele for, melhor. Neste caso, seu valor é 1058.03. Quanto
maior o Log likelihood, melhor o ajuste do modelo. Neste caso, seu valor é 527.017.
As variáveis têm estatística t maior que o t crítico (2,82), ou seja, podemos
rejeitar a hipótese nula, e são significativas, pois seus valores de significância estão
entre 0,01 e 0,001.
A multicolinearidade do modelo é 1.65 e, para ser adequada, deve estar o
quão mais próximo de 1 e ter limite 10, ou seja, nesse modelo a colinearidade não é
um problema.
Para o Índice de Moran, a hipótese nula é de que não há autocorrelação
espacial, porém, nesse caso, a hipótese foi rejeitada.
Spatial Lag:
Spatial Error:
A matriz de vizinhança escolhida para fazer as análises espaciais foi do tipo
queen, de grau 1, ou seja, foram considerados vizinhos os distritos que tocam
somente os distritos diretamente contíguos.
Tanto o spatial error que atribui autocorrelação espacial aos erros dos
vizinhos como o spatial lag que atribui autocorrelação à média da variável
dependente dos vizinhos melhoraram praticamente na mesma medida o modelo. O
R² que era de 0,09 passou a ser de 0,26 em ambos os modelos, ou seja, a
regressão espacial no caso da dengue em São Paulo, explica muito melhor do que
o modelo de regressão clássica. O Log Likelihood baixou um pouco, porém em
ambos os modelos seu valor foi 519, variando apenas nos décimos. O critério de
Akaike ficou também praticamente igual nos dois modelos espaciais, e diferiram
pouco da regressão clássica, variando apenas 13 e 15 unidades. Em ambos os
modelos de regressão espacial, a significância das variáveis se mantiveram entre si,
havendo pouca variação, e em relação à regressão clássica, os níveis de
significância continuam bons e significativos. A variável "likelihood ratio test" obteve
também praticamente o mesmo valor (14) variando apenas em décimos, e possuem
satisfatório nível de significância.
Após feitas essas análises, foi feita a regressão espacial no GWR, na
tentativa de melhor resultados acerca dos que foram obtidos com o spatial lag e
spatil error, assim como a intenção de plotar mapas com as informações geradas.
Regressão Espacial obtida pelo GWR
O software Geographically Weighted Regression (GWR), que ajustou o modelo de
regressão a cada ponto observado ponderando todas as demais observações
como função da distância a este ponto mostrou uma melhora no R² apresentado
anteriormente, saltando de 26% para 35% no que se refere à explicação das
incidências da dengue. Além disso, mostrou também que a variável independente
(lixo domiciliar) variou bastante em sua amplitude (Range), tendo aproximadamente
um mínimo de 5,95 e um máximo de 17,16.
Análise dos mapas plotados a partir do GWR
Após a análise feita pelo software Geographically Weighted Regression (GWR)
que parte de um ênfase nas diferenças (análise local) foi possível ver as variações
espaciais modeladas de forma contínua, com os parâmetros variando no espaço. MAPA I MAPA DO R QUADRADO LOCAL
O mapa do R quadrado local evidencia, notadamente, quais os distritos do
município de São Paulo que explicam mais a relação entre o lixo domiciliar jogado
nas ruas e as incidências de dengue no ano de 2010. Cruzando a informação com a
localização dos aglomerados subnormais de acordo com o Censo 2010 é notável
que os valores mais altos estão espalhados por toda capital, não importando se a
área é rural ou urbana e se possui mais habitantes de alta ou baixa renda. Porém, a
parte sul paulistana, onde há uma maior concentração de favelas, é a que explica
mais a relação entre a variável dependente e a independente já a parte noroeste é
a que menos é explicada pelo modelo. É importante ressaltar que em muitos lugares
onde existem favelas, a relação entre as variáveis não apresentou significância, ou
seja, os betas podem ser iguais a zero, não podendo ser rejeitada a hipótese nula.
MAPA II MAPA DOS BETAS: LIXO DOMICILIAR JOGADO
MAPA III MAPA DA ESTATÍSTICA T: LIXO DOMICILIAR JOGADO
A partir dos mapas dos betas, é possível notar os locais de São Paulo que, a
cada 1% dos domicílios que deixam o lixo na rua sem coleta, geram um aumento de
aproximadamente 46% dos casos de dengue a cada 100mil habitantes. Há uma
concentração de valores mais altos na zona extremo sul da capital e valores
intermediários pelo resto do município (Centro e Zona Leste, por exemplo).
Analisando a tabela t de student, com nível de significância 0,05 (confiança
de 95%) e dois graus de liberdade, chegase ao valor |2,92|. O mapa da estatística t
do lixo domiciliar jogado nas ruas ressalta, em vermelho, os distritos paulistas que
estão acima do valor estimado, ou seja, os betas são significantes e diferentes de
zero e em azul, os que estão abaixo, explicando pouco ou praticamente nada da
relação entre lixo domiciliar e a dengue no município de São Paulo, podendo assim
ter valor zero, ou seja, são valores que não se pode rejeitar a hipótese nula.
4. CONCLUSÕES
As hipóteses que envolviam as variáveis UBS, esgoto a céu aberto, rede de
abastecimento de água e renda não foram corroboradas. A única hipótese
corroborada foi a de que o lixo domiciliar jogado possui uma relação com a
incidência de Dengue e apenas em alguns distritos do município de São Paulo.
Os aglomerados subnormais não estão, como mostrado, necessariamente
localizados nos lugares que possuem maior a relação entre a incidência de Dengue
e o lixo domiciliar jogado.
5. REFERÊNCIAS BIBLIOGRÁFICAS GRUPO IG. Casos de dengue caem em São Paulo, mas situação segue epidêmica na cidade. 21 de Maio de 2015. Acessado em <http://ultimosegundo.ig.com.br/brasil/sp/20150521/casosdedenguecaememsaopaulomassituacaosegueepidemicanacidade.html> IBGE. Censo 2010. Acessado em 16 de junho de 2015 <http://censo2010.ibge.gov.br/> MAGALHÃES, Gledson. O Uso do geoprocessamento e da estatística nos estudos ecológicos em epidemiologia: o caso da dengue em 2008 na região metropolitana de Fortaleza. Revista Brasileira de Geografia Médica e da Saúde. 2012. MINISTÉRIO DA SAÚDE. Portal da saúde. Acessado em 10 de agosto de 2015 <http://portalsaude.saude.gov.br/index.php/oministerio/principal/secretarias/svs/dengue> PREFEITURA DE SÃO PAULO. Dados de incidência da dengue de 2010 por distritos. Acessado em 16 de junho de 2015 <www.prefeitura.sp.gov.br/cidade/secretarias/upload/chamadas/01dengue_cc_ci_16_07_2014_1405629331.pdf>