carla fernandes de mello poluição atmosférica na estimação...
TRANSCRIPT
Carla Fernandes de Mello
Estudo de Periodicidade dos Dados de Poluição Atmosférica na Estimação de Efeitos
na Saúde no Município do Rio de Janeiro
Dissertação de Mestrado
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós-graduação em Engenharia Elétrica do Departamento de Engenharia Elétrica da PUC-Rio.
Prof. Cristiano Augusto Coelho Fernandes
Rio de Janeiro
Setembro de 2007
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Carla Fernandes de Mello
Estudo de Periodicidade dos Dados de Poluição Atmosférica na Estimação de Efeitos
na Saúde no Município do Rio de Janeiro Dissertação apresentada como requisito parcial para
obtenção do grau de Mestre pelo Programa de Pós-Graduação em Engenharia Elétrica do Departamento de Engenharia Elétrica do Centro Técnico Científico da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada.
Dr. Cristiano Augusto Coelho Fernandes Orientador
Departamento de Engenharia Elétrica – PUC-Rio
Dr. Antonio Carlos Ponce de Leon
UERJ
Dr. Eduardo Lima Campos ENCE
Dra. Fernanda Chaves Pereira PUC/Rio
Prof. José Eugenio Leal Coordenador Setorial do Centro
Técnico Científico
Rio de Janeiro, 05 de setembro de 2007
Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, da autora e do orientador.
Carla Fernandes de Mello
Graduada em estatística pelo Instituto de Matemática e estatística da Universidade do Estado do Rio de Janeiro - IME/UERJ.
Ficha Catalográfica
CDD: 621.3
Mello, Carla Fernandes de Estudo de periodicidade dos dados de poluição
atmosférica na estimação de efeitos na saúde no Município do Rio de Janeiro / Carla Fernandes de Mello ; orientador: Cristiano Augusto Coelho Fernandes. – 2007.
105 f. ; 30 cm Dissertação (Mestrado em Engenharia Elétrica) –
Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2007.
Inclui bibliografia
1. Engenharia elétrica – Teses. 2. Poluição atmosférica. 3. Doenças respiratórias. 4. GAM. 5. Rio de Janeiro. I. Fernandes, Cristiano Augusto Coelho. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Engenharia Elétrica. III. Título.
Agradecimentos
A Deus.
Ao meu orientador, Professor Cristiano Fernandes e ao meu co-orientador,
Antonio Ponce de Leon.
Ao CNPq e à PUC-Rio, pelos auxílios concedidos.
Aos meus pais Cristina e Luiz e à minha irmã Mariana.
Ao Washington, pela ajuda desde a graduação.
Aos professores que participaram da Comissão examinadora.
Resumo
Mello, Carla Fernandes de; Fernandes, Cristiano Augusto Coelho (Orientador). Estudo de Periodicidade dos Dados de Poluição Atmosférica na Estimação de Efeitos na Saúde no Município do Rio de Janeiro. Rio de Janeiro, 2007. 105p. Dissertação de Mestrado - Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.
Esta dissertação apresenta um estudo de validação das estimações dos
efeitos da poluição atmosférica na saúde da população quando se utilizam dados
com periodicidade de seis dias. O estudo foi realizado utilizando duas abordagens
complementares. A primeira consiste em comparar os efeitos estimados a partir da
análise de duas séries de morbidade diárias na cidade do Rio de Janeiro com
aqueles obtidos particionando-se estas mesmas séries em seis séries distintas, cada
qual com periodicidade de seis dias. As estimativas dos efeitos nas series
particionadas de seis dias variaram substancialmente em relação à série diária para
contagem de internações por doenças respiratórias em crianças. Para a mesma
análise feita para a série de idosos, não foram detectadas diferenças tão
significativas. Para complementar esta análise, realizou-se um estudo de Monte
Carlo considerando diferentes cenários quanto aos padrões de poluição do ar. Os
resultados mostraram que quanto maior a quantidade de dia atípicos por mês,
maior pode ser a variação entre as estimações das séries diárias e as séries com
periodicidade de 6 dias. Ao fim deste trabalho são apresentados resultados
utilizando dados reais com periodicidade de 6 dias. Os efeitos estimados de PM10
para doenças respiratórias em crianças foram de 8.1% (IC: 5.4% ; 10.8%) para o
dia corrente e 7.3% (IC: 4.5% ; 10.2%) para 1 dia após a exposição à poluição do
ar. Para idosos, houve um aumento estatisticamente significativo apenas para o dia
corrente de 3.36% (IC: 1.19% ;5.58%).
Palavras-chave Poluição atmosférica, doenças respiratórias, GAM, Rio de Janeiro.
Abstract
Mello, Carla Fernandes de; Fernandes, Cristiano Augusto Coelho (Advisor). A study on the periodicity of atmospheric pollution data in the estimation of health effects in Rio de Janeiro city. Rio de Janeiro, 2007. 105p. MSc. Dissertation - Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro.
This dissertation presents a validation study on the analysis of the effect of
atmospheric pollution on morbidity using data sampled every sixth day. This has
been investigated using two complementary frameworks. We first compared such
pollution effects using two morbidity daily time series in Rio de Janeiro city,
which have been sampled every sixth day, thus generating, for each series, a set of
six sampled series. For the daily counts of hospital events for children due to
respiratory diseases the estimated pollution effect for the six sampled series was
markedly different from the same effect estimated on the original daily time
series, while for elderly people such difference has not been observed. The second
part of our analysis was carried over using a Monte Carlo study. Finally we
conclude our work presenting risk estimates using real data sampled every six
days. The estimated relative risks of particulate material (PM10) on respiratory
diseases for inhabitants of Rio de Janeiro city were as follows. For children the
risk was estimated in 8.1% (5.4%; 10.8%) for current day exposure and 7.3%
(4.5%; 10.2%) for exposition lagging one day. For elderly people it was observed
a significant increase on hospital attendances due to pollution on the same day of
exposition. and the estimated risk was 3.36% (1.19%; 5.58%).
Keywords
Atmospheric pollution, respiratory disease, GAM, Rio de Janeiro.
Sumário
1 Introdução 12 1.1. Rede de monitoramento: FEEMA 15 1.2. Material particulado (PM10) 17 2 Metodologia 19 2.1. Área geográfica de estudo 19 2.2. Dados de morbidade 19 2.3. Dados meteorológicos e de poluição do ar 19 2.4. Estratégia de modelagem (MAG) 21 2.4.1. Modelos lineares generalizados (MLG) 23 2.4.2. Modelos aditivos generalizados (MAG) 24 2.4.2.1. Splines cúbicas 25 2.4.2.2. Loess 26 2.5. Metodologia para simulação de variáveis 26 2.5.1. Simulação 28 2.5.1.1. Simulação de Monte Carlo 29 2.5.1.2. Gerador de números aleatórios 30 2.5.1.3. Simulação de variáveis climáticas (revisão bibliográfica) 31 2.5.1.4. Simulação - precipitação de chuva 32 2.5.1.5. Simulação - temperatura e umidade 37 2.5.1.6. Simulação - PM10 40 2.5.1.7. Simulação - contagem de internações hospitalares 42 2.5.1.8. Simulação e estimação de efeitos - cenários de concentração de PM10 43 2.6. Testes de adequação das variáveis simuladas 49 2.6.1. Teste de Kolmogorov - Smirnov univariado 49 2.6.2. Teste de Jarque – Bera 50 2.6.3. Teste de Kolmogorov - Smirnov multivariado 50 3 Resultados 51 3.1. Resultados para modelos de séries diárias e séries particionadas (periodicidade de 6 dias) 51 3.1.1. Idosos com mais de 65 anos 52 3.1.2. Crianças com menos de 5 anos 56 3.2. Simulação 60 3.2.1. Simulação - precipitação de chuva 60 3.2.2. Simulação - temperatura e umidade 64 3.2.3. Simulação - material particulado (PM10) 69 3.2.4. Resultados para modelos com séries simuladas, segundo diferentes cenários de concentração de poluição do ar 72 3.3. Resultados para modelos de séries com periodicidade de 6 dias (dados FEEMA) 74 3.3.1. Idosos com mais de 65 anos 74 3.3.2. Crianças com menos de 5 anos 75
4 Conclusões 77 5 Referências Bibliográficas 80 ANEXO I 84 ANEXO II 99 ANEXO III 103 ANEXO IV 104
Lista de tabelas
Tabela 1: Listagem dos monitores e parâmetros monitorados. 17 Tabela 2: Estatísticas descritivas das séries de PM10 (μg/m3) 52 Tabela 3: Estatísticas descritivas das séries de contagem de doenças do aparelho respiratório em idosos 53 Tabela 4: Efeitos estimados (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos (PM10 (dia corrente)) 54 Tabela 5: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos (PM10 (lag 1)) 55 Tabela 6: Média das estimativas dos efeitos estimados (%) das séries amostradas e estimativa do efeito estimado para a série diária completa (DAR65) 56 Tabela 7: Estatísticas descritivas das séries de contagem de doenças do aparelho respiratório em crianças 57 Tabela 8: Efeitos estimados (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças (PM10 (dia corrente)) 58 Tabela 9: Efeitos estimados (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças (PM10 (lag 1)) 58 Tabela 10: Média das estimativas dos efeitos estimados(%) das séries amostradas e estimativa do efeito estimado para a série diária completa (DAR5) 59 Tabela 11: P-valores dos teste de Kolmogorov Smirnov para uma distribuição Gama por mês e ano 61 Tabela 12: Estimativas dos parâmetros da distribuição Gama (α , β ) por mês e ano 62 Tabela 13: Coeficientes de correlação de Pearson para freqüência mensal e dias chuvosos e precipitação total por mês de chuva (séries simuladas e série observada de chuva). Coeficiente de Pearson, p-valor 63 Tabela 14: Correlações de Pearson entre temperatura e umidade por mês e ano. P-valor ( 0.05α = ) 65 Tabela 15: Teste de Kolmogorov-Smirnov bivariado para temperatura e umidade ( 0.05α = ) 65 Tabela 16: Testes de Kolmogorov-Smirnov e Jarque Bera para temperatura ( 0.05α = ) 66 Tabela 17: Testes de Kolmogorov-Smirnov e Jarque Bera para umidade ( 0.05α = ) 66 Tabela 18: Coeficientes de correlação de Pearson entre médias mensais/ variâncias mensais das séries simuladas e série observada e temperatura. Coeficiente de Pearson, p-valor 67 Tabela 19: Coeficientes de correlação de Pearson entre as estimativas de fac (30 lags)/facp (10 lags) das séries simuladas e série observada de temperatura. Coeficiente de Pearson, p-valor 68 Tabela 20: Coeficientes de correlação de Pearson entre médias mensais/ variâncias mensais das séries simuladas e série observada de umidade. Coeficiente de Pearson, p-valor 68
Tabela 21: Coeficientes de correlação de Pearson entre as estimativas de fac (14 lags)/facp (22 lags) das séries simuladas e série observada de umidade. Coeficiente de Pearson, p-valor 69 Tabela 22: Teste de Kolmogorov-Smirnov e Jarque Bera para poluição do ar ( 0.05α = ) 70 Tabela 23: Teste de Kolmogorov-Smirnov multivariado para poluição do ar, umidade e temperatura ( 0.05α = ) 70 Tabela 24: Coeficientes de correlação de Pearson entre médias mensais/ variâncias mensais das séries simuladas e série observada de material particulado. Coeficiente de Pearson, p-valor 71 Tabela 25: : Coeficientes de correlação de Pearson entre as estimativas de fac/facp (5 lags) das séries simuladas e série observada de material particulado. Coeficiente de Pearson, p-valor 71 Tabela 26: Efeitos estimados (%) para doenças do aparelho respiratório em crianças (PM10 - dados simulados com aumento de 25%, 100% e 200% de dias atípicos de material particulado por mês - série diária e séries com periodicidade de 6 dias) 73 Tabela 27: Efeitos estimados, aumentos percentuais (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos na cidade do Rio de Janeiro. 75 Tabela 28: Efeitos estimados, aumentos percentuais (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças na cidade do Rio de Janeiro. 76
Lista de figuras
Figura 1: Distribuição espacial da Rede de monitoramento da qualidade do ar na Região Metropolitana do Estado do Rio de Janeiro. Fonte: FEEMA 16 Figura 2: O método da transformada inversa 30 Figura 3: Algoritmo para definição de dias não chuvosos e chuvosos 34 Figura 4: Diagrama com as etapas da simulação das séries diárias de temperatura e umidade 40 Figura 5: Diagrama com as etapas da simulação da série de material particulado 41 Figura 6: Diagramas com as etapas da simulação da série diária de contagem de internações hospitalares de crianças. 43 Figura 7: Diagramas com as etapas da simulação dos cenários de concentração de poluição do ar 47 Figura 8: Diagramas com as etapas da simulação das séries diárias de chuva, temperatura, umidade, material particulado e contagem de internações hospitalares 48 Figura 9: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos (PM10 (dia corrente) ) 54 Figura 10: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos (PM10 (lag 1)) 55 Figura 11: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças (PM10 (dia corrente) ) 58 Figura 12: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças (PM10 (lag 1)) 59 Figura 13: Gráficos da série real e de 1 série simulada de chuva 63 Figura 14: Gráficos das séries observada e simulada de temperatura máxima diária 67 Figura 15: Gráficos das séries observada e simulada de umidade relativa do ar 68 Figura 16: Gráficos das séries observada e de uma série simulada de PM10 71 Figura 16: Média dos efeitos estimados nas 100 séries simuladas por cenário de concentração de poluição do ar (séries particionadas e séries completa) 73 Figura 18: Efeitos estimados(%) e intervalos de confiança de 95% para doenças do aparelho respiratório em idosos na cidade do Rio de Janeiro. 75 Figura 19: Efeitos estimados, aumentos percentuais (%) e intervalos de confiança de 95% para doenças do aparelho respiratório em crianças na cidade do Rio de Janeiro. 76
1 Introdução
A qualidade do ar no município do Rio de Janeiro depende fortemente do
nível de atividade industrial e do tráfego de caminhões e de outros veículos. Por
outro lado, a acidentada topografia da cidade e a presença do mar e da Baía de
Guanabara produzem um fluxo de ar complexo e heterogêneo em relação à
distribuição e dispersão dos poluentes.
Estudos15,28,38,43-47,49-51 têm mostrado várias evidências que sugerem a
associação da exposição à poluição do ar na saúde, tanto na morbidade, como na
mortalidade por causas específicas, principalmente por causas respiratórias em
crianças e idosos.
Devido à dinâmica da mistura de poluentes, aos padrões de dispersão da
poluição em diferentes partes da Região Metropolitana do Rio de Janeiro, à
construção de novas áreas residenciais, bem como às mudanças nos meios de
transporte, nos tipos de combustíveis e devido também ao surgimento de novas
indústrias, é importante que estudos como estes sejam freqüentemente realizados.
A Região Metropolitana do Rio de Janeiro conta com duas Redes de
monitoramento da poluição do ar: a Automática e a Manual. Na primeira Rede as
concentrações de vários poluentes são mensuradas de forma contínua e a segunda
opera com periodicidade de seis dias e registra apenas os níveis de material
particulado (PM10). Os dados da Rede Automática têm sido utilizados em
estudos29 dos efeitos da poluição do ar na saúde da população, diferentemente da
Rede Manual, embora esta tenha uma cobertura mais abrangente que a primeira.
Deve-se destacar que diversos estudos mostram que o feito do material
particulado no indicador de saúde é quase sempre estatisticamente significativo e
em alguns casos, seu efeito na saúde pode ser maior se comparado a outros
poluentes. Em São Paulo, Saldiva e colaboradores realizaram um estudo sobre o
efeito da poluição do ar na mortalidade por doenças do aparelho respiratório em
idosos e o poluente PM10 foi o que apresentou efeito estatístico mais
significativo43.
13
Em outro estudo similar, Clarice Freitas e colaboradores mostraram que o
material particulado foi o poluente que apresentou a associação mais significativa
com as contagens de internações hospitalares por doenças respiratórias, tanto em
idosos, como em crianças na cidade de São Paulo15. Um estudo realizado para 36
cidades dos Estados Unidos sobre o efeito dos poluentes PM10 e O3 também
mostrou um efeito mais significativo para o material particulado na contagem de
internações de emergência por infarto do miocárdio28.
Em um estudo realizado por Daumas10, sobre a investigação do efeito da
poluição do ar na saúde da população carioca, utilizou-se dados de concentrações
de poluentes de 1990 a 1993 com periodicidade de 6 dias e verificou-se um efeito
positivo de partículas totais em suspensão (PTS) na mortalidade de idosos
residentes na cidade do Rio de Janeiro por doenças respiratórias e
cardiovasculares, porém, este efeito não foi estatisticamente significativo.
Diferentemente, em um estudo mais recente realizado para a mesma cidade29, em
que se utilizou dados diários para este mesmo poluente, embora em outro período
de tempo, foi encontrado um efeito positivo e estatisticamente significativo das
partículas totais em suspensão.
Baseando-se nas diferenças encontradas entre os estudos citados
anteriormente e em adição a isso, a incerteza presente na possível utilização de
dados de poluição do ar provenientes da Rede Manual (Rio de Janeiro) em
investigações futuras, este trabalho tem como principal objetivo averiguar o quão
verossímil podem ser estudos que utilizem dados com periodicidade de 6 dias para
regiões ainda não cobertas por Redes de monitores automáticos, ou seja, se as
estimativas dos efeitos da poluição do ar na saúde encontrados para as séries
diárias diferem de forma significativas em relação às mesmas estimativas
utilizando séries com periodicidade de 6 dias, uma vez que algumas Redes de
Monitoramento da poluição do ar apenas medem a concentração de poluição
atmosférica em períodos de 6 dias.
Foram realizadas para tanto, análises com duas abordagens complementares.
A primeira consiste em comparar os efeitos estimados a partir da análise de uma
série de morbidade diária na cidade do Rio de Janeiro com aqueles obtidos
amostrando-se esta mesma série em seis séries distintas, cada qual com
periodicidade de seis dias, a fim de analisar como as estimativas de efeito da
14
poluição no último caso se distribuem ao redor do efeito estimado na análise da
série completa, o qual será assumido como o efeito “verdadeiro”.
Para complementar esta análise realizou-se um estudo de simulação
abrangente, considerando diferentes cenários quanto aos padrões de poluição das
séries temporais com periodicidade de seis dias. Procurou-se não só simular as
variáveis de poluição do ar e contagens de internações hospitalares por doenças
respiratórias, mas todas as variáveis que influenciariam no desfecho de saúde,
como: chuva, temperatura e umidade.
Nesta etapa foi utilizada a simulação de Monte Carlo para construção de
séries sintéticas climáticas(1-2,5-6,23,33,35,37,41,52), de poluição do ar e de contagens de
saúde. Séries temporais reais foram usadas como modelos para a geração das
séries simuladas, baseado em estratégias descritas com detalhes no capítulo de
metodologia.
Em resumo, cada variável climática foi gerada segundo uma distribuição de
probabilidade teórica conhecida, preservando também estruturas de variância e
autocorrelação das séries reais. Para simulação da série diária de material
particulado, simulou-se para cada mês um modelo de regressão dinâmica onde as
variáveis explicativas foram as séries diárias de: temperatura, poluição do ar
defasada em 1 dia e umidade relativa do ar. A série temporal de respostas
(contagens diárias de eventos de saúde) foi gerada a partir do modelo linear
generalizado de Poisson12,27, de acordo com o pressuposto que o número diário de
eventos de saúde é descrito por um processo estocástico de Poisson. O modelo
aditivo generalizado19 foi utilizado na estimação dos efeitos da poluição do ar nas
contagens de internações hospitalares por doenças respiratórias.
O trabalho está organizado da seguinte forma: No capítulo 2 é apresentado
o modelo utilizado na estimação dos efeitos da poluição do ar na saúde e como
este modelo foi utilizado na validação das análises que utilizam dados com
periodicidade de seis dias para estimação dos efeitos da poluição atmosférica na
saúde da população. Neste mesmo capítulo são apresentadas as metodologias de
simulação das séries de material particulado, contagens de saúde e séries
meteorológicas, bem como uma breve descrição do poluente PM10. O capítulo 3
apresenta os resultados para as duas abordagens de validação dos dados com
periodicidade de 6 dias: utilizando dados reais e dados simualados. Este mesmo
capítulo também apresenta os resultados da estimação dos efeitos de uma série
15
real de material particulado com periodicidade de 6 dias da Rede Manual para o
município do Rio de Janeiro nas contagens de doenças do aparelho respiratório
em idosos e crianças, respectivamente. O capítulo 4 conclui o trabalho expondo os
principais resultados. O anexo apresenta os códigos escritos em linguagem R40
para simulação das séries climáticas, poluição do ar e contagens de saúde, bem
como os diagnósticos dos modelos.
1.1 Rede de monitoramento: FEEMA
A Região Metropolitana do Rio de Janeiro conta com 17 municípios, onde
54% da população vive na cidade do Rio de Janeiro. A Região é a que apresenta a
maior densidade demográfica (por volta de 2.285 hab/km2) e possui maior grau de
urbanização do país. Também é a segunda Região Metropolitana com maior
concentração de veículos, de indústrias e de fontes emissoras de poluentes do país,
gerando sérios problemas de poluição do ar14.
Os veículos, responsáveis por 77% dos poluentes emitidos na Região, são
os maiores contribuidores para a degradação da qualidade do ar. Para
monitoramento da emissão desses poluentes a Fundação de Engenharia do Meio
Ambiente (FEEMA) conta com uma Rede de Monitoramento de poluição do ar
que possui 26 estações (4 Automáticas e 24 manuais) distribuídas na Região
Metropolitana do Rio de Janeiro14. A maior parte da Rede de Monitoramento de
poluição do ar da FEEMA é composta por monitores manuais e grande parte dos
dados produzidos por estes monitores não foram utilizados ainda em estudos de
investigação do efeito da poluição na saúde, uma vez que ainda não se conhece as
conseqüências do uso de dados com periodicidade de 6 dias na estimação desses
efeitos. Portanto, o objetivo deste trabalho, sobretudo, é averiguar a conseqüência
do uso desses dados em análises de séries temporais epidemiológicas, ou seja,
uma vez que haja indícios plausíveis que dados diários ou dados com
periodicidade de 6 dias não produzam resultados muito diferentes, no que se
refere às estimativas de efeitos da concentração de poluição do ar na saúde da
população, é possível que se aumente a abrangência das análises, com a inclusão
de outros locais da Região Metropolitana do Rio, uma vez que a maior parte da
Rede de Monitoramento da FEEMA é Manual.
16
A Figura 1 apresenta a distribuição dos monitores da FEEMA na Região
Metropolitana do Rio de Janeiro. Note como a Rede Manual que mede dados de 6
em 6 dias é muito mais abrangente do que a Rede Automática que mede dados
horários/ diários. Além disso, é importante destacar que a manutenção da Rede
Manual é mais barata para ser mantida do que a Rede Automática, o que
corrobora com a importância da utilização dos dados provenientes da Rede
Manual.
Figura 1: Distribuição espacial da Rede de monitoramento da qualidade do ar na
Região Metropolitana do Estado do Rio de Janeiro. Fonte: FEEMA
17
Tabela 1: Listagem dos monitores e parâmetros monitorados. Parâmetros Monitorados
Qualidade do Ar Estação
SO2 NOX O3 CO HC PM10 PTS
1 Belford Roxo X
2 Benfica* X
3 Bonsucesso* X X
4 Botafogo* X
5 Centro* X X
6 Centro Automática * X X X X X X
7 Coelho Neto* X
8 Copacabana* X X
9 Duque de Caxias* X X
10 Engenho da Rainha* X
11 Itaguaí X X
12 Jacarepaguá* X X
13 Jacarepaguá Automática* X X X X X X
14 Maracanã* X X
15 Nilópolis X
16 Niterói X
17 Nova Iguaçu X
18 Nova Iguaçu Automática X X X X X X
19 Realengo* X
20 Santa Tereza* X
21 São Cristóvão* X X
22 São Gonçalo X X
23 São Gonçalo Automática X X X X X X
24 São João de Meriti X X
25 Sumaré X X
26 Tijuca* X
* Monitores localizados na cidade do Rio de Janeiro
1.2 Material particulado (PM10)
O material particulado (PM) é uma mistura de partículas sólidas e liquidas
que, devido ao seu pequeno tamanho, se mantém em suspensão no ar. As fontes
emissoras desse poluente são em geral: fuligens emitidas por veículos, fumaças
expelidas pelas chaminés industriais e poeira depositada nas ruas, levantada pelo
vento e pelo movimento dos veículos.30-53
18
Até 1989, a legislação brasileira apenas preocupava-se com as partículas
totais em suspensão (PTS), ou seja, com partículas menores que 100 μg/m3
(microgramas* por metros cúbico). No entanto, pesquisas recentes53, mostram que
as partículas mais finas, em geral as menores que 10 μg/m3 (PM10), penetram mais
profundamente no aparelho respiratório e são as que apresentam efetivamente
mais riscos à saúde. Assim, a partir de 1990 a legislação brasileira passou também
a se preocupar com o PM10 53.
A USEPA (United States Environmental Protection Agency) para controle
de partículas menores ou iguais a 10 μg/m3 (PM10), também chamadas de
partículas inaláveis se baseia na premissa de que estas partículas podem atingir as
vias respiratórias inferiores. O material particulado PM10 inalável tem a
capacidade de transportar gases absorvidos em sua superfície até as porções mais
distais das vias aérea.30
* milésima parte do milímetro
2 Metodologia
2.1 Área geográfica de estudo
O município do Rio de Janeiro foi a área geográfica considerada neste
estudo e o período de estudo foi de janeiro de 2000 a dezembro de 2004.
2.2 Dados de morbidade
Os dados de morbidade utilizados neste estudo, referentes à cidade do Rio,
foram extraídos dos bancos de Autorizações de Internação Hospitalar (AIH) do
DATASUS, onde estão contidas informações de todas as internações hospitalares
realizadas pelo Sistema Único de Saúde (SUS). Nestes bancos constam
informações como sexo, idade, data de internação, data de alta, diagnóstico,
duração de internação, identificação do hospital e unidade da federação. Os
desfechos de interesse foram filtrados do banco de dados original utilizando a
Classificação Internacional de Doenças 10ª revisão (CID-10). As ocorrências de
internação foram agrupadas por data produzindo séries temporais de freqüência
diária para cada desfecho e faixa etária do estudo. Alguns estudos mostram uma
alta confiabilidade nos diagnósticos apresentados nos formulários de (AIH)54.
2.3 Dados meteorológicos e de poluição do ar
Na primeira e segunda parte deste trabalho (validação de dados com
periodicidade de 6 dias), foram utilizados dados diários de material particulado
para a cidade do Rio de Janeiro do período de 01/09/2000 a 31/08/2003,
20
provenientes das Redes Automáticas da FEEMA e da Secretaria Municipal de
Saúde (SMAC).
A Rede Automática da FEEMA, mede a concentração horária/ diária de
material particulado em apenas 2 estações na cidade do Rio: Jacarepaguá e
Centro. A SMAC mede dados diários de material particulado diariamente de 4
estações de monitoramento localizados na cidade: Tijuca, São Cristóvão, Centro e
Copacabana. Note que a abrangência da Rede Automática da FEEMA no Rio é
muito pequena (2 bairros). Mesmo considerando nas análises da primeira e
segunda parte do trabalho, os dados dos monitores da SMAC, única Rede
localizada na cidade que também mensura dados como a FEEMA, a abrangência
de medição para a cidade ainda não é suficiente, uma vez que em apenas 4 bairros
os dados de material particulado são medidos pela Rede Automática das 2
instituições: Jacarepaguá, Centro, Copacabana e São Cristovão.
Para a terceira parte deste trabalho (estimação dos efeitos de material
particulado na saúde utilizando os dados observados com periodicidade de 6 dias),
foram utilizados os dados de concentração de PM10 da cidade do Rio de Janeiro da
Rede Manual da FEEMA (dados medidos com periodicidade de 6 dias) no
período de janeiro de 2000 a dezembro de 2004, dos monitores localizados nos
seguintes bairros: Bonsucesso, Botafogo, Centro, Copacabana, Jacarepaguá,
Maracanã e São Cristóvão. Note como a Rede Manual da FEEMA abrange 5
estações/ bairros a mais que a Rede Automática da mesma instituição. Portanto é
importante que estudos de validação de dados com periodicidade de 6 dias sejam
realizados, a fim de que estes possam ser utilizados em estudos de estimação da
poluição do ar na saúde, já que a Rede Manual é muito mais abrangente e também
mais barata de ser mantida se comparada à Rede Automática.
É importante citar que o indicador de poluição do ar para o município foi a
média diária entre as séries diárias de poluição do ar nos monitores automáticos
(primeira e segunda parte do trabalho) e manuais (terceira parte do trabalho). Por
conta dos dados faltantes em alguns monitores, a média diária entre os monitores
foi calculada utilizando dados imputados, segundo um algoritmo EM21.
Os dados de temperatura e umidade relativa foram cedidos pelo Comando
da Aeronáutica e os de intensidade das chuvas foram obtidos na página da Internet
da Fundação Instituto de Geotécnica do município do Rio de Janeiro.16 Da mesma
forma, os indicadores de temperatura e umidade também foram calculados através
21
da média dos dados diários nos monitores localizados na cidade do Rio de Janeiro.
Nenhuma técnica de imputação de dados foi utilizada, uma vez que não havia
dados faltantes nestes casos.
2.4 Estratégia de modelagem (MAG)
Para efeito de comparação, foram estimados os efeitos da poluição do ar
na variável resposta (contagem de internações hospitalares em crianças) com
aqueles obtidos particionando-se esta mesma série em seis séries distintas, cada
qual com periodicidade de seis dias. Esta análise objetivou averiguar como as
estimativas de efeito da poluição no último caso se distribuem ao redor do efeito
estimado da série completa e foram feitas tanto para os dados reais, como para
dados simulados, segundo diversos cenários de concentração de poluição do ar.
O modelo utilizado foi o modelo aditivo linear generalizado19, descrito na
seção anterior. As séries de contagens de internações hospitalares diárias foram
modeladas pressupondo que estas seguem uma distribuição de Poisson.
: ( )t ty Poisson μ
var( ) t ty ϕμ=
01 1
log( ( )) ( , )J K
t j jt l tk fkE Y X f u dβ β= + +∑ ∑
Os 'sβ descrevem a variação percentual no logaritmo da média da
contagem dos eventos de saúde para a variação de uma unidade na variável de
exposição, por exemplo, um aumento de exp( ) 100% β × na média de internações
hospitalares para um aumento em 10 3μg/m de PM10. ϕ representa o parâmetro de
dispersão e em um modelo de Poisson é igual a 1. O conjunto de funções
{ }(., )fkf d denotam funções suavizadoras (loess/splines) das variáveis explicativas
1 2( , ,..., )t t t KtX X X X= e o argumento fkd o respectivo grau de suavização.
A tendência e a sazonalidade foram ajustadas através de funções loess/
splines do índice de tempo. Os fatores meteorológicos foram controlados através
de funções splines/ loess de temperatura e umidade. Foram adicionadas variáveis
22
indicadoras para controlar os efeitos de calendário (dias da semana e feriados), e
os níveis do poluente, o que de acordo com a abordagem epidemiológica de
análise de dados caracteriza um cenário de confusão. Analogamente a série de
precipitação de chuva foi adicionada de forma linear ao modelo, quando esta era
significativa.
As variáveis explicativas citadas anteriormente (chuva, temperatura
umidade, feriados e dias da semana) são consideradas variáveis de “confusão” do
efeito da poluição do ar na contagem de internações hospitalares respiratórias,
pois existem muitas evidências de que estas influenciam significamente a variável
resposta43-44. Portanto, é importante que estas variáveis sejam consideradas na
modelagem, uma vez que o objetivo principal da modelagem é identificar/estimar
apenas o efeito da concentração do material particulado na contagem de
internações hospitalares, retirando qualquer efeito que não esteja relacionado ao
poluente.
Também é importante ressaltar que, embora estas variáveis exerçam sua
influência sob a resposta, esta relação pode não apresentar um mesmo
comportamento ao longo do tempo; por exemplo, a contagem de internações pode
variar linearmente num período de temperatura alta e em outros períodos esta
relação pode ser exponencial ou quadrática. Desta forma, é importante que seja
usado um modelo de regressão não-linear, como o MAG neste tipo de análise.
Outro ponto importante a ser ressaltado é que fatores como tabagismo e
condições sócio-econômicas não são considerados como variáveis de confusão na
relação entre a poluição do ar e os efeitos na saúde e, portanto, não foram
utilizados na modelagem como variávelis explicativas, uma vez que estas
variáveis são constantes, ou seja, não mudam com o tempo.
Estudos mostram que o efeito da poluição na saúde apresenta uma
defasagem em relação à exposição do indivíduo aos agentes poluidores, ou seja,
os atendimentos observados em um dia devem estar relacionados à poluição do
referido dia (dia corrente), assim como ao da poluição observada em dias
anteriores (lag1, lag2,...). Por este motivo, testaram-se nos modelos os valores
diários do material particulado bem como as médias móveis de dois a sete
dias.43-44 (exceto para os modelos estimados utilizando dados simulados).
23
Deve-se destacar que a distribuição Binomial Negativa também foi testada
e acabou-se optando pela distribuição de Poisson, uma vez que as diferenças entre
as estimativas encontradas nos dois casos foram muito pequenas.
Os resultados apresentados neste trabalho representam os acréscimos
percentuais nas internações hospitalares correspondentes a variações de 10 µg/m³
nos níveis dos material particulado. O acréscimo percentual estimado no número
de internações hospitalares é chamado no capítulo de resultados, de efeito
estimado e este é cálculado da seguinte forma:
( )
1
01
01
ˆ ˆ ˆ ˆexp( 10 )exp ( / 10) ˆexp 10 1 *100%
exp ( ) ˆ ˆexp( )
p
j j p p pt p j
ppt
j jj
X XE Y X
E Y X
β β β ββ
β β
−
=
=
+ + ++ ⎡ ⎤= = −⎣ ⎦
+
∑
∑
Onde pX é a variável PM10 e os outros 'jX s são as variáveis explicativas
do modelo (dummies de feriado, dia da semana, temperatura, umidade e chuva). O nível de significância adotado, em todas as análises foi de 5%.
2.4.1 Modelos lineares generalizados (MLG)
A idéia básica desta classe de modelos é estender as opções para a
distribuição da variável resposta, permitindo que a mesma pertença à família
exponencial de distribuições, bem como dar maior flexibilidade para a relação
funcional entre a média da variável resposta e o preditor linear12,27,34.
O MLG é definido em termos de um conjunto de variáveis aleatórias
independentes 1 2 nY ,Y , ,Y… , onde a distribuição de cada iY pertence à família
exponencial12,27:
( ) ( )( ) ( ) ( )i i i i i i i i if y , exp y b c dθ θ θ θ⎡ ⎤= + +⎣ ⎦
Outro pressuposto importante destes modelos é que os iY ' s são
identicamente distribuídos (não necessariamente com as mesmas funções ib ic e
id ). Portanto, a função densidade de probabilidade conjunta é dada por:
24
( ) ( ) ( ) ( )n n n
1 n 1 n i i i i i i ii 1 i 1 i 1
f y , ,y , , , exp y b c dθ θ θ θ θ= = =
⎡ ⎤… … = + +⎢ ⎥
⎣ ⎦∑ ∑ ∑
Assim como nos modelos lineares, nos MLG os parâmetros β β…1 p, , são
coeficientes das variáveis explicativas, tal que a combinação linear de ' sβ e das
variáveis explicativas é igual a uma função do valor esperado de iY ( )( )i iE Y μ= ,
ou seja:
( ) 'i i 0 1 1i 2 2i p pi ig X X X x , i 1, ,nμ η β β β β β= = + + + + = = …
onde,
g é uma função monótona e diferenciável chamada função de ligação;
β é o vetor de parâmetros ( )p 1 1+ × ;
iX é o vetor de variáveis explicativas ( )p 1 1+ × , i 1, ,n= … ;
iη é o preditor linear.
2.4.2 Modelos aditivos generalizados (MAG)
Nos MLG o preditor p
0 j jj 1
Xη β β=
= +∑ é linear no vetor de parâmetros β .
No caso dos modelos lineares aditivos generalizados, o preditor linear é
substituído pelo preditor ( )p
j ji j
g X=∑ , uma soma de funções suaves estimadas por
processos iterativos19. Há um grande número dessas funções. Como exemplo
pode-se destacar as funções loess e splines.19
Atualmente, os modelos aditivos generalizados (MAG) constituem a classe
de modelo mais utilizada para a análise de séries temporais epidemiológicas em
estudos que investigam a associação de poluição do ar com eventos de saúde. Este
modelo é mais adequado para explicar estruturas como sazonalidade, tendência e
ciclos presentes na variável resposta (série temporal de contagens de eventos de
saúde), do que, por exemplo, um MLG com variáveis senoidais e polinômios do
25
tempo. Isto foi verificado empiricamente, por exemplo, em um estudo realizado
por Conceição e colaboradores9. O estudo mostrou que embora os dois modelos
tenham produzido resultados coerentes, o MAG apresentou maior “poder” para
detectar efeitos significativos que foram de pequena magnitude.
2.4.2.1 Splines cúbicas
Suponha que não sejam mais considerados os pressupostos tradicionais de
um modelo linear convencional (MLG) e que o objetivo seja encontrar a função
que minimize a soma dos quadrados dos erros ( )( )2N
i ii 1
Y g k=
−∑ . Utilizando como
suavizador a função que minimiza esta soma, o resultado é uma curva não suave19.
Para resolver este problema, inclui-se um termo de penalização que considera a
quantidade de curvatura da função obtida:
( ){ } { }bN 2 2
i ii 1 a
Y g k g'' dxλ=
− +∑ ∫
onde ik ,i 1, ,n= … são pontos chamados nós, ordenados num intervalo [ ]a,b
qualquer, g tem primeira e segunda derivadas contínuas g' e g'' , o quadrado de
g'' é uma função integrável e 0λ > é o parâmetro de suavização da curva g . A
solução gλ do problema descrito acima é uma spline cúbica natural19. O segundo
termo da equação { }b
2
a
g'' dx∫ mede a rugosidade da função g , portanto, quanto
maior for o valor de λ , maior a suavização de g .
Considere a seqüência de pontos 1 na k k b< < < <… . Qualquer que seja o
valor de λ , uma função g definida sobre o intervalo [ ]a,b será uma spline cúbica
se19:
1) em cada intervalo ( ) ( ) ( ) ( )1 1 2 2 3 na,k , k ,k , k ,k , , k ,b… , g for uma função
polinomial cúbica;
26
2) cada par de polinômios em intervalos vizinhos se unem no ponto ik de tal
forma que g,g',g'' sejam contínuas em todos os pontos e,
conseqüentemente em todo o intervalo [ ] 1a,b2
.
2.4.2.2 Loess
A regressão local é um método não-paramétrico de suavização que
consiste em estimar retas de mínimos quadrados ponderados a sub-conjuntos de
dados31. Escolhe-se q=p/n, onde p é o número de pontos em que serão estimados
os modelos de regressão (quanto maior for o valor de p, mais suave será a curva
ajustada).
Seja um ponto qualquer ( )i it ,Z . A estimação dos modelos é feita
considerando que os pontos vizinhos mais próximos ao ponto central ( )i it ,Z ,
tenham maior ponderação. Para tanto, usa-se a função peso simétrica tri-cúbica ao
redor de it , dada por:
( ) ( )33 se u 11- uh u, caso contrário0
⎧ <⎪= ⎨⎪⎩
O peso de ( )j jt ,Z será ( ) i ji j
i
t th u h
d−⎛ ⎞
= ⎜ ⎟⎝ ⎠
, onde id é a distância de it a kt .
Ajusta-se uma reta aos p pontos de tal forma que α e β minimizem
( )i
n 2
i i ii
h t Y tα β=
− −∑ . O valor suavizado de IY∞ será i iˆ ˆˆY t , i 1, ,nα β= + =
2.5 Metodologia para simulação de variáveis
O objetivo principal desta etapa é simular diferentes cenários de
concentração de poluição do ar e analisar como esses cenários influenciam na
27
variável resposta de contagem de internações hospitalares por doenças
respiratórias em dois casos: utilizando a série diária e as outras 6 séries
amostradas com periodicidade de 6 dias de poluição do ar. Assim, foi possível
analisar se diferentes cenários de poluição atmosférica (não só os cenários
verificados na série real), podem produzir estimativas muito diferentes em relação
à série completa diária, caso sejam usados dados de poluição com periodicidade
de dias.
Para isso, buscou-se não só simular as variáveis de poluição do ar e
contagens de internações hospitalares por doenças respiratórias, mas todas as
variáveis que influenciariam no desfecho de saúde, como: chuva, temperatura e
umidade. Em outras palavras, procurou-se simular toda a estrutura de relação
entre as variáveis que participam da relação poluição atmosférica-saúde.
Na prática, foram simuladas a série diária de internações hospitalares de
crianças e as variáveis explicativas não fixas do modelo (MAG) de estimação dos
efeitos da poluição do ar na saúde: séries diárias de temperatura, umidade, chuva e
poluição do ar (PM10).
Na metodologia para simulação de séries temporais utilizada deste
trabalho, considerou-se que os parâmetros relacionados às distribuições de
probabilidade de cada variável simulada variam com o tempo, uma vez que todos
os parâmetros foram estimados por mês.
Embora a chuva normalmente não seja utilizada como variável explicativa
nestes tipos de estudos15,28,38,43-47,49-51 , deve-se destacar que esta série foi
simulada, para conseqüente uso nos modelos apresentados na seção 3.2.1. A
chuva foi simulada, pois utilizando-se dados reais, notou-se que esta variável foi
estatisticamente significativa no modelo de estimação de efeito do poluente PM10
nas contagens de internações hospitalares por doenças no aparelho respiratório em
crianças (série escolhida para o estudo de simulação). Além disso, as séries de
chuva simuladas foram utilizadas para gerar séries de temperatura e umidade.
Foram realizadas 100 simulações para cada variável. Na implementação
computacional dos algoritmos, foi empregada a linguagem de programação
R.2.5.040.
28
2.5.1 Simulação
Um estudo de um sistema real que envolve um conjunto de variáveis, que
desencadeiam um processo em um nível mais abrangente é, na maioria das vezes,
impossível de ser conduzido, muitas vezes por conta da limitação de recursos
financeiros, de pessoal especializado ou de outros elementos indispensáveis para o
bom andamento da pesquisa.
Uma solução para resolver esse impasse é tentar simular o sistema real. A
simulação descreve uma grande quantidade de técnicas úteis e variadas ligadas às
regras de algum modelo que procura imitar durante determinado período de
tempo, a operação de um sistema ou de um processo do mundo real32. A
representação de um modelo de simulação deve fundamentar-se em conhecimento
técnico de alto nível, que torne possível a descrição dos processos envolvidos37,39.
A simulação requer, com freqüência, o desenvolvimento de programas complexos
e um grande dispêndio de tempo de programação e experimentação36.
Para construção de um modelo de simulação é primordial que se saiba qual
o tipo de modelo mais apropriado ao problema em questão. A simulação poderá
ser de vários tipos25:
Simulação determinística: Modelos de simulação que não contém variáveis
aleatórias, ou seja, a única forma de obter saídas diferentes da simulação é utilizar
diferentes dados de entrada.
Simulação estocástica: Modelos de simulação que tem uma ou mais
variáveis aleatórias como entrada. Desta forma, pode-se obter diferentes saídas a
partir de um único conjunto de dados de entrada.
Simulação estática: Modelos de simulação em que o tempo não é relevante
e, portanto, não é considerado.
Simulação dinâmica: Modelos de simulação de um sistema que se
desenvolve ao longo do tempo.
29
Simulação discreta: Modelos de simulação em que as variáveis de entrada
são discretas.
Simulação contínua: Modelos de simulação em que as variáveis de entrada
são contínuas.
Neste trabalho, a simulação de dados foi realizada utilizando modelos de
simulação estocásticos, especificamente com base no método de Monte Carlo.
2.5.1.1 Simulação de Monte Carlo
A simulação de Monte Carlo17 é um método de simulação estocástica que
envolve a geração de observações de alguma distribuição de probabilidades. A
amostra obtida é comumente usada para aproximar funções de interesse. As
aplicações mais comuns deste método são em avaliação de integrais e
aproximação de funções complexas.
O método de Monte Carlo mais conhecido é o método da transformada
inversa. Esse método faz uso das propriedades da função distribuição acumulada
de uma variável aleatória. O método é baseado no fato que os valores da
distribuição acumulada ( )F x variam no mesmo intervalo de um número aleatório
uniforme.
Um número aleatório é definido como sendo uma variável aleatória
( )U: Unif 0,1 e a função distribuição acumulada ( )F x de uma variável aleatória X
é dada por ( )F x P(X x)= < .
Tal função possui as seguintes propriedades:
( )d F x 0dx
≥
( )xlim F x = 0→−∞
( )xlim F x = 1→∞
30
Portanto, basta gerar um número aleatório uniforme U , substituir este
valor em ( )F x obter o valor de x. O método da transformada inversa é ilustrado
na Figura 2 a seguir.
Figura 2: O método da transformada inversa
2.5.1.2 Gerador de números aleatórios
A base para o processo de simulação de Monte Carlo é a geração de
números aleatórios. Os números aleatórios simulados pelo computador não são
verdadeiramente aleatórios (pseudo-aleatórios), pois a seqüência gerada desses
números pode ser reproduzida. Para que um algoritmo gerador de números
aleatórios seja eficiente, este deve satisfazer as seguintes condições17:
-Este deve reproduzir números aleatórios uniformemente distribuídos entre
0 e 1 (isto pode ser investigado com a ajuda de testes estatísticos) ;
-Como a geração de números aleatórios é feita segundo uma fórmula
determinística, é evidente que a partir de um período, a seqüência gerada se
repete. Portanto, é importante que o algoritmo seja capaz de gerar seqüências com
o maior período possível;
-Deve ser rápido na geração e consumir pouca memória (eficiência
computacional);
A geração de números aleatórios é realizada utilizando fórmulas recursivas
que podem ser facilmente implementadas. Vários métodos foram desenvolvidos
desde a década de 40. A maioria dos métodos usados atualmente são variações do
31
chamado Método Linear Congruente25. Neste método os números aleatórios,
gerados sucessivamente, são obtidos através da relação recursiva:
1 ( ) mod n nx ax c m+ = +
A função ( )nax c+ mod m dá o resto da divisão inteira de ( )nax c+ por m.
Onde:
a - multiplicador c - incremento m - módulo.
0x - semente.
2.5.1.3 Simulação de variáveis climáticas (revisão bibliográfica)
A simulação de Monte Carlo tem sido usada freqüentemente para simular
séries sintéticas de variáveis climáticas. Neste trabalho, este método foi utilizado
para gerar as variáveis explicativas de “confusão” do modelo aditivo generalizado
apresentado anteriormente: séries diárias de temperatura máxima, umidade e
precipitação de chuva. Cada variável climática será descrita por uma distribuição
de probabilidade teórica conhecida, mas os valores dos parâmetros que descrevem
esta distribuição são dependentes da ocorrência de chuva.
Relatos de alguns estudos sobre métodos de simulação de variáveis
meteorológicas são encontrados na literatura. Bruhn e colaboradores5 construíram
um modelo de geração de dados climáticos diários, e conseguiram, em termos de
média, variabilidade e autocorrelação, boa similaridade entre os dados simulados
e os dados históricos. Os autores empregaram a técnica de Monte Carlo para gerar
valores diários de precipitação pluviométrica, temperatura (máxima e mínima),
umidade relativa do ar mínima e radiação solar global. A variável de chuva foi
gerada segundo um modelo de cadeia de Markov de primeira ordem, enquanto as
outras variáveis foram simuladas de forma condicional à ocorrência de dias
chuvosos.
Richardson41 apresentou um modelo de simulação estocástica de variáveis
climáticas, em que estas foram empregadas em modelos matemáticos
32
determinísticos para avaliação de mudanças hidrológicas. Este modelo simulava
dados diários de precipitação de chuva, temperatura (máxima e mínima) e
radiação solar global, condicionando (como no estudo citado anteriormente) à
ocorrência de dias chuvosos. Uma das características principais deste modelo é
que este simulava séries residuais de temperatura e radiação solar em um modelo
de geração multivariada.
Larsen & Pense23 também desenvolveram um modelo de simulação de
dados climáticos diários eficientes, segundo os variados testes estatísticos
realizados na pesquisa. O modelo também gerava seqüências diárias de
precipitação de chuva, radiação solar global e temperatura (máxima e mínima).
Uma peculiaridade importante na metodologia apresentada nesta análise é que na
elaboração dos modelos de temperatura e radiação solar, utilizaram-se desvios ao
invés dos valores observados. Esses desvios foram calculados baseando-se nas
médias mensais e nos valores extremos mensais e levando-se em consideração a
ocorrência de dias chuvosos.
Young55 desenvolveu um método para simulação simultânea de dados de
temperatura (máxima e mínima) e precipitação pluviométrica, fundamentado num
modelo de cadeia multivariada ao qual utiliza a análise discriminante. Apesar da
alta similaridade entre os dados observados e simulados, notou-se uma pequena
subestimativa da variância da média mensal de temperaturas ocorrida
provavelmente por conta das subestimativas para temperaturas máximas e
mínimas extremas.
2.5.1.4 Simulação - precipitação de chuva
O modelo utilizado para simular precipitação de chuva é um modelo
estocástico condicional. Este é dividido em duas etapas: a ocorrência de
precipitação, determinada através de uma Cadeia de Markov de primeira ordem
(ou seja, o evento do dia atual depende unicamente do dia anterior) para
determinação da condição do dia (probabilidades de seqüências de dias chuvosos
e dias não chuvosos) e estimação da magnitude da precipitação (caso esta venha a
ocorrer), através da distribuição de probabilidade Gama. A distribuição Gama foi
33
escolhida porque alguns estudos realizados na modelagem de precipitação diária
de chuva mostraram resultados muito satisfatórios do uso deste modelo2,7,35.
A matriz de transição utilizada foi a seguinte:
Os cálculos das probabilidades33,42,48 da matriz de transição empregadas
neste estudo foram efetuados através das seguintes equações:
N(W/D) N(W/D)P(W/D)= 1 P(D/D)N(D/D)+N(W/D) N(D)
= = −
N(W/W) N(W/W)P(W/W)=N(D/W)+N(W/W) N(W)
=
N(D/W) N(D/W)P(D/W)= 1 P(W/W)N(D/W)+N(W/W) N(W)
= = −
em que:
P(D /D) - probabilidade (obtida para cada mês) do dia atual ser não
chuvoso,
tendo sido o anterior não chuvoso;
P(W /D) - probabilidade (obtida para cada mês) do dia atual ser chuvoso,
tendo sido o anterior não chuvoso;
P(D / W) - probabilidade (obtida para cada mês) do dia atual ser não
chuvoso, tendo sido o anterior chuvoso;
Dia anterior Dia atual
Seco Chuvoso
Seco P(D /D) P(D / W)
Chuvoso P(W /D) P(W / W)
N(D/D) N(D/D)P(D/D)=N(D/D)+N(W/D) N(D)
=
34
P(W/W) - probabilidade (obtida para cada mês) do dia atual ser chuvoso,
tendo sido o anterior não chuvoso;
N(D /D) - número de dias não chuvosos do mês tendo sido o anterior não
chuvoso;
N(W /D) - número de dias chuvosos do mês tendo sido o anterior não
chuvoso;
N(D / W) - número de dias não chuvosos do mês tendo sido o anterior
chuvoso;
N(W / W) - número de dias chuvosos do mês tendo sido o anterior chuvoso;
N(D) - número de dias não chuvosos do mês;
N(W) - número de dias não chuvosos do mês.
O algoritmo para definição de dias não chuvosos ou chuvosos é
apresentado a seguir na Figura 3:
Figura 3: Algoritmo para definição de dias não chuvosos e chuvosos
Deve-se destacar que essas probabilidades, bem como α e β foram
estimados para cada mês. Foram considerados dias com chuva ou chuvosos, dias
que apresentaram valores iguais ou superiores a 0,2 mm41.
Um grande problema encontrado no uso da distribuição Gama é a
estimação de parâmetros, por conta da falta de resultados analíticos. Muitos
U(0,1),P(W|W),P(W|D)
Dia anterior é chuvoso
Dia anterior é não chuvoso
U(0,1) ≤P(W|W) U(0,1)>P(W|W) U(0,1) ≤P(W|D)
U(0,1)>P(W|D)
Dia atual é chuvoso
Dia atual é não chuvoso
Dia atual é chuvoso
Dia atual é não chuvoso
35
métodos podem ser utilizados, como por exemplo, os métodos mais conhecidos,
como método dos momentos e máxima verossimilhança7.
Kuttatharmmakul e colaboradores22 realizaram um estudo de comparação
dos métodos de estimativa de parâmetros para amostras com poucos dados,
indicando o método da máxima verossimilhança como de melhor performance. Os
estimadores dos parâmetros da distribuição Gama, utilizados no estudo, foram
obtidos pelo método da máxima verossimilhança52 e são dados pelas expressões
demonstradas a seguir:
Seja uma variável aleatória contínua ( )X Gama ,α β∼ , tal que 0α > é o
parâmetro de forma e 0β > é o parâmetro de escala. A distribuição de
probabilidade de X é dada por:
Se X é uma variável aleatória com distribuição Gama com parâmetros α
e β , então a média de X é 1m αβ= , a variância é 22m αβ= e a função de
verossimilhança é dada por:
( ) ( )`n
i
i
xnn 1n
ii 1
x eα βαβ α =
⎛ ⎞−⎜ ⎟⎜ ⎟− −− ⎝ ⎠
=
∑⎡ ⎤= Γ⎣ ⎦ ∏
Aplicando-se logaritmo, tem-se que:
( ) ( ) ( ) ( )
`n
i`ni
1 2 n ii
xlnL x ,x , ,x ; , n ln nln 1 ln xα β α β α α
β=
=
⎛ ⎞⎡ ⎤= − − Γ + − −⎜ ⎟⎣ ⎦ ⎝ ⎠
∑∑…
Derivando-se e igualando a zero:
( ) ( ) ( )ixn
11 2 n i
i 1
1L x ,x , ,x ; , x eα βαα β
β α
−⎛ ⎞⎜ ⎟− ⎝ ⎠
=
=Γ∏…
( ) ( )
x11 x e ,x 0
f x
0 ,c.c
α βαβ α
−−
⎧>⎪
= Γ⎨⎪⎩
36
( ) ( ) ( )( )
( )
' `n1 2 n
ii
`n
i1 2 n i
2
lnL x ,x , ,x ; ,nln n ln x 0
xlnL x ,x , ,x ; , n 0
α β αβ
α α
α β αβ β β
=
=
⎧∂ Γ ⎛ ⎞= − − + =⎪ ⎜ ⎟∂ Γ ⎝ ⎠⎪⎪
⎨⎪∂ −⎪ = + =⎪ ∂⎩
∑
∑
…
…
Simplificando, obtém-se que:
( ) ( )( )
' `n
ii
n ln n ln x 0
xˆ
αβ
α
βα
=
⎧ Γ ⎛ ⎞− − + =⎪ ⎜ ⎟⎪ Γ ⎝ ⎠⎨⎪ =⎪⎩
∑
Fazendo as devidas substituições, tem-se que:
( ) ( )( )
n
' ii
ln xln ln x
nα
αα
=Γ− = −Γ
∑
A expressão ( )( )
' αα
ΓΓ
é chamada função digama de α , e será denotada por
( )ψ α . As derivadas ( )'ψ α e ( )''ψ α são chamadas função trigama e tetragama,
respectivamente.
Portanto, a equação acima pode ser representada por:
( ) ( )
n
ii
ln xln ln x
nα ψ α =− = −
∑
A dificuldade do método está na dificuldade de obter o estimador de α ,
pois a equação anterior está implícita em α .
Seja
n
ii
ln xA ln x
n== −∑
. A função digama ( )ψ α pode ser obtida através do
desenvolvimento em séries:
( ) ( ) ( )ψ α α
α α=
= − −∑m
2K2K
k 1
B1ln2 2K
em que KB são os números de Bernoulli7.
37
Desenvolvendo-se a expressão anterior obtém-se:
( ) ( ) ( )2 4 6 8 10 K 2
1 1 1 1 1 1 1 1ln ln2 212 120 252 240 132 12
ψ α α αα αα α α α α α+≅ − − − − − − ≅ − −
Igualando a equação aproximada da função digama e a equação
( ) ( )ln Aα ψ α− = , tem-se que:
212A 6 1 0α α− − =
Como i ix ln x> , tem-se que A 0> . Portanto, para satisfazer a condição por
definição de que 0α > , a solução de interesse será:
( ) ( )1ˆ 1 1 4A 34A
α = + + e xˆˆ
βα
= .
2.5.1.5 Simulação - temperatura e umidade
As variáveis de temperatura e umidade foram simuladas a partir das
seguintes características observadas nas séries reais: forte correlação mensal,
distribuição Normal (como indicaram em geral os testes de Kolmogorov Smirnov
e Jarque Bera de normalidade), sazonalidade e autocorrelação (como mostraram
os gráficos da função de autocorrelação, autocorrelação parcial e periodograma) e
da ocorrência de chuva, visto que dias chuvosos, normalmente são dias de baixa
temperatura e alta umidade. A temperatura simulada foi a temperatura máxima
diária, uma vez que apenas esta apresentou distribuição Normal, segundo os testes
de normalidade.
A simulação das séries temporais de umidade e temperatura foi feita da
seguinte forma:
38
1) Estimou-se um modelo SARIMA4,13 (visto que as séries apresentam
forte sazonalidade) com intercepto para cada série temporal de temperatura
máxima e umidade relativa do ar.
A estimação dos parâmetros desses modelos é feita através do Filtro de
Kalman13, utilizando a representação de um modelo ARIMA em espaço de estado
(a representação do modelo SARIMA com intercepto é feita de forma análoga).
Seja um modelo de espaço de estado linear gaussiano:
( ) ( ) ( ) ( )t pX1 t pXm t mX1 t pX1 = Z + , y α ε ( )t 0, tN Hε ∼
( ) ( ) ( ) ( ) ( )α α ηt+1 mX1 t mXm t mX1 t mXr t rX1= T +R , ( )η ∼t 0, ,tN Q = …1, ,t n
Seja ( ) ( )2 2t t t-1 t t t t t-s t ty y y , y y , y y y , y ys s s sΔ = − Δ = Δ Δ Δ = − Δ = Δ Δ e
*ty yd D
t s= Δ Δ uma nova série sem tendência e sazonalidade.
Um modelo ARIMA(p, q) é dado por: * * *
1 1 1 1y y yt t p t p t t q t qφ φ ζ θ ζ θ ζ− − − −= + + + + + +… … ( )2t 0,N ζζ σ∼ onde
0, 0p q> >
Este poderá ser escrito na forma:
1
* *
1 1y y
r r
t j t j t j t jj jφ ζ θ ζ
−
− −= =
= + +∑ ∑ 1, ,t n= …
onde ( )max , 1r p q= + . Desta forma, um modelo ARIMA(p, q) na forma de
espaço de estados será dado por:
( )1 0 0 0tZ = ,
2 1 1 1 1 2
3 1 2 2 1 3
1 1
y yy y
y
t
t r t r t r t r
t t r t r t r t r
r t r t
yφ φ θ ζ θ ζ
α φ φ θ ζ θ ζ
φ θ ζ
− − + − − +
− − + − − +
− −
⎛ ⎞⎜ ⎟+ + + + +⎜ ⎟⎜ ⎟= + + + + +⎜ ⎟⎜ ⎟⎜ ⎟+ +⎝ ⎠
… …… …
…
,
39
1
1
1 0
0 10 0
tr
r
T T
φ
φφ−
⎛ ⎞⎜ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎝ ⎠…
,
1
1
1
t
r
R Rθ
θ −
⎛ ⎞⎜ ⎟⎜ ⎟= =⎜ ⎟⎜ ⎟⎝ ⎠
, t 1tη ζ +=
Uma vez que se tenham as matrizes acima, as estimativas de tα ( )ta são
calculadas através das equações recursivas do filtro de Kalman. A inicialização do
algoritmo é dada pelos estimadores de máxima verossimilhança dos parâmetros
do modelo ARIMA proposto. As equações do Filtro13 são dadas a seguir:
' 1
1
,
,,
t t t t
t t t t t
t t t t t
v y Z a
K T P Z Fa T a K v
−
+
= −
=
= +
'
' '1
,,
,
t t t t t
t t t t
t t t t t t t
F Z P Z HL T K Z
P T PL R Q R+
= +
= −
= +
1, ,t n=
2) Simula-se de dois modelos ARIMA(p,d,q) referentes às duas séries de
temperatura e umidade utilizando os p+q coeficientes estimados na etapa
anteriormente descrita;
3) Calcula-se a decomposição de Cholesky das matrizes de covariância de
temperatura e umidade e as médias dessas variáveis por mês para dias chuvosos e
não chuvosos, de acordo com a série simulada de chuva. Deve-se destacar que as
médias e covariâncias foram estimadas separadamente para dias chuvosos e não
chuvosos, pois é razoável considerar que dias de chuva costumam ser dias de
baixa temperatura e alta umidade. Este comportamento foi confirmado em todos
os meses de estudo, ou seja, as médias mensais observadas de temperatura foram
mais baixas nos dias chuvosos, enquanto as médias mensais de umidade relativa
do ar, foram mais altas para esses dias;
4) Simula-se a matriz bivariada20 de dados:
( ) ( ) ( ) ( )j j2 1 2 2 ij 2 1 j 2 1 = y + ˆ ,i=1, ,nij X X X Xx μΓ para cada mês, onde jΓ é o fator de
Cholesky da matriz de covariância dos dados no mês j, ˆ jμ é o estimador de
40
médias das duas variáveis no mês j e ijy é o vetor de dados simulados na etapa 3.
A estimação mensal das matrizes de correlação e vetores de médias, reproduziu as
sazonalidades destas duas variáveis.
Figura 4: Diagrama com as etapas da simulação das séries diárias de
temperatura e umidade
2.5.1.6 Simulação - PM10
Uma vez que as séries de umidade, poluição do ar e temperatura máxima
diária possuem uma forte correlação (principalmente quando as séries são
particionadas por mês) e os gráficos das funções de autocorrelação e
autocorrelação parcial indicaram que a série de material particulado provém de
um modelo auto-regressivo de ordem 1, a simulação da série de PM10 foi realizada
da seguinte forma:
Simula-se uma série diária de temperatura através do modelo ARIMA (1,0,2) utilizando os coeficientes
estimados na etapa (1) anterior.
Temperatura simulada
Simula-se um vetor normal bivariado de temperatura e umidade.
Vetor final com as séries simuladas de temperatura e umidade.Decomposição de Cholesky no mês j das matriz estimada de covariância dos dados reais de temperatura e umidade.Vetor com as séries simuladas de temperatura e umidade encontradas na etapa (2).Vetor de médias estimadas dos dados reais de temperatura e umidade no mês j para dias chuvosos e não chuvosos, de acordo com a série simulada de chuva.
1
(1)
Estima-se os parâmetros de um modelo SARIMA (1,1,2) (1,1,1)365 para a
série real diária de temperatura:
Temperatura real
( )( ) ( )( ) ( )( )φ θ θ ε− −Φ − − = − − −Θ365 365 2 3651 21 1 1 1 1 1t tB B B B T B B B
Estima-se os parâmetros de um modelo SARIMA (1,0,1) (1,0,1)365 para a série real diária de umidade:
Umidade real
( )( ) ( )( )φ θ ε− −Φ = − −Θ365 3651 1 1 1t tB B U B B
(2)( ) ( ) ( )φ θ θ− = − − ∼2
1 2ˆ ˆ ˆ1 1 , 0,1t t tB T B B a a N
Simula-se uma série diária de umidade através do modelo ARIMA (1,0,1) utilizando os coeficientes
estimados na etapa (1) anterior.
Umidade simulada
( ) ( ) ( )φ θ− = − ∼ˆ ˆ1 1 , 0,1t t tB U B a a N
1
( ) ( ) ( ) ( )μΓ j j2 1 2 2 ij 2 1 j 2 1 = y + ˆ ,i=1, ,nij X X X Xx
(3)
1
( )Γ =j 2 2X
( )μ =j 2 1ˆ X
( ) =ij 2 1y X
=tT =tU
=tT =tU
( ) =2 1ij Xx
41
1) Modelou-se para cada mês um modelo de regressão dinâmica (36
modelos). O modelo estimado para cada mês foi o seguinte:
1 1 2 1 3 2 , 1, ,t t t t tY Y X X t Tμ φ φ φ ε−= + + + + = …
onde tY é a série diária de PM10, 1tY − é a série de PM10 defasada em 1 dia,
1tX é a série de temperatura máxima diária observada e 2tX é a série de umidade
relativa do ar diária observada (os parâmetros do modelo também foram
estimados pelas equações recursivas do Filtro de Kalman13).
2) Simulou-se a série diária de material particulado, utilizando um modelo
de regressão dinâmica com variáveis explicativas de temperatura máxima e
umidade simuladas (como descrito na seção 2.4.2), considerando as estimativas
de φ calculadas anteriormente.
Figura 5: Diagrama com as etapas da simulação da série de material particulado
Estim a-se por m ês os parâm etros do seguinte m odelo de regressão dinâm ica :
Série real d iária de m ateria l particulado.Série real d iária de m aterial particulado defasada em 1 d ia.Série real d iária de tem peratura.Série real d iária de um idade .
(1)
(2)
μ φ φ φ ε−= + + + +1 1 2 1 3 2t t t t tY Y X X
=1tX
=tY
− =1tY
=2 tX
Sim ula-se um a série diária de m aterial particuladoutilizando os coefic ientes estim ados na etapa (1) anterior.
Série sim ulada diária de m ateria l particulado.Série sim ulada diária de m aterial particulado defasada em 1 d ia.Série sim ulada diária de tem peratura.Série sim ulada diária de um idade .
μ φ φ φ ε−= + + + +1 1 2 1 3 2ˆ ˆ ˆ
t t t t tY Y X X
=1tX
=tY
− =1tY
=2 tX
42
2.5.1.7 Simulação - contagem de internações hospitalares
As contagens de internações hospitalares foram geradas a partir do modelo
linear generalizado de Poisson12,27. A série diária simulada foi a de internações
hospitalares por doenças do aparelho respiratório em crianças com menos de 5
anos. A série de crianças foi escolhida para ser simulada, uma vez que os efeitos
estimados do efeito da poluição do ar para a saúde deste grupo (pelo menos no
Rio de Janeiro) são os mais significativos29.
Foram geradas n observações da distribuição de Poisson com parâmetros 1
1
ˆ ˆexp , 1, ,p
i it p pti
X X t nβ β−
=
⎛ ⎞+ =⎜ ⎟
⎝ ⎠∑ … ., uma vez que o modelo linear generalizado de
Poisson12,27, utilizado para simulação da série, é dado pela equação a seguir.
( )1
1
ˆ ˆlogp
t t i it p pti
E Y X Xη β β−
=
= = +∑
, 1,2,..., 1itX i p= − - representam as variáveis explicativas fixas: tempo e
dias da semana; e simuladas: temperatura máxima, umidade e chuva.
ptX - série de poluição do ar simulada.
ˆ , 1,2,...,i i pβ = - parâmetros estimados das variáveis explicativas obtidos
por um modelo aditivo generalizado, utilizando séries reais (estimativas
encontradas na seção 3.1.2).
43
Figura 6: Diagramas com as etapas da simulação da série diária de contagem de
internações hospitalares de crianças.
2.5.1.8 Simulação e estimação de efeitos - cenários de concentração de PM10
Neste estudo foram simulados alguns diferentes cenários de concentração
de poluição do ar, de forma a comparar posteriormente, duas situações: se estes
cenários fossem totalmente incluídos (série diária de poluição do ar) ou se em
parte não fossem incluídos (série com periodicidade de 6 dias) nas análises de
efeitos da poluição atmosférica na saúde. Estes cenários foram simulados da
seguinte forma.
1) Para cada mês foram estimados os componentes principais8,20 das séries
diárias observadas de poluição do ar, temperatura, umidade e chuva;
Simula-se uma série de contagens de internações hospitalares de crianças, através
de um modelo linear generalizado de Poisson, utilizando os parâmetros estimados na etapa (1).
Série simulada diária de contagens de internações hospitalares de crianças.Séries dummies feriado/ dia da semana e séries simuladasdiárias de chuva, temperatura e umidade.Série diária simulada de material particulado.
Estima-se os parâmetros do seguinte modelo aditivo generalizado de Poisson:
Série real diária de contagens de internações hospitalares de crianças.Séries dummies de feriado/ dia da semana e séries reais diárias de material particulado e chuva.Funções (splines/loess) das séries reais diárias de temperatura e umidade.
= + +∑ ∑4 2
01 1
log( ( )) ( , )t j jt l tk fkE Y b b X f u d
= =, 1,...,4jtX j
=∑2
1( , )l tk fkf u d
=tY
( )η β β=
= = +∑-1
1
ˆ ˆlogp
t t i it p pti
E Y X X
=tY
, 1,...,5jtX j = =
(2)
(1)
ptX =
44
2) Para cada mês foi realizada uma análise de agrupamentos hierárquica para 6
grupos de dias, utilizando os escores dos componentes principais encontrados na
etapa anterior. Nesse tipo de análise, os grupos que formam uma partição podem
ser subdivididos em conjuntos menores ou agrupados em conjuntos maiores de
forma que terminemos por obter a estrutura hierárquica completa de um dado
conjunto de dias20. Neste trabalho, foi utilizado o método hierárquico
aglomerativo e, em particular, o método de ligação pela média (average
linkage)8,20;
3) Identificou-se como dias atípicos, os dias pertencentes aos menores grupos
de cada mês, encontrados na análise de agrupamentos, com as maiores médias de
poluição do ar;
4) Calculou-se as probabilidades de ocorrer dias muito poluídos (dias atípicos)
por mês. Este cálculo foi feito dividindo-se o número de dias muito poluídos no
mês (tamanho do menor grupo do mês com maior média de concentração de
poluição do ar) pelo número de dias no mês.
5) Simulou-se uma série dummy t
=1, se é dia atípicoD
=0, se não é dia atípico⎧⎨⎩
segundo uma
distribuição ( )iBinomial n, p ,i=1,...,36η , onde n=2 (valores 0 e 1), pi é a
probabilidade de ocorrer dias atípicos por mês, segundo o cálculo apresentado na
etapa anterior e η indica o coeficiente de aumento da probabilidade de ocorrer
dias atípicos por mês. Os 'sη utilizados foram 1.25,2.00,3.00, ou seja, foram
considerados aumentos de 25%, 100% e até 200% de dias atípicos de poluição do
ar por mês. Portanto, os 3 diferentes valores de η representaram os três diferentes
cenários de poluição do ar.
6) Simulou-se a série de PM10, segundo os 3 diferentes cenários, através do
seguinte modelo:
( )1 1 2 1 3 2ˆ ˆ ˆˆ * 1, ,t t t t t t tY Y X X D a t Tμ φ φ φ δ−= + + + + = …
45
onde:
• ( )~ 0,1ta N
• tY é a série simulada de PM10 diária a ser simulada, 1tY − é a série simulada
de PM10 defasada em 1 dia, 1tX é uma série diária simulada de temperatura
máxima, 2tX é uma série diária simulada de umidade relativa do ar e ˆtD é
a série dummy simulada na etapa anterior, para cada cenário considerado
(aumentos de 25%, 100% e até 300% de dias atípicos de poluição do ar
por mês);
• μ , 1φ , 2φ e 3φ são os parâmetros estimados para um modelo de regressão
dinâmica da série de PM10 com variáveis explicativas de temperatura
máxima e umidade (dados diários reais);
• Considerou-se como ( )( )
, 1
1, 0t
tt
se D dia atípico
se D não é dia atípico
δδ
⎧ =⎪= ⎨=⎪⎩
onde δ é a
razão/ variação entre as médias de PM10 dos dias atípicos e dos outros dias
da série original diária deste poluente. Deve-se destacar que μ , 1φ , 2φ , 3φ
e δ foram calculados para cada mês.
7) Simulou-se a variável de contagem de internações hospitalares da
seguinte forma:
( )1
1
ˆ ˆlogp
t t i it pt pti
E Y X Xη β δβ−
=
= = +∑
, 1,2,..., 1itX i p= − - representam as variáveis explicativas fixas: tempo e
dias da semana; e simuladas: temperatura máxima, umidade, chuva e poluição do
ar (para cada cenário de poluição do ar, foi gerada uma série de contagem de
internações por doenças respiratória em crianças).
ptX - série simulada de material particulado para um determinado cenário.
ˆ , 1,2,..., 1i i pβ = − - parâmetros estimados das variáveis explicativas para
um modelo utilizando séries reais de temperatura, umidade e chuva (estimativas
encontradas na seção 3.1.2).
46
( )( )
ˆ , 1ˆˆ , 0
pt tpt
pt t
se D dia atípico
se D não é dia atípico
δβδβ
β
⎧ =⎪⎨
=⎪⎩- onde ˆ
ptβ é parâmetro estimado
do material particulado obtido para um modelo estimado utilizando séries reais
(estimativa encontrada na seção 3.1.2), ˆtD é a série dummy simulada na etapa
anterior, para cada cenário considerado (aumentos de 25%, 100% e até 200% de
dias atípicos de poluição do ar por mês) e δ é a razão/ variação entre as médias de
PM10 dos dias atípicos e dos outros dias da série original diária deste poluente.
(8) Para a análise do efeito da inclusão total (série diária de PM10) ou
inclusão em parte (séries de PM10 com periodicidade de 6 dias) desses cenários na
estimativa do efeito da poluição do ar na sáude, foram realizadas análises
similares às análises feitas na primeira etapa deste trabalho. Depois de obter as
séries diárias simuladas (temperatura máxima, umidade, chuva, poluição do ar,
contagem de internações hospitalares) para cada cenário, particionou-se este
conjunto de séries em seis conjuntos de séries distintas, cada qual com
periodicidade de seis dias e estimou-se os efeitos do material particulado nas
internações hospitalares por doenças respiratórias em crianças, para as sete séries,
a fim de se comparar quanto as estimativas para as séries com periodicidade de 6
dias se distanciam em relação à estimativa do efeito encontrado para a série diária,
considerada como a “verdadeira”. Utilizou-se também neste caso, para estimação
dos efeitos, o modelo aditivo generalizado (as variáveis explicativas dummies de
dias da semana e feriados também foram adicionadas aos modelos).
Simularam-se, portanto, 100 conjuntos de dados, para 3 cenários de
concentração de poluição do ar, onde os efeitos do poluente no desfecho de
internações hospitalares por doenças respiratórios em crianças foram estimados
para as 7 séries: diária e amostradas com periodiocidade de 6 dias. Em suma,
obteve-se 100*7*3 modelos e 100*7*3 estimativas do efeito do poluente PM10.
47
Figura 7: Diagramas com as etapas da simulação dos cenários de concentração
de poluição do ar.
O diagrama abaixo mostra um resumo de todas as etapas da simulação das
séries diárias de: precipitação de chuva, temperatura, umidade, material
particulado e contagens de internações hospitalares por doenças do aparelho
respiratório em crianças.
Análise de componentes principais por mês das séries diárias observadas de temperatura, umidade e poluição do ar.(1)
Análise de agrupamentos por mês , utilizando os escores dos componentes principais encontrados na etapa anterior.
Estimativas das probabilidades de ocorrer dias muito poluídos (dias atípicos) por mês: Divisão do número de dias muito poluídos no mês (tamanho do menor grupo do mês com maior média de concentração de poluentes) pelo número de dias no
mês.
Simulação da série diária de PM10, segundo os 3 diferentes cenários, através do seguinte modelo:
Razão/ variação entre as médias de PM10 dos dias atípicos e dos outros dias da série original diária deste poluente.;Série dummy simulada na etapa anterior.
(2)
(3)
(4)
(5)
(6)
Identificação dos dias atípicos de concentração de poluição do ar: dias pertencentes aos menores grupos de cada mês, encontrados na análise de agrupamentos, que obtiveram as maiores médias de poluição do ar.
1
Simulação de uma série dummy segundo uma distribuição Binomial(n,ηpi) onde pi é a probabilidade estimada na etapa (4) de ocorrer dias atípicos por mês e η indica o coeficiente de aumento da probabilidade de ocorrer dias atípicos por mês. Os η’s utilizados foram 1.25,2.00,3.00, representando assim 3 diferentes cenários de poluição do ar.
( )1 1 2 1 3 2ˆ ˆ ˆˆ * 1, ,t t t t t tY Y X X D a t Tμ φ φ φ δ−= + + + + = …
tD =
δ =
(7) Simulação da série diária de internações hospitalares, segundo os 3 diferentes cenários:
1
1
Depois de se obter as séries diárias simuladas para cada cenário, particionou-se este conjunto de séries em seis conjuntos de séries distintas, cada qual com periodicidade de seis dias, afim de se comparar os efeitos estimados para a série diária e para as séries com periodicidade de 6 dias, nos 3 diferentes cenários de concentração de material particulado.
(8)
48
Figura 8: Diagramas com as etapas da simulação das séries diárias de chuva,
temperatura, umidade, material particulado e contagem de internações
hospitalares
Simulação da série diária de
precipitação de chuva.
Simulação das séries diárias de
temperatura e umidade
Simulação da série diária de
concentração de PM10 e diferentes cenários
de poluição do ar. Estima-se um modelo aditivo generalizado
cuja variável resposta é a série real de contagens de internações hospitalares em crianças e as variáveis explicativas são:
dummies de tempo e dia da semana, bem como as séries reais diárias de temperatura,
umidade e material particulado
Com os efeitos (“betas”) estimados em (1), e com as variáveis meteorológicas e de poluição do ar simuladas (preditor linear), gera-se um
modelo linear generalizado de Poisson, criando-se desta forma uma série de
contagens de internações hospitalares sintética
(1)
(2)
Simulação da série diária de
contagens de internações hospitalares.
Calcula-se as probabilidades condicionaismensais de ocorrências de chuva através da
série real de chuva.
Gera-se um número uniformemente distribuído
entre 0 e 1 para determinar se a chuva ocorre no dia corrente
(atual).
Se o número excede a probabilidade de precipitação (probabilidade do dia ser úmido), a quantidade de chuva diária é igual a zero,
caso contrário, a magnitude da chuva é determinada por um número aleatório gerado
de uma distribuição Gama.
(1)
(2)
(3)
Estima-se por mês os parâmetros de um modelo de regressão dinâmica onde a variável resposta é a série diária de PM10 e as variáveis explicativas
são: série diária de PM10 defasada em 1 dia, temperatura e umidade diárias.
Com os parâmetros estimados na etapa (1), simula-se a série de material particulado,
utilizando as séries simuladas de temperatura e umidade e considerando diferentes cenários de
poluição do ar
(1)
(2)
49
2.6 Testes de adequação das variáveis simuladas
2.6.1 Teste de Kolmogorov - Smirnov univariado
O teste de Kolmogorov-Smirnov26 mede o grau de concordância entre a
distribuição de um conjunto de valores observados (amostra) e uma determinada
distribuição teórica. O teste indica se os valores da amostra podem ser
considerados como provenientes de uma população com uma determinada
distribuição.
A estatística compara a distribuição acumulada de freqüências observadas
com a respectiva distribuição teórica e determina o ponto em que essas duas
distribuições acusam a maior divergência. A distribuição amostral indica se essa
diferença máxima pode ser atribuída ao acaso.
A hipótese 0H é que os dados seguem a distribuição especificada.
A estatística do teste é definida como:
( )1max ii n
iD F yn≤ ≤
= −
Onde:
D - é o maior valor calculado e é chamado de desvio máximo.
F - é a distribuição acumulada teórica da distribuição que está sendo
testada e deve ser uma distribuição contínua (neste caso, a distribuição Normal).
( )iF y - distribuição acumulada das escolhas segundo 0H . Isto é, para
iY y= , o valor de ( )iF y é a proporção de casos esperados com escores iguais ou
menores do que iy .
in
- corresponde a freqüência acumulada de uma amostra aleatória de n
observações, quando Y é qualquer escore possível e i é o número de observações
não superiores a Y.
50
2.6.2 Teste de Jarque – Bera
O teste de Jarque Bera testa a normalidade de uma amostra. A estatística
deste teste é dada pela seguinte equação13:
( )22 2
2
36 4
KnJB S χ⎡ ⎤−⎢ ⎥= +⎢ ⎥⎣ ⎦
∼
Onde S é a assimetria, K é a medida de curtose e n é o tamanho da amostra.
2.6.3 Teste de Kolmogorov - Smirnov multivariado
O teste multivariado de Kolmogorov-Smirnov26 (uma extensão do teste
univariado de mesmo nome) se baseia no fato de que, se o vetor Y com
dimensão igual a p segue uma distribuição normal multivariada, ou seja,
( )pN ,pY μ ∑∼ , então ' 1 2( ) ( ) pV Y Yμ μ χ−= − Σ − ∼ . Assim, utilizando os estimadores
amostrais de μ e Σ , ' 1( ) ( ), 1, ,j j jV Y Y S Y Y j n−= − − = , a estatística teste de
Kolmogorov-Smirnov (KS) é calculada da seguinte forma:
( ) ( )max pVKS S V F V= −
Onde:
( )S V - é a função distribuição acumulada observada.
( )pF V - é a função distribuição acumulada empírica (neste caso, a
distribuição qui-quadrada).
3 Resultados
Os resultados estão separados em 3 seções. Na seção 3.1 são apresentados
os efeitos estimados do poluente PM10 na contagem de internações por doenças do
aparelho respiratório em idosos e crianças, utilizando dados observados da Rede
Automática da FEEMA e da SMAC. Os efeitos estimados para séries diárias são
comparados com àqueles encontrados para as séries particionadas com
periodicidade de 6 dias, a fim de analisar se as estimativas dos efeitos da poluição
para as séries com periodicidade de 6 dias, variam muito em relação ao efeito
estimado para série completa.
A seção 3.2 apresenta uma análise análoga à realizada na seção 3.1 para
contagem de internações por doenças do aparelho respiratório em crianças,
utilizando dados simulados, segundo diferentes cenários de concentração de
poluição do ar. Nesta seção também são apresentados os resultados das
comparações realizadas entre as séries reais e as séries simuladas de poluição do
ar e meteorológicas, a fim de verificar se as séries simuladas são adequadas para
serem utilizadas no estudo de comparação dos efeitos das séries diárias e séries
particionadas com periodicidade de 6 dias, através da simulação de diferentes
cenários de concentração de poluição.
A seção 3.3 apresenta os resultados dos efeitos estimados para morbidade
por doenças do aparelho respiratório em crianças e idosos, utilizando dados reais
com periodicidade de 6 dias de material particulado da Rede Manual da FEEMA.
3.1 Resultados para modelos de séries diárias e séries particionadas (periodicidade de 6 dias)
A seguir são apresentados os efeitos estimados utilizando os dados diários
da Rede Automática da FEEMA e da SMAC. São comparados os efeitos das
séries diárias completas e das séries amostradas com periodicidade de 6 dias.
52
3.1.1 Idosos com mais de 65 anos
São apresentadas nas Tabela 2 e Tabela 3 as estatísticas descritivas de PM10
e de contagem de doenças respiratórias em idosos, da série completa (diária) e das
outras séries com periodicidade de 6 dias. Nota-se a pequena variação entre as
estatísticas de poluição do ar nas diferentes séries, com exceção apenas dos
valores máximos. No caso das contagens de internações hospitalares em idosos, as
estatísticas descritivas nas 6 séries foram muito semelhantes (Tabela 3).
Tabela 2: Estatísticas descritivas das séries de PM10 (μg/m3).
série
total série 1 série 2 série 3 série 4 série 5 série 6
n 1093 183 183 183 181 181 182
média 56.27 57.36 55.79 56.38 56.06 55.48 56.52
desvio-
padrão 17.45 19.03 17.81 18.38 17.86 15.55 15.97
min 17.94 22.46 25.01 17.94 25.97 20.63 26.12
5 53.60 55.25 52.69 52.38 52.11 53.55 55.73
10 36.63 33.28 34.91 37.43 38.39 37.41 37.26
25 43.36 43.23 42.60 42.82 42.78 44.82 43.20
50 53.60 55.25 52.69 52.38 52.11 53.55 55.73
75 66.68 69.69 67.30 67.21 63.22 64.17 66.62
90 80.37 83.53 81.40 82.82 78.12 75.50 78.13
Percentis
95 88.78 89.82 89.02 91.13 89.85 85.19 86.97
máx 139.73 135.23 111.27 108.96 139.73 109.79 96.54
53
Tabela 3: Estatísticas descritivas das séries de contagem de doenças do
aparelho respiratório em idosos.
série
total série 1 série 2 série 3 série 4 série 5 série 6
n 1095 183 183 183 182 182 182
média 8.98 9.03 8.89 8.92 8.95 8.91 9.21
desvio-
padrão 4.08 4.15 4.30 4.00 4.04 4.23 3.81
min 1.00 1.00 1.00 1.00 1.00 1.00 2.00
5 9.00 8.00 8.00 8.00 9.00 8.50 9.00
10 4.00 4.00 3.00 4.00 4.00 4.00 4.00
25 6.00 6.00 6.00 6.00 6.00 6.00 7.00
50 9.00 8.00 8.00 8.00 9.00 8.50 9.00
75 12.00 12.00 12.00 11.50 12.00 12.00 11.00
90 14.00 15.00 14.80 14.00 14.00 14.00 14.00
Percentis
95 16.00 16.90 17.00 15.90 15.00 17.00 16.00
máx 22.00 20.00 21.00 22.00 21.00 21.00 20.00
São apresentados nas Tabela 4 e Tabela 5, seguidos com as respectivas
Figuras 9 e 10, os efeitos estimados e respectivos intervalos de confiança para
doenças do aparelho respiratório em idosos referentes a uma variação de 10μg/m3
na concentração de PM10 para a exposição no dia corrente e para exposição com
defasagem de 1 dia. Os diagnósticos de resíduos destes modelos se encontram no
Anexo II ao final deste trabalho. Em geral, os diagnósticos apresentaram bons
resultados (resíduos não correlacionados e normalmente distribuídos) e os
parâmetros de dispersão estimados dos modelos não variaram muito e
apresentaram em média um valor de 1.22.
Nota-se uma variação entre os efeitos estimados da série completa e das
séries com periodicidade de 6 dias, tanto para o dia do evento de poluição (dia
corrente), como para o dia posterior ao evento de poluição (lag1). A série 4, que
mostrou ter o maior valor máximo de material particulado (Tabela 2) foi a que
apresentou a maior estimativa de efeito estimado. Embora a variação entre as
estimativas das séries particionadas e a série completa não seja tão alta, estes
resultados mostram que para uma determinada série com periodicidade de 6 dias
pode haver um aumento da estimativa do efeito de até mais de 1% em relação à
serie completa diária.
54
Observa-se também um menor intervalo de confiança para o efeito
estimado, como já esperado, para a série completa diária em relação às séries
amostradas para o período de 6 dias, uma vez que a série com periodicidade de 6
dias possui menos observações que a série completa.
Tabela 4: Efeitos estimados (%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em idosos (PM10 (dia corrente)).
Efeitos
estimados (%) Intervalo de confiança p-valor
Série diária 1.07 -0.12 2.27 0.08
Série.1 0.77 -2.04 3.67 0.60
Série.2 1.38 -1.70 4.55 0.39
Série.3 -0.18 -3.03 2.75 0.90
Série.4 1.79 -1.09 4.77 0.23
Série.5 0.85 -2.53 4.34 0.63
Série.6 2.69 -0.70 6.20 0.12
Figura 9: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em idosos (PM10 (dia corrente) ).
1,070,77
1,38
-0,18
1,79
0,85
2,69
-4,00
-2,00
0,00
2,00
4,00
6,00
8,00
Série diária Série.1 Série.2 Série.3 Série.4 Série.5 Série.6
PM10 - dia corrente
Efei
tos
estim
ados
(%)
55
Tabela 5: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em idosos (PM10 (lag 1)).
Efeitos
estimados(%) Intervalo de confiança p-valor
Série diária 0.75 -0.47 1.99 0.23
Série.1 -1.30 -4.46 1.96 0.43
Série.2 0.69 -2.00 3.46 0.62
Série.3 0.66 -2.41 3.82 0.68
Série.4 2.38 -0.49 5.32 0.11
Série.5 -0.25 -3.43 3.03 0.88
Série.6 1.95 -1.35 5.36 0.25
Figura 10: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em idosos (PM10 (lag 1)).
Como forma de comparação dos efeitos encontrados nas séries de 6 dias e
na série completa, a Tabela 6 apresenta a média aritmética das estimativas
pontuais de efeitos estimados na séries amostradas e a estimativa pontual do efeito
estimado para série completa. Foram estimados modelos para estimação do efeito
de até 3 dias depois do evento de poluição do ar (lag 3) e o efeito acumulado de
até 7 dias depois do evento de poluição do ar (média móvel de até 7 dias). Nota-se
que os efeitos estimados na série completa não variaram muito de uma forma
geral em relação às médias dos riscos estimados para as séries com periodicidade
de 6 dias.
0,75
-1,30
0,69 0,66
2,38
-0,25
1,95
-6,00
-4,00
-2,00
0,00
2,00
4,00
6,00
Série diária Série.1 Série.2 Série.3 Série.4 Série.5 Série.6
PM10 - lag1
Efei
tos
estim
ados
(%)
56
Tabela 6: Média das estimativas dos efeitos estimados (%) das séries
amostradas e estimativa do efeito estimado para a série diária completa
(DAR65).
3.1.2 Crianças com menos de 5 anos
A mesma análise feita para a série de doenças do aparelho respiratório em
idosos foi realizada para a série de crianças com menos de 5 anos. Os diagnósticos
de resíduos dos modelos a seguir apresentados se encontram no Anexo II ao final
deste trabalho. Os resíduos em geral apresentaram-se normalmente distribuídos e
não correlacionados e em média o parâmetro de dispersão estimado para estes
modelos foi de 1,39.
A Tabela 7 apresenta as estatísticas descritivas de internações hospitalares
por doenças respiratórias em crianças. Note que neste caso as variações entre as
estatísticas das séries particionadas foram pequenas, mas maiores do que para as
contagens de internações por doenças respiratórias em idosos. As Tabela 8 e
Tabela 9 e as Figuras 6 e 7 apresentam os efeitos estimados e respectivos
intervalos de confiança para doenças do aparelho respiratório em crianças com
menos de 5 anos, referente a uma variação de 10μg/m3 na concentração de PM10,
considerando tanto a exposição no dia corrente como a exposição com defasagem
de 1 dia.
Note como houve uma variação razoável nas estimativas de efeitos
estimados para as 6 séries e para série completa diária, tanto para o modelo do dia
média Série diária
dia corrente 1.22 1.07
defasagem de 1 dia 0.69 0.75
defasagem de 2 dias 1.33 1.07
defasagem de 3 dias 1.56 1.54
média de 2 dias 1.13 1.16
média de 3 dias 5.27 3.01
média de 4 dias 1.41 1.35
média de 5 dias 1.16 0.85
média de 6 dias 1.27 0.89
média de 7 dias 1.08 0.76
57
corrente, como para o modelo de defasagem de 1 dia. Isto pode ser comprovado
pelos parâmetros de dispersão estimados (ANEXO II), uma vez que estes
apresentaram valores razoavelmente variantes nas 7 séries.
Isto indica, que embora não haja uma grande variação na série de poluição
e que embora os parâmetros de dispersão dos modelos ajustados não sejam
“ideais”, uma vez que estes não foram muito baixos e variaram mais que no caso
das séries de idosos, a perda de informação pelo uso de uma série de 6 dias,
parece acarretar em vieses na estimação dos efeitos, uma vez que a relação entre a
poluição do ar e o desfecho de internações hospitalares em crianças parece mudar
de forma considerável em diferentes períodos.
Tabela 7: Estatísticas descritivas das séries de contagem de doenças do
aparelho respiratório em crianças.
série
total série 1 série 2 série 3 série 4 série 5 série 6
n 1095 183 183 183 182 182 182
média 11.56 11.96 11.79 10.85 11.87 11.57 11.32
desvio-
padrão 7.16 7.51 7.52 6.80 7.49 6.95 6.67
min 0.00 0.00 0.00 1.00 1.00 0.00 1.00
5 10.00 10.00 10.00 9.00 10.50 11.00 11.00
10 3.00 3.00 4.00 3.00 3.00 4.00 3.00
25 6.00 7.00 6.00 6.00 6.00 6.00 6.00
50 10.00 10.00 10.00 9.00 10.50 11.00 11.00
75 16.00 17.00 15.50 15.00 17.00 15.00 15.00
90 21.00 21.00 22.80 21.00 24.00 20.00 20.90
Percentis
95 26.00 26.00 26.90 23.90 27.00 24.00 23.95
máx 36.00 35.00 36.00 33.00 33.00 34.00 33.00
58
Tabela 8: Efeitos estimados (%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em crianças (PM10 (dia corrente)).
Efeitos
estimados (%) Intervalo de confiança p-valor
Série diária 2.07 1.17 2.99 0.00
Série.1 -0.78 -2.76 1.24 0.45
Série.2 3.82 1.48 6.22 0.00
Série.3 5.54 3.26 7.87 0.00
Série.4 3.80 1.67 5.97 0.00
Série.5 3.32 0.75 5.95 0.01
Série.6 1.30 -1.27 3.94 0.33
Figura 11: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em crianças (PM10 (dia corrente) ).
Tabela 9: Efeitos estimados (%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em crianças (PM10 (lag 1)).
Efeitos
estimados Intervalo de confiança p-valor
Série diária 2.30 1.43 3.18 0.00
Série.1 1.53 -0.76 3.88 0.19
Série.2 3.26 1.23 5.33 0.00
Série.3 6.82 4.43 9.26 0.00
Série.4 4.24 2.19 6.32 0.00
Série.5 4.85 2.64 7.12 0.00
Série.6 1.49 -1.08 4.13 0.27
2,07
-0,78
3,82
5,54
3,803,32
1,30
-4,00
-2,00
0,00
2,00
4,00
6,00
8,00
10,00
Série diária Série.1 Série.2 Série.3 Série.4 Série.5 Série.6
PM10 - dia corrente
Efei
tos
estim
ados
(%)
59
Figura 12: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em crianças (PM10 (lag 1)).
A Tabela 10 apresenta a média aritmética dos efeitos estimados nas séries
amostradas e o efeito estimado para série completa. Nota-se que a média dos
efeitos estimados nas 6 séries foram bem diferentes em relação aos riscos
estimados para a série diária em todos os casos.
Tabela 10: Média das estimativas dos efeitos estimados(%) das séries
amostradas e estimativa do efeito estimado para a série diária completa (DAR5).
média Série diária
dia corrente 2.83 2.07
defasagem de 1 dia 3.70 2.30
defasagem de 2 dias 4.39 2.62
defasagem de 3 dias 3.37 1.95
média de 2 dias 4.16 2.81
média de 3 dias 5.32 3.66
média de 4 dias 6.08 4.33
média de 5 dias 6.27 4.49
média de 6 dias 6.21 4.31
média de 7 dias 5.69 3.86
2,30
1,53
3,26
6,82
4,244,85
1,49
-2,00
0,00
2,00
4,00
6,00
8,00
10,00
Série diária Série.1 Série.2 Série.3 Série.4 Série.5 Série.6
PM10 - lag1
Efei
tos
estim
ados
(%)
60
3.2 Simulação
Nesta seção são apresentados os principais resultados encontrados das 100
simulações realizadas para as séries de precipitação de chuva, temperatura,
umidade e material particulado.
Testes de adequação dos dados reais aos dados simulados foram
realizados, a fim de verificar se em média os principais padrões estatísticos das
séries reais foram preservados na simulação, e se de forma geral, a estrutura de
correlação entre as variáveis de internações hospitalares por doenças respiratórias,
poluição do ar, temperatura, umidade, e chuva foram bem representadas pelas
séries simuladas.
É importante destacar que se procurou simular todas as séries diárias
citadas anteriormente, para que desta forma, fosse possível simular de forma
realística, diferentes cenários de concentração de poluição do ar.
Estes diferentes cenários foram simulados, a fim de se analisar como estes
poderiam influenciar nos efeitos estimados da poluição do ar nos dois casos:
utilizando séries diárias e séries amostradas com periodicidade de 6 dias. Este
estudo foi realizado para que fosse possível comparar como as estimativas de
efeito da poluição das séries amostradas se distribuem ao redor do efeito estimado
na análise da série completa, o qual foi assumido como o efeito “verdadeiro”.
Desta forma, pode-se analisar não só o que se observou nas séries reais (primeira
parte do trabalho), mas outros possíveis diferentes cenários de poluição
atmosférica.
3.2.1 Simulação - precipitação de chuva
A seguir nas Tabela 11 e Tabela 12 são apresentadas respectivamente as
estatísticas de Kolmogorov Smirnov para a distribuição Gama e as estimativas dos
parâmetros α e β desta distribuição para os dados observados de chuva por mês
e ano. Note que os p- valores foram muito altos em todos os períodos, indicando
que a distribuição Gama é realmente adequada para simulação dos dados de
chuva.
61
Observa-se também que as estimativas de α e β por mês mudaram
significamente (Tabela 12), o que confirma que a estimação desses parâmetros
deve ser feita mensalmente.
Tabela 11: P-valores dos teste de Kolmogorov Smirnov para uma distribuição
Gama por mês e ano.
meses p-valor meses p-valor 1 0.78 19 0.61 2 0.55 20 0.57 3 0.83 21 0.81 4 0.93 22 0.46 5 0.71 23 0.45 6 0.82 24 0.50 7 0.77 25 0.88 8 0.73 26 0.50 9 0.81 27 0.92 10 0.46 28 0.86 11 0.66 29 0.77 12 0.36 30 0.38 13 0.73 31 0.81 14 0.45 32 0.62 15 0.83 33 0.66 16 0.96 34 0.46 17 0.81 35 0.55 18 0.97 36 0.86
62
Tabela 12: Estimativas dos parâmetros da distribuição Gama (α , β ) por mês e
ano.
meses α β 1 0.32 37.97 2 0.27 19.63 3 0.25 36.99 4 0.39 21.10 5 0.42 11.01 6 0.39 11.33 7 0.31 32.50 8 0.32 13.14 9 0.34 18.47
10 0.28 24.80 11 0.28 41.87 12 0.24 12.08 13 0.31 13.95 14 0.26 38.63 15 0.30 21.92 16 0.32 44.10 17 0.33 14.13 18 0.36 26.68 19 0.29 19.04 20 0.38 7.46 21 0.28 32.96 22 0.24 50.82 23 0.26 14.33 24 0.29 10.37 25 0.45 17.09 26 0.26 27.15 27 0.33 25.94 28 0.28 35.23 29 0.34 44.17 30 0.28 7.82 31 0.28 46.03 32 0.24 38.35 33 0.38 14.00 34 0.30 9.21 35 0.29 17.07 36 0.43 23.51
63
A Figura 13 apresenta os gráficos da série real e de uma série simulada de
chuva. Note como os gráficos das duas séries foram semelhantes. Na Tabela 13
são apresentados os coeficientes de correlação linear de Pearson entre as médias
das freqüências mensais de dias chuvosos nas séries simuladas e as freqüências
mensais observadas de dias chuvosos na série original, bem como a correlação
entre as médias dos totais de precipitação por mês nas séries simuladas e os totais
de precipitação na série original por mês. Note que as correlações foram muito
altas nesses dois casos, indicando assim que a simulação preservou as principais
características da série real de precipitação de chuva.
Figura 13: Gráficos da série real e de 1 série simulada de chuva.
Tabela 13: Coeficientes de correlação de Pearson para freqüência mensal de
dias chuvosos e precipitação total por mês de chuva (séries simuladas e série
observada de chuva). Coeficiente de Pearson, p-valor.
Freqüência mensal de dias chuvosos (série real)
Total mensal de precipitação (série real)
Freqüência média mensal de dias chuvosos
(séries simuladas)
0.90 (0.00)
Total médio mensal de precipitação
(séries simuladas) 0.99
(0.00)
0 200 400 600 800 1000
020
4060
8010
012
0
chuva chuva
0 20 40 60 80
020
040
060
080
010
00
0 200 400 600 800 1000
020
4060
8010
012
0
chuva.simulada chuva.simulada
0 20 40 60 80 100 120
020
040
060
080
010
00
64
3.2.2 Simulação - temperatura e umidade
Os testes de Kolmogorov-Smirnov e Jarque-Bera foram utilizados para
testar a normalidade das séries diárias de temperatura e umidade. As
Tabela 15, Tabela 16 e Tabela 17 mostram os resultados deste teste para
temperatura e umidade separadamente (teste univariado), como para o teste
conjunto de normalidade destas variáveis (teste bivariado). Como pode ser visto,
os p-valores dos testes de Kolmogorov Smirnov univariados e bivariado foram
consideravelmente maiores que 0.05, indicando, portanto, que as séries diárias de
umidade e temperatura têm distribuição normal univarida/ bivariada. Como pode
ser visto, o teste de Jarque Bera apresentou não normalidade apenas para a
temperatura.
A Tabela 14 mostra as correlações entre as séries diárias de umidade e
material particulado. Note como as correlações mensais foram muito altas, o que
corroborou para que a estimação das matrizes de covariância na geração da
Normal Bivariada fosse feita mensalmente.
Os gráficos de fac e facp das séries de temperatura e umidade foram
utilizados para verificar as ordens dos respectivos modelos SARIMA (Figuras 14
e 15). Os modelos que apresentaram os melhores diagnósticos de resíduos3,5,26 e,
portanto, escolhidos para simulação das séries de umidade e temperatura foram o
SARIMA(1,0,1)*(1,0,1)12 e SARIMA(1,1,2)(1,1,1)12 respectivamente. Os
modelos simulados a partir das p+q estimativas encontradas no modelo sazonal
foram ARIMA(1,0,1) para série de umidade e ARIMA(1,0,2) para série de
temperatura.
65
Tabela 14: Correlações de Pearson entre temperatura e umidade por mês e ano. P-
valor ( 0.05α = ).
meses Correlações p-valor Total -0.30 0.00
1 -0.77 0.00 2 -0.84 0.00 3 -0.70 0.00 4 -0.83 0.00 5 -0.79 0.00 6 -0.57 0.00 7 -0.88 0.00 8 -0.76 0.00 9 -0.67 0.00
10 -0.45 0.01 11 -0.77 0.00 12 -0.62 0.00 13 -0.52 0.00 14 -0.83 0.00 15 -0.85 0.00 16 -0.61 0.00 17 -0.76 0.00 18 -0.66 0.00 19 -0.80 0.00 20 -0.83 0.00 21 -0.73 0.00 22 -0.88 0.00 23 -0.53 0.00 24 -0.78 0.00 25 -0.83 0.00 26 -0.90 0.00 27 -0.83 0.00 28 -0.83 0.00 29 -0.87 0.00 30 -0.94 0.00 31 -0.84 0.00 32 -0.26 0.16 33 -0.39 0.03 34 -0.69 0.00 35 -0.85 0.00 36 -0.79 0.00
Tabela 15: Teste de Kolmogorov-Smirnov bivariado para temperatura e umidade
( 0.05α = ).
Estatística teste p-valor
0.03 0.39
66
Tabela 16: Testes de Kolmogorov-Smirnov e Jarque Bera para temperatura
( 0.05α = ).
Testes Estatísticas testes p-valor
Kolmogorov-Smirnov 0.04 0.10
Jarque Bera 16.02 0.00
Tabela 17: Testes de Kolmogorov-Smirnov e Jarque Bera para umidade
( 0.05α = ).
Testes Estatísticas testes p-valor
Kolmogorov-Smirnov 0.01 0.98
Jarque Bera 3.75 0.15
A seguir são apresentados gráficos das séries observadas, histogramas,
correlogramas e correlogramas parciais das variáveis de temperatura e umidade,
bem como os mesmos gráficos de duas séries simuladas destas variáveis (Figuras
14 e 15). Como pode ser visto, os padrões estatísticos da série simulada tanto de
temperatura, como de umidade foram de forma geral (pelo menos para estas séries
simuladas), preservados em relação às series reais. Note também que apesar da
série simulada de umidade ter apresentado alguns (poucos) valores acima de
100%, uma vez que a distribuição utilizada para simulação da série foi a Normal,
os correlogramas e histogramas foram muito parecidos.
Para verificar se em média as 100 simulações apresentaram padrões de
média e variância próximos à série observada, foram calculadas as médias das
médias mensais das 100 variáveis simuladas e a média das variâncias mensais das
100 variáveis simuladas de temperatura e umidade. A partir disso, calculou-se as
correlações entre essas estimativas e as mesmas estimativas (médias mensais e
variâncias mensais) para a série real destas variáveis. Como pode ser visto nas
Tabela 18 e Tabela 19, as correlações foram muito altas nos dois casos.
Da mesma forma, para constatar se o padrão de autocorrelação das séries
reais foram preservados, calculou-se as correlações entre a função de
autocorrelação/ autocorrelação parcial das séries observadas de temperatura e
umidade e as médias das estimativas de fac e facp das 100 variáveis simuladas
destas duas variáveis (Tabela 18 e Tabela 20). As correlações foram altas tanto
67
para fac, como para facp, o que corrobora que os padrões estatísticos das séries
reais foram de forma geral preservados pelas séries simuladas. Deve-se destacar
que para o cálculo dessas correlações considerou-se apenas as estimativas até o
maior lag estatisticamente significativo e menor que 30 das funções de
autocorrelação e autocorrelação parcial das séries reais.
Figura 14: Gráficos das séries observada e simulada de temperatura máxima
diária.
Tabela 18: Coeficientes de correlação de Pearson entre médias mensais/
variâncias mensais das séries simuladas e série observada de temperatura.
Coeficiente de Pearson, p-valor.
Médias mensal de temperatura (série real)
Variância mensal de temperatura (série real)
Média mensal de temperatura
(séries simuladas)
1.00 (0.00)
Variância mensal de temperatura
(séries simuladas) 1.00
(0.00)
2025
3035
40
temperatura
2001 2002 2003
temperatura
20 25 30 35 40
050
100
150
200
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
temperatura
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
Lag
Parti
al A
CF
temperatura
2025
3035
40
temperatura_simulada
2001 2002 2003
temperatura_simulada
15 20 25 30 35 40 45
050
100
150
200
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
temperatura_simulada
0 5 10 15 20 25 30
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Lag
Parti
al A
CF
temperatura_simulada
68
Tabela 19: Coeficientes de correlação de Pearson entre as estimativas de fac
(30 lags)/facp (10 lags) das séries simuladas e série observada de temperatura.
Coeficiente de Pearson, p-valor. fac da série observada facp da série observada
fac (média das séries
simuladas)
0.97
(0.00)
facp (média das séries
simuladas)
0.98
(0.00)
Figura 15: Gráficos das séries observada e simulada de umidade relativa do ar.
Tabela 20: Coeficientes de correlação de Pearson entre médias mensais/
variâncias mensais das séries simuladas e série observada de umidade.
Coeficiente de Pearson, p-valor.
Média mensal de umidade (série real)
Variância mensal de umidade (série real)
Média mensal de umidade (séries simuladas)
0.99 (0.00)
Variância mensal de umidade (séries simuladas) 1.00
(0.00)
5060
7080
9010
0
umidade
2001 2002 2003
umidade
60 70 80 90 100
050
100
150
200
250
300
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
umidade
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
LagPa
rtial
AC
F
umidade
5060
7080
9010
0
umidade_simulada
2001 2002 2003
umidade_simulada
50 60 70 80 90 100
050
100
150
200
250
300
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
umidade_simulada
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
Lag
Parti
al A
CF
umidade_simulada
69
Tabela 21: Coeficientes de correlação de Pearson entre as estimativas de fac
(14 lags)/facp (22 lags) das séries simuladas e série observada de umidade.
Coeficiente de Pearson, p-valor.
fac da série observada facp da série observada fac
(média das séries simuladas)
0.98 (0.00)
facp (média das séries
simuladas) 0.97
(0.00)
3.2.3 Simulação - material particulado (PM10)
O teste de Kolmogorov Smirnov e o teste de Jarque Bera foram utilizados
para testar a normalidade univariada da série de poluição do ar e a normalidade
multivariada dos dados de poluição do ar, umidade e temperatura (Tabela 22 e
Tabela 23). Note que o teste indicou a não normalidade nos dois casos,
impossibilitando assim a simulação de uma distribuição Normal multivariada para
as séries diárias de poluição do ar, temperatura e umidade.
Procurou-se, portanto, encontrar um modelo de simulação para série de
material particulado que considerasse a relação existente desta série com as séries
de temperatura e umidade.
Uma vez que os gráficos de fac e facp das séries de material particulado
mostraram um padrão de um modelo ARIMA(1,0,0) e a série de material
particulado possui alta e significativa correlação tanto com as série de
temperatura, como com a série de umidade, o modelo escolhido para simulação da
série de PM10 foi um modelo de regressão dinâmica com as seguintes variáveis
explicativas: poluição do ar defasada em 1 dia, temperatura e umidade diárias.
Estes modelos foram estimados a cada mês do período de análise, uma vez que as
estimativas das covariâncias entre a série de poluição com temperatura e umidade
não se apresentaram constantes em relação ao tempo, devido a sazonalidade das
séries.
Os diagnósticos dos resíduos3,5,26 para os 36 (12 meses * 3 anos) modelos
estimados foram satisfatórios. Como já mencionado no capítulo 2, a partir dos
coeficientes encontrados dos modelos estimados, simulou-se 100 séries de
70
poluição do ar, utilizando estes coeficientes e as variáveis simuladas de
temperatura e umidade. Os principais resultados são encontrados a seguir.
A Figura 16 apresenta os gráficos de uma série simulada de material
particulado e da série diária observada. Observa-se que os padrões de
sazonalidade e autocorrelação, neste caso, foram razoavelmente preservados.
Como nas séries de temperatura e umidade, em média as 100 simulações
da série de material particulado apresentaram médias mensais muito próximos à
série real. Isto pode ser visto na Tabela 24, visto que a correlação entre as médias
mensais das simulações (média das médias mensais das 100 séries simuladas) e da
série real foi muito alta.
A variância mensal simulada não foi tão próxima à real (correlação de 0.79
- Tabela 24), o que é esperado, uma vez que a série de poluição do ar possui dias
atípicos que não foram considerados na simulação, exceto no caso das simulações
desta série considerando diferentes cenários de concentração de poluição do ar.
A Tabela 25 a seguir mostra as correlações entre as médias das estimativas
de fac e facp das 100 séries simuladas e as estimativas de fac e facp da série diária
observada de material particulado. As correlações entre as estimativas da função
de autocorrelação e autocorrelação parcial foram altas também, principalmente
para a função de autocorrelação, o que corrobora que o padrão estatístico da série
real foi de forma geral, preservado pelas séries simuladas. É importante ressaltar
que considerou-se no cálculo das correlações as 5 primeiras estimativas das
funções de autocorrelação e autocorrelação parcial da série real de poluição do ar.
Tabela 22: Teste de Kolmogorov-Smirnov e Jarque Bera para poluição do ar
( 0.05α = ).
Estatísticas testes p-valor
Kolmogorov-Smirnov 0.07 0.00
Jarque-Bera 166.75 0.00
Tabela 23: Teste de Kolmogorov-Smirnov multivariado para poluição do ar,
umidade e temperatura ( 0.05α = ).
Estatística teste p-valor
0.23 0.00
71
Figura 16: Gráficos das séries observada e de uma série simulada de PM10.
Tabela 24: Coeficientes de correlação de Pearson entre médias mensais/
variâncias mensais das séries simuladas e série observada de material
particulado. Coeficiente de Pearson, p-valor.
Média mensal de umidade (série real)
Variância mensal de umidade (série real)
Média mensal de umidade (séries simuladas)
0.99 (0.00)
Variância mensal de umidade
(séries simuladas) 0.79
(0.00)
Tabela 25: : Coeficientes de correlação de Pearson entre as estimativas de
fac/facp (5 lags) das séries simuladas e série observada de material particulado.
Coeficiente de Pearson, p-valor.
fac da série observada facp da série observada fac
(média das séries simuladas)
0.98 (0.00)
facp (média das séries
simuladas) 0.95
(0.01)
020
4060
8010
012
014
0
poluicao
2001 2002 2003
poluicao
20 40 60 80 100 120 1400
5010
015
020
025
030
035
00 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
poluicao
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
Lag
Parti
al A
CF
poluicao
020
4060
8010
012
014
0
poluicao_simulada
2001 2002 2003
poluicao_simulada
20 40 60 80 100 120
050
100
150
200
250
300
350
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
poluicao_simulada
0 5 10 15 20 25 30
0.0
0.2
0.4
0.6
Lag
Parti
al A
CF
poluicao_simulada
72
3.2.4 Resultados para modelos com séries simuladas, segundo diferentes cenários de concentração de poluição do ar
A seguir são apresentados os resultados da simulação de cenários de
concentração de poluição do ar. Séries diárias de contagem de internações por
doenças do aparelho respiratório em crianças com mais de 5 anos foram
simuladas, segundo um modelo linear generalizado de Poisson, utilizando as
séries climáticas simuladas, séries fixas (séries dummies para feriados e dias da
semana) e de poluição do ar e considerando 3 diferentes cenários de concentração
de material particulado (aumentos de dias atípicos de concentração de material
particulado por mês de 25%, 100% e 200%).
Para cada conjunto de dados simulados, ou seja, para cada cenário de
concentração de poluição do ar, os efeitos do material particulado no desfecho de
internações hospitalares foram estimados, utilizando a estrutura dos modelos
aditivos generalizados estimados na seção 3.1.2, tanto para as séries reais diárias
como para as séries particionadas de 6 dias (mesmos números de graus de
liberdade, no caso de ter se usado a função spline e mesmo tamanhos de janelas,
no caso de ter se usado a função loess).
Como considerou-se neste estudo 3 diferentes cenários de concentração de
poluição do ar, 100*3 (100 simulações e 3 cenários) modelos foram estimados
para as séries diárias e 100*3*6 (100 simulações, 3 cenários e 6 séries
particionadas) modelos foram estimados para as séries particionadas com
periodicidade de 6 dias.
A Tabela 26| e a Figura 16 apresentam as médias dos efeitos estimados
estimados para os 100 modelos das séries diárias simuladas e com periodicidade
de 6 dias, considerando os 3 diferentes cenários de concentração de poluição do
ar: aumento de probabilidade de dias atípicos de concentração de material
particulado de 25% ,100% e 200%.
Nota-se que a quanto maior a quantidade de dias atípicos simulados, maior
é a média e variação entre a estimativa de efeito da série diária e da média dos
efeitos estimados para as séries de 6 dias. Deve-se destacar que em média a
quantidade de dias atípicos por mês na série real de material particulado foi de 3
dias. Portanto, quando se diz que foi simulado um aumento de 25%,100% e
73
200%, houve em média um aumento na série diária de 1 ano, por exemplo, de 36
dias atípicos para: 45, 72 e 108 dias atípicos respectivamente.
Tabela 26: Efeitos estimados (%) para doenças do aparelho respiratório em
crianças (PM10 - dados simulados com aumento de 25%, 100% e 200% de dias
atípicos de material particulado por mês - série diária e séries com periodicidade
de 6 dias).
Figura 17: Média dos efeitos estimados nas 100 séries simuladas por cenário de
concentração de poluição do ar (séries particionadas e séries completa).
Efeitos estimados 25% 50% 100% série 1 2,78 3,11 3,78 série 2 2,25 3,13 3,97 série 3 2,68 2,93 3,66 série 4 2,06 4,35 4,21 série 5 2,54 3,57 3,54 série 6 2,43 2,94 3,40
Média dos efeitos nas séries particionadas 2,27 2,64 2,72
Efeito para série completa 2,46 3,34 3,76
Média dos efeitos nas séries particionadas/ Efeito para
série completa
0,92 0,79 0,72
2,46
2,12
2,65
2,00
2,34
2,65
2,26
2,63
2,96
2,72
3,97
3,19
2,65 2,63
3,26
3,95
3,42 3,383,20
3,31
2,67
0,00
0,50
1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
série 1 série 2 série 3 série 4 série 5 série 6 série completa
25%100%200%
74
3.3 Resultados para modelos de séries com periodicidade de 6 dias (dados FEEMA)
A seguir são apresentadas algumas análises para a cidade do Rio de
Janeiro utilizando os dados reais com periodicidade de 6 dias da Rede Manual
disponibilizados pela FEEMA. Considerou-se como indicador de poluição do ar
do município, a média diária entre as séries de poluição do ar nos monitores
manuais localizados no Rio (a média diária calculada através de dados imputados,
segundo um algoritmo EM21). Foram estimados 4 modelos: 2 para doenças do
aparelho respiratório em idosos (dia corrente e lag1) e 2 para doenças do aparelho
respiratório em crianças (dia corrente e lag1). Os diagnósticos de resíduos de
todos os modelos apresentados a seguir se encontram no Anexo IV ao final deste
trabalho. Os diagnósticos em geral, apresentaram bons resultados, com resíduos
normalmente distribuídos e não correlacionados.
3.3.1 Idosos com mais de 65 anos
A Tabela 27 e a Figura 18 a seguir mostram os efeitos estimados e
intervalos de confiança em porcentagem do aumento de internações hospitalares
de doenças do aparelho respiratório em idosos residentes na cidade do Rio para
um aumento na exposição de 10 μg/m3 deste grupo (dia corrente e (lag1)).
O efeito foi significativo apenas para o dia corrente (3.36% de aumento
nas internações hospitalares). Este efeito foi maior se comparado às estimativas
para a série diária e para as séries particionadas, utilizando apenas dados da Rede
Automática da FEEMA e da SMAC (Tabela 4).
75
Tabela 27: Efeitos estimados, aumentos percentuais (%) e intervalos de
confiança de 95% para doenças do aparelho respiratório em idosos na cidade do
Rio de Janeiro.
Efeito estimado (%) Intervalo de confiança p-valor
dia corrente 3.36 1.19 5.58 0.00 lag1 1.06 -1.23 3.41 0.37
Figura 18: Efeitos estimados(%) e intervalos de confiança de 95% para doenças
do aparelho respiratório em idosos na cidade do Rio de Janeiro.
3.3.2 Crianças com menos de 5 anos
Foram estimados também os efeitos da variação de 10 μg/m3 de material
particulado na contagem de internações hospitalares em crianças residentes na
cidade do Rio. Os efeitos foram muito altos e significativos, tanto para o dia
corrente, como para 1 dia após a exposição do grupo à poluição do ar (lag 1).
As estimativas pontuais dos efeitos estimados, nos dois casos,
apresentaram-se muito maiores, se comparadas às estimativas utilizando apenas
dados diários da Rede Automática da FEEMA e da SMAC, tanto para a série
diária completa, como para as séries amostradas com periodicidade de 6 dias
(Tabela 8 e Tabela 9). Isto poderia ser explicado pelo fato da Rede Manual medir
dados acumulativos da concentração de material particulado a cada seis dias,
diferentemente da Rede Automática que mede dados não acumulativos e
-2.00
-1.00
0.00
1.00
2.00
3.00
4.00
5.00
6.00
dia corrente defasagem de 1 dia
PM10
%R
R
76
diariamente. Além disso, o indicador de concentração de material particulado para
cidade do Rio, utilizado na estimação dos efeitos encontrados nas Tabela 8 e
Tabela 9, foi calculado através da média deste poluente em 6 monitores/ 4 bairros,
enquanto na Tabela 28 a seguir, o índice de poluição do ar para a cidade do Rio
utlizado, foi calculado através da média de material particulado nos 7 monitores/ 7
bairros da mesma Rede localizados no município, ou seja 3 bairros a mais que na
Rede Automática.
Tabela 28: Efeitos estimados, aumentos percentuais (%) e intervalos de
confiança de 95% para doenças do aparelho respiratório em crianças na cidade
do Rio de Janeiro.
Efeito estimado (%) Intervalo de confiança p-valor
dia corrente 8.10 5.40 10.80 0.00 lag1 7.30 4.50 10.20 0.00
Figura 19: Efeitos estimados, aumentos percentuais (%) e intervalos de
confiança de 95% para doenças do aparelho respiratório em crianças na cidade
do Rio de Janeiro.
0.00
2.00
4.00
6.00
8.00
10.00
12.00
dia corrente defasagem de 1 dia
PM10
%R
R
4 Conclusões
Este trabalho apresentou duas abordagens para a validação do uso dos
dados com periodicidade de 6 dias na estimação do efeito da poluição do ar na
saúde. Os resultados encontrados na primeira parte deste trabalho mostraram que
as estatísticas descritivas variaram pouco entre as séries de PM10 particionadas de
6 dias e a série diária completa de PM10. Apesar disso, as estimativas de efeito
estimado variaram substancialmente entre as séries diárias e séries particionadas
de 6 dias para contagem de internações hospitalares por doenças do aparelho
respiratório em crianças, diferentemente do mesmo caso para idosos, o que indica
que a relação entre o desfecho para crianças e a poluição do ar variam mais ao
longo do tempo do que para série de internações hospitalares em idosos e que
portanto, o uso de dados com periodicidade de 6 dias para estudos realizados na
contagem de internações para crianças não seria tão adequado.
As simulações realizadas na segunda parte deste trabalho apresentaram
resultados satisfatórios, uma vez que os padrões estatísticos de média,
autocorrelação e variância, de uma forma geral, foram preservados em relação às
séries reais. Além disso, os resultados encontrados na estimação de efeitos da
poluição do ar na contagem de doenças do aparelho respiratório em crianças,
utilizando dados simulados, mostraram que a variação mais significativa entre as
estimativas dos efeitos estimados das séries particionadas e a série diária
completa, ocorreu no caso de um aumento de 200% na quantidade de dias atípicos
na série diária. Além disso, percebeu-se que quanto maior a quantidade de dias
atípicos por mês, maior pode ser esta variação.
Na terceira parte, foram estimados os efeitos estimados para doenças do
aparelho respiratório em idosos e crianças residentes na cidade do Rio, utilizando
dados reais de PM10 com periodicidade de 6 dias, disponibilizados pela Rede
Manual da FEEMA. Os resultados mostraram que para um aumento na exposição
de 10 μg/m3 de material particulado da população de idosos com mais de 65 anos,
houve um aumento estatisticamente significativo de 3.36% (IC:1.19% ;5.58%) no
número de internações hospitalares por doenças respiratórias (dia corrente) . Para
78
a mesma análise em crianças, os efeitos estimados foram muito altos: 8.10% (IC:
5.40% ; 10.8%) para o dia corrente e 7.3% (IC: 4.5% ; 10.2%) para 1 dia após a
exposição à poluição do ar.
Na primeira parte deste trabalho, em que os efeitos foram estimados
utilizando os dados da Rede Automática (dados diários) da FEEMA e da SMAC,
os efeitos tanto para crianças, como para idosos foram bem menores do que os
obtidos para os dados da Rede Manual (periodicidade de 6 dias). Uma possível
explicação seria o fato de que o indicador de concentração de material particulado
para cidade do Rio, utilizado na estimação dos efeitos encontrados utilizando
dados diários, foi calculado através da média deste poluente em 6 monitores / 4
bairros, enquanto utilizando dados com periodicidade de 6 dias , o índice de
poluição do ar para a cidade do Rio foi calculado através da média de material
particulado nos 7 monitores/ 7 bairros da Rede Manual localizados no município,
ou seja 3 bairros a mais que na Rede Automática. Deve-se destacar também que a
diferença entre as estimativas dos efeitos utilizando dados da Rede Manual e da
Rede Automática foram ainda maiores para a série de contagem de internações
por doenças respiratórias em crianças.
Este trabalho indicou pelo estudo de simulação, que o aumento de dias
atípicos de poluição do ar pode aumentar a variação entre as estimativas dos
efeitos das séries amostradas e a série completa, considerada como “verdadeira”,
ou seja, perder uma certa quantidade de informação, pode acarretar viés na
estimação de efeitos na saúde. Quando há um número muito grande de dias
atípicos durante o período de análise, a diferença na estimativa do efeito da série
completa em relação a uma série qualquer de 6 dias pode ser de até mais que 1%,
um valor aparentemente pequeno, mas que na abordagem epidemiológica não
pode ser considerado despresível.
As análises também indicam que à medida que há uma maior variação da
variável resposta, torna-se menos apropriado o uso da série de seis dias. Isto foi
mostrado nas análises realizadas para as séries reais particionadas de doenças
respiratórias em crianças, as quais apresentaram efeitos estimados das séries
particionadas significativamente variantes em relação à série completa.
Considerando as análises feitas neste trabalho, os resultados indicam a
possibilidade do uso de dados com periodicidade de 6 dias nos estudos de
poluição do ar e saúde com respostas que não tenham variância alta e para séries
79
de poluição com poucos dados atípicos. Desta forma, esse estudo indica que,
exceto para casos contrários a este, poderiam ser utilizados os dados da Rede
Manual em futuras investigações da relação poluição do ar e saúde.
5 Referências bibliográficas
1 ASSIS, F.N. Ajuste da função gama aos totais semanais de chuva de Pelotas-RS. Revista Brasileira de Agrometeorologia, Santa Maria, v. 1, p. 131-136, 1993.
2 ASSIS, F.N. de Modelagem da ocorrência e da quantidade de chuva e dias não chuvosos em Piracicaba – SP e Pelotas – RS. Piracicaba: Tese (Doutorado em Agronomia), Escola Superior de Agricultura, Universidade de São Paulo, 1991,134p.
3 ATKINSON, A.C. (1985) Plots, transformations and regression: an introduction to graphical methods of diagnostic regression analysis. 2. ed, Oxford Science Publications, Oxford.
4 BOX, G.E.P.; JENKINS, G.M. (1976) Time Series Analysis: Forecasting and Control, Holden Day, San Francisco.
5 BRUHN, J.A.; FRY, W.E.; FICK, G.W. (1980) Simulation of daily weather data using theorical probability distributions. Journal of Applied meteorology, Lancaster, v.19, n.9, p.29-36.
6 CAREY, D.I.; HANN, C.T. (1978) Markov process for simulating daily point rainfall. Journal of Irrigation and Drainage Division, New York, v.104, n.IR1, p.111-125.
7 CASELLA, G. & Berger, R.L. (2002), Statistical Inference, 2nd edn, Duxbury Advanced Series, New York.
8 CHATFIELD, Chris; COLLINS, A.J. (1980) Introduction to Multivariate Analysis, Chapman and Hall, London.
9 CONCEIÇÃO, Gleice Margarete de Souza; SALDIVA, Paulo Hilário Nascimento; SINGER, Julio da Motta. Modelos MLG e MAG para análise da associação entre poluição atmosférica e marcadores de morbi-mortalidade: uma introdução baseada em dados da cidade de São Paulo. Revista Brasileira de Epidemiologia, São Paulo, v. 4, n. 3, p.206-219,2001. Disponível em: <http: //www.scielo.br/scielo.php?script=sci_arttext&pid=S1415790X2001000300007&lng=pt&nrm=iso>. Acesso em: 20 Jan 2007. Pré-publicação.
10 DAUMAS, R.P. Poluição do ar e mortalidade em idosos no Município do Rio de Janeiro: análise de série temporal. Dissertação (Mestrado em Epidemiologia), Instituto de Medicina Social, Universidade do Estado do Rio de Janeiro, 2002.
11 DIGGLE, P.J. (1992) Time series: a biostatistical introduction. Oxford University Press, Oxford.
12 DOBSON, ANNETTE, J. (1990) An introduction to generalized linear models. Chapman & Hall, London, 174 p.
81
13 DURBIN, J. and KOOPMAN, S.J. (2001) Time Series Analysis by State Space Methods. Oxford University Press,Oxford.
14 FEEMA. Relatório de Qualidade do Ar do Estado do RJ – 2006. In: Site da Fundação Estadual de Engenharia e Meio Ambiente,2007. Disponível em:
http://www.feema.rj.gov.br/estacoes-ar.asp?cat=65#monitoramento. Acesso em: 20 abr. 2007.
15 FREITAS, Clarice et al. Hospital admissions and mortality: association with air pollution in São Paulo, Brazil, 1993 to 1997. Revista Saúde Pública, São Paulo, v. 38, n. 6, 2004. In: Scielo, 2004. Disponível em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-89102004000600001&lng=en&nrm=iso>. Acesso em: 29 July 2007.
16 GEORIO. Desenvolvido pela prefeitura da cidade do Rio de Janeiro, 2007. Precipitação de chuva na cidade do Rio de Janeiro. In: Portal Oficial da Prefeitura da Cidade do Rio de Janeiro. Disponível em: <http://www.rio.rj.gov.br/georio/alerta/http://www.feema.rj.gov.br/estacoes-ar.asp?cat=65>. Acesso em: 20 janeiro. 2007.
17 GOTTFRIELD, BYRON S. (1984); Elements of Stochastic Process Simulation.Englewood Cliffs. Prentice Hall.
18 GRAYBEAL, W.J. - UDO W.Pooch(1980). Simulation: Principles and Methods. Cambridge, Mass.: Winthrop Publishers, First Edition. Hardcover; First Printing. BLACK COVERS ; SMALL 4to ; 249 p.
19 HASTIE, T.; TIBSHIRANI, R. (1990); Generalized additive models. 2 ed., Chapman and Hall,London.
20 JOHNSON, Richard Arnold; WICHERN DEAN W. (1994) Applied Multivariate Statistical Analysis. Fourth Edition.
21 JUNGER, W.L. Imputação de dados faltando em séries temporais multivariadas via algoritmo EM. Trabalho de Conclusão de Curso (Graduação em Estatística). Instituto de Matemática e Estatística, Universidade do Estado do Rio de Janeiro, 2002.
22 KUTTATHARMMAKUL, S.; MASSART, D.L. e SMEYERS-VERBEK, J. (2001). Comparison of methods for the estimation of statistical parameters of censored data. Analytica Chimica Acta, p.215-229.
23 LARSEN, G.A.; PENSE, R.B. (1982) Stochastic simulation of daily climatic data for agronomic models. Agronomy Journal, v.74, p.510-4.
24 LAW, A.M.; KELTON, W.D. (2000) Simulation modelling and analysis. 3. ed, McGraw-Hill,New York.
25 LEHMER, D.H. (1951) - Mathematical methods in Large-scale units, Ann. Comp. Lab., Havard University, n.26, p.141-146.
26 MALKOVICH, J.F.; AFIFI, A.A (1982) On tests for multivariate normality. Journal of the American Statistical Association, v.68, p.176-179.
27 MCGULLAGH, P.; NELDER, J.A. (1989) Generalized linear models. Chapman and Hall, London.
28 MEDINA-RAMÓN, M.; ZANOBETTI, A.; SCHWARTZ, J. The Effect of Ozone and PM10 on Hospital Admissions for Pneumonia and Chronic
82
Obstructive Pulmonary Disease: A National Multicity Study Am. J. Epidemiol., 15 March 2006; n. 163, p. 579-588.
29 MINISTÉRIO DO MEIO AMBIENTE, Qualidade do Ar e Efeitos na Saúde da População do Município do Rio de Janeiro: Relatório de conclusão; Instituto de Medicina Social/ UERJ e Centros de Estudos da Saúde do Trabalhador e Ecologia Humana/ ENSP/ FIOCRUZ, 2005; 138p.
30 MINISTÉRIO DA SAÚDE, Avaliação da Qualidade do Ar e seus Reflexos na Morbidade por Doenças Respiratórias na População Atendida no Município de Vitória: Relatório de conclusão; Instituto de Medicina Social/ UERJ e Centros de Estudos da Saúde do Trabalhador e Ecologia Humana/ ENSP/ FIOCRUZ, 2005, 152p.
31 MORETTIN, P.A.; TOLOI, C.M.C. Análise de Séries Temporais. 2. ed. São Paulo: Editora Blucher, v. 1, 2006, 535 p.
32 MORGAN, BYRON J.T. (1984). Elements of Simulation; Chapman and Hall, New York.
33 NICKS, A.D.; LANE, L.J.; GANDER, G.A. (1995). Weather generator: USDA- Water erosion rediction project (WEPP). West Lafayette: USDA-ARS National Soil Erosion Research Laboratory, cap.2, p.22.
34 PAULA, G. A. Modelos de Regressão com Apoio Computacional. São Paulo: Disponível na home-page do autor e tesouraria do IME-USP, 2004. v. 1. 253 p.
35 PEITER, M.X.; CHAUDHRY, FH.; CARLESSO, R.; RUVIARO, C. Modelagem estocástica da precipitação diária para Santa Maria, RS. In: Congresso Brasileiro de Engenharia Agrícola, p. 28, 1999, Pelotas. Anais... Pelotas: SBEA/UFPel, 1999, CD-ROM.
36 PERIN FILHO, C. Introdução à simulação de sistemas. Campinas : Editora da UNICAMP, 1995, 163 p.
37 PESSOA, M.C.P.Y., LUCHIARI, A.J., FERNANDES, E.N., LIMA, M.A. Principais modelos e simuladores utilizados para análise de impactos ambientais das atividades agrícolas. Jaguariúna: Embrapa-CNPMA, 1997., 83p.
38 PONCE DE LEON, A. C et al. Effects of air pollution on daily hospital admissions for respiratory disease in London between 1987-88 and 1991-92. J. Epidemiol. Community Health, v.50, suppl.1, p. 63-70, 1996.
39 PRESS, W.H. et al. (1986). Numerical recipes, the art of scientific computing. Cambridge, 818p.
40 R DEVELOPMENT CORE TEAM (2007). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, Disponível em:http://www.R-project.org.
41 RICHARDSON, C.W.; Nicks, A.D. (1990). Weather generator description. In: Erosion/productivity impact calculator. Model documentation. Washington, D.C: USDA-ARS Techinical, 235p. Bulletin 1768.
83
42 ROBERTSON, G.W. (1976). Dry and wet spells. Project Report Agrometeorology A-6. UNDP/FAO. Technical Assistance to the Federal Land Development Authority. Tun Razak Agriculture Research Center. Jerantut, Pahang, Malaysia, 30p.
43 SALDIVA, P.H.N.; POPE, C.A; SCHWARTZ, J.; DOCKERY, D.W.; LICHTENFELS, A.J.; SALGE, J.M. et al.(1995). Air pollution and mortality in elderly people: A time series study in São Paulo, Brazil. Arch Environ Health, 50: p. 159-64.
44 SCHWARTZ, J. (1996). Air pollution and hospital admissions for respiratory disease. Epidemiology , 7(1): 20-28.
45 SCHWARTZ, J. (1991). Particulate air pollution and daily mortality in Detroit. Environ Res, 56(2): 204-213.
46 SCHWARTZ J. (1994). What are people dying of on high air pollution days? Environ Res, 64(1):26-35.
47 SOBRAL H.R. Air pollution and respiratory diseases in children in Sao Paulo, Brazil. Soc. Sci. Méd. 1989; 29(8): 959-964.
48 SOUZA, S.A.V. Programa computacional para simulação da ocorrência de veranicos e queda de produção. Tese (Doutorado) - Escola Superior de Agricultura Luiz de Queiroz, Piracicaba, 1999, 124p.
49 SPEKTOR D.M.; HOFMEISTER V.A.; ARTAXO, P.; BRAGUE J.A.; ECHELAR, F.; NOGUEIRA, D.P. et al. (1991). Effects of heavy industrial pollution on respiratory function in the children of Cubatao, Brazil: a preliminary report. Environ Health Perspect; 94: 51-54.
50 SPIX C.; WICHMANN, H.E. (1996). Daily mortality and air pollutants: findings from Koln, Germany. J. Epidemiol. Community Health, 50 Suppl 1: s52-s58.
51 SUNYER, J.; CASTELLSAGUE, J.; SAEZ, M.; TOBIAS, A.; ANTO, J.M. (1996). Air pollution and mortality in Barcelona. J. Epidemiol. Community Health; 50 Suppl 1: s76-s80.
52 THOM, H.C.S. A note on the Gama distribution. Monthly Weather Review, Washington, v. 86, n. 4, p. 117-122, 1958.
53 UNIVERSIDADE FEDERAL DE JUIZ DE FORA. Laboratório de Climatologia e Análise Ambiental. A QUALIDADE DO AR EM JUIZ DE FORA – MG. Disponível em http://www.labcaa.ufjf.br/qualidadedoar.htm. Acesso em: 28 de julho de 2007.
54 VERAS, C.M.T. & MARTINS, M.S. A confiabilidade dos dados nos formulários de autorização de internação hospitalar (AIH), Rio de Janeiro: Cadernos de Saúde Pública, v. 10, p. 339-355, 1994.
55 YOUNG, K.C. (1994) A multivariate chain model for simulating climatic parameters from daily data. Journal of Applied Meteorology, v. 33, p. 661-71.
Anexo I
#Simulação – chuva
#condição do dia
cond.dia <- ifelse(dados$rain>=0.2,1,0)
nwd <- tapply(c(NA,ifelse(cond.dia[2:length(cond.dia)]==1 &
cond.dia[1:length(cond.dia)-1]==0,1,0)),by_,sum,na.rm = TRUE)
nww <- tapply(c(NA,ifelse(cond.dia[2:length(cond.dia)]==1 &
cond.dia[1:length(cond.dia)-1]==1,1,0)),by_,sum,na.rm = TRUE)
ndw <- tapply(c(NA,ifelse(cond.dia[2:length(cond.dia)]==0 &
cond.dia[1:length(cond.dia)-1]==1,1,0)),by_,sum,na.rm = TRUE)
ndd <- tapply(c(NA,ifelse(cond.dia[2:length(cond.dia)]==0 &
cond.dia[1:length(cond.dia)-1]==0,1,0)),by_,sum,na.rm = TRUE)
nw <- nwd+nww
nd <- ndw+ndd
prob.d.dado.d <- ndd/nd
prob.w.dado.d <- nwd/nd
prob.d.dado.w <- ndw/nw
prob.w.dado.w <- nww/nw
prob.d.dado.d <- ifelse(prob.d.dado.d !="NaN",prob.d.dado.d,0)
prob+.w.dado.d <- ifelse(prob.w.dado.d !="NaN",prob.w.dado.d,0)
prob.d.dado.w <- ifelse(prob.d.dado.w !="NaN",prob.d.dado.w,0)
prob.w.dado.w <- ifelse(prob.w.dado.w !="NaN",prob.w.dado.w,0)
#simulação de chuva (distribuição Gama)
mean.chuva <- tapply(ifelse(dados$rain!=
0,dados$rain,NA),by_,mean,na.rm = TRUE)
log.chuva <- ifelse(log(dados$rain)!= -Inf,log(dados$rain),NA)
mean.log.chuva <- tapply(log.chuva,by_,mean,na.rm = TRUE)
A <- log(mean.chuva) - mean.log.chuva
alpha <- (1/(4*A))*(sqrt(1+4*A/3)+1)
betha <- mean.chuva/alpha
#montando vetores de alpha e beta para dias
85
alpha. <- double(length(dados$rain))
beta. <- double(length(dados$rain))
prob.w.dado.d. <- double(length(dados$rain))
prob.w.dado.w. <- double(length(dados$rain))
for (z in 1:n)
{
alpha.[z] <- alpha[[by_[z]]]
beta.[z] <- betha[[by_[z]]]
prob.w.dado.d.[z] <- prob.w.dado.d[[by_[z]]]
prob.w.dado.w.[z] <- prob.w.dado.w[[by_[z]]]
}
#simulando as 100 séries
k <- 100
unif.inicial<- double(k)
dia.inicial <- matrix(NA,1,k)
precipitacoes.sim <- matrix(NA,length(dados$rain),k)
#primeiro passo (condição do dia inicial)
for (j in 1:k)
{
unif.inicial[j]<- runif(1,0,1)
if (unif.inicial[j] >0 &
unif.inicial[j]<=prob.w.dado.d.[1])
{
dia.inicial[1,j] <-1
}
else if (unif.inicial[j] >prob.w.dado.d.[1] &
unif.inicial[j]<=prob.w.dado.w.[1])
{
dia.inicial[1,j] <-1
}
else if (unif.inicial[j] >prob.w.dado.w.[1])
{
dia.inicial[1,j] <-0
}}
#condição do primeiro dia
86
for (j in 1:k)
{
unif <- runif(1,0,1)
if (dia.inicial[1,j]==1)
{
if (unif <= prob.w.dado.w.[1])
precipitacoes.sim[1,j] <- 1
else
precipitacoes.sim[1,j] <- 0
}
else if (dia.inicial[1,j]==0)
{
if (unif <= prob.w.dado.d.[1])
precipitacoes.sim[1,j] <- 1
else
precipitacoes.sim[1,j] <- 0
}}
#condições dos outros dias
for (j in 1:k)
{
for (i in 2:length(dados$rain))
{
unif<-runif(1,0,1)
if (precipitacoes.sim[i-1,j]==1)
{
if (unif<= prob.w.dado.w.[i-1])
precipitacoes.sim[i,j] <- 1
else
precipitacoes.sim[i,j] <- 0
}
else
{
if (unif<= prob.w.dado.d.[i-1])
precipitacoes.sim[i,j] <- 1
else
precipitacoes.sim[i,j] <- 0
}
}}
87
#segundo passo
#simulação de chuva
for (j in 1:k)
{
for (i in 1:length(dados$rain))
{
if (precipitacoes.sim[i,j]==1)
{precipitacoes.sim[i,j] <-
rgamma(1,alpha.[i],(1/beta.[i]))}
else
{precipitacoes.sim[i,j] <- 0}
}}
#Simulação – temperatura e umidade
#simulação de séries multivariadas
serie.multi.arima <-
function(n,mean,covar,by=NULL,ordem.arima=NULL,ar.coef=NULL,ma.coe
f=NULL,colnames=NULL,sd.=NULL,by2=NULL)
{
cols <- dim(mean)[1]
if (is.null(by))
{
if (!(dim(covar)[1]==dim(covar)[2]))
stop("Matriz de covariância deve ser quadrada")
if (!(dim(covar)[1]==dim(mean)[1]))
stop("Vetor média e dimensão da matriz de covariância
não concordam")
}
if(!is.null(ar.coef) && (!(length(ar.coef)==dim(mean)[1])))
stop("Erro em vetor ar coeficients")
if(!is.null(ma.coef) && (!(length(ma.coef)==dim(mean)[1])))
stop("Erro em vetor ma coeficients")
if (is.null(ordem.arima))
X <- matrix(rnorm(cols*n),nrow=n,ncol=cols)
else
if (!is.null(ordem.arima))
88
{
X <- matrix(NA,nrow=n,ncol=cols)
for (i in 1:cols)
if(ordem.arima[[i]][2]!=0)
X[,i] <- arima.sim(n-
1,model=list(order=ordem.arima[[i]],ar=ar.coef[[i]],ma=ma.coef[[i]
],sd=1,mean=0))
else
X[,i] <-
arima.sim(n,model=list(order=ordem.arima[[i]],ar=ar.coef[[i]],ma=m
a.coef[[i]],sd=1,mean=0))
}
Y <- matrix(NA,nrow=n,ncol=cols)
if (is.null(by))
Y <- t(t(X%*%chol(covar))+mean)
else
for(j in 1:n)
Y[j,] <-
t(t(X[j,]%*%chol(covar[,,by2[j]]))+mean[,,by2[j]])
if (is.null(names))
colnames(Y) <- paste("X",seq(1:cols),sep="")
else
colnames(Y) <- colnames
return(as.data.frame(Y))
}
#Periodograma
periodograma <-
function(series,rows=15,newwin=FALSE,retval=TRUE,...)
{
pgram.iomega <- function(x,n,series)
# análise spectral de resíduos
{
t <- seq(1:n)
sp <- ((sum(series*cos(x*t)))^2+(sum(series*cos(x*t)))^2)/n
return(sp)
}
89
# inicialização
n <- length(series)
IOmega <- NULL
i <- seq(1:trunc(n/2-1))
t <- seq(1:n)
omega <- (2*pi*i)/n
IOmega <-
sapply(i,function(x){pgram.iomega(omega[x],n=n,series=series)})
period <- (2*pi)/omega
period.max <- round(max(period),2)
period.min <- round(min(period),2)
periodogram <- cbind.data.frame(period,omega,IOmega)
periodogram <-
periodogram[order(periodogram$IOmega,decreasing=TRUE),]
if (retval)
return(periodogram[1:rows,])
}
#etapas para simulação das séries de temperatura e umidade
#temperatura - sarima
temperatura.ajuste <- arima(dados.2$temperatura, order = c(1,1,2),
seasonal = list(order = c(1,1,1), period = 3),
xreg = NULL, include.mean = T, transform.pars = F,
fixed = NULL, init = NULL, method ="ML",optim.control =
list(), kappa = 1e6)
#coeficientes temperatura.sarima
coef.temperatura <- temperatura.ajuste$coef
#umidade - sarima
umidade.ajuste <- arima(dados.2$umidade, order = c(1, 0, 1),
seasonal = list(order = c(1,0,1), period = 3),
xreg = NULL, include.mean = T, transform.pars = F,
fixed = NULL, init = NULL, method = "ML",optim.control
= list(), kappa = 1e6)
#coeficientes umidade.sarima
coef.umidade <- umidade.ajuste$coef
90
n <- 1095
cols <-2
ordem.arima. <- list(c(1,0,1),c(1,0,2))
ar.coef. <- list(coef.umidade[1],coef.temperatura[1])
ma.coef. <-
list(coef.umidade[2],c(coef.temperatura[2],coef.temperatura[3]))
colnames. <- c("umidade.sim","temperatura.sim")
s.umidade <-
c(periodograma(dados.2$umidade)$period[1],periodograma(dados.2$umi
dade)$period[2])
s.temperatura <-
c(periodograma(dados.2$temperatura)$period[1],periodograma(dados.2
$temperatura)$period[2])
periodo.sazonal. <-
matrix(c(s.temperatura[1],s.temperatura[2],s.umidade[1],s.umidade[
2]),2,2)
larger.seasonal. <-365
#condição do dia nas 100 simulações de precipitação de chuva
cond.dia.sim <- matrix(NA,n,k)
for (i in 1:k)
{
cond.dia.sim[,i] <- ifelse(precipitacoes.sim[,i]>0.2,1,0)
}
#condição do dia por mês
vetor.cond.dia.sim <- matrix(NA,n,k)
for (j in 1:k)
{
for (i in 1:length(table(by_)))
{
vetor.cond.dia.sim[by_==i,j]<-
ifelse(cond.dia.sim[by_==i,j]==1,2*by_[by_==i],-
1+(2*by_[by_==i]))
}
}
#simulação de temperatura e umidade
umidade.temp.sim <- array(NA,dim=c(n,2,k))
91
for (i in 1:k)
{
#montando as matrizes de covariância e vetores de médias, segundo
condição de chuva!
covar. <- array(dim = c(cols,cols,2*length(table(by_))))
mean. <- array(dim = c(cols,1,2*length(table(by_))))
vetor <- as.vector(names(table(vetor.cond.dia.sim[,i])),mode
= "numeric")
for (j in vetor)
{
mean.[,,vetor==j] <-
as.vector(mean(dados.2[(vetor.cond.dia.sim[,i])==j,2:3
],na.rm = T))
covar.[,,vetor==j] <-
var(dados.2[by_==(round(j/2+0.1,0)),2:3],na.rm = T)
}
umidade.temp.sim[,,i] <- as.matrix(serie.multi.arima
(n=1095,mean=mean.,covar=covar.,by=by_,periodo.sazonal=periodo.saz
onal.,
maior.periodo=365,ordem.arima=arima.order.,ar.coef=ar.coef.
,ma.coef=ma.coef.,colnames=colnames.,by2=vetor.cond.dia.sim[,i]))
}
#simulação – poluição do ar
coef.modelos.mes <- matrix(NA,length(table(by_)),4)
ks.pol <- double(36)
colnames(coef.modelos.mes) <-
c("ar1","intercepto","coef.umidade","coef.temperatura")
j <- 0
for (j in 1:length(table(by_)))
{
modelo <- arima(dados.2$PM[by_==j], order = c(1, 0, 0),xreg
= cbind.data.frame(dados.2$umidade[by_==j],
dados.2$temperatura[by_==j]),include.mean = TRUE,method =
"ML", optim.control = list(), kappa = 1e6)
coef.modelos.mes[j,] <- t(as.matrix(modelo$coef))
}
92
poluicao.sim <- matrix(NA,n,k)
for (z in 1:k)
{
poluicao.sim[1:table(by_)[1],z] <-
arima.sim(list(order=c(1,0,0),
ar=coef.modelos.mes[1,1]),n=table(by_)[1])+
coef.modelos.mes[1,2]+umidade.temp.sim[1:table(by_)[1],1,z]*
coef.modelos.mes[1,3]+umidade.temp.sim[1:table(by_)[1],2,z]*
coef.modelos.mes[1,4]
for (j in 2:length(table(by_)))
{
m <- table(by_)[j-1] + m
poluicao.sim[(m+1):(m+table(by_)[j]),z] <-
arima.sim(list(order=c(1,0,0),ar=coef.modelos.mes[j,1]),n=ta
ble(by_)[j])+coef.modelos.mes[j,2]+
umidade.temp.sim[(m+1):(m+table(by_)[j]),1,z]*coef.modelos.m
es[j,3]+umidade.temp.sim[(m+1):(m+table(by_)[j]),2,z]*coef.m
odelos.mes[j,4]
}
}
# Simulação com dummies simuladas - aumentos de probabilidade de
dias atípicos por mês
#Simulação da dummie de dias atípicos!!!##
selecao.6dias <- c(rep(seq(1,6,1),1095/6),c(1,2,3))
set.seed (10)
outliers.sim <- matrix(NA,1095,3)
for (i in 1:36)
{
outliers.sim[by_==i,1] <-
as.matrix(rbinom(prob=(round(1.25*prob.outliers[i],2)),n=n.mes[i],
size=1))
outliers.sim[by_==i,2] <-
as.matrix(rbinom(prob=(round(1.50*prob.outliers[i],2)),n=n.mes[i],
size=1))
outliers.sim[by_==i,3] <-
as.matrix(rbinom(prob=(round(2*prob.outliers[i],2)),n=n.mes[i],siz
e=1))
}
93
outliers.6dias <- matrix(NA,6,4)
colnames(outliers.6dias) <-
c("atipicos.real","atipicos.sim.1.25","atipicos.sim.1.50","atipico
s.sim.2")
for (i in 1:6)
outliers.6dias[i,] <-
apply(cbind(outliers.mes,outliers.sim)[selecao.6dias==i,],2,sum)
#Cenários de poluição do ar
k <- 100
poluicao.sim <- matrix(NA,n,k)
beta.outliers <- double(n)
for (i in 1:36)
{
beta.out <- mean(dados$PM[outliers.mes==1 &
by_==i],na.rm=T)/mean(dados$PM[outliers.mes==!1 & by_==i],na.rm=T)
beta.outliers[by_==i] <- beta.out
}
for (z in 1:100)
{
for (j in 1:36)
{
poluicao.sim[by_==j,z] <-
arima.sim(list(order=c(1,0,0),ar=coef.modelos.mes[j,1]),n=n.mes[j]
) + (coef.modelos.mes[j,2]) +
umidade.temp.sim[by_==j,1,z]*coef.modelos.mes[j,3]+umidade.temp.si
m[by_==j,2,z]*coef.modelos.mes[j,4]
}}
poluicao.sim.1.25 <- matrix(NA,n,k)
poluicao.sim.1.50 <- matrix(NA,n,k)
poluicao.sim.2.00 <- matrix(NA,n,k)
### aumento de 25 %
for (j in 1:100)
{
for (i in 1:n)
{
if(outliers.sim[i,1]==1)
94
poluicao.sim.1.25[i,j]<-
beta.outliers[i]*poluicao.sim[i,j]
else
poluicao.sim.1.25[i,j] <-poluicao.sim[i,j]
}
}
### aumento de 50 %
for (j in 1:100)
{
for (i in 1:n)
{
if(outliers.sim[i,2]==1)
poluicao.sim.1.50[i,j]<-
beta.outliers[i]*poluicao.sim[i,j]
else
poluicao.sim.1.50[i,j] <-poluicao.sim[i,j]
}
}
### aumento de 100 %
for (j in 1:100)
{
for (i in 1:n)
{
if(outliers.sim[i,3]==1)
poluicao.sim.2.00[i,j]<-
beta.outliers[i]*poluicao.sim[i,j]
else
poluicao.sim.2.00[i,j] <-poluicao.sim[i,j]
}
}
# Simulação doenças do aparelho respiratório em crianças menores
de 5 anos
resposta <- function(x,beta,family,intercept=TRUE,...)
{
if ((intercept) && (!(dim(x)[2]==(length(beta)-1))))
95
stop("Dimensões não concordam")
else
if ((!(intercept)) && (!(dim(x)[2]==(length(beta)))))
stop("Dimensões não concordam")
n <- dim(x)[1]
if (intercept)
X <- cbind(1,as.matrix(x))
else
X <- as.matrix(x)
eta <- X%*%beta
Y <- rpois(n,exp(eta))
return(Y)
}
#Junta dados (simulados e fixos)
fixo <-
cbind.data.frame(TEMPO=dados$TEMPO,MON=dados$MON,TUE=dados$TUE,WED
=dados$WED,THU=dados$THU,FRI=dados$FRI,SAT=dados$SAT,FERIADO=dados
$FERIADO,ENFORCA=dados$ENFORCA)
simulacao.dados <- array(NA,dim=c(n,13,k))
nomes.variaveis <-
c("TEMPO","MON","TUE","WED","THU","FRI","SAT","FERIADO","ENFORCA",
"precipitacoes.sim","umidade.sim","temperatura.sim","PM")
for (i in 1:k)
{
teste <-
as.matrix(cbind.data.frame(fixo,precipitacoes.sim=precipitac
oes.sim[,i],umidade.sim=umidade.temp.sim[,1,i],temperatura.s
im=umidade.temp.sim[,2,i],PM=poluicao.sim[,i]))
simulacao.dados[,,i] <- teste
colnames(simulacao.dados[,,i]) <- nomes.variaveis}
#simulação de dar 5
for (i in 1:k)
{
DAR5.sim[,i] <-
mkresponse(as.data.frame(simulacao.dados[,,i]),beta=beta.,fa
mily=poisson,intercept=TRUE)
}
96
# Modelos – dados simulados
library(gam)
library(ares)
riscos.series.completas <- double(k)
nomes.variaveis <-
c("TEMPO","MON","TUE","WED","THU","FRI","SAT","FERIADO","ENFORCA",
"DAR5","precipitacoes.sim","umidade.sim","temperatura.sim","PM")
#modelos para séries diárias
for (i in 1:100)
{
sim.dados <-
cbind.data.frame(fixo,DAR5=DAR5.sim[,i],precipitacoes.sim=pr
ecipitacoes.sim[,i],umidade.sim=umidade.temp.sim[,1,i],tempe
ratura.sim=umidade.temp.sim[,2,i],PM=poluicao.sim[,i])
colnames(sim.dados) <- nomes.variaveis
last.gam <-
gam(sim.dados$DAR5~s(sim.dados$TEMPO,20)+sim.dados$MON+sim.d
ados$TUE+sim.dados$WED+sim.dados$THU+sim.dados$FRI+sim.dados
$SAT+sim.dados$FERIADO+sim.dados$ENFORCA+s(sim.dados$tempera
tura.sim,5)+s(sim.dados$umidade.sim,5)+sim.dados$precipitaco
es.sim+sim.dados$PM,family=poisson(link=log),
dataset=sim.dados, na.action=na.exclude,
control=gam.control(epsilon=1e-14,bk.epsilon=1e-
14,maxit=1e3,bk.maxit=1e3,trace=T))
riscos.series.completas[i] <-
(exp(10*last.gam$coefficients[14])-1)*100
}
#modelos para séries de 6 em 6 dias
selecao.6dias <- c(rep(seq(1,6,1),1095/6),c(1,2,3))
riscos.series <- matrix(NA,6,100)
formula.1 <-
sim.dados.6dias$DAR5~lo(sim.dados.6dias$TEMPO,span=0.15)+sim.dados
.6dias$MON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias
$THU+sim.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIA
DO+sim.dados.6dias$ENFORCA+lo(sim.dados.6dias$temperatura.sim,span
=0.4)+lo(sim.dados.6dias$umidade.sim,span=0.1)+sim.dados.6dias$pre
cipitacoes.sim+sim.dados.6dias$PM
97
formula.2 <-
sim.dados.6dias$DAR5~lo(sim.dados.6dias$TEMPO,span=0.15)+sim.dados
.6dias$MON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias
$THU+sim.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIA
DO+sim.dados.6dias$ENFORCA+lo(sim.dados.6dias$temperatura.sim,span
=0.08)+lo(sim.dados.6dias$umidade.sim,span=0.12)+sim.dados.6dias$p
recipitacoes.sim+sim.dados.6dias$PM
formula.3 <-
sim.dados.6dias$DAR5~lo(sim.dados.6dias$TEMPO,span=0.14)+sim.dados
.6dias$MON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias
$THU+sim.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIA
DO+sim.dados.6dias$ENFORCA+lo(sim.dados.6dias$temperatura.sim,span
=0.15)+lo(sim.dados.6dias$umidade.sim,span=0.15)+sim.dados.6dias$p
recipitacoes.sim+sim.dados.6dias$PM
formula.4 <-
sim.dados.6dias$DAR5~lo(sim.dados.6dias$TEMPO,span=0.08)+sim.dados
.6dias$MON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias
$THU+sim.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIA
DO+sim.dados.6dias$ENFORCA+lo(sim.dados.6dias$temperatura.sim,span
=0.05)+lo(sim.dados.6dias$umidade.sim,span=0.035)+sim.dados.6dias$
precipitacoes.sim+sim.dados.6dias$PM
formula.5 <-
sim.dados.6dias$DAR5~lo(sim.dados.6dias$TEMPO,span=0.17)+sim.dados
.6dias$MON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias
$THU+sim.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIA
DO+sim.dados.6dias$ENFORCA+lo(sim.dados.6dias$temperatura.sim,span
=0.2)+lo(sim.dados.6dias$umidade.sim,span=0.03)+sim.dados.6dias$pr
ecipitacoes.sim+sim.dados.6dias$PM
formula.6 <-
sim.dados.6dias$DAR5~s(sim.dados.6dias$TEMPO,11)+sim.dados.6dias$M
ON+sim.dados.6dias$TUE+sim.dados.6dias$WED+sim.dados.6dias$THU+sim
.dados.6dias$FRI+sim.dados.6dias$SAT+sim.dados.6dias$FERIADO+sim.d
ados.6dias$ENFORCA+s(sim.dados.6dias$temperatura.sim,10)+s(sim.dad
os.6dias$umidade.sim,10)+sim.dados.6dias$precipitacoes.sim+sim.dad
os.6dias$PM
98
formulas.6dias <-
list(formula.1,formula.2,formula.3,formula.4,formula.5,formula.6)
for (i in 1:100)
{
sim.dados <-
cbind.data.frame(fixo,DAR5=DAR5.sim[,i],precipitacoes.sim=pr
ecipitacoes.sim[,i],umidade.sim=umidade.temp.sim[,1,i],tempe
ratura.sim=umidade.temp.sim[,2,i],PM=poluicao.sim[,i])
colnames(sim.dados) <- nomes.variaveis
for (g in 1:6)
{
sim.dados.6dias <- sim.dados[selecao.6dias==g,]
last.gam.6dias <-
gam(formula(formulas.6dias[[g]]),family=poisson(link=l
og), dataset=sim.dados.6dias, na.action=na.exclude,
control=gam.control(epsilon=1e-14,bk.epsilon=1e-
14,maxit=1e3,bk.maxit=1e3,trace=T))
riscos.series[g,i] <-
(exp(10*last.gam.6dias$coefficients[14])-1)*100
}
}
#final
Anexo II
Série 1 Série 2
Série 3 Série 4
Série 5 Série 6
Figura I: Diagnósticos para os modelos de doenças respiratórias em idosos com
mais de 65 – material particulado – série diária (FEEMA e SMAC).
-3 -2 -1 0 1 2 3
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
-0.2
0.2
0.6
1.0
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.2
0-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
8
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
01
23
45
67
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-3-2
-10
12
3
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
01
23
4
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-2 -1 0 1 2
-2-1
01
23
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
-0.2
0.2
0.6
1.0
LagA
CF
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
810
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
182 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-2 -1 0 1 2
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
8
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
182 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
01
23
45
6
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
100
Figura II: Diagnósticos para os modelos de doenças respiratórias em idosos com
mais de 65 – material particulado – série diária (FEEMA e SMAC).
Tabela II: Estimativas dos parâmetros de dispersão (phi) - modelos de doenças
respiratórias em idosos com mais de 65 – material particulado – série diária
(FEEMA e SMAC).
Série diária Série 1 Série 2 Série 3 Série 4 Série 5 Série 6
1.25 1.12 1.25 1.22 1.20 1.35 1.15
-3 -2 -1 0 1 2 3
-3-1
12
3
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.0
6-0
.02
0.02
0.06
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.00
510
15
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
1095 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
101
Série 1 Série 2
Série 3 Série 4
Série 5 Série 6
Figura III: Diagnósticos para os modelos de doenças respiratórias em crianças –
material particulado – série diária (FEEMA e SMAC).
-3 -2 -1 0 1 2 3
-3-2
-10
12
3
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
LagA
CF
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
8
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
8
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
01
23
45
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-2 -1 0 1 2
-3-1
01
23
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
-0.2
0.2
0.6
1.0
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
810
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
182 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-2 -1 0 1 2
-2-1
01
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0
1.0
2.0
3.0
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
182 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-2 -1 0 1 2
-2-1
01
2
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0
0.5
1.0
1.5
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
182 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
102
Figura IV: Diagnósticos para os modelos de doenças respiratórias em crianças –
material particulado – série diária (FEEMA e SMAC).
Tabela I: Estimativas dos parâmetros de dispersão (phi) - modelos de doenças
respiratórias em crianças – material particulado – série diária (FEEMA e SMAC).
Série diária Série 1 Série 2 Série 3 Série 4 Série 5 Série 6
1,23 1,42 1,29 1,43 1,51 1,38 1,46
-3 -2 -1 0 1 2 3
-4-2
02
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.0
6-0
.02
0.02
0.06
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
810
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
1095 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
Anexo III
Figura V: Diagnósticos para o modelo SARIMA de umidade – série diária.
Figura VI: Diagnósticos para o modelo SARIMA de temperatura – série diária.
histograma de resíduos padronizados
residuos.padrao.umidade
Freq
uenc
y
-4 -2 0 2 4
050
100
200
-3 -2 -1 0 1 2 3
-4-2
02
4
qqplot de resíduos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25 30
0.0
0.4
0.8
Lag
ACF
fac de resíduos
0 5 10 15 20 25 30
-0.0
6-0
.02
0.02
0.06
Lag
Parti
al A
CF
facp de resíduos
0 50 100 150
0.0
0.4
0.8
p-valores para estatística de Ljung-Box
histograma
residuos.padrao.temperatura
Freq
uenc
y
-4 -2 0 2 4
050
150
250
-3 -2 -1 0 1 2 3
-3-1
12
3
qqplot
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25 30
0.0
0.4
0.8
Lag
ACF
fac de resíduos
0 5 10 15 20 25 30
-0.0
8-0
.02
0.02
0.06
Lag
Parti
al A
CF
facp de resíduos
0 50 100 150
0.0
0.4
0.8
p-valores para estatística de Ljung-Box
Anexo IV
Figura VII: Diagnósticos para os modelos de dar 5 – material particulado
(FEEMA) Doenças do aparelho respiratório em crianças – Modelo para o dia
corrente.
Figura VIII: Diagnósticos para os modelos de dar 5 – material particulado
(FEEMA) Doenças do aparelho respiratório em crianças - Modelo para lag1.
-3 -2 -1 0 1 2 3
-4-2
02
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
-0.2
0.2
0.6
1.0
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
05
1015
20
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-3-1
01
23
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
-0.2
0.2
0.6
1.0
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
5-0
.05
0.05
0.15
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
05
1015
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
183 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
105
Figura IX: Diagnósticos para os modelos de dar 65 – material particulado
(FEEMA) Doenças do aparelho respiratório em idosos - Modelo para o dia
corrente.
Figura X: Diagnósticos para os modelos de dar 65 – material particulado
(FEEMA) Doenças do aparelho respiratório em idosos - Modelo para lag1.
-3 -2 -1 0 1 2 3
-3-2
-10
12
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
00.
000.
10
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
810
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
302 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
-3 -2 -1 0 1 2 3
-4-2
02
qqnorm de residuos
Theoretical Quantiles
Sam
ple
Qua
ntile
s
0 5 10 15 20 25
0.0
0.4
0.8
Lag
AC
F
fac de resíduos
5 10 15 20 25
-0.1
00.
000.
10
Lag
Par
tial A
CF
facp de resíduos
0.0 0.5 1.0 1.5 2.0 2.5 3.0
02
46
810
Angular frequency (rad) - [Top axis is period in days]
I(om
ega)
304 12.57 6.28 4.19 3.14 2.51 2.09Periodograma de residuos
Livros Grátis( http://www.livrosgratis.com.br )
Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas
Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo