dissertação giovanni - revisões feitas

161
81,9(56,’$’(&$7ˇ/,&$’(%5$6¸/,$ 352*5$0$’(3ˇ6*5$’8$d›2675,&726(168(0*(67›2’2 &21+(&,0(172(’$7(&12/2*,$’$,1)250$d›2 6XSRUWHj’HFLVmRSDUD9LJLOkQFLD (SLGHPLROyJLFDEDVHDGRHP0RGHOR3UHGLWLYR GH6XUWRVGH’HQJXHXWLOL]DQGR5HGHV1HXUDLV $UWLILFLDLV Giovanni Gondim de Castro BRASÍLIA 2005

Upload: api-3797829

Post on 07-Jun-2015

898 views

Category:

Documents


0 download

DESCRIPTION

Dissertação de mestrado

TRANSCRIPT

Page 1: Dissertação Giovanni - Revisões Feitas

81,9(56,'$'(�&$7Ï/,&$�'(�%5$6Ë/,$�352*5$0$�'(�3Ï6�*5$'8$d­2�675,&72�6(168�(0�*(67­2�'2�

&21+(&,0(172�(�'$�7(&12/2*,$�'$�,1)250$d­2��

6XSRUWH�j�'HFLVmR�SDUD�9LJLOkQFLD�(SLGHPLROyJLFD�EDVHDGR�HP�0RGHOR�3UHGLWLYR�GH�6XUWRV�GH�'HQJXH�XWLOL]DQGR�5HGHV�1HXUDLV�

$UWLILFLDLV��

Giovanni Gondim de Castro �

BRASÍLIA

2005

Page 2: Dissertação Giovanni - Revisões Feitas

Giovanni Gondim de Castro

6XSRUWH�j�'HFLVmR�SDUD�9LJLOkQFLD�(SLGHPLROyJLFD�EDVHDGR�HP�0RGHOR�3UHGLWLYR�GH�6XUWRV�GH�'HQJXH�XWLOL]DQGR�5HGHV�1HXUDLV�

$UWLILFLDLV�

Dissertação apresentada ao Programa de Pós-Graduação 6WULFWR�6HQVX� em Gestão do Conhecimento e da Tecnologia da Informação da Universidade Católica de Brasília, como requisito parcial para obtenção do grau de Mestre em gestão do conhecimento e da tecnologia da informação.

Orientador: PROF. DR. ROGÉRIO ALVARENGA Co-orientador: PROF. DR. HÉRCULES ANTÔNIO DO PRADO

BRASÍLIA

2005

Page 3: Dissertação Giovanni - Revisões Feitas

'(',&$7Ï5,$

Aos dois Anjos (,Q�PHPRULDP) que, passando pela minha vida, iluminaram-na com a sua

presença e deixaram saudades profundas.

Adilson Roberto Moreira – 19/08/1963 a 11/10/2001 Larissa Carelli de Araújo – 01/02/1986 a 19/10/2001

Page 4: Dissertação Giovanni - Revisões Feitas

$*5$'(&,0(1726

Ao Senhor Deus pela saúde, força, iluminação e imensa proteção, sem o qual nada é possível. Por me ter colocado em contato com pessoas fantásticas e por me agraciar com a

oportunidade de participar de algo tão belo, e que por vezes esquecemos tão facilmente o quão maravilhoso é encontrar amigos em um ambiente de conhecimento.

À minha família pela paciência e compreensão, nas horas em que tive que me afastar em

função dos trabalhos desta dissertação. E, em especial, aos meus pais, que sempre apoiaram, incentivaram e souberam passar aos filhos, valores de honestidade, paciência, perseverança e

fé. Ao meu irmão Rogério e à minha namorada Lenita Meireles, agradeço profundamente pelo carinho.

Aos orientadores Rogério Alvarenga e Hércules Antônio do Prado, o meu agradecimento pelo incentivo e apoio, sem os quais a realização desta dissertação não teria sido possível.

À Gleycione Gundim Dutra, o meu muito obrigado pelo carinho e amizade gastos com um

hóspede que esteve presente, diversas vezes, em sua residência.

À ‘Família Politec’ que, através de seus funcionários Hiraclis Nicolaidis Júnior, Nelson de Sousa e Silva Neto, Román Dario Cuattrin e Ricardo Ajax Dias Kosloski, me cativou, na

cidade de Brasília.

Às amigas e funcionárias da Universidade Católica de Brasília, Janina Silva e Georgiane Pessoa Alcoforado Jordão, por todo apoio e incentivo.

A todos os colegas da COMDATA e da Secretaria Municipal de Saúde, que me

auxiliaram, após a digitação de todas as tabelas, na conferência e validação dos dados.

Meus agradecimentos especiais ao Sr. Dr. Alaor Moacyr Dall'Antonia Júnior, pela autorização de doação dos parâmetros climáticos necessários, e aos meteorologistas do 10º

DISME, pelo auxílio na adaptação da escala anemométrica de %HDXIRUW� para esta dissertação.

Agradeço, também, ao Prof. Gercino Monteiro Filho, do Centro Integrado de Ensino, pela consultoria e revisão dos cálculos nesta dissertação.

Page 5: Dissertação Giovanni - Revisões Feitas

'867�,1�7+(�:,1'3RHLUD�DR�YHQWR

I CLOSE MY EYES

Eu fecho os meus olhos

ONLY FOR A MOMENT AND THE MOMENT’S GONE

Somente por um momento e esse momento se vai

ALL MY DREAMS

Todos meus sonhos

PASS BEFORE MY EYES IN CURIOSITY

Passam diante dos meus olhos por curiosidade

DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND

Poeira ao vento, tudo o que somos é poeira ao vento

SAME OLD SONG

A mesma velha canção

JUST A DROP OF WATER IN A ENDLESS SEA

Apenas uma gota d’água em um mar sem fim

ALL WE DO

Todos nós

CRUMBLES TO THE GROUND AND WE REFUSE TO SEE

Esfarelamos no chão embora recusemos a ver

DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND

Poeira ao vento, tudo o que somos é poeira ao vento

DON´T HANG ON

Não se perca

NOTHING LAST FOREVER BUT THE EARTH AND SKY

Nada dura para sempre exceto o céu e a terra

IT SLIPS AWAY

Ela se vai

AND ALL YOUR MONEY WON´T ANOTHER MINUTE BY

E todo seu dinheiro não comprará outro minuto

DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND

Poeira ao vento, tudo o que somos é poeira ao vento

DUST IN THE WIND

Poeira ao vento

EVERYTHING IS DUST IN THE WIND

Tudo é poeira ao vento

GRUPO: KANSAS

Page 6: Dissertação Giovanni - Revisões Feitas

I

5(6802�A Gestão da Vigilância Epidemiológica, para Dengue, pode ser realizada, através da inclusão de modelos preditivos que auxiliem ao gestor da área de saúde, na tomada de decisão, para o combate a epidemias (surtos). Com esse suporte, o tomador de decisões pode ter o apoio técnico necessário para designar seus limitados recursos humanos e financeiros, ao tratamento dos pacientes e ao combate ao vetor urbano brasileiro ($HGHV� DHJ\SWL) dessas doenças. Existem modelos relatados que alcançaram algum sucesso na predição, em áreas como a financeira e a epidemiológica. Nesta dissertação, utilizou-se Descoberta de Conhecimentos em Base de Dados com Mineração de Dados, para realizar um estudo de caso, na construção de um modelo de predição, baseado em séries temporais, para a cidade de Goiânia-Go, e para comparar os resultados obtidos nesse modelo, com os do Diagrama de Controle, que é a técnica atual utilizada no Brasil.

Foram utilizados os dados do Sistema de Informações de Agravos de Notificação (casos confirmados) e a média dos parâmetros climáticos (definida D SULRUL�de duas semanas), coletados pelo 10º Distrito de Meteorologia daquela cidade, no período de 01/01/2001 a 30/04/2004, por semana epidemiológica.

O uso das séries temporais se deve à possibilidade de previsões de novos estados, a partir da análise dos valores passados. Consistem em medidas ou observações, obtidas a partir de um fenômeno, e que são realizadas seqüencialmente, sob um intervalo de tempo.

As séries produzidas foram representadas na forma de redes neurais artificiais, tipo MLP – 0XOWL/D\HU� 3HUFHSWURQ, com algoritmo de aprendizado de retropropagação (EDFNSURSDJDWLRQ) e, nele, aplicada a técnica de janelamento. O modelo obtido possibilita a detecção prévia do início do surto, com margem de confiança satisfatória. Evidenciou-se a sazonalidade da série histórica de Dengue para o período, com valores, também, satisfatórios, que possibilitam e credenciam a aplicabilidade do modelo, na predição de surtos de Dengue, para a cidade de Goiânia-Go.

�3DODYUDV�&KDYH: Mineração de Dados; Predição; Séries Temporais; Janelamento; Dengue; Redes Neurais Artificiais.

Page 7: Dissertação Giovanni - Revisões Feitas

II

$%675$&7�The management of epidemiological surveillance for Dengue or Yellow Fever can be performed by incorporating predictive models to help the health policy makers to take decisions concerning the control of epidemics (outbreaks). With this tool he may have the necessary technical support to allocate his limited human and financial resources to the patients care and/or the control of the Brazilian urban vector ($HGHV� DHJ\SWL) for these diseases. Models have been reported reaching some success in predicting financial and epidemiological fields. In our thesis we have used Knowledge Database Discovery, with datamining, using temporal series, in order to build up a predictive model for the city of Goiania - Goias in central Brazil to compare results obtained by the Control Diagram that is the standard technique applied in epidemiological studies in Brazil.

We used data from Sistema de Informações de Agravos de Notificação (confirmed cases) and the mean of climatic parameters (defined a priori in two weeks) colleted by 10º Distrito de Meteorologia of this city, from the period of 01/01/2001 to 30/04/2004, by epidemiological week. All confirmed cases refer to Dengue since there was no report of Yellow Fever during the study period.

The use of temporal series aims to predict new values taking into account the analyses of previous values. The temporal series are measures or observations obtained from phenomena and which are sequentially produced in a time interval.

The temporal series were represented in artificial neural networks format such as MLP – MultiLayer Perceptron as a EDFNSURSDJDWLRQ learning algorithmic using the windowing technique. The model obtained made possible an early warning of outbreak with reliable confidence limit. There was evidence of the seasonality of the Dengue temporal series, for the period, with satisfactory values that made possible to recommend this predictive model for Dengue outbreaks in municipality of Goiania-Goias.

.H\�:RUGV� Datamining; prediction; forecasting; series; windowing; dengue; artificial neural network

Page 8: Dissertação Giovanni - Revisões Feitas

III

680È5,2�5(6802 �������������������������������������������������������������������������������������������������������������������������������������� , $%675$&7��������������������������������������������������������������������������������������������������������������������������������� ,, /,67$�'(�),*85$6���������������������������������������������������������������������������������������������������������������������9 /,67$�'(�48$'526 ����������������������������������������������������������������������������������������������������������������9,, /,67$�'(�48$'526 ����������������������������������������������������������������������������������������������������������������9,, /,67$�'(�7$%(/$6 ���������������������������������������������������������������������������������������������������������������9,,, /,67$�'(�*5È),&26 ���������������������������������������������������������������������������������������������������������������� ,; /,67$�'(�6,*/$6 �����������������������������������������������������������������������������������������������������������������������; /,67$�'(�$%5(9,$d®(6���������������������������������������������������������������������������������������������������������;,, � ,1752'8d­2 �����������������������������������������������������������������������������������������������������������������������

1.1 EXPOSIÇÃO DO ASSUNTO.............................................................................................5 1.2 INTRODUÇÃO AO PROBLEMA........................................................................................5 1.3 DEFINIÇÃO DA PESQUISA.............................................................................................7 1.4 DELIMITAÇÃO DA PESQUISA........................................................................................7 1.5 JUSTIFICATIVA DA PESQUISA........................................................................................8 1.6 REFERENCIAL TEÓRICO................................................................................................8 1.7 OBJETIVOS...................................................................................................................9 ����� *HUDO �������������������������������������������������������������������������������������������������������������������� ����� (VSHFtILFRV ���������������������������������������������������������������������������������������������������������� 1.8 HIPÓTESE...................................................................................................................10 ����� +LSyWHVH�SULQFLSDO����������������������������������������������������������������������������������������������� ����� +LSyWHVHV�VHFXQGiULDV ���������������������������������������������������������������������������������������� 1.9 ORGANIZAÇÃO DO DOCUMENTO................................................................................11

� 5(9,6­2�'(�/,7(5$785$�������������������������������������������������������������������������������������������������� 2.1 DADOS, INFORMAÇÃO E CONHECIMENTO...................................................................12 2.2 GESTÃO DO CONHECIMENTO E TECNOLOGIA DA INFORMAÇÃO..................................14 2.3 SISTEMAS DE SUPORTE À DECISÃO ............................................................................16 ����� $X[tOLR�j�GHFLVmR�FRPSXWDFLRQDO ������������������������������������������������������������������������ 2.4 DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS .............................................17 ����� ,QWURGXomR����������������������������������������������������������������������������������������������������������� ����� ÈUHDV�GH�$SOLFDomR ��������������������������������������������������������������������������������������������� 2.5 MINERAÇÃO DE DADOS .............................................................................................20 ����� 7pFQLFDV�SUHGLWLYDV�GD�0' ��������������������������������������������������������������������������������� ����� 3UREOHPDV��GHVDILRV��YDQWDJHQV��iUHDV�GH�DSOLFDomR�H�WpFQLFDV�GD�0' ������������ 2.6 CRISP-DM PARA MINERAÇÃO DOS DADOS................................................................29 2.7 REDES NEURAIS ARTIFICIAIS.......................................................................................31 ����� ,QWURGXomR����������������������������������������������������������������������������������������������������������� ����� &DUDFWHUtVWLFDV�H�DUTXLWHWXUDV�GDV�51$V������������������������������������������������������������ ����� 5HGHV�0XOWL/D\HU�3HUFHSWURQ ����������������������������������������������������������������������������� 2.8 GESTÃO DO CONHECIMENTO SOBRE OS EFEITOS DO CLIMA NA SAÚDE HUMANA.........40 2.9 O MODELO DE NOTIFICAÇÃO BRASILEIRO...................................................................43 ����� 'LDJUDPDV�GH�FRQWUROH ��������������������������������������������������������������������������������������� 2.10 DENGUE E SEU VETOR................................................................................................45 ������ 'HQJXH ���������������������������������������������������������������������������������������������������������������� 2.11 INQUÉRITOS SOROLÓGICOS.........................................................................................50 2.12 ESTUDOS RELATADOS................................................................................................52

Page 9: Dissertação Giovanni - Revisões Feitas

IV

������ (VWXGR�DSUHVHQWDGR�QD�66%'0¶����������������������������������������������������������������������� ������ 0RGHOR�3DQ�(XURSHX�GH�6D~GH �������������������������������������������������������������������������� ������ 0RGHOR�$OHPmR�GH�6D~GH������������������������������������������������������������������������������������ ������ 2XWURV�PRGHORV�GH�SUHGLomR�H�WUDEDOKRV�HQFRQWUDGRV ��������������������������������������� ������ 7UDEDOKRV�HQFRQWUDGRV�UHODWLYRV�DR�%UDVLO �������������������������������������������������������� ������ 2XWUDV�SXEOLFDo}HV�UHIHUHQWHV�D�'HQJXH������������������������������������������������������������ ������ (VWXGRV�HSLGHPLROyJLFRV�HP�*RLkQLD����������������������������������������������������������������� � 0(72'2/2*,$�������������������������������������������������������������������������������������������������������������������

3.1 CARACTERIZAÇÃO DA PESQUISA................................................................................62 ����� &ODVVLILFDomR�GD�3HVTXLVD ���������������������������������������������������������������������������������� ����� 8QLYHUVR�GD�3HVTXLVD ����������������������������������������������������������������������������������������� 3.2 MATERIAL E MÉTODOS..............................................................................................63 ����� $ERUGDJHP�$GRWDGD ������������������������������������������������������������������������������������������� ����� 'HVFULomR�GR�PpWRGR�&5,63�'0����������������������������������������������������������������������� ����� &ROHWD�GH�'DGRV�������������������������������������������������������������������������������������������������� ����� 5HSUHVHQWDomR�GD�DQiOLVH�GRV�GDGRV ������������������������������������������������������������������ ����� $QiOLVH�GRV�JUiILFRV�H�UHVXOWDGRV�HQFRQWUDGRV�QD�SUHGLomR ������������������������������ 3.3 MODELO PROPOSTO...................................................................................................66 3.4 ENTENDIMENTO DO NEGÓCIO.....................................................................................68 ����� 2EMHWLYRV ������������������������������������������������������������������������������������������������������������� ����� $YDOLDomR�GRV�UHFXUVRV�DWXDLV ���������������������������������������������������������������������������� ����� 2EMHWLYRV�D�VHUHP�DOFDQoDGRV�SHOD�PLQHUDomR�GH�GDGRV ����������������������������������� 3.5 ENTENDIMENTO DOS DADOS......................................................................................72 ����� 'DGRV�,QLFLDLV ����������������������������������������������������������������������������������������������������� ����� 'HVFULomR�GRV�GDGRV ������������������������������������������������������������������������������������������� ����� ([SORUDomR�GRV�GDGRV����������������������������������������������������������������������������������������� ����� 4XDOLGDGH�GRV�GDGRV ������������������������������������������������������������������������������������������ ����� $VSHFWRV�GD�*&�QR�HQWHQGLPHQWR�GRV�GDGRV ����������������������������������������������������� 3.6 PREPARAÇÃO DOS DADOS........................................................................................101 3.7 MODELAGEM ...........................................................................................................102 3.8 APRESENTAÇÃO DOS RESULTADOS...........................................................................116

� $1È/,6(�'26�5(68/7$'26 ����������������������������������������������������������������������������������������������� � &21&/86®(6�(�68*(67®(6�3$5$�75$%$/+26�)878526�������������������������������������������������

5.1 CONSIDERAÇÕES FINAIS...........................................................................................121 5.2 DESTAQUES E CONTRIBUIÇÃO DA PESQUISA.............................................................121 5.3 SUGESTÕES PARA NOVOS TRABALHOS DE PESQUISA.................................................123

5()(5Ç1&,$6�%,%/,2*5È),&$6 ����������������������������������������������������������������������������������������������� */266È5,2��',&,21È5,2�'(�7(5026� ������������������������������������������������������������������������������������� $1(;2�$���62/,&,7$d­2�'(�'2$d­2�'(�'$'26�$2�6(&5(7È5,2�081,&,3$/�'(�6$Ò'(�'(�*2,Æ1,$���*2 ���������������������������������������������������������������������������������������������������������������������������� $1(;2�%���62/,&,7$d­2�'(�'2$d­2�'(�'$'26�$2�',5(725�35(6,'(17(�'$�&20'$7$��������������������������������������������������������������������������������������������������������������������������������������������������� $1(;2�&���62/,&,7$d­2�'(�'2$d­2�'(�'$'26�&/,0È7,&26�$2�0,1,67e5,2�'$�

$*5,&8/785$�(�'2�$%$67(&,0(172 ������������������������������������������������������������������������������������� $1(;2�'���&$/(1'È5,2�(3,'(0,2/Ï*,&2�'(������$�������������������������������������������������������� $1(;2�(���(6&$/$�$1(020e75,&$�%($8)257�$'$37$'$ �������������������������������������������������

Page 10: Dissertação Giovanni - Revisões Feitas

V

/,67$�'(�),*85$6�FIGURA 1 - PROCESSO DE CONSTRUÇÃO DE UMA BASE DE REGRAS DE UMA REGIÃO ADAPTADA DE

AGRAWAL E PSAILA (1995, PP.1-2, COM ALTERAÇÕES)......................................................27 FIGURA 2 - REPRESENTAÇÃO DOS QUATRO NÍVEIS DA METODOLOGIA CRISP-DM (SPSS, 2000,

P.09, TRADUÇÃO NOSSA) ....................................................................................................30 FIGURA 3 - REPRESENTAÇÃO DO NÍVEL FASES DA CRISP-DM (SPSS, 2000, P.13, TRADUÇÃO

NOSSA)...............................................................................................................................31 FIGURA 4 - COMPONENTES DO NEURÔNIO BIOLÓGICO (BRAGA; LUDERMIR; CARVALHO,

2000, P.06).........................................................................................................................31 FIGURA 5 - COMPONENTES DO NEURÔNIO DE MCCULLOCH E PITTS (BRAGA; LUDERMIR;

CARVALHO, 2000, P.09).................................................................................................32 FIGURA 6 - ARQUITETURAS DE REDES NEURAIS ARTIFICIAIS – RETIRADA DE HAYKIN (2001,

PP.47-49) ...........................................................................................................................35 FIGURA 7 - FLUXO DE PROCESSAMENTO DO ALGORITMO %$&.�3523$*$7,21 ............................37 FIGURA 8 PREDIÇÃO DE VOLUME DE VENDAS DURANTE CINCO SEMANAS UTILIZANDO RNA COM

A TÉCNICA DE JANELAMENTO (BRAGA; LUDERMIR; CARVALHO, 2000, P.226) .......38 FIGURA 9 - PREDIÇÃO REALIZADA POR ALVARENGA E OLIVEIRA JUNIOR E CARVALHO (2003,

P.19) ..................................................................................................................................39 FIGURA 10 - GRÁFICO DA CURVA DE APRENDIZADO REALIZADA POR OLIVEIRA E ALVARENGA

(2003, P.10) .......................................................................................................................40 FIGURA 11 - GRÁFICO DA PREDIÇÃO REALIZADA POR OLIVEIRA E ALVARENGA (2003 P.11)......40 FIGURA 12 - MUDANÇAS CLIMÁTICAS E SEUS EFEITOS NA SAÚDE HUMANA (OMS, 2003D, P.30,

TRADUÇÃO NOSSA, COM ALTERAÇÕES) ..............................................................................41 FIGURA 13 – DIAGRAMA DE CONTROLE E CASOS NOTIFICADOS DE DENGUE POR SEMANA

EPIDEMIOLÓGICA, GOIÂNIA – GO, 2001 (SIQUEIRA JUNIOR, 2001, P.23)......................45 FIGURA 14 - ASPECTO DE UM $('(6�$(*<37, (MUNSTERMANN, 1995) ...............................46 FIGURA 15 ASPECTO DE UM $('(6�$/%23,&786 (CRUZ, 2004) ...............................................46 FIGURA 16 - TIPOS DE TRANSMISSÃO INDIRETA RECONHECIDA PARA DENGUE (OMS, 2003D,

P.16, TRADUÇÃO NOSSA, COM ALTERAÇÕES)......................................................................47 FIGURA 17 – PAÍSES COM PRESENÇA DE DENGUE EM 2003 (OMS ,2004C, P.74)........................48 FIGURA 18 - SOROTIPOS CIRCULANTES DO VÍRUS DA DENGUE POR ESTADOS, BRASIL, 2004 (SVS ,

2005, P.02).........................................................................................................................49 FIGURA 19 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE

PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW , 1998)............................................54 FIGURA 20 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE

PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW, 1998).............................................54 FIGURA 21 - ÓBITOS OBSERVADOS E ESTIMADOS POR REGRESSÃO BINOMIAL NEGATIVA E REDE

NEURAL - CEARÁ, JULHO DE 1991 A DEZEMBRO DE 1995 (PENNA, 2004, P.355) .............56 FIGURA 22 - CASOS RELATADOS DE DENGUE NO BRASIL NOS ANOS DE 1986 A 2003 (SIQUEIRA

JÚNIOR, 2005, P.49).........................................................................................................57 FIGURA 23 - NÚMERO DE CASOS RELATADOS DE AGRAVO, ÓBITOS, HOSPITALIZAÇÕES E ANO DA

TIPIFICAÇÃO DOS CASOS DE DENGUE NO BRASIL (SIQUEIRA JÚNIOR, 2005, P.50).........58 FIGURA 24 -PREVALÊNCIA DE DENGUE EM GOIÂNIA , 2001 (SIQUEIRA JÚNIOR (7�$/�, 2004)61 FIGURA 25 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA

EPIDEMIOLÓGICA SEGUNDO REGIÃO, BRASIL, 2004 (SVS, 2005) P.01................................66 FIGURA 26 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA

EPIDEMIOLÓGICA DA REGIÃO CENTRO-OESTE, BRASIL, 2003-2004 (SVS ,2005) P.5 .........67 FIGURA 27 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA ,

Page 11: Dissertação Giovanni - Revisões Feitas

VI

2003 A 2004, (FRANÇA; ALVES SILVA; AMORIM SILVA, 2004, P.52).....................67 FIGURA 28 TOTAL ANUAL DE REGISTROS DE DENGUE, SINAN, GOIÂNIA , 2001-2004 ...............79 FIGURA 29 – PERCENTUAL ANUAL DE REGISTROS DE DENGUE, APÓS SELEÇÃO, SINAN,

GOIÂNIA , JAN/2001 A ABR/2004 .......................................................................................80 FIGURA 30 - TIPOS E PERCENTUAL DE DENGUE, GOIÂNIA , 2001 A 2004 .....................................80 FIGURA 31 – PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO DENGUE DO SINAN,

GOIÂNIA , 2001-2004 .........................................................................................................81 FIGURA 32 - PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO VACINADO, SINAN,

GOIÂNIA , 2001-2004 .........................................................................................................82 FIGURA 33 - PERCENTUAL POR GÊNERO EM GOIÂNIA , IBGE, 2000 (A); PERCENTUAL POR

GÊNERO NA ANÁLISE DO SINAN, GOIÂNIA , 2001 A 2004 ..................................................83 FIGURA 34 – CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE HABITANTES POR BAIRRO,

GOIÂNIA , 2001 A 2004.......................................................................................................84 FIGURA 35 – PERCENTUAL DE FAIXA ETÁRIA POR ANO, SINAN, GOIÂNIA , 2001-2004 ..............85 FIGURA 36 – PERCENTUAL POR FAIXA ETÁRIA – GOIÂNIA , IBGE, 2000 (A) E PERCENTUAL DE

CASOS CONFIRMADOS DE DENGUE – GOIÂNIA , SINAN, 2001 A 2004.................................86 FIGURA 37 – CASOS CONFIRMADOS DE DENGUE POR BAIRROS VERSUS CEMITÉRIOS EXISTENTES,

GOIÂNIA , 2001-2004 .........................................................................................................87 FIGURA 38 – CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE LOTES VAGOS POR

BAIRROS, GOIÂNIA , 2001-2004..........................................................................................87 FIGURA 39 - CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE ÁREA VERDE POR

BAIRRO, GOIÂNIA , 2001-2004............................................................................................88 FIGURA 40- CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE FEIRAS LIVRES SEMANAIS

POR BAIRRO, GOIÂNIA , 2001-2004.....................................................................................89 FIGURA 41 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE HOSPITAIS POR BAIRRO,

GOIÂNIA , 2001-2004 .........................................................................................................89 FIGURA 42 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE ESCOLAS, GOIÂNIA ,

2001- 2004 ........................................................................................................................90 FIGURA 43 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE PRÉDIOS POR BAIRRO,

GOIÂNIA , 2001- 2004.........................................................................................................91 FIGURA 44 – PERCENTUAL DE CASOS CONFIRMADOS POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA ,

2001 A 2003.......................................................................................................................91 FIGURA 45 – SÉRIE TEMPORAL DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA , 2001 A 2004 93 FIGURA 46 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, SMSGO,

GOIÂNIA -2004 .................................................................................................................103 FIGURA 47 - ARQUITETURA DE REDE UTILIZADA, NO ($6<11�3/86� PARA PREDIÇÃO

EPIDEMIOLÓGICA DE DENGUE..........................................................................................106 FIGURA 48 – GRÁFICO DA CURVA DE APRENDIZADO – RODADA 1............................................106 FIGURA 49 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 1 .....107 FIGURA 50– GRÁFICO DA CURVA DE APRENDIZADO – RODADA 2 ............................................110 FIGURA 51 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 2.....111 FIGURA 52 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....112 FIGURA 53 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....113 FIGURA 54 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....115 FIGURA 55 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA , 2004 – RODADA 3 .....116 FIGURA 56 – COMPARAÇÃO DAS PREDIÇÕES DAS TÉCNICAS: DIAGRAMA DE CONTROLE E

MINERAÇÃO DE DADOS PARA O PERÍODO DE DOAÇÃO.......................................................118

Page 12: Dissertação Giovanni - Revisões Feitas

VII

/,67$�'(�48$'526�QUADRO 1 - QUADRO DE TÉCNICAS DE MD DESENVOLVIDO A PARTIR DOS AUTORES FAYYAD E

PIATETSKY-SHAPIRO E SMYTH (1996); TURBAN E RAINER E POTTER (2004, P.159) E

DELMATER E HANCOCK (2001)..........................................................................................22 QUADRO 2 - DICIONÁRIO DE DADOS DA TABELA DO SINAN, REFERENTE A PESQUISAS SOBRE O

DENGUE.............................................................................................................................73 QUADRO 3 - DICIONÁRIO DE DADOS SOBRE OS DADOS DO VETOR..............................................75 QUADRO 4 - DICIONÁRIO DE DADOS DA SEPLAN......................................................................75 QUADRO 5 - DICIONÁRIO DE DADOS DA COMDATA ................................................................76 QUADRO 6 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AS SEMANAS EPIDEMIOLÓGICAS....77 QUADRO 7 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AOS DADOS DO 10º DISME ..........77 QUADRO 8- CLASSIFICAÇÃO DOS PERÍODOS ENDÊMICOS E EPIDÊMICOS DE GOIÂNIA ANOS 2001 A

2004 ..................................................................................................................................98 QUADRO 9 - DICIONÁRIO DE DADOS DA TABELA CLASSIFICADORFINAL...........................101 QUADRO 10 – ANÁLISE DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA , 2001 A 2004 .........116 QUADRO 11 – ANÁLISE DOS CASOS DE DENGUE VERSUS VARIÁVEL, GOIÂNIA , 2001 A 2004....117

Page 13: Dissertação Giovanni - Revisões Feitas

VIII

/,67$�'(�7$%(/$6�TABELA 1 - TOTAL DE REGISTROS ANTES, DEPOIS DA SELEÇÃO E A PERDA.................................79 TABELA 2 - ANÁLISE DOS RESULTADOS DA PREVISÃO FEITA ATRAVÉS DO DIAGRAMA DE

CONTROLE DA SECRETARIA MUNICIPAL DE SAÚDE DE GOIÂNIA - GOIÁS, 2004...............104 TABELA 3 – ANÁLISE DOS RESULTADOS DA PREVISÃO – TÉCNICA 1.........................................106 TABELA 4 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 2.........................................110 TABELA 5 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 3.........................................113

Page 14: Dissertação Giovanni - Revisões Feitas

IX

/,67$�'(�*5È),&26�QUADRO DE GRÁFICOS 1 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS

CLIMÁTICAS DE 2001..........................................................................................................94 QUADRO DE GRÁFICOS 2 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS

CLIMÁTICAS DE 2002..........................................................................................................95 QUADRO DE GRÁFICOS 3 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS

CLIMÁTICAS DE 2003..........................................................................................................96 QUADRO DE GRÁFICOS 4 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS

CLIMÁTICAS DE 2004..........................................................................................................97 QUADRO DE GRÁFICOS 5 – TREINAMENTO PROPOSTO – RODADA 2 ..........................................109

Page 15: Dissertação Giovanni - Revisões Feitas

X

/,67$�'(�6,*/$6�10º DISME 10º Distrito de Meteorologia AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius) CARESS (SLGHPLRORJLFDO�DQG�6WDWLVWLFDO�'DWD�([SORUDWLRQ�6\VWHP CARLOS &DQFHU�5HJLVWU\�/RZHU�6D[RQ\�COMDATA Companhia de Processamento de Dados do Município de Goiânia CRISP-DM &URVV�,QGXVWULDO�6WDQGDUG�3URFHVV�IRU�'DWD�0LQLQJ CSV &RPPD�6HSDUDWHG�9DOXH�DBF 'DWD�%DVH�)RUPDW�DCBD Descoberta de Conhecimento em Banco de Dados�DH Dengue Hemorrágico DSS 'HFLVLRQ�6XSSRUW�6\VWHP�DW 'DWD�:DUHKRXVLQJ EI Era da Informação�EUA Estados Unidos da América�EWS (DUO\�:DUQLQJ�6\VWHPV�FHD Febre Hemorrágica do Dengue FUNASA Fundação Nacional de Saúde GC Gestão do Conhecimento GIS *HRJUDSKLF�,QIRUPDWLRQ�6\VWHP�HBR +DUYDUG�%XVLQHVV�5HYLHZ�IA Inteligência Artificial�INEMET Instituto Nacional de Meteorologia KDD .QRZOHGJH�'LVFRYHU\�LQ�GDWDEDVHV�MD Mineração de Dados�MGCTI Mestrado em Gestão do Conhecimento e da Tecnologia da Informação MLP 0XOWLOD\HU�3HUFHSWURQ ou�SHUFHSWURQ�PXOWL�FDPDGDV�OMS Organização Mundial de Saúde�PD Índice pluviométrico ou precipitação (medida diária) PIB Produto Interno Bruto�RNAs Redes Neurais Artificiais SAMC 6RXWKHUQ�$IULFD�0DODULD�&RQWURO�SAP Sistemas de Aviso Prévio�SEPLAN Secretaria Municipal de Planejamento SIG Sistema de Informação Geográfica�SIG’S Sistemas de Informações Geográficas SINAN Sistema de Informações de Agravos de Notificação�SIR 6XVFHSWLEOH�,QIHFWHG�,PPXQH SMS Secretaria Municipal de Saúde SMS-GO Secretaria Municipal de Saúde de Goiânia-GO SSD Sistema de Suporte a Decisão SUS Sistema Único de Saúde TEMP Temperatura (média diária, valor em Graus Celsius) TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius) TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius) UBV Ultra Baixo Volume UCB Universidade Católica de Brasília URA Umidade Relativa do Ar

Page 16: Dissertação Giovanni - Revisões Feitas

XI

URA Umidade relativa do ar (média diária, valor em percentual) URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual) URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual) WHO :RUOG�+HDOWK�2UJDQL]DWLRQ

Page 17: Dissertação Giovanni - Revisões Feitas

XII

/,67$�'(�$%5(9,$d®(6�H�J�� (H[HPSOL�JUDWLD), Por exemplo i.e. Isto é

Page 18: Dissertação Giovanni - Revisões Feitas

5

� ,1752'8d­2�“Se GHVHQYROYLGD� H� DSOLFDGD� FRP� VXFHVVR�� D� WHRULD� H� SUiWLFD� GD� JHVWmR� GR�

FRQKHFLPHQWR� VH� WRUQDUi�XPD�GLVFLSOLQD� IXQGDPHQWDO�SDUD�HOLPLQDU�HVSDoRV�TXH� OHYHP�DR� DXPHQWR� GH� TXDOLGDGH� QD� VD~GH� S~EOLFD� SDUD� WRGRV�´ Dr. Ariel Pablos-Mendez,

Diretor do Departamento de Gestão e Compartilhamento do Conhecimento, da

Organização Mundial de Saúde, 2005.

���� ([SRVLomR�GR�$VVXQWR�É necessário o suporte à decisão para vigilância epidemiológica, através de modelos

preditivos, que possam auxiliar o gestor da área de saúde, na tomada de decisão. Assim

ele pode designar seus limitados recursos humanos e financeiros para o tratamento dos

pacientes e para o combate ao vetor urbano de Dengue.

Existem relatos de modelos já utilizados com algum sucesso, na predição, em áreas

como a financeira (H�J� ALVARENGA; OLIVEIRA JUNIOR; CARVALHO, 2003) e a

epidemiológica (H�J� GILL, 1923 DSXG Organização Mundial de Saúde, 2004b) que

podem auxiliar no prognóstico de casos confirmados de Dengue através de técnicas

regressivas de Redes Neurais Artificiais.

A grande vantagem desses modelos preditivos é o preço baixo, quando não,

gratuito, das variáveis (i.e. dados eletrônicos) necessárias para predição. Justifica-se esta

afirmativa, pois os dados (H�J� tomada do vetor, casos notificados) são coletados de forma

compulsória, por diversos órgãos municipais, estaduais e federais, em todo o território

brasileiro.

Nesta dissertação será abordado um modelo preditivo com a granularidade de casos

confirmados de Dengue que é maior que a convencional que trabalha com casos

notificados.

���� ,QWURGXomR�DR�3UREOHPD�A :RUOG�+HDOWK�2UJDQL]DWLRQ (WHO) ou Organização Mundial de Saúde (OMS)

(2004b, p.04) afirma que o conhecimento existente sobre a interação entre o clima e a

saúde, data da época de Aristóteles e a compreensão do assunto tem mais avançado a

Page 19: Dissertação Giovanni - Revisões Feitas

6

cada ano. A habilidade de se predizer as interações entre o clima e as doenças infecciosas,

também tem melhorado nos últimos anos. Existe a tendência de se desenvolver modelos

que possibilitem a predição ou o monitoramento de epidemias. Se forem precisos, o seu

valor é inestimável.

O clima tem influência na transmissão de muitas doenças. Algumas delas estão

entre as que mais influenciam o número de óbitos, nos países em desenvolvimento (OMS,

2004b, p.08, 37). Especula-se que ondas de calor ou mudanças climáticas extremas

possam causar impactos significantes na disseminação de doenças contagiosas (OMS,

2004b, p.10).

Sabe-se que algumas doenças infecciosas, principalmente as disseminadas por

vetores (insetos), como o Dengue - estão geograficamente limitadas por padrões

ambientais (H�J� clima, vegetação) (OMS, 2004b, p.10). São tradicionalmente conhecidas

como “doenças da pobreza” (PAIM, 2003, p.563) ou “doenças da modernidade”

(ANDRADE; DANTAS, 2004, p.01) e estão relacionadas a populações de baixo poder

aquisitivo e a países em desenvolvimento, (OMS, 2004b, p.37). (xistem algumas

exceções� FRPR a Austrália e &ingapura. Dentre estas doenças está o Dengue que é

disseminado pelo seu vetor ($HGHV� DHJ\SWL) e que possui influência sazonal (OMS,

2004b).

Na saúde pública, a epidemiologia é uma das áreas na qual o maior número de

estudos e publicações encontrados referentes ao Dengue, é realizado através de inquéritos

sorológicos e estudos estatísticos.

Os modelos de predição existentes e relatados (OMS, 2004b, 2003d, 2000, dentre

outros), utilizam, basicamente, dados históricos para detectar padrões de comportamento

e estimar seus valores no futuro. De forma genérica, empregam-se técnicas matemáticas

e/ou estatísticas para representar a realidade, na qual foram criadas. As estatísticas têm

sido usadas, com algum sucesso, para predição desses padrões.

A abordagem adotada neste trabalho visa explorar o uso das Redes Neurais

Artificiais para a construção de um modelo voltado à predição de casos confirmados de

Dengue e à comparação dos resultados obtidos com o Diagrama de Controle adotado no

Brasil.

Page 20: Dissertação Giovanni - Revisões Feitas

7

Assim, a proposta é explorar o uso da técnica de janela de tempo, também

conhecida como janelamento, sobre série de dados temporais para a construção de

modelo preditivo que, com certa margem de confiança, consiga prever o número de casos

confirmados que irão ocorrer em um determinado período, a partir dos dados notificados

de Dengue, contidos no Sistema de Informações de Agravos de Notificação (SINAN) e de

medidas climáticas de uma cidade, neste caso, foi escolhido como objeto de estudo os

dados da cidade de Goiânia - Goiás.

Essa abordagem justifica-se por:

a) As instituições de saúde pública, em todo território brasileiro, notificam, ao

longo dos anos e de forma compulsória, ao Departamento de Vigilância Sanitária da

cidade a que pertencem e à Secretaria Estadual de Saúde de seu Estado, cerca de

trinta e cinco (35) doenças diferentes, determinadas por lei (dentre elas, o os casos

notificados de Dengue). As notificações são feitas na forma de registros

padronizados de prontuários médicos e digitalmente guardadas no SINAN, através

de uma coleção de dados disponíveis, na forma de banco de dados eletrônico

(FUNASA, 2002);

b) O vetor (Aedes aegypti) da doença tem influência sazonal.

���� 'HILQLomR�GD�3HVTXLVD�Predizer, por meio de um modelo baseado em Redes Neurais Artificiais, a

ocorrência de surtos urbanos causados pelos vetores: PRVTXLWR�$HGHV�� possibilitando aos

gestores da área de saúde, suporte à decisão, para o planejamento de combate a

epidemias.

���� 'HOLPLWDomR�GD�3HVTXLVD�Cria um modelo para predição urbana de surtos de Dengue (OMS, 2004b, p.17), e

alimenta esse modelo com dados (i.e. parâmetros climáticos e pacientes confirmados)

Prediz a ocorrência de surtos em uma região, (OMS, 2004b, pp.15-16) e avalia seu valor

de predição (possibilita ao gestor, designar recursos humanos e/ou financeiros para o

tratamento dos pacientes, campanhas informativas e educativas e combate do vetor da

1 “Tipo de mosquito que pode transmitir doenças como a Febre Amarela e o Dengue” (OMS, 1996, p. 01).

Page 21: Dissertação Giovanni - Revisões Feitas

8

doença em tela).

���� -XVWLILFDWLYD�GD�3HVTXLVD�A cada dia, gera-se grande quantidade de dados médicos (registrados em

prontuários) e laboratoriais (resultados de exames) de pacientes atendidos por

profissionais de saúde em hospitais ou laboratórios. Esses dados representam as

condições médicas ou doenças que os pacientes apresentam e possibilitam a notificação

de casos de doenças transmissíveis. A notificação é importante, especialmente na

prevenção e disseminação de epidemias2 e pode ser feita de forma semanal, mensal e

anual (SCHUMANN; CHAVEZ; GRAW, 1998, p.01; OMS, 2004b, p.27).

A análise rápida dos dados assegura suporte epidemiológico a gestores de saúde

(OMS, 2004b), através de ações preventivas à disseminação ou ao surgimento de

epidemias (CUMMINGS HW�DO�, 2004, p.345), através do combate ao vetor ou vacinação

da população. Pode ser feita através de:

a) Técnicas de Mineração de Dados, para buscar os padrões de ocorrência e

comportamento das doenças (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,

p.37);

b) Análise estatística ou de gráficos (OMS, 2004b, p.08,09).

Essa pesquisa utiliza os dados de exames laboratoriais e avaliações médicas do

Sistema Único de Saúde Brasileiro (SUS), do qual setenta por cento (70%) da população

brasileira depende (WESTPHAL, 2000, p.46) e fornece ao gestor da área de saúde bases

para gerenciar seus limitados recursos humanos e financeiros.

���� 5HIHUHQFLDO�7HyULFR�Os Sistemas de Suporte à Decisão fornecem alternativa computacional aos gestores,

para tomada de decisão, em problemas cuja solução não é trivial. Suas principais

vantagens são (TURBAN; RAINER; POTTER, 2004):

a) Permitir tomadas de decisões a partir de grandes fontes (bases) de dados;

b) Superar os limites humanos no processamento e armazenamento de informações;

2 “Doença que ataca ao mesmo tempo muitas pessoas da mesma região” (MICHAELIS, 1998, p.483).

Page 22: Dissertação Giovanni - Revisões Feitas

9

c) Reduzir os custos de pesquisa de um projeto;

d) Prover soluções com qualidade e em curto espaço de tempo.

A Mineração de Dados apresenta a possibilidade de gerar, através de

tarefas/técnicas (H�J� regressão e classificação) e aplicativos (VRIWZDUHV) específicos,

informações preditivas que possam fornecer aos gestores, subsídios para tomada de

decisão. Dentre estes VRIWZDUHV�estão os que utilizam as Redes Neurais Artificiais para

este fim (predição) (BRAGA; LUDERMIR; CARVALHO, 2000; ALVARENGA;

OLIVEIRA JUNIOR; CARVALHO, 2003).

As Redes Neurais Artificiais são sistemas de processamento de informações

distribuídos, compostos por elementos computacionais simples (i.e. neurônios artificiais)

e, por serem inspiradas no cérebro humano, apresentam características como a capacidade

de aprendizagem de padrões complexos de informações ou a de generalizar uma

informação aprendida (BAETS; VENGOPAL, 1994 DSXG PASSARI, 2003; BRAGA;

LUDERMIR; CARVALHO, 2000; HAYKIN, 2001; OLIVEIRA; ALVARENGA, 2003).

A OMS (2004b, 2003e, 2000b), enfatiza a necessidade de pesquisas que possam

fornecer suporte à decisão, aos gestores da área de saúde, na predição e combate de surtos

(RXWEUHDNV) de várias doenças que estão sob influência sazonal, incluindo as causadas por

vetores. Em todo mundo, Dengue está entre as doenças que mais afetam a população dos

países em desenvolvimento.

No Brasil, o combate e a prevenção de trinta e cinco doenças diferentes, é feito

através do Modelo Brasileiro de Notificação. Esta notificação, nos hospitais públicos e

estaduais, é feita através de preenchimento de formulários específicos que são enviados à

Secretaria Municipal de Saúde e armazenados em forma digital no Sistema de

Informações de Agravos de Notificação. Em relação a Dengue, que é uma destas doenças,

o modelo é passivo e definido por lei. (FUNASA, 2002).

���� 2EMHWLYRV������� *HUDO�

O objetivo principal deste trabalho é construir um modelo para suporte à tomada de

Page 23: Dissertação Giovanni - Revisões Feitas

10

decisão no combate a epidemias de Dengue, utilizando Redes Neurais Artificiais para

predizer o número de casos confirmados dessas doenças, em menor tempo e maior

precisão do que a prática atual.

������ (VSHFtILFRV�Os objetivos específicos desta pesquisa são relacionados a seguir:

• Construção de uma base de conhecimentos epidemiológicos, a partir da

análise de variáveis para diagnóstico e identificação do surto3 a partir das seguintes

fontes de dados:

a) Resultados de exames laboratoriais e avaliações médicas (Dengue),

realizados nos laboratórios e consultórios do Sistema Único de Saúde (SUS)

da cidade de Goiânia–GO, registrados no SINAN;

b) Índice pluviométrico, temperatura e umidade relativa do ar, de Goiânia,

realizado pelo 10º DISME – Distrito de Meteorologia.

• Fornecer bases para a otimização dos recursos humanos e/ou financeiros

utilizados na gestão epidemiológica de Dengue;

• Uso e avaliação da tecnologia baseada em RNAs como instrumento de

análise e predição epidemiológica.

���� +LSyWHVH������� +LSyWHVH�SULQFLSDO�

Um modelo de predição, baseado em Redes Neurais Artificiais, aplicando séries

temporais, pode garantir maior precisão de resultados e melhor qualidade que o modelo

atual utilizado pelo Sistema Brasileiro de Notificação, vigente para Vigilância

Epidemiológica de Dengue.

������ +LSyWHVHV�VHFXQGiULDV�O número de casos confirmados de Dengue em Goiânia-Go, neste período,

3 Definição de Last (2001 apud OMS, 2004, p. 14, tradução nossa): “Uma epidemia (praga) limitada a um local que aumenta na incidência de uma doença (enfermidade). e.g. em uma vila, cidade ou instituição fechada.”

Page 24: Dissertação Giovanni - Revisões Feitas

11

apresenta relação com:

a) Mudanças das variáveis climáticas (i.e. apenas algumas variáveis

climáticas influenciam o surto);

b) Características urbanas (H�J� percentual de área verde, número de prédios

por bairro, número de cemitérios) e populacionais (sexo, habitantes por

bairro e faixa etária) apresentadas em Goiânia-GO no período estudado.

���� 2UJDQL]DomR�GR�'RFXPHQWR�O presente trabalho está estruturado em cinco (05) capítulos, a saber:

No Capítulo 1 – Introdução – apresentação das considerações iniciais: ao

conhecimento sobre a interação entre o clima e a saúde; à definição do tema, delimitação

da pesquisa, referencial teórico, justificativa, objetivos e hipóteses desta dissertação.

No Capítulo 2 - Revisão de Literatura – apresentação do referencial teórico sobre

dados, informação e conhecimento. Na seqüência, aborda-se: Gestão do Conhecimento e

Tecnologia da Informação; Sistemas de Suporte à Decisão; Mineração de Dados; Redes

Neurais e Séries Temporais; efeitos do clima sobre a saúde humana; Modelo Brasileiro de

Predição; Dengue, assim como, também, o vetor brasileiro reconhecido ($HGHV�DHJ\SWL) e

os estudos relatados, encontrados.

No Capítulo 3 – Metodologia – exposição dos procedimentos metodológicos para

elaboração do trabalho, incluindo o processo de análise e modelagem de dados, para

especificação do modelo neural e dos critérios de avaliação. Foi utilizada a metodologia

&URVV�,QGXVWULDO�6WDQGDUG�3URFHVV�IRU�'DWD�0LQLQJ� através da aplicação de um estudo

de caso, na cidade de Goiânia–Go e posterior apresentação dos resultados encontrados no

período estudado.

No Capítulo 4 - Apresentação e Análise dos Resultados.

No Capítulo 5 - Conclusões e Sugestões para Trabalhos Futuros, listam-se, também,

as referências citadas e todos os anexos.

Page 25: Dissertação Giovanni - Revisões Feitas

12

� 5(9,6­2�'(�/,7(5$785$�“O valor do conhecimento é intangível, o que para muitos pode não ter sentido,

para outros pode ser a ‘invenção da pólvora’”. Autor desconhecido

���� 'DGRV��,QIRUPDomR�H�&RQKHFLPHQWR�Os dados “são fatos brutos, não organizados para transmitir um significado

específico” (TURBAN; RAINER; POTTER, 2004, p.364). São importantes porque,

através deles, é possível a criação da informação. O que permite a eficiência da

informação é a qualidade dos dados, não a sua quantidade ou o seu conjunto.

Uma informação pode ser caracterizada através de conjunto de itens que tenham

significado (TURBAN; RAINER; POTTER, 2004, p.364) e proporcionem um novo

ponto de vista para a interpretação de eventos ou objetos, tornando visíveis, significados

antes invisíveis. A compreensão de dados (H�J� fatos, textos, gráficos, imagens estáticas,

sons, etc.), por um indivíduo ou conjunto de indivíduos (organização) é uma informação.

Esta informação se completa e, sem sobrecarga, pode ser usada como vantagem

competitiva para tomada de decisão, no ambiente em que foi moldada (MORESI, 2000,

pp.17-18).

“Essa informação pode não ser a mesma do ponto de vista de quem emitiu a

mensagem, pois emissor e receptor são pessoas com experiências distintas” (LEMOS,

2003, p.07).

Pode-se considerar a informação como meio necessário para extrair ou construir o

conhecimento, alterando-o ou reestruturando-o. É o produto capaz de gerar o

conhecimento.

“Conhecimento não é dado e nem informação, mas está relacionado a ambos”

(TEIXEIRA FILHO, 2001, p.21). “É mais valioso e poderoso do que os recursos

naturais” (STEWART, 1998, p.XIII). É o resultado da interpretação, aprendizagem e

utilização da informação para algum fim, especificamente para gerar novas idéias,

resolver problemas ou tomar decisões (STEWART, 1998).

A capacidade de geração de dados, em qualquer organização, é, naturalmente,

Page 26: Dissertação Giovanni - Revisões Feitas

13

superior à capacidade de mobilizar os meios e recursos necessários à transformação

desses dados, em informações e, dessas informações, em conhecimento. O significado da

tríade (dados, informações e conhecimento) é bastante contextual e subjetivo. O que é

informação para uma pessoa ou organização pode não passar de dados para outro ente

qualquer. Além do fato de que o conhecimento depende de uma série de condições e de

conceitos bastante abstratos como valor, reflexão, síntese e utilidade, entre outros

(ALVARENGA; JUNIOR; CARVALHO, 2004, p.05).

Capturar e disseminar o conhecimento de uma instituição (organização) não é tarefa

fácil. Embora existam diversos profissionais e técnicas de captura e disseminação, ambos

(profissionais e técnicas) dependem, também, do interesse, comprometimento e dedicação

das pessoas que compõe a organização, em representar e disseminar esse conhecimento.

E aquela que representa e dissemina o conhecimento, tem a capacidade de gerar

diferenciais competitivos importantes.

Por exemplo: para maximizar os lucros em pesquisas, uma organização que possua

várias filiais, desenvolve diversos projetos simultâneos. Provavelmente os profissionais

que compõem as equipes, enfrentam alguns problemas iguais ou semelhantes aos já

ocorridos em projetos anteriores. Se as informações de solução dos problemas anteriores

(técnicas aplicadas) estão mantidas e são compartilhadas dentro da organização, os

especialistas dos novos projetos localizam as soluções e as aplicam de maneira rápida e

eficaz. Outro exemplo interessante, no mesmo sentido, é o de compartilhar, vender ou

comprar informações (soluções) sobre resolução de desafios, em projetos já enfrentados

por outras organizações.

Deve-se ressaltar que o conhecimento pode ser dividido em tácito e explícito

(NONAKA; TAKEUCHI, 1997, p.62; TURBAN; RAINER; POTTER, 2004, p.389). “O

conhecimento tácito é pessoal, específico ao contexto e, assim, difícil de ser formulado e

comunicado. Já o conhecimento explícito ou ‘codificado’, refere-se ao conhecimento

transmissível em linguagem formal e sistemática” (POLANYI, 1966 DSXG NONAKA;

TAKEUCHI, 1997, p.65). O segredo para aquisição do conhecimento está, dentre outros

fatores, na experiência obtida através da convivência entre indivíduos (NONAKA;

TAKEUCHI, 1997, p.69).

Três observações são necessárias aqui. Primeira, o conhecimento, ao contrário da

Page 27: Dissertação Giovanni - Revisões Feitas

14

informação, diz respeito a ‘crenças’ e ‘compromissos’. O conhecimento é uma

função de uma atitude, perspectiva ou intenção específica. Segunda, o conhecimento,

ao contrário da informação, está relacionado à ‘ação’. É sempre o conhecimento

‘com algum fim’. E terceira, o conhecimento, como a informação, diz respeito ao

‘significado’. É específico ao contexto e relacional [...] consideramos o

conhecimento como “um processo humano dinâmico de justificar a crença pessoal

com relação à ‘verdade’” (NONAKA; TAKEUCHI, 1997, p.63).

���� *HVWmR�GR�&RQKHFLPHQWR�H�7HFQRORJLD�GD�,QIRUPDomR�A informação e o conhecimento são os diferenciais competitivos que atualmente

são considerados os produtos econômicos mais valorosos que uma organização (empresa,

instituição) pode possuir. Na verdade, o conhecimento tácito vem sendo usado nas

organizações há muito tempo embora o reconhecimento de ele que pode e deve ser

aplicado como vantagem competitiva, seja relativamente recente (TEIXEIRA FILHO

2001, p.22).

A Gestão do Conhecimento (GC), nesse sentido, atinge um campo multidisciplinar,

que possibilita amplas implicações e aplicações em diversas áreas, pois permite que os

pesquisadores possam se tornar profissionais geradores, mantenedores e disseminadores

do conhecimento, em uma instituição (organização). A Tecnologia da Informação (TI),

normalmente associada à GC, pode ser vista como o recurso básico para implantação da

GC nas organizações (DRUCKER, 1999 DSXG LEMOS, 2003, p.06).

Na verdade a GC “é um tipo de gestão pelo qual o reconhecimento do

conhecimento individual e organizacional é fator básico para atingir os resultados

desejados de uma organização” (LEMOS, 2003, p.06). Deve ser difundida entre os

funcionários (também conhecidos como multiplicadores) da organização de forma a

maximizar a confiança no processo de geração, absorção de conhecimento e

produtividade na organização (ARAUJO; FREIRE; MENDES, 1997).

Pode ser vista, através de outros conceitos similares como: �D� “uma coleção de

processos que governa a criação, disseminação e utilização do conhecimento para atingir

plenamente os objetivos da organização” (TEIXEIRA FILHO, 2001, p.22); �E� um

“processo que acumula e cria conhecimento de modo eficiente, gerenciando uma base de

conhecimentos organizacionais para armazenar o conhecimento, e facilitando o

compartilhamento desse conhecimento para permitir sua aplicação eficaz em toda

Page 28: Dissertação Giovanni - Revisões Feitas

15

organização” (TURBAN; RAINER; POTTER, 2004, p.389); ou �F� um conjunto de

princípios e ferramentas para otimizar e integrar o processo criativo de criar, desenvolver

e disseminar o conhecimento de forma estratégica e efetiva dentro da organização (OMS,

2005, p.02).

"Existe uma relação sinergética poderosa entre gestão do conhecimento e tecnologia;

esta relação leva a retornos crescentes e sofisticação crescente, em ambas as frentes.

À medida que a tecnologia de informação se torna nossa ferramenta pessoal e nossa

conexão com os outros, aumenta nossa cobiça em acessar ainda mais informação e

conhecimento de outras pessoas, e então demandamos ferramentas de TI ainda

melhores e mais eficientes, que se tornam parte da forma como trabalhamos”

(O'DELL; GRAYSON JR, 1998, p.30).

Embora GC seja um campo novo e em discussão (TURBAN; RAINER; POTTER,

2004, p.388), existe, no mercado, uma enorme quantidade de ferramentas que procuram

gerenciar os conhecimentos das empresas. Infelizmente, nenhuma delas fornece um

modelo que se adapte a todas.

A gestão e o compartilhamento do conhecimento, no que diz respeito aos sistemas

de saúde, representam uma importante oportunidade para melhorar o atendimento e

tratamento de pacientes, particularmente nos países em desenvolvimento, pois podem

trocar experiências sobre campanhas preventivas e combate a doenças (OMS, 2005,

p.01).

A OMS (2005, p.02), no sentido de relatar e pesquisar novas ferramentas e soluções

criou o Departamento de Gestão e Compartilhamento do Conhecimento, que tem, como

tarefa, a construção de uma rede global, visando o compartilhamento de informações de

cunho médico e científico, entre todos os países. Sua estratégia é compartilhar as

abordagens da própria OMS com a perícia em saúde, de forma a encontrar ou criar novas

ferramentas e novas maneiras de se aplicar o conhecimento, aumentando, assim, em todo

o mundo, a qualidade dos sistemas de saúde pública.

Um exemplo prático da atuação desse departamento é o projeto de ligação entre

clínicas de tratamento e acompanhamento de HIV, na África, com plataformas que

disponibilizam dados (incluindo registros médicos eletrônicos) e com comunidades de

aprendizado, em busca de programas de saúde efetivos, que ajudem a aplicar e disseminar

Page 29: Dissertação Giovanni - Revisões Feitas

16

campanhas ou práticas preventivas dessa doença (OMS, 2005, p.02).

���� 6LVWHPDV�GH�6XSRUWH�j�'HFLVmR

O decisor normalmente possui capacidade de conhecimento limitada, ao se deparar

com problemas complexos e grandes. Sua habilidade não é suficiente para fornecer

soluções que conduzam a resultados esperados e desejados (EIRMAN; NIEDERMAN;

ADAMS, 1995; TURBAN; RAINER; POTTER, 2004, p.369). Assim, a tomada de

decisão é um aspecto importante para a gerência no planejamento das atividades

operacionais das organizações. É o ato final de um processo que visa resolver um

problema ou um conjunto de problemas, em um domínio de aplicação (HENDRIKS;

VRIENS, 1995; RAFAELI NETO, 2001).

Segundo Hendriks e Vriens (1995) e Rafaeli Neto (2001), os Sistemas de Suporte à

Decisão fornecem a solução para problemas que no domínio geográfico, por exemplo,

tendem a serem novos, complexos, grandes e mal estruturados. Sua complexidade se deve

à interação de uma série de variáveis de natureza complexa (H�J� natureza geográfica,

técnica, organizacional, social, temporal, etc.).

2.3.1 $X[tOLR�j�GHFLVmR�FRPSXWDFLRQDO Os 'HFLVLRQ�6XSSRUW�6\VWHP�±��'66� ou Sistemas de Suporte à Decisão (SSD) são

ferramentas computacionais que, através de consulta à base de dados, auxiliam aos

gerentes na tomada de decisão (ADRIAANS; ZANTIGE, 1996, p.28; DELMATER;

HANCOCK, 2001, p.88; PORTO; AZEVEDO, 1997 DSXG CARVALHO, 2003, p.23;

TURBAN; ARONSON, 1998, p.267; TURBAN; RAINER; POTTER, 2004, pp.369-

372).

Os SSD representam uma abordagem de auxílio computacional, baseada na intensa

utilização de bases e modelos de dados, que proporcionam o diálogo entre o homem e o

computador, na solução de problemas não triviais (CARVALHO, 2003, p.23;

HAMMERS, 2002, p.01; TURBAN; RAINER; POTTER, 2004, pp.369-372).

Possuem quatro características principais: �D� incorporam dados e modelos; �E� são

desenhados para auxiliar gerentes nos seus processos de decisão em tarefas semi-

estruturadas ou não estruturadas; �F� oferecem suporte, mas não substituem o julgamento

Page 30: Dissertação Giovanni - Revisões Feitas

17

gerencial; �G� seu objetivo é melhorar a efetividade das decisões e não a eficiência do

processo de tomada de decisão (TURBAN; ARONSON, 1998; TURBAN; RAINER;

POTTER, 2004, pp.369-372).

Os seus usuários podem utilizá-los em três tipos de configurações: �D� ativas

(permite sugestões ou decisões); �E� passivas (não permite sugestões ou decisões); �F� cooperativas (permite que o responsável pelas decisões ou um técnico sob sua orientação,

modifique, refine ou termine o processo de análise) (HÄTTENSCHWILER, 1999 DSXG�GACHET, 2001, p.215).

Em um SSD, deve haver um profissional que domine o problema, para que, através

de informações e concepção intelectual do assunto, possa obter um bom suporte à decisão

(HÄTTENSCHWILER, 1999 DSXG GACHET, 2001, p.215).

O melhor SSD não é aquele que utiliza as melhores técnicas matemáticas ou de

pesquisa a bases de dados, mas sim o que é capaz de induzir as melhores decisões. O SSD

não tem o objetivo de encontrar a solução ótima, mas, sim, auxiliar ao gestor na escolha

de uma alternativa satisfatória ao seu problema (PORTO; AZEVEDO, 1997 DSXG�CARVALHO, 2003, pp.23-24; TURBAN; RAINER; POTTER, 2004, pp.369-372).

São exemplos típicos de SSD, os Sistemas de Informações Geográficas e os

Sistemas Especialistas (TURBAN; ARONSON, 1998, TURBAN; RAINER; POTTER,

2004, p.372, 383). Citam-se como aplicações de SSD o: �D� Planejamento de mercado e

pesquisa; exemplo: geração de um catálogo de vendas, a partir da estimativa das decisões

de compra, que um consumidor pode fazer; �E� Planejamento estratégico e operações;

exemplo: monitoração, análise e geração de fazer relatos das tendências sutis de mercado,

o que pode auxiliar o gestor, a tirar proveito de campos ainda não explorados; �F� Suporte

a vendas; exemplo: executivos de altos escalões recebem relatórios diários de vendas de

produtos por região (TURBAN; ARONSON; 1998; TURBAN; RAINER; POTTER,

2004); e �G� A alocação de água para projetos de irrigação (CARVALHO, 2003).

���� 'HVFREHUWD�GH�&RQKHFLPHQWR�HP�%DVH�GH�'DGRV�“As organizações devem ser capazes de obter, organizar, analisar e interpretar os

dados, para sobreviver nos mercados globais supercompetitivos. E o gerenciamento de

dados é fundamental para todas as funções empresariais”.(TURBAN; RAINER;

Page 31: Dissertação Giovanni - Revisões Feitas

18

POTTER, 2004, p.132).

“A maioria das organizações internacionais produzem mais informações em uma

semana que algumas pessoas podem ler em toda a sua vida” [...] “Existe um paradoxo no

crescimento dos dados, quanto mais dados menos informação” (ADRIAANS;

ZANTINGE, 1996, p.02, tradução nossa).

������ ,QWURGXomR�A produção, coleta e armazenagem de dados, no mundo, aumentam em uma

enorme velocidade, tornando impossível a análise adequada para transformá-las em

informações úteis (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37). As bases

de dados, que podem representar de 65 a 70% do espaço existente em disco (MOORE,

1999, p.01), estão crescendo em tamanho, de duas maneiras: pelo aumento de número de

registros e pelo número de campos (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,

p.38).

A transformação tradicional de dados em conhecimento usa análise manual e

interpretação. É realizada por especialistas que, através de teorias e ferramentas, extraem

informações úteis, a partir de dados digitais. Ao final do processo, os especialistas geram

relatórios sobre seus estudos, para decisões ou planejamentos, fornecendo suporte à

decisão. Essa maneira tradicional de gerar conhecimento é cara, lenta e altamente

subjetiva (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.37-38; TURBAN;

RAINER; POTTER, 2004, pp.130-132, 362-363).

A transformação dos dados em informação é um processo difícil, pelos seguintes

motivos (TURBAN; RAINER; POTTER, 2004, p.367): �D� a quantidade de dados em

grandes instituições aumenta exponencialmente com o tempo; �E� a coleta de dados é feita

por vários indivíduos de uma organização, usando métodos e dispositivos diversos; �F� os

dados brutos (sem nenhum trabalho de limpeza e em seu estado original) podem ser

armazenados em diferentes formatos, bancos, sistemas e plataformas; �G� somente partes

pequenas dos dados de uma organização são relevantes para uma decisão específica; �H� a

tomada de decisão para uma grande organização requer análise de dados externos; �I� exigências legais, relacionadas aos dados, são diferentes, dependendo da região e mudam

com freqüência; �J� selecionar a ferramenta ideal para um trabalho pode ser um problema,

Page 32: Dissertação Giovanni - Revisões Feitas

19

devido ao grande número de produtos comerciais existentes e aos requisitos para operar

essa ferramenta.

É inegável que diante das dificuldades acima listadas e do desgaste humano para

analisar, manualmente, essa grande quantidade de dados, surge o desafio de desenvolver

técnicas, ou aplicativos de automação, capazes de filtrar a informação necessária de

grandes bases de dados e disponibilizá-la em formatos visualmente compreensíveis, que

possam ser utilizados para solução de um problema (ADRIAANS; ZANTIGE, 1996,

p.02; GOEBEL; GRUENWALD, 1999, p.20; MOORE, 1999, p.01).

Nem sempre dados garantem informação e informação traz conhecimento. O

desafio é retirar a informação escondida nas bases de dados, de forma a utilizá-la em

decisões (HAN; KAMBER, 2001, p.279; TURBAN; RAINER; POTTER, 2004, p.362).

Soluções estão sendo pesquisadas e resultados estão sendo obtidos, através de técnicas

oriundas da Inteligência Artificial (IA) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH,

1996, p.37), dentre elas, a Mineração de Dados.

O termo .QRZOHGJH� 'LVFRYHU\� LQ� 'DWDEDVHV� (KDD) ou Descoberta de

Conhecimento em Banco de Dados (DCBD) foi cunhado no primeiro encontro de

pesquisadores da área ocorrido em 1995, em Montreal (ADRIAANS; ZANTINGE, 1996,

p.05).

Foi definido como: “O processo de extração de conhecimento a partir dos dados

registrados numa base de dados, extração esta não trivial de conhecimento implícito,

previamente desconhecido e potencialmente útil, feita a partir dos dados registrados”

(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.40, tradução nossa).

DCBD é o processo completo de descoberta de conhecimento, a partir de uma base

de dados, e estabelece uma ênfase especial em encontrar padrões de dados,

compreensíveis ou interessantes, que possam ser interpretados visando a criação de

conhecimento (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.39-40;

MEDEIROS OLIVEIRA, 2005, p.01; OLIVEIRA; ALVARENGA, 2003, p.02).

É usado para explorar bases de dados, de maneira a fornecer informações

compreensíveis e úteis, no processo de tomada de decisão, de uma organização. O

problema básico de DCBD é transformar um grande volume de dados, que estão em sua

Page 33: Dissertação Giovanni - Revisões Feitas

20

forma primitiva, em outras formas que serão: �D� mais compactas (H�J� um pequeno

relatório); �E� mais abstratas (H�J� um modelo que possa ter sido concebido a partir de

dados); �F� mais proveitosas (H�J� um modelo de predição para estimativa de casos

futuros) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37; NOON; HANKINS,

2001, p.01). “O centro do processo é a aplicação de métodos específicos de mineração de

dados, para descoberta e extração de padrões” (AGRAWAL; PSAILA, 1995 DSXG

FAYYAD; PIATETSKY-SHAPIRO, 1996).

2.4.2 ÈUHDV�GH�$SOLFDomR

Dentre outras áreas de aplicação de DCBD, citam-se as seguintes: �D��0DUNHWLQJ�que procura identificar padrões de compras em consumidores, para a determinação dos

produtos que serão colocados em locais vizinhos, maximizando, assim, a venda (venda

cruzada); �E� Monitoração de fraudes eletrônicas em cartões de crédito, que possam

indicar a atividade de lavagem de dinheiro; �F� Predição de problemas em projetos

aéreos, através de relatos de falhas, a partir de agrupamentos; �G� Localização e

classificação de problemas ocorridos em telecomunicações de maneira a evitar

consultas a padrões já conhecidos; �H� Identificação e eliminação de redundância de

dados; �I� Predição epidemiológica, possibilitando ao gestor da área de saúde, o

planejamento de recursos para o atendimento a pacientes infectados ou para o combate

ao vetor de uma determinada doença (dengue) (MEDEIROS OLIVEIRA, 2005, p.01;

CASTRO; ALVARENGA; PRADO, 2004, p.83; CASTRO; ALVARENGA; PRADO,

2005, p.41; DELMATER; HANCOCK, 2001, p.270; FAYYAD; PIATETSKY-

SHAPIRO; SMYTH, 1996, pp.38-39; TURBAN; ARONSON, 1998, p.130;

TURBAN; RAINER; POTTER, 2004, p.159; WANG; WEIGEND, 2004, p.457).

Existem várias propostas para o processo de DCBD, dentre elas as de Fayyad e

Piatetsky-Shapiro e Smyth (1996), Adriaans e Zantinge (1996) e a de Kamp e Grupe

(1997).

���� 0LQHUDomR�GH�'DGRV�O termo mineração de dados, ou GDWD�PLQLQJ� refere-se a uma parte particular do

processo de DCBD (ADRIAANS; ZANTINGE, 1996, p.05; MEDEIROS OLIVEIRA,

2005, p.12), que aplica algoritmos específicos e técnicas próprias, para extração de

novos padrões, a partir de dados eletrônicos conhecidos (FAYYAD; PIATETSKY-

Page 34: Dissertação Giovanni - Revisões Feitas

21

SHAPIRO; SMYTH, 1996, p.39).

Mineração de Dados (MD) pode ser definida como um processo automatizado

que, a partir de grandes volumes de dados, gera um conjunto de regras significativas

ou identifica informações (recursos ou tendências ou agrupamentos), que são

dificilmente perceptíveis (BOSE; SUGUMARAN, 1999 DSXG�COFFIN HW� DO�, 2004,

p.02; FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.39; FRAWLEY;

PIATETSKY-SHAPIRO; MATHEUS, 1992 DSXG ELDER, 2004, p.02; REIFER,

2002, p.14) e que podem ser utilizadas com o objetivo de suporte à decisão (HAN;

KAMBER, 2002, p.279; WANG; WEIGEND, 2004, p.457; TURBAN; ARONSON,

1998; TURBAN; RAINER; POTTER, 2004, p.159).

Outras aplicações de MD são (TURBAN; RAINER; POTTER, 2004, p.383): �D� predição automatizada de tendências e comportamentos, através da automatização do

processo de procura de informações (H�J� compras realizadas por clientes no passado)

em bancos de dados, para se prever alvos futuros (H�J� seleção de clientes em

potencial, para determinado produto a ser vendido); �E� detecção automática de

padrões desconhecidos, anteriormente, através da análise dos dados de vendas com a

identificação dos produtos, aparentemente, não relacionados, que geralmente são

vendidos em conjunto, em um determinado dia da semana (H�J� fraldas e cerveja em

uma sexta-feira à noite). Existem diversos projetos em que a MD pode ser aplicada,

dentre eles (ELDER, 2004, p.04): �D� avaliações de crédito; �E� PDUNHWLQJ; �F� predição

de vendas; �G� detecção de fraudes.

Para Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), o objetivo da DM é a

extração de conhecimento de alto nível, a partir de dados de baixo nível, contidos em

grandes conjuntos de dados (H�J� extrair conhecimento a partir de uma base de dados).

Já para Delmater e Hancock (2001, p.04) o desafio é bem maior: o objetivo definido é

o de extrair conhecimento de alto nível, a partir de dados de alto nível, o que é bem

mais complexo (H�J� extrair conhecimento de um GDWDZDUHKRXVH).

O que deixa a MD eficaz é a aliança entre o que o ser humano faz de melhor

(avaliar/inferir as informações descobertas pela MD) e o que o computador faz de

melhor (procurar relações entre os dados existentes em uma base de dados)

(DELMATER; HANCOCK, 2001, p.09).

Page 35: Dissertação Giovanni - Revisões Feitas

22

Na visão de Delmater e Hancock (2001, p.07), a análise da MD desenvolve

modelos de dois tipos: �D� modelos para previsão (predição), que envolvem a

utilização de uma parte ou de todo o conjunto de variáveis existentes, para prever

valores desconhecidos ou futuros, de variáveis de interesse (H�J� desastres naturais,

índices de degradação ambiental, índice de reprodução de vetores, surtos); �E� modelos

para descrição, que busquem padrões em um sistema de forma a torná-los

interpretáveis.

Autores como Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), Medeiros

Oliveira (2005, pp.13-14) e Turban e Rainer e Potter (2004, p.159) dizem que a

mineração de dados possui várias técnicas (tarefas), dentre elas a classificação, a

regressão, a clusterização e a sumarização.

As tarefas de classificação e a regressão são preditivas, já a clusterização e

sumarização são descritivas. As descritivas se concentram em encontrar padrões que

descrevam os dados de forma interpretável pelos seres humanos. As preditivas

realizam inferências nos dados, para construir modelos que serão usados nas predições

do comportamento de novos dados. Nesta dissertação serão abordadas apenas as

técnicas preditivas.

No Quadro 1, para cada técnica relatada nas obras de Fayyad e Piatetsky-Shapiro

e Smyth (1996) e Turban e Rainer e Potter (2004, p.159), foi especificado o tipo de

modelo relatado por Delmater e Hancock (2001).

4XDGUR�����4XDGUR�GH�WpFQLFDV�GH�0'�GHVHQYROYLGR�D�SDUWLU�GRV�DXWRUHV�)D\\DG�H�3LDWHWVN\�6KDSLUR�H�6P\WK���������7XUEDQ�H�5DLQHU�H�3RWWHU��������S������H�'HOPDWHU�H�+DQFRFN��������

Técnica Descrição dos modelos Tipo

Classificação Pressupõe características definidoras de um grupo específico (como clientes que foram perdidos para concorrentes)

Preditiva

Regressão Prediz um valor numérico com base no comportamento histórico dos dados

Preditiva

Clusterização Possibilita gerar agrupamentos a partir de semelhanças encontradas nos dados.

Descritiva

Associação Procura descobrir se existe algum padrão de relacionamento entre itens existentes nos dados (como o conteúdo de um carrinho de compras)

Descritiva

Page 36: Dissertação Giovanni - Revisões Feitas

23

2.5.1 7pFQLFDV�SUHGLWLYDV�GD�0'

A classificação e a regressão são formas de análise de dados, que podem ser

usadas para extrair dois tipos de modelos: �D� os que descrevem classes de dados

importantes; �E� os que atuam na predição de tendência de dados futuros (HAN;

KAMBER, 2001, p.279; PRADO, 1998, p.39; OLIVEIRA; ALVARENGA, 2003,

p.03).

A predição visa estabelecer o valor de um ou mais atributos, em um banco de dados,

a partir de outros atributos presentes [...] A abordagem preditiva não implica,

necessariamente, na previsão de um valor futuro - ‘a característica importante é que

ela faz uma adivinhação educada sobre o valor de um ou mais atributos

desconhecidos, dados os valores de outros atributos conhecidos’ [JOH97] (PRADO,

1998, p.39).

Faz-se, então, necessária, a distinção entre as técnicas preditivas de classificação

e regressão. Na classificação, cada registro (tupla) pertence a uma classe, entre um

conjunto pré-definido de classes. A classe de uma tupla é indicada por um valor

especificado pelo usuário, em um atributo objetivo. As tuplas consistem de atributos

preditivos e um atributo objetivo, este último indicando a que classe esta tupla

pertence (HAN; KAMBER, 2001, p.280). O atributo objetivo é do tipo categórico ou

discreto (i.e. pode tomar apenas um valor dentro de um conjunto de valores discretos)

(H�J� {SIM, NÃO}; {01...10}; {POSITIVO, NEGATIVO, ZONACINZA}),

determinando classes ou categorias.

O princípio da tarefa de classificação é descobrir algum tipo de relacionamento

entre os atributos preditivos e o atributo objetivo, de modo a desvendar um

conhecimento que possa ser utilizado, para prever a classe de uma tupla desconhecida

(OLIVEIRA; ALVARENGA, 2003, p.03).

A regressão, por sua vez, é muito similar à classificação. A regressão é uma

função de aprendizado que mapeia dados ou conjunto de dados de entrada, em uma

saída real numérica. Nessa função, o atributo objetivo é contínuo, isto é, pode tomar

qualquer valor real. O objetivo do algoritmo de regressão é encontrar algum

relacionamento entre os atributos preditivos e o atributo objetivo, de modo a predizer

valores para o atributo objetivo. São exemplos típicos, as predições financeiras e

comerciais.

Page 37: Dissertação Giovanni - Revisões Feitas

24

Suponha que, em uma cidade, tenham ocorrido várias endemias ou epidemias de

uma doença ou conjunto de doenças. Essas ocorrências, provavelmente foram

registradas pela Secretaria Municipal de Saúde dessa cidade. Seria interessante utilizar

esses dados, para prever a ocorrência de surtos de uma doença e, assim, possibilitar as

autoridades competentes a planejar melhor seus limitados recursos

(humanos/financeiros), desencadeando ações de vacinação ou combate ao vetor dessa

doença, de forma a melhorar o atendimento aos pacientes e, até mesmo, amenizar o

número de casos confirmados.

No caso de doenças com influência sazonal, a partir dos dados climáticos e

epidemiológicos registrados, um algoritmo de regressão pode descobrir regras que

possam prever o número de casos confirmados, em uma cidade. No caso da regressão,

a informação do surto ocorrido (i.e. número de confirmados) é totalizada em um

atributo (neste caso, o atributo objetivo). Uma vez que se tenha o atributo objetivo

determinado, prepara-se o subconjunto de atributos preditivos, dentre aqueles

existentes na base de dados. Claramente alguns atributos, tais como nome do paciente,

raça, cor dos olhos, estatura, peso, dentre outros, são, de modo geral, irrelevantes para

previsão do surto e, portanto, devem ser desconsiderados.

No caso da predição, para se medir o quão bom é o padrão encontrado (a

chamada acurácia do modelo), basta verificar o número de acertos, em um total de

casos testados (PRADO, 1998, p.39).

São esperadas duas reações distintas às predições: �D� Preparar-se para as

conseqüências das mudanças ocorridas. Por exemplo, no caso de predição de um

número alto de pacientes infectados por uma doença (H�J� dengue), o gestor pode

designar seus limitados recursos humanos/financeiros para o tratamento desses

pacientes, em hospitais; �E� tomar medidas para reverter ou modificar as predições,

reduzindo as incertezas com a produção de informações, evitando, assim, surpresas

com a precipitação dos eventos. Se o cenário previsto é o de um surto, o gestor pode

decidir tentar amenizá-lo, determinando que sejam incrementadas, ou iniciadas,

campanhas de combate ao vetor. (CUMMINGS HW� DO�, 2004, p.345; HANKE;

REITSCH 1995 DSXG PASSARI, 2003, p.08).

MD pode ser considerada uma abordagem eficaz, se comparada às técnicas

Page 38: Dissertação Giovanni - Revisões Feitas

25

tradicionais, já que lida com grande quantidade de volume de dados e consegue gerar

padrões para fenômenos complexos, que necessitam de muitos parâmetros. Por

exemplo, a estatística, de modo geral, é orientada para a verificação e validação das

hipóteses cognitivas e a maioria de suas técnicas requer o desenvolvimento de uma

hipótese prévia. Já a MD busca padrões, nas bases de dados, que possam ser utilizados

para algum fim. A grande vantagem da MD, em relação às técnicas estatísticas, é a

possibilidade de explicitar informações, apenas do domínio de especialistas,

escondidas nas bases, através da documentação gerada durante sua realização. Essas

informações podem levantar hipóteses que não haviam sido descobertas, até aquele

momento (PASSARI, 2003, pp 58-60).

������ 3UREOHPDV��GHVDILRV��YDQWDJHQV��iUHDV�GH�DSOLFDomR�H�WpFQLFDV�GD�0'� Em relação aos problemas referentes à MD, os mais comuns são: �D�

representação do conhecimento extraído; �E� complexidade da pesquisa; �F� seleção do

método e técnica mais apropriada da mineração para a pesquisa (FAYYAD;

SHAPIRO-PIATETSKY; SMYTH, 1996).

Além desses problemas, existem alguns desafios a serem vencidos, dentre eles:

�D� o volume da base de dados: as bases, normalmente, possuem centenas de tabelas,

com centenas de campos e talvez milhares de registros, o que pode resultar em uma

variedade enorme de padrões, combinações e hipóteses; �E� dados inconsistentes: além

de atributos com valores nulos, outros, importantes, podem estar ausentes das bases de

dados, pois, na sua concepção, não foram projetadas para DCBD; �F� ruídos nas bases

de dados: é um problema muito comum e grave, indicando que atributos importantes

podem estar perdidos, com valores errados ou colocados em locais incorretos, na base

de dados; �G��interação com o usuário: o profissional ou técnico de MD, deve procurar

conhecimentos, a partir de hipóteses levantadas por seus clientes, que possam ser

utilizados para explicar algum processo, na corporação, ou predizer ocorrências

futuras; �H� representação da informação: se o conhecimento descoberto não for de

fácil acesso e claramente compreendido pelo cliente, pode causar interpretações

errôneas ou ambíguas (FAYYAD; SHAPIRO-PIATETSKY; SMYTH 1996b).

Aproximadamente oitenta por cento dos problemas em MD referem-se às etapas

de preparação dos dados (pré-processamento), enquanto os outros vinte por cento são

Page 39: Dissertação Giovanni - Revisões Feitas

26

referentes à etapa de mineração de dados, em si (ADRIAANS; ZANTINGE, 1996).

A extração física de dados oriundos de diversas fontes é uma tarefa

extremamente árida e tediosa, pois pode trazer surpresas desagradáveis, tais como: �D��ocorrência de exceções (H�J� linhas de total no meio do arquivo); �E� apresentação de

arquivos em formatos diferentes, o que exige sua reconstrução em formato desejado

(H�J� $FUREDW� 5HDGHU�� 0LFURVRIW� ([FHO�� 0LFURVRIW� :RUG); �F� falta de padrão na

codificação: instituições diferentes mantêm as mesmas informações, em cadastros

diferentes e independentes (H�J� a carteira de identidade, cartão de crédito, carteira de

motorista) (PRADO, 1998, p.25).

É importante levar em consideração que: �D� é altamente improvável a existência

de uma grande base de dados, sem a presença de algum tipo de ruído, erros ou

inconsistência de dados; �E� mesmo que se tenha a sensação de que todas as

dificuldades de extração foram superadas, a inclusão de versão atual de um arquivo,

pode trazer erros tão grandes, que não há outra opção, a não ser recomeçar o

processamento dos dados.

As técnicas e características de processamento mais comuns são (HAN;

KAMBER, 2001, pp.105-142; PRADO, 1998, pp.28-29): �D� limpeza: preencher,

corrigir ou eliminar dados sem informação; �E� integração: combinar vários dados,

oriundos de várias bases, em um repositório final; �F� transformação de dados: alterar

dados (consolidar) para o formato desejado; �G� redução dos dados: representar, de

forma reduzida, o volume dos dados, sem perder a consistência ou a integridade.

Em relação às aplicações, a MD pode ser utilizada para: �D� segmentação de

mercados: agrupando clientes pela suas características comuns; �E� detecção de fraude:

identifica transações suspeitas que tenham probabilidade de serem fraudadas; �F��PDUNHWLQJ direto: identifica pessoas, com determinado perfil de consumo, para envio

de um tipo específico de catálogo de produtos (H�J� armas, pescaria, roupas, viagens);

�G� análise de tendências: revela diferenças entre o comportamento de um determinado

cliente, em um período de tempo; �H� óleo e gás: analisa dados sísmicos, em busca de

depósitos subterrâneos, que possam ser perfurados com mais facilidade; �I� varejo:

distingue padrões de compras.

Page 40: Dissertação Giovanni - Revisões Feitas

27

A MD pode ser utilizada também para predição, nas seguintes áreas: �D� PDUNHWLQJ: busca os melhores clientes, para maximizar as vendas; �E� detecção de

fraude em cartões de crédito; �F� desistência (perda) de clientes: prevê quais os

prováveis clientes a saírem de empresa; �G� seguro e sistemas de saúde: antecipa quais

clientes potenciais para novas apólices; �H� medicina: prevê e indica as terapias

adequadas a cada doença, e a eficácia das drogas (TURBAN; RAINER; POTTER,

2004, p.161).

Além das vantagens e desvantagens já mencionadas, acrescentam-se:

a) A MD não necessita do processamento de todo o banco de dados, para a

geração de regras. Basta que sejam analisadas faixas de dados distintas e desejadas,

dessa base. Através dessa análise, as regras e suas faixas de confiança são geradas

e adicionadas ou, ainda, alteradas, em uma base de regras (também conhecida

como base de conhecimento). Através do acréscimo de novos registros na base de

dados, a base de regras é atualizada com as regras geradas.

A busca de padrões de um local ou região específica pode ser feita e analisada,

através da mudança dos valores existentes, em uma faixa de dados, extraídos de uma

base de dados, conforme pode ser visto na Figura 1.

)LJXUD�����3URFHVVR�GH�FRQVWUXomR�GH�XPD�EDVH�GH�UHJUDV�GH�XPD�UHJLmR�DGDSWDGD�GH�$JUDZDO�H�3VDLOD��������SS������FRP�DOWHUDo}HV��

b) A Mineração de Dados possibilita, além de velocidade na solução de

problemas, o preenchimento de informações, que podem ser a chave para decisões,

em negócios importantes (ELDER, 2004, p.04).

c) Falha no registro dos dados eletrônicos: por algum motivo, os dados

Page 41: Dissertação Giovanni - Revisões Feitas

28

não estão representados no universo necessário e, portanto, a informação obtida

pode não ser confiável. Deve haver a preocupação com a completa representação e

disponibilidade das informações, para quem precise delas (DRUCKER, 2001 in

+DUYDUG�%XVLQHVV�5HYLHZ�(HBR) p.18);

d) Os executivos e profissionais especialistas, a partir dos dados que

possuem, precisam expressar corretamente a informação desejam alcançar. Assim,

os responsáveis por gerá-la, não sobrecarregam o processo de transformação de

dados em informação e conseguem fornecer o suporte a decisão (DRUCKER, 2001

LQ HBR, p.19);

e) Reunir, examinar e confirmar as informações extraídas, a partir de

dados válidos, fornece uma análise sofisticada e possibilita conclusões que

resistem a questionamentos críticos (ARGYRIS, 2001 LQ HBR, p.99,100);

f) Os custos associados com a coleção, processamento e armazenamento

de tais tipos de recursos (informações), podem ser altos o que desencoraja o

investimento na geração desta informação (DELMATER; HANCOCK, 2001,

p.05);

g) Os pesquisadores, ou gerentes supõem que, o melhor modelo e as

melhores respostas para um problema, foram encontrados, podendo decidir pelo

encerramento da pesquisa o que pode impedir que um modelo mais preciso seja

encontrado (ELDER, 2004, p.22).

Pode ser realizada, através de vários modelos e ferramentas específicas, como:

�D� &URVV�,QGXVWULDO� 6WDQGDUG� 3URFHVV� IRU� 'DWD� 0LQLQJ� �CRISP-DM��� D� HVFROKLGD�SDUD� HVWD� SHVTXLVD�� �E�� 6DPSOH�� ([SORUH�� 0RGLI\�� 0RGHO�� $VVHVV� �6(00$�� �F��&RPPRQ�$SURDFKHV��'(/0$7(5��+$1&2&.��������S�������.

Existem diversas ferramentas profissionais de mineração de dados, dentre elas,

&OHPHQWLQH da SPSS4; (QWHUSULVH�0LQHU da SAS5; (DV\QQ�3OXV�; ,QWHOOLJHQW�0LQHU da

IBM 7; 6�3OXV e ,QVLJKWIXO�0LQHU 2 da ,QVLJKWIXO�&RUSRUDWLRQ8; 6HH��&�����&XELVW e

4 www.spss.com5 www.sasinstitute.com6 www.easynn.com/easynnplus.html7 www.ibm.com

Page 42: Dissertação Giovanni - Revisões Feitas

29

0DJQXP�2SXV da RuleQuest59 e o R10. Academicamente, existem, também, alguns

casos de soluções para 0', dentre eles, o :(.$11 H R�$5$5$��.

���� &5,63�'0�SDUD�PLQHUDomR�GRV�GDGRV�A metodologia CRISP-DM (DELMATER; HANCOCK, 2001, p.61;

CHAPMAN HW� DO�, 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA;

ALVARENGA, 2003, p.02) foi concebida em 1996, como um guia passo a passo, para

a MD, e propõe um modelo gratuito de processo padrão, para mineração de dados

(SPSS, 2000).

Sua origem deve-se ao consórcio formado por quatro empresas de consultoria: 1&5�6\VWHPV� (QJLQHHULQJ� &RSHQKDJHQ�� 'DLPOHU&KU\VOHU� $*�� 6366� ,QF. e 2+5$

Verzekeringen en Bank Groep (SPSS, 2000 p.2). A CRISP-DM tem como vantagem, não

depender da área de negócio e da tecnologia a ser utilizada na MD, além da fácil

aplicação rapidez, custos mais baixos, viabilidade e facilidade da gestão dos projetos de

alta ou baixa envergadura de MD.

Na descrição dos quatro níveis da CRISP-DM, visto na Figura 2, é utilizado um

modelo de processo hierárquico, composto por um conjunto de tarefas, descritas em

níveis de abstração (SPSS, 2000, p.09):

a) Fases: neste nível, dividido em seis fases principais, estão as tarefas genéricas e os

relacionamentos entre essas tarefas;

b) Tarefas genéricas: neste nível, são apresentadas de forma geral, para cobrir todas

as situações possíveis da MD, mesmo aquelas não previstas (H�J� novas técnicas de

modelagem);

c) Tarefas especializadas: neste nível, estão as descrições de como as ações do nível

genérico, devem ser executadas, em certas situações específicas (H�J� limpeza dos

dados);

8 www.insightful.com9 www.rulequest.com10 www.r-project.org11 www.cs.waikato.ac.nz/~ml/weka/12 www.ucb.br/prg/professores/rogerio/arara/arara.html

Page 43: Dissertação Giovanni - Revisões Feitas

30

d) Instância de Processos: neste nível, registram-se as ações, decisões e resultados de

um projeto de MD.

)LJXUD�����5HSUHVHQWDomR�GRV�TXDWUR�QtYHLV�GD�PHWRGRORJLD�&5,63�'0��6366��������S�����WUDGXomR�QRVVD��O primeiro nível (fases), representado na Figura 3, tem as seguintes divisões e

objetivos: ��� Compreensão do Negócio (%XVLQHVV�8QGHUVWDQGLQJ): entender os objetivos

do projeto e seus requisitos, sob o ponto de vista do negócio, para serem convertidos na

definição de um problema de MD; quando se adquire a compreensão dos objetivos e

requisitos do projeto, deve-se definir um plano preliminar, para atingir estes objetivos; ��� Compreensão dos Dados ('DWD�8QGHUVWDQGLQJ): recolher os dados e familiarizar-se com

eles, para: a identificação de possíveis problemas, provocados pela qualidade desses

dados; o descobrimento de perspectivas iniciais, dentro dos dados; a detecção de

subconjuntos interessantes, que permitam formular hipóteses sobre informações

(escondidas), que não estão disponíveis aos gestores; ��� Preparação dos Dados ('DWD�3UHSDUDWLRQ�: construção dos conjuntos de dados� (GDWD� VHWV), para a construção de

modelos, a partir dos dados originais; ��� Modelagem (0RGHOLQJ): seleção, aplicação de

várias técnicas de modelagem de dados e otimização de parâmetros; existem diversas

técnicas que podem ser aplicadas, no mesmo problema de MD, algumas delas com

requisitos específicos, em relação à forma dos dados - é freqüente ter que se voltar à fase

anterior; ��� Avaliação ((YDOXDWLRQ): do ponto de vista da análise dos dados, os modelos,

construídos nesta fase, podem aparentar elevada qualidade; antes de prosseguir para a

fase seguinte, a de operacionalização, é importante rever os passos dados, na construção

do modelo, para garantir que se atinja os objetivos chave (um deles é determinar se existe

alguma questão importante, não considerada); ��� Operacionalização ('HSOR\PHQW)utilização dos modelos criados em ambiente operacional.

Page 44: Dissertação Giovanni - Revisões Feitas

31

)LJXUD�����5HSUHVHQWDomR�GR�QtYHO�)DVHV�GD�&5,63�'0��6366��������S�����WUDGXomR�QRVVD� ���� 5HGHV�QHXUDLV�DUWLILFLDLV�

“A gestão eficiente de qualquer corporação, seja ela do setor público ou privado,

industrial ou varejista, requer planejamento. Para um planejamento efetivo é necessário

que se tenha uma expectativa precisa das condições futuras em que a corporação irá

operar, e de como se relacionam os elementos condicionantes desta expectativa”

(PASSARI, 2003, p.08).

2.7.1 ,QWURGXomR

O cérebro humano possui, como células fundamentais, aproximadamente 1011

neurônios. Cada neurônio é dividido em três seções distintas, conforme representado na

Figura 4: �D� corpo da célula; �E� dendritos; �F��axônio. Cada seção possui funções

específicas, porém complementares (BRAGA; LUDERMIR; CARVALHO, 2000, pp.4-5;

HAYKIN, 2001, pp.32-34).

)LJXUD�����&RPSRQHQWHV�GR�QHXU{QLR�ELROyJLFR��%5$*$��/8'(50,5��&$59$/+2��������S�����

Page 45: Dissertação Giovanni - Revisões Feitas

32

Os dendritos têm por função, receber as informações (impulsos nervosos) de outros

neurônios e conduzi-las até o corpo celular (soma). A informação é processada neste local

e novos impulsos são gerados. Esses impulsos são transmitidos a outros neurônios,

passando através do axônio, até os dendritos dos neurônios seguintes. O ponto de contato

entre a terminação de um neurônio e o dendrito de outro, é chamado de sinapse. Entre a

sinapse e o dendrito de vários outros neurônios, existe o espaço sináptico (AZEVEDO;

BRASIL; OLIVEIRA, 2000, p.03; BRAGA; LUDERMIR; CARVALHO, 2000, p.06;

HAYKIN, 2001, pp.32-34).

As $UWLILFLDO� 1HXUDO� 1HWZRUNV ou Redes Neurais Artificiais (RNAs) surgiram a

partir do modelo de neurônios artificiais (SHUFHSWURQ), proposto por 0F&XOORFK e 3LWWV (1943 DSXG BRAGA; LUDERMIR; CARVALHO, 2000, p.06; AZEVEDO; BRASIL;

OLIVEIRA, 2000, p.06; TURBAN; RAINER; POTTER, 2004, p.417). É uma

simplificação do que se sabia, até então, sobre neurônio biológico. A composição

(descrição) matemática de um neurônio artificial resultou em um modelo com Q terminais

de entrada [�� [�� ������[Q (que simulam o papel dos dendritos) e, apenas, um terminal de

saída \ (simulando o papel do axônio). Para simular o comportamento das sinapses, os

terminais de entrada possuir pesos acoplados Z�� Z�� �����ZQ, que podem possuir valores

negativos ou positivos, dependendo das sinapses correspondentes, inibitórias ou

excitatórias (HAYKIN, 2001, pp.36-38). “O efeito de uma sinapse particular L no

neurônio pós-sináptico é dado por xiwi” (BRAGA; LUDERMIR; CARVALHO, 2000,

p.08).

)LJXUD�����&RPSRQHQWHV�GR�QHXU{QLR�GH�0F&XOORFK�H�3LWWV��%5$*$��/8'(50,5��&$59$/+2��������S�����

Em suma, nos neurônios artificiais, as conexões emulam os dendritos, pesos imitam

as sinapses, uma função de mapeamento emula o corpo celular e uma saída imita o

Page 46: Dissertação Giovanni - Revisões Feitas

33

axônio (BRAGA; LUDERMIR; CARVALHO, 2000, pp.7-8; HAYKIN, 2001, pp.36-37),

conforme pode ser visto na Figura 5. Os neurônios de uma RNA recebem informações de

fontes externas ou de outros neurônios e as transformam, através de pesos, em uma saída.

Esta saída é transmitida para outros neurônios ou para saídas externas (TURBAN;

RAINER; POTTER, 2004, p.418).

De forma genérica, é correto afirmar que as funções básicas de cada neurônio,

presentes em uma rede, seguem a seguinte cronologia: ��� avaliam os valores de entrada;

��� calculam o total dos valores de entrada combinados; ��� comparam o total com um

valor limiar e determinam o valor que será a saída.

������ &DUDFWHUtVWLFDV�H�DUTXLWHWXUDV�GDV�51$V�Soluções computacionais clássicas são implementadas, de forma explícita, em um

sistema, através de regras ou equações. Estas soluções fornecem a garantia de saída

computacional, em problemas para os quais foram desenvolvidas, e possuem limitações

(H�J� não podem generalizar soluções; não são tolerantes a erros e ruídos) (SWINGLER,

1996, p.08).

As RNAs, por outro lado, são sistemas de processamento de informações

distribuídos, compostas por elementos computacionais simples (i.e. neurônios artificiais)

e, por serem inspiradas no cérebro humano, apresentam: �D� a capacidade de aprender ou

descobrir padrões complexos de informações e soluções em problemas, para os quais as

regras ou equações não são facilmente visíveis ou de difícil implementação.Em outras

palavras, as RNAS fornecem boas soluções para problemas, cujo domínio e precisão

formal não são possíveis (por falta de profissionais ou de conhecimento adequado) ou não

são viáveis (seja pelo custo financeiro ou pela necessidade de resposta em baixo tempo),

em soluções computacionais tradicionais; �E� a capacidade de generalizar um problema,

através de um conjunto de dados de treinamento, que não forneça regras explícitas

(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BAETS; VENGOPAL, 1994 DSXG

PASSARI, 2003, p.72; BRAGA; LUDERMIR; CARVALHO 2000, pp.15-27; HAYKIN,

2001, p.28; OLIVEIRA; ALVARENGA, 2003, p.03; SWINGLER, 1996, p.03,08).

Em uma RNA, cada elemento computacional não linear, é chamado de nó ou nodo

e é densamente interconectado, através de conexões diretas. Cada nó recebe um ou mais

Page 47: Dissertação Giovanni - Revisões Feitas

34

valores de entrada, que são combinados em um único valor. Com o uso de diferentes

pesos para cada entrada, através de uma função de ativação, gera-se uma saída. Deve-se

ressaltar que o número de elementos que compõem a entrada de uma RNA, não é,

necessariamente, o número de elementos que compõem a saída da mesma RNA

(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BRAGA; LUDERMIR;

CARVALHO 2000, pp.10-13; SWINGLER, 1996, p.03).

Definir a arquitetura de uma RNA é uma decisão importante, uma vez que ela

restringe o tipo de problema a ser tratado pela rede. As principais arquiteturas de redes

são: �D� As que possuem uma camada única, representada pela Figura 6(a): um nó entre

qualquer entrada e qualquer saída; tendem a resolver problemas linearmente separáveis

(i.e. que podem ser separados por uma reta, em um espaço geométrico, no qual os pontos

obedecem a uma equação linear de coordenadas cartesianas); �E� As que possuem

múltiplas camadas, representada pela Figura 6(b): com mais de um neurônio entre alguma

entrada e alguma saída da rede e tendem a resolver problemas não linearmente separáveis

(i.e. possuem o potencial de resolverem problemas complexos) (AZEVEDO; BRASIL;

OLIVEIRA, 2000, pp. 71-72,81-90; BRAGA; LUDERMIR; CARVALHO 2000, p. 11-

12,49, HAYKIN, 2001, pp. 46-47,47-48); �F� As recorrentes, representadas pela Figura

6(c), com a seguinte característica de possuir laços de realimentação (i.e. possuem uma

camada de neurônios que, com seu sinal de saída, alimenta as entradas de todos os outros

neurônios). (HAYKIN, 2001, pp.48-49).

A tecnologia das RNAs, talvez seja a que mais apresenta o profundo poder da MD,

pois elas tentam construir representações internas de modelos ou padrões encontrados

nos dados. A visão do processo das RNAs do tipo MLP a descoberta pode ser feita em

duas fases: na primeira, a seleção dos parâmetros de treinamento do algoritmo, na

segunda, os resultados finais obtidos pela RNA são vistos como uma “caixa preta” (ou

seja, são inexplicáveis) (PASSARI, 2003, p.32; SWINGLER, 1996, p.08); aqui se faz

necessário um apêndice sobre o funcionamento de uma “caixa preta” em uma RNA:

“O funcionamento da RNA se torna uma metáfora de um ato reflexo que, depois de

aprendido, se repete inconscientemente. E este aspecto, que é uma das forças do

paradigma, pois pode ser largamente empregado, constitui, também, em um dos seus

pontos fracos, pois, tal como um ato reflexo, é difícil de explicar o porquê do ato”

(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.18)

Page 48: Dissertação Giovanni - Revisões Feitas

35

As RNAs são úteis em diversas aplicações do mundo real, pois lidam com dados

complexos e geralmente incompletos; as primeiras aplicações desenvolvidas nas RNAS

foram: �D� reconhecimento de voz e �E� reconhecimento de padrões visuais.

Atualmente são comuns aplicações como: �D� análise de escrita à mão (utilizados

em SDOPWRSV); �E� controle e automatização de equipamentos em grandes empresas (H�J� montadoras de carros); �F� avaliação de crédito (TURBAN; RAINER; POTTER, 2004,

p.39).

)LJXUD�����$UTXLWHWXUDV�GH�5HGHV�1HXUDLV�$UWLILFLDLV�±�UHWLUDGD�GH�+D\NLQ��������SS��������

Page 49: Dissertação Giovanni - Revisões Feitas

36

Diversas áreas empresariais, já utilizam aplicações baseadas em RNAs, dentre as

quais cita-se (TURBAN; RAINER; POTTER, 2004, pp.418-419): �D� a MD� procurando

padrões em bancos de dados grandes e complexos; �E� fraudes fiscais, identificando e

procurando irregularidades; �F� serviços financeiros, identificando padrões de mercado;

�G� avaliação de empréstimo, analisando o cliente, de acordo com seu histórico naquela

instituição; �H� análise de novos produtos, fazendo a previsão de vendas daquele produto

em determinada região; �I� previsão do comportamento do consumidor na Internet, para

ajudar a planejar páginas que possam influenciar em escolha de compra; �J� detecção de

fraudes de cartões de crédito, também analisando padrões de compras.

2.7.3 5HGHV�0XOWL/D\HU�3HUFHSWURQ

As redes SHUFHSWURQ�PXOWL�FDPDGDV ou PXOWLOD\HU�SHUFHSWURQ (MLP) são redes que

possuem mais de uma camada, em sua construção, e apresentam a característica de

resolver problemas complexos São formadas por neurônios artificiais, ligados por

conexões sinápticas e divididas em: �D� camada de entrada, que recebe estímulos do meio

externo; �E� camada interna ou oculta (KLGGHQ), onde ocorre o processamento das

informações e �F� camada de saída, que se comunica com o exterior e apresenta os

resultados (BRAGA; LUDERMIR; CARVALHO 2000; OLIVEIRA JÚNIOR, 2003;

PASSARI, 2003).

A topologia da MLP refere-se ao número de camadas utilizadas. Uma rede MLP

deve ser composta por, pelo menos, três camadas: �D� camada de entrada, que consiste nas

variáveis de entrada do modelo e devem ser conhecidas; �E� camadas intermediárias ou

camadas ocultas, que tornam o modelo mais refinado e não linear, com a capacidade de

aprender padrões mais complexos; �F� camada de saída, que contém um ou mais nós,

representando os resultados finais do processamento (KUO; XUE, 1998 DSXG PASSARI,

2003, p.79).

“Ficou provado que tudo que uma rede pode aprender com Qcamadas

intermediárias pode ser aprendido por uma rede com uma única camada intermediária”

(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.23).

Existem diversos algoritmos de treinamento para RNAs (H�J� EDFN�SURSDJDWLRQ,

FRXQWHUSURSDJDWLRQ), o algoritmo de aprendizado mais conhecido e utilizado para

Page 50: Dissertação Giovanni - Revisões Feitas

37

treinamento dessas redes é o EDFN�SURSDJDWLRQ (AZEVEDO; BRASIL; OLIVEIRA,

2000, pp.107-109; RULHEMART; MCCLELLAND, 1986 DSXG BRAGA; LUDERMIR;

CARVALHO 2000, p.59; SWINGLER, 1996, p.10). É um algoritmo supervisionado, que

utiliza pares de entrada e saída desejada para ajustar os pesos da rede, por meio de um

mecanismo de correção de erros. Seu treinamento ocorre nas fases IRUZDUG e EDFNZDUG.

Cada fase percorre a rede em um sentido. A primeira fase (IRUZDUG) é utilizada para

definir a saída da rede, para um dado padrão de entrada. A segunda fase (EDFNZDUG)

“utiliza a saída desejada e a saída fornecida pela rede, para atualizar os pesos de suas

conexões”.(BRAGA; LUDERMIR; CARVALHO 2000, p.59). A Figura 7 foi baseada em

Braga e Ludermir e Carvalho (2000, p.59) e ilustra estas duas fases �D� em uma rede com

uma saída; �E� em uma rede com mais de uma saída.

)LJXUD�����)OX[R�GH�SURFHVVDPHQWR�GR�DOJRULWPR�EDFN�SURSDJDWLRQ�“Um dos problemas enfrentados no treinamento de redes MLP, diz respeito à

definição de seus parâmetros. A seleção dos parâmetros de treinamento do algoritmo

EDFN�SURSDJDWLRQ é um sucesso tão pouco compreendido, que é muitas vezes chamado de

‘magia negra’” (BRAGA; LUDERMIR; CARVALHO 2000, p.66). Outro dos problemas

enfrentados é a ocorrência de RYHUILWWLQJ (excesso de treinamento), pois a rede, em vez de

melhorar, piora a sua taxa de acertos (BRAGA; LUDERMIR; CARVALHO 2000, p.68).

A 7LPH�'HOD\�1HXUDO�1HWZRUN� também é conhecida como atraso de tempo, janela

de tempo ou janelamento. Esta técnica permite que, através de observações passadas,

possa-se realizar o treinamento de uma RNA e predizer ocorrências futuras (LANG;

HINTON, 1988 DSXG BRAGA; LUDERMIR; CARVALHO 2000, p.220, 227;

SWINGLER, 1996, p.43).

Page 51: Dissertação Giovanni - Revisões Feitas

38

Existem diversos exemplos bem sucedidos de aplicações de RNAs, na previsão de

séries temporais, com a técnica de janela de tempo. Eis alguns autores (e obras relatadas)

com esta técnica:

a) Braga e Ludermir e Carvalho (2000, p.227): volume de vendas (LANG; HILTON,

1988);

b) Alvarenga e Oliveira Junior e Carvalho (2003, p.14): ��� previsão de ações

(ROSIN, 1997); ��� previsão do IBOVESPA (MORAIS; PORTUGAL, 1999); ��� previsão da demanda de importações brasileiras (SILVA; PORTUGUAL;

CECHIN; 2001); ��� previsão da demanda de energia elétrica de concessionárias

brasileiras (SOTO, 1999); ��� previsão do preço de ovos (TÁPIA; ROISENBERG;

BARRETO, 2000); ��� previsão de venda de cerveja na Austrália (CALÔBA;

SALIBY, 2001);

c) Oliveira; Alvarenga (2003): predição do valor da ação BRTP4 da Brasil Telecom

Participações.

Os autores Braga e Ludermir e Carvalho (2000, p.228) exemplificam a predição do

volume de vendas de um determinado produto, em uma RNA com cinco neurônios de

entrada, sete neurônios na camada intermediária e um neurônio na camada de saída. A

RNA consegue prever, com certa margem de confiança, o volume de vendas, com uma

semana de antecedência. O exemplo dado por esses autores pode ser visto na Figura 8.

)LJXUD���3UHGLomR�GH�YROXPH�GH�YHQGDV�GXUDQWH�FLQFR�VHPDQDV�XWLOL]DQGR�51$�FRP�D��WpFQLFD�GH�MDQHODPHQWR��%5$*$��/8'(50,5��&$59$/+2��������S������

Alvarenga e Oliveira Junior e Carvalho (2003, pp.15-19) utilizaram o simulador

(VRIWZDUH) de redes neurais (DV\11�3OXV, para construção de um modelo para previsão

Page 52: Dissertação Giovanni - Revisões Feitas

39

em séries temporais, baseada em RNAs, para o Sistema de Pagamentos Brasileiro. O

modelo foi criado, através da construção de uma RNA, com a seguinte característica: �D� trinta neurônios na camada de entrada, �E� oito na camada intermediária e um na camada

de saída.

Nesse VRIWZDUH� foram aplicados a taxa de aprendizado com o valor 1,00,

momentum 0,60 e com os valores otimizados pelo aplicativo. Os valores previstos são

representados na Figura 9.

)LJXUD������3UHGLomR�UHDOL]DGD�SRU�$OYDUHQJD�H�2OLYHLUD�-XQLRU�H�&DUYDOKR��������S�����Os resultados obtidos por esses autores, demonstram a sazonalidade da série e

podem auxiliar a tomada de decisões, indicando, ao banco, o potencial de depósitos e

aplicações financeiras, oriundas do Sistema Brasileiro de Pagamentos.

Os autores Oliveira e Alvarenga (2003) relatam a construção de um modelo,

utilizado para predição do valor da ação BRTP4, no mercado de capitais. O modelo foi

criado, através da construção de uma RNA, com a seguinte característica: �D� trinta e oito

(38) neurônios na camada de entrada; �E� trinta e oito (38) neurônios na camada

intermediária; (c) dois (02) neurônios na camada de saída.

Foi utilizado o (DV\11�3OXV� com os parâmetros de taxa de aprendizado 0,6,

momentum 0,8 e erro alvo (desejado) 0,05. Os autores relatam que o treinamento foi

realizado com 1.102 amostras, das quais 15 foram escolhidas como amostras de teste. Os

resultados do aprendizado podem ser vistos na Figura 10.

Page 53: Dissertação Giovanni - Revisões Feitas

40

)LJXUD������*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�UHDOL]DGD�SRU�2OLYHLUD�H�$OYDUHQJD��������S�����O erro alcançado nesta predição foi de 0,049916, após 578 ciclos de aprendizado e

os resultados da predição podem ser vistos na Figura 11.

)LJXUD������*UiILFR�GD�SUHGLomR�UHDOL]DGD�SRU�2OLYHLUD�H�$OYDUHQJD�������S�����Em relação aos três artigos acima, todos os autores utilizaram RNAs com o

algoritmo EDFN�SURSDJDWLRQ e possuíam, no período a ser analisado, todo o universo de

variáveis, que seriam trabalhadas. O grande desafio à predição de Dengue, em Goiânia-

Go, com essa técnica e no período de doação, é o percentual estimado pela Divisão de

Epidemiologia da Secretaria Municipal de Saúde de Goiânia, de trinta e cinco a quarenta

por cento de notificações não realizadas. Esse desafio também é enfrentado pelos gestores

da atualidade, na análise dessas informações.

���� *HVWmR�GR�&RQKHFLPHQWR�VREUH�RV�HIHLWRV�GR�FOLPD�QD�VD~GH�KXPDQD�Existem diversas obras (GALE MOORE, 2000, OMS, 2003d, 2004b, 2000b, dentre

outras) que relatam as conseqüências da influência sazonal, em relação às doenças

Page 54: Dissertação Giovanni - Revisões Feitas

41

transmitidas por vetores. Nas publicações da OMS (2003d, 2004b), foram abordados os

efeitos das variações climáticas e as técnicas mais conhecidas e utilizadas para medir ou

predizer os seus efeitos sobre a saúde humana. Dentre os provocados pelo clima, estão os

surtos causados por vetores. As mudanças climáticas e seus efeitos (relações),

reconhecidos em diversas áreas, estão representados na Figura 12.

As relações reconhecidas entre o clima e a saúde, incluindo os impactos diretos e

indiretos sobre a humanidade, são diversos. Atingem, de maneira e forma diferentes, as

regiões, os continentes e os países, causando diversos efeitos na saúde da população, de

cada localidade. Entre efeitos na saúde, estão as doenças causadas por vetores e roedores,

que sofrem influência sazonal (OMS, 2003d).

)LJXUD������0XGDQoDV�FOLPiWLFDV�H�VHXV�HIHLWRV�QD�VD~GH�KXPDQD��206������G��S�����WUDGXomR�QRVVD��FRP�DOWHUDo}HV��

As técnicas relatadas nas publicações da OMS (2004b, 2003d), para a predição e

Page 55: Dissertação Giovanni - Revisões Feitas

42

detecção de epidemias, que sofrem influência sazonal, são os modelos preditivos e os

Sistemas de Aviso Prévio.

A Organização Mundial de Saúde, em publicações recentes (2000b, 2003d e

2004b), abordou o potencial dos modelos de predição e (DUO\�:DUQLQJ�6\VWHPV (EWS) ou

Sistemas de Aviso Prévio (SAP). São reconhecidos dois tipos de SAP: �D� os

desenvolvidos para epidemiologia; �E� os desenvolvidos para escassez de alimentos

(OMS, 2000b, 2003d). Através da revisão bibliográfica realizada, não foi possível

encontrar trabalhos científicos sobre SAP, aplicados à área de surtos causados por vetores

PRVTXLWR�$HGHV� em regiões urbanas no Brasil.

Os SAP surgiram, através da proposta de Gill (1923 DSXG OMS, 2004b, p.12), para

predizer o surto de doenças infecciosas (malária), baseado nas condições climáticas

(chuva). O modelo foi colocado em prática, na cidade de Punjab, na Índia, entre os anos

1921 e 1942.

Rogers (1923, 1925, 1926 DSXG OMS, 2004b, p.12) descreveu a associação entre

variáveis climáticas (temperatura, chuva, umidade e ventos) e a incidência de doenças

(pneumonia, varíola, lepra e tuberculose), na Índia e em outras localidades. O modelo

nunca foi implementado em larga escala.

Segundo a OMS (2004b, p.12), os estudos já realizados demonstram a utilidade dos

SAP para predizer padrões existentes e futuros de doenças, mesmo sem estabelecer a

relação da associação de fatores climáticos à incidência de doenças. O uso de SAP pode

ajudar a gestores na área de saúde, a desenvolverem planos e concentrarem recursos, onde

forem necessários (PATZ, 1996 DSXG OMS, 2000b, p.10).

Em seu texto, a OMS (2004b, p.12) aponta três fatores para o setor de saúde

explorar os SAP: �D� padronização do diagnóstico, o que possibilita a rápida notificação e

monitoramento de doenças; �E� rede de monitoramento de dados ambientais, a um custo

praticamente inexistente; �F� avanços nos modelos estatísticos e epidemiológicos.

Na sua obra, a OMS (2004b, p.37) relata a não existência e o desconhecimento na

existência de publicações relatando o uso de SAP, ou de modelos implementados, para

auxiliar o suporte a decisões epidemiológicas.

Page 56: Dissertação Giovanni - Revisões Feitas

43

A exceção a essa afirmação é o 6RXWKHUQ�$IULFD�0DODULD�&RQWURO (SAMC), que não

publicou suas obras (OMS, 2004b, p.37), pois “não havia coletado os dados apropriados

(H�J� saúde, clima, uso da terra), nos períodos necessários, das regiões afetadas, de forma

adequada” (OMS, 2003d, p.09, tradução nossa).

Na publicação da OMS (2004b, p.16) é dito que: �D� os SAP incorporam, em seu

funcionamento os modelos preditivos; �E� utilizam técnicas estatísticas que podem servir

para predizer a possibilidade de ocorrência de uma epidemia ou predizer o tamanho de

uma epidemia; �F� incluem consideração de condições operacionais de uso e respostas

(nível de acurácia).

Sua predição pode ser feita em semanas, meses ou até mesmo anos (OMS, 2004b,

pp.18-19). Seus principais objetivos são: �D� identificar se uma epidemia irá ocorrer em

uma população, de acordo com um número relatado de casos; �E� predizer o número de

casos, em um período de tempo (OMS, 2004b, p.19).

���� 2PRGHOR�GH�QRWLILFDomR�EUDVLOHLUR�No Brasil, em 1969, foi criado o Sistema de Notificação Semanal de Doenças,

através do qual, as Secretarias Estaduais de Saúde relatavam ao Ministério da Saúde, as

informações dos casos ocorridos naquela região. Em 1975, foi instituído pela lei 6.259,

do mesmo ano, e pelo decreto 78.231, de 1976, o Sistema Nacional de Vigilância

Epidemiológica, que incorporou o conjunto de doenças de maior relevância no país

(FUNASA, 2002, pp.10-11).

O Sistema Único de Saúde foi promulgado em 1990, através da lei 8.080, e através

dele, a descentralização das responsabilidades e funções do sistema de saúde, implicou no

redirecionamento das atividades de vigilância epidemiológica ao município (FUNASA,

2002, pp.10-11). A Portaria n.º 1.943, de 18 de outubro de 2001 do Ministério da Saúde,

aumentou para trinta e cinto, o número de doenças que são compulsórias e, por isto,

devem ser notificadas (FUNASA, 2002, pp.26-27).

Para cada doença, a coleta, notificação13 de casos e geração dos dados são

13 "Notificação é a comunicação da ocorrência de determinada doença ou agravo à saúde, feita à autoridade sanitária, por profissionais de saúde ou qualquer cidadão, para fins de adoção de medidas de intervenção pertinentes" (FUNASA, 2002, p. 15)

Page 57: Dissertação Giovanni - Revisões Feitas

44

especificadas no Sistema Nacional de Agravos de Notificação (SINAN). Os dados que

alimentam esse sistema são: �D� dados demográficos, socioeconômicos e ambientais; �E� dados de mortalidade; �F� notificação de surtos e epidemias (FUNASA, 2002).

Encontram-se disponíveis, formulários padronizados do SINAN, para a maioria das

doenças do Sistema de Vigilância Epidemiológica brasileiro, nas unidades de saúde de

atendimento do SUS. Em caso suspeito de alguma dessas doenças, a respectiva ficha é

preenchida e enviada à Secretaria Municipal de Saúde. A notificação é compulsória e

pode ser feita: �D� no local de atendimento; �E��de forma anônima; �F� pela imprensa. O

que facilita, após investigação epidemiológica14, e se necessário, o combate à doença

(FUNASA, 2002, pp.34-37).

������ 'LDJUDPDV�GH�FRQWUROH�O método indicado pela FUNASA (2002, p.48) e adotado em todo Brasil, para

verificação de uma epidemia, é transcrito a seguir:

Um dos métodos utilizados para verificação de ocorrência de uma epidemia é o

DIAGRAMA DE CONTROLE, que consiste na representação gráfica da distribuição da

média mensal e desvio padrão dos valores da freqüência (incidência ou casos) observada,

em um período de tempo (habitualmente 10 anos). A construção desse gráfico pode ser

gerada, procedendo-se da seguinte maneira:

* Verificar se a distribuição do número de casos/incidência da doença, registrado

mensalmente, durante os últimos anos (geralmente dez anos ou mais), apresenta grandes

variações;

* excluem-se os dados referentes a anos epidêmicos;

* calcula-se a média aritmética e os desvios-padrão (pode ser calculado no

programa Excel) de cada distribuição mensal das incidências registradas no período

selecionado;

14 "Investigação epidemiológica é um trabalho de campo, realizado a partir de casos notificados (clinicamente declarados ou suspeitos) e seus contatos, que tem como principais objetivos: identificar fonte e modo de transmissão: grupos expostos a maior risco; fatores determinantes; confirmar diagnóstico; e determinar as principais características epidemiológicas. O seu propósito final é orientar medidas de controle para impedir a ocorrência de novos casos" (FUNASA, 2002, 31).

Page 58: Dissertação Giovanni - Revisões Feitas

45

* os valores compreendidos entre aqueles correspondentes à média de cada mês,

acrescidos de 1,96 desvios-padrão e os de cada média mensal, subtraídos 1,96 desvios-

padrão (distribuição normal), correspondem ao nível endêmico da doença, ou seja, o

limite de variação esperada para cada mês;

* representa-se graficamente (diagrama curvilinear) a distribuição das médias e

desvios-padrão da incidência (diagrama de controle);

* quando os valores observados ultrapassam aqueles do limite máximo da variação

esperada, diz-se que está ocorrendo uma epidemia. Dessa maneira, quando uma doença

deixou de ocorrer em uma determinada área, o registro de um único caso pode estar

configurando uma epidemia ou surto.

Ao fim da transcrição, exibe-se um diagrama de controle de Dengue da cidade de

Goiânia-Go no ano 2001 (Figura 13).

)LJXUD����±�'LDJUDPD�GH�FRQWUROH�H�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�±�*R��������6,48(,5$�-81,25��������S�����

����� 'HQJXH�H�VHX�9HWRU�O $HGHV�DHJ\SWL� �6WHJRP\D��(Figura 14)�e o�$HGHV�DOERSLFWXV��6NXVH� (Figura 15)

são os vetores conhecidos de Dengue em todo mundo (OMS, 2004, 2003). No Brasil,

nenhuma publicação relata o $HGHV�DOERSLFWXV portando-as.

Page 59: Dissertação Giovanni - Revisões Feitas

46

)LJXUD�������$VSHFWR�GH�XP�$HGHV�DHJ\SWL��08167(50$11��������

)LJXUD�����$VSHFWR�GH�XP�$HGHV�DOERSLFWXV� �&58=��������Desconhece-se, através da revisão bibliográfica realizada, publicações nas

Américas, que relatem o $HGHV�DOERSLFWXV portando quaisquer arbovírus, embora Alves

Borges (2001, p.04) relate que “estudos laboratoriais demonstram a competência vetora

do$H�$OERSLFWXV� para transmitir dezoito arbovírus, incluídos em três famílias”.

O relato nesta dissertação será referente ao vetor urbano brasileiro de Dengue, o

$HGHV� DHJ\SWL. Segundo alguns autores (CUMMINGS HW� DO�, 2004, p.345; GALE

MOORE, 2000, p.08; PATZ HW� DO�, 1998, p.01; REBELO HW� DO�, 1999, p.478; OMS,

2004b, pp.24-26, OMS, 2000b, p.07), Dengue possui um vetor que segue séries sazonais

(depende de temperatura e umidade, normalmente com presença de chuva, para se

propagar). A imunidade contra o vírus de Dengue (Den-1, Den-2, Den-3, Den-4) que

contaminou o paciente, é permanente e, para os demais tipos, é de três meses a cinco

anos, na média (FUNASA, 2002, p.186).

Dengue constitui num dos mais importantes problemas de saúde pública, em vários

outros países, exigindo avanços na busca de soluções e obtenção de resultados

satisfatórios nos programas de controle de vetores (BRASSOLATTI; ANDRADE, 2002,

p.244).

Page 60: Dissertação Giovanni - Revisões Feitas

47

A prevenção a essas epidemias pode ser feita por meio do combate ao vetor na

forma de: ��� campanhas preventivas, aplicação de veneno nas ruas da cidade; ��� com a

utilização do Ultra Baixo Volume (UBV) (GUBLER, 1989 p.244 DSXG BRASSOLATTI;

ANDRADE, 2000; OMS, 1997, p.57); ��� predadores naturais (PINHEIRO; TADEI,

2002, p.1529; MARTENS HW�DO., 1995, p.04; OMS, 1997, p.59); ��� agentes biológicos

(POLANCZYK; GARCIA; ALVES, 2003, p.01; OMS, 1997, p.58); ��� a soltura

(liberação em locais de risco) de vetores transgênicos (não férteis) (O´BROCHTA, 2002,

pp.247-253).

O vetor pode transmitir o vírus de forma indireta (transmissão horizontal), nas

zonas urbanas e rurais. Na zona rural, a transmissão pode ocorrer do mosquito para

animais, e do mosquito para humanos. Na zona urbana, o vetor transmite as doenças de

um animal (ser humano) a outro (transmissão horizontal), através de um mosquito

infectado. O vetor pode também passar o vírus a sua prole, em sua primeira fase de vida

(transmissão vertical) (OMS, 2004, p.02; OMS, 1996, p.21). A transmissão indireta está

representada na Figura 16.

)LJXUD������7LSRV�GH�WUDQVPLVVmR�LQGLUHWD�UHFRQKHFLGD�SDUD�GHQJXH��206������G��S�����WUDGXomR�QRVVD��FRP�DOWHUDo}HV��

������� 'HQJXH�“A Dengue tem sido relatada nas Américas, há mais de 200 anos” [...] “há

referências de epidemias desde o século XIX” (FUNASA, 2002, p.207). Dengue é um

vírus (arbovirose) (UNICAMP, 2004, p.127) da família )ODYLYLULGDH� gênero )ODYLYLUXV (FUNASA 2002, p.203; HEINZ HW�DO� 2000 DSXG�CORTES, 2003, p.01). De acordo com

as publicações da FUNASA (2002, p.203) e da OMS (2003d, p.14, tradução nossa) “é a

mais importante arbovirose que afeta o ser humano”.

De forma geral, as epidemias desse vírus são identificadas, quando a incidência de

casos acumulados, já atingiu um contingente populacional expressivo, em determinada

área geográfica e, portanto, detectadas de forma tardia (OMS, 2000c, pp.75-88).

É uma doença endêmica em cem países, encontrada em regiões tropicais e

Page 61: Dissertação Giovanni - Revisões Feitas

48

subtropicais (Figura 17), predominantemente em regiões urbanas e semi-urbanas. A OMS

estima que ocorram cinqüenta milhões de casos suspeitos ao ano. A vacina contra dengue

vem sendo desenvolvida e ainda não foi testada para uso em larga escala (KHAN HW�DO�,2004, p.85; SRINIVASAN HW�DO. 2004, p.49; OMS, 2003, p.02).

São reconhecidos, no mundo, quatro tipos diferentes do vírus Dengue: Den-1, Den-

2, Den-3 e Den-4. Os tipos Den-1, Den-2 e Den-3 são circulantes em boa parte do Brasil

(SVS, 2005, p.02) (Figura 18). Alguns autores (ALVES BORGES, 2001, pp.18-22;

LOIOLA, 2000, pp.49-55; MSB, 2004, 2005) relatam que o Den-4 não está presente no

Brasil.

)LJXUD����±�3DtVHV�FRP�SUHVHQoD�GH�'HQJXH�HP�������206������F��S�����No entanto, a FUNASA (2002, p.207) registrou nos anos de 1981 e 1982,

epidemias comprovadas clínica e laboratorialmente, do Den-4 e Den-1, na cidade de Boa

Vista, em Roraima. Foram registrados, no mesmo período (1981-1982), casos do Den-4

na Venezuela, Equador e Peru (LOIOLA, 2000, pp.49-55). Na obra de )RXTXH e *DULQFL e *DERULW (2004, p.44), há relato da presença dos quatro sorotipos de Dengue na Guiana

Francesa, o que indica, pela proximidade geográfica, a possibilidade de um novo surto no

Brasil.

Os principais hospedeiros do vírus são os humanos. Alguns estudos sugerem que,

em algumas partes do mundo, os macacos podem ser infectados (OMS, 2003, p.02).

Page 62: Dissertação Giovanni - Revisões Feitas

49

)LJXUD������6RURWLSRV�FLUFXODQWHV�GR�YtUXV�GD�GHQJXH�SRU�HVWDGRV��%UDVLO��������696���������S�����Dengue, no organismo do vetor, demora de oito a dez dias para se desenvolver e

permanece ativo, até o fim da vida, sem prejudicá-lo (OMS, 2003, p.01). No organismo

humano, os sintomas aparecem, após três dias da picada do vetor contaminado e o vírus

permanece ativo, em média, de cinco a seis dias, período em que os sintomas aparecem

(OMS, 2003, p.02).

Já se registrou a incidência dos casos de Dengue, entre cinqüenta e setenta por cento

da população do Estado do Rio de Janeiro (CREMERJ, 2002 DSXG DENIS, 2003, p.645).

A OMS estima que a incidência possa atingir, entre oitenta e noventa por cento da

população (GUBLER; TRENT 1993 DSXG OMS, 2003, p.51).

Registra-se que um mesmo paciente pode ser infectado por mais de um vírus, ao

mesmo tempo (ROCCO; BARBOSA; KANOMATA, 1998, p.151). A imunidade

humana, quanto a qualquer dos tipos adquiridos de Dengue, é permanente e a infecção

seqüencial por outro tipo do vírus, pode causar a Febre Hemorrágica do Dengue (FHD)

(FUNASA, 2002, p.203, PONTES; RUFFINO NETTO, 1994, p.01; OMS, 2003, p.01).

Epidemias de FHD foram reconhecidas, na década de 1950, nas Filipinas e

Tailândia, afetando a maioria dos países asiáticos, onde se transformou em uma das

principais causas de hospitalização e óbito de crianças. Sem tratamento adequado, pode

causar a morte de um paciente infectado, entre doze e vinte quatro horas. Segundo

estatísticas da OMS, cerca de dois e meio por cento das pessoas com FDH vão a óbito

(OMS, 2003, p.01).

O mais importante vetor de Dengue, nas Américas e na Ásia, são as fêmeas do

$HGHV� DHJ\SWL� Nesses continentes, sua reprodução tem características urbanas. Já, na

Page 63: Dissertação Giovanni - Revisões Feitas

50

África, além das áreas urbanas, ocorre, também, em áreas silvestres. Em anos recentes, o

$HGHV�DOERSLFWXV� foi reconhecido (OMS, 1997, p.51) como vetor secundário, na Ásia, e

tornou-se presente em diversos países americanos, dentre eles o Brasil (OMS, 2003,

p.02).

Em diversas publicações (H�J� LIMA HW�DO��� 1999; SILVEIRA RODRIGUES HW�DO�� 2002; SOUSA HW� DO��� 2004; VASCONCELOS HW� DO., 1998), a estimativa dos casos

ocorridos supera a notificação dos órgãos responsáveis, o que dificulta muito o combate

da doença, pois a falta destas informações prejudica a ação e planejamento eficazes dos

gestores da área de saúde para o tratamento dos pacientes e combate ao vetor de Dengue.

Na publicação de NASCIMENTO SOUSA HW�DO� (2004), é relatado que, além dos

elementos (parâmetros) meteorológicos, outros fatores contribuem para a incidência de

Dengue, em uma cidade. Estes fatores podem ser exemplificados, através do modelo

epidemiológico 6XVFHSWLEOH�,QIHFWHG�,PXQH� (SIR), utilizado para estabelecer a dinâmica

da transmissão e com a introdução na população de novos subtipos virais circulantes.

No Brasil, a tipificação laboratorial do Den-1 foi feita em 1996. O Den-2 foi

tipificado em 1990 e finalmente o Den-3, em 2000 (SIQUEIRA JÚNIOR, 2005, p.49).

Todos os surtos do Den-4 detectados, foram controlados e não houve epidemia registrada

depois de 1982.

Publicações recentes (SIQUEIRA JUNIOR HW� DO�, 2004, 2005) relatam que a

ocorrência de Dengue nos anos 2001 e 2002, em toda a América Latina, está concentrada

na população adulta (30 a 49 anos de idade) e, no Brasil, concentrada na faixa etária de 20

a 40 anos de idade.

����� ,QTXpULWRV�VRUROyJLFRV�Inquéritos sorológicos são exames laboratoriais (LOIOLA, 2000, pp.37-43), cujas

amostras são recolhidas de pessoas residentes em locais escolhidos de forma aleatória,

dentro de um mesmo município, e proporcionam estimativa da dimensão de uma

epidemia (FUNASA, 2002, p.272).

Os inquéritos epidemiológicos realizados em populações brasileiras encontram,

mesmo atualmente, sérias dificuldades quanto ao processo de obtenção das amostras

de domicílios. O sorteio por conglomerados em vários estágios, em que o setor

Page 64: Dissertação Giovanni - Revisões Feitas

51

censitário é a unidade primária de amostragem, é o método probabilístico

usualmente adotado (Kish, 1965). Informações demográficas sobre os setores

censitários, sorteados no primeiro estágio, podem ser adquiridas na Fundação

Instituto Brasileiro de Geografia e Estatística (IBGE), que também produz cópias

dos mapas construídos para os censos demográficos, realizados a cada 10 anos

(NUNES SILVA; CUNHA; QUINTANILHA, 2003, p.494)

Os inquéritos são importantes para a precisão da avaliação do caso suspeito, por sua

alta eficácia de diagnóstico (CORTES HW� DO., 2003, p.331). Citam-se, em ordem

cronológica de publicação, alguns autores que realizaram inquéritos sorológicos relativos

ao dengue, e os resultados alcançados:

Venâncio da Cunha HW�DO� (1997, p.379) relatam que, em amostragem de crianças

em fase escolar, no ano de 1994, no Município de Paracambi, Estado do Rio de Janeiro, a

positividade do teste de Inibição da Hemaglutinação foi detectada em 39,2% (145/370)

dos casos escolares pesquisados. A freqüência de positividade foi de 53,8% (78/145) para

o sexo feminino, e de 46,2% (67/145) para o sexo masculino. A distribuição por faixa

etária mostrou positividade crescente com o aumento da idade.

Lima HW�DO� (1999, p.566) relatam que, mesmo com a notificação compulsória dos

casos de agravo (448 sendo 57 confirmados), os dados estatísticos, obtidos através de

pesquisa (com 1.113 amostras) realizada três (03) meses após o término da epidemia,

feita com a técnica MAC-ELISA para detecção dos anticorpos IgM Den-1 e Den-2,

apresentaram valores duas vezes superiores aos notificados, e quinze vezes superiores aos

casos laboratoriais relatados, o que indicaria que a epidemia foi muito superior à

inicialmente divulgada.

Vasconcelos HW� DO. (1998, p.447) relatam inquérito baseado em mil trezentas e

quarenta e uma amostras de soro, de nove distritos sanitários, testadas por inibição da

hemaglutinação, sendo classificadas como negativas e positivas, com quarenta e quatro

por cento ou quinhentas e oitenta e oito amostras positivas. Os autores relatam que não

houve diferença da prevalência quanto ao sexo, faixa etária e escolaridade, ao contrário

da condição sócio-econômica que apresentou diferenças estatisticamente significantes.

Silveira Rodrigues HW� DO� (2002, p.160), relatam�estudo realizado em instituto de

correção de menores (com 196 amostras), que indicou o possível nível de disseminação

Page 65: Dissertação Giovanni - Revisões Feitas

52

de Dengue, em uma cidade com grande densidade populacional, demonstrando um índice

de infecção muito superior ao oficial.

Cabe salientar, que o preço médio para um kit com 96 (noventa e seis) amostras

(testes individuais) de averiguação de Dengue, com a capacidade de diagnosticar se a

pessoa está com o vírus no momento, ou se já teve contato com o vírus (são kits

diferentes), foi avaliado em um mil e duzentos reais, em fevereiro de 2005.(preço por kit).

Para realizar um inquérito sorológico, com no mínimo mil amostras, seriam necessários

aproximadamente onze kits, o que totalizaria, aproximadamente, treze mil e duzentos

reais, apenas em material para testes laboratoriais.

����� (VWXGRV�UHODWDGRV�������� (VWXGR�DSUHVHQWDGR�QD�66%'0¶���

Esse estudo foi apresentado na ,QWHUQDWLRQDO� &RQIHUHQFH� RQ� 6FLHQWLILF� DQG�6WDWLVWLFDO� 'DWDEDVH� 0DQDJHPHQW� �66'%0¶����� Nele é relatada a arquitetura do

(SLGHPLRORJLFDO�DQG�6WDWLVWLFDO�'DWD�([SORUDWLRQ�6\VWHP (CARESS), baseada no projeto

&DQFHU�5HJLVWU\�/RZHU�6D[RQ\ (CARLOS), iniciado em 1993, na Alemanha. O projeto

CARLOS visou melhorar o acesso às informações, através da unificação de ferramentas

de pesquisa (WIETEK; KAMP, 1997, pp.01-02).

Sua arquitetura é formada pelas seguintes camadas: integração de dados,

questionamento, análise, apresentação visual (feita através de ferramentas) e exploração

interativa (KAMP; SITZMANN; WIETEK, 1997, p.01). O centro de toda a arquitetura

consiste na combinação de dados estatísticos e espaciais (mapas) (WIETEK; KAMP,

1997, p.06).

No CARESS, uma pessoa, através de complexas consultas ao banco de dados e de

operações estatísticas, gera as informações que deseja. Essas consultas podem ser

cíclicas, o que gera complexidade de interpretação e alto tempo de realização da pesquisa

(KAMP; SITZMANN; WIETEK 1997, p.02; WIETEK; KAMP, 1997, p.04).

Essas informações podem ser divididas em: �D� Categorias: região, intervalo de

tempo, propriedades de classificação (H�J� idade, sexo) e não classificativas (H�J� doenças); �E� Resumos: número (H�J� população, casos), medida comparativa (H�J�

Page 66: Dissertação Giovanni - Revisões Feitas

53

classificação), medida geral (H�J� nível de significância, testes estatísticos) ou

visualização (H�J� mapas, gráficos ou tabelas) (KAMP; SITZMANN; WIETEK, 1997,

p.01; WIETEK; KAMP, 1997, p.04).

No CARESS, os dados são mantidos em um 'DWDZKDUHKRXVH, agrupados em forma

de metadados e disponíveis para consulta. As consultas em forma de mapas, utilizando

Sistemas de Informações Geográficas, são feitas em duas dimensões (KAMP;

SITZMANN; WIETEK, 1997, p.04).

As estatísticas, obtidas através de agrupamentos dos casos, podem servir como

suporte à decisão, para o tratamento de pacientes (através da pesquisa de tratamentos

similares que foram bem sucedidos), ou na prevenção de novos casos (a partir das

condições ambientais em que as pessoas vivem) (WIETEK; KAMP, 1997).

�������0RGHOR�3DQ�(XURSHX�GH�6D~GH�O Modelo Pan-Europeu de Saúde propõe integrar vários sistemas legados

(programas antigos existentes) de saúde, a fim de utilizar informações de inúmeros

bancos de dados simultâneos. De acordo com a publicação, todos os bancos convergiriam

para a estrutura de um 'DWDZDUHKRXVH, no qual os gestores manejariam informações de

acordo com o perfil dos dados (públicos ou confidenciais) ou o tipo de seu

armazenamento. No modelo Pan-Europeu, foram identificadas três possibilidades de

perfil diferentes (KOVACS HW�DO., 2000, pp.01-07): �D� o perfil de acesso Completo, no

qual os dados privados do paciente são armazenados localmente; �E� o perfil de acesso de

dados Filtrados (parcialmente confidenciais), no qual os dados dos pacientes guardados

por região; �F� o perfil de acesso aos dados Filtrados (confidenciais), no qual os dados dos

pacientes armazenados em âmbito nacional ou internacional.

As desvantagens desse modelo para a criação da informação são: �D� alto tempo

necessário para pesquisa; �E� a alta especialização necessária para operação do

'DWDZDUHKRXVH; �F� subjetividade dos dados (KOVACS HW�DO�, 2000, p.04).

Os conjuntos (grupos) de dados (subjetivos) de sistemas de saúde locais podem ser

assim classificados: �D� Epidemiologia: dados classificados de acordo com a doença,

facilitando a análise geográfica e temporal de alguns pacientes, selecionados de acordo

com as relações entre eles; �E� Orçamento: custo da análise para melhor solução; �F�

Page 67: Dissertação Giovanni - Revisões Feitas

54

Recursos humanos: análise da SHUIRUPDQFH de condução, de médicos e outras pessoas;

�G� Recursos materiais: estudos comparativos de instrumentos e infra-estrutura

(utilização, eficiência e custo); �H� Sociologia: estudos podem indicar os benefícios do

bem-estar e os custos de saúde (KOVACS HW�DO., 2000, p.08).

Os autores relatam que o modelo estava sendo implementado no CRYSTAL ':, o

que possibilitaria uma visão geral e transparente do estado clínico dos pacientes, em uma

região.

�������0RGHOR�$OHPmR�GH�6D~GH�No modelo Alemão de Saúde, todas as doenças de notificação compulsória são

analisadas, diariamente, semanalmente, mensalmente ou anualmente, pelo Departamento

de Saúde Pública daquele país (SCHUMANN; LÓPEZ; GRAW 1998). Essas notificações

de doenças são enviadas, em formatos distintos de dados, especificados nas Figuras 19 e

20. Na Figura 19, está representado o formato de envio, dos hospitais ao Departamento de

Saúde Pública Alemão. Na Figura 20, está representado o formato de envio obrigatório de

dados, das companhias seguradoras, ao mesmo departamento de saúde.

)LJXUD������)RUPDWR�GH�HQYLR�GH�GDGRV�GRV�KRVSLWDLV�DR�'HSDUWDPHQWR�GH�6D~GH�3~EOLFD�$OHPmR��6&+80$11��/Ï3(=��*5$:���������

Na Figura 19, Kij representa a freqüência da doença Ki, em uma área geográfica oj

(i.e. distrito ou cidade). Os parâmetros [ta, te] representam o intervalo de tempo.

)LJXUD������)RUPDWR�GH�HQYLR�GH�GDGRV�GRV�KRVSLWDLV�DR�'HSDUWDPHQWR�GH�6D~GH�3~EOLFD�$OHPmR��6&+80$11��/Ï3(=��*5$:��������

O formato de envio dos dados, das companhias seguradoras ao Departamento de

Saúde Alemão, é compulsório e definido por leis daquele país. Essas leis obrigam que a

notificação do caso contenha: tratamento seguido, idade, sexo (dentre outros parâmetros a

serem informados). Na Figura 20, o parâmetro 2 denota o conjunto de áreas geográficas,

.� o tipo da doença e, m1,..., mk, os parâmetros descrevendo o paciente e a doença.

Page 68: Dissertação Giovanni - Revisões Feitas

55

Segundo os autores, embora o conjunto de dados 0' possa ser facilmente extraído do

&'� o fluxo de dados é lento e dificulta a predição de epidemias.

�������2XWURV�PRGHORV�GH�SUHGLomR�H�WUDEDOKRV�HQFRQWUDGRV�Rigau-Perez HW�DO� (1999) avaliam a utilidade do Gráfico de Barras, na detecção

de epidemias de Dengue, em Porto Rico, para a vigilância de doenças, em múltiplas

localidades. Durante um período de quatro semanas, observou-se significante aumento

na incidência de Dengue, caracterizado por excesso de casos suspeitos, em mais de duas

semanas, além da média prevista. A apresentação de um índice anual de casos

registrados de Dengue, maior que três por mil foi considerado como epidemia.

Hales HW�DO� (2002) investigam os efeitos potenciais da mudança do clima na saúde

humana, em relação aos arbovetores. Nessa obra, os autores, através de um parâmetro

climático (evaporação de água), avaliaram as mudanças nos limites geográficos da

transmissão de Dengue e o número de possíveis infectados, através de projeções da

população humana e mudanças climáticas.

Os autores relatam que, através de regressões logísticas, com margem de confiança

de oitenta a nove por cento até o ano 2085, o valor aproximado é entre cinco e seis

bilhões de pessoas. De cinqüenta a sessenta por cento da população global projetada,

estariam susceptíveis, em seus limites geográficos atuais, à transmissão de Dengue. Na

construção do modelo, foram utilizados a média mensal das variáveis climáticas (chuva,

temperatura máxima, mínima e média diárias, dentre outras) e o número de casos

notificados da doença.

Penna (2004) realizou um estudo entre as redes neurais e a técnica estatística de

regressão binomial negativa, para predição de cólera, no Ceará. Este estudo teve como

base, os dados de uma epidemia de cólera, ocorrida entre os anos de 1993 e 1994. Foi

utilizada uma rede recorrente, com dois neurônios na camada de entrada (correspondentes

ao ano e ao mês), doze, na camada oculta, um, na camada de saída e um, na de memória.

O treinamento foi feito através do EDFN�SURSDJDWLRQ, com taxa de aprendizado de 0,01 e

momentum de 0,9. Os dados utilizados para treinamento, foram coletados entre janeiro de

1979 e junho de 1991, correspondendo a cento e cinqüenta observações. A predição foi

realizada para o período de agosto de 1991 a dezembro de 1995. Houve o mesmo ajuste

de dados para a técnica de regressão binomial negativa, através da qual foram feitas as

Page 69: Dissertação Giovanni - Revisões Feitas

56

predições para o mesmo período. Os resultados são os apresentados na Figura 21.

.

)LJXUD������ÏELWRV�REVHUYDGRV�H�HVWLPDGRV�SRU�UHJUHVVmR�ELQRPLDO�QHJDWLYD�H�UHGH�QHXUDO���&HDUi��-XOKR�GH������D�GH]HPEUR�GH�������3(11$��������S������

Nessa obra, a autora nos relata que os dois modelos alcançaram valores bons de

predição, embora o modelo de regressão binomial negativa estudado, apresentasse menor

variância que o da rede neural (PENNA, 2004, p.355).

������� 7UDEDOKRV�HQFRQWUDGRV�UHODWLYRV�DR�%UDVLO�Siqueira Júnior (2005) faz uma avaliação dos casos de Dengue no Brasil nos anos

situados entre 1981 e 2002. Nessa obra, o autor relata que o Brasil notificou,

aproximadamente, setenta por cento de todos os casos notificados nas Américas.

O autor relata que os casos notificados de Dengue reapareceram nas Américas, na

década de 1960, mas precisamente nas Ilhas Caribenhas e Venezuela; na década de 1970

e na Colômbia e no Brasil, na década de 1980.

O histórico da totalização de casos notificados de dengue, no Brasil, pode ser

demonstrado através da Figura 22. Esta figura apresenta um gráfico que está totalizado

mensalmente, sendo que a barra negra representa o mês de janeiro de cada ano

(SIQUEIRA JÚNIOR, 2005).

Page 70: Dissertação Giovanni - Revisões Feitas

57

)LJXUD������&DVRV�UHODWDGRV�GH�GHQJXH�QR�%UDVLO�QRV�DQRV�GH������D�������6,48(,5$�-Ò1,25��������S�����

A Figura 22 fornece informações importantes sobre a ocorrência dos casos de

Dengue no Brasil. A primeira informação é a representação de duas séries temporais

distintas. A segunda informação é a que de forma genérica, no início de cada ano, há um

aumento de número de casos notificados relatados.

A Figura 23 demonstra o número de casos, óbitos, hospitalizações de DH e

tipificação dos casos de Dengue, em todo Brasil, nos anos entre 1996 e 2002, assim como

também FHD, óbitos, hospitalizações e ano de tipificação desse vírus, no Brasil. Nesta

figura pode-se ver o aumento considerável do número de hospitalizações, decorrentes de

complicações relativas ao Dengue ou por FHD.

As últimas pesquisas publicadas no ano de 2004, revelam que houve redução

nacional de 81,8% dos casos notificados, sendo que o estado de Goiás teve decréscimo de

80,7% dos casos de agravo relatados (SVS, 2004, p.05).

Page 71: Dissertação Giovanni - Revisões Feitas

58

)LJXUD������1~PHUR�GH�FDVRV�UHODWDGRV�GH�DJUDYR��yELWRV��KRVSLWDOL]Do}HV�H�DQR�GD�WLSLILFDomR�GRV�FDVRV�GH�GHQJXH�QR�%UDVLO��6,48(,5$�-Ò1,25��������S�����

�������2XWUDV�SXEOLFDo}HV�UHIHUHQWHV�D�'HQJXH�Na publicação de Sousa HW� DO� (2004), é relatada uma relação direta entre a

precipitação pluviométrica e o número de casos notificados de Dengue, em Belém-PA, no

período entre 1998 e 2003. Os autores construíram gráficos anuais, divididos em faixas

mensais que, depois de analisados, os levaram a constatar que existe uma maior

incidência de casos de Dengue nos meses considerados mais chuvosos (janeiro, fevereiro,

março e abril). Os autores relacionaram outros parâmetros meteorológicos (temperatura e

umidade relativa) com o surto dessa doença.

Nascimento Sousa HW� DO� (2004), relatam ter utilizado tomada mensal de dados

climáticos (temperatura média, temperatura máxima, temperatura mínima, umidade

relativa do ar e precipitação) entre 1996 e 2000, para determinar, através do método de

coeficientes de incidências mensais, a influência do clima sobre a variação anual média

de casos relatados de Dengue, na cidade de Campina Grande-PB. Os autores relatam que

uma das condições atmosféricas (temperatura mínima) restringe a ação do vetor e o

impede de transmitir o vírus de Dengue. Dizem, ainda, que os elementos (parâmetros)

meteorológicos (chuva, temperatura média e umidade relativa do ar) contribuíram para

incidência da doença, naquela cidade, na faixa de doze a trinta e quatro por cento da

população. Ainda justificam que, “além das condições meteorológicas, existem outras,

causadas por condições nutricionais, sociais, e de defesa imunológica do organismo

Page 72: Dissertação Giovanni - Revisões Feitas

59

humano” (NASCIMENTO SOUSA HW�DO�, 2004, p.02) H�J� (relatado pelos autores) e pelo

racionamento de água ocorrido na região.

Andrade e Dantas (2004), em sua obra, avaliam a influência de elementos

meteorológicos, nos casos de várias doenças, dentre elas, Dengue, na cidade de Campina

Grande–PB Os elementos climáticos (temperatura mínima, temperatura máxima,

precipitação, umidade relativa do ar) foram analisados através das médias semanais dos

anos entre 1999 e 2001, totalizando 156 semanas. Foram utilizadas técnicas estatísticas

de regressão linear simples e regressão linear múltipla para determinar a correlação do

número de casos registrados de Dengue e as variações climáticas registradas. O resultado

obtido foi a correlação, considerada, pelos autores, fraca, entre clima (variáveis

climáticas) e o surto de Dengue. Na mesma publicação, é relatado que os elementos

meteorológicos que mais influenciaram na disseminação de Dengue, naquela região,

foram a umidade relativa do ar e a precipitação pluviométrica.

Campus Braga HW�DO� (2004), em artigo, apresentam a regressão linear simples, como

método para predição de Dengue, sobre a região da Paraíba, a partir de uma variável

atmosférica (índice pluviométrico). Os dados adotados para a pesquisa, foram os totais

diários de notificação de Dengue e a precipitação da região. O método tem capacidade de

predição para alguns meses, em relação à distribuição do número de casos relatados de

Dengue. Os resultados encontrados foram de boa acurácia, para alguns municípios da

região estudada.

������� (VWXGRV�HSLGHPLROyJLFRV�HP�*RLkQLD�Em sua dissertação de mestrado, Maciel (1999) - através de métodos estatísticos de

análise epidemiológica descritiva, com construção da série histórica do período, taxas de

ataque (ocorrência) global e específica por idade, sexo e local de residência, com

intervalos de confiança de noventa e cinco por cento - faz uma avaliação epidemiológica,

nos dados notificados de Dengue, no Município de Goiânia, no período entre 1994 e

1997. Na pesquisa, é relatado que o maior número de casos notificados, no período,

ocorreu entre janeiro e maio, também a fase de maior precipitação pluviométrica.

Os resultados encontrados foram: �D� diferença estatística significante entre os

sexos, sendo o feminino o de maior taxa de ataque (ocorrência); �E� faixas etárias mais

Page 73: Dissertação Giovanni - Revisões Feitas

60

atingidas, entre vinte e quarenta e nove anos; �F� a região com maior número de

notificações foi a central, com 19,8% dos casos.

É importante ressaltar que, antes da década de 80, não houve notificação do vírus

de Dengue, em Goiânia-Go, portanto, o ano de 1994 foi considerado epidêmico.

Siqueira Júnior (2001), em sua dissertação de mestrado, faz uma avaliação

epidemiológica nos dados notificados de Dengue, no Município de Goiânia. Essa

avaliação, nos dados de notificação, visou oferecer bases para determinar a existência de

epidemia, nos primeiros meses de 2001. Foram utilizadas as técnicas de diagramas de

controle de método analítico-gráfico e método de 6KHZKDUW, para determinar o limite de

alarme para a ocorrência do surto.

Os resultados apresentados foram: �D� a detecção da epidemia (número de casos

notificados comparado ao limite de alarme) por ambas as técnicas. O método analítico-

gráfico, que possibilitou a detecção com duas semanas de antecedência; �E� “identificação

da região Nordeste, como a área inicial, com excesso significativo de casos” (SIQUEIRA

JÚNIOR, 2001, p.06).

Um inquérito populacional foi realizado em mil seiscentos e dez indivíduos, para

avaliar a presença de anticorpos anti-Dengue, através dos testes sorológicos (IgG e IgM),

e os fatores de risco individuais e de área para a ocorrência da infecção no município de

Goiânia em 2001. Foi realizada, através do método .HUQHO, a distribuição espacial da

prevalência na área urbana. Entre os fatores de risco para infecção o resultado

apresentado foi risco em pessoas mais velhas, com baixo nível de educação, menores

salários e em áreas urbanas mais afastadas, das regiões mais valorizadas (SIQUEIRA

JÚNIOR, 2004).

A Figura 25 mostra as estimativas de prevalência de infecção pelo vírus da Dengue

de acordo com a técnica espacial de .HUQHO�para o município de Goiânia. A prevalência

global para região foi de 29,5%.

Page 74: Dissertação Giovanni - Revisões Feitas

61

)LJXUD�����SUHYDOrQFLD�GH�GHQJXH�HP�*RLkQLD��������6,48(,5$�-Ò1,25�HW�DO�� ������

Page 75: Dissertação Giovanni - Revisões Feitas

62

� 0(72'2/2*,$����� &DUDFWHUL]DomR�GD�SHVTXLVD������� &ODVVLILFDomR�GD�3HVTXLVD�

Este é um trabalho de pesquisa aplicada, que objetiva a criação de modelo

epidemiológico para doenças transmitidas pelo vetor urbano, PRVTXLWR� $HGHV (i.e.

Dengue), que possibilite, com certa margem de confiança, a tomada de decisão aos

gestores de saúde. A classificação da pesquisa quanto ao fim, é explicativa (pretende-

se criar relações, de forma a transformar um conjunto de dados em base de

conhecimento, que prevejam a ocorrência de surtos), quanto ao meio de investigação, e

experimental (pretende-se trabalhar com variáveis independentes e observar como

essas variáveis se comportam). Como a fonte dos dados é interdisciplinar, optou-se, no

caso dos dados, pela pesquisa exploratória descritiva (revisão bibliográfica), com

instrumento de pesquisa documental, visando buscar pesquisas recentes sobre o vetor e

as doenças.

������ 8QLYHUVR�GD�3HVTXLVD�A pesquisa realizada teve como escopo de trabalho, os dados fornecidos, através

de solicitação, pelas seguintes fontes da cidade de Goiânia-GO: �D� 10º Distrito de

Meteorologia (10º DISME); �E� Cia. de Processamento de Dados do Município de

Goiânia (COMDATA); �F��Secretaria Municipal de Saúde de Goiânia (SMS-GO); �G� Divisão de Estudos Sócio Econômicos, pertencente à Secretaria Municipal de

Planejamento (SEPLAN).

O alvo desta pesquisa está direcionado para a criação de modelo epidemiológico,

capaz de prever, com certa margem de confiança, o número de casos confirmados de

Dengue, possibilitando a tomada de decisão/ação (i.e. campanhas de prevenção,

combate ou vacinação de emergência) por parte das autoridades de saúde da cidade

(CUMMINGS HW�DO�, 2004).

O modelo é alimentado conforme as referências bibliográficas (pesquisa

exploratória) e referentes ao vetor das doenças e a parâmetros climáticos,

representados através dos seguintes bancos de dados:

Page 76: Dissertação Giovanni - Revisões Feitas

63

a) Dados epidemiológicos – representados pelos exames laboratoriais e

avaliações médicas, registradas no SINAN, e fornecidas pelo

Departamento de Epidemiologia da Secretaria Municipal de Saúde de

Goiânia - Go;

b) Dados (parâmetros) climáticos fornecidos pelo 10º DISME.

���� 0DWHULDO�H�0pWRGRV������� $ERUGDJHP�$GRWDGD�

Por sua característica interdisciplinar, o curso de mestrado da Universidade

Católica de Brasília (UCB), em Gestão do Conhecimento e da Tecnologia da

Informação (MGCTI), possibilita uma abordagem que parte da tecnologia para a gestão

do conhecimento, de forma indutiva e provocativa, a fim de que os processos mentais

atuem para a implantação de modelos formais de Gestão do Conhecimento em várias

áreas. Dentre essas áreas, está a da Saúde, que no momento, tem grande repercussão, no

que tange a ocorrência de epidemias. O processo de análise e descoberta de

conhecimento, utilizado nesta dissertação, baseia-se na metodologia CRISP-DM

(DELMATER; HANCOCK, 2001, p.61; CHAPMAN HW� DO., 1999 DSXG COSTA

SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02), através da aplicação em

estudo de caso, para a área fim da Secretaria Municipal de Saúde de Goiânia.

������ 'HVFULomR�GR�PpWRGR�&5,63�'0�O método CRISP-DM (DELMATER; HANCOCK, 2001, p.61; CHAPMAN et

al., 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02) é

apresentado por meio de dois modelos básicos: o de referência e o guia do usuário. O

modelo de referência dá uma visão geral do ciclo de um projeto de mineração de dados.

O modelo guia do usuário oferece um detalhamento maior desse processo e será

empregado no estudo de caso.

������ &ROHWD�GH�'DGRV�Concentrada na atividade fim da SMS, a coleta de dados epidemiológicos,

relativos aos casos confirmados de Dengue, para a mineração de dados, foi realizada,

junto ao setor responsável (Departamento de Epidemiologia). Os aspectos sobre o vetor

Page 77: Dissertação Giovanni - Revisões Feitas

64

e doenças foram tratados com os profissionais que realizam, diariamente, o serviço de

notificação de doenças e medida da incidência do vetor na cidade (Departamento de

Zoonoses).

Como os órgãos responsáveis pela captação e gerência das informações, relativas

a epidemias e controle do vetor, detêm a competência para lidar com as questões

inerentes ao prontuário de pacientes, os especialistas dessas áreas foram envolvidos e a

SMS proporcionou o acesso ao banco de dados do SINAN, relativo ao Dengue e à

descrição de sua estrutura.

������ 5HSUHVHQWDomR�GD�DQiOLVH�GRV�GDGRV�Representar a análise dos dados para gestores é tarefa aparentemente simples,

mas, na verdade, trata-se, na maioria das vezes, de tarefa complexa, já que emissor e

receptor possuem experiências, formações e bagagens de conhecimento distintas. Para

sanar esta dificuldade, comunicar as investigações realizadas e representar a análise dos

dados para gestores, nesta dissertação, será utilizada a técnica visual de gráficos.

Os gráficos são importantes, pois tornam a comunicação mais rápida, clara e de

fácil assimilação pelo receptor da mensagem. Existem cinco (05) tipos de gráficos

básicos que devem ser utilizados em qualquer pesquisa: �D� o de torta; �E� o de barras;

�F� o de colunas; �G� o de linhas; �H� o de pontos (ZELASNY, 1997, pp.19-36).

Para cada tipo existem especificações: �D� O gráfico de torta deve ser utilizado

para mostrar o tamanho de cada parte como um percentual do total, em, no máximo, seis

divisões (ZELASNY, 1997, pp.38-42); �E� O gráfico de barras, ou de colunas, deve ser

utilizado para demonstrar a variação de um item mensurável (H�J� volume de vendas,

magnitude de rendimento), em um determinado período ou para a comparação entre

diferentes produtos (ZELASNY, 1997, pp.43-45); �F� O gráfico de linhas deve ser

utilizado para mostrar, de forma compacta, se existe tendência de aumento ou

decréscimo em determinado período de tempo (ZELASNY, 1997, pp.48-50); �G� O

gráfico de pontos deve ser utilizado para mostrar a relação entre duas variáveis que

seguem ou não, o padrão que normalmente se esperaria (e.g. pessoas com maior grau de

instrução recebem maiores salários, profissionais com mais tempo de serviço e maior

experiência, realizam tarefas de forma mais rápida e sem necessidade de supervisão).

Page 78: Dissertação Giovanni - Revisões Feitas

65

(ZELASNY, 1997, p.56).

No caso de pesquisas que apresentem fortes relações com séries temporais, dois

tipos de gráficos, o de colunas e o de linhas, são os indicados para representar os dados.

No primeiro tipo, o de colunas, deve-se observar o limite máximo de seis ou sete

divisões; já o segundo tipo, o de linhas, deve ser usado para representar mais de sete

divisões (ZELASNY, 1997, p. 36,46-47).

������ $QiOLVH�GRV�JUiILFRV�H�UHVXOWDGRV�HQFRQWUDGRV�QD�SUHGLomR�Escolher gráficos como uma alternativa para melhor representação visual é uma

opção amplamente utilizada em diversas instituições (ZELASNY, 1997). Quando

existem vários gráficos sobre o mesmo assunto, a análise visual pode comprometer a

avaliação sobre qual deles apresenta o melhor resultado. Para sanar essa dúvida, não

resta alternativa, a não ser trabalhar com métricas de análise.

Nesta obra, em termos da análise dos resultados da predição, serão trabalhadas as

seguintes métricas:

a) percentual de erro, representado pelo percentual entre o resultado previsto e o

real (notificado ou confirmado);

b) acurácia da tendência (real versus predita), representada pelo percentual de

número de acertos;

c) erro médio e erro padrão de previsão (observações versus previsões): existe

necessidade de se avaliar as diferenças existentes entre as observações e previsões,

atribuindo um valor numérico que estabeleça a qualidade do estimador utilizado, para

que a avaliação seja abrangente a toda a amostra.

No modelo matemático utilizado nesta dissertação, adotou-se a seguinte diferença

entre os modelos: ���� No caso do erro médio, o modelo utiliza o operador “Valor

Absoluto”; ��� No caso do erro padrão, o modelo utiliza o operador “Elevar ao

quadrado”; O operador Valor Absoluto, aqui utilizado de forma extensiva, não possui

propriedades matemáticas pelas quais se possa fazer uma extensão amostra-população,

já o erro médio é utilizado, apenas, para descrição e não extensão.

Page 79: Dissertação Giovanni - Revisões Feitas

66

���� 0RGHOR�3URSRVWR�No Brasil, Dengue é uma doença reemergente e, por isso, as epidemias são um dos

mais importantes problemas de saúde pública, apresentando padrão de contaminação alto,

especialmente em áreas urbanas com elevada densidade populacional (FUNASA, 2002,

p.20). A detecção precoce e a predição de surtos, pelo sistema de vigilância brasileiro, são

essenciais para possibilitar a interrupção da epidemia e o planejamento de combate à

doença.

O número de casos de Dengue relatados em uma (macro/micro) região ou distrito

(de um país, de um estado ou de uma cidade) deve-se às suas próprias características (H�J� densidade demográfica, hidrografia, etc.). Esse número é influenciado por mudanças

climáticas extremas (H�J� chuva, ondas de calor, amplitude térmica, etc.) e forma um

cenário no qual cada variável (H�J� exposição a um novo tipo de vírus, susceptibilidade da

população a este vírus, etc.) possui seu próprio domínio (i.e. número de casos ocorridos,

presença do vetor naquela região, etc.).

O cenário de Dengue no Brasil, em determinado momento histórico, pode ser

representado na forma clássica de séries temporais, através dos relatos das semanas

epidemiológicas. A notificação dos casos de Dengue, em várias regiões brasileiras e no

mesmo período histórico, forma um conjunto de mosaicos, cenários somente explicados

pelas características únicas (H�J� densidade demográfica, influência climática, entrada de

um novo tipo de vírus na região, etc.) que essas regiões apresentam, naquele momento. A

Figura 25 mostra um exemplo desses cenários.

)LJXUD������'DGRV�SUHOLPLQDUHV�GRV�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD�VHJXQGR�UHJLmR��%UDVLO��������696��������S����

É possível visualizar os cenários específicos de Dengue, na Figura 26, em uma

Page 80: Dissertação Giovanni - Revisões Feitas

67

região escolhida, também na forma de coleção de semanas epidemiológicas.

)LJXUD������'DGRV�SUHOLPLQDUHV�GRV�FDVRV�QRWLILFDGRV�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD�GD�UHJLmR�&HQWUR�2HVWH��%UDVLO�������������696��������S���

O Brasil possui sua própria técnica de predição e combate epidemiológico: o

diagrama de controle (FUNASA, 2002). A técnica, exemplificada na Figura 27, em

cenários específicos na cidade de Goiânia, na forma de coleção de semanas

epidemiológicas.

)LJXUD����±�'LDJUDPD�GH�FRQWUROH�GH�GHQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�������D��������)5$1d$��$/9(6�6,/9$��$025,0�6,/9$��������S�����

As ocorrências de um ano com as de outro, podem ser comparadas – Figura 29 -

através de diagrama que contemple essa possibilidade (FRANÇA; ALVES SILVA;

AMORIM SILVA, 2004, p.52), Na análise do diagrama de controle anterior, Figuras 27,

tem-se o número previsto de casos (média), o limite de alarme (a partir do qual o número

de casos notificados é considerado surto) e o número de casos notificados de uma doença.

Page 81: Dissertação Giovanni - Revisões Feitas

68

Os autores Maciel (1999) e Siqueira Júnior (2001) utilizaram pesquisas em bases de

dados. Através de técnicas estatísticas ou diagramas de controle, estimaram a quantidade,

a localização (região) e o perfil de pacientes infectados na cidade em tela.

Existe grande quantidade de obras publicadas que utilizam técnicas estatísticas de

predição já consagradas e que relatam a influência sazonal de Dengue (H�J� ANDRADE;

DANTAS, 2004; CAMPUS BRAGA HW�DO� 2004; FOCKS HW�DO� 1995, RIGATU-PEREZ

HW� DO� 1999; NASCIMENTO SOUSA HW� DO� 2004; SOUSA HW� DO� 2004; SCHREIBER

2001, dentre outras).

Através das publicações da OMS (2003d, 2004b), SVS (2003, 2004, 2005) e dos

autores acima citados (dentre outros), foi possível compilar lista de variáveis que podem

auxiliar o diagnóstico, a localização e a predição de surtos de Dengue. As principais

variáveis são: �D� Mudanças climáticas extremas (H�J� chuva, ondas de calor, amplitude

térmica, etc.); �E� Regionais (H�J� número de casos ocorridos, tipificação do vírus

corrente, susceptibilidade da população ao tipo do vírus, medida do vetor naquela região,

etc.); �F� Físicas da região (H�J� tipo e uso do solo, altitude, vegetação predominante,

características de ocupação territorial, etc.).

A maioria dessas variáveis foi doada por instituições municipais, estaduais e

federais presentes na cidade de Goiânia, que possuem padrões temporais de coleta

distintos, regidos por leis. Algumas das variáveis doadas possuem restrições à publicação

e são de domínio privado.

Assim como relatado pela OMS (2003d, 2004b) em relação às variáveis similares,

não houve possibilidade de análise da amálgama de todas. O problema da impossibilidade

da transformação dos dados para o formato desejado, em tempo hábil, era inesperado e

consumiu aproximadamente três meses da pesquisa. Apenas as variáveis climáticas e

relativas à notificação dessas doenças puderam ser adequadas para o de semanas

epidemiológicas adotado nesta pesquisa.

���� (QWHQGLPHQWR�GR�QHJyFLR�Na fase do CRISP-DM, busca-se a compreensão dos objetivos necessários para o

alcance dos objetivos do projeto. É realizado o levantamento dos requisitos de fontes de

dados e conhecimento de especialistas. Além desses recursos, também são relatados os

Page 82: Dissertação Giovanni - Revisões Feitas

69

levantamentos bibliográficos relativos às doenças e, os aspectos legais da disponibilidade

e uso das informações.

������ 2EMHWLYRV�No Brasil, as Secretarias Estaduais e Municipais de Saúde (SMS) são os órgãos

responsáveis pelo controle e combate de surtos de trinta e cinco doenças cuja notificação

é compulsória (FUNASA, 2002). Dentre essas doenças está o Dengue. O seu controle,

combate e prevenção são feitos através de combate ao vetor.

O Departamento de Epidemiologia da Secretaria Municipal de Saúde de Goiânia

estima que cerca de sessenta a sessenta e cinco por cento dos casos de Dengue ocorridos

na cidade de Goiânia, são notificados, o que dificulta o combate ao vetor dessas doenças.

A Secretaria Municipal de Saúde de Goiânia (SMS-GO), assim como as demais

SMS do Brasil, são órgãos que dependem de planejamento prévio (FUNASA; 2002) para

que: �D� suas ações de combate a doenças sejam eficientes e eficazes (FRANÇA; ALVES

SILVA; AMORIM SILVA, 2004); �E� a melhoria contínua de seus sistemas

informatizados proporcione melhor atendimento aos pacientes de uma região (CASTRO,

ARAUJO, 2004; OMS, 2004d).

Na SMS-GO, a Divisão de Vigilância Epidemiológica é responsável pelo cadastro

no SINAN, dos prontuários médicos e seus resultados e pela construção dos diagramas de

controle das doenças de notificação compulsória.

Pode-se então destacar como objetivos principais da Divisão de Vigilância

Epidemiológica (em relação aos dados de Dengue): �D� alimentação de banco de dados do

SINAN; �E� construção de diagramas de controle e, �F� em caso de ocorrência de

epidemias, o diagnóstico e bloqueio perifocal, na área de provável transmissão.

Nas bases de dados do SINAN, que contêm todos os registros classificados como

confirmados, descartados ou suspeitos (i.e. não houve possibilidade de chegar a um

resultado durante a investigação), são mantidos os casos notificados de uma cidade. Cada

região (cidade, estado ou país) tem suas características regionais e físicas próprias e

sofrem diferentes epidemias, em épocas distintas. (OMS, 2003d; 2004b).

A identificação das variáveis climáticas que influenciam o surto de Dengue, em

Page 83: Dissertação Giovanni - Revisões Feitas

70

Goiânia, é a etapa secundária do trabalho - a primária é a predição de casos confirmados.

A fase de exploração do espaço do problema é o ponto crítico para um projeto de

mineração de dados e a identificação do problema e sua solução representam duas das

mais importantes fases do projeto de mineração de dados (PYLE 1996 DSXG COSTA

SOUSA, 2003, p.73). Das publicações referentes à predição de Dengue, relatadas por

especialistas e da experiência adquirida durante a fase CRISP-DM, foram selecionados

alguns questionamentos e suas respectivas hipóteses de solução, que serão exploradas

pela mineração de dados, destacando-se as seguintes:

a) Quais as variáveis climáticas que mais contribuem para o menor erro na

variável preditiva (número de casos confirmados) para cidade de Goiânia?

Hipótese: O conjunto de variáveis climáticas influencia o número de casos

confirmados de Dengue.

b) É possível classificar, através dos períodos endêmicos e epidêmicos de Dengue,

as variáveis climáticas de Goiânia?

Hipótese: Períodos endêmicos e epidêmicos de Dengue seguem padrões

meteorológicos.

Com a resolução dessas questões, espera-se fornecer base para suporte ao combate

epidemiológico da doença. Pela análise dos dados e seu entendimento, pode-se identificar

a influência sazonal em relação aos casos confirmados.

������ $YDOLDomR�GRV�UHFXUVRV�DWXDLV�Destina-se à identificação dos recursos necessários para o alcance dos objetivos

deste projeto. É realizado o levantamento dos requisitos de VRIWZDUH, fontes de dados e

conhecimento necessário de especialistas, além de levantamentos sobre a qualidade e

segurança dos resultados.

Iniciando a avaliação, segue abaixo a lista dos recursos disponíveis, em termos de

recursos tecnológicos, dados e informações:

a) Foi utilizada a base de dados referente ao SINAN de Goiânia-GO. Nela estão os

dados cadastrais referentes aos prontuários médicos, em relação ao Dengue. As

Page 84: Dissertação Giovanni - Revisões Feitas

71

ocorrências descrevem os resultados das avaliações laboratoriais e médicas

(prova do laço) de cada paciente;

b) Foi utilizada a base de dados referente ao 10º DISME de Goiânia. Nela estão os

dados (parâmetros) climáticos;

c) O equipamento utilizado para execução dos modelos de mineração de dados,

tem as seguintes características: K-7 2600Md, 1 Gbyte de memória, 80 Gbytes

de disco rígido;

d) Simulador de Redes Neurais Artificiais (DV\11�SOXV, disponível na forma livre;

e) Recursos externos disponíveis (acesso a outras bases de dados): dados que não

puderam ser trabalhados na forma temporal (semanas epidemiológicas) adotada

nesta pesquisa.

f) Por seu caráter individual e restrito, o cadastro dos dados do SINAN não pode

ser divulgado, sem a devida autorização, conforme o compromisso de doação

firmado com a Secretaria Municipal de Saúde. A autorização de uso das

informações do cadastro de pacientes, no SINAN, teve sua aprovação baseada

nas restrições impostas pela FUNASA (2002, p.17) e no pedido de doação que

consta do Anexo A.

g) A autorização de uso das informações cadastrais referentes à cidade de Goiânia

foi concedida pela COMDATA, baseada no pedido que consta do Anexo B:

h) As variáveis climáticas foram doadas pelo 10º DISME–Goiânia, para uso

exclusivo desta dissertação de mestrado, conforme pedido do orientador, que

consta do Anexo C.

i) As variáveis referentes à população de Goiânia foram doadas pela Secretaria de

Planejamento daquela cidade e são de domínio público, assim como as doadas

pelo Departamento de Controle de Zoonoses, referentes à medida do vetor

também em Goiânia.

Tendo-se em mãos a autorização para uso das informações e seguindo o modelo

CRISP-DM, pôde-se dar início aos estudos sobre os casos notificados. As bases de dados

Page 85: Dissertação Giovanni - Revisões Feitas

72

foram implementadas na plataforma de banco de dados 0LFURVRIW�$FFHVV.������ 2EMHWLYRV�D�VHUHP�DOFDQoDGRV�SHOD�PLQHUDomR�GH�GDGRV�

Tomando-se por base os objetivos desta dissertação, o objetivo principal da

mineração de dados foi o de executar mecanismos de análise e predição sobre a

amálgama do SINAN e 10º DISME, que poderão ser utilizados para planejamento ao

combate a endemias e epidemias de Dengue.

���� (QWHQGLPHQWR�GRV�'DGRV�Durante a fase da coleta, foi realizada investigação preliminar que visou maior

familiarização com os dados, além de avaliação e limpeza.

������ 'DGRV�,QLFLDLV�A cidade de Goiânia, capital do Estado de Goiás, fica localizada entre as

coordenadas geográficas 49º 00’ – 49º 45’ W e 16º 30’ - 17º 00’ S e a sua extensão

territorial é de 741 quilômetros quadrados (SIQUEIRA JÚNIOR 2001, p.09). Nela,

existem, atualmente, duas estações climáticas de coleta, sob a responsabilidade do 10º

DISME. Os dados climáticos doados, para este estudo, são referentes à estação 83423,

localizada em latitude de 16º 40’ S e longitude de 49º 15’ W, com altitude de 741,48

metros.

Os dados utilizados para estudo epidemiológico e sua influência climática foram

coletados a partir dos bancos de dados da Secretaria Municipal de Saúde e do 10º

DISME, no período correspondente a 01 de janeiro de 2001 até 30 de abril de 2004.

Inicialmente, a coleta de dados foi realizada de acordo com o formato de doação

dos arquivos, que, por sua vez, foram importados para o Microsoft Access. A importação

dos dados para aquele banco facilitou sua transformação em informações a serem

analisadas no equipamento onde foi executada a técnica de mineração de dados.

Sobre o gerenciador de Banco de Dados 0LFURVRIW�$FFHVV, as tabelas utilizadas para

extração dos dados necessários à mineração de dados, foram restritas às seguintes:

a) Tabela de prontuários do SINAN de Goiânia – Goiás (0'(1*8(). Número de

registros, 30.495.

Page 86: Dissertação Giovanni - Revisões Feitas

73

b) Tabela de semanas epidemiológicas (6(0$1$(3,), referente ao calendário

definido pelo SINAN para todo Brasil. Número de registros, 175.

c) Tabela de parâmetros climáticos (��',60(), referente às variáveis

meteorológicas da cidade de Goiânia, relativa ao período entre 2001 e 2004.

Número de registros gerados, 1.582.

d) Tabela &/$66,),&$'25),1$/ foi gerada pela união das informações das

tabelas eletrônicas: 0'(1*8(�� 6(0$1$(3, e� ��',60(. Nela estão

registrados o número de casos confirmados de Dengue e a sua influência

sazonal representada pela média, definida, D SULRUL, em duas semanas anteriores

à semana epidemiológica pesquisada. Número de registros gerados, 175.

Cabe destacar que as demais variáveis doadas (características físicas e

populacionais da cidade e a medida do vetor) foram convertidas, mas tiveram de ser

descartadas, pois não puderam ser adequadas para o formato do calendário de semanas

epidemiológicas escolhido para esta pesquisa.

������ 'HVFULomR�GRV�GDGRV�Os dados coletados para este estudo estão descritos nos Quadros 2, 3, 4, 5, 6 e 7.

Em cada quadro está contida a estrutura e descrição da tabela de dados, assim como o seu

local de origem, período de abrangência, número de instâncias, formato de doação,

domínio, nome, número de atributos e utilização nesta pesquisa.

Os Quadros estão agrupados conforme os locais de doação. A ordem de descrição

adotada foi a de bancos de dados municipais e, em seguida, o federal. Após cada quadro,

foi feita a descrição dos dados presentes na base. Os bancos de dados municipais

abordados e seus locais de obtenção estão representados nos Quadros 2, 3, 4, 5 e 6.

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�GR�6,1$1��UHIHUHQWH�D�SHVTXLVDV�VREUH�R�'HQJXH�Domínio Casos notificados de dengue Origem dos Dados Departamento de Epidemiologia da Secretaria

Municipal de Saúde de Goiânia – Goiás Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número de Instâncias Ano de 2001 – 06.709

Ano de 2002 – 17.639

Page 87: Dissertação Giovanni - Revisões Feitas

74

Ano de 2003 – 08.236 Ano de 200415 – 03.497 Total – 36.081

Formato de doação do arquivo 'DWD�%DVH�)LOH�(DBF)�Formato de trabalho do arquivo0LFURVRIW�$FFHVV�Domínio dos dados Restrito Nome 0'(1*8(�Número de Atributos 87 existentes nos arquivos originais, 13 utilizadas na

CRISP-DM. Utilização Utilizada para geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�Dicionário de dados da tabela do SINAN�

Os domínios aqui apresentados são definidos na )LFKD�GH�,QYHVWLJDomR�GH�GHQJXH ID_MUNICIP Código do município onde foi feita

a notificação Domínio: 5208707 (Município de Goiânia)

DT_NOTIFIC Data da notificação NU_IDADE Idade do paciente CS_SEXO Sexo do Paciente Domínio: M; F ID_BAIRRO Código do bairro onde o paciente reside ID_MN_RESI Código do município onde o

paciente reside Domínio: 5208707 (Município de Goiânia)

DENGUE Havia sido infectado com Dengue antes

Domínio: 1 - Sim; 2 - Não; 9 - Ignorado

VACINADO Vacinado contra Febre Amarela Domínio: 1 - Sim; 2 - Não; 9 – Ignorado

FEBRE Teve febre Domínio: 1 - Sim; 2 - Não; 9 – Ignorado

DURACAO Duração da febre em dias LACO Prova do Laço Domínio: Positiva; Negativa; Não Realizada HOSPITALIZ Ocorreu Hospitalização Domínio: Sim; Não; Ignorado CON_CLASSI Resultado final Domínio: 1 – Dengue Clássico; 2 – Dengue com

Complicações; 3 – Febre Hemorrágica de dengue – FHD; 4 – Síndrome do Choque de dengue; 5 – Descartado

No Quadro 2, estão representados os dados do SINAN referentes ao período de

doação. Cada registro desse banco corresponde a uma avaliação médica e/ou exame

laboratorial registrado. Ao total são 36.081 registros de agravo para análise.

No Quadro 3, estão representados os dados referentes às medidas do PRVTXLWR�$HGHV� realizados entre os anos de 2001 e 2004. Cada registro desse banco corresponde ao

índice de %UHWHDX medido, em um determinado período histórico, em um conjunto de

bairros da cidade. É importante ressaltar que foram encontrados os seguintes problemas

na conversão dessa base: �D� a base doada não está em formato que possa facilmente ser

Page 88: Dissertação Giovanni - Revisões Feitas

75

transformada em um banco de dados, foi necessária a criação de um campo para

representar o código do bairro e a sua associação manual com os bairros reconhecidos

pela SEPLAN; �E� existem bairros que não estão presentes na amostragem oficial da

SEPLAN; �F� a grafia dos nomes dos bairros dessa doação, não segue nenhuma regra.

4XDGUR�����'LFLRQiULR�GH�GDGRV�VREUH�RV�GDGRV�GR�9HWRU�Domínio Dados Entomológicos sobre o Vetor Origem dos Dados Departamento de Controle de Zoonoses Período de abrangência 22/Março/2002 a 30/Abril/2004. Número total de Instâncias Total – 2.191 Formato de doação do arquivo 12 planilhas do Microsoft Excel Formato de trabalho do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Público Nome 9,*,B6$1,�Número de Atributos 12 Utilização Descartada na geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�

DATAI Data de início DATAF Data de fim CD_BAIRRO Código do Bairro IM_INSP Número de imóveis inspecionados IM_PAAE Número de imóveis com $HGHV�DHJ\SWL IM_PAAL Número de imóveis com $HGHV�DOERSLFWXV DP_PAAE Número de depósitos positivos com $HGHV�DHJ\SWL DP_PAAL Número de depósitos positivos com $HGHV�DOERSLFWXV IIP_MAAE Índice de infestação predial do $HGHV�DHJ\SWL IIP_MAAL Índice de infestação predial do $HGHV�DOERSLFWXV IB_MAAE Índice de %UHWHDX do $HGHV�DHJ\SWL IB_MAAL Índice de %UHWHDX do $HGHV�DOERSLFWXV

No Quadro 4, estão representados os dados referentes ao estudo realizado e

publicado, em 2002, pela SEPLAN, referente ao último censo realizado pelo IBGE, em

2000. Na publicação da SEPLAN, está a lista de todos os bairros reconhecidos por lei,

assim como também, o total de habitantes por sexo e faixa etária, por bairro. É importante

ressaltar que a base doada não possui todos os bairros presentes no cadastro do SINAN.

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�6(3/$1�Domínio Censo do IBGE publicado pela SEPLAN Origem dos Dados Secretaria de Planejamento (SEPLAN) Período de abrangência 2002 Número total de Instâncias Total – 327 Formato de doação do arquivo $FUREDW�5HDGHU�

15 Os dados existentes referem-se ao ano de 2004, de 01/Janeiro a 30/Abril.

Page 89: Dissertação Giovanni - Revisões Feitas

76

Formato de trabalho do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Público Nome &$5$&7(5,67,&$6%$,55266(3/$1�Número de Atributos 13 Utilização Descartada na geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�

CD_BAIRRO Código do bairro NM_BAIRRO Nome do bairro TOTAL População total do bairro POP_H Número de homens do bairro POP_M Número de mulheres do bairro TI00_04 Total de Habitantes com idade entre zero e quatro anos TI05_09 Total de Habitantes com idade entre cinco e nove anos TI10_19 Total de Habitantes com idade entre dez e dezenove anos TI20_29 Total de Habitantes com idade entre vinte e vinte e nove anos TI30_39 Total de Habitantes com idade entre trinta e trinta e nove anos TI40_49 Total de Habitantes com idade entre quarenta e quarenta e nove anos TI50_59 Total de Habitantes com idade entre cinqüenta e cinqüenta e nove

anos TI60 Total de Habitantes com idade superior a sessenta anos

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�&20'$7$�Domínio Registros da cidade de Goiânia Origem dos Dados COMDATA Período de abrangência Até agosto de 2004 Número total de Instâncias Total – 550 Formato de doação dos dados Texto puro Formato do arquivo 0LFURVRIW�$FFHVV�Domínio dos dados Privado Nome &$5$&7(5Ë67,&$6%$,5526&20'$7$�Número de Atributos 32 Utilização Descartada na geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�

CD_BAIRRO Código do Bairro no qual é realizada a feira NM_BAIRRO Nome do Bairro no qual é realizada a feira NR_LT_VAGOS Numero de total de lotes vagos no bairro NR_LT_RES Numero de lotes residenciais NR_LT_COM Numero de lotes comerciais AREA_VERDE Área verde em metros quadrados ASFALTO Domínio: Completamente asfaltado; Parcialmente

asfaltado; Sem asfalto. SEM_INST_SANI Total de lotes sem instalação sanitária COM_INST_SANI Total de lotes sem instalação sanitária HIDROMETRO Total de lotes com hidrômetro CISTERNA Total de lotes com cisterna CISTERNA_HIDROMETRO Total de lotes com cisterna e hidrômetro

Page 90: Dissertação Giovanni - Revisões Feitas

77

POCO_ART Total de lotes com poço artesiano SEM_H2O Total de lotes sem água REDE_PUB Total de lotes com rede de esgoto pública FOSSA_SEP Total de lotes com fossa séptica FOSSA_NEGRA Total de lotes com fossa negra SEM_ESGOTO Total de lotes sem esgoto QTDE_FEIRAS Total de feiras livres existentes naquele bairro QTDE_HOSPITAIS Quantidade de hospitais no bairro QTDE_ESCOLAS Quantidade de escolas no bairro NR_PREDIOS Número de prédios (condomínios verticais) existentes no

bairro NR_CEMITERIOS Número de cemitérios por bairro

No Quadro 5, estão representados os dados referentes à doação da COMDATA, em

2004. No conjunto de dados, estão as características físicas referentes a cada bairro. A

base refere-se apenas ao ano 2004 - não foram doados os anos anteriores - e possui

bairros que não estão presentes na publicação da SEPLAN.

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�UHIHUHQWH�DV�VHPDQDV�HSLGHPLROyJLFDV�Domínio Calendário de semanas epidemiológicas Origem dos Dados Departamento de Vigilância Sanitária Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número total de Instâncias Total – 175 Formato de doação dos dados Relatório Formato do arquivo 0LFURVRIW�$FFHVV Domínio dos dados Público Nome 6(0$1$(3,�Número de Atributos 3 Utilização Descartada na geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�

INICIO Data do início da semana FIM Data do fim da semana SEM_EPI Semana epidemiológica

No Quadro 6, estão representadas as semanas epidemiológicas do SINAN,

referentes aos anos de 2001 a 2004 (Anexo D).

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�UHIHUHQWH�DRV�GDGRV�GR�����',60(�Domínio Clima Origem dos Dados Distrito de Meteorologia em Goiás - 10º DISME

pertencente ao Instituto Nacional de Meteorologia (INEMET)

Período de abrangência 01/Janeiro/2001 a 30/Abril/2004 Número total de Instâncias Total – 1.582 Formato de doação dos dados Foram doados 360 arquivos referentes ao clima na

Page 91: Dissertação Giovanni - Revisões Feitas

78

cidade de Goiânia. Formato do arquivo Microsoft Access Domínio dos dados Restrito a esta pesquisa Nome ��',60(�Número de Atributos 10 Utilização Utilizada para a geração da tabela CLASSIFICADOR

FINAL Descrição dos Atributos�

DATA Data da avaliação climática N0900 Nebulosidade às 09:00 horas N1800 Nebulosidade às 18:00 horas N2100 Nebulosidade às 21:00 horas PD Índice pluviométrico ou precipitação (medida diária) URA Umidade relativa do ar (média diária, valor em percentual) URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual) URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual) TEMP Temperatura (média diária, valor em Graus Celsius) TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius) TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius) AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius)

No Quadro 7, estão representados os dados referentes à doação realizada pelo 10º

DISME. No conjunto de dados estão os padrões climáticos. Não houve problemas de

conversão com essa base.

������ ([SORUDomR�GRV�GDGRV�A exploração dos dados foi realizada por meio da linguagem de programação

9LVXDO�%DVLF� na qual, através da lógica de programação estruturada e de comandos SQL,

foram feitas, inicialmente, as seguintes análises:

Em relação à tabela eletrônica�0'(1*8(��a) Foram feitas as seguintes restrições em seus atributos: ��� o campo

CON_CLASSI foi definido como não nulo; ��� os campos ID_MUNICIP e

ID_MN_RESI foram restritos ao código 520870716.

Dessa maneira, eliminaram-se os dados de outras cidades e os resultados das

avaliações médicas não preenchidas e as não condizentes com a pesquisa. Esse

requisito foi utilizado nos anos de 2001, 2002, 2003 e 2004 (Tabela 1 e Figura 28).

16 O código 5208707 é o da cidade de Goiânia, no cadastro de cidades do IBGE.

Page 92: Dissertação Giovanni - Revisões Feitas

79

Foi feito um estudo comparativo dos dados que não serão utilizados durante a

análise dos dados.

Ano Existente Após seleção % Perda 2001 6.709 6.178 7,91%2002 17.639 16.617 5,79%2003 8.236 7.577 8,00%2004 3.410 3.301 5,60%Total 35.994 33.673 -

7DEHOD�����7RWDO�GH�UHJLVWURV�DQWHV��GHSRLV�GD�VHOHomR�H�D�SHUGD�

)LJXUD����7RWDO�DQXDO�GH�UHJLVWURV�GH�'HQJXH��6,1$1��*RLkQLD������������O porcentual de perda, na Tabela 1, refere-se aos casos registrados de

pacientes de outras cidades, que realizaram exames na cidade de Goiânia, além de

casos no qual o campo CON_CLASSI eventualmente não está preenchido.

O percentual representativo de cada ano, na base, foi calculado e

representado na Figura 29. Constatou-se que o ano 2002, considerado epidêmico

em todo Brasil, (SIQUEIRA JÚNIOR, 2005), apresentou maior percentual, em

relação aos outros anos analisados17.

17 Os dados referentes a 2004 são até o fim do mês de abril.

Page 93: Dissertação Giovanni - Revisões Feitas

80

)LJXUD����±�3HUFHQWXDO�DQXDO�GH�UHJLVWURV�GH�'HQJXH��DSyV�VHOHomR���6,1$1��*RLkQLD��-DQ������D�$EU������b) O total de cada tipo de Dengue, em cada prontuário, foi somado de acordo

com o preenchimento do atributo CON_CLASSI; os valores nulos, que

descartaram infecção e os não preenchidos, foram eliminados dessa análise,

representada na Figura 30.

)LJXUD������7LSRV�H�SHUFHQWXDO�GH�GHQJXH��*RLkQLD�������D������Através da Figura 30, pode-se relatar que o percentual de casos notificados

de FHD é baixo, em comparação aos notificados do tipo clássico de dos

confirmados que apresentaram alguma complicação.

c) O atributo DENGUE foi totalizado de acordo com suas respostas e,

através delas, o seu percentual calculado; os valores nulos, que descartaram

Page 94: Dissertação Giovanni - Revisões Feitas

81

infecção e os não preenchidos, foram eliminados da análise.

)LJXUD����±�3HUFHQWXDO�GR�WRWDO�GDV�UHVSRVWDV�QR�FDPSR�'(1*8(�GR�6,1$1��*RLkQLD������������A partir da Figura 31, pode-se relatar que o porcentual de casos, nos quais o

paciente não teve contato anterior com o Dengue, é superior aos que o próprio

entrevistado admite não saber se já havia apresentado a doença ou ainda aos que

afirmou ter sido infectado. Esse relato reforça a idéia de que o vírus se dissemina

(através do vetor), em sua maioria, dentre as pessoas que não apresentaram

infecção prévia.

d) O atributo VACINADO foi totalizado de acordo com suas respostas e,

através delas, o seu percentual calculado. Os valores nulos, que descartaram

infecção e não preenchidos, foram eliminados da análise.

De acordo com a Figura 32, pode-se relatar que o porcentual de casos

confirmados, no qual o paciente já foi vacinado contra Febre Amarela, é superior

aos casos em que ele não foi vacinado ou não sabe responder à pergunta. Através

da análise desses dados, é possível concluir que boa parcela dessa população já

está imunizada contra a Febre Amarela, o que justifica a não apresentação de casos

confirmados da doença, pelo SINAN.

Page 95: Dissertação Giovanni - Revisões Feitas

82

)LJXUD������3HUFHQWXDO�GR�WRWDO�GDV�UHVSRVWDV�QR�FDPSR�9$&,1$'2��6,1$1��*RLkQLD������������No atributo CON_CLASSI, os valores de 1 a 4, referentes à tipificação

positiva de Dengue, foram convertidos para SIM; o valor 5, referente ao descarte

para NÃO e os valores nulos ou não preenchidos, foram eliminados das análises

que se sucederam.

Na análise da amálgama das tabelas 0'(1*8( e

&$5$&7(5,67,&$6%$,55266(3/$1 surgem as seguintes informações�O gênero dos pacientes com presença do SIM, no atributo (campo) CON_CLASSI,

foi totalizado e comparado ao gênero da somatória da população, com amostragem feita

pelo IBGE, em 2000, como pode ser visto na Figura 33(a).

Na pesquisa do IBGE (2000), a diferença percentual é de quatro vírgula oito

pontos percentuais, em relação aos gêneros, como pode ser demonstrado através da

Figura 33(a), enquanto na totalização do SINAN, a diferença totalizou treze

vírgula cinqüenta e dois pontos percentuais, como visto na Figura 33(b). Foram

encontrados dezessete casos, nos quais o sexo não está preenchido Esses registros

não apresentam percentual representativo (0,06%) da base e não foram eliminados

das pesquisas que se seguiram.

Page 96: Dissertação Giovanni - Revisões Feitas

83

)LJXUD������3HUFHQWXDO�SRU�JrQHUR�HP�*RLkQLD��,%*(��������D���3HUFHQWXDO�SRU�JrQHUR�QD�DQiOLVH�GR�6,1$1��*RLkQLD�������D������

Algumas das hipóteses que poderiam ser formuladas para explicar essa

possível diferença de taxas de ataque de Dengue com relação ao sexo são: �D� grupos que permanecem mais tempo dentro do ambiente domiciliar e/ou ambiente

de trabalho e/ou escolar, possuem uma probabilidade maior de infecção/doença;

�E� demanda espontânea dos serviços de saúde que dispõe de atendimento

preferencial à saúde da mulher18.

a) O total de pacientes com presença do SIM, no campo CON_CLASSI, foi

totalizado por bairro e comparado à última amostragem feita pelo IBGE, em 2000.

Na Figura 34, o número de casos confirmados notificados, apresentou

relação, considerada forte, com o número de habitantes relatado pelo IBGE (2000

18 Hipóteses também levantadas por Maciel (1999, p. 66) em sua dissertação de mestrado.

Page 97: Dissertação Giovanni - Revisões Feitas

84

DSXG SEPLAN 2002). Os bairros que apresentaram, em 2000, os maiores números

na população, apresentam, no período pesquisado, o maior número de casos

confirmados. Esse relato levanta a necessidade de trabalhos futuros detalhados e

específicos sobre a ocorrência de Dengue em altas densidades populacionais,

naquela cidade.

)LJXUD����±�&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�Q~PHUR�GH�KDELWDQWHV�SRU�EDLUUR��*RLkQLD�������D������b) O percentual de pacientes, por faixa etária, com presença do SIM no

campo CON_CLASSI, foi totalizado por ano, de acordo com as faixas existentes

na publicação do IBGE, na última amostragem realizada em Goiânia, no ano de

2000.

Na Figura 35, o número de casos confirmados notificados, apresentou relação

de ocorrência (ataque), considerada forte, nos anos pesquisados. As faixas com

maior percentual de ataque foram respectivamente: 20 a 29, 10 a 19 e 30 a 39 anos,

o que caracteriza um padrão de alto risco de infecção, para população jovem, em

Goiânia, nesse período.

Em Goiânia, a predominância relatada por Maciel (1999, p.65), foi relativa às

faixas etárias de 20 a 29 e 30 a 39 anos, enquanto e Siqueira Junior (2001, p.12)

relatou maior ocorrência nas faixas de 30 a 39 e 40 a 49 anos. Esses relatos de

ataque desiguais, no mesmo local de estudo e sobre a mesma doença, indicam que

ela atacou faixas etárias diferentes, em períodos históricos diferentes.

Page 98: Dissertação Giovanni - Revisões Feitas

85

)LJXUD����±�3HUFHQWXDO�GH�IDL[D�HWiULD�SRU�DQR��6,1$1��*RLkQLD������������c) O percentual por gênero e faixa etária, com presença do SIM no campo

CON_CLASSI, foi totalizado, nos anos de doação, de acordo com as faixas

existentes na publicação do IBGE, na última amostragem feita em Goiânia, no ano

de 2000, conforme pode ser visto na Figura 36(a). Esse resultado foi comparado

com o percentual obtido, através de pesquisas da SINAN, naquela cidade, por

gênero - Figura 36(b).

Na Figura 36, embora os gêneros apresentem percentuais muito próximos, na

avaliação do IBGE em 2000, o número de casos confirmados notificados, por

gênero e faixa etária, apresentou diferenças significativas nas idades em que

ocorrem os maiores ataques (20 a 29, 30 a 39 anos e 40 a 49 anos).

Page 99: Dissertação Giovanni - Revisões Feitas

86

)LJXUD����±�3HUFHQWXDO�SRU�IDL[D�HWiULD�±�*RLkQLD��,%*(��������D���H��3HUFHQWXDO�GH�FDVRV�FRQILUPDGRV�GH�GHQJXH�±�*RLkQLD��6,1$1�������D������

Na análise dos dados das tabelas 0'(1*8( e

&$5$&7(5,67,&$6%$,5526&20'$7$ surgem as seguintes informações:

a) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi totalizado o número de cemitérios existentes e comparado ao número de casos

confirmados, no período de doação, conforme representado na Figura 37.

O número de casos confirmados apresentou relação considerada fraca, com o

número de cemitérios por bairro. Nos dois bairros, onde existem cemitérios, os

relatos são considerados de baixas proporções (aproximadamente 220 casos em

quatro anos).

Page 100: Dissertação Giovanni - Revisões Feitas

87

)LJXUD����±�&DVRV�FRQILUPDGRV�GH�'HQJXH�SRU�EDLUURV�YHUVXV�FHPLWpULRV�H[LVWHQWHV��*RLkQLD������������b) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi calculado o percentual de lotes sem construção (i.e. lotes baldios ou vagos) e

comparado ao número de casos confirmados, no período de doação. O

comparativo pode ser visto na Figura 38.

)LJXUD����±�&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�SHUFHQWXDO�GH�ORWHV�YDJRV�SRU�EDLUURV��*RLkQLD������������

O número de casos confirmados notificados apresentou relação considerada

forte, com os menores percentuais de lotes vagos. De forma genérica, pode-se

afirmar que os bairros que apresentaram os menores percentuais de lotes vagos,

são os que apresentam maiores relatos de casos confirmados. O relato reforça a

necessidade de trabalhos futuros detalhados e específicos, dada a ocorrência de

Dengue, nos locais de alta densidade populacional, naquela cidade.

Page 101: Dissertação Giovanni - Revisões Feitas

88

c) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi calculado o percentual representativo de área verde existente e comparado ao

número de casos confirmados, no período de doação. O comparativo pode ser

visto na Figura 39.

)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�SHUFHQWXDO�GH�iUHD�YHUGH�SRU�EDLUUR��*RLkQLD������������O número de casos confirmados apresentou relação considerada forte com os

menores percentuais de área verde por bairro, ou seja, de forma genérica, a partir

da Figura 39 pode-se relatar que os bairros com os menores percentuais de área

verde são os que apresentam mais relatos de casos confirmados. Este relato

demonstra a necessidade de trabalhos futuros, detalhados e específicos, dada a

ocorrência de Dengue nas altas densidades populacionais, em Goiânia. Surge,

também, outro trabalho futuro interessante: quais as diferenças entre os bairros que

apresentam baixo e alto número de casos, mas possuem densidades similares,

aproximadas, de área verde?

d) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado, por bairro, no período de doação. Para cada bairro,

foi computado o número de feiras livres semanais e comparado ao número de

casos confirmados, no período de doação. Este comparativo pode ser visto na

Figura 40.

Page 102: Dissertação Giovanni - Revisões Feitas

89

)LJXUD�����&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�Q~PHUR�GH�IHLUDV�OLYUHV�VHPDQDLV�SRU�EDLUUR��*RLkQLD������������

O número de casos confirmados apresentou relação considerada fraca com o

número de feiras livres, por bairro.

e) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi computada a quantidade de hospitais e comparada ao número de casos

confirmados. Este comparativo pode ser visto na Figura 41.

)LJXUD������&DVRV�FRQILUPDGRV�GH�GHQJXH�YHUVXV�TXDQWLGDGH�GH�KRVSLWDLV�SRU�EDLUUR��*RLkQLD������������O número de casos confirmados apresentou relação considerada fraca, com o

número de hospitais, por bairro. Os cinco bairros com mais de cinco hospitais,

apresentam relatos semelhantes ou inferiores aos que relataram números similares

ou superiores de casos.

Page 103: Dissertação Giovanni - Revisões Feitas

90

f) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi computada a quantidade de escolas existentes e comparada ao número de casos

confirmados, no período de doação. Este comparativo pode ser visto na Figura 42.

)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�TXDQWLGDGH�GH�HVFRODV��*RLkQLD�������������Pode-se relatar, pela análise da Figura 42, que os quatro bairros com mais de

dez hospitais apresentaram números de casos confirmados, semelhantes aos bairros

que não possuem o mesmo número de hospitais.

g) O número de casos confirmados, com presença do SIM no campo

CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,

foi computada a quantidade de escolas existentes e comparada ao número de casos

confirmados, no período de doação. Este comparativo pode ser visto na Figura 43.

Pode-se relatar, pela análise da Figura 43, que os sete bairros com mais de

cinqüenta prédios, apresentam relatos semelhantes aos dos bairros que não

possuem o mesmo número de prédios e, portanto, é considerada uma relação fraca.

Page 104: Dissertação Giovanni - Revisões Feitas

91

)LJXUD������&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�TXDQWLGDGH�GH�SUpGLRV�SRU�EDLUUR��*RLkQLD�������������Na análise da amálgama das tabelas 0'(1*8(��6(0$1$(3,�e��',60( surgem

as seguintes informações:

a) O percentual de casos confirmados (i.e. com presença de SIM no campo

CON_CLASSI), nos anos de doação 2001, 2002 e 2003, após a seleção e de

acordo com o calendário do SINAN, foi calculado pela respectiva semana

epidemiológica e está representado na Figura 44.

)LJXUD����±�3HUFHQWXDO�GH�FDVRV�FRQILUPDGRV�SRU�VHPDQD�HSLGHPLROyJLFD��*RLkQLD�������D������A Figura 44 demonstra que o maior número de registros de casos, ocorreu

nas semanas epidemiológicas 01 a 20 de 2002. A tendência de concentração de

casos nessas semanas, embora não tão acentuada, pode ser observada também nos

anos subseqüentes, indicando sazonalidade de ocorrência dos casos de dengue, no

Page 105: Dissertação Giovanni - Revisões Feitas

92

mesmo período histórico. A mesma tendência de concentração de casos em 2002,

embora em menor escala, pode ser observada nas semanas 43 a 52.

O ano 2002, naquela cidade, apresentou maior índice pluviométrico (em

relação a 2001, 2003 e 2004) e a entrada de um tipo diferente do vírus (Den-3),

para o qual a população não possuía resistência. Esses dois fatores podem ser

vistos como hipóteses para justificar a ocorrência do surto ocorrido naquele ano.

b) O número de casos confirmados, após a seleção por semana

epidemiológica, foi totalizado. Para cada semana epidemiológica, foi feita, em

relação a cada parâmetro climático, a média climática de duas semanas (definida DSULRUL) relativas ao período mínimo que o vetor necessitaria para se desenvolver e

ter capacidade de disseminar o vírus. Foi feito o estudo visual (através de gráficos)

dos anos e das variáveis climáticas que pudessem ter relação com o surto, em cada

ano.

A série temporal completa, dos casos confirmados de Dengue no período de

doação, pode ser vista na Figura 45. Para possibilitar a visualização da influência sazonal

dos parâmetros climáticos em relação aos casos confirmados de Dengue, a série temporal

foi dividida em quatro anos distintos.

Page 106: Dissertação Giovanni - Revisões Feitas

93

6pULH�WHPSRUDO�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH�GH�DFRUGR�FRP�R�FDOHQGiULR�LQWHUQDFLRQDO�GR�6,1$1��*RLkQLD�*R�����������

0

200

400

600

800

1000

1200

1400

1600

1800

S01

S03

S05

S07

S09

S11

S13

S15

S17

S19

S21

S23

S25

S27

S29

S31

S33

S35

S37

S39

S41

S43

S45

S47

S49

S51

S01

S03

S05

S07

S09

S11

S13

S15

S17

S19

S21

S23

S25

S27

S29

S31

S33

S35

S37

S39

S41

S43

S45

S47

S49

S51

S01

S03

S05

S07

S09

S11

S13

S15

S17

S19

S21

S23

S25

S27

S29

S31

S33

S35

S37

S39

S41

S43

S45

S47

S49

S51

S01

S03

S05

S07

S09

S11

S13

S15

S17

6HPDQDV�HSLGHPLROyJLFDV

&DVRV�GH�'HQJXH

)LJXUD����±�6pULH�WHPSRUDO�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH��*RLkQLD�������D�����

Page 107: Dissertação Giovanni - Revisões Feitas

94

Em relação a 2001, os gráficos desenvolvidos foram representados em um quadro,

no qual cada gráfico recebeu uma letra como identificação:

4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������

No Quadro de gráficos 1, relativo a 2001, o gráfico A representa a influência dos

casos em relação à chuva (índice pluviométrico); o B, em relação à média da umidade

relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação à média

da URA máxima; o E, em relação à média da temperatura média diária; o F, em relação à

média da temperatura máxima diária; o G, em relação à média da temperatura mínima

Page 108: Dissertação Giovanni - Revisões Feitas

95

diária e, finalmente, o H, em relação à média da amplitude térmica diária.

Em relação a 2002, os gráficos desenvolvidos foram representados em um quadro,

no qual cada gráfico recebeu uma letra como identificação:

4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������

No Quadro de gráficos 2, relativo ao ano 2002, o gráfico A representa a influência

dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);

o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,

em relação à média da temperatura média diária; o F, em relação à média da temperatura

máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,

Page 109: Dissertação Giovanni - Revisões Feitas

96

em relação à média da amplitude térmica diária.

Em relação a 2003, os gráficos desenvolvidos foram representados em um quadro,

no qual cada gráfico recebeu uma letra como identificação:

4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������

No Quadro de gráficos 3, relativo ao ano 2004 (até o período de doação), o gráfico

A representa a influência dos casos em relação à chuva; o B, em relação à média da

umidade relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação

à média da URA máxima; o E, em relação à média da temperatura média diária; o F, em

relação à média da temperatura máxima diária; o G, em relação à média da temperatura

mínima diária e, finalmente, o H, em relação à média da amplitude térmica diária.

Page 110: Dissertação Giovanni - Revisões Feitas

97

Em relação a 2004, os gráficos desenvolvidos foram representados em um quadro,

no qual cada gráfico recebeu uma letra como identificação:

4XDGUR�GH�JUiILFRV�����&DVRV�FRQILUPDGRV�GH�'HQJXH�YHUVXV�PpGLDV�GH�YDULiYHLV�FOLPiWLFDV�GH������

No Quadro de gráficos 4, relativo ao ano 2004, o gráfico A representa a influência

dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);

o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,

em relação à média da temperatura média diária; o F, em relação à média da temperatura

máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,

em relação à média da amplitude térmica diária.

Cabe novamente ressaltar que, no ano de 2002, considerado epidêmico em todo

Page 111: Dissertação Giovanni - Revisões Feitas

98

Brasil (SIQUEIRA JÚNIOR et al., 2005), houve a tipificação (detecção) laboratorial do

Den-3, na cidade de Goiânia (tipo de vírus a que a população não tinha resistência). A

variável climática que apresentou maior similaridade com a curva dos casos confirmados

de Dengue notificados, foi o índice pluviométrico, que naquele ano, teve médias

superiores aos anos de 2001, 2003 e 2004.

A Figura 46 demonstra o percentual de casos confirmados por semana

epidemiológica.

Para classificar os períodos endêmicos (baixa concentração de casos) e epidêmicos

(alta concentração de casos) correspondentes aos casos pesquisados de Dengue, foi

necessário o auxílio dos meteorologistas do 10º DISME. Esses meteorologistas

auxiliaram a adaptar a escala anemométrica de %HDXIRUW (Anexo E), a partir da publicação

de Vianello e Alves (1991).

De forma genérica, essa escala foi adaptada para os países de clima temperado e/ou

tropical (Anexo E). A partir de então, os parâmetros climáticos foram classificados,

conforme a característica apresentada nas 178 semanas epidemiológicas, relativas à tabela

6(0$1$(3,. Essa classificação está representada no Quadro 8 e demonstra a influência

sazonal sobre doença. O índice pluviométrico (PD) foi principal parâmetro climático de

influência, durante aquele período, em Goiânia, com a média de duas semanas.

Nos anos analisados, de forma genérica, as semanas epidemiológicas 01 a 20 e 37 a

52 apresentaram maior número de casos, enquanto as semanas 21 a 36, o menor número

de casos. A variável climática que sofre maior alteração é o PD; outras variáveis, como

URA e TEMP, também apresentam influência sazonal. Nas semanas 21 a 36, ela está

com valor igual ou muito próximo de zero (ausência de chuva), enquanto nas outras

semanas, com valores que indicam presença de chuva (> 1,1mm/h).

4XDGUR����&ODVVLILFDomR�GRV�SHUtRGRV�HQGrPLFRV�H�HSLGrPLFRV�GH�*RLkQLD�DQRV������D������Variável climática Períodos endêmicos Períodos epidêmicos

PD Chuvisco fraco Chuva fraca/chuva moderadaURA Desconfortável ou confortável Confortável ou muito úmido URAMIN Desconfortável ou estado de

atenção Confortável

URAMAX Confortável Muito úmido TEMP Clima tropical e subtropical Clima equatorial

Page 112: Dissertação Giovanni - Revisões Feitas

99

TEMPMIN Clima tropical e subtropical Clima tropical e subtropical TEMPMAX Clima tropical e subtropical Clima tropical e subtropical AMPLITUDE Clima tropical e subtropical Clima tropical e subtropical

������ 4XDOLGDGH�GRV�GDGRV�Nessa fase, são listados os resultados da verificação da qualidade dos dados do

SINAN, 10º DISME, COMDATA, SEPLAN, Departamento de Vigilância Sanitária e

Departamento de Epidemiologia.

Para preparação dos dados para mineração, os problemas encontrados são tratados

de forma ética e não devem comprometer o resultado esperado. Assim, os registros

atributos com valor faltante, foram descartados da análise e as falhas encontradas no

cadastro foram selecionadas de acordo com os bancos e cronologia abaixo:

a) Historicamente, o cadastro do SINAN (tabela 0'(1*8(), após sua

informatização, vem sofrendo, a cada dia, aperfeiçoamentos, de forma a manter

maior qualidade de informação. As falhas referentes ao cadastro foram: ��� No

campo CS_SEXO, aproximadamente 0,06% registros estavam sem

preenchimento; ��� No campo CON_CLASSI, aproximadamente 6,7% registros

estavam com o valor nulo.

b) O cadastro dos dados meteorológicos realizado pelo 10º DISME (tabela

10DISME), na cidade de Goiânia, não apresentou falhas significativas que

comprometessem sua análise.

c) Historicamente, a SEPLAN mantém o cadastro dos dados relativos aos

bairros oficiais de Goiânia. As atualizações são realizadas no momento em que a

homologação de uma lei torna um bairro oficial e reconhecido. Algumas vezes o

bairro existe na forma de um aglomerado de casas e já possui até mesmo asfalto,

energia elétrica, água e esgoto encanados, mas, ainda assim, o bairro não é

reconhecido. Outras vezes o bairro é homologado, as ruas abertas e asfaltadas,

instalações sanitárias e elétricas implantadas e, mesmo assim, não possui nenhum

morador.

d) A COMDATA, empresa do Município de Goiânia, desenvolve diversos

sistemas e mantém o cadastro dos dados relativos às atividades desse Município.

Page 113: Dissertação Giovanni - Revisões Feitas

100

Esses cadastros vêm sendo, diariamente, aperfeiçoados e atualizados, mantendo,

assim, maior qualidade de informação. As falhas encontradas referentes à doação

foram:

I. Não existe padronização entre o nome dos bairros contidos nessa base e

os bairros contidos na publicação da SEPLAN (2002). Para a

associação das bases, foi necessária a criação de uma tupla e a

associação manual, bairro a bairro, entre as tabelas;

II. Existem 223 regiões (bairros) nessa listagem, mas ausentes na

publicação da SEPLAN (2002). Essas regiões condizem, em sua

maioria, a: ��� espaços geográficos a serem povoados (i.e. glebas); ��� Fazendas ou zonas rurais que estão no perímetro urbano; ��� áreas ainda

não reconhecidas como bairros.

e) O Departamento de Controle de Zoonoses realizou, no período estudado,

a tomada do vetor Goiânia e mantém o cadastro dos dados levantados, em

planilhas do aplicativo 0LFURVRIW� ([FHO. As falhas encontradas, referentes ao

cadastro, foram:

I. Não existe padronização entre o nome dos bairros dessa base e os

contidos na publicação da SEPLAN ou nas bases da COMDATA; para

a associação das três bases foi necessária a criação de uma tupla e a

associação manual, bairro a bairro, entre as tabelas;

II. Foram encontrados cerca de trinta bairros (regiões) que não constam em

nenhum dos dois cadastros (SEPLAN ou COMDATA), além dos

nomes dos bairros existentes não seguirem nenhum tipo de padrão, na

sua utilização. Essa base, mesmo depois de totalmente digitada,

associada e conferida, não pôde ser utilizada neste trabalho.

f) O Departamento de Vigilância Sanitária doou, no período estudado, o

calendário epidemiológico do SINAN, em forma de relatório (Anexo D) que,

depois de digitado (tabela 6(0$1$(3,), foi utilizado em toda a pesquisa.

Page 114: Dissertação Giovanni - Revisões Feitas

101

������ $VSHFWRV�GD�*&�QR�HQWHQGLPHQWR�GRV�GDGRV�A fase de entendimento dos dados do modelo CRISP-DM está relacionada à

aquisição, seleção e validação do conhecimento. No aspecto organizacional, os

especialistas e publicações recentes (H�J� ALVARENGA, OLIVEIRA JUNIOR,

CARVALHO, 2003; OMS, 2003, 2004, dentre outras) desempenham papel importante, à

medida que determinam os caminhos para identificação e validação dos dados

necessários para a mineração. Já no entendimento dos dados, os especialistas são

provocados, através de processos mentais complexos, para a elaboração de novas idéias

que se tornarão conhecimento útil, para resolução de problemas.

Sem as publicações recentes, não seria possível capturar os requisitos, desde os

dados até o conhecimento para sua avaliação, necessários para solução do problema.

���� 3UHSDUDomR�GRV�GDGRV�Nessa fase e a partir do entendimento dos dados, são gerados os conjuntos que

serão submetidos à ferramenta de análise. Antes de submetê-los, é feita a limpeza dos

dados inconsistentes e faltantes, além da totalização dos casos confirmados e respectivas

médias das variáveis climáticas, de acordo com o calendário do SINAN, adotado para

esta pesquisa.

De acordo com o calendário do SINAN, as semanas epidemiológicas dos anos

2001, 2002 e 2004 têm 52 divisões, já o ano 2003 tem 53 divisões. Para que não haja a

exclusão da semana 53, do ano 2003, foi considerada como a semana um de 2004.

São gerados, na tabela &/$66,),&$'25),1$/, basicamente, os seguintes

conjuntos de dados: �D� total de casos confirmados - originário da tabela de 0'(1*8(,

com dados que não permitem a identificação do paciente; �E� cinqüenta e dois campos

binários indicando qual das semanas epidemiológicas está sendo analisada; �F� média (de

duas semanas) em relação a cada variável climática observada – originária da tabela

10DISME. Esse layout pode ser visto no Quadro 9.

4XDGUR�����'LFLRQiULR�GH�GDGRV�GD�WDEHOD�&/$66,),&$'25),1$/�Nome do campo Tipo TamanhoDescrição

NCASOSPOSITIVOS Inteiro 5 Número de casos Notificados

NCASOSPREVISTOS Inteiro 5 Número de casos Previstos

Page 115: Dissertação Giovanni - Revisões Feitas

102

S01 ... S52 Lógico 1 Sem. Epidemiológica 01 a 52

PD Inteiro 3 Índice pluviométrico

URA Real 6 Umidade relativa do ar

URAMIN Real 6 Umidade relativa do ar mínima

URAMAX Real 6 Umidade relativa do ar máxima

TEMP Real 6 Temperatura média

TEMPMAX Real 6 Temperatura máxima

TEMPMIN Real 6 Temperatura mínima

AMPLITUDE Inteiro 3 Amplitude térmica

A média dos atributos climáticos seguiu os valores comuns à escala anemométrica

de %HDXIRUW (VIANELLO; ALVES 1991). Assim sendo, PD foi arredondado sem casas

decimais e as médias de URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN e

AMPLITUDE, foram arredondados com duas casas decimais. O valor contido no campo

NCASOSPREVISTOS é o seguinte ao NCASOSPOSITIVOS atual.

���� 0RGHODJHP�No CRISP-DM, a modelagem é a fase em que se escolhe a técnica de mineração de

dados e que apresenta forte interação com a fase de preparação. Acrescenta-se a isso, a

técnica escolhida, que pode ter implicações na formatação dos dados. A técnica de

modelagem a ser utilizada neste trabalho é a de predição, que se destinará à estimativa do

número de casos confirmados, na semana subseqüente à atual.

A predição foi escolhida como técnica, em virtude da necessidade de encontrar

modelos que fossem capazes de estimar, com certa margem de confiança, o número de

casos confirmados de Dengue, em uma cidade. Essa predição possibilita aos gestores, a

destinação de recursos humanos e financeiros para análise das áreas de ocorrência e do

perfil dos pacientes infectados.

Essa simples análise pode fornecer as bases para melhorar o atendimento aos

pacientes além, é claro, do combate ao vetor, nos pontos mais críticos de ocorrência, em

uma cidade. Ações de planejamento podem ser implementadas, por exemplo, através da

localização manual dos casos do SINAN e da análise das últimas N semanas (à escolha

do gestor), em uma ferramenta de Sistema de Informação Geográfica.

Page 116: Dissertação Giovanni - Revisões Feitas

103

Foi escolhida a técnica de janelamento de RNAs, por sua capacidade de predição e

pelas existência de diversas obras publicadas. A aplicação dessa técnica consiste em usar,

como entradas de rede, “uma seqüência de valores passados (janela de tempo), da

grandeza que se deseja prever” (ALVARENGA, OLIVEIRA JUNIOR, CARVALHO

2003, p.14).

Para se utilizar a técnica de janelamento precisamos definir as seguintes variáveis

(BRAGA, LUDERMIR, CARVALHO, 2000, p.227):

a) A janela de entrada utiliza um conjunto de valores passados que serão as

entradas da rede neural; por exemplo, 15 valores;

b) A janela de saída utiliza o valor da série com W passos à frente; por exemplo, três

passos à frente;

c) Uma ou um conjunto de variáveis explicativas que podem ajudar no

treinamento da rede; por exemplo, dia, mês ou ano da entrada W�

A Figura 46 é o diagrama de controle, até a semana epidemiológica 16 do ano 2004,

feito pela Divisão de Epidemiologia da Secretaria Municipal de Saúde de Goiânia.

Os dados, contidos na Figura 46, doados em forma de planilha 0LFURVRIW� ([FHO� foram transpostos para a Tabela 2 e analisados. O número de casos previstos foi

comparado ao número de casos notificados, e a tendência de alta ou queda, foi avaliada,

através do acerto apresentado na série.

)LJXUD����±�'LDJUDPD�GH�FRQWUROH�GH�'HQJXH�SRU�VHPDQD�HSLGHPLROyJLFD��606*2��*RLkQLD�������

Page 117: Dissertação Giovanni - Revisões Feitas

104

7DEHOD�����$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR�IHLWD�DWUDYpV�GR�'LDJUDPD�GH�&RQWUROH�GD�6HFUHWDULD�0XQLFLSDO�GH�6D~GH�GH�*RLkQLD���*RLiV�������

Resultados Tendência semana/2004previstos notificados % erro real predita acerto S02 25,3 91 259,68 Alta Alta Ok S03 35,8 109 204,47 Alta Alta Ok S04 43 144 234,88 Queda Alta - S05 37,5 217 478,67 Queda Queda Ok S06 36,8 205 457,07 Queda Queda Ok S07 35,8 188 425,14 Alta Queda - S08 37,8 160 323,28 Queda Alta - S09 37,7 165 337,67 Alta Alta Ok S10 42,8 179 318,22 Queda Queda Ok S11 38,2 139 263,87 Alta Alta Ok S12 44,5 203 356,18 Queda Queda Ok S13 42,7 179 319,20 Queda Queda Ok S14 33,8 142 320,12 Alta Queda - S15 44 128 190,91 Queda Alta - S16 43,5 148 240,23 Queda Queda Ok S17 33,3 136 308,41 - - -

Depois da análise dos resultados da predição versus os casos notificados, através do

percentual de erro, analisou-se a tendência, na Tabela 2. Com isso, a taxa de erro

encontrada na tendência foi de 40% e o erro padrão na previsão de 127,2.

Da tabela eletrônica &/$66,),&$'25),1$/, oriunda do aplicativo 0LFURVRIW�$FFHVV� foram selecionados 60 atributos preditivos: NCASOSPOSITIVOS, S01, S02,

...S52, PD, URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN,

AMPLITUDE. A classe alvo desta tabela é o campo NCASOSPREVISTOS.

Esta tabela foi importada para o 0LFURVRIW� ([FHO e convertida para o formato

&RPPD� 6HSDUDWHG� 9DOXH (CSV). Após a conversão, o arquivo resultante foi editado,

através do aplicativo 7H[WSDG19� e todas as vírgulas substituídas por pontos.

Os testes foram realizados na forma de estudos, aqui chamados de rodada de testes,

através dos quais, os parâmetros climáticos foram testados em relação ao número de

casos confirmados, naquela semana epidemiológica. Cabe relembrar que, no caso desses

estudos, o que se prediz é o número de casos confirmados e não de casos notificados, o

que indica granularidade superior à da técnica de Diagrama de Controle.

19 Download gratuito através do link ftp://download.textpad.com/pub/textpad4.7/txpptb473.exe

Page 118: Dissertação Giovanni - Revisões Feitas

105

Na primeira rodada de testes, foram testadas as seguintes arquiteturas, em relação

aos casos confirmados: �D� sem nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA,

AMPLITUDE; �I� PD, AMPLITUDE; �J�� PD, URA, URAMIN, URAMAX, TEMP,

TEMPMIN, TEMPMAX, AMPLITUDE.

Utilizou-se o (DV\11�SOXV����� com a seguinte configuração, para todos os testes:

aprendizado de 0,7, momentum 0,9, erro desejado (alvo) 0,02 e valores otimizados pelo

aplicativo.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa

série, apresenta os dados, assim organizados e divididos:

a) As 33.673 instâncias referentes à tabela 0'(1*8( foram agrupadas e

contabilizadas, de acordo com o calendário de semanas epidemiológicas do

SINAN. Esse agrupamento resultou em 173 instâncias.

b) Do total dos 36.081 casos de agravo, 33.673 (93,3% aproximadamente) eram

casos confirmados e 1.582, referentes a medidas climáticas diárias. Os dados

foram separados em treinamento (2001 e 2002), avaliação (2003) e teste (2004).

c) Para treinamento, foram utilizadas 106 instâncias, referentes aos anos de 2001,

2002. Para avaliação, foram utilizadas 53 instâncias, referentes a 2003. Na

predição, foram utilizadas 16 instâncias, referentes aos quatro primeiros meses

de 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta

cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na

camada de saída. O modelo está representado na Figura 47 e apresenta os seguintes

neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o

objetivo de auxiliar à rede a identificar os componentes sazonais da série;

• Um neurônio contendo o valor da observação PD;

• Um neurônio contendo o valor da observação URA;

Page 119: Dissertação Giovanni - Revisões Feitas

106

• Um neurônio contendo o valor da observação TEMP;

• Um neurônio contendo o valor da observação atual e,

• Um neurônio contendo o valor da observação, imediatamente posterior à

que se quer prever (predição semanal).

)LJXUD������$UTXLWHWXUD�GH�UHGH�XWLOL]DGD���QR�(DV\QQ�3OXV��SDUD�SUHGLomR�HSLGHPLROyJLFD�GH�'HQJXH�O gráfico da curva de aprendizado, no aplicativo utilizado, e com essa arquitetura,

está na Figura 48.

)LJXUD����±�*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�±�5RGDGD���

Os resultados obtidos nessa predição são mostrados na Tabela 3 e na Figura 49.

7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR�±�7pFQLFD���Resultados Tendência

semana/2004confirmados previstos % erro real predita acerto S02 96 39 59,38 Queda Alta - S03 73 32 56,16 Alta Alta Ok S04 102 34 66,67 Alta Alta Ok S05 123 39 68,29 Alta Queda -S06 198 46 76,77 QuedaAlta - S07 179 56 68,72 QuedaAlta - S08 163 43 73,62 QuedaQueda Ok S09 147 44 70,07 QuedaQueda Ok S10 130 33 74,62 Alta Queda -S11 154 37 75,97 QuedaQueda Ok S12 112 29 74,11 Alta Queda -

Page 120: Dissertação Giovanni - Revisões Feitas

107

S13 156 39 75,00 Queda Alta - S14 148 31 79,05 Queda Queda Ok S15 113 31 72,57 Queda Alta - S16 89 37 58,43 Alta Queda -S17 126 33 73,81 - - -

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro encontrada na tendência foi de 26,7% e o erro

padrão 101,8.

Na segunda rodada de testes, foi gerada uma massa de dados, na tentativa de

auxiliar o treinamento da rede. A lógica utilizada é a que se segue: nas dezesseis

primeiras semanas de 2004, o número de casos confirmados notificados totaliza

aproximadamente 56,4% do número encontrado em 2003. Se essas semanas de 2004

forem comparadas às de 2002, o decréscimo chega a aproximadamente 83,6%. Os

cálculos dão a noção de decréscimo do número de casos notificados de Dengue, em 2004,

ao menos em Goiânia, no período estudado. Parte de sua população, em 2002, adquiriu

resistência ao Den-3, após ocorrência de surto.

Em relação ao Brasil, de forma genérica, pode-se afirmar, a partir das Figuras 23 e

24, que: �D� antes de cada ano considerado epidêmico (1987, 1991, 1998, 2002), existe

um ano com tendência crescente do número de casos notificados; �E� sempre depois dos

anos considerados epidêmicos, há redução drástica no número de casos notificados; (b)

Page 121: Dissertação Giovanni - Revisões Feitas

108

em média, após quatro anos da ocorrência de um surto, outro ocorre.

A tática adotada visou gerar três anos com a função de ensinar a RNA que, após um

ano epidêmico, acontece queda brusca no número de casos. Para representar essas

informações para rede neural, foram consideradas as trinta e três mil, seiscentas e setenta

e três instâncias (i.e. casos confirmados) agrupadas e contabilizadas, segundo o

calendário do SINAN relativo ao período de estudo, o que resultou em 173 instâncias.

Para o primeiro ano, a fórmula de geração para os campos não binários é a que

se segue.

Sn é a somatória de i, variando de 1 a 3, dividida por 3. Os anos de origem foram

2001, 2002 e 2003.

Em relação ao segundo ano, a fórmula de geração para os campos não binários

é:

Sn é a somatória de i, variando de 1 a 2, dividida por 2. Os anos de origem

foram 2001 e 2003.

Para o terceiro ano, a fórmula de geração para os campos não binários segue a

seguinte seqüência: O número de casos confirmados recebeu o valor do ano 2003, menos

trinta por cento do mesmo campo, nessa tabela e as variáveis climáticas receberam os

valores da média dos anos gerados.

O treinamento dado à rede, pode ser visto no Quadro de gráficos 5, através do qual

vê-se exemplos da ocorrência de decréscimo brusco no número de casos, após um surto.

Page 122: Dissertação Giovanni - Revisões Feitas

109

4XDGUR�GH�JUiILFRV���±�7UHLQDPHQWR�SURSRVWR�±�5RGDGD���Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: �D� sem

nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa

série, apresenta os dados, assim organizados e divididos:

a) Para treinamento, foram utilizadas 260 instâncias, referentes aos anos de 2001 e

2002, ano de treinamento 1 e ano de treinamento 2;

b) Para avaliação, foram utilizadas 53 instâncias, referentes ano de 2003;

c) Na predição, foram utilizadas 17 instâncias, referentes aos quatro primeiros meses

do ano 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta

cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na

camada de saída. A arquitetura está representada na Figura 47. A camada de entrada

apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana) ,utilizados com o objetivo de

auxiliar a rede a identificar os componentes sazonais da série;

• Um neurônio contendo o valor da observação PD;

• Um neurônio contendo o valor da observação URA;

Page 123: Dissertação Giovanni - Revisões Feitas

110

• Um neurônio contendo o valor da observação TEMP;

• Um neurônio contendo o valor da observação atual;

• Um neurônio contendo o valor da observação, imediatamente posterior à

que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,

está na Figura 50.

)LJXUD���±�*UiILFR�GD�FXUYD�GH�DSUHQGL]DGR�±�5RGDGD���O erro alcançado, como pode ser visto na Figura 50, foi inferior ao desejado. Os

resultados obtidos, após o treinamento, são mostrados na Tabela 4 e na Figura 51.

7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR����5RGDGD���Resultados Tendência

Semana/2004 confirmadosprevistos % erro real predita acerto S02 96 34 64,58 Queda Alta - S03 73 64 12,33 Alta Alta Ok S04 102 145 42,16 Alta Alta Ok S05 123 161 30,89 Alta Queda -S06 198 145 26,77 QuedaAlta - S07 179 174 2,79 QuedaQueda Ok S08 163 173 6,13 QuedaQueda Ok S09 147 126 14,29 QuedaAlta - S10 130 143 10,00 Alta Alta Ok S11 154 152 1,30 QuedaQueda Ok S12 112 150 33,93 Alta Queda -S13 156 139 10,90 QuedaQueda Ok S14 148 118 20,27 QuedaQueda Ok S15 113 60 46,90 QuedaAlta - S16 89 109 22,47 Alta Queda -S17 126 76 39,68 - - -

Page 124: Dissertação Giovanni - Revisões Feitas

111

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�'HQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 46,7% e o erro padrão 35,7.

Na terceira rodada de testes, foi utilizada a mesma massa de dados existente na

primeira rodada. Dessa vez, cada valor dos parâmetros meteorológicos foi substituído

pela respectiva faixa da escala adaptada de %HDXIRUW.Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: �D� sem

nenhuma variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.

Utilizou-se o (DV\11�SOXV���� com a seguinte configuração, para todos os testes:

aprendizado de 0,7, momento 0,8, erro desejado (alvo) 0,02% e valores otimizados pelo

aplicativo.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa

série, apresenta os dado e foram assim organizados e divididos:

a) As 33.673 instâncias, referentes à tabela MDENGUE, foram agrupadas e

contabilizadas de acordo com o calendário de semanas epidemiológicas do SINAN. O

agrupamento resultou em 173 instâncias.

Page 125: Dissertação Giovanni - Revisões Feitas

112

b) Do total dos 36.081 casos de agravo, 33.673 eram casos confirmados e 1.582,

dados referentes a medidas climáticas diárias. Os dados foram separados em treinamento

(2001 e 2002), avaliação (2003) e teste (2004).

c) Para treinamento, foram utilizadas as 128 primeiras instâncias e para avaliação

foram utilizadas as próximas 28 instâncias. Na predição, foram utilizadas 16 instâncias,

referentes aos quatro primeiros meses de 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta

cinqüenta e seis neurônios, na camada de entrada, treze na camada intermediária e um, na

camada de saída. O modelo apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o

objetivo de auxiliar a rede a identificar os componentes sazonais da série;

• Um neurônio contendo a faixa da observação PD;

• Um neurônio contendo a faixa da observação URAMAX;

• Um neurônio contendo a faixa da observação TEMPMAX;

• Um neurônio contendo o valor da observação atual;

• Um neurônio contendo o valor da observação, imediatamente posterior à

que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,

está na Figura 52.

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após

o treinamento, são mostrados na Tabela 5 e na Figura 53.

Page 126: Dissertação Giovanni - Revisões Feitas

113

7DEHOD���±�$QiOLVH�GRV�UHVXOWDGRV�GD�SUHYLVmR����5RGDGD���Resultados Tendência

Semana/2004 confirmadosprevistos % erro real predita acerto S02 96 62 35,42 Queda Queda Ok S03 73 53 27,40 Alta Alta Ok S04 102 60 41,18 Alta Alta Ok S05 123 178 44,72 Alta Alta Ok S06 198 258 30,30 Queda Queda Ok S07 179 177 1,12 Queda Queda Ok S08 163 164 0,61 Queda Alta - S09 147 181 23,13 Queda Queda Ok S10 130 150 15,38 Alta Alta Ok S11 154 152 1,30 Queda Alta - S12 112 176 57,14 Alta Queda -S13 156 83 46,79 Queda Queda Ok S14 148 68 54,05 Queda Alta - S15 113 116 2,65 Queda Queda Ok S16 89 72 19,10 Alta Alta Ok S17 126 135 7,14 - - -

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 26,7% o erro padrão 43

aproximadamente.

Foi solicitada a Secretaria Municipal de Saúde de Goiânia a doação dos dados de

Dengue em todo o ano 2004. Todas as rodadas de testes foram novamente feitas, desta

vez, foram preditos os casos notificados de Dengue em Goiânia em todo ano de 2004.

Foram testadas as seguintes arquiteturas, com o (DV\11�SOXV� ��� na seguinte

configuração, para todos os testes: aprendizado de 0,7, momento 0,8, erro desejado (alvo)

Page 127: Dissertação Giovanni - Revisões Feitas

114

0,02% e valores otimizados pelo aplicativo.

Em relação aos casos notificados:

Com as médias climáticas: �D� sem nenhuma variável climática; �E� PD, URA,

TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD, URAMAX, TEMPMAX; �H� PD, URA,

AMPLITUDE; �I� PD, AMPLITUDE; �J�� PD, URA, URAMIN, URAMAX, TEMP,

TEMPMIN, TEMPMAX, AMPLITUDE.

Com a adaptação da estala de %HDXIRUW� feita nesta dissertação: �D� sem nenhuma

variável climática; �E� PD, URA, TEMP; �F� PD, URAMIN, TEMPMIN; �G� PD,

URAMAX, TEMPMAX; �H� PD, URA, AMPLITUDE; �I� PD, AMPLITUDE; �J��PD,

URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE; �K� PD,

PD_Beaufort, URA, URA_Beaufort, TEMP, TEMP_Beaufort,; �L� PD, PD_Beaufort,

URAMIN, URAMIN_Beaufort, TEMPMIN, TEMPMIN_Beaufort; �M� PD, PD_Beaufort,

URAMAX, URAMAX_Beaufort, TEMPMAX, TEMPMAX_Beaufort; �N� PD,

PD_Beaufort, URA, URA_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; �O� PD,

PD_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; �P��PD, PD_Beaufort, URA,

URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,

TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,

TEMPMAX_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort, �1�� PD, PD_Beaufort,

URA, URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,

TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,

TEMPMAX_Beaufort.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa

série, apresenta os dado e foram assim organizados e divididos:

a) As instâncias, referentes à tabela MDENGUE, foram agrupadas e contabilizadas

de acordo com o calendário de semanas epidemiológicas do SINAN. O agrupamento

resultou em 208 instâncias.

b) Para treinamento, foram utilizadas as 118 primeiras instâncias e para avaliação

foram utilizadas as próximas 38 instâncias. Na predição, foram utilizadas 526 instâncias,

referentes ao ano 2004.

Page 128: Dissertação Giovanni - Revisões Feitas

115

O modelo da rede que obteve os melhores resultados dessa série apresenta sessenta

e sete neurônios, na camada de entrada, doze na camada intermediária e um, na camada

de saída. O modelo apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o

objetivo de auxiliar a rede a identificar os componentes sazonais da série;

• Um neurônio contendo a faixa da observação PD;

• Um neurônio contendo a faixa da observação PD_Beaufort;

• Um neurônio contendo a faixa da observação URAMIN;

• Um neurônio contendo a faixa da observação URAMIN_Beaufort;

• Um neurônio contendo a faixa da observação URAMAX;

• Um neurônio contendo a faixa da observação URAMAX_Beaufort;

• Um neurônio contendo a faixa da observação TEMPMAX;

• Um neurônio contendo a faixa da observação TEMPMAX_Beaufort;

• Um neurônio contendo a faixa da observação TEMPMIN;

• Um neurônio contendo a faixa da observação TEMPMIN_Beaufort;

• Um neurônio contendo a faixa da observação TEMP_Beaufort;

• Um neurônio contendo a faixa da observação TEMP;

• Um neurônio contendo o valor da observação atual;

• Um neurônio contendo o valor da observação, imediatamente posterior à

que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,

está na Figura 52.

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���

Page 129: Dissertação Giovanni - Revisões Feitas

116

O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após

o treinamento, são mostrados na Figura 53.

)LJXUD����±�&DVRV�FRQILUPDGRV���SUHYLVWRV�GH�GHQJXH��*RLkQLD�������±�5RGDGD���Com essa análise, a taxa de erro na tendência foi de 47,1% e o erro padrão 56,9.

Neste mesmo período o diagrama de controle obteve a taxa de erro na tendência de 45,1%

e o erro padrão 88,3.

���� $SUHVHQWDomR�GRV�UHVXOWDGRV�A partir da metodologia CRISP-DM, foi possível gerar a amálgama (união) dos

bancos de dados e analisar o comportamento dos casos confirmados de dengue em

relação a diversas variáveis, aqui representada, de forma reduzida, nos Quadros 10 e 11.

O estudo dessas relações forneceu bases (LQVLJKWV) para diversos trabalhos futuros,

relatados no Capítulo 5 desta dissertação.

4XDGUR����±�$QiOLVH�GRV�FDVRV�FRQILUPDGRV�GH�'HQJXH��*RLkQLD�������D������Variável Informações

Tipos de dengue em Goiânia, 2001

a 2004

Clássico – 87,87%;

Dengue com complicações – 11,80%

FHD – 0,33%

Percentual das respostas no campo

DENGUE, SINAN, Goiânia, 2001

a 2004

Não havia apresentado infecção anterior –

88,23%;

Havia apresentado infecção anterior – 7,69%;

Ignorado – 3,81%

Page 130: Dissertação Giovanni - Revisões Feitas

117

Percentual das respostas no campo

VACINADO, SINAN, Goiânia,

2001 a 2004

Havia sido vacinado contra febre amarela–

77,44%;

Ignorado 14,96%;

Não havia sido vacinado – 7,61%

IBGE, Goiânia, 2000 SINAN, 2001 - 2004Percentual por gênero Homens 47,60% 43,21%

Mulheres 52,40% 56,73% Ignorados - 0,06%

4XDGUR����±�$QiOLVH�GRV�FDVRV�GH�GHQJXH�YHUVXV�YDULiYHO��*RLkQLD�������D������

Variável

Relação apresentada Autores que também

apresentam estas relações nesta cidade

Percentual por faixa etária Forte Maciel (1999), Siqueira Junior (2001)

Número de habitantes por bairro Forte -

Cemitérios por bairro Fraca - Menores percentuais de lotes vagos Forte - Menores percentuais de área verde Forte - Número de feiras livres semanais Fraca - Quantidade de hospitais por bairro Fraca - Quantidade de escolas por bairro Fraca - Quantidade de prédios por bairro Fraca - Influência sazonal Forte -

Com o auxílio de especialistas do 10º DISME, foi feita extensão (adaptação) da

escala anemométrica de %HDXIRUW (VIANELLO; ALVES, 1991). Investigou-se, a partir

dessa adaptação e através de gráficos, a influência sazonal sofrida pelo dengue, através da

média de duas semanas anteriores (definida D SULRUL) a cada semana epidemiológica, em

relação a cada variável climática. Seguindo essa descrição, foi possível analisar os

períodos com alta e baixa concentração de casos. Deve-se levar em consideração que para

cada cidade analisada, através dos passos descritos, os resultados apresentados podem ser

únicos.

Foi analisado o diagrama de controle da Divisão de Epidemiologia da Secretaria

Municipal de Saúde de Goiânia-Goiás, com formato no calendário de semanas

epidemiológicas, referente ao período entre 01/01/2004 e 30/04/2004. Os resultados

obtidos foram analisados e comparados, na Figura 54, com os de duas rodadas que

apresentaram melhores resultados e fornecem, com certa margem de confiança, suporte

Page 131: Dissertação Giovanni - Revisões Feitas

118

para predição de Dengue naquela cidade.

Reforça-se a necessidade de investimentos em recursos humanos e financeiros, para

realizar através de outros softwares e outras técnicas, os trabalhos relatados no Capítulo 5

desta dissertação.

)LJXUD����±�FRPSDUDomR�GDV�SUHGLo}HV�GDV�WpFQLFDV��GLDJUDPD�GH�FRQWUROH�H�PLQHUDomR�GH�GDGRV�SDUD�R�SHUtRGR�GH�GRDomR�

Page 132: Dissertação Giovanni - Revisões Feitas

119

� $QiOLVH�GRV�UHVXOWDGRV�Ao final da apresentação dos resultados, torna-se importante tecer as seguintes

considerações em relação a: �D� bancos estudados; �E� metodologia adotada; �F� Modelo

Brasileiro de Notificação utilizado para o combate de várias doenças; �G� modelo de

regressão através de redes neurais apresentado; �H� técnica apresentada para predição; �I� objetivos propostos.

a) Em relação aos bancos de dados analisados: nenhum dos bancos avaliados foi

desenvolvido com o fim de DCBD. Mesmo assim, foi possível, através de alto esforço de

conversão, gerar várias informações importantes. A análise dessas informações foi feita

de forma ética, através de gráficos de fácil entendimento, que não identificam os

pacientes infectados ou os bairros da cidade de Goiânia.

b) A CRISP-DM é de fácil utilização, aplicação e possibilita gerar informações

importantes, através da transformação dos dados contidos nas bases (tabelas eletrônicas),

em informações sobre o comportamento dos casos confirmados de Dengue, nos anos de

doação avaliados.

c) O Modelo Brasileiro de Notificação já é consagrado e adotado por lei em todo o

Brasil, há muitos anos, e prediz, com certa margem de confiança, a ocorrência de surtos

de trinta e cinco doenças diferentes. Com essa técnica, na granularidade de semanas

epidemiológicas, é possível fazer a predição em um ou mais anos em relação aos casos

notificados. Além disto, pode-se gerar o limite de alarme, a partir do qual é possível

determinar se existe ou não a ocorrência de uma epidemia.

d) A técnica e arquitetura utilizadas na rede neural implementada no aplicativo

(DV\QQ�3OXV apresentou, nas dezesseis primeiras semanas epidemiológicas do ano 2004,

na cidade de Goiânia, melhor faixa de confiança na predição do número de casos

confirmados de Dengue. Essa técnica carrega a desvantagem de gerar erros expressivos,

conforme o número de passos que, no futuro, serão incrementados (i.e. em vez de gerar a

predição com uma semana de antecedência tenta-se gerar a predição com dez semanas e

obtêm-se erros maiores).

e) Em relação ao objetivo geral e aos específicos (sub-item 1.7.1 e 1.7.2):

Page 133: Dissertação Giovanni - Revisões Feitas

120

O objetivo principal foi alcançado, já que construído modelo que forneceu suporte à

tomada de decisão para o combate a epidemias de Dengue, o que possibilitou, neste

estudo de caso, a predição de casos confirmados de Dengue, em menor tempo e maior

precisão do que a prática atual.

Quanto aos objetivos específicos: �D� em Goiânia, de janeiro de 2001 a abril de

2004, o número de casos confirmados de Dengue, no formato de semanas

epidemiológicas, apresentou nítida influência sazonal, principalmente em relação a um

dos parâmetros climáticos (índice pluviométrico); �E� através da difícil transformação de

dados em informações, foram encontradas diversas relações de Dengue com as

características urbanas representadas no Quadro 11.

Além de todos esses resultados, foram encontradas as seguintes informações

importantes: �D� o tipo Clássico de Dengue apresentou o maior percentual de notificações

confirmadas, no período estudado, naquela cidade; deve-se levar em consideração que,

embora a ocorrência de Dengue com complicações e FHD apresentem menores

percentuais de confirmação, são elas que, normalmente, sem tratamento médico

adequado, levam a óbito os pacientes infectados; �E� em relação ao percentual de

respostas no campo DENGUE, da tabela eletrônica 0'(1*8(: em sua maioria, são

notificados pacientes que não haviam apresentado infecção prévia da doença; �F� em

relação ao percentual de respostas no campo VACINADO da tabela 0'(1*8(, a

maioria dos pacientes afirmam terem sido vacinados contra Febre Amarela, o que apóia a

não notificação dos casos confirmados da doença, no período avaliado; �G� em relação ao

percentual por gênero, houve forte relação com o sexo feminino; �H� em relação a

população por bairro, esta apresenta aspecto forte, diretamente proporcional ao número de

habitantes de cada bairro.

Page 134: Dissertação Giovanni - Revisões Feitas

121

� &RQFOXV}HV�H�VXJHVW}HV�SDUD�WUDEDOKRV�IXWXURV�“A arte do raciocínio epidemiológico é tirar sábias conclusões de dados

imperfeitos” George W. Comstock.

���� &RQVLGHUDo}HV�ILQDLV�A Mineração de Dados é utilizada pelas organizações de forma crescente, dada a

possibilidade de procurar padrões e de fornecer suporte à decisão, a partir das bases de

dados existentes.

Quanto à CRISP-DM, talvez seu maior benefício seja a possibilidade de aplicação

em grandes ou pequenos projetos de mineração de dados, além de fornecer aos

pesquisadores juniores, um roteiro que possibilite a conclusão de projetos complexos, em

curto espaço de tempo e com poucos recursos financeiros. Convém ainda ressaltar que a

metodologia CRISP-DM, para MD, é de fácil aplicação e fundamental para manter,

relatar ou descobrir o conhecimento especializado existente nas bases de dados de uma

organização. É um roteiro que conduz o profissional a pesquisas que possibilitam

aquisição e representação do conhecimento. No âmbito desta pesquisa, possibilitou a

aquisição e representação ética do conhecimento epidemiológico sobre os casos

notificados de Dengue.

Para ter sucesso em suas pesquisas, segundo Elder (2004, p.27), o profissional

(pesquisador) de MD deve ter persistência (não desistir se os primeiros experimentos não

apresentarem sucesso) e atitude (ser otimista e acreditar que o trabalho poder ser feito);

ser aberto ao trabalho de equipe (aprender com os usuários o que eles sabem, onde

desejam chegar e como comunicar, de modo eficaz, as descobertas obtidas pela MD). Ser,

principalmente, humildade (saber que a tecnologia, sem o apoio e o conhecimento da

equipe, não fornece soluções).

���� 'HVWDTXHV�H�FRQWULEXLomR�GD�SHVTXLVD�Para se obter maior confiabilidade nos resultados, buscou-se a doação de dados em

instituições públicas (municipais e federais), que realizam, de forma compulsória, a coleta

e armazenamento dos dados necessários para esta pesquisa.

Com essa visão, a pesquisa teve como objetivo principal, predizer, com uma

Page 135: Dissertação Giovanni - Revisões Feitas

122

semana de antecedência, o número de casos confirmados de Dengue, naquela cidade. Em

relação aos objetivos secundários, foram encontradas relações que devem ser estudadas

com mais profundidade, em trabalhos futuros.

Existem, ainda, duas outras contribuições: �D� o valor de doação de todas as

variáveis para esta pesquisa foi gratuito; �E� a anemométrica de %HDXIRUW foi adaptada

para todos os parâmetros climáticos utilizados para esta pesquisa e, provavelmente, a

mesma adaptação poderá servir para a predição de outras doenças. O simulador de Redes

Neurais (DV\QQ�3OXV atende, com facilidade, a especificação e modelagem, o que

permite, aos pesquisadores, seu uso para novas análises e trabalhos futuros.

Em relação aos resultados da análise e da predição, foram apresentados de duas

formas: �D� para a comunidade científica, com a codificação do nome do bairro, conforme

as questões éticas indicadas por autores consagrados (H�J� TURBAN; RAINER; POTTER

2004, p.503, 507); �E� para os especialistas da SMSGO, através de palestras, planilhas de

dados, do aplicativo 0LFURVRIW� ([FHO, com a identificação dos bairros e locais não

identificados no estudo de caso realizado.

Para a comunidade científica e, em relação aos especialistas da SMSGO, os

resultados apresentados, possibilitam a análise de informações importantes, dentre elas:

a) O percentual relativo a cada ano, em relação ao banco de dados, o que

possibilitou identificar o ano de surto;

b) O pequeno percentual de perda, relativo à escolha desta pesquisa, na predição

dos casos confirmados;

c) A escolha de construção de gráficos estatísticos facilitou a análise de Dengue

versus população, lotes baldios, influência sazonal, etc.;

d) Foram identificadas as taxas de ataque, por sexo e idade;

e) Foram estabelecidos e classificados os períodos que apresentam maior ou

menor concentração de casos confirmados;

f) Foi realizada a predição do número de casos confirmados, através de duas

técnicas distintas e ambas apresentaram valores melhores que a técnica

Page 136: Dissertação Giovanni - Revisões Feitas

123

brasileira de predição atual.

���� 6XJHVW}HV�SDUD�QRYRV�WUDEDOKRV�GH�SHVTXLVD�A complexidade e as potencialidades da análise dos bancos de dados eletrônicos

oferecem muitas oportunidades de pesquisa.

Como sugestão para trabalhos futuros que abordem predição epidemiológica: �D� avaliação da predição de casos confirmados de todo o ano 2004; �E� avaliação de outras

RNAs para predição; �F� aplicação do modelo proposto em outras séries e/ou períodos

futuros referentes a outras doenças de notificação compulsória; �G� utilização da técnica

de classificação para identificar os bairros que apresentarão ocorrência de casos

notificados em semana futura, a partir da ocorrência de casos notificados em semana

anterior, em um bairro ou conjunto de bairros; �H� Utilizar a técnica de classificação para

gerar regras de ocorrências em bairros em relação à tomada do vetor na cidade.

Outros trabalhos futuros que não abordam predição epidemiológica são relatados

abaixo:

a) O governo brasileiro criou o cartão SUS, que será utilizado, após a distribuição

em todo território brasileiro, para identificação de seus pacientes, no

atendimento em suas unidades de saúde. Cerca de cinqüenta por cento destes

cartões já foram distribuídos em Goiânia. Sugere-se utilizar a técnica de

classificação, no aplicativo (software) WEKA, para, de uma base de

conhecimento, identificar as faixas etárias menos contempladas e locais nos

quais houve pouca entrega, auxiliando, assim, o planejamento de campanhas de

distribuição em Goiânia-Go.

b) Considerando que, em geral, dados de saúde estão relacionados com várias

formas de dados ambientais (KAMP, 1997; OMS, 2004, pp.14-15), e que,

segundo a prática de gestão, há forte relação entre a existência de acúmulo de

água em objetos abandonados (BRITO; FORATTINI, 2004, p.204); é

necessário que sejam considerados dados relativos a construções inacabadas,

principais praças na cidade, visitas domiciliares realizadas pelos funcionários

que combatem o vetor das doenças (que apresentaram presença do mosquito),

índice de infestação predial (medido semanalmente), índice pluviométrico por

Page 137: Dissertação Giovanni - Revisões Feitas

124

bairro (sugeridos pela OMS, 2004, p.15), campanhas preventivas por setor e

locais/forma de combate ao vetor. Com estes dados, provavelmente seria

conseguido um modelo que fornecesse melhores resultados que os obtidos.

Entretanto, estes dados não estão disponíveis, o que desde já aponta para a

necessidade de uma coleta mais refinada de dados relevantes para a gestão das

doenças em tela. Outros dados, embora interessantes, foram descartados pelo

ciclo de vida/reprodução e combate ao vetor, tais dados e motivos de descarte

são: rios (o vetor não coloca seus ovos em água corrente) e lagoas (existem os

predadores naturais como forma de combate). Neste sentido, um trabalho

interessante seria do de verificar, com as bases existentes quais de suas

variáveis apresentam os menores níveis de ruído e que poderiam ser utilizadas

em estudos futuros.

c) Em relação ao Dengue, na cidade estudada, a estimativa é que, entre trinta e

cinco e quarenta por cento dos casos não são relatados por algum motivo. Para

auxiliar a notificação, propõe-se criar um protocolo de notificação virtual que

forneça subsídios para diminuir a perda de notificação de Dengue. Este

protocolo poderia ser criado através de uma interface e seria dividido em duas

partes. A primeira: criar um layout, para notificação por laboratórios e hospitais

estaduais e/ou particulares, para envio de notificações. A segunda: cadastrar

automaticamente os dados recebidos que não estiverem presentes na base do

SINAN.

d) A mesma proposta do protocolo pode ser estendida, de forma genérica, para

outras doenças brasileiras de notificação compulsória que tenham influência

sazonal. Analisados os dados, poderão fornecer informações que auxiliem, ao

gestor de saúde, na tomada de decisão, de forma a melhorar o atendimento aos

pacientes ou a combater a disseminação de uma doença.

e) Fazer um estudo do percentual de notificações, que não os realizados por

inquérito sorológico: sorteio dos pacientes e verificação de exposição ao vírus,

antes da retirada do sangue; em seguida, logo após o mês de março, coletar as

amostras sangüíneas dos mesmos pacientes e, através de técnicas estatísticas,

determinar o percentual de notificações não realizadas.

Page 138: Dissertação Giovanni - Revisões Feitas

125

5HIHUrQFLDV�%LEOLRJUiILFDV�ADRIAANS, Pieter; ZANTINGE, Dolf: 'DWD�0LQLQJ� (QJODQG��(G�6\VOORJLF�����S���������AGRAWAL, Rakesh; PSAILA, Guiseppe: $FWLYH�'DWD�0LQLQJ� In Proceedings of the First International Conference on Knowledge Discovery and Data Mining (KDD-95): American Association for Artificial Intelligence. 1995.

ALVARENGA, Rogério; JUNIOR, Odilon N.; CARVALHO, Marcelo R. C.: 8P�PRGHOR�GH�H[WHUQDOL]DomR� GR� FRQKHFLPHQWR� YLVDQGR� VXSRUWH� j� GHFLVmR� H� YDQWDJHQV� FRPSHWLWLYDV�XWLOL]DQGR�DV�PHWRGRORJLDV�&RPPRQNDGV�H�&5,63�'0� KMBRASIL, 2004.

ALVARENGA, Rogério; OLIVEIRA JUNIOR, Waldomiro de; CARVALHO, Marcelo. 'DWDPLQLQJ HP� ILQDQoDV�� 8P� PRGHOR� SDUD� SUHYLVmR� HP� VpULHV� WHPSRUDLV� EDVHDGD� HP�UHGHV� QHXUDLV� ± HVWXGR� GH� SUHYLVmR� VREUH� R� VLVWHPD� GH� SDJDPHQWRV� %UDVLOHLUR�KMBRASIL, Julho 2003.

ALVES BORGES, Sonia Marta dos Anjos ,PSRUWkQFLD� HSLGHPLROyJLFD� GR� $HGHV�$OERSLFWXV� QDV� $PpULFDV� Brasil, Universidade de São Paulo –USP, Dissertação de Mestrado, Outubro 2001, 99p.�ANDRADE, Ionilda Sabrino; DANTAS, Renilson Targino: (VWXGR� GD� LQIOXrQFLD� GH�HOHPHQWRV�PHWHRUROyJLFRV�QRV�FDVRV�GH�FyOHUD��GHQJXH�H�PHQLQJLWH�QD�FLGDGH�GH�&DPSLQD�*UDQGH� XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 10p.

ARAUJO, Vânia M. R. Hermes de; FREIRE, Isa Maria; MENDES, Teresa Cristina M.: 'HPDQGD�GD�,QIRUPDomR�SHOR�VHWRU�LQGXVWULDO�: dois estudos no intervalo de 25 anos. Brasil, Brasília-Df: Ci. Inf.,�v.26 n.3, p. 283-289, set/dez – 1997.�ARGYRIS, Chris:�(QVLQDQGR�3HVVRDV�,QWHOLJHQWHV�D�$SUHQGHU� LQ HARVARD BUSINESS REVIEW: Gestão do Conhecimento�RQ NQRZOHGJH�PDQDJHPHQW: 1991. Tradução de Afonso Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.82-107.

AZEVEDO, Fernando Mendes de; BRASIL, Lourdes Mattos; OLIVEIRA, Roberto Célio Limão de: 5HGHV� 1HXUDLV� FRP� $SOLFDo}HV� HP� &RQWUROH� H� HP� 6LVWHPDV� (VSHFLDOLVWDV�Florianópolis, Brasil, Visual Books, 2000.

BRAGA, Antônio de Pádua; LUDERMIR, Teresa Bernarda; CARVALHO, André Carlos Ponce de Leon Ferreira: 5HGHV�QHXUDLV�DUWLILFLDLV� ��Teorias e aplicações. Livros Técnicos e Científicos S. A. – LTC, Rio de Janeiro, 262 p, 2000.

BRASSOLATTI, Rejane Cristina; ANDRADE, Carlos Fernando S. $YDOLDomR� GH� XPD�LQWHUYHQomR�HGXFDWLYD�QD�SUHYHQomR�GD�GHQJXH��Brasil. Ciênc. Saúde coletiva. 2002, vol.7, no.2, p.243-251.

BRITO, Marylene de; FORATTINI, Oswaldo Paulo: 3URGXWLYLGDGH�GH�FULDGRXURV�GH�$HGHV�DOERSLFWXV�QR�9DOH�GR�3DUDtED��63��%UDVLO. Brasil, São Paulo,: Isso. Saúde pública;38(2):209-215, abr. 2004.

CAMPOS BRAGA, Giordana HW�DO�:3UHYLVmR�GR�Q~PHUR�GH�FDVRV�GR�GHQJXH�QD�3DUDtED�D�SDUWLU� GD� SUHFLSLWDomR� GH� PRGHORV� DWPRVIpULFRV� UHJLRQDLV�� XIII Congresso Brasileiro de

Page 139: Dissertação Giovanni - Revisões Feitas

126

Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 14p.�CARDOSO JUNIOR, Rubens Pinto�HW�DO. 'HWHFomR�GH�$HGHV�DHJ\SWL�H�$HGHV�DOERSLFWXV��QD�]RQD� XUEDQD� GR� PXQLFtSLR� GH� &DWDQGXYD�63�� DSyV� FRQWUROH� GH� HSLGHPLD� GH� GHQJXH�Brasil. Rev. Soc. Bras. Med. Trop. v.30 n.1 Uberaba jan./fev. 1997, vol.30, no.1, p.37-40. ISSN 0037-8682.

CARVALHO, Mirléia Aparecida de 6LVWHPD�GH� VXSRUWH�D�GHFLVmR�SDUD�DORFDomR�GH�iJXD�HP�SURMHWRV�GH�LUULJDomR��Universidade de São Paulo – USP, Tese de Doutorado,Setembro 2003, p.1-193.

CASTRO, Giovanni Gondim; ALVARENGA, Rogério; PRADO, Hércules Antônio: 0RGHOR�SDUD�JHVWmR�HSLGHPLROyJLFD�GR�'HQJXH�H�)HEUH�$PDUHOD��EDVHDGR�HP�6LVWHPDV�GH�6XSRUWH�D 'HFLVmR��0LQHUDomR�GH�'DGRV� H� ,QIRUPDo}HV�(VSDFLDLV��V Workshop de Tecnologia da Informação da UCB. p. 83-84, Setembro 2004.

______: 8VR�GH�PLQHUDomR�GH�GDGRV�SDUD�D�FRQVWUXomR�GH�PRGHOR�SUHGLWLYR�GH�VXUWR�GH�GHQJXH� XWLOL]DQGR� FDVRV� FRQILUPDGRV� GR� 6LVWHPD� GH� ,QIRUPDo}HV� GH� $JUDYRV� GH�1RWLILFDomR��VI Workshop de Tecnologia da Informação da UCB. p. 41-42, Maio 2005.

CASTRO, Giovanni Gondim; ARAUJO, Valdivino Alves. $PSOLDomR�GR�VLVWHPD�GH�FRQWUROH�ODERUDWRULDO�GD� VD~GH�GH�*RLkQLD� Revista da Secretaria Municipal de Saúde, Relatório de Gestão, Artigos, p. 65,66. Dezembro/2004.

COFFIN, Carla HW� DO.: 8VLQJ� ,QWHOOLJHQW� $JHQWV� WR� 5HSXUSRVH� $GPLQLVWUDWLYH� 'DWD� LQ�)RUHFDVWLQJ� 'LVHDVH� 3UHYHQWLRQ� LQ� DQ� 2XWSDWLHQW� &RQWH[W� 7KH� &DVH� RI� 3QHXPRFRFFDO�9DFFLQDWLRQ��USA, Hawaii: Proceedings on 37th Hawaii International Conference on Systems Sciences – 2004, IEEE, 7p. 2004.�CORTES, Luzia M de C HW� DO� &RPSDUDWLYH� LPPXQRORJLFDO� UHFRJQLWLRQ� RI� SURWHLQV� IURP�1HZ� *XLQHD� ³&´� GHQJXH� YLUXV� W\SH� �� SURWRW\SH� DQG� IURP� D� GHQJXH� YLUXV� W\SH� �� VWUDLQ�LVRODWHG� LQ� WKH�6WDWH�RI�5LR�GH�-DQHLUR��%UD]LO. Brasil.�Memorando Instituto Oswaldo Cruz. Abr. 2003, vol.98, no.3, p.331-334. ISSN 0074-0276.

COSTA SOUSA, Paulo de Tarso: 0LQHUDomR� GH�'DGRV� SDUD� LQGXomR� GH� XP�PRGHOR� GH�*HVWmR�GR�&RQKHFLPHQWR���Brasil, Universidade Católica de Brasília – UCB, Dissertação de Mestrado, Março 2003, 167p.

CRUZ, Bruna: (VWXGR� YDL� PRQLWRUDU� UHSURGXomRGH�YHWRUHV�GR�GHQJXH� Brasil. FIOCRUZ, Março/2004.

CUMMINGS, Derek A. T. HW� DO�: 7UDYHOOLQJ� ZDYHV� LQ� WKH� RFFXUUHQFH� RI� GHQJXH�KDHPRUUKDJLF�IHYHU�LQ�7KDLODQG� USA. Nature, Vol. 427, p.344-347, Jan/2004.

CYRINEU TERRA, José Cláudio:� *HVWmR� GR� &RQKHFLPHQWR O grande desafio empresarial:uma abordagem baseada no aprendizado e na criatividade. Brasil. São Paulo, Ed. Negócio, 313p. 2001.

DELMATER, Rhonda; HANCOCK, Monte: 'DWD�0LQLQJ�([SODLQHG�±$ 0DQDJHU�V�*XLGH�WR�&XVWRPHU�&HQWULF�%XVLQHVV�,QWHOOLJHQFH. USA. 392p. Ed. Digital Press. 2001. ISBN:1-55558-231-1.

DENIS, Cristiane K.�HW�DO��0DQLIHVWDo}HV�RWRUULQRODULQJROyJLFDV�HP�SDFLHQWHV�FRP�GHQJXH�

Page 140: Dissertação Giovanni - Revisões Feitas

127

Brasil. Set./out. 2003, vol.69, no.5, p.644-647.

DRUCKER, Peter H.:2 DGYHQWR� GD� 1RYD� 2UJDQL]DomR� LQ HARVARD BUSINESS REVIEW: Gestão do Conhecimento�RQ NQRZOHGJH�PDQDJHPHQW: 1998. Tradução de Afonso Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.9-26

EIRMAN, Michael A; NIEDERMAN, Fred; ADAMS, Carl:'66�7HRU\��D�PRGHO�RI�FRQVWUXFWV�DQG�UHODWLRQVKLSV. P.1-26. Volume 14, Março 1995. ISSN:0167-9236.

ELDER, John:7RS� ��� GDWD�PLQLQJ�PLVWDNHV� :RRG�*ULOOH� %XIIHW�� &KDUORWWHVYLOOH�� 9LUJLQLD��,(((��0DU����������S� FAYYAD, Usama; SHAPIRO-PIATETSKY, Gregory; SMYTH, Padhraic:)URP�'DWD�0LQLQJ�WR�.QRZOHGJH�'LVFRYHU\�LQ�'DWDEDVHV��86$� $PHULFDQ�$VVRFLDWLRQ�IRU�$UWLILFLDO�,QWHOOLJHQFH1996, p. 37-54.

______: $GYDQFHV� LQ� .QRZOHGJH� 'LVFRYHU\� DQG� 'DWD� 0LQLQJ. American Association for Artificial Intelligence, 1996b. 625p. ISBN 0-262-56097-6

FOCKS, Dana A. HW� DO��$ VLPXODWLRQ� PRGHO� RI� WKH� HSLGHPLRORJ\� RI� XUEDQ� GHQJXH� IHYHU��OLWHUDWXUH�DQDO\VLV��PRGHO�GHYHORSPHQW��SUHOLPLQDU\� YDOLGDWLRQ�� DQG� VDPSOHV� RI� VLPXODWLRQ�UHVXOWV. American Journal of Tropical Medicine and Hygiene. 1995. Nr. 53, p. 489-506.

FOUQUE, Florence; BICOUT, Dominique; SABATIER, Philippe:0RGHOLQJ� 7UDQVPLVVLRQ�3RWHQWLDO�RI�0RVTXLWRHV�9HFWRUV�RI�7URSLFDO�'LVHDVHV��FOUQUE, Florence; GARINCI, Romuald; GABORIT, Pascal�(SLGHPLRORJLFDO� DQG�HQWRPRORJLFDO� VXUYHLOODQFH�RI� WKH� FR�FLUFXODWLRQ�RI�'(1����'(1���DQG�'(1�� YLUXVHV� LQ�)UHQFK� *XLDQD�� 7URSLFDO� 0HGLFLQH� � ,QWHUQDWLRQDO� +HDOWKVolume 9, p. 41-46. Janeiro 2004.�FRANÇA, Consuelo Vidica; ALVES SILVA, Marta Maria; AMORIM SILVA, Flúvia Pereira: $o}HV� YLWRULRVDV� QR� FRQWUROH� GD� GHQJXH� HP�*RLkQLD� Revista da Secretaria Municipal de Saúde, Relatório de Gestão, Artigos, p. 51-53. Dezembro/2004.

FUNASA:*XLD�GH�9LJLOkQFLD�(SLGHPLROyJLFD�9ROXPH�,� Brasil, Brasília-Df. Ed. Fundação Nacional de Saúde - FUNASA. 477p. 2002.

GACHET, Alexandre:$ )UDPHZRUN� IRU� 'HYHORSLQJ� 'LVWULEXWHG� &RRSHUDWLYH� 'HFLVLRQ�6XSSRUW� 6\VWHPV� – Inception Phase. Challenges to Informing Clients: A Transdisciplinary Approach. University of Fribourg, Switzerland, 2001.

GALE MOORE, Thomas:,Q� 6LFNQHVV� DQG� LQ� +HDOWK� The Kyoto Protocol versus Global Warming� 6WDQIRUG�8QLYHUVLW\ – 2000.

GOEBEL, Michael; GRUENWALD, Le:$ 6XUYH\�RI�'DWD�0LQLQJ�DQG�.QRZOHGJH�'LVFRYHU\�6RIWZDUH�7RROV� 6LJ.GG�([SORUDWLRQV, -XQH�����, Volume 1, Issue 1: p.20-33, 1999.

HALES HW�DO.:3RWHQWLDO�HIIHFW�RI�SRSXODWLRQ�DQG�FOLPDWH�FKDQJHV�RQ�JOREDO�GLVWULEXWLRQ�RI�GHQJXH�IHYHU��DQ�HPSLULFDO�PRGHO. THE LANCET, Vol 360, p. 830-834, September 2002.

HAMMERS Maryann:0LQH�FRPSDQ\�GDWD�ZLWK�GHFLVLRQ�VXSSRUW�WRROV�� KXPDQ�UHVRXUFH�PDQDJHPHQW� V\VWHPV� – related article� Choosing a Decision-Support System.� Workforce, June 2002, p.1-2.

Page 141: Dissertação Giovanni - Revisões Feitas

128

HAN Jiawei; KAMBER Micheline:'DWD�0LQLQJ� &RQFHSWV� DQG� 7HFKLQLTXHV�� 6LPRQ� )UDVHU�8QLYHUVLW\��2001. 550 p.�HAYKIN, Simon:5HGHV� QHXUDLV – Princípios e prática: 1999. Tradução de Paulo Martins Engel. Brasil, Porto Alegre. 2ª Edição. Ed. Bookman, 2001. 900p.

HENDRIKS, Paul; VRIENS, Dirk:&ROODERUDWLYH�H[SORUDWLRQ�RI�VSDWLDO�SUREOHPV� In Initiative on Collaborative Spatial Decision Making 17, Londres, NCGIA, 1995.

KAMP, Vera; GRUPE, Roland:6HPDQWLF� &OLHQW� &DFKLQJ� LQ� D� &OLHQW�6HUYHU�EDVHG� .''�$UFKLWHFWXUH� Alemanha, 1997.

KAMP, Vera; SITZMANN, Lars; WIETEK, Frank:$ VSDWLDO� GDWD� FXEH� FRQFHSW� WR� 6XSSRUW�'DWD� $QDO\VLV� LQ� (QYLURQPHQWDO� (SLGHPLRORJ\. EUA, Washington: 3URFHHGLQJV� RI� WKH� �WK,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6FLHQWLILF�DQG�6WDWLVWLFDO�'DWDEDVH�0DQDJHPHQW� �66'%0¶��� –,(((�&RPSXWHU�6RFLHW\�3UHVV. 4p. 1997.

KAMP, Vera; WIETEK, Frank:,QWHOOLJHQW� 6XSSRUW� IRU�0XOWLGLPHQVLRQDO�'DWD�$QDO\VLV� LQ(QYLURQPHQWDO�(SLGHPLRORJ\� ,QWHUQDWLRQDO�6\PSRVLXP� IDA’97, 12p, 1997.

KHAN A.M. HW� DO .:$QDO\VLV� RI� DQWLJHQLF� KRW�VSRWV� LQ� GHQJXH� YLUXV�� $� ELRLQIRUPDWLFVDSSURDFK LQ First Asian Regional dengue research network meeting. October 2004. Bankok. Thailand.

KOVACS, Zsolt HW�DO.:'DWDEDVH�'HVFULSWLRQ�IRU�D�3DQ�(XURSHDQ�+HDOWKFDUH�6\VWHP� USA, Hawaii: 3URFHHGLQJV�RI�WKH���UG�+DZDLL�,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6\VWHP�6FLHQFHV – 2000. IEEE, 10p, 2000.

LEMOS, Wilda Soares:*HVWmR� GH� &RPSHWrQFLDV: A Utilização do Método Delphi em um Estudo de Caso. 2003. Dissertação de Mestrado (Mestrado em Gestão de Conhecimento e Tecnologia da Informação) - Programa de Pós-Graduação 6WULFWR� 6HQVX em Gestão de Conhecimento e Tecnologia da Informação, Universidade Católica de Brasília –UCB, Brasília-DF.

LIMA, Virgília L C �HW�DO��'HQJXH��LQTXpULWR�VRUROyJLFR�SyV�HSLGrPLFR�HP�]RQD�XUEDQD�GR�(VWDGR�GH�6mR�3DXOR��%UDVLO���Brasil. 5HY��6D~GH�3~EOLFD. Dez. 1999, vol.33, no.6 p.566-574. ISSN 0034-8910.

LOIOLA, Carlos Catão Prates:'HQJXH� QDV� $PpULFDV� in CASTRO GOMES, Almerio de:Informes em Saúde Pública� Universidade de São Paulo – Faculdade de Saúde Pública, 2000.

MACIEL, Ivan José:$YDOLDomR� (SLGHPLROyJLFD� GR� 'HQJXH� QR�0XQLFtSLR� GH�*RLkQLD� QR�3HUtRGR� GH� ����� D� ����� Brasil, UniversidadeFederal de Goiás, Dissertação de Mestrado, 1999, 119p.�MARTENS, Willem J.M. HW�DO�:3RWHQWLDO�,PSDFW�RI�*OREDO�&OLPDWH�&KDQJH�RQ�0DODULD�5LVN��Environmental Health Perspectives Volume 103, Number 5, 11p, May 1995.

MEDEIROS OLIVEIRA, Stanley Robson de:'DWD� WUDQVIRUPDWLRQ� IRU� SULYDF\�SUHVHUYLQJ�GDWD�PLQLQJ� Universidade de Alberta, Canadá, Tese de Doutorado, 2005, 167p.

MELHORAMENTOS:'LFLRQiULR�3UiWLFR�da Língua Portuguesa. Brasil, 10. Ed., São Paulo:

Page 142: Dissertação Giovanni - Revisões Feitas

129

Cia. Melhoramentos de São Paulo 1998. ISBN 85-06-01707-6

MICHAELIS:3HTXHQR� 'LFLRQiULR� GD� /tQJXD� 3RUWXJXHVD� Brasil, 5. Ed., São Paulo: Companhia Melhoramentos 1998. ISBN 85-06-02718-7

MOORE, Fred:1HZ� $SSOLFDWLRQV� %UHDN� 7KURXJK� 6WRUDJH� %RXQGDULHV� ± 1HZV� %ULHIV.&RPSXWHU�7HFKQRORJ\�5HYLHZ, 2FW 1999, 2p.

MORESI, 2000:'HOLQHDQGR�R�YDORU�GR�VLVWHPD�GH�LQIRUPDomR�GH�XPD�RUJDQL]DomR� Brasil, Brasília-DF: Ci. Inf., V.29, n.º 1, p. 14-24, jan./abr. 2000.

MSB - Ministério da Saúde do Brasil: Núcleo de comunicação da Secretaria de Vigilância em Saúde – 2 TXH�p�'HQJXH, Maio 2004.

MUNSTERMANN, Leonard:$HGHV�DHJ\SWL� WKH�\HOORZ�IHYHU�PRVTXLWR. National Institutes of Health - National Institute for Allergy and Infectious Diseases. 1995.

NASCIMENTO SOUSA HW� DO.:(IHLWR� GR� FOLPD� VREUH� D� 'HQJXH� QD� FLGDGH� GH� &DPSLQD�*UDQGH� �� 3%. XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 7p.

NONAKA, Ikujiro; TAKEUCHI, Hirotaka:&ULDomR�GH�&RQKHFLPHQWR�QD�(PSUHVD. Como as Empresas Japonesas Geram a Dinâmica da Inovação. Brasil. Editora Campus 2ª Edição. 1997.

NOON, Charles E.; HANKINS, Charles T.:6SDWLDO� 'DWD� 9LVXDOL]DWLRQ� LQ� +HDOWKFDUH��6XSSRUWLQJ� D� )DFLOLW\� /RFDWLRQ� 'HFLVLRQ� YLD� *,6�EDVHG� 0DUNHW� $QDO\VLV�� � ��WK +DZDLL�,QWHUQDWLRQDO�&RQIHUHQFH�RQ�6\VWHP�6FLHQFHV. IEEE, 10p – 2001.

NUNES SILVA, Nilza; CUNHA, Tarcisio Neves; QUINTANILHA, José Alberto:$PRVWUD�PHVWUD� H� JHRSURFHVVDPHQWR�� tecnologias para inquéritos domiciliares. Brasil, São Paulo: Revista Saúde Pública. P.494-502, Fevereiro 2003.

O´BROCHTA� David A.:7UDQVJHQLF� ,QVHFWV��3URJUDPV��7HFKQRORJ\��%HQHILWV��DQG�5LVNV�in: /02V� DQG� WKH� (QYLURQPHQW�� 3URFHHGLQJV� RI� DQ� ,QWHUQDWLRQDO� &RQIHUHQFH�� ����� (C. R. Roseland ed.) Organization of Economic Cooperation and Development, França, Paris. P.247-254, 2002.

O’DELL, Carla, GRAYSON, JR. C. Jackson:,I� 2QO\� :H� .QHZ� :KDW� :H� .QRZ:The Transfer of Internal Knowledge and Best Practice. The Free Press, USA, 1998

OLIVEIRA JÚNIOR, Waldomiro: 3UHYLVmR� GH� VpULHV� WHPSRUDLV� XWLOL]DQGR� UHGHV� QHXUDLV�Estudo de caso: Previsão no sistema de pagamentos Brasileiro. Universidade Católica de Brasília – UCB, Descoberta de conhecimentos em bases de dados, 2003, 40 p.

OLIVEIRA, Emerson Madureira; ALVARENGA, Rogério:'DWD� PLQLQJ� HP� ILQDQoDV: Um exemplo prático utilizando a metodologia CRISP-DM, Brasil, Brasília, Universidade Católicade Brasília, novembro/2003

OMS:.QRZOHGJH�PDQDJHPHQW�DQG�VKDULQJ��.06���Suíça, Genebra, 2p. 2005.

______:)DFW�VKHHW�Q�������December 2001.�Suíça, Genebra. 4p 2004.

______:8VLQJ� FOLPDWH� WR� SUHGLFW� ,QIHFWLRXV� GLVHDVH� RXWEUHDNV� D� UHYLHZ� Suíça, Genebra.

Page 143: Dissertação Giovanni - Revisões Feitas

130

&RPPXQLFDEOH� 'LVHDVHV� 6XUYHLOODQFH� DQG� 5HVSRQVH� 3URWHFWLRQ� RI� WKH� +XPDQ� (QYLURQPHQW�5ROO�%DFN�0DODULD� 55p. 2004b.

______:,QWHUQDWLRQDO�7UDYHO�DQG�+HDOWK��Suíça, Genebra. 2004c�______:'HQJXH1HW���:+2�*OREDO�'HQJXH�6XUYHLOODQFH� Suíça, Genebra. 2004d�______::RUOG� 5HSRUW� RQ� � .QRZOHGJH� IRU� %HWWHU�+HDOWK� �� 6WUHQJWKHQLQJ�+HDOWK� 6\VWHPV�Suíça, Genebra. 2004e�______:)DFW�VKHHW�Q������ April 2002.�Suíça, Genebra. 3p 2003.

______:$WLYLGDGHV� GD� 206� QD� 5HJLmR� $IULFDQD� – Relatório Anual de 2002. África, Jonesburgo. 82p. Setembro 2003b.

______:,QWHUQDWLRQDO�7UDYHO�DQG�+HDOWK��Suíça, Genebra. 207p. 2003c.

______:&OLPDWH�FKDQJH�DQG�KXPDQ�KHDOWK - risks and responses. Summary� Suíça, Genebra. 37p. 2003d. ISBN-92.4.159081.5.

______::K\�DLUFUDIW�GLVLQVHFWLRQ"� Suíça� *HQHEUD��3������������2000.

______:&OLPDWH�9DULDELOLW\�DQG�&KDQJH�DQG�WKHLU�+HDOWK�(IIHFWV�LQ�3DFLILF�,VODQG�&RXQWULHV�� :RUNVKRS�5HSRUW� $SLD��6DPRD��6XtoD��*HQHEUD����S��-XOKR�����E���______:'HQJXH� DQG� 'HQJXH� +HPRUUKDJLF� )HYHU – Report on global surveillance of epidemic-prone infectious diseases. Chapter 6: p.75-88, 2000c.

______:9HFWRU�6XUYHLOODQFH�DQG�&RQWURO� LQ�9HFWRU�FRQWURO��PHWKRGV�IRU�XVH�E\�LQGLYLGXDOV�DQG�FRPPXQLWLHV��Genebra. P.48-59. 1997�

______:$JULFXOWXUDO�GHYHORSPHQW�DQG�YHFWRU�ERUQH�GLVHDVHV� Suíça. Genebra. 22p. 1996.

PAIM, Jairnilson Silva:(SLGHPLRORJLD� H� SODQHMDPHQWR�� D� UHFRPSRVLomR� GDV� SUiWLFDV�HSLGHPLROyJLFDV�QD�JHVWmR�GR�686��Brasil: Revista Ciência e Saúde, Associação Brasileira de Pós-graduação em Saúde Coletiva – ABRASCO, Volume 8, n.º2, p. 557-567, 2003, ISSN 1413-8123.�PASSARI, Antônio Fabrizio Lima:([SORUDomR�GH� GDGRV� DXWRPDWL]DGRV� SDUD�SUHYLVmR�GH�YHQGDV�QR�YDUHMR�XWLOL]DQGR�UHGHV�QHXUDLV, São Paulo, Brasil, Universidade de São Paulo -USP, Dissertação de Mestrado, 2003, 150p.

PATZ, Jonathan A. HW� DO�:'HQJXH� )HYHU� (SLGHPLF� 3RWHQWLDO� DV� 3URMHFWHG� E\� *HQHUDO�&LUFXODWLRQ�0RGHOV�RI�*OREDO�&OLPDWH�&KDQJH� Environmental Health Perspectives Volume 106, Number 3, March 1998.

PENNA, Maria Lúcia F.:5HGH� QHXUDO� DUWLILFLDO� SDUD� GHWHFomR� GH VREUHPRUWDOLGDGH�DWULEXtYHO� j� &yOHUD� QR� &HDUi. 5HY�� 6D~GH� 3~EOLFD, Junho 2004, vol.38, no.3, p.351-357. ISSN 0034-8910.

PINHEIRO, Valéria Cristina Soares; TADEI, Wanderli Pedro:$YDOLDomR�GR�HIHLWR�UHVLGXDO�GR�WHPHIyV� HP� ODUYDV� GH� $HGHV� DHJ\SWL� �'LSWHUD�� &XOLFLGDH�� HP� UHFLSLHQWHV� DUWLILFLDLV� HP�

Page 144: Dissertação Giovanni - Revisões Feitas

131

0DQDXV�� $PD]RQDV�� %UDVLO�� Idem. Caderno Saúde Pública. Nov./dez. 2002, vol.18, no.6, p.1529-1535.

POLANCZYK, Ricardo Antonio, GARCIA, Marcelo de Oliveira e ALVES, Sérgio Batista:. 3RWHQFLDO� GH� %DFLOOXV� WKXULQJLHQVLV� LVUDHOHQVLV� %HUOLQHU� QR� FRQWUROH� GH� $HGHV� DHJ\SWL.5HYLVWD�6D~GH�3~EOLFD. Dez. 2003, vol.37, no.6, p.813-816. ISSN 0034-8910.

PONTES, Ricardo J. S.; RUFFINO NETTO, Antonio:'HQJXH� HP� ORFDOLGDGH� XUEDQD� GD�UHJLmR� VXGHVWH� GR� %UDVLO�� DVSHFWRV� HSLGHPLROyJLFRV�� Brasil. Revista Saúde Pública. Jun. 1994, vol.28, no.3, p.218-227.

PRADO, Hercules Antônio:$ERUGDJHQV� +tEULGDV� SDUD� 0LQHUDomR� GH� 'DGRV� Exame de qualificação de doutorado. Universidade Federal do Rio Grande do Sul. 1998.

RAFAELI NETO, Silvio Luiz:7RPDGD� GH�'HFLVmR� (VSDFLDO��Uma abordagem sistêmica e implicações tecnológicas. III Workshop Brasileiro de Geoinformática –GeoInfo2001. Brasil. Rio de Janeiro. Instituto Militar de Engenharia, 4 e 5 de outubro de 2001.

REBELO, José Manuel Macário�HW�DO.:'LVWULEXLomR�GH�$HGHV�DHJ\SWL H GR�GHQJXH�QR�(VWDGR�GR�0DUDQKmR�� %UDVLO. &DG�� 6D~GH� 3~EOLFD. Jul./set. 1999, vol.15, no.3, p.477-486. ISSN 0102-311X.

REIFER, Donald J.:�$ /LWWOH�ELW�RI�NQRZOHGJH�LV�D�GDQJHURXV�WKLQJ. IEEE, p14/15, May/June 2002.

RIGAU-PEREZ, José G. HW�DO�:$ 'HULYDWLRQ�%DU�&KDUW�IRU�'HWHFWLQJ�'HQJXH�2XWEUHDNV�LQ�3XHUWR�5LFR� American Journal of Public Health. March 1999, vol. 89, Nr 3, p.374-378.

ROCCO, Iray Maria; BARBOSA, Maria Luisa; KANOMATA, Emilia Hiromi Nakaya. 6LPXOWDQHRXV�LQIHFWLRQ�ZLWK�'HQJXH���DQG���LQ�D�%UD]LOLDQ�SDWLHQW. Brasil. Ver. Inst. `éd. Trop. S. Paulo. Maio/Jun. 1998, vol.40, no.3, p.151-154.

SCHREIBER, Kathleen.:$Q�LQYHVWLJDWLRQ�RI�UHODWLRQVKLSV�EHWZHHQ�FOLPDWH�DQG�GHQJXH�XVLQJ�D ZDWHU�EXGJHWLQJ�WHFKQLTXH��Int. J. Biometorol, March 2001, Nr. 45, p.81-89.

SCHUMANN; H, CHÁVEZ, Norma de López; GRAW, H,-U:9LVXDO�DQDO\VLV�DV�DQ�HIILFLHQW�WRRO� IRU� WKH� H[SORUDWLRQ�RI�KXPDQ�KHDOWK�GDWD� Alemanha: Proceedings of the International Workshop on Geomedical Systems (GEOMED’97).

SEPLAN:$VSHFWRV�GHPRJUiILFRV�GD�SRSXODomR�GH�*RLkQLD��SRU�EDLUUR��VHJXQGR�R�DQR�GH������ Brasil, Goiânia. Secretaria de Planejamento - SEPLAN. 199p, dezembro 2002.

SILVEIRA RODRIGUES, Eugênia Maria HW�DO��(SLGHPLRORJLD�GD�LQIHFomR�SHOD�GHQJXH�HP�5LEHLUmR�3UHWR��63��%UDVLO��Idem. Revista Saúde Pública. Abr. 2002, vol.36, no.2, p.160-165.

SIQUEIRA JUNIOR, João Bosco HW� DO�:+RXVHKROG� VXUYH\� RI� GHQJXH� LQIHFWLRQ� LQ� FHQWUDO�EUD]LO�� VSDWLDO� SRLQW� SDWWHUQ� DQDO\VLV� DQG� ULVN� IDFWRUV� DVVHVVPHQW�� American Journal of Tropical Medicine and Hygiene, nº 71, p 646-651, 11/2004.

______:'HQJXH� DQG� 'HQJXH� +HPRUUKDJLF� )HYHU�� %UD]LO�� ����±������ CDC – Emerging Infectious Diseases, Vol .11, nº 1, p 48-53, 01/2005.

SIQUEIRA JÚNIOR, João Bosco:9LJLOkQFLD� GR� 'HQJXH�� $SOLFDomR� GH� 'LDJUDPDV� GH�&RQWUROH�H�$QiOLVH�(VSDFLDO�QR�0XQLFtSLR�GH�*RLkQLD��*RLiV�Brasil, Universidade Federal

Page 145: Dissertação Giovanni - Revisões Feitas

132

de Goiás – UFG,Dissertação de Mestrado, 2001. 53p.

SOUSA HW�DO�:(VWXGR�FRPSDUDWLYR�HQWUH�D�SUHFLSLWDomR�SOXYLRPpWULFD�PHQVDO�H�R�Q~PHUR�PHQVDO� GH� FDVRV� GH� FDVRV� GHQJXH� QRWLILFDGRV� HP�%HOpP�3D� �����������. XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 9p.

SPSS: &5,63�'0�����6WHS�E\�VWHS�GDWD�PLQLQJ�JXLGH��78p. 2000.

SRINIVASAN K.N. HW� DO�:$QDO\VLV� RI� 7�FHOO� HSLWRSH� KRW�VSRWV� LQ� GHQJXH� YLUXV� HQYHORSH�SURWHLQ LQ First Asian Regional dengue research network meeting. October 2004. Bankok. Thailand.

STEWART, Thomas A.:&DSLWDO� ,QWHOHFWXDO – A Nova Abordagem Competitiva das Empresas: 1987. Tradução de Ana Beatriz Rodrigues e Priscilla Martins Celeste. Brasil. Rio de Janeiro. 9ª Edição. Ed. Campus, 1998. 237p.

SVS: Secretaria de Vigilância em Saúde – BRASIL LQ Ministério da Saúde do Brasil -MSB : Núcleo de Comunicação da Secretaria de Vigilância em Saúde. 'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.

______:'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.

______:'HQJXH�EROHWLP�GD�VHPDQD�Q����������, Ministério da Saúde do Brasil.

SWINGLER, Kevin:$SSO\LQJ� QHXUDO� QHWZRUNV – D SUDFWLFDO� JXLGH. Academic Press, USA, San Diego, 1996. 303p.

TEIXEIRA FILHO, Jayme:*HUHQFLDQGR� FRQKHFLPHQWR. Brasil, Rio de Janeiro, Serviço Nacional de Aprendizagem Comercial. 2ª Edição. 189p. 2001.

TURBAN, Efraim; ARONSON, Jay E.:'HFLVLRQ� 6XSSRUW� 6\VWHPV� DQG� ,QWHOOLJHQW� 6\VWHPV�1HZ�-HUVH\��3UHQWLFH�+DOO����������(GLWLRQ�TURBAN, Efraim; RAINER, Kelly R. Jr.; POTTER, Richard E.:$GPLQLVWUDomR� GH�WHFQRORJLD� GD� LQIRUPDomR – Teoria e prática: 2003. Tradução de Teresa Félix de Souza. Brasil. Rio de Janeiro. 4ª Edição. Ed. Campus, 2004. 598p.

UNICAMP:;,,� &RQJUHVVR� ,QWHUQR� GH� ,QLFLDomR� &LHQWtILFD. Brasil. São Paulo: Ed. Universidade de Campinas (UNICAMP). 398p. Setembro 2004.

VASCONCELOS, Pedro F. C.�HW�DO��(SLGHPLD�GH�GHQJXH�HP�)RUWDOH]D��&HDUi�� LQTXpULWR�VRUR�HSLGHPLROyJLFR� DOHDWyULR��Brasil. 5HY�� 6D~GH�3~EOLFD. Out. 1998, vol.32, no.5, p.447-454. ISSN 0034-8910.

VENÂNCIO DA CUNHA, Rivaldo HW� DO��'HQJXH� LQIHFWLRQ� LQ�3DUDFDPEL�� 6WDWH� RI�5LR� GH�-DQHLUR�����������. Rev. Soc. Bras. Med. Trop. Set./out. 1997, vol.30, no.5, p.379-383. ISSN 0037-8682.

VIANELLO, Rubens Leite; ALVES, Adil Ramier:0HWHRURORJLD� EiVLFD� H� DSOLFDo}HV��Universidade Federal de Viçosa, Imprensa Universitária, p.384-397, Viçosa –Minas Gerais, 1991.

WANG, Hui; WEIGEND, Andreas S.:'DWD� PLQLQJ� IRU� ILQDQFLDO� GHFLVLRQ� PDNLQJ. Ed. Elsevier, 2004, p. 457-460.

Page 146: Dissertação Giovanni - Revisões Feitas

133

WESTPHAL, Márcia Faria:2 PRYLPHQWR�FLGDGHV�PXQLFtSLRV�VDXGiYHLV��XP�FRPSURPLVVR�FRP� D� TXDOLGDGH� GH� YLGD. Associação Brasileira de Pós-graduação em Saúde Coletiva –ABRASCO. 2000, Volume 5 número 1. ISSN 1413-8123

WIETEK, Frank; KAMP, Vera: 6SDWLDO�'DWD�$QDO\VLV�6XSSRUW�IRU�&DQFHU�(SLGHPLRORJ\�LQ�&$5(66� *HRPHGLFDO�6\VWHPV (GEO-MED 97), 11p 1997.

ZELASNY Gene�&RPXQLFDomR�YLVXDO�SDUD�H[HFXWLYRV���Utilizando gráficos como poderosa ferramenta de trabalho. Tradução de Aníbal Mari. Brasil. São Paulo, Ed. Futura, 1997. 203p.

Page 147: Dissertação Giovanni - Revisões Feitas

134

*ORVViULR��GLFLRQiULR�GH�WHUPRV�� Termo Significado Autor/página Arbovírus Um vírus difundido por artrópodes i.e. um vírus que é

transmitido por insetos ou pequenos aracnídeos WHO, 1996, p. 01

apud Citado por, conforme, segundo Exemplo: (EVANS, 1987, apud SAGE, 1992, p. 2-3) Segundo Silva (apud ABREU, 1999, p. 3) diz ser [...]

SERRA NEGRA, 2003, p. 165

e.g. (latim H[HPSOL�JUDWLD), Por exemplo MELHORAMENTOS, 1998, 1034

Endemia Doença que ocorre constantemente em determinada região. MICHAELIS, 1998, p.468

Epidemia Doença que ataca ao mesmo tempo muitas pessoas da mesma região. (Michaelis, 1998, p.483)

“A ocorrência em uma comunidade ou em uma região, de um número de casos específicos no comportamento de uma doença, ou outros eventos claramente relacionados que indiquem a presença de uma epidemia que varia de acordo com o agente da população exposta e experiência (falta de precedente da exposição à doença e época e lugar da ocorrência)” (LAST, 2001 DSXG WHO, 2004, p. 14, tradução nossa).

i.e. Isto é MELHORAMENTOS, 1998, 1036

Interação Ação recíproca de dois ou mais corpos uns nos outros; Atualização da influência recíproca de corpos inter-relacionados; Ação Recíproca entre o usuário e um equipamento; Ações e relações entre os membros de um grupo ou entre grupos de uma sociedade.

MICHAELIS, 1998, p.691

Investigaçãoepidemiológica

“Investigação epidemiológica é um trabalho de campo, realizado a partir de casos notificados (clinicamente declarados ou suspeitos) e seus contatos, que tem como principais objetivos: identificar fonte e modo de transmissão: grupos expostos a maior risco; fatores determinantes; confirmar diagnóstico; e determinar as principais características epidemiológicas. O seu propósito final é orientar medidas de controle para impedir a ocorrência de novos casos” (FUNASA, 2002, 31).

(FUNASA, 2002, 31).

Iteração Ato e iterar repetir MICHAELIS, 1998, p.710

Modelo É a descrição formal de um sistema. Estas descrições modem possuir muitas formas, dependendo do propósito do modelo. O propósito do modelo é descrever a relação entre a entrada e saída dos dados do sistema.

DELMATER e HANCOCK, 2001, p. 06

Mosquito Aedes

Tipo de mosquito que pode transmitir doenças como a Febre Amarela e o Dengue

WHO, 1996, p. 01

Notificação “Notificação é a comunicação da ocorrência de determinada doença ou agravo à saúde, feita à autoridade sanitária por

FUNASA, 2002, p. 15

Page 148: Dissertação Giovanni - Revisões Feitas

135

profissionais de saúde ou qualquer cidadão, para fins de adoção de medidas de intervenção pertinentes” (FUNASA, 2002, p. 15)

Surto “Uma epidemia (praga) limitada a um local que aumenta na incidência de uma doença (enfermidade). e.g. em uma vila, cidade ou instituição fechada”

LAST (2001 DSXGWHO, 2004, p.14, tradução nossa)

Sazonal “Relativo à estação do ano, à sazão” MICHAELIS, 1998, p.1114

Page 149: Dissertação Giovanni - Revisões Feitas

136

$QH[R� $ �� 62/,&,7$d­2� '(� '2$d­2� '(� '$'26� $2� 6(&5(7È5,2�081,&,3$/�'(�6$Ò'(�'(�*2,Æ1,$�� *2

³6U��6HFUHWiULR���

3DUD�GDU� SURVVHJXLPHQWR� H� FRQVROLGDU� D� SHVTXLVD�HIHWXDGD�HP�PLQKD�GLVVHUWDomR� GH� 0HVWUDGR�� QD� 8QLYHUVLGDGH� &DWyOLFD� GH� %UDVtOLD�� QHFHVVLWR� TXH�VHMDP� IRUQHFLGDV�� D� WtWXOR� GH� GRDomR� SDUD� SHVTXLVD� FLHQWtILFD�� DV� LQIRUPDo}HV��%DQFR� GH� GDGRV�� PDSDV�� GDGRV� H� 3.�� SHUWHQFHQWHV� j� 6HFUHWDULD� 0XQLFLSDO� GH�6D~GH�� UHIHUHQWHV� DR� 6LVWHPD� 1DFLRQDO� GH� $JUDYRV� H� 1RWLILFDomR� �6,1$1��� QR�SHUtRGR� GH� ��� MDQHLUR� GH� ����� D� ��� DEULO� GH� ������ VREUH� DV� GRHQoDV�'HQJXH� H�)HEUH�$PDUHOD��� (VFODUHoR�TXH�HVWRX�FLHQWH�GD�UHVSRQVDELOLGDGH�SHOD�QmR�GLYXOJDomR�GRV�GDGRV�SDUD�RXWURV�ILQV�TXH�QmR�DFDGrPLFRV���

2V� GDGRV�� FRQVWDQWHV� QR� 6,1$1�� TXH� QmR� VHUmR� XWLOL]DGRV� QD� QRVVD�SHVTXLVD� VmR�� QRPH� GR� SDFLHQWH�� ORJUDGRXUR�� UDoD�� HVFRODULGDGH�� QXPHUR� GR�FDUWmR�686��QRPH�GD�PmH��WHOHIRQH��RFXSDomR��GHVORFDPHQWR��GDWD�GD�~OWLPD�GRVH�GH� IHEUH� DPDUHOD�� VH� RFRUUHX� D� KRVSLWDOL]DomR�� GDWD� GH� KRVSLWDOL]DomR��PXQLFtSLR�QRPH�HQGHUHoR�WHOHIRQH� GR� KRVSLWDO�� ORFDO� SURYiYHO� GH� LQIHFomR��REVHUYDo}HV�³

Page 150: Dissertação Giovanni - Revisões Feitas

137

$QH[R� %� �� 62/,&,7$d­2� '(� '2$d­2� '(� '$'26� $2� ',5(725�35(6,'(17(�'$�&20'$7$�

³6U��3UHVLGHQWH��3DUD� GDU� SURVVHJXLPHQWR� H� FRQVROLGDU� D� SHVTXLVD� HIHWXDGD� HP� PLQKD�

GLVVHUWDomR�GH�0HVWUDGR��QD�8QLYHUVLGDGH�&DWyOLFD�GH�%UDVtOLD��QHFHVVLWR�TXH�VHMDP�IRUQHFLGDV�� D� WtWXOR� GH� GRDomR� SDUD� SHVTXLVD� FLHQWtILFD�� RV� VHJXLQWHV� GDGRV�UHIHUHQWHV�D�&LGDGH�GH�*RLkQLD���

• &yGLJR�GR�EDLUUR��• 1RPH�GR�EDLUUR��• 1~PHUR�GH�HVFRODV�SRU�EDLUUR��• 1~PHUR�GH�KRVSLWDLV�SRU�EDLUUR��• 1~PHUR�GH�SUpGLRV�SRU�EDLUUR��• 4XDQWLGDGH�WRWDO�GH�ORWHV�SRU�EDLUUR���• 4XDQWLGDGH�WRWDO�GH�ORWHV�UHVLGHQFLDLV�SRU�EDLUUR��• 4XDQWLGDGH�WRWDO�GH�ORWHV�FRPHUFLDLV�SRU�EDLUUR��• 7RWDO�GH�iUHD�YHUGH�SRU�EDLUUR��• $VIDOWR��FRPSOHWDPHQWH�DVIDOWDGR��SDUFLDOPHQWH�DVIDOWDGR��VHP�DVIDOWR���• ,QVWDODomR�6DQLWiULD��&RPSOHWD��6HP���• ÈJXD� �+LGU{PHWUR�� &LVWHUQD�� &LVWHUQD� +LGU{PHWUR�� 3RoR� $UWHVLDQR��6HP���• (QHUJLD�(OpWULFD��• (VJRWR��5HGH�3~EOLFD��)RVVD�6pSWLFD��)RVVD�1HJUD��6HP���

�(VFODUHoR�TXH� HVWRX� FLHQWH� GD� UHVSRQVDELOLGDGH�SHOD�QmR�

GLYXOJDomR�GRV�GDGRV�SDUD�RXWURV�ILQV�TXH�QmR�DFDGrPLFRV�´

Page 151: Dissertação Giovanni - Revisões Feitas

138

$QH[R� &� �� 6ROLFLWDomR� GH� GRDomR� GH� GDGRV� &OLPiWLFRV� DR�0LQLVWpULR�GD�$JULFXOWXUD�H�GR�$EDVWHFLPHQWR��

³6U��$ODRU�0RDF\U�'¶DOODQW{QLD�-~QLRU��'LUHWRU�GR�����'LVWULWR�GH�0HWHRURORJLD�HP�*RLiV��',60(���&DUR�6U�$ODRU���*RVWDULD�VH�SRVVtYHO�FRQWDU�QRYDPHQWH�FRP�VXD�JUDWLGmR��FRPSUHHQVmR�H�ERD�

YRQWDGH� QR� VHQWLGR� GH� YLDELOL]DU� D� GRDomR� GRV� GDGRV� QHFHVViULDV� DR� SOHQR�GHVHQYROYLPHQWR� H� ILQDOL]DomR� GD� GLVVHUWDomR� GH� 0HVWUDGR� GH� PHX� RULHQWDQGR�*LRYDQQL�*RQGLP���

*LRYDQQL� WrP� GHGLFDGR� IRUWHPHQWH� HP� VXD� SHVTXLVD� TXH� WUDWD� GR�GHVHQYROYLPHQWR�GH�XP�PRGHOR�TXH��DFUHGLWDPRV��VHMD�FDSD]�GH�SUHYHU�HQGHPLDV�H�HSLGHPLDV�GH�)HEUH�$PDUHOD�H�'HQJXH��WHQGR�FRPR�FHQiULR�SDUD�HVWXGR�GH�FDVR�D�FLGDGH�GH�*RLkQLD�� H� TXH� VHMD� HTXLYDOHQWH� RX�DWp�PHVPR�VXSHULRU� DRV�PRGHORV� Mi�H[LVWHQWHV��LQFOXVLYH�RV�XWLOL]DGRV�SHOD�2UJDQL]DomR�0XQGLDO�GH�6D~GH���

Os dados serão utilizados exclusivamente para este projeto de pesquisa e

teremos imenso prazer de citá-los em nossas publicações.“

Page 152: Dissertação Giovanni - Revisões Feitas

139

$QH[R�'���&DOHQGiULR�HSLGHPLROyJLFR�GH������D������Semana Epidemiológica Inicio Fim S01 20001231 20010106S02 20010107 20010113S03 20010114 20010120S04 20010121 20010127S05 20010128 20010203S06 20010204 20010210S07 20010211 20010217S08 20010218 20010224S09 20010225 20010303S10 20010304 20010310S11 20010311 20010317S12 20010318 20010324S13 20010325 20010331S14 20010401 20010407S15 20010408 20010414S16 20010415 20010421S17 20010422 20010428S18 20010429 20010505S19 20010506 20010512S20 20010513 20010519S21 20010520 20010526S22 20010527 20010602S23 20010603 20010609S24 20010610 20010616S25 20010617 20010623S26 20010624 20010630S27 20010701 20010707S28 20010708 20010714S29 20010715 20010721S30 20010722 20010728S31 20010729 20010804S32 20010805 20010811S33 20010812 20010818S34 20010819 20010825S35 20010826 20010901S36 20010902 20010908S37 20010909 20010915S38 20010916 20010922S39 20010923 20010929S40 20010930 20011006S41 20011007 20011013S42 20011014 20011020S43 20011021 20011027S44 20011028 20011103S45 20011104 20011110S46 20011111 20011117S47 20011118 20011124S48 20011125 20011201S49 20011202 20011208S50 20011209 20011215S51 20011216 20011222

Page 153: Dissertação Giovanni - Revisões Feitas

140

S52 20011223 20011229S01 20011230 20020105S02 20020106 20020112S03 20020113 20020119S04 20020120 20020126S05 20020127 20020202S06 20020203 20020209S07 20020210 20020216S08 20020217 20020223S09 20020224 20020302S10 20020303 20020309S11 20020310 20020316S12 20020317 20020323S13 20020324 20020330S14 20020331 20020406S15 20020407 20020413S16 20020414 20020420S17 20020421 20020427S18 20020428 20020504S19 20020505 20020511S20 20020512 20020518S21 20020519 20020525S22 20020526 20020601S23 20020602 20020608S24 20020609 20020615S25 20020616 20020622S26 20020623 20020629S27 20020630 20020706S28 20020707 20020713S29 20020714 20020720S30 20020721 20020727S31 20020728 20020803S32 20020804 20020810S33 20020811 20020817S34 20020818 20020824S35 20020825 20020831S36 20020901 20020907S37 20020908 20020914S38 20020915 20020921S39 20020922 20020928S40 20020929 20021005S41 20021006 20021012S42 20021013 20021019S43 20021020 20021026S44 20021027 20021102S45 20021103 20021109S46 20021110 20021116S47 20021117 20021123S48 20021124 20021130S49 20021201 20021207S50 20021208 20021214S51 20021215 20021221S52 20021222 20021228S01 20021229 20030104S02 20030105 20030111

Page 154: Dissertação Giovanni - Revisões Feitas

141

S03 20030112 20030118S04 20030119 20030125S05 20030126 20030201S06 20030202 20030208S07 20030209 20030215S08 20030216 20020222S09 20030223 20030301S10 20030302 20030308S11 20030309 20030315S12 20030316 20030322S13 20030323 20030329S14 20030330 20030405S15 20030406 20030412S16 20030413 20030419S17 20030420 20030426S18 20030427 20030503S19 20030504 20030510S20 20030511 20030517S21 20030518 20030524S22 20030525 20030531S23 20030601 20030607S24 20030608 20030614S25 20030615 20030621S26 20030622 20030628S27 20030629 20030705S28 20030706 20030712S29 20030713 20030719S30 20030720 20030726S31 20030727 20030802S32 20030803 20030809S33 20030810 20030816S34 20030817 20030823S35 20030824 20030830S36 20030831 20030906S37 20030907 20030913S38 20030914 20030920S39 20030921 20030927S40 20030928 20031004S41 20031005 20031011S42 20031012 20031018S43 20031019 20031025S44 20031026 20031101S45 20031102 20031108S46 20031109 20031115S47 20031116 20031122S48 20031123 20031129S49 20031130 20031206S50 20031207 20031213S51 20031214 20031220S52 20031221 20031227S53 20031228 20040103S01 20040104 20040110S02 20040111 20040117S03 20040118 20040124S04 20040125 20040131

Page 155: Dissertação Giovanni - Revisões Feitas

142

S05 20040201 20040207S06 20040208 20040214S07 20040215 20040221S08 20040222 20040228S09 20040229 20040306S10 20040307 20040313S11 20040314 20040320S12 20040321 20040327S13 20040328 20040403S14 20040404 20040410S15 20040411 20040417S16 20040418 20040424S17 20040425 20040501

Page 156: Dissertação Giovanni - Revisões Feitas

143

$QH[R�(���(VFDOD�$QHPRPpWULFD�%HDXIRUW�$GDSWDGD�

VENTO Velocidade equivalente na altura padrão de 10m acima de um terreno plano e descoberto

No Beaufort Termo Descritivo

Vel. Med. Nó

m/seg. Km/h Especificações em terra

0 Clma < 1 0 - 0.2 < 1 Não se nota o menor deslocamento nos mais leves objetos. A fumaça eleva-se verticalmente

1 Aragem 1 -3 0.3 -1.5 1 -5 A direção do vento é indicada pelo desvio da fumaça mas não pelos cata-ventos.

2 Brisa leve 4 -6 1.6 - 3.3 6 -11 Sente-se o vento na face; as folhas das árvores são levemente agitadas; os cata-ventos comuns são acionados.

3 Brisa fraca

7 - 10 3.4 -5.4 12 -19 As folhas e os pequenos arbustos ficam em agitação contínua; as bandeiras leves começam a se estender.

4 Brisa moderada

11 - 16 5.5 - 7.9 20 -28 Move-se os pequenos galhos das árvores, poeira e pedaços de papel são levantados.

5 Brisa forte

17 - 21 8.0 -10.7

29 -38 As árvores pequenas com folhagem começam a oscular, aparecem ondas com crista nas superfície dos rios e lagos.

6 Vento fresco

22 - 27 13.9 -17.1

39-49 Galhos maiores das árvores agitadas; ouve-se os assobios produzidos pelo vento ao passar pelos fios telegráficos; torna-se difícil de usar o guarda-chuva.

7 Vento forte

28 - 33 17.2 -20.7

50 -61 Os troncos das árvores oscilam; torna-se difícil andar contra o vento.

8 Ventania 34 - 40 20.8 -24.4

62 -74 Geralmente torna-se impossível andar contra o vento. Quebram-se os galhos das árvores.

9 Ventania forte

41 - 47 24.5 - 28.4

75 -88 Ocorrem pequenos danos nas edificações (telhas, chaminés são arrancadas).

10 Tempestade

48 - 55 24.5 -28.4

89 -102 Raro no interior da terra; as árvores são derrubadas; as edificações sofrem danos materiais consideráveis.

Page 157: Dissertação Giovanni - Revisões Feitas

144

11 Tempestadeviolenta

56 - 63 38.5 -32.6

103 -117

É observado muito raramente; produz grandes destruições.

12 Furação 64 - 71 32.7-36.9

118 -133

Poucos danos - as árvores, os arbustos e os trailers serão arrastados se não forem amarrados a algum lugar seguro. Outros tipos de construção serão atingidas de forma mais amena. Destruição parcial ou total de letreiros e anúncios mal instalados. Seqüência de ondas com altura de 1 a 1,5 m acima do normal. Inundação de ruas e estradas próximas à costa. Poucos danos em ancoradouros. As embarcações pequenas têm suas amarras rompidas.

13 Furação 72 -80 37.0 -

41.4 134 -149

Poucos danos - as árvores, os arbustos e os trailers serão arrastados se não forem amarrados a algum lugar seguro. Outros tipos de construção serão atingidas de forma mais amena. Destruição parcial ou total de letreiros e anúncios mal instalados. Seqüência de ondas com altura de 1 a 1,5 m acima do normal. Inundação de ruas e estradas próximas à costa. Poucos danos em ancoradouros. As embarcações pequenas têm suas amarras rompidas.

14 Furação 81 - 89 41.5 -

46.1 150 -166

Danos moderados - danos consideráveis em árvores e arbustos. Perda total de trailers, letreiros e anúncios. Destruição parcial de telhados, portas e janelas. Poucos danos em construções. Seqüência de ondas com altura de 1,8 a 2,4 m acima do normal. Inundação de ruas e estradas próximas à costa. As avenidas que estão em terrenos baixos são interrompidas de 2 a 4 horas antes da chegada do centro do furacão. As marinas ficam inundadas. É obrigatória a retirada

Page 158: Dissertação Giovanni - Revisões Feitas

145

dos moradores das áreas costeiras. 15 Furação 90 - 99 46.2 -

50.9 167 -183

Danos moderados - danos consideráveis em árvores e arbustos. Perda total de trailers, letreiros e anúncios. Destruição parcial de telhados, portas e janelas. Poucos danos em construções. Seqüência de ondas com altura de 1,8 a 2,4 m acima do normal. Inundação de ruas e estradas próximas à costa. As avenidas que estão em terrenos baixos são interrompidas de 2 a 4 horas antes da chegada do centro do furacão. As marinas ficam inundadas. É obrigatória a retirada dos moradores das áreas costeiras.

16 Furação 100 - 108

51.0 - 56.0

184 -201

Muitos danos - ramos de árvores são arrancados. Árvores grandes são derrubadas. Anúncios e letreiros são arrastados pelo vento. Danos em telhados, portas e janelas de casas. Danos na estrutura de edifícios pequenos. Trailers são destruídos. Seqüência de ondas com altura de 2,8 a 3,7m acima do normal, inundando a área costeira e destruindo casas próximas ao litoral. Prédios de porte são danificados por causa das ondas. As avenidas de emergência, que estão em terrenos baixos, são interrompidas de 3 a 5 horas antes da chegada do centro do furacão. Os terrenos que estão a 1,5 m ou menos acima do nível do mar são inundados. A água avança cerca de 12 km continente adentro. É exigida a retirada dos moradores das áreas costeiras.

17 Furação 109 - 118

56.1 - 61.2

202 -220

Danos extremos - as árvores são arrastadas pelo vento. Os anúncios e letreiros são arrancados ou destruídos. Grandes danos nos telhados, janelas e portas das casas. Algumas paredes e tetos de residências são completamente destruídos. Trailers são destruídos. Seqüência de ondas com altura de

Page 159: Dissertação Giovanni - Revisões Feitas

146

4 a 5,5 m acima do normal. Os terrenos que estão a pelo menos 3 m acima do nível do mar são inundados e a água avança cerca de 9,6 km continente adentro. As avenidas e estradas de emergência, escolhidas para a retirada de moradores, são interrompidas de 3 a 5 horas antes da chegada do centro do furacão. É obrigatória a retirada total de todas as pessoas que morem próximo à costa e que vivam em terrenos baixos, a uma distância de�����NP�GR�PDU�

Fonte: Manual de Observações Meteorológicas - INMET Fração da abóbada celeste coberta por nuvens

Fonte: Manual de Observações Meteorológicas - INMET UMIDADE RELATIVA DO AR (URA) > - 12% Estado de emergência 12 - 20% Estado de alerta 20 - 30% Estado de atenção 30 - 40% Desconfortável 40 - 50% Desconfortável 50 - 60% Confortável 60 - 70% Confortável 70 - 80% Confortável 80 - 90% Muito úmido 90 - 100% Muito úmido Fonte: Unicamp UMIDADE RELATIVA DO AR (URA) > - 12% Árido 12 - 20% Árido 20 - 30% Semi-árido 30 - 40% Subúmido

Divisão da Abóbada Celeste Quantidade de Nuvens 0 - Ausência de nuvens 0 Céu claro 1 - oitavo ou menos de céu

coberto mas não zero 1/10 ou menos, mas não zero Parcialmente nublado

2 - oitavos de céu coberto 2/10 - 3/10 Parcialmente nublado 3 - oitavos de céu coberto 4/10 Parcialmente nublado 4 - oitavos de céu coberto 5/10 Nublado 5 - oitavos de céu coberto 6/10 Nublado 6 - oitavos de céu coberto 7/10 - 8/10 Nublado 7 - oitavos de céu coberto 9/10 ou mais, menos 10/10 Nublado 8 - Céu completamente encoberto 10/10 Encoberto

Page 160: Dissertação Giovanni - Revisões Feitas

147

40 - 50% Subúmido 50 - 60% Úmido 60 - 70% Úmido 70 - 80% Úmido 80 - 90% Muito úmido 90 - 100% Muito úmido Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado TEMPERATURA MÉDIA DO AR (oC) -3 – 10 Clima polar -3 - 18 Clima temperado 18 - 24 Clima tropical/Subtropical 20 - 27 Clima Equatorial 28 - 30 Clima desértico e clima de monções

TEMPERATURA DO AR (oC) -3 – 0 Climar polar 0 – 5 Clima temperado/clima polar 5 – 10 Clima temperado 10 – 15 Clima subtropical 15 – 20 Clima tropical 20 – 25 Clima tropical/Equatorial 25 – 30 Clima tropical/Equatorial 30 - 35 Clima tropical/Equatorial 35 – 40 Clima semi-árido 40 – 45 Clima semi-árido/clima desértico 45 - 50 Clima semi-árido/clima desértico Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado AMPLITUDE TÉRMICA DIURNA (oC) 1 - 3 Clima Equatorial 3 – 5 Clima Equatorial/ 5 – 7 Clima tropical 7 – 9 Clima tropical 9 – 11 Clima subtropical/ Clima tropical 11 – 13 Clima subtropical/ Clima tropical 13 – 15 Clima subtropical/ Clima tropical 15 – 17 Clima tropical 17 - 19 Clima tropical/ Clima subtropical 19 – 21 Clima tropical/ Clima subtropical 21 – 23 Clima tropical/Clima temperado

continental 23 – 25 Clima tropical 25 - 27 Clima desértico 27 – 29 Clima desértico 29 – 31 Clima desértico 31 – 33 Clima desértico

Page 161: Dissertação Giovanni - Revisões Feitas

148

33 - 35 Clima desértico

Evaporação diária (mm) 0 - 1 Clima polar 1 - 5 Clima equatorial/ clima subtropical 5 - 7 Clima tropical 7 - 9 Clima tropical 9 - 11 Clima semi-árido/ clima desértico 11 - 13 Clima semi-árido/ clima desértico 13 - 15 Clima semi-árido/ clima desértico 15 - 17 Clima semi-árido/ clima desértico

Grau de intensidade de precipitação Chuvisco fraco Máx. 0,3mm/h Visibilidade superior a 1.000 metros.

Chuvisco moderado

0,3 - 0,5mm/h Visibilidade entre 500 e 1.000 metros.

Chuvisco forte 0,5 mm/h Visibilidade inferior a 500 metros.

Chuva fraca

1,1 - 5mm/h 0,8 mm/10min As gotas de chuvas são bem destacadas; os pingos nos telhados fracos, poças d’água corrente nas sarjetas das ruas.

5,1 – 15mm/h 6,0 mm/10min 15 – 25mm/h 6,0 mm/10min 25 – 35mm/h 6,0 mm/10min 35 – 45mm/h 6,0 mm/10min

Chuva moderada

45 – 60mm/h 6,0 mm/10min

As gotas de chuva identificam-se bem e ao encontrarem superfícies duras provocam borrifos; o escoamento das águas nas calhas dos telhados vai de um terço a mais da metade de sua capacidade; a queda das chuvas nos telhados provoca ruídos assemelhados a desde um simples chiado até o bater de tambores.

Chuva forte > 60mm/h 10,0mm/10min A chuva cai torrencialmente e todas as demais características são mais acentuadas que as indicadas para chuva moderada.