tese de doutorado em computação aplicada adair santa catarina
Post on 03-Jan-2016
43 Views
Preview:
DESCRIPTION
TRANSCRIPT
SAHGA – Um algoritmo genético híbrido com representação explícita de relacionamentos espaciais para análise de dados geoespaciais
Tese de doutorado em Computação Aplicada
Adair Santa Catarina
Orientadores: Dr. Antônio Miguel Vieira Monteiro
Dr. João Ricardo de Freitas Oliveira
INPE – Abr/2009
2
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
3
Introdução
Dados Organizado
s
GIS
Geoco
mputa
ç
ão
Informações
Dados
4
Introdução
Dados Organizado
s
• Model Breeders (Openshaw, 1997);
• GARP (Stockwell e Peters, 1999).
Informações
Negligenciam os relacionamentos espaciais XDependência
Espacial(Lei de Tobler)
5
É possível incorporar os relacionamentos espaciais em sistemas semi-automáticos de análise de dados geoespaciais baseados em AG?
Estes sistemas são capazes de operar sobre um modelo generalizado de relacionamentos espaciais?
Os relacionamentos espaciais afetam os resultados fornecidos por tais sistemas?
O conhecimento pré-existente, acerca dos fatores ambientais que afetam o problema em estudo, pode ser representado nestes sistemas?
Questões
6
Hipótese Central
É possível incorporar aos AG, utilizados em sistemas de análise de dados geoespaciais, uma estrutura para representação explícita de relacionamentos espaciais, a GPM – Generalized Proximity Matrix, possibilitando-os considerar os efeitos da dependência espacial nos fenômenos estudados.
Verificação da hipótese prova de conceito SAHGA – Spatially Aware Hybrid Genetic
Algorithm SAHGA MB dados sócio-econômicos SAHGA SDM duas espécies de aves
7
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
8
Representação do Espaço 2D
Polígonos ou grades regulares:
9
Generalized Proximity Matrix (GPM) Aguiar et al., 2003. Estrutura da GPM:
Conjunto de objetos O: Células regulares; Polígonos.
Grafo (G): Nós = objetos; Arcos = relacionamentos.
Matriz de proximidade (V): Conjunto de valores Wij que indicam o quanto dois
objetos Oi e Oj estão relacionados; Wij relacionamentos no espaço absoluto ou relativo.
10
Algoritmos Genéticos (AG)
11
Simulated Annealing
Metropolis (1953); Kirkpatrick et al. (1983):
ij
k
ij
ij
c ggsec
gg
ggse
jaceitarPk exp
1
)(
gi e gj = níveis energéticos;
ck = temperatura.
Extensão do método de busca local; Habilidade para fugir da armadilha do
ótimo local.
12
Model Breeders
Openshaw & Openshaw (1997), Santa Catarina et al. (2005):
y = f(x1, x2, ..., xn);
Núcleo de otimização utilizam AG; Vantagens: modelos simples de
compreender e eficiência computacional; Desvantagem: simplificação do fenômeno
observado e grande consumo de tempo para resposta ótima.
13
Species Distribution Models (SDM)
Fonte: Adaptado de Siqueira (2005)
14
Tipos de Modelos usados em Ecologia
Analíticos; Mecanicistas; Empíricos SDM.
Fonte: Adaptado de Guisan e Zimmerman (2000)
15
Avaliação dos SDM
Matriz de Confusão
Fonte: Adaptado de Siqueira (2005)
Fonte: Adaptado de Meyer (2005)Fonte: Braga (2000)
16
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
17
SAHGA Model Breeder
Codificação:
Função de aptidão: Constanteˆ
1 110
n
k
NRE
jij
NRE
jkjijki
ii
WXWCXX
m
iii XXAptidão
1
2
00ˆ
Dados de entrada:
18
Núcleo de Otimização – SAHGA
19
Operadores Genéticos – SAHGA
Seleção pelo método da roleta; Cruzamento aritmético de Michalewicz
(1996): 212
211
1
1
ppc
ppc
Mutação uniforme [-4; 4]; Busca local (SA) mutação uniforme [-0,5;
0,5]; Elitismo.
Padronização das variáveis de entrada:
s
xXX p
20
Parâmetros do SAHGA
Grefenstette (1986), De Jong e Spears (1991) e Santa Catarina e Bach (2003).
21
Estudo de Caso – SAHGA MBX0 = Número de
filhos nascidos vivos;
X1 = Número de domicílios com banheiro;
X2 = Número de domicílios cujo responsável tem 8 ou mais anos de estudo;
X3 = Número de domicílios onde a renda é maior que 3 salários mínimos.Fonte: IBGE
(2007)
22
Modelos Ajustados – SAHGA MB
Desconsiderando a GPM:
0025,03185,37114,25605,1ˆ3210 pppp XXXX
Cada estado está relacionado apenas consigo mesmo Wii = 1
Aptidão mínima = 0,9298.
Considerando a GPM:
Aptidão mínima = 1,0737.
011,00,43491,35397,1ˆ3210 pppp XXXX
Configuração dos parâmetros = Default
23
Conclusões – SAHGA MB
Modelos ajustados estimam adequadamente X0 em função das variáveis independentes;
Trabalha com diferentes tipos de modelos, utilizando a mesma estrutura de codificação: Adaptação para modelos quadráticos
Constanteˆ
1
1
1
1
1
2
20
n
kNRE
jij
NRE
jkjij
kNRE
jij
NRE
jkjij
kii
i
i
i
W
XW
CX
W
XW
CXX
24
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
25
SAHGA SDM
Codificação (=):
Dados de entrada:
Função de aptidão: Constanteˆ
1 110
n
k
NRE
jij
NRE
jkjijki
ii
WXWCXX
m
i iiii
iiiiii
XeXouXeXse
XeXouXeXseXXAptidão
1 0000
00002
005,0ˆ15,0ˆ0,1
5,0ˆ15,0ˆ0,01,0ˆ
26
Estudos de Caso – SAHGA SDM
Distribuição potencial de duas espécies de aves:
Strix varia Thalurania furcata boliviana
27
Estudos de Caso – SAHGA SDM
Comparação SAHGA SDM x GARP (SR e BS) openModeller Desktop v1.0.6 (CRIA et al., 2008);
SAHGA SDM: Modelos com e sem relacionamentos espaciais; Construção da GPM:
Parâmetros: Hard.
28
Espécie Strix varia
Dados: Base exemplo do DesktopGarp (Kansas
University, 2007); 1218 pontos de presença 100 selecionados; 7 layers geográficos: temperatura, precipitação
e relevo; 100 pontos de pseudo-ausência modelo
BioClim (Nix, 1986) openModeller Desktop; Treino (50%) e teste (50%); GPM raio de 100 km.
29
Modelo BioClim – Strix varia
30
Modelos S1 e S2 – Strix varia
Modelo S1 Modelo S2
31
Distribuição Potencial – Modelos S1 e S2
32
Modelos SGSR e SGBS – Strix varia
Modelo SGSR
Modelo SGBS
33
Distribuição Potencial – Modelos SGSR e SGBS
34
Espécie Thalurania furcata boliviana Dados:
Base exemplo do openModeller Desktop; 65 pontos de presença; 8 layers geográficos: precipitação e
temperatura; 50 pontos de pseudo-ausência modelo
BioClim openModeller Desktop; Treino (40P/30A) e teste (25P/20A); GPM raio de 100 km.
35
Modelo BioClim – Thalurania furcata boliviana
36
Modelos T1 e T2 – Thalurania furcata boliviana
Modelo T1 Modelo T2
37
Distribuição Potencial – Modelos T1 e T2
38
Modelos TGSR e TGBS – Thalurania furcata boliviana
Modelo TGSR Modelo TGBS
39
Distribuição Potencial – Modelos TGSR e TGBS
40
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
41
Conclusões
Sistemas de análise de dados geoespaciais que utilizam AG negligenciam os efeitos da dependência espacial;
Prova de conceito SAHGA – Spatially Aware Hybrid Genetic Algorithm relacionamentos espaciais GPM;
Algoritmo de uso múltiplo: SAHGA MB Dados sócio-econômicos; SAHGA SDM Strix varia e Thalurania furcata
boliviana.
42
Conclusões
SAHGA MB:
Ajuste de modelos sem e com relacionamentos espaciais (GPM);
Modelos ajustados são distintos influência dos relacionamentos espaciais.
Ambos estimam adequadamente o valor padronizado da variável dependente.
43
Conclusões SAHGA SDM:
44
Conclusões
Representação de conhecimento do especialista: No espaço relativo SAHGA MB:
Associações entre estados independem da distância; Válida para alguns estados.
No espaço absoluto SAHGA SDM: Pesos Wij variam em função da distância; 0 – 50 km = 1,0; 50 – 100 km = 0,5.
Adaptabilidade do algoritmo modelos mais complexos: Adaptação da estrutura cromossômica; Reescrita da função de aptidão.
45
Trabalhos Futuros
Geração automática da GPM: Relacionamentos pré-definidos: toca,
intercepta, perto de, etc. Outros tipos de modelos:
Estruturas cromossômicas e funções de aptidão pré-definidas;
Rotinas de pré-análise de dados; Geração automática de pontos de pseudo-
ausência; GPM dinâmicas:
Análise de dados espaço-temporais.
46
Roteiro
Introdução
Referencial Teórico: Representação do espaço bi-dimensional e vizinhança
espacial;
Algoritmos Genéticos;
Model Breeders;
Species Distribution Models.
SAHGA Model Breeder
SAHGA SDM
Conclusões
Referências Bibliográficas
47
Referências BibliográficasAGUIAR, A. P. D. et al. Modeling spatial relations by generalized proximity matrices. In: Brazilian Symposium on Geoinformatics, 5, 2003. Campos do Jordão - SP. Anais eletrônicos... São José dos Campos: INPE, Nov. 2003. Disponível em: <http://www.geoinfo.info/geoinfo2003/papers/geoinfo2003-11.pdf>. Acesso em: 04/07/2006.
BRAGA, A. C. S. Curvas ROC: aspectos funcionais e aplicações. 2000. 243 p. Tese (Doutorado em Engenharia de Produção e Sistemas) - Universidade do Minho, Braga.
CENTRO DE REFERÊNCIA EM INFORMAÇÃO AMBIENTAL; ESCOLA POLITÉCNICA DA USP; INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. openModeller. 2008. Disponível em: <http://openmodeller.sourceforge.net/>. Acesso em: 12/07/2008.
DE JONG, K. A. An analysis of the behavior of a class of genetic adaptive systems. 1975. 256 p. Tese (Ph. D. in Computer and Communication Sciences) - University of Michigan, Ann Arbor.
GREFENSTETTE, J. J. Optimization of control parameters for genetic algorithms. IEEE transactions on systems, man and cybernetics, v. 16, n. 1, p. 122-128, Jan./Fev. 1986.
GUISAN, A.; ZIMMERMANN, N. E. Predictive habitat distribution models in ecology. Ecological Modelling, v. 135, n. 2-3, p. 147-186, Dez. 2000.
HOLLAND, J. H. Adaptation in natural and artificial systems. Cambridge: MIT Press, 1992. 228 p.
48
Referências BibliográficasKANSAS UNIVERSITY. DesktopGarp. 2007. Disponível em: <http://www.nhm.ku.edu/desktopgarp/>. Acesso em: 03/05/2008.
KIRKPATRICK, S.; GELATT, C. D.; VECCHI, M. P. Optimization by simulated annealing. Science, v. 220, n. 4598, p. 671-680, Maio 1983.
METROPOLIS, N. et al. Equation of state calculations by fast computing machines. The Journal of Chemical Physics, v. 21, n. 6, p. 1087, Jun. 1953.
MEYER, E. M. Ecological niche modelling: inter-model variation, best-subset models selection. In: Workshop on Biodiversity Data Modelling, 2005. Cidade do México. Anais eletrônicos... Copenhague: GBIF, Abr. 2005. Disponível em: <http://www.gbif.org/prog/ocb/modeling_workshop/bangalore/presentations/ENMIV>. Acesso em: 21/10/2007.
MICHALEWICZ, Z. Genetic algorithms + data structures = evolution programs. 3. ed. Berlin: Springer-Verlag, 1996. 387 p.
NIX, H. A. A biogeographic analysis of Australian elapid snakes. In: LONGMORE, R. (Ed.) Atlas of elapid snakes of Australia. Canberra: Australian government publishing service, v.7, 1986. p. 4–15. (Australian flora and fauna series).
OPENSHAW, S.; OPENSHAW, C. Artificial intelligence in geography. West Sussex: John Wiley & Sons, 1997. 348 p.
49
Referências BibliográficasPEDROSA, B. M. Ambiente computacional para modelagem dinâmica. 2003. 71 p. Tese (Doutorado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais, São José dos Campos.
SANTA CATARINA, A.; BACH, S. L. Estudo do efeito dos parâmetros genéticos sobre a solução otimizada e sobre o tempo de convergência em algoritmos genéticos com codificações binária e real. Acta Scientiarum. Technology, v. 25, n. 2, p. 147-152, Jul./Dez. 2003.
SIQUEIRA, M. F. Uso de modelagem de nicho fundamental na avaliação do padrão de distribuição geográfica de espécies vegetais. 2005. 107 p. Tese (Doutorado em Ciências de Engenharia Ambiental) - Universidade de São Paulo, São Carlos.
STOCKWELL, D. R. B.; PETERS, D. The GARP modeling system: problems and solutions to automated spatial prediction. International Journal of Geographical Information Science, v. 13, n. 2, p. 143-158, Mar. 1999.
top related