testes de dispersão
TRANSCRIPT
Testes de Distribuição ou Dispersão Espacial (ou Temporal)
Ecologia de Populações
Prof. Dr. Harold Gordon Fowler
Por que Estudar a Dependência Espacial?
avaliar a quantidade de agregação ou aleatoriedade de um padrão – e.g., taxas de doença, taxas de acidentes, renda
per capita
aleatória: os fatores causativos operam em escalas mais finas do que as “zonas de registro”
agregada: os fatores causativos operam em escalas mais grosas do que as “zonas de registro”
Métodos para fazer análise espacial
1. Fazer a pergunta,
2.Coletar os dados,
3.Escolhe o método estatístico,
4.Calcular a estatística,
5.Interpretar a estatística, e
6.Testar a significância.
Analise Espacial Transforma os dados crus em informação
útil – Ao adicionar maior conteúdo e valor de
informação
Revela padrões, tendências, e anormalidades que não são óbvios
Proporciona um teste da intuição humana – Ajudando em situações onde o olho pode
enganar
Analise Espacial Um método de análise é espacial se os
resultados dependem das localizações dos objetos sob estudo – Mudar os objetos e os resultados mudam
– resultados não são invariantes quando mudado
A análise espacial requer os atributos e localizações dos objetos – Um SIG tem a capacidade de guardar ambos
O Mapa de Snow (surtos de cólera na década de 1850)
Proporciona um exemplo clássico do uso da localização para fazer inferências
Mas o mesmo padrão podia resultar do contagio (a disseminação da cólera pelo ar) – Se a fonte original viveu no centro do surto – contagio era a hipótese que Snow tentou
falsificar. O SIG pode ser usado para demonstrar uma sequencia de mapas durante o desenvolvimento do surto
– Contagio produziria uma seqüência concêntrica, e a água potável uma seqüência aleatória
O Mapa de Snow
Análise Espacial
Censo biológico onde cada ponto representa o avistamento de uma espécie. Se existe um padrão como nessa figura podemos analisar o comportamento em termos das características ambientais
1.Quantificação de padrão • Atração ou repulsão • Direcionalidade
2.Infere sobre processos a base do padrão observado
Dispersão Espacial de Populações
Espaçamento aleatório
Análise de Padrão de Pontos
Agregado (atração)
Uniforme (repulsão)
Análise de Padrão de Pontos
Os testes estatísticos para padrões significantes nos dados, comparada com a hipótese nula de um padrão espacial aleatório O padrão para comparação de padrões espaciais de pontos é um:
Processo inteiramente aleatório espacial de pontos Distribuição da probabilidade de Poisson (média =
variância) . Usado para gerar pontos espaciais aleatórios
Análise de Parcelas (Pontos) Divide a área em parcelas iguais Conte o número de pontos em cada parcela Compare contagens com contagens esperados da distribuição aleatória
Núm
ero
de c
élu
las
Número de pontos por célula
CSR esperado = hipótese nula
Agregado
Uniforme Média esperada do número por célula em CSR l = N/número de parcelas Para a distribuição de Poisson: p(x) = (e-l lx)/x! (observado – esperado)2/esperado # Oi P(x) Ei
0 2 0.0156 0.39 1 2 0.0649 1.62 5.39 2.42 2 5 0.1350 3.38 3 1 0.1873 4.68 … S C2
Verifique tabela de X2 Se Ho rejeitada: Média <> variância Média > variância (uniforme) Média < variância (agregado)
Dispersão Espacial da População
Distribuição: aleatória, regular, agregada
Para identificar padrão: testa a distribuição observada contra a distribuição aleatória
Distribuição de Poisson - uma descrição matemática de eventos aleatórias não freqüentes
Px = axe-a / x!
x – número de ocorrências, a – número médio de ocorrências
Distribuição Poisson
onde m is é a média e i!= 1×2×3× ... ×i, 0!=1; 1!=1.
Teorema: Na distribuição Poisson, a média = variância:
Distribuição Poisson
A distribuição Poisson é simétrica em valores baixos de média, e quase simétrica sob valores maiores de media
Quando a media aproxima a infinidade, essa distribuição coincida com a distribuição normal
Distribuições de Poisson com médias diferentes
Distribuição Poisson
Exemplo: Simulação 100 pessoas pescam ao mesmo tempo (3 horas) e têm a probabilidade igual de pescar um peixe por unidade de tempo. Pergunta: Quantos pescadores pescam 0, 1, 2, 3 .... peixes?
Distribuição Poisson
TESTE DE CHI QUADRADO
onde n(i) é a distribuição da amostra (o número de pescadores que capturaram i peixes), e n'(i) é a distribuição teórica (número esperado de pescadores que pescaram i peixes pela distribuição Poisson). =4,74
O número de graus de liberdade = o número de classes (7 ) menos o número de parâmetros usados para ajustar a distribuição teórica a da amostra (2 parâmetros: m=2.3 e N = 100. gl = 7 - 2 = 5
Valor crítico gl = 5 e P = 0.05 é de 11.07.: Distribuição da amostra não difere significativamente.
Distribuição Poisson
Númer
o de
peixes
Número de
pescadores
Proporção
de
pescadores
Distribuição de
Poisson
n'(i)=Np'(i)
0 11 0,11 10
1 25 0.25 23
2 21 0.21 27
3 25 0,25 20
4 9 0.09 12
5 7 0,07 5
6 2 0.02 2
7 0 0,00 1
total 100 1,00 100
Número médio de peixes capturado por um pescador, M = 2.30, e desvio padrão, SD = 1.41.
Método de momentos (m = M) = 2.3
Distribuição Poisson
TESTE DE CHI QUADRADO
Não comprova que a distribuição
da amostra é a mesma que a
teórica! Se não há diferença
significativa, implica que ou a
distribuição da amostra é próxima a
teórica, ou que falta dados para
distinguir essas distribuições.
Se amostramos uma
população por censo numa
área, cada amostra é igual
a um pescador e os
indivíduos contados são
iguais aos peixes
capturados. Uma
"distribuição aleatória"
pode definir usando o
modelo de indivíduos..
Anãlise Poisson da distribuição hipotética de larvas de mosquito em poços
Número de larvas
no poçoNúmero de poços (O) Número esperado de
poços (E)(O-E)
2/E
0 8 6,82 0,21
1 8 8,86 0,08
2 4 6,28 0,82
3 2 2,49 0,1
4 1 0,82 0,04
5 1 0,21 2,97
6 1 0,05 18,05
25 25 χ2 = 22.27
χ2 = 22.27, 6 gl, p < 0.001
Distribuição Poisson
Premissas: número médio de ocorrências é igual a variância do número de ocorrências
Razão Media/ variância > 1 implica variação entre poços é pequena (relativa a media) e sugere uma hiper-dispersão
Razão Media/ variância < 1 implica variação entre poços é relativamente grande e sugere uma distribuição agregada
Distribuição Poisson
Estatística de teste : (n-1)s2/x (media)
Estatística de teste : χ2, d.f. = n -1
ou seja. se a media = 1.48, s2 = 2.68, n = 25
Razão media/ variância = 1.48/2.68 = 0.55
Estatística de teste = (25 -1)(2.68)/(1.48) = 43.5, significativo ao nível de 0.05
Conclusão: a distribuição é agregada
Distribuição Poisson
Índices de Agregação
Coeficiente de dispersão
Índices de Agregação
Testes de Padrão Espacial Coeficiente de dispersão:
se CD << 1 [distribuição regular]
se CD » 1 [distribuição aleatória]
se CD >> 1 [distribuição agregada]
Distribuição Agregada
Não existe um modelo teórico universal para a distribuição espacial agregada. Modelos empíricos podem funcionar, como a distribuição binominal negativa:
onde m é a média e k é a "coeficiente de agregação"
A agregação aumenta com o decremento de k.
Distribuição Agregada
Na equação do binomial negativa, o termo de zero (a proporção de amostras sem nada)’ é igual a:o:
Distribuição Agregada
Na equação do binomial negativa, os outros termos
podem ser estimados por iteração:
Índices de Agregação
Coeficiente de dispersão
Mean crowding (Lloyd 1967) é igual ao número médio de ”vizinhos" no mesmo parcela:
Índice tem sentido biológico somente se o tamanho de cada parcela corresponde a ”distancia de interação" entre os indivíduos.
Índices de Agregação
Coeficiente de dispersão
Para Poisson, CD=1, e = m.
Índices de Agregação
(N) (N-1) N(N-1) 1 5 4 20 2 3 2 6 3 0 -1 0 4 1 0 0 5 7 6 42 Total 16 - 68 O numero médio de ”vizinhos" é = 4.25.
Índice de Moran positivo quando os atributos dos objetos
próximos são mais similares do que esperado 0 quando os arranjos são aleatórios negativo quando os atributos dos objetos
próximos são menos similares do que esperado
I = nS S wijcij / S S wij S(zi - zavg)2
n = número de objetos na amostra i,j - qualquer 2 dos objetos Z = valor do atributo para I cij = similaridade de i e j atributos wij= similaridade de i e j localidades
Índice de Moran similaridade dos atributos e da localização
Negativo Extremo SA Dispersado, - SA
Independente, 0 SA
Agregação Espaciaial, + SA Positivo extremo SA
PADRÃO DE DISTRIBUIÇÃO DE PONTOS: I de Moran
Demonstra a similaridade de atributos vizinhos
Proporciona uma estatística única para resumir padrão
Para dados contínuos
Covariação espacial /variação total
– Varia de –1 a 1 Positiva = auto-correlação espacial positiva, negativa indica uma auto-correlação espacial negativa. 0 = sem auto-correlação espacial (aleatório).
Agregada
Dispersa
Correlação do Tempo de Retorno: I de Moran
Centrado ao redor os valores médios de x, x Padronizado a variação da amostra
Nh
Covariância do Lag: Ch = S (xi – xi-h )(xi – xi+h ) i=1
Nh
correlação do Lag Ph = Ch Sx-h Sx+h
Razão c de Geary Como o Índice de Moran usa um único
valor para descrever a distribuição espacial – como., de elevações nas células de DEM
< 1 (agregado)
1
> 1 (aleatório)
como.,o indicador da informação perdida da auto-correlação espacial durante as conversões entre DEMs e TINs
Moran e Geary
Lee and Marion, 1994, Analysis of spatial autocorrelation of USGS 1:250,000 DEMs. GIS/LIS Proceedings.
PADRÃO DE VALORES DE POLIGONOS E PONTOS: Gi de Getis-Ord e G Geral
Análise de pontos quentes, demonstrando concentração de valores altos ou baixos
Indica se os valores altos ou baixos são agregados
Usa uma distancia a base de vizinhança especificada
Aplica um peso a dados dentro da distancia com valores similares
PADRÃO DA DISTRIBUIÇÃO DE PONTOS:
Operações de Vizinhança O que fica próximo?
Métodos
– Distancia de linha reta (distancia Euclidiana)
Diagrama de aranha
– Distancia de custo em rede
– Custo numa superfície
– Buffers
– Buffers de distancia variável
– Filtros
– Funções Locais, Focais e Zonais
– Distancia até atributos
– Polígonos de Theissen, ou
diagramas de Voronoi
PADRÃO DA DISTRIBUIÇÃO DE PONTOS:
Índice do Vizinho Mais Próximo
Calcula a distancia média entre
pontos
Significância testada
com a distribuição Z
Tipos – Distancia Inter-centróide
– Distancia borda – borda
Distancia a Vizinho Mais Próximo
1. Calcule a distancia a vizinho mais próximo para cada ponto 2. Calcule a distancia média do vmp 3. Calcule a média esperada para a distribuição CSR E(di) = 0.5 A/N 4. Compare a média esperada a média observada com Z Z = [ d – E(di)] / [0.0683 A/N2]
Verifique significância de z Se Ho rejeitada, média observada < média esperada e Z < 0 => agregada média observada > esperada e Z > 0 => uniforme
Função K de Ripley Expande um circulo de raio maior ao redor de cada ponto Conte o número de pontos dentro de cada circulo. Calcule L(d), uma medida do número esperado de pontos
dentro da distancia (d); L(d) = [ASkij/pN(N-1)]0.5, onde A = área, Skij = número de pontos j dentro da distancia d de todos os pontos i
Simulações de Monte Carlo ou teste t
Raio
L(d)
Média esperada de CSR
Agregada
Uniforme
PADRÃO DA DISTRIBUIÇÃO DE PONTOS:
Função K de Ripley Contagem do número de atributos dentro de
distancias definidas
Mede o arranjo espacial (agregado, uniforme, aleatório)
Usa simulações múltiplas para criar um envelope de distribuição aleatória
Detecta a escala desses padrões, como o tamanho do cluster?
Premissas:
– Estacionária: Sem tendências
nos dados
– Isotrofia: Sem direção (mas é possível modificar a função
K para detectar a anisotrofia.
– área regular de estudo
(raramente encontrada)
h h
Lh
at(h
)-h
Distancia (m)
Agregada
Aleatória
Limite superior
Limite inferior
Índices de Agregação Invariantes com a Densidade
Os índices simples de agregação são específicos a populações particulares em tempo discreto. Não podem ser extrapolados no espaço ou tempo. Por isso, vários índices invariantes com densidade foram propostos.
Índices de Agregação Invariantes com a Densidade
A ”lei de potência" (Taylor 1961):
O coeficiente b é especifica a espécie..
Índices de Agregação Invariantes com a Densidade
K da distribuição da binomial negativa.
Não um bom índice porque geralmente varia com a densidade
Índices de Agregação Invariantes com a Densidade Regressão de Mean crowding (Iwao 1968):
.
Hasta luego Baby!