testes de dispersão

Testes de Distribuição ou Dispersão Espacial (ou Temporal)

Ecologia de Populações

Prof. Dr. Harold Gordon Fowler

[email protected]

Por que Estudar a Dependência Espacial?

avaliar a quantidade de agregação ou aleatoriedade de um padrão – e.g., taxas de doença, taxas de acidentes, renda

per capita

aleatória: os fatores causativos operam em escalas mais finas do que as “zonas de registro”

agregada: os fatores causativos operam em escalas mais grosas do que as “zonas de registro”

Métodos para fazer análise espacial

1. Fazer a pergunta,

2.Coletar os dados,

3.Escolhe o método estatístico,

4.Calcular a estatística,

5.Interpretar a estatística, e

6.Testar a significância.

Analise Espacial Transforma os dados crus em informação

útil – Ao adicionar maior conteúdo e valor de

informação

Revela padrões, tendências, e anormalidades que não são óbvios

Proporciona um teste da intuição humana – Ajudando em situações onde o olho pode

enganar

Analise Espacial Um método de análise é espacial se os

resultados dependem das localizações dos objetos sob estudo – Mudar os objetos e os resultados mudam

– resultados não são invariantes quando mudado

A análise espacial requer os atributos e localizações dos objetos – Um SIG tem a capacidade de guardar ambos

O Mapa de Snow (surtos de cólera na década de 1850)

Proporciona um exemplo clássico do uso da localização para fazer inferências

Mas o mesmo padrão podia resultar do contagio (a disseminação da cólera pelo ar) – Se a fonte original viveu no centro do surto – contagio era a hipótese que Snow tentou

falsificar. O SIG pode ser usado para demonstrar uma sequencia de mapas durante o desenvolvimento do surto

– Contagio produziria uma seqüência concêntrica, e a água potável uma seqüência aleatória

O Mapa de Snow

Análise Espacial

Censo biológico onde cada ponto representa o avistamento de uma espécie. Se existe um padrão como nessa figura podemos analisar o comportamento em termos das características ambientais

1.Quantificação de padrão • Atração ou repulsão • Direcionalidade

2.Infere sobre processos a base do padrão observado

Dispersão Espacial de Populações

Espaçamento aleatório

Análise de Padrão de Pontos

Agregado (atração)

Uniforme (repulsão)

Análise de Padrão de Pontos

Os testes estatísticos para padrões significantes nos dados, comparada com a hipótese nula de um padrão espacial aleatório O padrão para comparação de padrões espaciais de pontos é um:

Processo inteiramente aleatório espacial de pontos Distribuição da probabilidade de Poisson (média =

variância) . Usado para gerar pontos espaciais aleatórios

Análise de Parcelas (Pontos) Divide a área em parcelas iguais Conte o número de pontos em cada parcela Compare contagens com contagens esperados da distribuição aleatória

Núm

ero

de c

élu

las

Número de pontos por célula

CSR esperado = hipótese nula

Agregado

Uniforme Média esperada do número por célula em CSR l = N/número de parcelas Para a distribuição de Poisson: p(x) = (e-l lx)/x! (observado – esperado)2/esperado # Oi P(x) Ei

0 2 0.0156 0.39 1 2 0.0649 1.62 5.39 2.42 2 5 0.1350 3.38 3 1 0.1873 4.68 … S C2

Verifique tabela de X2 Se Ho rejeitada: Média <> variância Média > variância (uniforme) Média < variância (agregado)

Dispersão Espacial da População

Distribuição: aleatória, regular, agregada

Para identificar padrão: testa a distribuição observada contra a distribuição aleatória

Distribuição de Poisson - uma descrição matemática de eventos aleatórias não freqüentes

Px = axe-a / x!

x – número de ocorrências, a – número médio de ocorrências

Distribuição Poisson

onde m is é a média e i!= 1×2×3× ... ×i, 0!=1; 1!=1.

Teorema: Na distribuição Poisson, a média = variância:


A distribuição Poisson é simétrica em valores baixos de média, e quase simétrica sob valores maiores de media

Quando a media aproxima a infinidade, essa distribuição coincida com a distribuição normal

Distribuições de Poisson com médias diferentes


Exemplo: Simulação 100 pessoas pescam ao mesmo tempo (3 horas) e têm a probabilidade igual de pescar um peixe por unidade de tempo. Pergunta: Quantos pescadores pescam 0, 1, 2, 3 .... peixes?


TESTE DE CHI QUADRADO

onde n(i) é a distribuição da amostra (o número de pescadores que capturaram i peixes), e n'(i) é a distribuição teórica (número esperado de pescadores que pescaram i peixes pela distribuição Poisson). =4,74

O número de graus de liberdade = o número de classes (7 ) menos o número de parâmetros usados para ajustar a distribuição teórica a da amostra (2 parâmetros: m=2.3 e N = 100. gl = 7 - 2 = 5

Valor crítico gl = 5 e P = 0.05 é de 11.07.: Distribuição da amostra não difere significativamente.


Númer

o de

peixes

Número de

pescadores

Proporção

de

pescadores

Distribuição de

Poisson

n'(i)=Np'(i)

0 11 0,11 10

1 25 0.25 23

2 21 0.21 27

3 25 0,25 20

4 9 0.09 12

5 7 0,07 5

6 2 0.02 2

7 0 0,00 1

total 100 1,00 100

Número médio de peixes capturado por um pescador, M = 2.30, e desvio padrão, SD = 1.41.

Método de momentos (m = M) = 2.3


TESTE DE CHI QUADRADO

Não comprova que a distribuição

da amostra é a mesma que a

teórica! Se não há diferença

significativa, implica que ou a

distribuição da amostra é próxima a

teórica, ou que falta dados para

distinguir essas distribuições.

Se amostramos uma

população por censo numa

área, cada amostra é igual

a um pescador e os

indivíduos contados são

iguais aos peixes

capturados. Uma

"distribuição aleatória"

pode definir usando o

modelo de indivíduos..

Anãlise Poisson da distribuição hipotética de larvas de mosquito em poços

Número de larvas

no poçoNúmero de poços (O) Número esperado de

poços (E)(O-E)

2/E

0 8 6,82 0,21

1 8 8,86 0,08

2 4 6,28 0,82

3 2 2,49 0,1

4 1 0,82 0,04

5 1 0,21 2,97

6 1 0,05 18,05

25 25 χ2 = 22.27

χ2 = 22.27, 6 gl, p < 0.001


Premissas: número médio de ocorrências é igual a variância do número de ocorrências

Razão Media/ variância > 1 implica variação entre poços é pequena (relativa a media) e sugere uma hiper-dispersão

Razão Media/ variância < 1 implica variação entre poços é relativamente grande e sugere uma distribuição agregada


Estatística de teste : (n-1)s2/x (media)

Estatística de teste : χ2, d.f. = n -1

ou seja. se a media = 1.48, s2 = 2.68, n = 25

Razão media/ variância = 1.48/2.68 = 0.55

Estatística de teste = (25 -1)(2.68)/(1.48) = 43.5, significativo ao nível de 0.05

Conclusão: a distribuição é agregada


Índices de Agregação

Coeficiente de dispersão


Testes de Padrão Espacial Coeficiente de dispersão:

se CD << 1 [distribuição regular]

se CD » 1 [distribuição aleatória]

se CD >> 1 [distribuição agregada]

Distribuição Agregada

Não existe um modelo teórico universal para a distribuição espacial agregada. Modelos empíricos podem funcionar, como a distribuição binominal negativa:

onde m é a média e k é a "coeficiente de agregação"

A agregação aumenta com o decremento de k.


Na equação do binomial negativa, o termo de zero (a proporção de amostras sem nada)’ é igual a:o:


Na equação do binomial negativa, os outros termos

podem ser estimados por iteração:



Mean crowding (Lloyd 1967) é igual ao número médio de ”vizinhos" no mesmo parcela:

Índice tem sentido biológico somente se o tamanho de cada parcela corresponde a ”distancia de interação" entre os indivíduos.



Para Poisson, CD=1, e = m.


(N) (N-1) N(N-1) 1 5 4 20 2 3 2 6 3 0 -1 0 4 1 0 0 5 7 6 42 Total 16 - 68 O numero médio de ”vizinhos" é = 4.25.

Índice de Moran positivo quando os atributos dos objetos

próximos são mais similares do que esperado 0 quando os arranjos são aleatórios negativo quando os atributos dos objetos

próximos são menos similares do que esperado

I = nS S wijcij / S S wij S(zi - zavg)2

n = número de objetos na amostra i,j - qualquer 2 dos objetos Z = valor do atributo para I cij = similaridade de i e j atributos wij= similaridade de i e j localidades

Índice de Moran similaridade dos atributos e da localização

Negativo Extremo SA Dispersado, - SA

Independente, 0 SA

Agregação Espaciaial, + SA Positivo extremo SA

PADRÃO DE DISTRIBUIÇÃO DE PONTOS: I de Moran

Demonstra a similaridade de atributos vizinhos

Proporciona uma estatística única para resumir padrão

Para dados contínuos

Covariação espacial /variação total

– Varia de –1 a 1 Positiva = auto-correlação espacial positiva, negativa indica uma auto-correlação espacial negativa. 0 = sem auto-correlação espacial (aleatório).

Agregada

Dispersa

Correlação do Tempo de Retorno: I de Moran

Centrado ao redor os valores médios de x, x Padronizado a variação da amostra

Nh

Covariância do Lag: Ch = S (xi – xi-h )(xi – xi+h ) i=1

Nh

correlação do Lag Ph = Ch Sx-h Sx+h

Razão c de Geary Como o Índice de Moran usa um único

valor para descrever a distribuição espacial – como., de elevações nas células de DEM

< 1 (agregado)

1

> 1 (aleatório)

como.,o indicador da informação perdida da auto-correlação espacial durante as conversões entre DEMs e TINs

Moran e Geary

Lee and Marion, 1994, Analysis of spatial autocorrelation of USGS 1:250,000 DEMs. GIS/LIS Proceedings.

PADRÃO DE VALORES DE POLIGONOS E PONTOS: Gi de Getis-Ord e G Geral

Análise de pontos quentes, demonstrando concentração de valores altos ou baixos

Indica se os valores altos ou baixos são agregados

Usa uma distancia a base de vizinhança especificada

Aplica um peso a dados dentro da distancia com valores similares

PADRÃO DA DISTRIBUIÇÃO DE PONTOS:

Operações de Vizinhança O que fica próximo?

Métodos

– Distancia de linha reta (distancia Euclidiana)

Diagrama de aranha

– Distancia de custo em rede

– Custo numa superfície

– Buffers

– Buffers de distancia variável

– Filtros

– Funções Locais, Focais e Zonais

– Distancia até atributos

– Polígonos de Theissen, ou

diagramas de Voronoi


Índice do Vizinho Mais Próximo

Calcula a distancia média entre

pontos

Significância testada

com a distribuição Z

Tipos – Distancia Inter-centróide

– Distancia borda – borda

Distancia a Vizinho Mais Próximo

1. Calcule a distancia a vizinho mais próximo para cada ponto 2. Calcule a distancia média do vmp 3. Calcule a média esperada para a distribuição CSR E(di) = 0.5 A/N 4. Compare a média esperada a média observada com Z Z = [ d – E(di)] / [0.0683 A/N2]

Verifique significância de z Se Ho rejeitada, média observada < média esperada e Z < 0 => agregada média observada > esperada e Z > 0 => uniforme

Função K de Ripley Expande um circulo de raio maior ao redor de cada ponto Conte o número de pontos dentro de cada circulo. Calcule L(d), uma medida do número esperado de pontos

dentro da distancia (d); L(d) = [ASkij/pN(N-1)]0.5, onde A = área, Skij = número de pontos j dentro da distancia d de todos os pontos i

Simulações de Monte Carlo ou teste t

Raio

L(d)

Média esperada de CSR

Agregada

Uniforme


Função K de Ripley Contagem do número de atributos dentro de

distancias definidas

Mede o arranjo espacial (agregado, uniforme, aleatório)

Usa simulações múltiplas para criar um envelope de distribuição aleatória

Detecta a escala desses padrões, como o tamanho do cluster?

Premissas:

– Estacionária: Sem tendências

nos dados

– Isotrofia: Sem direção (mas é possível modificar a função

K para detectar a anisotrofia.

– área regular de estudo

(raramente encontrada)

h h

Lh

at(h

)-h

Distancia (m)

Agregada

Aleatória

Limite superior

Limite inferior

Índices de Agregação Invariantes com a Densidade

Os índices simples de agregação são específicos a populações particulares em tempo discreto. Não podem ser extrapolados no espaço ou tempo. Por isso, vários índices invariantes com densidade foram propostos.


A ”lei de potência" (Taylor 1961):

O coeficiente b é especifica a espécie..


K da distribuição da binomial negativa.

Não um bom índice porque geralmente varia com a densidade

Índices de Agregação Invariantes com a Densidade Regressão de Mean crowding (Iwao 1968):

.

Hasta luego Baby!

testes de dispersão

Education