introduction à l’analyse spatiale

1

Licence 3 – Outils mathématiques &statistiques

2

Distribution spatiale

3

Analyse des propriétés spatiales de l’ensemble des points.

Deux approches:

• Densité en utilisant l’analyse ‘Quadrat’. Basée sur la fréquence de distribution ou sur la densité de points dans une grille. – Rapport variance / moyenne– Comparaison avec des distributions de fréquences

théoriques.

• Analyse du plus proche voisin (Nearest Neighbor Analysis) basée sur les distances entre les points.

Distribution spatiale

Census

Plusieurs façons de construire lesquadrats. Attention à leurs tailles!

Echantillonnage

Calcul des fréquences

Nbre pts dans

Quadrat n Proportion n Proportion0 51 0,797 29 0,7631 11 0,172 8 0,2112 2 0,031 1 0,0263 0 0,000 0 0,000

Census Q = 64 Sampling Q = 38

Analyse quadrat

5

• Construire une grille dont les éléments ont pour largeur :

• Traiter chaque cellule comme une observation et compter le nombre de points dans chacune pour créer la variable X.

• Calculer la variance, la moyenne de X et le rapport variance / moyenne.

• Pour une distribution uniforme la variance est 0– Donc le rapport variance/moyenne devrait être proche de 0.

• Pour une distribution aléatoire, la variance et la moyenne sont identiques (loi de Poisson). – Donc le rapport variance/moyenne devrait être proche de 1.

• Pour une distribution de type cluster, la variance est grande.– Donc le rapport variance/moyenne devrait être supérieur à 1.

A = aireP = nbre de ptsP

Al

2

Analyse quadrat

6

N = nombre de Quadrats = 10

RANDOM

UNIFORME

CLUSTER

Formule de la variance

1

)(1

2

N

XXn

ii

1

]/)[(1

2

N

NXXn

ii2

3 15 02 11 33 1

Quadrat #

Nbre de pts/ Quadrat x^2

1 3 92 1 13 5 254 0 05 2 46 1 17 1 18 3 99 3 9

10 1 120 60

Variance 2,222Moyenne 2,000Var/Moy 1,111random

x

0 00 0

10 100 00 0

Quadrat #

Nbre de pts /Quadrat x^2

1 0 02 0 03 0 04 0 05 10 1006 10 1007 0 08 0 09 0 0

10 0 020 200

Variance 17,778Moyenne 2,000Var/Moy 8,889

cluster

x

2 22 22 22 22 2

Quadrat #

Nbre de pts/ Quadrat x^2

1 2 42 2 43 2 44 2 45 2 46 2 47 2 48 2 49 2 4

10 2 420 40

Variance 0,000Moyenne 2,000Var/Moy 0,000

uniforme

x

Analyse quadrat

7

• On compare les fréquences observées dans les quadrats avec les fréquences attendues qui seraient générées par:– Un modèle aléatoire (Loi de Poisson) – Un modèle de type cluster– Un modèle uniforme (e.g. chaque cellule possède P/Q points)

• Deux possibilités pour comparer les deux fréquences de distribution : 2, Kolmogorov-Smirnov

Analyse quadrat

8

3 2 6 2 2

2 4 3 7 3

2 6 6 9 4

5 6 3 5 5

3 7 3 2 0

En moyenne 4 points par cellule ().Variance = 4.59

Analyse quadrat

Freq Obs, O Exp, E |O-E| |O‑E|2/E

0 1 .5 .5 0.641 0 1.8 1.8 1.832 6 3.7 2.3 1.493 6 4.9 1.1 0.254 2 4.9 2.9 1.7

5 3 3.9 .9 0.216 4 2.6 1.4 0.757 2 1.5 .5 0.188 0 .7 .7 0.749 1 .3 .7 1.3510 0 .1 .1 0.13

Somme 25 χ2=9.3

9

Freq Obs, O Exp, E |O-E| |O‑E|2/E

0-1 1 2,3 1,3 0,73 2-3 12 8,6 3,4 1,34 4-5 5 8,8 3,8 1,646 et + 7 5,3 1,7 0,54

Somme 25 χ2=4,3

Le nombre de degrés de liberté dans ce cas = 11‑1‑1=9,parce que il y a 11 classes de fréquence. Le total est connu (‑1DF), Et la moyenne a été estimée à partir de l’échantillon (‑1DF). χ2

0.05,9=16.9, donc, avec 9.3 on ne peut pas rejeter H0.

Attention cependant, moins de 5 observations dans certaines classes!On regroupe!χ2

0.05,2=6, donc, avec 4,3 on ne peut toujours pas rejeter H0.

Analyse quadrat

freq exp cum - freq obs cummaxnK

K est comparé avec des valeurs critiques issues de tables

Kolmogorov test

H0 : les données s’ajustent au modèleH1 : les données ne s’ajustent pas au modèle

Analyse quadrat

Calculation of Poisson Frequencies for Kolmogorov-Smirnov testNumber of Observed Cumulative Cumulative Absolute Points in Quadrat Total Observed Observed Poisson Poisson Differencequadrat Count Point Probability Probability Probability Probability

0 8 0 0,8000 0,8000 0,1353 0,1353 0,66471 0 0 0,0000 0,8000 0,2707 0,4060 0,39402 0 0 0,0000 0,8000 0,2707 0,6767 0,12333 0 0 0,0000 0,8000 0,1804 0,8571 0,05714 0 0 0,0000 0,8000 0,0902 0,9473 0,14735 0 0 0,0000 0,8000 0,0361 0,9834 0,18346 0 0 0,0000 0,8000 0,0120 0,9955 0,19557 0 0 0,0000 0,8000 0,0034 0,9989 0,19898 0 0 0,0000 0,8000 0,0009 0,9998 0,19989 0 0 0,0000 0,8000 0,0002 1,0000 0,2000

10 2 20 0,2000 1,0000 0,0000 1,0000 0,0000

The Kolmogorov-Smirnov D test statistic is the largest Absolute Difference = largest value in Column h 0,6647

Critical Value at 5% for one sample given by: 0.39 Significant

number of quadrats Q 10 (sum of column B)number of points P 20 (sum of Col C)number of points in a quadrat x

Analyse quadrat

Faiblesses de l’analyse Quadrat• Les résultats peuvent dépendre la taille et de

l’orientation des quadrats!

– Il faut tester differentes tailles (ou orientations)

Analyse quadrat

Faiblesses de l’analyse Quadrat

• C’est une mesure de la dispersion et non du pattern parce qu’elle est basée sur la densité et non sur leur relation les uns avec les autres.

– Par exemple l’analyse Quadrat ne peut pas distinguer ces deux patterns.

1313

Analyse quadrat

• Utilise la distance entre les points.

• Compare la distance moyenne observée entre chaque point et son plus proche voisin avec la distance moyenne attendue si la distribution était aléatoire.

NNI=Dist. moyenne Obs / Dist. moyenne attendue

Pour aléatoire, NNI = 1Pour cluster, NNI = 0Pour uniforme, NNI = 2.149

• Nous pouvons utiliser un test sur la loi normale pour voir si la distribution observée est différente de ce que produirait le hasard.

Z = Dist Moy Obs - Dist. Moy Exp. Ecart type

Analyse du plus proche voisin

15

An /

26136.02

(Standard error)

Test


16


17

• Calculer la distance (euclidienne) de chaque point a son plus proche voisin, en calculant l’hypothénuse du triangle

22 )()( BABAAB yyxxd

Site X Y NN dNN

A 1.7 8.7 B 2.79

B 4.3 7.7 C 0.98

C 5.2 7.3 B 0.98

D 6.7 9.3 C 2.50

E 5.0 6.0 C 1.32

F 6.5 1.7 E 4.55

13.12

19.26

12.13________

n

ddDistance moyenne obs


18

91.16

885.05.0)(

n

AdE

14.192.1

19.2

)(

______

dE

dNNI

0

1

2.15

Parfaitement groupé

Totalement aléatoire

Parfaitement dispersé

Plus dispersé qu’aléatoire

Plus groupé qu’aléatoire


PointNearest

Neighbor Distance1 2 12 3 0.13 2 0.14 5 15 4 16 5 27 6 2.78 10 19 10 110 9 1

10.9

r 1.09Area of Region 50Density 0.2Expected Mean 1.118034R 0.974926NNI

Mean distance

PointNearest

Neighbor Distance1 2 0.12 3 0.13 2 0.14 5 0.15 4 0.16 5 0.17 6 0.18 9 0.19 10 0.110 9 0.1

1


Mean distance

PointNearest

Neighbor Distance1 3 2.22 4 2.23 4 2.24 5 2.25 7 2.26 7 2.27 8 2.28 9 2.29 10 2.210 9 2.2

22


Mean distance

Aléatoire UniformeGroupé

Z = 5.508Z = -0.1515 Z = 5.855


20

• Avantages– NNI prend en compte des distances– Pas de probleme concernant la taille des quadrats comme précédemment.

• Inconvénients– Attention aux effets de bord (attention à la taille et à la forme)– Fondamentalement basée sur la distance moyenne– On ne voit pas les variations locales (p.e. groupé localement mais pas

partout)

• Ajustement pour les effets de bord possible mais cela ne résout pas tous les problèmes.

• Des alternatives existent. Elles sont basées sur la distribution de toutes les distances…


introduction à l’analyse spatiale

Documents