introduction à l’analyse spatiale
DESCRIPTION
Licence 3 – Outils mathématiques & statistiques. Introduction à l’analyse spatiale. Distribution spatiale. Distribution spatiale. Analyse des propriétés spatiales de l’ensemble des points. Deux approches: Densité en utilisant l’analyse ‘Quadrat ’. - PowerPoint PPT PresentationTRANSCRIPT
1
Licence 3 – Outils mathématiques &statistiques
2
Distribution spatiale
3
Analyse des propriétés spatiales de l’ensemble des points.
Deux approches:
• Densité en utilisant l’analyse ‘Quadrat’. Basée sur la fréquence de distribution ou sur la densité de points dans une grille. – Rapport variance / moyenne– Comparaison avec des distributions de fréquences
théoriques.
• Analyse du plus proche voisin (Nearest Neighbor Analysis) basée sur les distances entre les points.
Distribution spatiale
Census
Plusieurs façons de construire lesquadrats. Attention à leurs tailles!
Echantillonnage
Calcul des fréquences
Nbre pts dans
Quadrat n Proportion n Proportion0 51 0,797 29 0,7631 11 0,172 8 0,2112 2 0,031 1 0,0263 0 0,000 0 0,000
Census Q = 64 Sampling Q = 38
Analyse quadrat
5
• Construire une grille dont les éléments ont pour largeur :
• Traiter chaque cellule comme une observation et compter le nombre de points dans chacune pour créer la variable X.
• Calculer la variance, la moyenne de X et le rapport variance / moyenne.
• Pour une distribution uniforme la variance est 0– Donc le rapport variance/moyenne devrait être proche de 0.
• Pour une distribution aléatoire, la variance et la moyenne sont identiques (loi de Poisson). – Donc le rapport variance/moyenne devrait être proche de 1.
• Pour une distribution de type cluster, la variance est grande.– Donc le rapport variance/moyenne devrait être supérieur à 1.
A = aireP = nbre de ptsP
Al
2
Analyse quadrat
6
N = nombre de Quadrats = 10
RANDOM
UNIFORME
CLUSTER
Formule de la variance
1
)(1
2
N
XXn
ii
1
]/)[(1
2
N
NXXn
ii2
3 15 02 11 33 1
Quadrat #
Nbre de pts/ Quadrat x^2
1 3 92 1 13 5 254 0 05 2 46 1 17 1 18 3 99 3 9
10 1 120 60
Variance 2,222Moyenne 2,000Var/Moy 1,111random
x
0 00 0
10 100 00 0
Quadrat #
Nbre de pts /Quadrat x^2
1 0 02 0 03 0 04 0 05 10 1006 10 1007 0 08 0 09 0 0
10 0 020 200
Variance 17,778Moyenne 2,000Var/Moy 8,889
cluster
x
2 22 22 22 22 2
Quadrat #
Nbre de pts/ Quadrat x^2
1 2 42 2 43 2 44 2 45 2 46 2 47 2 48 2 49 2 4
10 2 420 40
Variance 0,000Moyenne 2,000Var/Moy 0,000
uniforme
x
Analyse quadrat
7
• On compare les fréquences observées dans les quadrats avec les fréquences attendues qui seraient générées par:– Un modèle aléatoire (Loi de Poisson) – Un modèle de type cluster– Un modèle uniforme (e.g. chaque cellule possède P/Q points)
• Deux possibilités pour comparer les deux fréquences de distribution : 2, Kolmogorov-Smirnov
Analyse quadrat
8
3 2 6 2 2
2 4 3 7 3
2 6 6 9 4
5 6 3 5 5
3 7 3 2 0
En moyenne 4 points par cellule ().Variance = 4.59
Analyse quadrat
Freq Obs, O Exp, E |O-E| |O‑E|2/E
0 1 .5 .5 0.641 0 1.8 1.8 1.832 6 3.7 2.3 1.493 6 4.9 1.1 0.254 2 4.9 2.9 1.7
5 3 3.9 .9 0.216 4 2.6 1.4 0.757 2 1.5 .5 0.188 0 .7 .7 0.749 1 .3 .7 1.3510 0 .1 .1 0.13
Somme 25 χ2=9.3
9
Freq Obs, O Exp, E |O-E| |O‑E|2/E
0-1 1 2,3 1,3 0,73 2-3 12 8,6 3,4 1,34 4-5 5 8,8 3,8 1,646 et + 7 5,3 1,7 0,54
Somme 25 χ2=4,3
Le nombre de degrés de liberté dans ce cas = 11‑1‑1=9,parce que il y a 11 classes de fréquence. Le total est connu (‑1DF), Et la moyenne a été estimée à partir de l’échantillon (‑1DF). χ2
0.05,9=16.9, donc, avec 9.3 on ne peut pas rejeter H0.
Attention cependant, moins de 5 observations dans certaines classes!On regroupe!χ2
0.05,2=6, donc, avec 4,3 on ne peut toujours pas rejeter H0.
Analyse quadrat
freq exp cum - freq obs cummaxnK
K est comparé avec des valeurs critiques issues de tables
Kolmogorov test
H0 : les données s’ajustent au modèleH1 : les données ne s’ajustent pas au modèle
Analyse quadrat
Calculation of Poisson Frequencies for Kolmogorov-Smirnov testNumber of Observed Cumulative Cumulative Absolute Points in Quadrat Total Observed Observed Poisson Poisson Differencequadrat Count Point Probability Probability Probability Probability
0 8 0 0,8000 0,8000 0,1353 0,1353 0,66471 0 0 0,0000 0,8000 0,2707 0,4060 0,39402 0 0 0,0000 0,8000 0,2707 0,6767 0,12333 0 0 0,0000 0,8000 0,1804 0,8571 0,05714 0 0 0,0000 0,8000 0,0902 0,9473 0,14735 0 0 0,0000 0,8000 0,0361 0,9834 0,18346 0 0 0,0000 0,8000 0,0120 0,9955 0,19557 0 0 0,0000 0,8000 0,0034 0,9989 0,19898 0 0 0,0000 0,8000 0,0009 0,9998 0,19989 0 0 0,0000 0,8000 0,0002 1,0000 0,2000
10 2 20 0,2000 1,0000 0,0000 1,0000 0,0000
The Kolmogorov-Smirnov D test statistic is the largest Absolute Difference = largest value in Column h 0,6647
Critical Value at 5% for one sample given by: 0.39 Significant
number of quadrats Q 10 (sum of column B)number of points P 20 (sum of Col C)number of points in a quadrat x
Analyse quadrat
Faiblesses de l’analyse Quadrat• Les résultats peuvent dépendre la taille et de
l’orientation des quadrats!
– Il faut tester differentes tailles (ou orientations)
Analyse quadrat
Faiblesses de l’analyse Quadrat
• C’est une mesure de la dispersion et non du pattern parce qu’elle est basée sur la densité et non sur leur relation les uns avec les autres.
– Par exemple l’analyse Quadrat ne peut pas distinguer ces deux patterns.
1313
Analyse quadrat
• Utilise la distance entre les points.
• Compare la distance moyenne observée entre chaque point et son plus proche voisin avec la distance moyenne attendue si la distribution était aléatoire.
NNI=Dist. moyenne Obs / Dist. moyenne attendue
Pour aléatoire, NNI = 1Pour cluster, NNI = 0Pour uniforme, NNI = 2.149
• Nous pouvons utiliser un test sur la loi normale pour voir si la distribution observée est différente de ce que produirait le hasard.
Z = Dist Moy Obs - Dist. Moy Exp. Ecart type
Analyse du plus proche voisin
15
An /
26136.02
(Standard error)
Test
Analyse du plus proche voisin
16
Analyse du plus proche voisin
17
• Calculer la distance (euclidienne) de chaque point a son plus proche voisin, en calculant l’hypothénuse du triangle
22 )()( BABAAB yyxxd
Site X Y NN dNN
A 1.7 8.7 B 2.79
B 4.3 7.7 C 0.98
C 5.2 7.3 B 0.98
D 6.7 9.3 C 2.50
E 5.0 6.0 C 1.32
F 6.5 1.7 E 4.55
13.12
19.26
12.13________
n
ddDistance moyenne obs
Analyse du plus proche voisin
18
91.16
885.05.0)(
n
AdE
14.192.1
19.2
)(
______
dE
dNNI
0
1
2.15
Parfaitement groupé
Totalement aléatoire
Parfaitement dispersé
Plus dispersé qu’aléatoire
Plus groupé qu’aléatoire
Analyse du plus proche voisin
PointNearest
Neighbor Distance1 2 12 3 0.13 2 0.14 5 15 4 16 5 27 6 2.78 10 19 10 110 9 1
10.9
r 1.09Area of Region 50Density 0.2Expected Mean 1.118034R 0.974926NNI
Mean distance
PointNearest
Neighbor Distance1 2 0.12 3 0.13 2 0.14 5 0.15 4 0.16 5 0.17 6 0.18 9 0.19 10 0.110 9 0.1
1
r 0.1Area of Region 50Density 0.2Expected Mean 1.118034R 0.089443NNI
Mean distance
PointNearest
Neighbor Distance1 3 2.22 4 2.23 4 2.24 5 2.25 7 2.26 7 2.27 8 2.28 9 2.29 10 2.210 9 2.2
22
r 2.2Area of Region 50Density 0.2Expected Mean 1.118034R 1.96774NNI
Mean distance
Aléatoire UniformeGroupé
Z = 5.508Z = -0.1515 Z = 5.855
Analyse du plus proche voisin
20
• Avantages– NNI prend en compte des distances– Pas de probleme concernant la taille des quadrats comme précédemment.
• Inconvénients– Attention aux effets de bord (attention à la taille et à la forme)– Fondamentalement basée sur la distance moyenne– On ne voit pas les variations locales (p.e. groupé localement mais pas
partout)
• Ajustement pour les effets de bord possible mais cela ne résout pas tous les problèmes.
• Des alternatives existent. Elles sont basées sur la distribution de toutes les distances…
Analyse du plus proche voisin