modélisation nuage de points. les travaux statistiques sont dabord et avant tout des travaux...
Post on 04-Apr-2015
107 Views
Preview:
TRANSCRIPT
Modélisation
Nuage de points
Les travaux statistiques sont d’abord et avant tout des travaux d’observations sur des phénomènes, des objets, des populations…
En sciences, l’analyse de données issues d’expériences ou d’études statistiques est un élément essentiel de la recherche.
Tous ces résultats ne correspondent pas toujours à des situations parfaites.
Cependant, une fois qu’un lien est mis en évidence et que son intensité a été mesurée, il devient possible de le modéliser à l’aide d’une fonction.
Exemple:
Pays Taux de mortalité infantile (%)
Angola
Argentine
Bangladesh
Canada
Côte d’Ivoire
Égypte
États-Unis
Haïti
Inde
Mexique
Nicaragua
Pérou
Sierra Lone
Vietman
Espérance de vie (années)
46,5
72,9
58,1
79,0
46,7
66,3
76,7
53,7
62,6
72,2
67,9
68,3
37,2
67,4
12,5
2,2
7,5
0,6
8,7
5,1
0,7
7,1
7,1
3,1
4,3
4,0
17,0
2,9
Les données suivantes proviennent d’un rapport paru en 2 000 qui porte sur le développement dans le monde.
Développement dans le monde
0
Mortalité infantile (%)
4
2
6
10
8
14
12
16
20
18
20 40 60 80 100
Espérance de vie (années)
En reportant dans un plan cartésien, ces données ;
l’espérance de vie, en abscisse,
la mortalité infantile, en ordonnée,
et en plaçant chaque couple,
on obtient une représentation graphique de la situation.
Les points ne sont pas parfaitement alignés, mais une certaine tendance se dessine.
Cette situation s’apparente à une fonction linéaire de variation partielle.
On peut donc modéliser cette situation par une fonction linéaire.
Certains nuages de points ne révèlent rien de particulier.
2
3
4
5
6
7
8
9
10
2 3 4 5 6 7 8
456789
1011121314151617
2 4 6 8
D’autres, au contraire, sont très significatifs.
Plus, il y a de données et plus le nuage est représentatif.
Les nuages de points peuvent prendre plusieurs formes; quand le lien est grand (quand les points sont très rapprochés les uns des autres, on peut les modéliser.
Modélisable par une fonction linéaire.
Modélisable par une fonction inversement proportionnelle.
Modélisable par une fonction constante.
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
Âge Taille (cm)
Exemple:
Comment construire un nuage de points
Voici un tableau représentant l’âge et la taille (en cm) d’un échantillon d’adolescents.
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
Âge Taille (cm)
Chaque couple de données peut s’écrire comme un couple de coordonnées dans le plan cartésien.
Exemple:
( 11, 142 )
Il s’agit alors d’inscrire chaque couple dans un plan cartésien.
La première coordonnée
( ici, l’âge )
sera représentée
sur l’axe des abscisses.
La deuxième coordonnée
( ici, la taille )
sera représentée
sur l’axe des ordonnées.
La graduation des axes est importante.
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
L1 L2
Sur un même axe, la distance entre les échelons doit être égale.
Pour une meilleure interprétation, le graphique devrait avoir une forme approximativement carrée.
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
L1 L2
Pour déterminer la graduation, calcule en premier l’étendue de chaque distribution ( chaque colonne ).
L1: 16 – 11 = 5
Comme l’étendue est très petite, chaque petit trait vaudra 1.
On commence avec un nombre inférieur à la première donnée et on termine avec un nombre supérieur à la dernière donnée.
donc de 10 à 17
10 11 12 13 14 15 16 17
Remarque:
Comme chaque trait représente une unité et que par rapport à l’origine il y a plusieurs unités qu’on n’utilise pas, il faut penser à mettre ce petit symbole:
Âge
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
L1 L2
Pour déterminer la graduation, calcule en premier l’étendue de chaque distribution ( chaque colonne ).
Ici, l’étendue de la distribution est de 180 – 123 donc de 57. On peut donc utiliser 6 intervalles d’une largeur de 10 unités chacun.
L2: - 123 = 57180
120
130
140
150
160
170
Pense à
Taille ( cm )
180
10 11 12 13 14 15 16 17 Âge
120
130
140
150
160
170Taille ( cm )
180
Nous pouvons maintenant tracer le nuage de points.
1111121212121213
13141414141515151516
13
142123142140160148148140
155155172160157155165165167180
161
L1 L2Répartition d’un échantillon d’adolescents en fonction de l’âge et la taille
Il faut être le plus précis possible.
Remarque:
on inscris alors un 2 à côté du point pour indiquer qu’il y en a 2.
ici, on a 2 fois le couple ( 12 , 148 );
2
2
Voilà, le nuage de points est tracé.
10 11 12 13 14 15 16 17 Âge
120
130
140
150
160
170Taille ( cm )
180
Répartition d’un échantillon d’adolescents en fonction de l’âge et la taille
2
2
Ici, le nuage de points est assez dispersé; le lien entre les variables est donc faible et non significatif.
top related