cours de statistiques s1 éco

62
STATISTIQUE DESCRIPTIVE §1 Introduction La statistique dØsigne lensemble des mØthodes mathØmatiques relatives la collecte, la prØsentation, lanalyse et lutilisation de donnØes numØriques. Ces opØrations permettent de tirer des conclusions et de prendre des dØcisions dans les situations d incertitude quon rencontre dans le domaine Øconomique, dans celui des a/aires ou dans dautres sciences sociales ..... On distingue la statistique descriptive et la statistique inductive. La premiLre rØsume, rØcapitule, analyse un ensemble de donnØes . La seconde conclut sur le tout aprØs examen dune partie. Le tout est alors appelØ population et une partie est appelØe un Øchantillon . §2 Terminologie : - La population est lensemble de tous les individus concernØs par une Øtude statistique Exemple 1: Si lon veut Øtudier la qualitØ des allumettes fabriquØes par une usine, la population sera lensemble de toutes les allumettes fabriquØes par cette usine. - On appelle Øchantillon toute partie de la population. - On appelle individu chaque ØlØment de la population. - La taille reprØsente le nombre d individus dun Øchantillon ou dune population. Elle est notØe n dans le cas dun Øchantillon et N dans le cas dune population. - Le caract Lre est laspect particulier que lon dØsire Øtudier. Exemple 2: Concernant un groupe de personnes, on peut s intØresser au caractLre ge, ou au caractLre sexe ou encore leur taille . 1

Upload: ilhame-attache

Post on 28-Dec-2014

27.355 views

Category:

Documents


3 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Cours de statistiques s1 éco

STATISTIQUE DESCRIPTIVE

§1 Introduction

La statistique désigne l�ensemble des méthodes mathématiques relativesà la collecte, à la présentation, à l�analyse et à l�utilisation de donnéesnumériques. Ces opérations permettent de tirer des conclusions et deprendre des décisions dans les situations d�incertitude qu�on rencontredans le domaine économique, dans celui des a¤aires ou dans d�autressciences sociales.....

On distingue la statistique descriptive et la statistique inductive. Lapremière résume, récapitule, analyse un ensemble de données . La secondeconclut sur le tout aprés examen d�une partie. Le tout est alors appelépopulation et une partie est appelée un échantillon .

§2 Terminologie :

- La population est l�ensemble de tous les individus concernés par uneétude statistique

Exemple 1:

Si l�on veut étudier la qualité des allumettes fabriquées par une usine, lapopulation sera l�ensemble de toutes les allumettes fabriquées par cetteusine.

- On appelle échantillon toute partie de la population.

- On appelle individu chaque élément de la population.

- La taille représente le nombre d�individus d�un échantillon ou d�unepopulation. Elle est notée n dans le cas d�un échantillon et N dans lecas d�une population.

- Le caractère est l�aspect particulier que l�on désire étudier.

Exemple 2:

Concernant un groupe de personnes, on peut s�intéresser au caractèreâge, ou au caractère sexe ou encore à leur taille .

1

Page 2: Cours de statistiques s1 éco

- On appelle modalités les di¤érentes possibilités que peut présenter uncaractère.

Exemple 3:

- Le sexe est un caractère à deux modalités : féminin ou masculin

- Le caractère nombre d�enfants par famille peut être égal à 0; 1; 2; :::

- On dira d�un caractère qu�il est qualitatif si ses modalités ne s�exprimentpas par un nombre.

Exemple 4 :

La religion , la marque d�une lessive et la couleur des yeux sont descaractères qualitatifs.

- On dit d�un caractère qu�il est quantitatif si ses modalités sont numériques.

Exemple 5 :

L�âge , le poids , le salaire , . . . sont des caractères quantitatifs.

- On appelle série statistique l�ensemble des di¤érentes données associéesaux individus d�un échantillon ou d�une population.

Exemple 6:

- La série suivante représente les notes (sur 20 ) obtenues par 10 étudiantsen statistique :

10� 15� 9� 7� 6� 5� 8� 13� 11� 19

- La série suivante représente le sexe de 10 étudiants de première annéede l0ISIAM :

F � F �M �M � F � F � F �M �M � F

2

Page 3: Cours de statistiques s1 éco

§3 Traitement des données

- D�une façon générale , on distingue 3 étapes dans le traitement d�unesérie statistique :

A) La synthèse des résultats à l�aide d�un tableau;

B) La représentation graphique du phénomène étudié;

C) Le calcul des mesures caractéristiques.

Expliquons maintenant comment il faut procéder dans chaque étape.

A) Tableaux statistiques

1) Cas d�un caractère qualitatif

- La taille de l�échantillon est n

- Les di¤érentes modalités sont x1; x2; :::; xk .

- Chaque modalité constitue une classe .

- Le nombre d�individus qui appartiennent à la classe xi s�appelle l�e¤ectif(ou la fréquence absolue ) de cette classe . Il est noté fi. On a toujours

f1 + f2 + ::: + fk = n

- La fréquence relative de la classe xi estfin.

- Souvent on préfère exprimer la fréquence relative en pourcentage ; pour

cela, il su¢ t de multiplierfinpar 100 .

Exemple : La série statistique suivante représente l�état-civil d�un

3

Page 4: Cours de statistiques s1 éco

groupe de 20 personnes .

M�C�M�V�M�M�D�V�D�M�C�V�V�V�V�C�C�C�M�Moù M;D;C et V représentent respectivement marié(e), divorcé(e), céli-bataire et veuf(ve).

R�epartition d0un groupe de 20 personnes selon leur �etat� civil

Etat-civil e¤ectifs fréq.relativesfinpourcentages

fin100

M 7 0; 35 35

C 5 0; 25 25

V 6 0; 30 30

D 2 0; 10 10

Total 20 1 100

2) Cas d�un caractère quantitatif discret :

- Un caractère quantitatif est discret si l�ensemble des valeurs qu�il peutprendre est �ni.

Exemple 1:

- Le nombre d�enfants par famille et le nombre de téléviseurs fabriqués parune usine par jour sont des caractères quantitatifs discrets , par contre lecaractère poids n�est pas discret .

Pour l�élaboration du tableau , il faut voir si le caractère présente beau-coup de valeurs di¤erentes ou non . Dans le deuxième cas on procèdecomme dans le cas d�un caractère qualitatif et dans le premier cas onregroupe les données comme dans le cas d�un caractère continu qui seratraité ultérieurement .

Exemple 2: La série suivante donne le nombre d�enfants à charge dans16 familles .

0� 1� 0� 0� 2� 1� 3� 0� 1� 2� 0� 1� 2� 2� 2� 44

Page 5: Cours de statistiques s1 éco

R�epartition de 16 familles selon le nombre d0enfants �a charge

nb.d�enf e¤ fi freq.rel.finpourcent

fin� 100 e¤. cumul Fi freq.rel. cum

Fin

0 5 0; 3125 31; 25 5 0; 3125

1 4 0; 25 25 9 0; 5625

2 5 0; 3125 31; 25 14 0; 8750

3 1 0; 0625 6; 25 15 0; 9375

4 1 0; 0625 6; 25 16 1

Total 16 1 100 //////////////////////////// /////////////////////////////

- La colonne des e¤ectifs cumulés Fi s�obtient en additionnant à l�e¤ectifd�une classe l�e¤ectif de chacune des classes qui la pécède , ainsi on a :

F1 = f1 , F2 = f1 + f2 , . . . ,Fi = f1 + f2 + ::: + fi

Fi correspond au nombre de données de la série dont la valeur est in-férieure à la classe xi. 2) Cas d�un caractère quantitatif continu :

Un caractère quantitatif est continu s�il peut prendre théoriquement n�importequelle valeur dans un intervalle donné .

Exemple 1 :La taille des individus et leur poids sont des caractèresquantitatifs continus .

Dans ce cas (ou dans le cas d�un caractère discret avec beaucoup devaleurs di¤erentes) la construction du tableau passe par les étapes suiv-antes :

Etape 1 : Déterminer l�étendu de la série

Notée e, l�étendu de la série est la di¤érence entre la plus grande valeuret la plus petite valeur observée.

Etape 2 : Déterminer le nombre de classes

Noté k, le nombre de classe doit se situer entre 5 et 15 , et s�il n�a pas

5

Page 6: Cours de statistiques s1 éco

été imposé on peut le déterminer à partir de la formule de Sturges :

k = la valeur entière la plus rapprochée de 1 + 3; 322 log10(n) où n estle nombre de données de la série.

Exemple 2 :

- Pour n = 12 on a 1 + 3; 322log10(12) = 4; 585::: donc k = 5classes

- Pour n = 15 on a 1+3; 322log10(15) = 4; 906::: donc k = 5 classes

- Pour n = 25 on a 1 + 3; 322log10(25) = 5; 643::: donc k = 6classes

- Pour n = 1000 on a 1 + 3; 322log10(1000) = 10; 966::. donc k = 11classes.

Etape 3 : Déterminer l�amplitude des classes

Notée c, l�amplitude des classes ne doit pas contenir plus de chi¤res aprèsla virgule que les données de la série . Ainsi après avoir calculé le quotiente

k, il faut tronquer le résultat pour éliminer les décimales non utiles et

additionner 1 au dernier chi¤re.

Exemple 3: Sie

k= 0; 9361 alors pour des données à 2 chi¤res après la

virgule c = 0; 94 mais pour des données entières c = 1.

Etape 4 : Construire les intervalles

En procédant avec la même unité de mesure que les données de la série ,on �xe tout d�abord la limite inférieure du premier intervalle . La valeurchoisie peut être soit la plus petite mesure de la série , soit une valeurqui lui est assez voisine mais inférieure . En additionnant l�amplitude àcette valeur , on obtient la limite supérieure de la classe .

Pour les classes suivantes , la limite inférieure coincide avec la limitesupérieure de la classe précédente . L�addition à la limite inférieure del�amplitude permet encore d�établir la limite supérieure .

Par convention ,pour que toute donnée appartienne à une seule classe,

6

Page 7: Cours de statistiques s1 éco

les intervalles seront fermés à gauche et ouverts à droite .

Exemple (voir plus loin )

Etape 5 : Etablir la fréquence des classes

Pour compléter le tableau, il reste à déterminer

- le centre des classes mi =limite inférieure + limite supérieure

2(Les

centres des classes serviront dans le calcul des mesures caractéristiques )

- Les e¤ectifs fi .

- Les e¤ectifs cumulés Fi .

- Les fréquences relativesfin.

- Les fréquences relatives en pourcentagesfin� 100.

Exemple 4 : La série suivante représente le poids réel , en grammes ,d�un échantillon de 23 boites de con�ture de marques di¤érentes :

271 516 414 242 510 190 490 450 390 430

360 360 450 460 453 509 489 412 410 453

460 405 373

Construire le tableau de fréquences de cette série.

Solution :

- L�étendue e = 516� 190 = 326- Le nombre de classes k : on a 1+3; 322log10(23) = 5; 523::: donc k = 6classes .

- L�amplitude des classes : on ae

k=326

6= 54; 33::: donc c = 55

7

Page 8: Cours de statistiques s1 éco

- Le premier intervalle : [190; 245[

Poids P (en g ) centres mi e¤ectifs fi e¤.cumulés Fi freq.rel.fin(%)

fin100

190 � P < 245 217; 5 2 2 0; 0869 8; 69

245 � P < 300 272; 5 1 3 0; 0434 4; 34

300 � P < 355 327; 5 0 3 0 0

355 � P < 410 382; 5 5 8 0; 2173 21; 73

410 � P < 465 437; 5 10 18 0; 4347 43; 47

465 � P < 520 492; 5 5 23 0; 2173 21; 73

Exemple 2 : Le salaire horaire (en DH ) de 20 employés d�un magasinest donné par la série suivante : 6; 80 6; 30 8; 25 6; 45 6; 30 6; 80 8; 305; 55 6; 00 5; 60 6; 75 8; 35 5; 75 6; 80 7; 30 6; 85 5; 70 5; 557; 25 7; 25

Construire la distribution de fréquences de cette série .

Solution :

- L�étendue : e = 8; 35� 5; 55 = 2; 8

- Le nombre de classes k : on a 1 + 3; 322 log10(20) = 5; 322::: donc k = 5classes

- L�amplitude des classes c : on ae

k=2; 8

5= 0; 56 donc c = 0; 57

- Le premier intervalle : [5; 55 ; 6; 12 [ .

8

Page 9: Cours de statistiques s1 éco

Salaire S (en DH) centres mi e¤ fi e¤.cum Fi freq.rel.fin%

5; 55 � S < 6; 12 5; 835 6 6 0; 30 30

6; 12 � S < 6; 69 6; 405 3 9 0; 15 15

6; 69 � S < 7; 26 6; 975 7 16 0; 35 35

7; 26 � S < 7; 83 7; 545 1 17 0; 05 5

7; 83 � S < 8; 4 8; 115 3 20 0; 15 15

B) Représentation graphique

Il existe plusieurs façons de représenter graphiquement les résultats d�unesérie statistique. Nous verrons ici les formules les plus utilisées.

1) Diagramme à bandes rectangulaires.

Ce diagramme est adapté à la représentation d�un caractère qualitatifou quantitatif discret. Il est constitué par la juxtaposition de bandesverticales ou la superposition de bandes horizontales; la hauteur ou lalongueur d�une bande, sera proportionnelle à la fréquence de la modalité.

Exemple 1.

2) Histogramme.

Il convient bien à la représentation d�un caractère quantitatif continu,l�histogramme est constitué par la juxtaposition de bandes rectangulairesverticales, mais adjacentes. De plus chaque rectangle doit présenter unelargeur équivalente à l�amplitude de la classe qu�il représente et la hauteurproportionnelle à la fréquence.

Exemple 2.

C) Le calcul des mesures caractéristiques.

9

Page 10: Cours de statistiques s1 éco

Il est souvent nécessaire de résumer de façon très concise l�ensemble desinformations qu�on possède sur une série statistique .Pour cela , on arecours à quelques mesures donnant une idée sur l�ordre de grandeur desdonnées ou sur l�étalement de la série .

On distingue deux types de mesures : les mesures de tendance centraleet les mesures de dispersion .

1) les mesures de tendances centrales :

Les mesures de tendance centrales les plus importantes sont : la moyennearithmétique , la médiane et le mode .

a) La moyenne arithmétique :

Pour calculer la moyenne arithmétique (on dira dans la suite moyennetout court ) d�un ensemble de données, il su¢ t de faire la somme decelles-ci et de diviser par le nombre de données .

Notation

Dans le cas d�une population la moyenne sera notée �

� =

NPi=1

xi

N

et dans le cas d�un échantillon elle sera notée�x :

�x =

nPi=1

xi

n

Exemple 1

Les notes ( sur 20 ) obtenues par 10 étudiants en statistique sont :

2� 2� 8� 9� 10� 12� 8� 13� 12� 13

10

Page 11: Cours de statistiques s1 éco

On a donc�x =

2 + 2 + 8 + 9 + 10 + 12 + 8 + 13 + 12 + 13

10=89

10= 8: 9

- Si les données sont traitées dans un tableau de fréquences :

caractère xi e¤ectifs fi freq.rel.fin

x1 f1f1n

x2 f2f2n

. . .

. . .

. . .xk fk

fkn

dans ce cas la formule de la moyenne devient :

�x =

kPi=1

xifi

n

Exemple 2

La distribution des notes des 10 étudiants de l�exemple précédent est :

11

Page 12: Cours de statistiques s1 éco

Notes xi e¤ectifs fi freq.rel.fin

2 2 0; 2

8 2 0; 2

9 1 0; 1

10 1 0; 1

12 2 0; 2

13 2 0; 2

Total 10 1

�x =

2� 2 + 2� 8 + 1� 9 + 1� 10 + 2� 12 + 2� 1310

=89

10= 8; 9

- Si maintenant les données sont groupées dans des intervalles de centresmi alors une aproximation de la moyenne est donnée par

�x =

kPi=1

fimi

n

où k est le nombre de classes et n la taille de l�échantillon .

Exemple 3

Le tableau suivant représente le chi¤re d�a¤aires (en DH) réalisé par 36restaurants au cours d�une journée.

Chi¤re d�a¤. C (en DH) centres mi e¤ectifs fi fimi

2000 � C < 2500 2250 11 24750

2500 � C < 3000 2750 9 24750

3000 � C < 3500 3250 10 32500

3500 � C < 4000 3750 6 22500

Total =============== 36 104500

12

Page 13: Cours de statistiques s1 éco

On a donc�x =

104500

36= 2902; 777::: = 2902; 78

Le chi¤re d�a¤aires moyen de ces restaurants est donc approximativement2902; 78 DH

b) La médiane

- La médiane est la valeur du caractère qui partage la série en deuxparties égales : 50% de données lui sont inférieures ou égales et 50% luisont supérieures ou égales .

Notation : la médiane sera notée Me

- Calcul de la médiane: On distingue deux cas :

1ercas : les données ne sont pas groupées dans des intervalles.

Alors dans ce cas on applique la règle suivante :

- Si n est impair , la médiane est la valeur de la série dont le rang estn + 1

2dans le classement par ordre croissant .

- Si n est pair , la médiane est la moyenne des valeurs de rangn

2et

n

2+ 1 dans le classement par ordre croissant .

Exemple 1: Soit la série 3� 1� 4� 5� 1� 2� 6� 8� 6:Le classement par ordre croissant est 1� 1� 2� 3� 4� 5� 6� 6� 8On a n = 9 donc Me = la cinquième valeur = 4

Exemple 2 :

Soit la série 3� 1� 4� 7� 5� 1� 2� 6� 8� 6

13

Page 14: Cours de statistiques s1 éco

Le classement par ordre croissant est 1� 1� 2� 3� 4� 5� 6� 6� 7� 8

On a n = 10 ; la 5�eme valeur est 4 et la 6�eme valeur est 5 donc la médiane

est Me =4 + 5

2= 4; 5

Exercice 1 :Calculer la médiane de la série suivante :

xi 0 2 5 7 9 Totalfi 5 7 9 4 5 30

Solution

On a n = 30 donc la médiane est la moyenne entre la 15�eme et la 16�emevaleur dans le classement par ordre croissant .

Ici la 15�eme valeur est 5 et la 16�eme valeur est 5 aussi, donc la médiane

est Me =5 + 5

2= 5

2�emecas : Si les données sont groupées dans des intervalles :

Dans ce cas , on ne se préoccupe pas du fait qu�il y a un nombre pair ouimpair de données dans la série .

On détermine d�abord la classe qui contient la médiane : c�est la premièreclasse dont l�e¤ectif cumulé est supérieur ou égal à

n

2.

Si [Li , Li + c[ est la classe qui contient la médiane , et si Fi est sone¤ectif cumulé et Fi�1 l�e¤ectif cumulé de la classe qui la précède alorson a :

Me � Li(Li + c)� Li

=

n

2� Fi�1

Fi � Fi�1

14

Page 15: Cours de statistiques s1 éco

donc

Me = Li +

0@ n2 � Fi�1Fi � Fi�1

1A cExemple 3:

Reprenons l�exemple du chi¤re d�a¤aires des 36 restaurants .

Chi¤re d�a¤. C en DH e¤ectifs fi e¤ectifs cumulés Fi2000 � C < 2500 11 11

2500 � C < 3000 9 20

3000 � C < 3500 10 30

3500 � C < 4000 6 36

On a n = 36 doncn

2= 18; la classe qui contient la médiane est la

deuxième donc

Me � 25003000� 2500 =

18� 1120� 11 donc

Me � 2500500

=7

9et par suite Me =

2500 + 500� 79= 2888; 88:::

Me = 2888; 89 DH

c) Le mode .

Lemode d�une série de données est la valeur du caractère la plus fréquente. Le symbole utilisé pour le noter estMo , qu�il s�agisse d�un échantillonou d�une population .

Lorsque les données sont groupées dans des intervalles, on utilise le centrede la classe ayant la plus grande fréquence comme approximation dumode ou on parle tout simplement de la classe modale, c�est-à-dire laclasse ayant la plus grande fréquence

15

Page 16: Cours de statistiques s1 éco

Exemple 1.

� Le mode de la série 2� 3� 4� 2� 2 est la valeur 2� La série 2� 2� 3� 4� 3� 2� 3 a deux modes : 2 et 3� La série 1� 2� 3� 4� 5 n�a pas de mode

2) Les mesures de dispersion

-La variance

Pour un échantillon de taille n , la variance, notée s2 , est dé�nie par

s2 =

nPi=1

(xi ��x)2

n

où xi représente la ième données et_x la moyenne .

Exemple 1

Calculer la variance de la série suivante : 8� 8� 10� 12� 12 .

On a_x =

8 + 8 + 10 + 12 + 12

5= 50

5 = 10 d�où s2 =

(8� 10)2 + (8� 10)2 + (10� 10)2 + (12� 10)2 + (12� 10)25

=

4 + 4 + 0 + 4 + 4

5= 3; 2

Exemple 2

Calculer la variance de la série 6� 7� 10� 13� 14.

On a_x =

6 + 7 + 10 + 13 + 14

5=50

5= 10

d�où s2 =(6� 10)2 + (7� 10)2 + (10� 10)2 + (13� 10)2 + (14� 10)2

5=

50

10= 10

16

Page 17: Cours de statistiques s1 éco

Remarque:

les séries 8 � 8 � 10 � 12 � 12 et 6 � 7 � 10 � 13 � 14 ont la mêmemoyenne 10, mais les écarts des données par rapport à la moyenne sontplus grands dans la deuxième série que dans la première. Ceci se traduitpar une variance plus grande dans la deuxième série.

- En général le calcul de la variance à l�aide de sa formule est fastidieux,c�est pour cela qu�il est parfois intéressant d�appliquer la formule équiv-alente suivante :

frames2 = x2 � (x)2

Cette formule se retient facilement en disant que la variance est lamoyennedes carrés moins le carré de la moyenne.

Exemple 3

Pour la série 8� 8� 10� 12� 12 on a x2 = 82 + 82 + 102 + 122 + 122

5=

516

5= 103: 2

et (x)2 = 102 = 100 d�où s2 = 103; 2� 100 = 3; 2

- Dans le cas où les données sont données dans un tableau de fréquences

caractére xi e¤ectifs fi fréquences relativesfin

x1 f1f1n

x2 f2f2n

. . .

. . .

. . .xk fk

fkn

17

Page 18: Cours de statistiques s1 éco

alors

s2 =f1x

21 + f2x

22 + ::: + fkx

2k

n� (f1x1+f2x2:::+fkxkn )2

On peut écrire encore

s2 =f1nx21 +

f2nx22 + ::: +

fknx2k � (x)2

Exercice 1

Calculer la variance de la distribution suivante:

caractére xi e¤ectifs fi fréquencesfin

2 2 0; 2

8 2 0; 2

9 1 0; 1

10 1 0; 1

12 2 0; 2

13 2 0; 2

Total 10 1

Solution

Pour le calcul de la variance , on organise le tableau comme suit :

18

Page 19: Cours de statistiques s1 éco

xi fi fixi fix2i

2 2 4 8

8 2 16 128

9 1 9 81

10 1 10 100

12 2 24 288

13 2 26 338

Total 10 89 943

On a x = 8910 = 8; 9 et s2 = 943

10 � (8; 9)2 = 94; 3� 79; 21 =

15; 09

- Lorsque les données sont groupées dans des intervalles , on se contented�obtenir une approximation de la variance en remplaçant dans la formuleles xi par les centres mi

s2 =f1m

21 + f2m

22 + ::: + fkm

2k

n� (f1m1 + f2m2::: + fkmk

n)2

Exercice 2

Calculer la variance de la distribution suivante:

19

Page 20: Cours de statistiques s1 éco

REGRESSION ET CORRELATION

§ 1 Introduction

Dans ce chapitre, on va étudier les relations, lorsqu�elles existent, entredeux variables statistiques. Par exemple la relation entre publicité etvente, ou entre le revenu et les dépenses.

§ 2 : Régression linéaire simple

Nuage statistique : Considérons deux caractères numériques x et y. Sià partir d�une étude menée sur un échantillon de taille n on obtient lesvaleurs xi et yi , la représentation graphique dans le plan de l�ensembledes points de coordonnées (xi; yi) pour i = 1; 2; ::::; n s�appelle nuagestatistique.

A partir de ce nuage, il faut chercher à exprimer la relation entre les deuxvariables à l�aide d�une équation mathématique . On pourrait le faire deplus d�une façon, mais on va se limiter ici à la plus simple, c�est-à-direl�équation linéaire de la forme

y = ax + b

- On appelle régression linéaire, l�ajustement d�une droite au nuage sta-tistique (xi; yi)

- Le problème consiste donc à trouver une droite d�équation y = ax + bqui traduit , avec le plus de �délité, le lien entre x et y. Pour cela nousallons utiliser une technique appelée : la méthode des moindres carrés,qui consiste à minimiser la somme des carrés des distances Di verticalesentre la droite et chacun des points (xi; yi).

Tout calcul fait (pour voir ces calculs consulter votre livre) on trouve :

20

Page 21: Cours de statistiques s1 éco

a =

nPi=1

xiyi � nx:ynPi=1

x2i � n (x)2

etb = y � ax:

où x et y sont respectivement les moyennes arithemétiques de x et de y:

Exemple : Une entreprise veut mener une étude pour connaître la re-lation entre les dépenses hebdomadaires en publicité et le volume desventes qu�elle réalise. On a recueilli au cours des dix dernières semainesles données suivantes :

X=Coût pub en103 DH 4 2 2.5 2 3 5 1 5.5 3.5 4.5Y=Ventes en 103 DH 49.5 41 43 39 46 53 38 54 48.5 51.5

1) Trouver l�équation de la droite de régression des moindres carrés

2) Estimer le volume des ventes si la semaine prochaine on comptedépenser 3500 DH en publicité .

§3 : Séries chronologiques.

Lorsque la variable indépendante x représente le temps et la variabley représente un facteur quelconque on dit qu�on a a¤aire à une sériechronologique . Dans ce cas la droite de régression s�appelle la droite detendance ou le trend

Méthode d�ajustement : Lorsque les di¤érentes valeurs de x (le temps)se suivent par le même intervalle , on associe à chaque valeur de x uncode comme suit :

- Si n est impair , les codes seront ,�3;�2;�1; 0; 1; 2; 3, . Où le code 0est associé à la valeur de x de rang n+ 1

2

- Si n est pair , les codes seront ,�5;�3;�1; 1; 3; 5; où le code 1 estassocié à la valeur de x de rang n

2+ 1

21

Page 22: Cours de statistiques s1 éco

Exemple 1

Donner les codes pour représenter la variable indépendante temps si ona

1) 1975; 1976; 1977; 1978; 1979; 1980

2) lundi mardi mercredi jeudi vendredi samedi dimanche

3) janvier , février , ., décembre.

Exercice 1

Une nouvelle pâtisserie vient d�ouvrir ses portes . La série statistiquesuivante donne le nombre de milliers de pains vendus au cours des dixpremières semaines :

Semaine x 1ère 2ère 3ère 4ère 5ère 6ère 7ère 8ère 9ère 10èreNb de pains(103) y 1,71 1.74 1.73 1.75 1.78 1.77 1.81 1.80 1.84 1.83

1) Trouver l�équation de tendance.

2) Déterminer le nombre de pains qui va etre vendus la semaine prochaine.

§ 4 : Coe¢ cient de corrélation .

Ce coe¢ cient va nous permettre d�aborder le problème du degré de dépen-dance entre les deux variables x et y.

Considérons la série statistique à deux caractères :

x x1 x2 . . . . . . . xny y1 y2 . . . . . . . yn

Dé�nissons la covariance de x et y par : Cov(x; y) = xy � x:y

Le coe¢ cient de corrélation r est donné par la formule suivante

r =Cov(x; y)

s(x):s(y)

22

Page 23: Cours de statistiques s1 éco

Où s(x) et s(y) sont les écart-types des variables x et y .

Interprétation de r

1) On a toujours : �1 6 r 6 1

2) Si r > 0 alors il y a corrélation positive entre x et y , c-à-d si xaugmente alors y augmente .

3) Si r < 0 alors il y a corrélation négative entre x et y , c-à-d si xaugmente alors y diminue .

4) Si r = 0 alors il n�y a aucune corrélation entre x et y , les variables xet y sont indépendantes.

5) Si r est voisin de �1 ou de 1, il y a une très forte dépendance entre xet y .

6) Si r = +1 ou �1, la droite de régression s�ajuste parfaitement auxdonnées recueillies .

Exercice 1 : Intra 2000

La série suivante représente le prix d�une boite de sardines, fabriquée parune usine marocaine, au cours des dix dernières années.

Années 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000Prix y en DH 2.00 2.20 2.25 2.35 2.50 2.70 2.70 2.80 3.00 3.00

1) Trouver l�équation de la droite de régression.

2) Si la tendance continue estimer le prix d�une boite pour l�an 2001 etpour l�an 2002.

3) Calculer le coe¢ cient de corrélation linéaire r.

4) Que peut-on dire des estimations de la question 2

5) En quelle année le prix d�une boite atteindra les 4 DH

23

Page 24: Cours de statistiques s1 éco

Solution

On a n = 10 donc le code 1 sera attribué à la sixième année 1996

Année Code xi Prixyi en Dh x2i y2i xi:yi1991 -9 2.00 81 4.00 -18.001992 -7 2.20 49 4.84 -15.401993 -5 2.25 25 5.06 -11.251994 -3 2.35 9 5.52 -7.051995 -1 2.50 1 6.25 -2.501996 1 2.70 1 7.29 2.701997 3 2.70 9 7.29 8.101998 5 2.80 25 7.84 14.001999 7 3.00 49 9.00 21.002000 9 3.00 81 9.00 27.00Total 0 25,50 330 66.095 18.60

1) L�équation de la droite de régression :

On a : et

Donc l�équation de la droite est y = 2:55 + 0:056� x

2) - L�an 2001 a pour code x = 11, donc l�estimation du prix est y =2:55 + 0:056� 11 = 3:166 DH.- L�an 2002 a pour code x = 13, donc l�estimation du prix est y =2:55 + 0:056� 13 = 3:278 DH.3) Coe¢ cient de corrélation :

On a Cov(x; y) = xy � x:y = xy car donc x = 0

Cov(x; y) =18:6

10= 1:86 , s2(x) = x2 � (x)2 = 33 et s2(y) =

y2 � (y)2 = 0:107

24

Page 25: Cours de statistiques s1 éco

Le coe¢ cient de corrélation r =Cov(x; y)

s(x):s(y)=

1:86

5:74� 0:33 ' 0; 98

4) Puisque le coe¢ cient de corrélation r est proche de 1 alors il y a uneforte dépendance linéaire entre x et y , donc si la tendance continue , lesestimations de la question 2 seront bonnes .

5) Si le prix est de 4 DH , alors le code de l�année est donné par c-à-d

Or l�an 2008 a pour code 25 et l�an 2009 a pour code 27, donc le prixatteindra les 4 DH vers la �n de 2008.

Exercice 2 :( intra 2000)

Dans une entreprise on veut étudier la relation entre le revenu mensuelet les dépenses mensuelles pour le transport. Pour cela , on a choisi unéchantillon de dix employés.

Les résultats de l�enquête sont dans le tableau suivant :

X = Rev mes en Dh 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5Y= Dép en trans en Dh 500 500 475 450 570 525 725 300 625 800

1) Calculer l�équation de la droite de régression .

2) Estimer les dépenses en transport pour quelqu�un qui a un revenumensuel de 2500 DH.

3) Calculer le coe¢ cient de corrélation .

4) Que peut-on dire de l�estimation de la question 2 .

Solution : Total

25

Page 26: Cours de statistiques s1 éco

xi yi x2i y2i xiyi3 500 9 25000 15003.5 500 12.5 25000 17504 475 16 225625 19004.5 450 20.25 202500 20255 570 25 324900 28505.5 525 30.25 275625 2887.56 725 36 275625 43506.5 300 42.25 90000 19507 625 49 390625 43757.5 800 56.25 640000 600052.5 5470 266.25 3174900 29587.5

L�équation de la droite est donc y = 325:56 + 42:18� x

2) Si x = 2; 5 alors y = 325; 56 + 42; 18� 2; 5 = 431; 01 DH

3) Le coe¢ cient de corrélation : r =cov (x; y)

s (x) s (y): Où cov(x; y) = xy

�x:y , s2 (x) = x2 � (x)2 et s2 (y) = y2 � (y)2 :

donc il y a une faible corrélation linéaire entre x et y .

26

Page 27: Cours de statistiques s1 éco

LES PROBABILITES

Introduction.

Après avoir appris à traiter les résultats d�une enquête sur un échan-tillon ( la première partie) nous allons maintenant passer à la questionimportante, à savoir, comment généraliser les résultats obtenus sur unéchantillon à toute la population (statistique inductive). Pour cela nousavons besoin de quelques notions en calcul des probabilités. Le présentchapitre sera donc juste un outil pour pouvoir aborder la statistique in-ductive.

§1 : Notions fondamentales.

� Une expérience aléatoire est un processus caracterisé par:

- i) on ne peut prédire son résultat,

- ii) on peut décrire à priori l�ensemble de tous ses résultat possibles.

Exemple 1

- Un investissement est une expérience aléatoire dont les résultats possi-bles sont, soit R=rentable, soit N=non rentable.

- Lancer un dé est une expérience aléatoire dont les résultats sont 1,2,3,4,5ou 6.

� L�espace échantionnal S associé à une expérience aléatoire est l�ensemblede tous les résultats possibles de cette expérience.

Exemple 2

- Dans le cas d�un investissement S =nN,R

o- Dans le cas du dé, on a S = f1; 2; 3; 4; 5; 6g

� Un événement est un sous-ensemble de l�espace S

27

Page 28: Cours de statistiques s1 éco

� On dira qu�un événement A s�est réalisé lorsque le résultat de expériencealéatoire est un élément de A:

Exemple 3

- Dans le cas du dé, considèrons l�événement A =�obtenir une face paire�.On a A = f2; 4; 6g, et l�événement A sera réalisé si le résultat est 2 ou 4 ou 6.

� L�événement S est appelé l�événement sûr ( ou certain )

� L�événement ; est appelé l�événement impossible.

� Lorsqu�un événement est composé d�un seul élément, il est dit simpleou élémentaire.

� Si A et B sont deux événements alors,

- A[B est l�événement qui se réalise si au moins un de ces deux événementsse réalise

- A \B est l�événement qui se réalise les deux événements se realisent.

-��A (lire non A) est l�événement qui se réalise si l�événement A ne se réalisepas.

§2 : Probabilité d�un evenement.

� On dit qu�on a dé�ni une probabilité p sur un espace échantionnal Slorsqu�à chaque événement A on peut associé un nombre p(A) tel que :

i) 0 � p(A) � 1

ii) p(S) = 1

iii) p(A [B) = p(A) + p(B) pour tous les événements A et B tels que A \B = ;:

§ 2.1 Conséquences immédiates.

a) Pour tout événement A on a p(A) = 1� p(_

A)

b) On a toujours p(;) = 0

c) On a toujours p(A[B) = p(A)+p(B)�p(A\B) quels que soient les événements

28

Page 29: Cours de statistiques s1 éco

A et B:

§ 2.2 Cas particulier d�équiprobabilité.

Lors d�une expérience aléatoire, il arrive souvent (pour des raisons physiques)que les événements élémentaires aient lamême chance de se réaliser. Dansce cas on dit qu�il y a équiprobabilité des événements élémentaires.

Si l�espace échantionnal est S = fr1; r2; :::; rng et si A est un événement quel-conque, p(A) est dé�ni, dans le cas d�équiprobabilité, par

p(A) =card(A)

card(S)=nombre de cas favorables à la réalisation de A

nombre de cas possibles

On véri�e facilement que

i) 0 � p(A) � 1

ii) p(S) = 1

iii) p(A [B) = p(A) + p(B) si A \B = ;

Donc on a bien une probabilité sur S et p(frig) =1

card S=1

n:

Exemple 1.

On lance un dé équilibré.

1) Calculer la probabilité d�avoir un résultat pair.

2) Calculer la probabilité d�avoir un résultat impair.

Solution :

On a S = f1; 2; 3; 4; 5; 6g : Puisque le dé est équilibré, alors on peut supposerqu�il ya équiprobabilité des événements élémentaires.

Appelons A l�événement �avoir un résultat pair�et B l�événement �avoirun résultat impair�. On a A = f2; 4; 6g et B = f1; 3; 5g

29

Page 30: Cours de statistiques s1 éco

p(A) =card A

card S=3

6=1

2et p(B) =

card B

card S=3

6=1

2:

Exercice 1

On lance une pièce de monnaie équilibrée 3 fois d�a¢ lée, et on observechaque fois le côté qu�elle présente lorsqu�elle tombe.

1) Calculer la probabilité d�obtenir au moins une fois le côté face.

2) Calculer la probabilité d�obtenir exactement deux fois le côté face.

Solution :

L�espace échantonnal est S = fFFF; FFP; FPF; FPP; PFF; PFP; PPF; PPPg

Comme la pièce est équilibrée, on peut supposer qu�il y a équiprobabilitédes événements élémentaires.

1) Appelons A l�événement �obtenir au moins une fois le côté face�

On a A = fFFF; FFP; FPF; FPP; PFF; PFP; PPFg et p(A) =card A

card S=7

8:

Remarque 1

Pour calculer p(A) il est parfois plus simple d�utiliser la proprieté p(A) =1� p(

_

A). En e¤et; dans le cas présent on a_

A = fPPPg donc p(A) = 1� 18=7

8

2) Appelons B l�événement �avoir exactement 2 fois le côté face�

On a B = fFFP; FPF; PFFg donc p(B) = 3

8:

§3:Analyse combinatoire:

Le cardinal de certains événements complexes est souvent di¢ cile à cal-culer. Les téchniques d�analyse combinatoire, que nous allons voir main-tenant, vont nous faciliter cette tâche dans beaucoup de cas.

§3.1 Principe de multiplication

Si une première opération peut être executée de n1 façons, et si pourchacun des cas précédent, une deuxième opération peut être executée de

30

Page 31: Cours de statistiques s1 éco

n2 façons,...., et si pour chacun des cas précédent une k-ième opérationpeut être executée de nk façons, alors il y aura n1:n2::::nk façons d�executertoutes ces opérations.

Exemple 1.

Vous interroger trois personnes au hasard. Calculer la probabilité quetoutes les trois soient nées un dimanche.

Solution

Notons le résultat de l�experience par (x; y; z) où x est le jour de naissancede la première personne, y celui de la deuxième personne et z celui de latroisième personne.

Il y a 7 réponses possibles pour la première personne, et pour chaqueréponse de la première personne il y a 7 réponses possibles pour la deux-ième personne, et quelle que soit la réponse des deux premières personnes,il y a 7 réponses possibles pour la troisième personne. Au total , d�aprèsle principe de multiplication, il y a 7� 7� 7 = 343 réponses possibles .

card S = 343

Si on appelle A l�événement �les 3 personnes sont nées un dimanche�alorsA = f(d; d; d)g, donc p(A) = 1

343

§3.2 Les arragements

Considérons un ensemble �ni E à n éléments, et un entier p � n: On ap-pelle arrangement de p éléments pris parmi n, toute suite ordonnée de péléments di¤erents formée à partir des n éléments de E:

Exemple 2.

Soit E = fa; b; c; dg : Les di¤erents arrangements de 2 éléments pris parmi les4 éléments sont :

ab ac ad ba bc bd ca cb cd da db dc. Il y en a 12.

Théorème 1 :

Le nombre d�arrangements de p éléments pris parmi n , noté Apn , est donnépar :

31

Page 32: Cours de statistiques s1 éco

Apn =n!

(n� p)!

où n! = 1� 2� :::� n et par convention on pose 0! = 1

Exemple 3.

A24 est le nombre d�arrangements de 2 éléments pris parmi 4.

A24 =4!

(4� 2)! =4!

2!= 3�4 = 12 c�est ce qu�on atrouvé dans l�exemple précédent.

Exercice 2.

Au tiercé, supposons qu�il ya 12 partants et qu�il ne peut y avoir d�exaequo.

1) Calculer la probabilité de gagner dans l�ordre si l�on a parié une seulefois sur 3 numéros

2) Calculer la probabilité de gagner dans l�ordre ou dans le désordre sil�on a parié une seule fois sur 3 numéros.

Solution

Le résultat de la course est un arrangement de 3 numéros pris parmi 12.Donc card(S) = A312 =

12!

9!= 12� 11� 10 = 1320

Supposons qu�il y a équiprobabilité des événements élémentaires.

1) Posons A l�événement �gagner dans l�ordre�, on a card(A) = 1 ( il y a unseul arrangement gagnant) , donc p(A) =

1

1320= 0; 00075

2) Si abc est le résultat dans l�ordre alors acb; bac; bca; cab et cba sont gagnantdans le désordre . Au total il y a 6 arrangements gagnant dans l�ordre oudans le désordre. La probabilité cherchée est donc égale à 6

1320= 0; 0045:

§3.3 Les pérmutations

- On appelle pérmutation de n éléments de E , tout arrangement de n

32

Page 33: Cours de statistiques s1 éco

éléments pris parmi les n éléments de E.

- Le nombre de pérmutations de n éléments est donc Ann =n!

(n� n)! =n!

0!= n!

§3.4 Les combinaisons.

- Considérons un ensemble �ni E à n éléments, et un entier p � n: Onappelle combinaison de p éléments pris parmin, tout ss-ensemble de p

éléments di¤erents formé à partir des n éléments de E:

Exemple 4.

Soit E = fa; b; c; dg

Les di¤erentes combinaisons de 2 éléments pris parmi les 4 éléments de Esont :

fa; bg , fa; cg , fa; dg , fb; cg , fb; dg , fc; dg

Rappelons que dans un ensemble l�ordre dans lequel on écrit les élémentsn�a aucune importance.

Théorème 2 :

Le nombre de combinaisons de p éléments pris parmi n , noté Cpn; estdonné par

Cpn =n!

p!(n� p)!

Exemple 5.

Au jeu Loto, le parieur doit faire une sélection de 6 numéros parmi lesnombres de 1 à 49.

De combien de façons peut-il faire une mise?

Solution :

Une sélection est une combinaison de 6 éléments pris parmi les 49 ( carl�ordre n�a aucune importance) . Il y a donc C649 =

49!

6!(49� 6)! = 13983816 façons

33

Page 34: Cours de statistiques s1 éco

de faire une mise.

La probabilité de gagner avec une mise est 1

13983816= 0; 000000071

§4: Probabilité conditionnelle

Soit A un événement dans le cadre d�une expérience aléatoire, et B unévénement non impossible ( i.e p(B) 6= 0 ) ; alors la probabilité de l�événementA sachant que l�événement B est déjà réaliser , notée p(A=B) , est donnéepar

p(A=B) =p(A \B)p(B)

p(A=B) s�appelle la probabilité de A par rapport à B:

Exemple 1

1) Quelle est la probabilité qu�une famille de 2 enfants n�ait que des �llessachant que l�aînée est une �lle.

2) Quelle est la probabilité qu�une famille de 2 enfants n�ait que des �llessachant qu�elle a au moins une �lle.

Solution:

L�espace echantionnal de cette expérience est S = fFF; FG;GF;GGg

Appelons A l�événement �la famille n�a que des �lles�

B l�événement �l�ainée est une �lle�

C l�événement �la famille a au moins une �lle�

On a A = fFFg , B = fFF; FGg ; C = fFF; FG;GFg

1) On doit calculer p(A=B): Pour cela on a A \ B = fFFg donc p(A \ B) = 1

4et

p(B) =2

4, d�où p(A=B) =

p(A=B)

p(B)=

1

42

4

=1

2

2) On doit calculer ici p(A=C). pour cela on a A \ C = fFFg donc p(A \ C) = 1

4

34

Page 35: Cours de statistiques s1 éco

et p(C) =3

4d�où p(A=C) =

p(A \ C)p(C)

=1434

=1

3:

Exercice 1

Le tableau suivant présente le comportement d�un échantillon de con-sommateurs par rapport à une compagne publicitaire en faveur d�unelessive.

les consommateurs qui ont acheté n�ont pas acheté totalont vu la pub 15 30 45

n�ont pas vu la pub 15 60 75

total 30 90 120

Si l�on considére au hasard une personne de cette échantillon :

1) Quelle est la probabilité qu�elle ait acheté la lessive ?

2) Quelle est la probabilité qu�elle ait acheté la lessive si elle a vu lapublicité?

3) Est-ce que la publicité a eu des e¤ets positifs sur les consommateurs?

Solution

- L�échantillon contient 120 personnes au total; parmi elles 30 ( au total )ont acheté la lessive.

1) Si on choisit une personne au hasard ( sans aucune information sup-plémentaire) la probabilité qu�elle ait acheté la lessive est 30

120=1

4

2) Si on choisit une personne au hasard et si on sait qu�elle a vu lapublicité (il y en a 45 au total qui ont vu la pub parmi lesquelles 15 ontacheté ) alors la probabilité qu�elle ait acheté est 15

45= 1

3

3) Puisque 13> 1

4donc la probabilité qu�une personne achéte la lessive

après avoir vu la pub est supérieur à la probabilité qu�une personne priseau hasard achète la lessive; donc la publicité a eu des e¤ets positifs surles consommateurs.

§5 Les variables aléatoires (v.a)

35

Page 36: Cours de statistiques s1 éco

Soit S l�espace échantionnal associé à une expérience aléatoire. Une vari-able aléatoire est une fonction de S dans R .

Généralement une v.a sera désigné par X; Y; Z ou T:

Exemple 1

On lance une pièce de monnaie trois fois, alors on a vu que

S = fFFF; FFP; FPF; FPP; PFF; PFP; PPF; PPPg

On peut considérer la v.a X qui compte le nombre de faces, on alors

X(FFF ) = 3 ; X(FFP ) = 2 ; X(FPF ) = 2; ::::X(PFP ) = 1 ; X(PPP ) = 0

Les valeurs possibles de X sont 0; 1; 2 et 3

§5.1 Nouvelle notation pour les événements

Soit X une v.a . l�écriture (X = a) désignera l�événement fs 2 S : X(s) = ag

Exemple 2

Dans le cadre de l�exemple précédent on a :

(X = 3) = fFFFg ; (X = 2) = fFFP; FPF; PFFg ; (X = 1) = fPFP; PPF; FPPg et(X = 0) = fPPPg :

- On peut donc parler de p(X = a); par exemple on a p(X = 3) =1

8; p(X = 2) =

3

8

; p(X = 1) =3

8et p(X = 0) =

1

8

- De même on note par (X � a); (a � X � b) ou (a � X) les événementssuivants:

(X � a) = fs 2 S : X(s) � ag

(a � X � b) = fs 2 S : a � X(s) � bg

(X � a) = fs 2 S : X(s) � ag :

Exemple 3

Toujours dans le cadre de l�exemple précédent on a

36

Page 37: Cours de statistiques s1 éco

(X � 1) = fPPP; PFP; PPF; FPPg et p(X � 1) = 4

8=1

2:

§5.2 Remarque :

a) Comme pour les variables statistiques quantitatives, il y a deux typesde v.a : discrètes et continues.

b)Une v.a est discrète si l�ensemble des valeurs qu�elle peut prendre est �niou dénombrable, par contre si l�ensemble des ses valeurs est un intervalle,elle sera dite continue.

37

Page 38: Cours de statistiques s1 éco

LES LOIS D0USAGE COURANT

Dans ce chapitre, nous allons étudier trois exemples importants de vari-ables aléatoires obéissant aux lois suivantes: binomiale, de Poisson et laloi normale.

§1 Variable aléatoire discrète

Soit X une v.a discrète pouvant prendre les valeurs x1; x2; :::; xn . Posonsp(X = xi) = pi pour i = 1; 2; :::; n .

On appelle loi de la variable X (ou distribution de probabilité de X) letableau suivant:

X x1 x2 .... xnp(X = xi) p1 p2 .... pn

Remarquons que cela est identique à une distribution de fréquences pourune variable statistique où les probabilités pi remplacent les fréquencesrelatives fi

n:

De même que pour une variable statistique, on peut calculer la moyenne,la variance et l�écart-type d�une v.a.

- Lamoyenne, appelée aussi l�espérancemathématique et notée E(X);d�unev.a X est dé�nie par

E(X) =nPi=1

pixi

où les xi sont les valeurs de X et pi = p(X = xi) pour i = 1; 2; :::; n .

- La variance de X , notée V ar(X), est dé�nie par :

V ar(X) = E(X2)� (E(X))2

- L�écart-type de X , noté �(X); est dé�ni comme la racine carrée de lavariance:

�(X) =pV ar(X)

38

Page 39: Cours de statistiques s1 éco

§2 La loi binomiale.

Considérons une expérience qui n�a que deux résultats possibles dontl�un est appelé R (réussite) et l�autre est appelé E (échec), avec p(R) = p etp(E) = 1� p = q:

Ce genre d�expérience s�appelle expérience de Bernoulli.

Répétons cette expérience n fois et considérons la variable aléatoire X quicompte le nombre de réussites au cours des n essais. Alors les valeurspossibles pour X sont 0; 1; 2; :::; n; et on démontre que la loi de probabilitéde X est donnée par :

p(X = k) = Ckn pkqn�k pour k = 0; 1; 2; :::; n:

p(X = k) représente la probabilité d�avoir k réussites après n essais . Cettev.a est dite suivre la loi binomiale de paramétres n et p, et pour dire celaen abrégé on note X B(n; p)

On montre que si X B(n; p) alors

E(X) = np , V ar(X) = npq et �(X) =pnpq

Exemple 1.

Calculer la probabilité d�obtenir 6 bonnes réponses dans un test de 10

questions où il y a 4 choix de réponses pour chacune d�elles, si l�on choisitles réponses tout à fait au hasard.

Solution

Lexperience �répondre à une question au hasard�n�a que deux résul-tats:ou bien la réponse est juste R (réussite) avec la probabilité 1

4; ou bien

la réponse est fausse E (échec) avec la probabilité 34:

Cette experience se répète 10 fois dans le test.

Considéronsmaintenant la v.a X qui compte le nombre de bonnes réponses.Il est clair que

X B(n = 10; p =1

4):

39

Page 40: Cours de statistiques s1 éco

La probabilité d�avoir 6 bonnes réponses est donc donnée par p(X = 6):

On a alors p(X = 6) = C610(1

4)6(3

4)10�6 = 0; 0162

Exercice 1

Dans le cadre de l�exemple précédent , calculer :

1) la probabilité de n�avoir aucune bonne réponse,

2) la probabilité d�avoir au moins cinq bonnes réponses.

Solution

1) la probabilité de n�avoir aucune bonne réponse est donnée par p(X = 0):

On a p(X = 0) = C010(1

4)0(3

4)10 = 0; 0563:

2) la probabilité d�avoir au moins 5 bonnes réponses est donnée par p(X �5):

Or p(X � 5) = p(X = 5) + p(X = 6) + p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10)

Pour accélérer ces calculs, on dispose d�une table (à la �n du livre) don-nant les valeurs numériques de p(X = k) pour certaines valeurs de n etp.

Après lecture de la table , on trouve

p(X � 5) = 0; 0584 + 0; 0162 + 0; 0031 + 0; 0004 + 0; 000 + 0; 000 = 0; 0781

§3 La loi de Poisson

Considérons un événement R dont on sait (par expérience) qu�il se réaliseen moyenne � fois dans un intervalle de temps �t (ou dans une région D)donné. Alors la v.a X qui compte le nombre de réalisation de l�événementR dans l�intervalle de temps �t (ou dans la région D) a pour loi de prob-abilité :

p(X = k) = e��:�k

k! pour k = 0; 1; 2; :::

p(X = k) est la probabilité que l�événement R se réalise k-fois dans l�intervalle

40

Page 41: Cours de statistiques s1 éco

de temps �t (ou dans la région D)

Une telle v.a est dite suivre la loi de Poisson de paramètre �; et pourexprimer cela on écrit X Po(�):

On montre que si X Po(�) alors E(X) = V ar(X) = � et �(X) =p�

Exemple 2

Dans une grande usine, on sait, par expérience, qu�il se produit enmoyenne1; 8 accident de travail par semaine.

1) Calculer la probabilité qu�il se produise, dans cette usine, trois acci-dents en une semaine.

2) Calculer la probabilité qu�il se produise, dans cette usine, au plus deuxaccidents en une semaine.

Solution

L�événement R ici est �un accident de travail�. On sait qu�il se réalise enmoyenne 1; 8 fois par semaine. Donc �t = une semaine, et � = 1; 8

La v.a X qui compte le nombre d�accidents par semaine suit alors une loide Poisson de paramètre 1; 8: X Po(1; 8)

1) La probabilité d�avoir trois accidents par semaine est donnée donc par

p(X = 3) = e�1;8(1; 8)3

3!= 0; 1607

2) La probabilité de voir se produire au plus 2 accidents par semaine estdonnée par p(X � 2) = p(X = 0) + p(X = 1) + p(X = 2)

= e�1;8(1; 8)0

0!+ e�1;8

(1; 8)1

1!+ e�1;8

(1; 8)2

2!

Pour calculer rapidement des expressions de ce genre, une table estfournie en annexe à la �n du livre.

On lit sur la table p(X = 0) = 0; 1653; p(X = 1) = 0; 2975 et p(X = 2) = 0; 2678

d�où p(X � 2) = 0; 1653 + 0; 2975 + 0; 2678 = 0; 7306

Exemple 3

41

Page 42: Cours de statistiques s1 éco

Le nombre moyen de défauts mineurs par mètre carré de tissu produitpar une usine de textile est 0; 3. Si les défauts sont distribués au hasarddans la production, quelle est la probabilité qu�un mètre carré de tissucontienne plus d�un défaut.

Solution

L�événement R ici est �un défaut mineur�. On sait qu�il se réalise enmoyenne 0; 3 fois par mètre carré. Donc la région D=un mètre carré, et� = 0; 3

La v.a X qui compte le nombre de défauts mineurs par mètre carré, suitdonc une loi de Poisson de paramètre 0; 3: X Po(0; 3)

la probabilité qu�un mètre carré de tissu contienne plus d�un défaut estdonnée par p(X > 1) = p(X = 2) + p(X = 3) + ::::::

Pour faciliter ce calcul , il vaut mieux passer par l�événement contrairecomme suit:

p(X > 1) = 1� p(X � 1)

= 1� [p(X = 0) + p(X = 1)]

= 1� (0; 7408 + 0; 2222)

= 0; 037

§3.1 Remarque importante

Soit X Po(�) . Il arrive souvent qu�on cherche la probabilité de voir seréaliser l�événement R en question pendant n�t (ou dans la région nD).Alors dans ce cas la v.a Y qui compte le nombre de réalisation de R

pendant n�t ( ou nD) suit la loi Po(n�):

Exemple 4.

Dans le cadre de l�exemple précédent, quelle est la probabilité qu�unepièce de tissu de 10 mètres carrés ne contienne aucun défaut.

Solution

On sait qu�en moyenne, il y a 0; 3 défauts par mètre carré, donc il y a enmoyenne 10� 0; 3 = 3 défauts par 10 m2:

42

Page 43: Cours de statistiques s1 éco

La v.a Y qui compte le nombre de défauts par 10 m2 suit donc la loi dePoisson de paramètre 3: Y Po(3)

la probabilité qu�une pièce de tissu de 10mètres carrés ne contienne aucundéfaut est donnée par p(Y = 0) = e�3 (3)

0

0!= 0; 0498

Exercices

Exercice 1 (�nal 2000)

Par expérience, on sait qu�une personne sur huit parmi celles qui entrentdans un supermarché n�achète aucun article.

Parmi les 12 prochaines personnes qui vont entrer au supermarché, cal-culer:

1) la probabilité qu�il s�en trouve au moins une personne qui n�achèterien ;

2) la probabilité que les 12 achètent chacun au moins un article.

Exercice 2

L�expérience montre que 16des cosommateurs contactés par un vendeur

d�aspirateurs achètent un des produits o¤erts.Calculer la probabilité queparmi les 15 prochaines personnes contactées, il s�en trouve 5 qui accéptentd�acheter le produit.

Exercice 3

Des relevés récents montrent qu�il entre en moyenne 1; 6 clients par minutedans une agence banquaire.

1) Quelle est la probabilité qu�il n�entre, dans cette agence, aucun clientpendant un intervalle d�une minute

2) Quelle est la probabilité qu�il entre, dans cette agence, au moins unclient pendant un intervalle de deux minutes

3) Quelle est la probabilité qu�il entre, dans cette agence, au plus 5 clientspendant un intervalle de 5 minutes.

43

Page 44: Cours de statistiques s1 éco

Solutions

Exercice 1

Une personne qui entre au supermarché est une expérience qui n�a quedeux résultats : ou bien la personne n�achète aucun article R (réussite)avec p(R) = 1

8; ou bien la personne achète au moins un article E (échec)

avec p(E) = 7

8:

Pour les 12 prochaines personnes qui entrent au supermarché, cette ex-périence se répéte 12 fois .

Considérons la v.a X qui compte le nombre de personnes qui n�achètentaucun article. Alors X B(n = 12; p =

1

8)

1) la probabilité que parmi les 12 au moins une personne n�achète rien estdonnée par p(X � 1) = 1� p(X < 1) = 1� p(X = 0) = 1� C012(

1

8)0(7

8)12 = 0; 798 58

2) Considérons la v.a Y qui compte le nombre de personnes qui achètentau moins un article. Il est clair que cette v.a suit une loi binomiale deparamétres n = 12, et p = 7

8:

La probabilité que les 12 achètent chacun au moins un article est donnéepar p(Y = 12):

p(Y = 12) = C1212(78)12(1

8)0 = (7

8)12 = 0; 201 4

Exercice 2

Contacter un client est une expérience à deux résultats : ou bien le clientachète (Réussite) , avec p(R) = 1

6, ou bien il n�achète pas (Echec) , avec

p(E) =5

6:

Lorsque le vendeur cotacte 15 clients, il répète l�expérience 15 fois. Donc lav.a X qui compte le nombre de clients qui achètent , suit la loi binomialeB(n = 15; p =

1

6):

La probabilité que parmi les 15 clietns contactés, il s�en trouve 5 quiachètent, est donnée par p(X = 5) = C515(

1

6)5(5

6)10 = 0; 0623 (n�existe pas dans

44

Page 45: Cours de statistiques s1 éco

la table)

Exercice 3

1) L�événement R �un client entre dans l�agence�se produit en moyenne1; 6 fois par minute. Donc la v.a X qui compte le nombre de clients quientrent, par minute, dans l�agence suit une loi de Poisson de paramètre1; 6:

La probabilité qu�il n�entre aucun client dans l�agence pendant un inter-valle d�une minute est donnée par p(X = 0) = e�1;6

(1; 6)0

0!= 0; 2019

2) De même si on considére la v.a Y qui compte le nombre de clientsqui entrent dans l�agence pendant un intervalle de deux minutes, alorsY Po(3; 2) car 2� 1; 6 = 3; 2

la probabilité qu�il entre, dans cette agence, au moins un client pendantun intervalle de deux minutes est donnée par :

p(Y � 1) = 1� p(Y < 1)

= 1� p(Y = 0)

= 1� 0; 0408

= 0; 9592

3) Soit Z la v.a qui compte le nombre de clients qui entrent dans l�agencependant un intervalle de 5 minutes. On a Z Po(8) car 5� 1; 6 = 8.

la probabilité qu�il entre, dans cette agence, au plus 5 clients pendant unintervalle de 5 minutes est donnée par :

p(Z � 5) = p(Z = 0) + p(Z = 1) + ::::+ p(Z = 5) (la lecture de la table donne)

= 0; 0003 + 0; 0027 + 0; 0107 + 0; 0286 + 0; 0573 + 0; 0916

= 0; 1912:

§4 Variable aléatoire continue

Pour une v.a aléatoire X continue, sa loi de probabilité est donnée parune fonction f appelée densité de probabilité de X: Elle est représentéepar une courbe continue et la probabilité p(a � X � b) est donnée par la

45

Page 46: Cours de statistiques s1 éco

surface comprise entre la courbe de f , l�axe Ox et les droites verticalesx = a et x = b

La surface totale entre la courbe de f et l�axe des x est évidemmentégale à 1

� On dé�nit l�espérance mathématique, la variance et l�écart type d�unevariable continue comme suit:

E(X) =Rxf(x)dx

V ar(x) =Rx2f(x)dx � (E(x))2 = E(X2)� (E(X))2

�(X) =pV ar(X)

� Dans la suite on va avoir besoin de la dé�nition suivante:

Une variable aléatoire est dite centée si E(X) = 0 et elle est dite réduite siV ar(X) = 1:

Si on a à la fois E(X) = 0 et V ar(X) = 1 , elle sera dite centrée réduite.

� On montre que si X est une v.a telle que E(X) = � et �(X) = � alors lavariable Z =

X � ��est une variable centrée réduite c�est-àdire que E(Z) = 0

et �(Z) = 1

§4.1 La loi normale centée réduite

� Une variable Z est dite normale centée réduite si sa densité de probabilitéest donnée par :

f(x) =1p2�e�x2

2

� Pour dire qu�une variable aléatoire Z suit une loi est normale centréeréduite, on écrit Z N(0; 1)

§4.2 Proprietés

� La courbe de f est symétrique par rapport à l�axe des y

� La surface comprise entre la courbe et l�axe des x est comme on l�a déjàdit est égale à 1, donc l�axe des y divise cette surface en deux parties

46

Page 47: Cours de statistiques s1 éco

égales chacune à 0; 5

� Pour calculer une probabilité, lorsque Z N(0; 1) , on se sert d�une tableconstruite pour cela. Cette table donne seulement p(Z � z0) pour z0 > 0 .c�est-à-dire elle donne la surface hachurée.

Pour comprendre comment lire la table voici un exemple

Exemple 1.

Soit Z N(0; 1): Calculer p(Z � 1; 65):

On utilise la table comme suit: on écrit 1; 65 = 1; 6+0; 05. Puis au croisementde la ligne 1; 6 et la colonne 0; 05 on lit la probabilité p(Z � 1; 65) = 0; 9505:

� Pour calculer toutes les probabilités, même celles qui ne sont pas donnéespar la table, par exemple p(Z � �1; 65) ou p(Z � 1; 36) , on utilise les proprietésde f . Voici comment :

§4.2 Calcul de p(Z � z0) avec z0 négatif.

Bien sûr cette probabilité n�est pas donnée par la table, mais en utilisantles proprietés de la densité, on peut la calculer en se ramenant à ce quedonne la table c�est-à-dire p(Z � x) où x est positif.

La surface S1 est égale à la surface S2 à cause de la symétrie de la courbepar rapport à l�axe des y.

On a donc

p(Z � z0) =surface totale�p(Z � �z0) (avec �z0 � 0)

= 1� p(Z � �z0):

La table nous donne p(Z � �z0) car �z0 � 0.

47

Page 48: Cours de statistiques s1 éco

ECHANTILLONNAGE ET ESTIMATION

Dans ce chapitre on va aborder le problème fondamental de la statis-tique, à savoir développer des procédés permettant de généraliser à touteune population des résultats observés sur un échantillon, tout en étantcapable de mesurer les chances que ces généralisations s�avèrent exactes.

§1: Echantillon aléatoire

Dans la pratique, il est souvent impensable de faire porter notre étudestatistique sur l�ensemble de tou les individus de la population. Onprocède alors par échantillonnage, c�est-à-dire que l�on restreint notreétude à une partie de la population.

Pour que les conclusions de notre étude soient valables, les échantil-lons doivent être représentatifs. Une des façons d�obtenir un échantillonreprésentatif est de procéder à un échantillonnage aléatoire, ce qui re-vient à considérer que les individus de la population ont la même chanced�appartenir à un même échantillon. En�n, pour obtenir un échantillonaléatoire , on attribue un numéro à chaque individu de la population; oninscrit ces numéros sur des petits morceaux de papier que l�on place dansune urne, puis on procéde à un tirage dans l�urne.

Quand on a extrait un individu d�une urne, avant de procéder à un nou-veau tirage, on peut soit l�y remettre (tirage avec remise), soit ne pas l�yremettre(tirage sans remise). Dans le deuxième cas, un individu ne peutsortir qu�une seule fois.

Quand chaque individu d�une population peut être tiré plus d�une fois,l�échantillonnage est dit non exhaustif, dans le cas contraire il est ditexhaustif.

§2 Distribution d�échantillonnage des moyennes

Supposons qu�un certain caractère numérique dans une population apour moyenne � et d�écart-type �:

Considérons tous les échantillons de taille n, qui peuvent être extrait auhasard (avec ou sans remise).

Désignons par x1; x2; ::: les moyennes du caractère dans l�échantillon 1,2,...etc.

48

Page 49: Cours de statistiques s1 éco

Considérons la variable aléatoire X dont les valeurs possibles sont x1; x2; :::

La variable aléatoire X s�appelle distribution d�échantillonnage desmoyennes.

On montre les deux théorèmes suivants :

Théorème 1: Les caractéristiques de X

a) Si le tirage est exhaustif dans une population de taille N, on a :

E( X) = � et �( X) =�pn

rN � nN � 1

b) Sinon on a :

E( X) = � et �( X) =�pn

Théorème 2: La loi de X

Dans une population distribuée normalement (c-à-d le caractère suit laloi normale dans la population) ou dans une population quelconque maisavec n � 30 on a : X N(�; �2(X))

Remarque.

Le facteurrN � nN � 1 qui s�appelle facteur d�exhaustivité peut être pris égal

à 1 si n � 0; 05N: Autrement ditrN � nN � 1 = 1 si la taille de l�échantillon est

inférieur à 5% de la population.

Exemple 1

Supposons que le poids d�une population de 60 étudiants d�une universitéest normalement distibué avec une moyenne � = 64 kg et une variance�2 = 20 kg2:

Un échantillon de 20 étudiants a été tiré.

1) Trouver les caractéristiques et la loi de probabilité de la distributiond�échantillonnage des moyennes X si le tirage a été e¤ectué avec remise.

2) Même question pour un tirage sans remise.

49

Page 50: Cours de statistiques s1 éco

3) Trouver la probabilité qu�un échantillon de taille 20 tiré avec remiseait une moyenne supérieure ou égale à 66 kg.

4) Trouver deux valeurs L1 et L2 situées à distance égale de part et d�autresde � = 64 telles que la probabilité que la moyenne d�un échantillon nonexhaustif de 20 étudiants tombe entr ces deux valeurs soit 0; 95.

Solution.

1) On est dans le cas non exhaustif, donc les caractéristiques de X sont (voir théorème 1)

E( X) = � = 64 kg et �( X) =�pn=

p20p20= 1

Puisque la population est distribuée normalement alors X N(� ; �2(X))

(voir théorème 2)

Donc ici X N(64 ; 1)

2) Si le tirage est exhaustif alors le théorème 1 nous dit que E( X) = 64

kg et

�( X) =

p20p20

r60� 2060� 1

ce qui donne �( X) = 0; 8234

Le théorème 2 nous dit que

X N(64 ; �2(X) = 0; 6779)

3) Puisque le tirage est avec remise alors on est dans le cadre de laquestion 1) donc X N(64; 1): La probabilité demandée est P (X � 66): Pourla calculer faisons le changement de variable habituel

Z =X � ��(X)

=X � 641

donc X = Z + 64

On sait que dans ce cas Z N(0; 1)

P (X � 66) = P (Z + 64 � 66)

50

Page 51: Cours de statistiques s1 éco

= P (Z � 2)

= 1� P (Z � 2)

= 1� 0; 9772

= 0; 0228:

4) La question signi�e qu�il faut chercher L1 et L2 telles que P (L1 � X �L2) = 0; 95 avec X N(64; 1) puisque le tirage est avec remise.

Pour cela posons encore Z = X � ��(X)

=X � 641

donc X = Z + 64 On a 0; 95 =P (L1 � X � L2) = P (L1 � Z + 64 � L2) = P (L1 � 64 � Z � L2 � 64)

Puisque L1 et L2 doivent être symétriques par rapport à la moyenne � = 64de X alors pour la variable aléatoire Z ceci revient à chercher t > 0 tel queP (�t � Z � t) = 0; 95:

Dans ce cas on a :

P (�t � Z � t) = P (Z � t)� P (Z � �t) = P (Z � t)� [1� P (Z � t)] = 0; 95

donc, P (Z � t) = 1+0;952

= 0; 975

La table de la loi normale nous donne t = 1; 96 et par suite

On peut écrire donc P (62; 04 � X � 65; 96) = 0; 95

Autrement dit l�intervalle [62; 04 ; 65; 95] possède 95% de chance de contenirla moyenne d�un échantillon non exhaustif de taille 20.

Exercice 1

La durée de vie moyenne des ampoules électriques produites par une usineest de 800 heures avec un écart-type �=40 heures: De cette population ontire un échantillon de taille 25 pris sans remise(exhaustif). Trouver, ensupposant que la durée de vie des ampoules est distribuée normalement:

1) P (X � 785)

2) P (790 � X � 810)

3) L1et L2 symétriques par rapport à � = 800 telles que P (L1 � X � L2) = 0; 90:

51

Page 52: Cours de statistiques s1 éco

Exercice 2

Les résultats de 200 étudiants à un test de mathématiques présentent unemoyenne de 75 sur 100 et un écart-type de 10 . De cette population , onpréléve , sans remise, un échantillon de taille 50. Trouver:

1) La probabilité que le résultat moyen de cet échantillon se situe entre74 et 76.

2) Les limites L1 et L2 d�un intervalle symétrique par rapport à la moyennequi posséde 99% des chances de contenir la moyenne de cet échantillon.

Solutions

Exercice 1

On a � = 800 h et � = 40h

Le tirage est exhaustif, donc on doit tenir compte du facteur d�exhaustivitépuisque n = 25 < 30 . Mais on peut considérer que la population est trèsgrande, donc n < 0; 05N (ce qui est logique puisque 25 ampoules représentecertainement moins de 5% de la production de l�usine) et par suite lefacteur d�exhaustivité peut être pris égal à 1. D�où

E(X ) = 800h et �(X) =�pn=

40p25= 8

La population est supposée normale donc X N(800 ; 64)

Posons Z =X � ��(X)

=X � 800

8donc X = 8Z + 800 avec Z N(0 ; 1)

1) P (X � 785) = P (8Z+800 � 785) = P (Z � �1; 88) = 1�P (Z � 1; 88) = 1�0; 9699 = 0; 0301:

2) P (790 � X � 810) = P (790 � 8Z + 800 � 810)

= P (�1; 25 � Z � 1; 25)

= P (Z � 1; 25)� P (Z � �1; 25)

= P (Z � 1; 25)� [1� P (Z � 1; 25)]

= 2P (Z � 1; 25)� 1

= 2(0; 8944)� 1

52

Page 53: Cours de statistiques s1 éco

= 0; 7888

Cette probabilité signi�e qu�il y a 78; 88% de chances que la moyenne d�unéchantillon exhaustif de taille 25 soit dans l�intervalle [790 ; 785]

3) De la même façon que dans l�exemple du cours, on a :

P (L1 � X � L2) = P (L1 � 8Z + 800 � L2) = P (L1 � 800

8� Z � L2 � 800

8) = 0; 90

Cherchons t > 0 tel que P (�t � Z � t) = 0; 90

Ceci est équivalent à P (Z � t) = 1 + 0; 90

2= 0; 95: la valeur de t la plus proche

dans la table est t = 1; 65

L1 � 8008

= �1; 65 et L2 � 8008

= 1; 65 Donc L1 = 786; 8 et L2 = 813; 2

Ceci signi�e qu�il y a 90% de chances que la moyenne d�un échantillon detaille 25 soit dans l�intervalle [786; 8 ; 813; 2] :

Exercice 2

On a � = 75 ; � = 10 ; n = 50 et N = 200

Le tirage est exhaustif donc E(X) = 75 et �(X) =�pn

rN � nN � 1 =

10p50

r200� 50200� 1 '

1; 23

Puisque n = 50 > 30 alors X N(75 ; (1; 23)2)

Posons comme toujours Z =X � 751; 23

donc X = 1; 23Z + 75 et Z N(0 ; 1)

1) P (74 � X � 76) = P (74 � 1; 23Z + 75 � 76)

= P (74� 751; 23

� Z � 76� 751; 23

)

= P (�0; 81 � Z � 0; 81)

= P (Z � 0; 81)� P (Z � �0; 81)

= P (Z � 0; 81)� [1� P (Z � 0; 81)]

= 2P (Z � 0; 81)� 1

53

Page 54: Cours de statistiques s1 éco

= 2(0; 7910)� 1

= 0; 5820

2) P (L1 � X � L2) = 0; 99

P (L1 � 1; 23Z + 75 � L2 = 0; 99 =) P (L1 � 751; 23

� Z � L2 � 751; 23

) = 0; 99

On cherche t > 0 tel que P (�t � Z � t) = 0; 99 et comme avant ceci revient àrésoudre l�équation

P (Z � t) = 1 + 0; 99

2= 0; 995 . La table de la loi normale nous donne t = 2; 58 (la

valeur la plus proche)

DoncL1 � 751; 23

= �2; 58 et L2 � 751; 23

= 2; 58 =) L1 = 1; 23(�2; 58) + 75 = 71; 83L2 = 1; 23(2; 58) + 75 = 78; 17

L�intervalle [L1 ; L2] a 99% de chances de contenir la moyenne d�un échan-tillon exhaustif de taille 50.

§3 Estimation par intervalle de con�ance de la moyenne �

Lors d�une étude statistique, en général la moyenne � de la population estinconnue. Le problème qui nous interésse ici est de trouver un intervalle[L1 ; L2] tel que la probabilité que � appartienne à cet intervalle soit �xéed�avance.

Dé�nition 1On appelle intervalle de con�ance, un intervalle de la forme [L1 ; L2]

symétrique par rapport à � ayant une certaine probabilité de contenir lamoyenne �:

Dé�nition 2On appelle niveau de con�ance, noté 1�� , la probabilité qu�à l�intervallede con�ance de contenir la moyenne �: Le nombre � s�appelle le risqued�erreur.Méthode de calcul de L1 et L2Si n � 30 , ou si la population est distribuée normalement avec � connu,on sait que dans ce cas que X N(�;�2(X)):

54

Page 55: Cours de statistiques s1 éco

Posons Z =X � ��(X)

, on sait qu�alors Z N(0; 1)

1ereétape: on cherche d�abord t > 0 tel que P (�t � Z � t) = 1 � � . Voicicomment:

On a P (Z � t)� P (Z � �t) = 1� �

P (Z � t)� [1� P (Z � t)] = 1� � donc P (Z � t) = 1� �2et t sera donné par

la table de la loi normale.

2�emeétape: Une fois que t est connu, on peut écrire que P (�t � X � ��(X)

� t) =

1� � doncP (X � t�(X) � � � X + t�(X)) = 1� �

Pour un échantillon, la variable aléatoire X prend la valeur x, donc

L1 = x� t�(X) L2 = �x+ t�(X)

Si � est inconnu, alors on peut prendre une valeur estiméé ponctuellepour �; c�est-à-dire l�écart-type trouvé dans l�échantillon.

Remarque

Pour le calcul de l�intervalle de con�ance [L1;L2] on prendra les valeurs det suivantes:

t = 2; 58 si � = 1%

t = 1; 96 si � = 5%

t = 1; 65 si � = 10%

Exemple

Une machine est réglée pour verser un certain mélange dans une boiteavec un écart-type de 3; 2 grammes. Parmi l�ensemble de la production, onprélève au hasard, avec remise, 30 boites pour chacune d�elles on a noté lepoids. Sachant que le poids moyen obtenu à partir de l�échantillon est 165grammes, construire un intervalle de con�ance à 95% pour le poids moyendes boites remplies par cette machine.

Solution :

55

Page 56: Cours de statistiques s1 éco

On a et L1 = x � t�(X) et L2 = x + t�(X) avec x = 165g et puisque letirage est non exhaustif alors �(X) =

�pn=3; 2p30= 0; 584::

Comme 1� � = 0; 95 alors � = 0; 05 = 5% donc t = 1; 96

Donc L1 = 165� (1; 96)(0; 584) = 163; 86

L2 = 165 + (1; 96)(0; 584) = 166; 14

On a donc P (� 2 [163; 86 ; 166; 14]) = 0; 95

Autrement dit, on a 95% de chances que lamoyenne appartienne à l�intervalle[163; 86 ; 166; 14] :

Exercice 1

Etan donné que la moyenne � et l�écart-type � de la durée de vie d�untube écran de télévision fabriqué par une compagnie sont inconnus, ona prelevé au hasard dans la production un échantillon de taille 36 pourlequel on a obtenu une moyenne de 6 ans et un écart-type de 0; 8 an .Construire un intervalle de con�ance à 95% pour � puis un intervalle decon�ance à 99%:

Exercice 2

Dans le but de se faire une idée sur l�e¢ cacité d�un nouveau médicamentdevant prolonger la durée du sommeil des gens, on a administré unedose de ce médicament à 40 individus choisis au hasar. On a obtenu untemps supplémentaire moyen de sommeil de 1; 6 heures avec un écart-typede 0; 4 heure pour ces individus. Construire un intervalle de con�ance à99% pour�� , le temps moyen de prolongation de sommeil causé par lemédicament.

Solution :

Exercice 1

On a n = 36 ; x = 6 et l�écart-type de l�échantillon s = 0; 8: On a aussiL1 = x� t�(X) et L2 = x+ t�(X) où �(X) =

spn=0; 8p36= 0; 133::

Ici on a pas tenu compte du facteur d�exhaustivité car on peut considérerque la population est très grande, et par suite la taille de l�échantillonreprésente moins de 5% de la taille de la population.

56

Page 57: Cours de statistiques s1 éco

- Si � = 5% alors t = 1; 96 donc

L1 = 6� (1; 96)(0; 133) = 5; 74

et

L2 = 6 + (1; 96)(0; 133) = 6; 26

D�où P (� 2 [5; 74 ; 6; 26]) = 0; 95

- Si � = 1% alors t = 2; 58 donc

L1 = 6� (2; 58)(0; 133) = 5; 66

L2 = 6 + (2; 58)(0; 133) = 6; 34

D�où P (� 2 [5; 66 ; 6; 34]) = 0; 99

Exercice 2

On a n = 40 ; x = 1; 6 et s = 0; 4 donc �(X) =spn

0; 4p40= 0; 06

Pour � = 1% on a t = 2; 58 donc

L1 = x� t�(X) = 1; 6� (2; 58)(0; 06) = 1; 45

L2 = x+ t�(X) = 1; 6 + (2; 58)(0; 06) = 1; 75

Donc P (� 2 [1; 45 ; 1; 75]) = 0; 99

§4 Distribution d�échantillonnage des proportions

Considérons une population dans laquelle chaque individu posséde oune posséde pas un caractère. Supposons que la proportion de ceux quipossédent le caractère est p ( donc la proportion de ceux qui ne possédentpas le caractère est 1� p)

Considérons tous les échantillons de taille n qui peuvent être extrait dela population . Pour chaque échantillon i déterminons la proportion fi deceux qui posséedent le caractère.

La variable aléatoire F dont les valeurs sont f1; f2; ::: est appelée distrib-ution d�échantillonnage des proportions.

57

Page 58: Cours de statistiques s1 éco

On a les théorèmes suivants:

Théorème 1

Si le tirage est sans remise (exhaustif) dans une population de taille Nalors

E(F ) = p et �(F ) =

rp(1� p)n

rN � nN � 1

Sinon on a

E(F ) = p et �(F ) =

rp(1� p)n

Théorème 2

Si n � 30 alors F N(p ; �2(F ))

Remarque

Si n < 0; 05N le facteur d�exhaustivitérN � nN � 1 peut être pris égal à 1:

Exercice 1

Une certaine machine usine des pièces. D�une façon générale, elle produit3% de pièces mauvaises. Un client reçoit une caisse de 500 pièces, enprovenance directe de la machine.

1) Quelle est la probabiulité qu�il trouve moins de 1% de pièce mauvaisesà l�interieur de la caisse.

2) Quelle est la probabiulité qu�il trouve plus de 5% de pièce mauvaises àl�interieur de la caisse

Exercice 2

Calculer la probabilité pour que sur les 200 prochains accidentés de voituresur les routes, il existe:

1) moins de30% d�hommes,

2) plus de 80% d�hommes

58

Page 59: Cours de statistiques s1 éco

3) entre 40% et 60% d�hommes sachant que, généralement, sur cinq person-nes accidentées il y a une femme.

Solution :

Exercice 1

D�une façon générale, la proportion de pièces mauvaises est p = 3% =

0; 03: On peut considérer que l�échantillon provient d�une population trèsgrande (donc n � 0; 05N) . La distibution d�échantillonnage des proportionsF a donc les caractéristiques suivantes:

E(F ) = p = 0; 03 ; �(F ) =

rp(1� p)n

=

r0; 03(1� 0; 03)

500' 0; 0076

F N(0; 03 ; (0; 0076)2)

1) On doit calculer P (F < 0; 01);Pour cela posons Z =F � 0; 030; 0076

On a P (F < 0; 01) = P (0; 0076Z + 0; 03 < 0; 01) = P (Z < �2; 63) = 1� P (Z < 2; 63) = 0; 0043:

2) La probabilité que le client trouve plus de 5% de pièces mauvaises estdonnée par P (F > 0; 05):

On a P (F > 0; 05) = P (0; 0076Z + 0; 03 > 0; 05) = P (Z > �2; 63) = 1� P (Z < 2; 63) = 0; 0043:

Exercice 2

Désignons par p la proportion d�hommes accidentés. On a p = 45= 0; 8:

On peut considérer que l�échantillon de taille n = 200 provient d�une pop-ulation très grande (donc n < 0; 05N), ce qui permet de prendre le facteurd�exhaustivité égal à 1. La distribution d�échantillonnage des proportionsa donc les caractéristiques suivantes:

E(F ) = 0; 8 ; �(F ) =

rp(1� p)n

=

r0; 8(1� 0; 8)

200' 0; 028

Et comme n = 200 > 30 alors F N(0; 8 ; (0; 028)2)

1) La probabilité demandée est donnée par P (F < 0; 3):

Posons Z =F � 0; 80; 028

donc F = 0; 028Z + 0; 8 et Z N(0; 1)

59

Page 60: Cours de statistiques s1 éco

P (F < 0; 3) = P (0; 028Z + 0; 8 < 0; 3) = P (Z <0; 3� 0; 80; 028

) = P (Z < �17; 85) ' 0

2) De même calculons P (F > 0; 8):

P (F > 0; 8) = P (0; 028Z + 0; 8 > 0; 8) = P (Z > 0) = 0; 5

3) Il faut calculer P (0; 4 < F < 0; 6):

P (0; 4 < F < 0; 6) = P (0; 4 < 0; 028Z + 0; 8 < 0; 6)

= P (�14 < Z < �7) ' 0

§ 5 Estimation par intervalle de con�ance de la proportion

Comme pour la moyenne, nous allons chercher deux valeurs L1 et L2telles que la probabilité que p apparetienne à [L1;L2] soit égale à 1�� où �

est le risque d�erreur �xé d�avance.

Si n � 30 nous savons que la distribution d�échantillonnage F suit la loinormale N(p ; �(F ) ):

Posons Z = F � p�(F )

, on sait que Z N(0; 1)

Cherchons t > 0 tel que P (�t � Z � t) = 1� �

On a vu (voir §3 ) que ceci est equivalent à P (Z � t) = 1� �2et t est donné

par la table de la loi normale.

On a donc P (�t � F � p�(F )

� t) = 1�� donc P (F � t�(F ) � p � F + t�(F )) = 1��

Pour un échantillon la variable aléatoire prend la valeur f , donc

L1 = f � t�(F )

L2 = f + t�(F )

Il reste pour calculer L1 et L2 à estimer �(F ) :

On prend �(F ) =

rf(1� f)

n

rN � nN � 1 si l�on doit tenir compte du facteur

d�exhaustivité, ou on prend �(F ) =rf(1� f)

nsinon .

60

Page 61: Cours de statistiques s1 éco

Rappelons que f est la valeur de la proportion trouvée dans l�échantillon.

Exercice 1

90% des 150 personnes interrogées sont des consommateurs d�une marquede lessive.

Construire un intervalle de con�ance à 95% pour la proportion de l�ensembledes consommateurs de cette lessive

Exercice 2

Dans un certain lac, un échantillon de 350 poissons pris à l�aide d�un�let comprend 70 truites. Construire un intervalle de con�ance pour laproportion des truites dans ce lac.

1) avec un niveau de con�ance de 90%

2) avec un risque de 1%

Solution :

Exercice 1

Dans l�échantillon de taille 150 on a trouvé que la proportion est f = 0; 9:

On peut supposer que la population est très grande (donc n < 0; 05N), doncle facteur d�exhaustivité peut être pris égal à 1, et par suite �(F ) =rf(1� f)

n=

r0; 9(1� 0; 9)

150= 0; 024

Ici 1� � = 0; 95 donc � = 0; 05 = 5% et par suite t = 1; 96

Donc L1 = 0; 9� (1; 96)(0; 024) = 0; 85

L2 = 0; 9 + (1; 96)(0; 024) = 0; 95

D�où P (p 2 [0; 85 ; 0; 95]) = 0; 95

Avec un niveau de con�ance de 95%, la proportion des consommateurs sesitue entre 85% et 95%:

Exercice 2

61

Page 62: Cours de statistiques s1 éco

Dans l�échantillon de taille n = 350 , la proportion des truites est f = 70

350=

0; 2:

On peut supposer que la taille de la population (les poissons du lac) est

très grande donc �(F ) =rf(1� f)

n=

r0; 2(1� 0; 2)

350= 0; 0213::: ' 0; 021

1) Si � = 10% ( c-à-d 1� � = 0; 90) alors t = 1; 65 donc

L1 = 0; 2� (1; 65)(0; 021) = 0; 165 ' 0; 17

L2 = 0; 2 + (1; 65)(0; 021) = 0; 234 ' 0; 23

Avec un risque d�erreur de 10% , la proportion des truites dans le lac sesitue entre 17% et 23%.

2) Si � = 1% alors t = 2; 58 donc L1 = 0; 2� (2; 58)(0; 021) = 0; 1458 ' 0; 15 et

L2 = 0; 2 + (2; 58)(0; 021) = 0; 254 ' 0; 25

Avec un niveau de con�ance de 99%, la proportion des truites dans le lacse situe entre 15% et 25%:

62