d.touiar 04/03/2008 statistique...
TRANSCRIPT
D.TOUIAR 04/03/2008
1
STATISTIQUE INFERENTIELLE
Module Méthodes Quantitatives :
-Statistique III
(S4)
Section D
INTRODUCTION GENERALE
• Il y a en statistique deux approches :
• La Description (vue en S2) : consiste à résum er et à décrire un ensem ble de données.
• L’inférence statistique : son but est d’étendre les propriétés de l’échantillon à la population entière (objet de ce semestre) et de valider ou de rejeter des hypothèses à priori ou formulées après une étape descriptive (objet de S5).
La démarche statistique est la suivante
• L’échantillon est tiré au hasard dans une population plus vaste (1er chapitre).
• Le calcul des probabilités (vu en S3) permet ensuite de préciser les caractéristiques de l’ensemble des échantillons que l’on aurait pu obtenir par le même procédé; c’est l’étude des distributions d’échantillonnage (2ème chapitre)
• On inverse les conclusions de l’étape
précédente pour en déduire la structure
vraisemblable de la population dont est
issu l’échantillon observé; c’est la phase
inférentielle (3ème chapitre)
On remarque que cette démarche est
semblable à la démarche scientifique
habituelle
confrontation résultat
Modèleréalité
D.TOUIAR 04/03/2008
2
–Les méthodes statistiques sont
aujourd’hui utilisées dans presque
tous les domaines de l’activité
humaine : économie, gestion,
industrie, médecine, sciences
humaines…
PROGRAMME DE CE Semestre :S4
• Chapitre 1 : L’échantillonnage
• Chapitre 2 : L’estimation
BIBLIOGRAPHIE
Titre Auteurs CodeMéthodes statistiques B. Grais stat22
Introduction à la statistique J.P Bélisle ;J. Desrosiers
stat20
Théorie des sondages C. Gouriéroux stat49
Méthodes statistiques I A. Vogt stat25
Eléments de statistique d’aide à la décision
Hafidi et Touijar
CHAPITRE 1
ECHANTILLONNAGE
Introduction
• L’enquête statistique est l’opération
technique qui consiste à élaborer
les statistiques. Elle a pour but de
déterminer un ensemble de
caractéristiques d’une population.
• On distingue deux types
d’enquêtes:
Le recensement et le sondage
I- RECENSEMENTS ET SONDAGES
• 1- Définitions
– Définition1: La population est un ensemble de personnes ou d’objets sur lesquelles porte une étude. Et on appelle individu chaque élément de cette population.
– Définition2: On appelle recensement ou (enquête exhaustive) l’observation de la population entière.
D.TOUIAR 04/03/2008
3
–Remarque: Selon l’ONU: «le recensement de
l’habitat est une opération qui permet de
recueillir, grouper, évaluer, analyser et publier les
données démographiques, économiques et
sociales se rapportant à un moment donné à tous
les habitants d’un pays »
–Définition3: On appelle échantillon, une partie
représentative de la population observée.
–Remarque: La population d’où on tire
l’échantillon s’appelle « population mère »
• Définition4: On appelle enquête par sondage,
l’observation d’une partie représentative de la
population mère, dans le but d’étudier un ensemble
donnée de caractéristiques de cette dernière.
• Définirion5: On appelle taux de sondage, le rapport
de la taille d’échantillon à la taille de la population
mère:
échantillon
populationNn=τ
2- Les avantages des enquêtes par sondage
Les sondages présentent de nombreux
avantages par rapport aux recensements. Leurs
coût est nettement moins élevé. De plus, ils sont
plus rapides. Seul le recensement exprime un
résultat certain puisqu’il n’ y a plus, en théorie, de
problème d’inférence statistique (problème
d’estimation).
Cependant, l’expérience montre que les
sondages sont souvent très précis.
3- Types d’erreurs:
On distingue deux types d’erreurs:
a)- Erreur de mesure (em): elle provient des
imprécisions du questionnaire, des erreurs
professionnelles des enquêteurs…
b)- Erreur d’échantillonnage ou erreur aléatoire (ea):
elle tient au fait qu’on n’observe qu’une partie de la
population.
• L’erreur totale est la somme(vectorielle) des deux erreurs précédentes:
em
eaeT
222amT eee +=
• Remarque: Dans un recensement, l’erreur aléatoire
disparaît mais l’erreur de mesure persiste, et elle est
souvent beaucoup plus importante que dans un
sondage; car on doit employer un grand nombre
d’enquêteurs hâtivement formés. Il n’y a donc
aucune raison que l’erreur totale soit plus grande
dans le cas d’un sondage.
• Un sondage bien fait peut-être plus précis qu’un
recensement tout en coûtant beaucoup moins cher.
D.TOUIAR 04/03/2008
4
•Le principal inconvénient des sondages est
de présenter des erreurs
d’échantillonnage, qu’on tente de réduire
en utilisant des méthodes rigoureuses de
construction d’échantillons.
Quelques méthodes de prélèvement d’un
échantillon
•On distingue deux types de sondages
– Les sondages aléatoires: qui aboutissent à la
construction d’échantillons aléatoires.
– Les sondages par choix raisonné génèrent des
échantillons empiriques. Cette deuxième
méthode ne sera pas étudiée en ce semestre.
Détermination de la base d’échantillonnage
Définition de l’unité et du cadre
d’échantillonnage
Méthode d’échantillonnage
Méthode non probabilistes
Echantillon de convenanceBoule de neige
sequentielMéthode des quatoas
Méthode probabilistesSondage aléatoire
simpleSondage stratifié
Sondage en grappeSondage complexe
Calcul de lataille de
l’échantillon
Méthode de recueilFace à face
TéléphoniquePostalEAO...
A- Echantillonnage Aléatoire
•1- Echantillonnage aléatoire simple:
–La construction d’un échantillon aléatoire simple
de taille n est réalisée par un tirage au hasard avec
remise de n individus dans l’ensemble de la
population. Ainsi, tous les individus seront tirés de
manière indépendante et auront une chance égale
de faire partie de l’échantillon.
•Pour constituer un tel échantillon, on fait souvent
appel aux « Tables des nombres aléatoires».
B-Le tirage d’échantillon aléatoire
simple
1- Les tirages avec et sans remise
–L’échantillonnage aléatoire simple (EAS) est basé sur
un tirage avec remise. Si on constitue un tel échantillon,
chaque individu aura une probabilité 1/N d’être le
premier élément de l’échantillon. Pour le deuxième
élément, chaque individu aura toujours la même
probabilité 1/N; ainsi de suite, à chaque tirage, on aura
la probabilité 1/N
• Par contre s’il n’y avait pas de remise:
• Au premier tirage, la probabilité est 1/N
• Au deuxième, la probabilité est 1/(N-1)
••• Au nème, la probabilité est 1/(N-n+1)
– Dans le cas d’un tirage sans remise on ne peut
obtenir d’échantillon de taille supérieure à N de la
population; on l’appelle donc: tirage exhaustif
D.TOUIAR 04/03/2008
5
�Lorsque la taille de la population est
importante par rapport à la taille de
l’échantillon, on confond alors le tirage
sans remise et le tirage avec remise
ΙΙΙΙΙΙΙΙ- ECHANTILLONNAGE
• Le but de ce paragraphe est d’étudier les liens théoriques existant entre la population et l’échantillon aléatoire prélevé dans cette population.
1-L’Echantillonnage aléatoire simple
• -On réalise une étude démographique sur la fécondité chez la femme citadine. Pour ce, on considère la variable aléatoire Xqui désigne le nombre d’enfantspar famille.
• Soit L L L L la loi de X. L’espérance µ et la variance σ2 sont deux paramètres de cette loi.
• On note alors X L L L L (µ , σ2222)
• Avec µ=E(X) et σ2222=V(X)
• A priori, la loi LLLL, et en particulier µ et σ2222
sont inconnus.
–On tire au hasard 9 familles avec remise, et on observe la réalisation de la variable X pour les familles tirées. Ce qui revient à observer les réalisations de 9 V.A. indépendantes et de même loi.
Définition: Les n V.A. constituent un échantillon aléatoire simple de la V.A. X si et seulement si
sont indépendantes et de même loi que X.
• Désormais, on appellera X la VA parente.
• Remarque:
( ) ( ) ( ) ( )( ) ( ) ( ) ( ) 2
21
21
σµ
=====
=====
XVXVXVXV
XEXEXEXE
n
n
L
L
nXXX ,,, 21 L
nXXX ,,, 21 L
• 2222---- La moyenne d’échantillonnageLa moyenne d’échantillonnageLa moyenne d’échantillonnageLa moyenne d’échantillonnage
Il s’agit toujours de l’étude concernant la fécondité chez la femme citadine. On s’intéresse au nombre moyen d’enfants par famille. Pour cela, on prélève 5 échantillons aléatoires et on observe la réalisation des 9 V.A
pour chacun des 5 échantillons:921 ,,, XXX L
D.TOUIAR 04/03/2008
6
Echantillon 1 2 3 4 5X1
2 1 4 4 0
X21 0 3 4 1
X31 0 3 0 0
X41 4 0 1 2
X53 3 1 0 2
X62 2 2 3 2
X75 5 5 2 4
X82 1 2 4 3
X94 0 2 1 5
2,3 1,8 2,4 2,1 2,1X
• On remarque que le nombre moyen d’enfants par famille prend des valeurs différentes selon l’échantillon considéré; où :
• est donc une variable aléatoire; c’est donc une statistique.
X
99
1 9219
1
XXXXX
ii
+++== ∑=
L
X
• Définition :Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, et h une fonction de Rn →R ;
la variable aléatoire
Y=h(X1, X2, …, Xn )
est appelée une statistique.
• Quelques exemples de statistiques:
néchantillo moyenne 1 1
1 n
XXX
nX n
n
ii
++== ∑=
L
( ) néchantillo variance;1
2
1
2 ∑=
−=n
iie XX
nS
( ) variance-quasi ;1
1
1
22 ∑=
−−
=n
ii XX
nS
I- Propriétés de la statistique
• Le tableau précédent nous a permis d’obtenir 5 réalisations de la moyenne d’échantillonnage qu’on note
On s’attend à ce que ces 5 valeurs
soient proches de la moyenne µ.µ.µ.µ.
X
521 ;;; xxx L
1- Calcul de
• A) Propriété 1:
Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X. L’espérance de la V.A.
est égale à la moyenne de la population µ :µ :µ :µ :
= E(X)=µµµµ
( )XΕ
( )XΕ
X
D.TOUIAR 04/03/2008
7
2- Calcul de
• Propriété 2 :
Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X. La variance de la V.A.
est égale à la variance de X divisée par la taille n de l’échantillon:
X
( )XV
( ) ( )nn
XVXV
2σ==
• Remarque :
• Exemple
• Soit X P (2) la V.A. parente :
E(X)= λ = 2 = V(X)D’où:
= 2 et = 2/n ( )XΕ ( )XV
( ) 0lim =∞→
XVn
C- La variance d’échantillonnage et la
quasi-variance
•On note la variance d’échantillonnage:
•On rappelle que est une statistique: c’est une V.A. qui associe une valeur numérique à chaque tirage d’échantillon.
( )2
1
2 1∑
=
−=n
iie XX
nS
2eS
2eS
I- Propriétés de la statistique
1- Calcul de
• Propriété 3: Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ et de variance σσσσ2. Alors, l’espérance de est égale à:
( )2eSΕ
2eS
2eS
( )
−=n
SE e
1122 σ
Remarque:
�L’espérance de la variance d’échantillonnage n’est pas une image parfaite de la variance σσσσ2
:
�Pour remédier à cet inconvénient, on construit une statistique qui approchera le mieux σσσσ2
( ) 22 σ≠Ε eS
• Propriété 4 : Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µµµµ et de variance σσσσ2. Alors, l’espérance de la quasi-variance est égale à la variance de la population:
( ) 22 σ=Ε S
D.TOUIAR 04/03/2008
8
Remarque
• On peut montrer également que les variances de et de tendent toutes les deux vers zéro lorsque la taille de l’échantillon tend vers l’infini :
2eS
( ) ( ) 0limlim 22 ==∞→∞→
SVSVn
en
2S
D- Notion de Fréquence
• Lors d’une production industrielle des pièces mécaniques, on s’intéresse à la proportion des pièces défectueuses. Si on note X la V.A. qui prend, avec une probabilité p, la valeur 1 si la pièce est défectueuse et qui prend 0, avec la probabilité 1-p sinon. on note alors :
• D’où :
X BBBB (p)
conforme pièce si 1 proba. avec 0
edéfectueus pièce si .laproba avec 1
−=
p
pX
• On extrait de cette production un E.A. de taille n. Soit X1, X2, …, Xn cet échantillon aléatoire. Alors chaque Xi suit une loi de Bernoulli de paramètre p
Xi BBBB (p)
• De plus les Xi sont indépendantes, par conséquent, leur somme Sn suit une loi binomiale :
Sn BBBB (n,p)
• Sn représente le nombre de pièces défectueuses dans l’échantillon :
• Définissons la fréquence F comme étant la proportion de pièces défectueuses dans l’échantillon :
( ) nkqpCkSP knkknn ,,1,0; K=== −
n
XXX
n
SF nn L++== 21
• Si x est une valeur numérique que peut
prendre la statistique F, alors :
• Et la distribution de F est donnée par :
( ) ( ) nxnnxnxnn qpCnxSPxFP −====
−∈ 1,
1,,
2,
1,0
n
n
nnx K
D.TOUIAR 04/03/2008
9
•Remarque :Les propriétés de F sont déduites de celles de (puisque F est un cas particulier de )
•Propriété 6 :Soit la V.A. parente X qui suit
une loi de Bernoulli de paramètre p. Les
moments de la statistique F sont comme suit :
( ) ( )n
pqFVpFE == et
XX
E- Théorèmes
fondamentaux de la
Statistique
I- Convergence en probabilité
• Définition : La suite aléatoire X1, X2, …, Xn,… converge en probabilité vers la V.A. X, appelée limite de la suite, si :
• Ce que l’on note:
{ } 1lim;0 =<−>∀∞→
εε XXP nn
XX Pn →
• Remarque :
On peut redéfinir la convergence en probabilité comme suit :
La V.A. X peut être une constante; par exemple, lorsqu’on étudie la convergence d’une suite de statistiques vers la valeur vraie d’un paramètre
{ } 0lim;0 =>−>∀∞→
εε XXP nn
II- Convergence en LOI• Définition : La suite aléatoire X1, X2, …, Xn,… converge en loi vers la V.A. X, appelée limite de la suite si
en tout point de continuité x de F(x)• Et on note :
• Où F(x) est la fonction de répartition de X
( ) ( ) ;lim xFxFnn
=∞→
XX Ln →
Convergence de la loi de Poisson vers la
loi Normale
• Propriété 10 : Soit une V.A. Z normale
centrée réduite: Z N N N N (0,1) et soit
une suite de V.A. X1, X2, …, Xn,… telles
que: Xn P P P P (λn) avec
Alors;
+∞=∞→ n
nλlim
ZX L
n
nn →−λ
λ
D.TOUIAR 04/03/2008
10
Remarque:
• Si λ est suffisamment grand ,
Alors :
P P P P (λ) NNNN
( )15≥λ
≈ ( )λλ ,
Convergence de la loi Binomiale vers la loi
Normale
• Propriété 11 : Soit une V.A. Z normale
centrée réduite: Z N N N N (0,1) et soit
une suite de V.A. X1, X2, …, Xn,… telles
que: Xn B B B B (n , p)
Alors;
Znpq
npX Ln →−
Remarque:
• Si
Alors :
B B B B (n , p) NNNN
5et 5et 30 ≥≥≥ nqnpn
≈ ( )npqnp,
Convergence de la loi de Khi-
deux vers la loi Normale
Rappel sur la loi de Khi-
deux: χχχχ2222
• Définition : Soit une suite de n V.A. Z1,
Z2, …, Zn indépendantes et de même loi
normale centrée réduite: Zi N N N N (0,1)
On appelle loi de Khi-deux à n degrés de liberté, la loi suivie par la somme des
carrés des V.A. Zi ; on note :
χχχχ2(n)∑=
n
iiZ
1
2
b)- Distribution d’une Khi-deux
• La distribution de χχχχ2 est dissymétrique. Elle est continue et elle dépend du nombre de degrés de liberté n. Pour des valeurs différentes de n, on obtient des distributions différentes. Lorsque n
augmente, la loi de χχχχ2 tend lentement vers la loi normale
D.TOUIAR 04/03/2008
11
Distribution de χχχχ2(10)
Distribution de χχχχ2(16)
Distribution de χχχχ2(30)
10 15 20 30
0,1
0
C)- Les moments de Khi-deux
• Soit X χχχχ2(n) ; alors :
E( X ) = n et V( X ) = 2n
d)- Une propriété de Khi-deux
• La somme de deux Khi-deux indépendantes de
d.d.l. respectifs n et m est une Khi-deux de d.d.l.
n+m ; on note :
( )( )
( )mY
mnYXYXoùet
nX
2
2
2
χχ
χ++⇒C
• Propriété 12: Approximation de fisher
• Soit X χχχχ2(n) , si n > 30; alors :
N N N N (0,1)≈−− 122 nX
Convergence de la loi de
Student vers la loi Normale
Rappel sur les lois de Student :
t et de Fisher : F
• Définition 1: Soient X une V.A. de khi-deux à n d.d.l. et Y une V.A. de khi-deux à m d.d.l. avec X et Y indépendantes; on définit alors la V.A. de Fisher par le rapport des rapports des deux V.A. de khi-deux par leurs d.d.l. respectifs n et m et on note :
• FFFF
( )
( )
( )mY
mn
mY
nX
YXoùet
nX
2
2
,
χ
χ
⇒C
D.TOUIAR 04/03/2008
12
•F F F F (n , m) est la notation de la loi de Fisher à (n , m) d.d.l. Sa densité étant dissymétrique, étalée à droite.
• Propriété 14: moments de la loi de Fisher
Soit F F F F F (n , m) ;alors
( ) 22 >−= msimmFE
( ) ( )( ) ( )
442
222
2
>−−
−+= msimmn
mnmFV
• Remarque :
�Si Fn,m,p est le fractile d’ordre p de la V.A. de Fisher à (n , m) d.d.l, alors :
�Cette loi joue un grand rôle en statistique (loi du rapport des variances de deux échantillons indépendants)
pnmpmn F
F−
=1,,
,,
1
• Définition : Soit Z une V.A. suivant la loi
normale centrée réduite: Z N N N N (0,1)
et soit X une V.A. de Khi-deux à νννν degrés de
liberté: X χ2(ν) et indépendante de Z. On définit alors la V.A. T suivant la loi de student à
νννν degrés de liberté, notée tνννν :
tνννν
νX
ZT =
Distribution de la loi de Student
• Les distributions de Student sont continues et symétriques et dépendent
d’un paramètre n. A des valeurs différentes de n, correspond différentes distributions de Student. Lorsque n tend
vers l’infini, la loi de student tend vers la loi normale.
n=1
n=50
-3 0 +3
Distributions de Student0,4
0,3
Propriété 15: moments de la loi de Student
Soit T t (n ) ;alors
( ) 10 >= nsiTE
( ) ( ) 22
>−
= nsin
nTV
303 >= nsiµ
D.TOUIAR 04/03/2008
13
Propriétés de Student
� T2=F(1,n)
�Soit T t (n ) ;alors si n >120
N N N N (0,1)≈T
Loi des Grands Nombres (loi faible)
• Théorème 1: Loi des grands nombres
• Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ ; alors :
• Remarque: Ce résultat reste vrai quelque soit la loi de X. donc en particulier pour la loi de Bernoulli
µ→PX
• Corollaire 1: Soit la V.A. parente X suivant une loi de Bernoulli de paramètre p ; alors :
• Remarque: Cela veut dire que la
fréquence d’un événement converge vers sa probabilité
• La démonstration du Théorème1 découle du lemme suivant
pF P→
Si εεεε désigne un réel strictement positif, et
X une V.A. d’écart type σσσσ, alors
•Indication pour démonstration:• voir dans le cas d’une v.a. discrète et poser
Lemme Lemme Lemme Lemme : Inégalité de Bienaymé-Tchebicheff
( ){ }2
2
εσε ≤≥− XEXP
( ) EYEXXY calculer et 2−=
• Remarque:
•La loi des grands nombres peut être généralisée:
• Théorème 2:Soit T=T(X1, X2, …, Xn) une statistique telle que :
alors : θ→PT
( ) ( ) 0limlim ==∞→∞→
TVetTEnn
θ
D.TOUIAR 04/03/2008
14
• Exemple :
• 1)-
Alors
• 2)-
Alors :
( ) ( ) 0limlim 222 ==∞→∞→ e
ne
nSVetSE σ
22 σ→PeS
( ) ( ) 0limlim 222 ==∞→∞→
SVetSEnn
σ
22 σ→PS
Théorème CENTRAL LIMITE
(T.C.L.)
• Théorème 3: (T.C.L. 1ère formulation)
• Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ et de variance σσσσ2. Alors,
• N N N N (0,1)→−=− LXn
n
X
σµ
σµ
• Théorème 4: (T.C.L. 2ème formulation)
• Pour une taille n assez grande (en pratique n 30), on a:
• NNNN
• Corollaire 2: Soit la V.A. parente X suivant une loi de Bernoulli de paramètre p ; Si
alors on a :
F NNNN
≈X ( )n2
,σµ≥
5et 5et 30 ≥≥≥ nqnpn
≈
n
pqp,
Cas des échantillons Aléatoires issus d’une
population Normale
• Lorsque l’E.A. est relatif à une loi normale, on obtient des propriétés plus intéressantes pour les statistiques et S2
• Propriété 16: Soit X N N N N (µµµµ ,σσσσ2222); alors
N N N N (µµµµ , σσσσ2222/n)
X
X
• Remarque: Le T.C.L. s’applique à
toute V.A. quelque soit sa loi; il
fournit une propriété asymptotique.
• Alors que la propriété 16 ne
s’applique qu’aux V.A. suivants une loi
Normale et quelque soit la taille n de
l’échantillon.
Propriété 17: Sous l’hypothèse de normalité,
χχχχ2(n-1)
Propriété 18: Sous l’hypothèse de normalité:
t(n-1)
( ) 22
1S
n
σ−
S
Xn
µ−
D.TOUIAR 04/03/2008
15
Remarque: Sous l’hypothèse de normalité, et si la moyenne de la population est connue, on a:
χχχχ2(n)22
~S
n
σ( )
2
1
2 1~Où ∑
=
−=n
iiX
nS µ
Remarque: Cas des petits échantillons
• Lorsque n est petit, on ne peut utiliser le T.C.L. et par conséquent on ne peut obtenir une loi pour . Or si on ajoute l’hypothèse de normalité, on obtient des résultats importants quelque soit n.
X
F- Cas des échantillons
exhaustifs
(T.S.R.)
• Lorsque le tirage est sans remise, toutes les propriétés qu’on a énoncé (ou presque), concernant les statistiques ,
ne sont plus valables. En effet, on peut montrer qu’on a :
22 et ,, SSFX e
( )( )
−−=
=
1
2
N
nN
nXV
XEσµ
( )( )
−−=
=
1N
nN
n
pqFV
pFE
• Remarque: Si n est négligeable devant N (la taille de la population finie), le tirage sans remise devient équivalent à un tirage avec remise. Dans la pratique, ceci prend effet lorsque:
( )( )
−=
−
−=
1
1
1
22
22
N
NSE
N
N
n
nSE e
σ
σ
nN 20≥
L’ Estimation
Chapitre II
D.TOUIAR 04/03/2008
16
INTRODUCTION
• Après avoir prélevé l’échantillon, et étudié les
distributions d’échantillonnage, on peut alors
généraliser, à la population, les résultats
expérimentaux obtenus à partir de
l’échantillon; c’est ce qu’on appelle l’inférence
statistique.
� L’estimation consiste en l’évaluation d’un paramètre de la population à partir de l’observation d’un E.A.
� La théorie de l’estimation se divise en deux parties:
1) L’estimation ponctuelle: permet d’obtenir une valeur unique calculée à partir d’un E.A., valeur qui sera prise comme estimation du paramètre inconnu.
2) L’estimation par intervalle: permet de déterminer un intervalle qui, avec une grande probabilité fixée a priori, contient la valeur vraie du paramètre inconnu.
• Exemple:On dit que 53% de la
population favorise le candidat A avec une marge d’erreur de 1% et avec un niveau de confiance de 95%. Ce qui signifie que la proportion d’électeurs favorisant A se situe, avec une probabilité de 95%, entre 52% et 54%.
A- L’ ESTIMATION PONCTUELLE
• I- Définitions
–Définition1: Soit X1, X2, …, Xn un E.A.S
relatif à la V.A. parente X de loi LLLL (θθθθ). On appelle estimateur du
paramètre θ θ θ θ toute statistique utilisée dans le but d’approcher la valeur inconnue de θθθθ. Un estimateur est donc une Variable Aléatoire.
– Définition2: Une estimation du paramètre θ θ θ θ est une réalisation d’un estimateur de ce paramètre. Une estimation est donc une valeur numérique.
– Exemples:
Si X LLLL (µ) estimateur
Si X LLLL (p) estimateur
Si X LLLL (σ2222) estimateur
xX estimation →
fF estimation →
→
2
2
2
2e
Ssestimation
S
s
se
• II- Propriétés des estimateurs
• 1-Estimateurs sans biais
•Définition: On appelle estimateur sans biais du paramètre θ θ θ θ toute statistiqueT=T(X1, X2, …, Xn) telle que:
E(T)=θθθθ
D.TOUIAR 04/03/2008
17
• Remarque 1: Si T est biaisé, le biais serai alors:
B= E(T)-θθθθ
E(T)=θθθθ
Estimateur sans biais
B
θθθθ E(T)
Estimateur biaisé
– Exemples:
22
22
de biaisé estimateurun est de biais sans estimateurun est de biais sans estimateurun est
σσµ
eSSX
( ) ( )nn
nSESB ee
222222 1 σσσσ −=−
−=−=
• Définition: On appelle estimateur
asymptotiquement sans biais, du paramètre θ, θ, θ, θ, toute statistiqueT=T(X1, X2, …, Xn) telle que:
E(T)=θθθθ
Exemple:Se
2 est un estimateur asymptotiquement sans biais de σ2 :
∞→nlim
( ) 222 11limlim σσ =
−=∞→∞→ n
SEn
en
2-Estimateurs Convergents
• Définition: On appelle estimateur Convergent du paramètre θθθθ toute statistique T=T(X1, X2, …, Xn) telle que:
θ→PT
• Remarque : La loi des grands nombres
implique que est un estimateur
convergent de µ. De même que F est un
E.C. de p
X
Théorème : L.G.N. généralisée• Si T est un estimateur sans biais ou
asymptotiquement sans biais de θθθθ, et si sa variance tend vers zéro lorsque n tend vers l’infini, alors T est un estimateur
convergent de θ θ θ θ :
• Si
• Alors θ→PT
( ) ( ) 0limlim ==∞→∞→
TVetTEnn
θ
D.TOUIAR 04/03/2008
18
Exemple :
Alors
• De même on montre que S 2 est un E.C. de σ σ σ σ 2222
22 deconvrgent estimateurun est σeS
( ) ( ) 0limlim 222 ==∞→∞→ e
ne
nSVetSE σ
3-Estimateurs Efficaces:
Entre deux estimateurs sans biais, on préfère utiliser celui qui a la variance la plus petite.
• Définition: Soient T1 et T2 deux estimateurs sans biais du même paramètre θθθθ et basés sur le même échantillon. On dit que T1 est plus précis que T2 si:
)()( 21 TVTV ≤
Exemple : Montrons que est plus précis
que . On a d’abord:
donc sont
deux E.S.B. de µ.µ.µ.µ.
D’où
X
221 XX +=Γ
( ) ( ) µ=Γ= EXE ΓetX
( ) ( ) ( )( ) ( )22
1
4
1 2
21
σ==+=Γ XVXVXVV
( )n
XVOr2σ=
( ) ( ) 2≥Γ≤ npourVXV
• Question:
• Définition: On appelle Quantité d’information de
Fisher de θθθθ, la quantité In(θ θ θ θ ):
• Où In(θ θ θ θ ) dépend de n et de la loi de X mais ne dépend pas de l’estimateur T
( )?.}..{
TVMinBSET∈
( ) ( )
∂∂=
2
21 ,,,, θθ
θ nn XXXfLogEI K
• Remarques : Soit f(x,θθθθ) la densité de la loi de X,
alors In(θ θ θ θ ) s’écrit aussi (sous certaines conditions
qu’on supposera toujours vérifiées):
1-
2-
3-
( ) ( )
∂∂=
2
,θθ
θ XfLogEnI n
( ) ( )θθ 1nII n =
( ) ( )
∂∂−= θθ
θ ,2
2
XfLogEnI n
4- Le rapport est appelé
Borne de CRAMER-RAO
( ) ( )θθ
nCR I
B1=
D.TOUIAR 04/03/2008
19
• Propriété: Inégalité de CRAMER-RAO
Si T est un Estimateur sans biais (E.S.B.) du paramètre θ , θ , θ , θ , alors :
( ) ( )θCRBTV ≥
• Définition : un E.S.B. T de θθθθ, , , , est dit efficace si sa variance est égale à la borne de Cramer-Rao:
• Définition: un E.S.B. T de θθθθ, , , , est dit asymptotiquement efficace si:
( ) ( )θCRBTV =
( )( ) 1lim =
∞→ θCRn B
TV
Exemple : Si X N N N N (µ , σ2222), alors
Or E.S.B. de µ, d’où il est efficace de µ.
S2 est asymptotiquement efficace de σ2222 car
(n/n-1) 1
( ) ( )n
XVn
I n
2
2et
σσ
µ ==
( ) ( )1
2et
2
42
42
−==
nSV
nI n
σσ
σ
X
III Recherche d’estimateurs
• Soit (x1, x2, …, xn ) la réalisation d’un échantillon aléatoire X1, X2, …, Xn, relatif à la V.A. parente X de loi Pθθθθ. La probabilité d’obtenir une telle réalisation est :
( ) ( )∏=
=====n
iiinn xXPxXxXxXP
12211 ,,, θθ K
• Définition : On appelle Estimateur de
Maximum de Vraisemblance (E.M.V.) pour θθθθ, la valeur de θθθθ, qui maximise cette probabilité.
• En pratique, il revient au même de chercher qui maximise le logarithme de la probabilité, soit :
θ
θ
( ) ( )[ ]ii
n
i
xXPLogL ==∑=
θθ1
• Remarque:
• maximise ssi
• Exemple:
• Si X BBBB ( p)• D’où
θ ( )θL( )( )
<∂∂
=∂∂
0ˆ
0ˆ
2
2
θθ
θθL
L
( ) ii xxiip qpxXP −==⇒ 1
( ) ( ) ( )[ ]∑=
−−+=n
iii pLogxLogpxpL
1
11
D.TOUIAR 04/03/2008
20
Vérifiez ensuite que
On conclu que F est bien un E.M.V. pour p
( )p
xnx
ppx
p
x
p
L
n
iin
ii
n
ii
i
−
−−=
−−−=
∂∂ ∑
∑∑ =
== 1
1
1
11 1
11
Fn
Xpnxp
p
L
n
iin
ii ==⇔=⇔=
∂∂ ∑
∑ =
=
1
1
ˆ0
( ) 0ˆ2
2
<∂∂
pL
θ
IV Cas Exhaustif
1-Cas de la moyenne : θ=µθ=µθ=µθ=µLorsque le tirage est sans remise,
garde la même espérance mais pas la même variance:
Remarque :
X
( ) ( )1
et 2
−−==
N
nN
nXVXE
σµ
( ) ( )TARTSR XVXV ≤
2-Cas de la variance : θ=σθ=σθ=σθ=σ2222
�Si le TAR S2 est un E.S.B. de σ σ σ σ 2222�Mais lorsque le TSR, on a:
est donc un ESB de σ σ σ σ 2222
221 σ=
−S
N
NE
21S
N
N −
B- Estimation Par Intervalle de Confiance
–Définition: On dit que (C1,C2) est un intervalle de confiance au niveau 1-αααα pour le paramètre θθθθ si on a :
–Les bornes C1 et C2 de l’intervalle sont des statistiques relatives à l’ E.A.
( )( ) ( ) αθθ −=≤≤=⊃ 1; 2121 CCPCCP
• 1-αααα est appelé niveau de confiance de
l’intervalle (C1,C2).
• Plus α α α α est petit et plus l’intervalle de
confiance est grand. Généralement, on
considère des intervalles à risques
symétriques:
( ) ( )212
αθθ =<=> CPCP
I- Intervalle de Confiance pour une
proportion: IC(p)
• 1- Construction de L’ IC(p): Afin d’estimer une
proportion p de « Succès » par exemple; on utilise
la fréquence F qui est un estimateur sans biais
convergent et efficace du paramètre p. De plus, on
a (d’après le T.C.L.)
• N N N N (0,1)
• dés que 5et 5et 30 ≥≥≥ nqnpn
≈−=
n
pq
pFZ
D.TOUIAR 04/03/2008
21
αααα/2 αααα/21- αααα
-zαααα/2 +zαααα/2Z0
π2
1Courbe de densité de la loi normale centrée réduite
• D’où
• Remplaçons Z par son expression:
( ) ααα −=+<<− 12/2/ zZzP
ααα −=
+<−<− 12/2/ z
n
pq
pFzP
•Donc, on obtient comme intervalle de
confiance pour la proportion au niveau 1-αααα
ααα −=
+<<− 12/2/ n
pqzFp
n
pqzFP
( )
+−=44344214434421
21
2/2/ ;
CC
C n
pqzF
n
pqzFpI αα
• Exemple: pour un niveau de confiance 95%; α=5%
et par suite zαααα/2 = z0000,,,,025025025025 = 1,96. Par conséquent:
• N N N N (0,1)
( )
+−=
n
pqF
n
pqFpIC 96,1;96,1
2222,,,,5555%%%% 2222,,,,5555%%%%95%
-1,96 1,96
Z0
• Une réalisation de cet intervalle est :
• Problème: est inconnue car p est inconnu. On utilise alors l’approximation suivante, pour n assez grande :
( )
+−=
n
pqf
n
pqfpIC 96,1;96,1
npq
( )n
ffn
pq −≅ 1
• Propriété: Soit X1, X2, …, Xn un
échantillon aléatoire simple de taille n, relatif à la V.A. parente X suivant une loi de Bernoulli de paramètre p inconnu. Un intervalle de confiance au niveau 1-αpour p est comme suit :
• Dés que :
( ) ( ) ( )
−+−−=n
ffzf
n
ffzfpIC
1;
12/2/ αα
( ) 51et 5et 30 ≥−≥≥ fnnfn
D.TOUIAR 04/03/2008
22
• 2- Précision d’une estimation par intervalle
de confiance: Pour un α donné, on veut
déterminer la taille nécessaire de l’échantillon pour
atteindre une certaine précision de l’estimation.
–Notons a(α,n) l’amplitude de IC(p) :
( )
npqz
n
pqzf
n
pqzfna
2
22
2
,
α
ααα
=
−−
+=
• On appelle erreur d’estimation la demi-longueur de Ic
• Or p est inconnu, on utilise donc la majoration:
• On obtient donc
( )n
pqzna
22
,α
α =
( ) 211 ≤− pp
nzn
pqz2
122
αα ≤
• Pour que l’erreur d’estimation soit inférieure ou égale à e:
• Il faut que n soit:
• Remarque: Plus l’erreur d’estimation est petite et plus la précision est grande.
2
2
4
1
≥
e
zn
α
en
z≤
22
α
• Exercice:Parmi un E.A. de 250 électeurs, 108 déclarent vouloir voter pour le président sortant. Tandis que les autres voteront pour l’autre candidat. Donner un IC(p) au niveaux 90 et 95%
• Combien faudrait-il interroger d’électeurs pour que l’erreur d’estimation ne dépasse pas 2% ?
• Réponse
• 1)-
• D’où : X BBBB (p)
Bpour votesi 1 proba. avec 0Apour votesi .proba avec 1
−=p
pX
• p représente la proportion des votants en faveur de A dans toute la population des électeurs.
• Une estimation ponctuelle de p est donnée, grâce à la réalisation de l’E.A., par la fréquence:
• Condθ TCL:
Or α=10%, d’où zαααα/2=z0,05=1,645(loi normale C.R)
432,0250
1081 ===n
nf
5142et 5108et 30250 ≥≥=≥= nfn
( ) ( ) ( )
−+−−=n
ffzf
n
ffzfpIC
1;
12/2/ αα
• 2)- α=5% ⇒ z0,025=1,96
[ ][ ]483,0;381,0
031,0645,1432,0;031,0645,1432,0
=×+×−=
( ) [ ]493,0;371,0=pI C
D.TOUIAR 04/03/2008
23
05/01/2004
• 3)-
240102,0
96,1
4
1
4
12
2
2 =
=
≥
e
zn
α
II- Intervalle de Confiance pour la
moyenne: IC(µµµµ)
• 1)- IC(µµµµ) dans le cas d’un population Normalement
distribuée:
• Dans ce cas la V.A. parente X suit :
• X N N N N (µ , σµ , σµ , σµ , σ2222).
• Or, on sait que est un bon estimateur de la moyenne µ :
• N N N N (µ , σµ , σµ , σµ , σ2222////n).
X
X
• Posons
• N N N N (0000, , , , 1111).
• D’où n
XZ σ
µ−=
( )
1
2/2/
2/2/
+<<−=
+<<−=−
nzX
nzXP
zZzP
σµσ
α
αα
αα
• D’où :
• Cet intervalle n’a de sens que si σ2 est connue.
• Si σ2 est inconnue, on l’estime alors par S2 et on obtient la V.A.(grâce à l’hypothèse de Normalité) :
• t(n-1)
( )
; 2/2/
+−=n
zxn
zxIC
σσµ αα
S
XnZ
µ−=
• Notre intervalle de confiance devient :
• Où est la valeur critique d’ordre
α/α/α/α/2222 lue dans la table de student à n-1
d.d.l.
( )
; 2/,12/,1
+−= −−n
stx
n
stxI nnC ααµ
2/,1α−nt
•Propriété: Soit la V.A X N N N N (µ , σµ , σµ , σµ , σ2222) . •1)- Si σ2 est connue, alors un intervalle
de confiance au niveau 1-α pour µµµµ est :
•2)- Si σ2 est inconnue, alors un intervallede confiance au niveau 1-α pour µµµµ est :
( )
; 2/2/
+−=n
zxn
zxI C
σσµ αα
( )
; 2/,12/,1
+−= −−n
stx
n
stxI nnC ααµ
D.TOUIAR 04/03/2008
24
• 2)- IC(µµµµ) dans le cas d’un population
quelconque:
•Propriété: Soit X1, X2,…, Xn un échantillon
aléatoire relatif à X LQ (µ , σµ , σµ , σµ , σ2222) . 1)- Si σ2 est connue, et si alors un
intervalle de confiance au niveau 1-α de µµµµ
•2)- Si σ2 est inconnue, et si alorsnotre intervalle pour µµµµ devient :
( )
; 2/2/
+−=n
zxn
zxI C
σσµ αα
( )
; 2/2/
+−=n
szx
n
szxI C ααµ
50≥n
30≥n
III- Intervalle de Confiance pour la
variance: IC(σσσσ2222)
• Pour montrer le grand intérêt que présente la variance, on prend l’exemple où X est le taux de rendement d’un actif financier. Celui-ci est définit comme suit:
• Où Pt est le prix de la période t, et dt le dividende de la même période
1
1
−
−−+=t
ttt P
PdtPR
• La variance de X peut-être considérée comme une mesure de l’incertitude de l’actif et donc comme une mesure de son risque.
• Soit P la population des actions des entreprises du secteur micro-informatique. X est le taux de rendement de ses actions; on suppose :
• X N N N N (µ , σµ , σµ , σµ , σ2222).
• On prélève au hasard 30 actions et construisons un intervalle de confiance pour σσσσ2222
12/01/2004
Si µ est inconnue, on utilise alors S2 et on obtient la V.A.(grâce à l’hypothèse de Normalité)
χχχχ2(n-1)( ) 22
1S
n
σ−
1−α
α/2
χχχχ1−α/2;n-1 χχχχα/2;n-1
• D’où :
• ou
( )( ) ( )
−−=
−−
=
−
=∑∑
22/1;1
1
2
22/;1
1
2
2 ;αα χχ
σn
n
ii
n
n
ii
C
xxxxI
( ) ( ) ( )
−−=−−−
22/1;1
2
22/;1
22 1
;1
αα χχσ
nnC
snsnI
D.TOUIAR 04/03/2008
25
IV- Intervalle de Confiance pour la
différence des moyenne
•1)- IC(µµµµ1111 −−−− µµµµ2222 ) dans le cas de 2 populations
Normalement distribuées:
•Soient P1 et P2 2 populations que l’on étudie selon la V.A. parente X de loi sur P1
NNNN (µµµµ1111 , σ, σ, σ, σ11112222) et NNNN (µµµµ2222 , σ, σ, σ, σ2222
2222) sur P2.
•On veut estimer la différence des
moyennes µµµµ1111 −−−− µµµµ2222 .
• Pour cela, on prélève 2 échantillons indépendamment de tailles n1 et n2respectivement de P1 et P2
• Et on définie alors 2 estimateurs et
respectivement de µ1 et µ2
On propose alors estimateur
de µ1 – µ2 :
2X1X
21 XX −
( ) ( ) ( )212121XEXEXXEXX −=−=−µ
21 µµ −=
• Or NNNN (µµµµ1111 , σ, σ, σ, σ11112222////n1).
• Et NNNN (µµµµ2222 , σ, σ, σ, σ22222222////n2).
• D’où
NNNN (µµµµ1111−−−− µµµµ2222 ,σ,σ,σ,σ11112222////n1+σ+σ+σ+σ2222
2222////n2)
1X
2X
21 XX −
2
22
1
21222
2121 nnXXXX
σσσσσ +=+=−
• Si les deux variances σ11112222 et σ2222
2222 sont connues :
• Si les variances sont inconnues mais égales
222
21 σσσ ==
( )
;
2
22
1
21
2/21
2
22
1
21
2/2121
++−
+−−=−
nnzxx
nnzxxIC
σσ
σσµµ
α
α
On les estime alors par , où
• Et donc on construit une V.A. de Student:
( ) ( )( ) ( )11
11ˆ21
222
2112
−+−−+−=
nn
SnSnS
( ) ( )
21
2121
11ˆnn
S
XXT
+
−−−= µµ ( )221 −+ nnt
2S
•D’où notre intervalle de confiance au niveau 1- α :α :α :α :
•Où tαααα/2 est lu dans la table de student à n1 +n2 -2
( )
++−
+−−=−
−+
−+
212/;221
212/;22121
11ˆ
;11
ˆ
21
21
nnstxx
nnstxxI
nn
nnC
α
αµµ
D.TOUIAR 04/03/2008
26
a)- Si les deux variances σ11112222 et σ2222
2222 sont connues
:
•On considère alors la V.A. pour
NNNN (0,1)
2)- le cas de 2 populations quelconques:
( ) ( ) ≈+
−−−=
2
22
1
21
2121
nn
XXZ
σσµµ
30, 21 ≥nn
• Donc, notre intervalle de confiance au niv.
1111−−−−αααα, de la différence des moyennes s’écrit :
( )
;
2
22
1
21
2/21
2
22
1
21
2/2121
++−
+−−=−
nnzxx
nnzxxIC
σσ
σσµµ
α
α
• Si les variances sont inconnues:
• On estime chaque par Si2 et on
considère alors la V.A. pour
• Donc, notre intervalle de confiance au niv.
1111−−−−αααα, s’écrit :
2iσ
50, 21 ≥nn
( ) ( ) ≈+
−−−=
2
22
1
21
2121
n
S
n
S
XXZ
µµ NNNN (0,1)
( )
;
2
22
1
21
2/21
2
22
1
21
2/2121
++−
+−−=−
n
s
n
szxx
n
s
n
szxxIC
α
αµµ
V- Intervalle de Confiance pour la
différence des proportions
•Soient P1 et P2 2 populations que l’on étudie selon la V.A. parente X suivant la loi
B(p1) sur P1 et B(p2) sur P2.
•On veut estimer la différence des
proportions p1 −−−− p2 . Alors dés que:
( ) 2,1:51 , 5 , 30 i =≥−≥≥ ifnfnn iiii
• notre intervalle de confiance s’écrit au niveau 1- α :α :α :α :
( ) ( ) ( )
( ) ( )
11
;11
2
22
1
112/21
2
22
1
112/2121
−+−+−
−+−−−=−
n
ff
n
ffzff
n
ff
n
ffzffppIC
α
α
D.TOUIAR 04/03/2008
27
VI- Intervalle de Confiance pour le
Rapport des variances
•Les deux populations sont supposées être
Normalement distribuées:
•Sur P1 : X N N N N (µ1 , σ12)
•Sur P2 : X NNNN (µ2 , σ22)
•On s’intéresse à l’estimation du rapport
22
21
σσ
• 1)- Si les moyennes sont inconnues
• On propose alors l’estimateur
• Or
• D’où FFFF (n1-1;n2-1)
22
21
SS
( ) 212
1
211
1 1 1
−
−= nSnY χσ
( ) 212
2
222
2 2 1
−
−= nSnY χσ
22
22
21
21
σσ
S
S
<<=
−−
−−−
1,1;2/22
21
22
21
1,1;2/122
21
12
12
nn
nn
FS
S
FS
SP
α
α σσ
<<
=−
−−−−− 1,1;2/22
22
21
21
1,1;2/1 2121
1
nnnn FS
SFP αα σ
σα
• D’où notre intervalle de confiance pour le rapport
de variance au niveau 1-α :α :α :α :
=
−−
−−−
1,1;2/22
21
1,1;2/122
21
22
21
12
12
;
nn
nnC
Fs
s
Fs
sI
α
ασσ
• Remarque : Pour des raisons de lecture des tables statistiques de Fisher, on choisi d’estimer le
rapport (σ12/σ2
2) si (s12>s2
2); sinon on doit estimer le rapport
(σ22/σ1
2).