d.touiar 04/03/2008 statistique...

D.TOUIAR 04/03/2008

1

STATISTIQUE INFERENTIELLE

Module Méthodes Quantitatives :

-Statistique III

(S4)

Section D

INTRODUCTION GENERALE

• Il y a en statistique deux approches :

• La Description (vue en S2) : consiste à résum er et à décrire un ensem ble de données.

• L’inférence statistique : son but est d’étendre les propriétés de l’échantillon à la population entière (objet de ce semestre) et de valider ou de rejeter des hypothèses à priori ou formulées après une étape descriptive (objet de S5).

La démarche statistique est la suivante

• L’échantillon est tiré au hasard dans une population plus vaste (1er chapitre).

• Le calcul des probabilités (vu en S3) permet ensuite de préciser les caractéristiques de l’ensemble des échantillons que l’on aurait pu obtenir par le même procédé; c’est l’étude des distributions d’échantillonnage (2ème chapitre)

• On inverse les conclusions de l’étape

précédente pour en déduire la structure

vraisemblable de la population dont est

issu l’échantillon observé; c’est la phase

inférentielle (3ème chapitre)

On remarque que cette démarche est

semblable à la démarche scientifique

habituelle

confrontation résultat

Modèleréalité

D.TOUIAR 04/03/2008

2

–Les méthodes statistiques sont

aujourd’hui utilisées dans presque

tous les domaines de l’activité

humaine : économie, gestion,

industrie, médecine, sciences

humaines…

PROGRAMME DE CE Semestre :S4

• Chapitre 1 : L’échantillonnage

• Chapitre 2 : L’estimation

BIBLIOGRAPHIE

Titre Auteurs CodeMéthodes statistiques B. Grais stat22

Introduction à la statistique J.P Bélisle ;J. Desrosiers

stat20

Théorie des sondages C. Gouriéroux stat49

Méthodes statistiques I A. Vogt stat25

Eléments de statistique d’aide à la décision

Hafidi et Touijar

CHAPITRE 1

ECHANTILLONNAGE

Introduction

• L’enquête statistique est l’opération

technique qui consiste à élaborer

les statistiques. Elle a pour but de

déterminer un ensemble de

caractéristiques d’une population.

• On distingue deux types

d’enquêtes:

Le recensement et le sondage

I- RECENSEMENTS ET SONDAGES

• 1- Définitions

– Définition1: La population est un ensemble de personnes ou d’objets sur lesquelles porte une étude. Et on appelle individu chaque élément de cette population.

– Définition2: On appelle recensement ou (enquête exhaustive) l’observation de la population entière.

D.TOUIAR 04/03/2008

3

–Remarque: Selon l’ONU: «le recensement de

l’habitat est une opération qui permet de

recueillir, grouper, évaluer, analyser et publier les

données démographiques, économiques et

sociales se rapportant à un moment donné à tous

les habitants d’un pays »

–Définition3: On appelle échantillon, une partie

représentative de la population observée.

–Remarque: La population d’où on tire

l’échantillon s’appelle « population mère »

• Définition4: On appelle enquête par sondage,

l’observation d’une partie représentative de la

population mère, dans le but d’étudier un ensemble

donnée de caractéristiques de cette dernière.

• Définirion5: On appelle taux de sondage, le rapport

de la taille d’échantillon à la taille de la population

mère:

échantillon

populationNn=τ

2- Les avantages des enquêtes par sondage

Les sondages présentent de nombreux

avantages par rapport aux recensements. Leurs

coût est nettement moins élevé. De plus, ils sont

plus rapides. Seul le recensement exprime un

résultat certain puisqu’il n’ y a plus, en théorie, de

problème d’inférence statistique (problème

d’estimation).

Cependant, l’expérience montre que les

sondages sont souvent très précis.

3- Types d’erreurs:

On distingue deux types d’erreurs:

a)- Erreur de mesure (em): elle provient des

imprécisions du questionnaire, des erreurs

professionnelles des enquêteurs…

b)- Erreur d’échantillonnage ou erreur aléatoire (ea):

elle tient au fait qu’on n’observe qu’une partie de la

population.

• L’erreur totale est la somme(vectorielle) des deux erreurs précédentes:

em

eaeT

222amT eee +=

• Remarque: Dans un recensement, l’erreur aléatoire

disparaît mais l’erreur de mesure persiste, et elle est

souvent beaucoup plus importante que dans un

sondage; car on doit employer un grand nombre

d’enquêteurs hâtivement formés. Il n’y a donc

aucune raison que l’erreur totale soit plus grande

dans le cas d’un sondage.

• Un sondage bien fait peut-être plus précis qu’un

recensement tout en coûtant beaucoup moins cher.

D.TOUIAR 04/03/2008

4

•Le principal inconvénient des sondages est

de présenter des erreurs

d’échantillonnage, qu’on tente de réduire

en utilisant des méthodes rigoureuses de

construction d’échantillons.

Quelques méthodes de prélèvement d’un

échantillon

•On distingue deux types de sondages

– Les sondages aléatoires: qui aboutissent à la

construction d’échantillons aléatoires.

– Les sondages par choix raisonné génèrent des

échantillons empiriques. Cette deuxième

méthode ne sera pas étudiée en ce semestre.

Détermination de la base d’échantillonnage

Définition de l’unité et du cadre

d’échantillonnage

Méthode d’échantillonnage

Méthode non probabilistes

Echantillon de convenanceBoule de neige

sequentielMéthode des quatoas

Méthode probabilistesSondage aléatoire

simpleSondage stratifié

Sondage en grappeSondage complexe

Calcul de lataille de

l’échantillon

Méthode de recueilFace à face

TéléphoniquePostalEAO...

A- Echantillonnage Aléatoire

•1- Echantillonnage aléatoire simple:

–La construction d’un échantillon aléatoire simple

de taille n est réalisée par un tirage au hasard avec

remise de n individus dans l’ensemble de la

population. Ainsi, tous les individus seront tirés de

manière indépendante et auront une chance égale

de faire partie de l’échantillon.

•Pour constituer un tel échantillon, on fait souvent

appel aux « Tables des nombres aléatoires».

B-Le tirage d’échantillon aléatoire

simple

1- Les tirages avec et sans remise

–L’échantillonnage aléatoire simple (EAS) est basé sur

un tirage avec remise. Si on constitue un tel échantillon,

chaque individu aura une probabilité 1/N d’être le

premier élément de l’échantillon. Pour le deuxième

élément, chaque individu aura toujours la même

probabilité 1/N; ainsi de suite, à chaque tirage, on aura

la probabilité 1/N

• Par contre s’il n’y avait pas de remise:

• Au premier tirage, la probabilité est 1/N

• Au deuxième, la probabilité est 1/(N-1)

••• Au nème, la probabilité est 1/(N-n+1)

– Dans le cas d’un tirage sans remise on ne peut

obtenir d’échantillon de taille supérieure à N de la

population; on l’appelle donc: tirage exhaustif

D.TOUIAR 04/03/2008

5

�Lorsque la taille de la population est

importante par rapport à la taille de

l’échantillon, on confond alors le tirage

sans remise et le tirage avec remise

ΙΙΙΙΙΙΙΙ- ECHANTILLONNAGE

• Le but de ce paragraphe est d’étudier les liens théoriques existant entre la population et l’échantillon aléatoire prélevé dans cette population.

1-L’Echantillonnage aléatoire simple

• -On réalise une étude démographique sur la fécondité chez la femme citadine. Pour ce, on considère la variable aléatoire Xqui désigne le nombre d’enfantspar famille.

• Soit L L L L la loi de X. L’espérance µ et la variance σ2 sont deux paramètres de cette loi.

• On note alors X L L L L (µ , σ2222)

• Avec µ=E(X) et σ2222=V(X)

• A priori, la loi LLLL, et en particulier µ et σ2222

sont inconnus.

–On tire au hasard 9 familles avec remise, et on observe la réalisation de la variable X pour les familles tirées. Ce qui revient à observer les réalisations de 9 V.A. indépendantes et de même loi.

Définition: Les n V.A. constituent un échantillon aléatoire simple de la V.A. X si et seulement si

sont indépendantes et de même loi que X.

• Désormais, on appellera X la VA parente.

• Remarque:

( ) ( ) ( ) ( )( ) ( ) ( ) ( ) 2

21

21

σµ

=====

=====

XVXVXVXV

XEXEXEXE

n

n

L

L

nXXX ,,, 21 L

nXXX ,,, 21 L

• 2222---- La moyenne d’échantillonnageLa moyenne d’échantillonnageLa moyenne d’échantillonnageLa moyenne d’échantillonnage

Il s’agit toujours de l’étude concernant la fécondité chez la femme citadine. On s’intéresse au nombre moyen d’enfants par famille. Pour cela, on prélève 5 échantillons aléatoires et on observe la réalisation des 9 V.A

pour chacun des 5 échantillons:921 ,,, XXX L

D.TOUIAR 04/03/2008

6

Echantillon 1 2 3 4 5X1

2 1 4 4 0

X21 0 3 4 1

X31 0 3 0 0

X41 4 0 1 2

X53 3 1 0 2

X62 2 2 3 2

X75 5 5 2 4

X82 1 2 4 3

X94 0 2 1 5

2,3 1,8 2,4 2,1 2,1X

• On remarque que le nombre moyen d’enfants par famille prend des valeurs différentes selon l’échantillon considéré; où :

• est donc une variable aléatoire; c’est donc une statistique.

X

99

1 9219

1

XXXXX

ii

+++== ∑=

L

X

• Définition :Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, et h une fonction de Rn →R ;

la variable aléatoire

Y=h(X1, X2, …, Xn )

est appelée une statistique.

• Quelques exemples de statistiques:

néchantillo moyenne 1 1

1 n

XXX

nX n

n

ii

++== ∑=

L

( ) néchantillo variance;1

2

1

2 ∑=

−=n

iie XX

nS

( ) variance-quasi ;1

1

1

22 ∑=

−−

=n

ii XX

nS

I- Propriétés de la statistique

• Le tableau précédent nous a permis d’obtenir 5 réalisations de la moyenne d’échantillonnage qu’on note

On s’attend à ce que ces 5 valeurs

soient proches de la moyenne µ.µ.µ.µ.

X

521 ;;; xxx L

1- Calcul de

• A) Propriété 1:

Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X. L’espérance de la V.A.

est égale à la moyenne de la population µ :µ :µ :µ :

= E(X)=µµµµ

( )XΕ

( )XΕ

X

D.TOUIAR 04/03/2008

7

2- Calcul de

• Propriété 2 :

Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X. La variance de la V.A.

est égale à la variance de X divisée par la taille n de l’échantillon:

X

( )XV

( ) ( )nn

XVXV

2σ==

• Remarque :

• Exemple

• Soit X P (2) la V.A. parente :

E(X)= λ = 2 = V(X)D’où:

= 2 et = 2/n ( )XΕ ( )XV

( ) 0lim =∞→

XVn

C- La variance d’échantillonnage et la

quasi-variance

•On note la variance d’échantillonnage:

•On rappelle que est une statistique: c’est une V.A. qui associe une valeur numérique à chaque tirage d’échantillon.

( )2

1

2 1∑

=

−=n

iie XX

nS

2eS

2eS

I- Propriétés de la statistique

1- Calcul de

• Propriété 3: Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ et de variance σσσσ2. Alors, l’espérance de est égale à:

( )2eSΕ

2eS

2eS

( )

−=n

SE e

1122 σ

Remarque:

�L’espérance de la variance d’échantillonnage n’est pas une image parfaite de la variance σσσσ2

:

�Pour remédier à cet inconvénient, on construit une statistique qui approchera le mieux σσσσ2

( ) 22 σ≠Ε eS

• Propriété 4 : Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µµµµ et de variance σσσσ2. Alors, l’espérance de la quasi-variance est égale à la variance de la population:

( ) 22 σ=Ε S

D.TOUIAR 04/03/2008

8

Remarque

• On peut montrer également que les variances de et de tendent toutes les deux vers zéro lorsque la taille de l’échantillon tend vers l’infini :

2eS

( ) ( ) 0limlim 22 ==∞→∞→

SVSVn

en

2S

D- Notion de Fréquence

• Lors d’une production industrielle des pièces mécaniques, on s’intéresse à la proportion des pièces défectueuses. Si on note X la V.A. qui prend, avec une probabilité p, la valeur 1 si la pièce est défectueuse et qui prend 0, avec la probabilité 1-p sinon. on note alors :

• D’où :

X BBBB (p)

conforme pièce si 1 proba. avec 0

edéfectueus pièce si .laproba avec 1

−=

p

pX

• On extrait de cette production un E.A. de taille n. Soit X1, X2, …, Xn cet échantillon aléatoire. Alors chaque Xi suit une loi de Bernoulli de paramètre p

Xi BBBB (p)

• De plus les Xi sont indépendantes, par conséquent, leur somme Sn suit une loi binomiale :

Sn BBBB (n,p)

• Sn représente le nombre de pièces défectueuses dans l’échantillon :

• Définissons la fréquence F comme étant la proportion de pièces défectueuses dans l’échantillon :

( ) nkqpCkSP knkknn ,,1,0; K=== −

n

XXX

n

SF nn L++== 21

• Si x est une valeur numérique que peut

prendre la statistique F, alors :

• Et la distribution de F est donnée par :

( ) ( ) nxnnxnxnn qpCnxSPxFP −====

−∈ 1,

1,,

2,

1,0

n

n

nnx K

D.TOUIAR 04/03/2008

9

•Remarque :Les propriétés de F sont déduites de celles de (puisque F est un cas particulier de )

•Propriété 6 :Soit la V.A. parente X qui suit

une loi de Bernoulli de paramètre p. Les

moments de la statistique F sont comme suit :

( ) ( )n

pqFVpFE == et

XX

E- Théorèmes

fondamentaux de la

Statistique

I- Convergence en probabilité

• Définition : La suite aléatoire X1, X2, …, Xn,… converge en probabilité vers la V.A. X, appelée limite de la suite, si :

• Ce que l’on note:

{ } 1lim;0 =<−>∀∞→

εε XXP nn

XX Pn →

• Remarque :

On peut redéfinir la convergence en probabilité comme suit :

La V.A. X peut être une constante; par exemple, lorsqu’on étudie la convergence d’une suite de statistiques vers la valeur vraie d’un paramètre

{ } 0lim;0 =>−>∀∞→

εε XXP nn

II- Convergence en LOI• Définition : La suite aléatoire X1, X2, …, Xn,… converge en loi vers la V.A. X, appelée limite de la suite si

en tout point de continuité x de F(x)• Et on note :

• Où F(x) est la fonction de répartition de X

( ) ( ) ;lim xFxFnn

=∞→

XX Ln →

Convergence de la loi de Poisson vers la

loi Normale

• Propriété 10 : Soit une V.A. Z normale

centrée réduite: Z N N N N (0,1) et soit

une suite de V.A. X1, X2, …, Xn,… telles

que: Xn P P P P (λn) avec

Alors;

+∞=∞→ n

nλlim

ZX L

n

nn →−λ

λ

D.TOUIAR 04/03/2008

10

Remarque:

• Si λ est suffisamment grand ,

Alors :

P P P P (λ) NNNN

( )15≥λ

≈ ( )λλ ,

Convergence de la loi Binomiale vers la loi

Normale

• Propriété 11 : Soit une V.A. Z normale

centrée réduite: Z N N N N (0,1) et soit

une suite de V.A. X1, X2, …, Xn,… telles

que: Xn B B B B (n , p)

Alors;

Znpq

npX Ln →−

Remarque:

• Si

Alors :

B B B B (n , p) NNNN

5et 5et 30 ≥≥≥ nqnpn

≈ ( )npqnp,

Convergence de la loi de Khi-

deux vers la loi Normale

Rappel sur la loi de Khi-

deux: χχχχ2222

• Définition : Soit une suite de n V.A. Z1,

Z2, …, Zn indépendantes et de même loi

normale centrée réduite: Zi N N N N (0,1)

On appelle loi de Khi-deux à n degrés de liberté, la loi suivie par la somme des

carrés des V.A. Zi ; on note :

χχχχ2(n)∑=

n

iiZ

1

2

b)- Distribution d’une Khi-deux

• La distribution de χχχχ2 est dissymétrique. Elle est continue et elle dépend du nombre de degrés de liberté n. Pour des valeurs différentes de n, on obtient des distributions différentes. Lorsque n

augmente, la loi de χχχχ2 tend lentement vers la loi normale

D.TOUIAR 04/03/2008

11

Distribution de χχχχ2(10)



10 15 20 30

0,1

0

C)- Les moments de Khi-deux

• Soit X χχχχ2(n) ; alors :

E( X ) = n et V( X ) = 2n

d)- Une propriété de Khi-deux

• La somme de deux Khi-deux indépendantes de

d.d.l. respectifs n et m est une Khi-deux de d.d.l.

n+m ; on note :

( )( )

( )mY

mnYXYXoùet

nX

2

2

2

χχ

χ++⇒C

• Propriété 12: Approximation de fisher

• Soit X χχχχ2(n) , si n > 30; alors :

N N N N (0,1)≈−− 122 nX

Convergence de la loi de

Student vers la loi Normale

Rappel sur les lois de Student :

t et de Fisher : F

• Définition 1: Soient X une V.A. de khi-deux à n d.d.l. et Y une V.A. de khi-deux à m d.d.l. avec X et Y indépendantes; on définit alors la V.A. de Fisher par le rapport des rapports des deux V.A. de khi-deux par leurs d.d.l. respectifs n et m et on note :

• FFFF

( )

( )

( )mY

mn

mY

nX

YXoùet

nX

2

2

,

χ

χ

⇒C

D.TOUIAR 04/03/2008

12

•F F F F (n , m) est la notation de la loi de Fisher à (n , m) d.d.l. Sa densité étant dissymétrique, étalée à droite.

• Propriété 14: moments de la loi de Fisher

Soit F F F F F (n , m) ;alors

( ) 22 >−= msimmFE

( ) ( )( ) ( )

442

222

2

>−−

−+= msimmn

mnmFV

• Remarque :

�Si Fn,m,p est le fractile d’ordre p de la V.A. de Fisher à (n , m) d.d.l, alors :

�Cette loi joue un grand rôle en statistique (loi du rapport des variances de deux échantillons indépendants)

pnmpmn F

F−

=1,,

,,

1

• Définition : Soit Z une V.A. suivant la loi

normale centrée réduite: Z N N N N (0,1)

et soit X une V.A. de Khi-deux à νννν degrés de

liberté: X χ2(ν) et indépendante de Z. On définit alors la V.A. T suivant la loi de student à

νννν degrés de liberté, notée tνννν :

tνννν

νX

ZT =

Distribution de la loi de Student

• Les distributions de Student sont continues et symétriques et dépendent

d’un paramètre n. A des valeurs différentes de n, correspond différentes distributions de Student. Lorsque n tend

vers l’infini, la loi de student tend vers la loi normale.

n=1

n=50

-3 0 +3

Distributions de Student0,4

0,3

Propriété 15: moments de la loi de Student

Soit T t (n ) ;alors

( ) 10 >= nsiTE

( ) ( ) 22

>−

= nsin

nTV

303 >= nsiµ

D.TOUIAR 04/03/2008

13

Propriétés de Student

� T2=F(1,n)

�Soit T t (n ) ;alors si n >120

N N N N (0,1)≈T

Loi des Grands Nombres (loi faible)

• Théorème 1: Loi des grands nombres

• Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ ; alors :

• Remarque: Ce résultat reste vrai quelque soit la loi de X. donc en particulier pour la loi de Bernoulli

µ→PX

• Corollaire 1: Soit la V.A. parente X suivant une loi de Bernoulli de paramètre p ; alors :

• Remarque: Cela veut dire que la

fréquence d’un événement converge vers sa probabilité

• La démonstration du Théorème1 découle du lemme suivant

pF P→

Si εεεε désigne un réel strictement positif, et

X une V.A. d’écart type σσσσ, alors

•Indication pour démonstration:• voir dans le cas d’une v.a. discrète et poser

Lemme Lemme Lemme Lemme : Inégalité de Bienaymé-Tchebicheff

( ){ }2

2

εσε ≤≥− XEXP

( ) EYEXXY calculer et 2−=

• Remarque:

•La loi des grands nombres peut être généralisée:

• Théorème 2:Soit T=T(X1, X2, …, Xn) une statistique telle que :

alors : θ→PT

( ) ( ) 0limlim ==∞→∞→

TVetTEnn

θ

D.TOUIAR 04/03/2008

14

• Exemple :

• 1)-

Alors

• 2)-

Alors :

( ) ( ) 0limlim 222 ==∞→∞→ e

ne

nSVetSE σ

22 σ→PeS

( ) ( ) 0limlim 222 ==∞→∞→

SVetSEnn

σ

22 σ→PS

Théorème CENTRAL LIMITE

(T.C.L.)

• Théorème 3: (T.C.L. 1ère formulation)

• Soit X1, X2, …, Xn un échantillon aléatoire simple de taille n, relatif à la V.A. parente X de moyenne µ µ µ µ et de variance σσσσ2. Alors,

• N N N N (0,1)→−=− LXn

n

X

σµ

σµ

• Théorème 4: (T.C.L. 2ème formulation)

• Pour une taille n assez grande (en pratique n 30), on a:

• NNNN

• Corollaire 2: Soit la V.A. parente X suivant une loi de Bernoulli de paramètre p ; Si

alors on a :

F NNNN

≈X ( )n2

,σµ≥

5et 5et 30 ≥≥≥ nqnpn

≈

n

pqp,

Cas des échantillons Aléatoires issus d’une

population Normale

• Lorsque l’E.A. est relatif à une loi normale, on obtient des propriétés plus intéressantes pour les statistiques et S2

• Propriété 16: Soit X N N N N (µµµµ ,σσσσ2222); alors

N N N N (µµµµ , σσσσ2222/n)

X

X

• Remarque: Le T.C.L. s’applique à

toute V.A. quelque soit sa loi; il

fournit une propriété asymptotique.

• Alors que la propriété 16 ne

s’applique qu’aux V.A. suivants une loi

Normale et quelque soit la taille n de

l’échantillon.

Propriété 17: Sous l’hypothèse de normalité,

χχχχ2(n-1)

Propriété 18: Sous l’hypothèse de normalité:

t(n-1)

( ) 22

1S

n

σ−

S

Xn

µ−

D.TOUIAR 04/03/2008

15

Remarque: Sous l’hypothèse de normalité, et si la moyenne de la population est connue, on a:

χχχχ2(n)22

~S

n

σ( )

2

1

2 1~Où ∑

=

−=n

iiX

nS µ

Remarque: Cas des petits échantillons

• Lorsque n est petit, on ne peut utiliser le T.C.L. et par conséquent on ne peut obtenir une loi pour . Or si on ajoute l’hypothèse de normalité, on obtient des résultats importants quelque soit n.

X

F- Cas des échantillons

exhaustifs

(T.S.R.)

• Lorsque le tirage est sans remise, toutes les propriétés qu’on a énoncé (ou presque), concernant les statistiques ,

ne sont plus valables. En effet, on peut montrer qu’on a :

22 et ,, SSFX e

( )( )

−−=

=

1

2

N

nN

nXV

XEσµ

( )( )

−−=

=

1N

nN

n

pqFV

pFE

• Remarque: Si n est négligeable devant N (la taille de la population finie), le tirage sans remise devient équivalent à un tirage avec remise. Dans la pratique, ceci prend effet lorsque:

( )( )

−=

−

−=

1

1

1

22

22

N

NSE

N

N

n

nSE e

σ

σ

nN 20≥

L’ Estimation

Chapitre II

D.TOUIAR 04/03/2008

16

INTRODUCTION

• Après avoir prélevé l’échantillon, et étudié les

distributions d’échantillonnage, on peut alors

généraliser, à la population, les résultats

expérimentaux obtenus à partir de

l’échantillon; c’est ce qu’on appelle l’inférence

statistique.

� L’estimation consiste en l’évaluation d’un paramètre de la population à partir de l’observation d’un E.A.

� La théorie de l’estimation se divise en deux parties:

1) L’estimation ponctuelle: permet d’obtenir une valeur unique calculée à partir d’un E.A., valeur qui sera prise comme estimation du paramètre inconnu.

2) L’estimation par intervalle: permet de déterminer un intervalle qui, avec une grande probabilité fixée a priori, contient la valeur vraie du paramètre inconnu.

• Exemple:On dit que 53% de la

population favorise le candidat A avec une marge d’erreur de 1% et avec un niveau de confiance de 95%. Ce qui signifie que la proportion d’électeurs favorisant A se situe, avec une probabilité de 95%, entre 52% et 54%.

A- L’ ESTIMATION PONCTUELLE

• I- Définitions

–Définition1: Soit X1, X2, …, Xn un E.A.S

relatif à la V.A. parente X de loi LLLL (θθθθ). On appelle estimateur du

paramètre θ θ θ θ toute statistique utilisée dans le but d’approcher la valeur inconnue de θθθθ. Un estimateur est donc une Variable Aléatoire.

– Définition2: Une estimation du paramètre θ θ θ θ est une réalisation d’un estimateur de ce paramètre. Une estimation est donc une valeur numérique.

– Exemples:

Si X LLLL (µ) estimateur

Si X LLLL (p) estimateur

Si X LLLL (σ2222) estimateur

xX estimation →

fF estimation →

→

2

2

2

2e

Ssestimation

S

s

se

• II- Propriétés des estimateurs

• 1-Estimateurs sans biais

•Définition: On appelle estimateur sans biais du paramètre θ θ θ θ toute statistiqueT=T(X1, X2, …, Xn) telle que:

E(T)=θθθθ

D.TOUIAR 04/03/2008

17

• Remarque 1: Si T est biaisé, le biais serai alors:

B= E(T)-θθθθ

E(T)=θθθθ

Estimateur sans biais

B

θθθθ E(T)

Estimateur biaisé

– Exemples:

22

22

de biaisé estimateurun est de biais sans estimateurun est de biais sans estimateurun est

σσµ

eSSX

( ) ( )nn

nSESB ee

222222 1 σσσσ −=−

−=−=

• Définition: On appelle estimateur

asymptotiquement sans biais, du paramètre θ, θ, θ, θ, toute statistiqueT=T(X1, X2, …, Xn) telle que:

E(T)=θθθθ

Exemple:Se

2 est un estimateur asymptotiquement sans biais de σ2 :

∞→nlim

( ) 222 11limlim σσ =

−=∞→∞→ n

SEn

en

2-Estimateurs Convergents

• Définition: On appelle estimateur Convergent du paramètre θθθθ toute statistique T=T(X1, X2, …, Xn) telle que:

θ→PT

• Remarque : La loi des grands nombres

implique que est un estimateur

convergent de µ. De même que F est un

E.C. de p

X

Théorème : L.G.N. généralisée• Si T est un estimateur sans biais ou

asymptotiquement sans biais de θθθθ, et si sa variance tend vers zéro lorsque n tend vers l’infini, alors T est un estimateur

convergent de θ θ θ θ :

• Si

• Alors θ→PT

( ) ( ) 0limlim ==∞→∞→

TVetTEnn

θ

D.TOUIAR 04/03/2008

18

Exemple :

Alors

• De même on montre que S 2 est un E.C. de σ σ σ σ 2222

22 deconvrgent estimateurun est σeS

( ) ( ) 0limlim 222 ==∞→∞→ e

ne

nSVetSE σ

3-Estimateurs Efficaces:

Entre deux estimateurs sans biais, on préfère utiliser celui qui a la variance la plus petite.

• Définition: Soient T1 et T2 deux estimateurs sans biais du même paramètre θθθθ et basés sur le même échantillon. On dit que T1 est plus précis que T2 si:

)()( 21 TVTV ≤

Exemple : Montrons que est plus précis

que . On a d’abord:

donc sont

deux E.S.B. de µ.µ.µ.µ.

D’où

X

221 XX +=Γ

( ) ( ) µ=Γ= EXE ΓetX

( ) ( ) ( )( ) ( )22

1

4

1 2

21

σ==+=Γ XVXVXVV

( )n

XVOr2σ=

( ) ( ) 2≥Γ≤ npourVXV

• Question:

• Définition: On appelle Quantité d’information de

Fisher de θθθθ, la quantité In(θ θ θ θ ):

• Où In(θ θ θ θ ) dépend de n et de la loi de X mais ne dépend pas de l’estimateur T

( )?.}..{

TVMinBSET∈

( ) ( )

∂∂=

2

21 ,,,, θθ

θ nn XXXfLogEI K

• Remarques : Soit f(x,θθθθ) la densité de la loi de X,

alors In(θ θ θ θ ) s’écrit aussi (sous certaines conditions

qu’on supposera toujours vérifiées):

1-

2-

3-

( ) ( )

∂∂=

2

,θθ

θ XfLogEnI n

( ) ( )θθ 1nII n =

( ) ( )

∂∂−= θθ

θ ,2

2

XfLogEnI n

4- Le rapport est appelé

Borne de CRAMER-RAO

( ) ( )θθ

nCR I

B1=

D.TOUIAR 04/03/2008

19

• Propriété: Inégalité de CRAMER-RAO

Si T est un Estimateur sans biais (E.S.B.) du paramètre θ , θ , θ , θ , alors :

( ) ( )θCRBTV ≥

• Définition : un E.S.B. T de θθθθ, , , , est dit efficace si sa variance est égale à la borne de Cramer-Rao:

• Définition: un E.S.B. T de θθθθ, , , , est dit asymptotiquement efficace si:

( ) ( )θCRBTV =

( )( ) 1lim =

∞→ θCRn B

TV

Exemple : Si X N N N N (µ , σ2222), alors

Or E.S.B. de µ, d’où il est efficace de µ.

S2 est asymptotiquement efficace de σ2222 car

(n/n-1) 1

( ) ( )n

XVn

I n

2

2et

σσ

µ ==

( ) ( )1

2et

2

42

42

−==

nSV

nI n

σσ

σ

X

III Recherche d’estimateurs

• Soit (x1, x2, …, xn ) la réalisation d’un échantillon aléatoire X1, X2, …, Xn, relatif à la V.A. parente X de loi Pθθθθ. La probabilité d’obtenir une telle réalisation est :

( ) ( )∏=

=====n

iiinn xXPxXxXxXP

12211 ,,, θθ K

• Définition : On appelle Estimateur de

Maximum de Vraisemblance (E.M.V.) pour θθθθ, la valeur de θθθθ, qui maximise cette probabilité.

• En pratique, il revient au même de chercher qui maximise le logarithme de la probabilité, soit :

θ

θ

( ) ( )[ ]ii

n

i

xXPLogL ==∑=

θθ1

• Remarque:

• maximise ssi

• Exemple:

• Si X BBBB ( p)• D’où

θ ( )θL( )( )

<∂∂

=∂∂

0ˆ

0ˆ

2

2

θθ

θθL

L

( ) ii xxiip qpxXP −==⇒ 1

( ) ( ) ( )[ ]∑=

−−+=n

iii pLogxLogpxpL

1

11

D.TOUIAR 04/03/2008

20

Vérifiez ensuite que

On conclu que F est bien un E.M.V. pour p

( )p

xnx

ppx

p

x

p

L

n

iin

ii

n

ii

i

−

−−=

−−−=

∂∂ ∑

∑∑ =

== 1

1

1

11 1

11

Fn

Xpnxp

p

L

n

iin

ii ==⇔=⇔=

∂∂ ∑

∑ =

=

1

1

ˆ0

( ) 0ˆ2

2

<∂∂

pL

θ

IV Cas Exhaustif

1-Cas de la moyenne : θ=µθ=µθ=µθ=µLorsque le tirage est sans remise,

garde la même espérance mais pas la même variance:

Remarque :

X

( ) ( )1

et 2

−−==

N

nN

nXVXE

σµ

( ) ( )TARTSR XVXV ≤

2-Cas de la variance : θ=σθ=σθ=σθ=σ2222

�Si le TAR S2 est un E.S.B. de σ σ σ σ 2222�Mais lorsque le TSR, on a:

est donc un ESB de σ σ σ σ 2222

221 σ=

−S

N

NE

21S

N

N −

B- Estimation Par Intervalle de Confiance

–Définition: On dit que (C1,C2) est un intervalle de confiance au niveau 1-αααα pour le paramètre θθθθ si on a :

–Les bornes C1 et C2 de l’intervalle sont des statistiques relatives à l’ E.A.

( )( ) ( ) αθθ −=≤≤=⊃ 1; 2121 CCPCCP

• 1-αααα est appelé niveau de confiance de

l’intervalle (C1,C2).

• Plus α α α α est petit et plus l’intervalle de

confiance est grand. Généralement, on

considère des intervalles à risques

symétriques:

( ) ( )212

αθθ =<=> CPCP

I- Intervalle de Confiance pour une

proportion: IC(p)

• 1- Construction de L’ IC(p): Afin d’estimer une

proportion p de « Succès » par exemple; on utilise

la fréquence F qui est un estimateur sans biais

convergent et efficace du paramètre p. De plus, on

a (d’après le T.C.L.)

• N N N N (0,1)

• dés que 5et 5et 30 ≥≥≥ nqnpn

≈−=

n

pq

pFZ

D.TOUIAR 04/03/2008

21

αααα/2 αααα/21- αααα

-zαααα/2 +zαααα/2Z0

π2

1Courbe de densité de la loi normale centrée réduite

• D’où

• Remplaçons Z par son expression:

( ) ααα −=+<<− 12/2/ zZzP

ααα −=

+<−<− 12/2/ z

n

pq

pFzP

•Donc, on obtient comme intervalle de

confiance pour la proportion au niveau 1-αααα

ααα −=

+<<− 12/2/ n

pqzFp

n

pqzFP

( )

+−=44344214434421

21

2/2/ ;

CC

C n

pqzF

n

pqzFpI αα

• Exemple: pour un niveau de confiance 95%; α=5%

et par suite zαααα/2 = z0000,,,,025025025025 = 1,96. Par conséquent:

• N N N N (0,1)

( )

+−=

n

pqF

n

pqFpIC 96,1;96,1

2222,,,,5555%%%% 2222,,,,5555%%%%95%

-1,96 1,96

Z0

• Une réalisation de cet intervalle est :

• Problème: est inconnue car p est inconnu. On utilise alors l’approximation suivante, pour n assez grande :

( )

+−=

n

pqf

n

pqfpIC 96,1;96,1

npq

( )n

ffn

pq −≅ 1

• Propriété: Soit X1, X2, …, Xn un

échantillon aléatoire simple de taille n, relatif à la V.A. parente X suivant une loi de Bernoulli de paramètre p inconnu. Un intervalle de confiance au niveau 1-αpour p est comme suit :

• Dés que :

( ) ( ) ( )

−+−−=n

ffzf

n

ffzfpIC

1;

12/2/ αα

( ) 51et 5et 30 ≥−≥≥ fnnfn

D.TOUIAR 04/03/2008

22

• 2- Précision d’une estimation par intervalle

de confiance: Pour un α donné, on veut

déterminer la taille nécessaire de l’échantillon pour

atteindre une certaine précision de l’estimation.

–Notons a(α,n) l’amplitude de IC(p) :

( )

npqz

n

pqzf

n

pqzfna

2

22

2

,

α

ααα

=

−−

+=

• On appelle erreur d’estimation la demi-longueur de Ic

• Or p est inconnu, on utilise donc la majoration:

• On obtient donc

( )n

pqzna

22

,α

α =

( ) 211 ≤− pp

nzn

pqz2

122

αα ≤

• Pour que l’erreur d’estimation soit inférieure ou égale à e:

• Il faut que n soit:

• Remarque: Plus l’erreur d’estimation est petite et plus la précision est grande.

2

2

4

1

≥

e

zn

α

en

z≤

22

α

• Exercice:Parmi un E.A. de 250 électeurs, 108 déclarent vouloir voter pour le président sortant. Tandis que les autres voteront pour l’autre candidat. Donner un IC(p) au niveaux 90 et 95%

• Combien faudrait-il interroger d’électeurs pour que l’erreur d’estimation ne dépasse pas 2% ?

• Réponse

• 1)-

• D’où : X BBBB (p)

Bpour votesi 1 proba. avec 0Apour votesi .proba avec 1

−=p

pX

• p représente la proportion des votants en faveur de A dans toute la population des électeurs.

• Une estimation ponctuelle de p est donnée, grâce à la réalisation de l’E.A., par la fréquence:

• Condθ TCL:

Or α=10%, d’où zαααα/2=z0,05=1,645(loi normale C.R)

432,0250

1081 ===n

nf

5142et 5108et 30250 ≥≥=≥= nfn

( ) ( ) ( )

−+−−=n

ffzf

n

ffzfpIC

1;

12/2/ αα

• 2)- α=5% ⇒ z0,025=1,96

[ ][ ]483,0;381,0

031,0645,1432,0;031,0645,1432,0

=×+×−=

( ) [ ]493,0;371,0=pI C

D.TOUIAR 04/03/2008

23

05/01/2004

• 3)-

240102,0

96,1

4

1

4

12

2

2 =

=

≥

e

zn

α

II- Intervalle de Confiance pour la

moyenne: IC(µµµµ)

• 1)- IC(µµµµ) dans le cas d’un population Normalement

distribuée:

• Dans ce cas la V.A. parente X suit :

• X N N N N (µ , σµ , σµ , σµ , σ2222).

• Or, on sait que est un bon estimateur de la moyenne µ :

• N N N N (µ , σµ , σµ , σµ , σ2222////n).

X

X

• Posons

• N N N N (0000, , , , 1111).

• D’où n

XZ σ

µ−=

( )

1

2/2/

2/2/

+<<−=

+<<−=−

nzX

nzXP

zZzP

σµσ

α

αα

αα

• D’où :

• Cet intervalle n’a de sens que si σ2 est connue.

• Si σ2 est inconnue, on l’estime alors par S2 et on obtient la V.A.(grâce à l’hypothèse de Normalité) :

• t(n-1)

( )

; 2/2/

+−=n

zxn

zxIC

σσµ αα

S

XnZ

µ−=

• Notre intervalle de confiance devient :

• Où est la valeur critique d’ordre

α/α/α/α/2222 lue dans la table de student à n-1

d.d.l.

( )

; 2/,12/,1

+−= −−n

stx

n

stxI nnC ααµ

2/,1α−nt

•Propriété: Soit la V.A X N N N N (µ , σµ , σµ , σµ , σ2222) . •1)- Si σ2 est connue, alors un intervalle

de confiance au niveau 1-α pour µµµµ est :

•2)- Si σ2 est inconnue, alors un intervallede confiance au niveau 1-α pour µµµµ est :

( )

; 2/2/

+−=n

zxn

zxI C

σσµ αα

( )

; 2/,12/,1

+−= −−n

stx

n

stxI nnC ααµ

D.TOUIAR 04/03/2008

24

• 2)- IC(µµµµ) dans le cas d’un population

quelconque:

•Propriété: Soit X1, X2,…, Xn un échantillon

aléatoire relatif à X LQ (µ , σµ , σµ , σµ , σ2222) . 1)- Si σ2 est connue, et si alors un

intervalle de confiance au niveau 1-α de µµµµ

•2)- Si σ2 est inconnue, et si alorsnotre intervalle pour µµµµ devient :

( )

; 2/2/

+−=n

zxn

zxI C

σσµ αα

( )

; 2/2/

+−=n

szx

n

szxI C ααµ

50≥n

30≥n

III- Intervalle de Confiance pour la

variance: IC(σσσσ2222)

• Pour montrer le grand intérêt que présente la variance, on prend l’exemple où X est le taux de rendement d’un actif financier. Celui-ci est définit comme suit:

• Où Pt est le prix de la période t, et dt le dividende de la même période

1

1

−

−−+=t

ttt P

PdtPR

• La variance de X peut-être considérée comme une mesure de l’incertitude de l’actif et donc comme une mesure de son risque.

• Soit P la population des actions des entreprises du secteur micro-informatique. X est le taux de rendement de ses actions; on suppose :

• X N N N N (µ , σµ , σµ , σµ , σ2222).

• On prélève au hasard 30 actions et construisons un intervalle de confiance pour σσσσ2222

12/01/2004

Si µ est inconnue, on utilise alors S2 et on obtient la V.A.(grâce à l’hypothèse de Normalité)

χχχχ2(n-1)( ) 22

1S

n

σ−

1−α

α/2

χχχχ1−α/2;n-1 χχχχα/2;n-1

• D’où :

• ou

( )( ) ( )

−−=

−−

=

−

=∑∑

22/1;1

1

2

22/;1

1

2

2 ;αα χχ

σn

n

ii

n

n

ii

C

xxxxI

( ) ( ) ( )

−−=−−−

22/1;1

2

22/;1

22 1

;1

αα χχσ

nnC

snsnI

D.TOUIAR 04/03/2008

25

IV- Intervalle de Confiance pour la

différence des moyenne

•1)- IC(µµµµ1111 −−−− µµµµ2222 ) dans le cas de 2 populations

Normalement distribuées:

•Soient P1 et P2 2 populations que l’on étudie selon la V.A. parente X de loi sur P1

NNNN (µµµµ1111 , σ, σ, σ, σ11112222) et NNNN (µµµµ2222 , σ, σ, σ, σ2222

2222) sur P2.

•On veut estimer la différence des

moyennes µµµµ1111 −−−− µµµµ2222 .

• Pour cela, on prélève 2 échantillons indépendamment de tailles n1 et n2respectivement de P1 et P2

• Et on définie alors 2 estimateurs et

respectivement de µ1 et µ2

On propose alors estimateur

de µ1 – µ2 :

2X1X

21 XX −

( ) ( ) ( )212121XEXEXXEXX −=−=−µ

21 µµ −=

• Or NNNN (µµµµ1111 , σ, σ, σ, σ11112222////n1).

• Et NNNN (µµµµ2222 , σ, σ, σ, σ22222222////n2).

• D’où

NNNN (µµµµ1111−−−− µµµµ2222 ,σ,σ,σ,σ11112222////n1+σ+σ+σ+σ2222

2222////n2)

1X

2X

21 XX −

2

22

1

21222

2121 nnXXXX

σσσσσ +=+=−

• Si les deux variances σ11112222 et σ2222

2222 sont connues :

• Si les variances sont inconnues mais égales

222

21 σσσ ==

( )

;

2

22

1

21

2/21

2

22

1

21

2/2121

++−

+−−=−

nnzxx

nnzxxIC

σσ

σσµµ

α

α

On les estime alors par , où

• Et donc on construit une V.A. de Student:

( ) ( )( ) ( )11

11ˆ21

222

2112

−+−−+−=

nn

SnSnS

( ) ( )

21

2121

11ˆnn

S

XXT

+

−−−= µµ ( )221 −+ nnt

2S

•D’où notre intervalle de confiance au niveau 1- α :α :α :α :

•Où tαααα/2 est lu dans la table de student à n1 +n2 -2

( )

++−

+−−=−

−+

−+

212/;221

212/;22121

11ˆ

;11

ˆ

21

21

nnstxx

nnstxxI

nn

nnC

α

αµµ

D.TOUIAR 04/03/2008

26

a)- Si les deux variances σ11112222 et σ2222

2222 sont connues

:

•On considère alors la V.A. pour

NNNN (0,1)

2)- le cas de 2 populations quelconques:

( ) ( ) ≈+

−−−=

2

22

1

21

2121

nn

XXZ

σσµµ

30, 21 ≥nn

• Donc, notre intervalle de confiance au niv.

1111−−−−αααα, de la différence des moyennes s’écrit :

( )

;

2

22

1

21

2/21

2

22

1

21

2/2121

++−

+−−=−

nnzxx

nnzxxIC

σσ

σσµµ

α

α

• Si les variances sont inconnues:

• On estime chaque par Si2 et on

considère alors la V.A. pour

• Donc, notre intervalle de confiance au niv.

1111−−−−αααα, s’écrit :

2iσ

50, 21 ≥nn

( ) ( ) ≈+

−−−=

2

22

1

21

2121

n

S

n

S

XXZ

µµ NNNN (0,1)

( )

;

2

22

1

21

2/21

2

22

1

21

2/2121

++−

+−−=−

n

s

n

szxx

n

s

n

szxxIC

α

αµµ

V- Intervalle de Confiance pour la

différence des proportions

•Soient P1 et P2 2 populations que l’on étudie selon la V.A. parente X suivant la loi

B(p1) sur P1 et B(p2) sur P2.

•On veut estimer la différence des

proportions p1 −−−− p2 . Alors dés que:

( ) 2,1:51 , 5 , 30 i =≥−≥≥ ifnfnn iiii

• notre intervalle de confiance s’écrit au niveau 1- α :α :α :α :

( ) ( ) ( )

( ) ( )

11

;11

2

22

1

112/21

2

22

1

112/2121

−+−+−

−+−−−=−

n

ff

n

ffzff

n

ff

n

ffzffppIC

α

α

D.TOUIAR 04/03/2008

27

VI- Intervalle de Confiance pour le

Rapport des variances

•Les deux populations sont supposées être

Normalement distribuées:

•Sur P1 : X N N N N (µ1 , σ12)

•Sur P2 : X NNNN (µ2 , σ22)

•On s’intéresse à l’estimation du rapport

22

21

σσ

• 1)- Si les moyennes sont inconnues

• On propose alors l’estimateur

• Or

• D’où FFFF (n1-1;n2-1)

22

21

SS

( ) 212

1

211

1 1 1

−

−= nSnY χσ

( ) 212

2

222

2 2 1

−

−= nSnY χσ

22

22

21

21

σσ

S

S

<<=

−−

−−−

1,1;2/22

21

22

21

1,1;2/122

21

12

12

nn

nn

FS

S

FS

SP

α

α σσ

<<

=−

−−−−− 1,1;2/22

22

21

21

1,1;2/1 2121

1

nnnn FS

SFP αα σ

σα

• D’où notre intervalle de confiance pour le rapport

de variance au niveau 1-α :α :α :α :

=

−−

−−−

1,1;2/22

21

1,1;2/122

21

22

21

12

12

;

nn

nnC

Fs

s

Fs

sI

α

ασσ

• Remarque : Pour des raisons de lecture des tables statistiques de Fisher, on choisi d’estimer le

rapport (σ12/σ2

2) si (s12>s2

2); sinon on doit estimer le rapport

(σ22/σ1

2).

d.touiar 04/03/2008 statistique...

Documents