module 3 : construction d’un test d’hypothèses · tests de concordance). • test...

42
Echantillonnage M3 EchMod3 1/42 MODULE 3 : Construction d’un test d’hypothèses Unité 1 : aspects méthodologiques L’utilisation des intervalles de confiance comme moyen de décision est possible ; toutefois le décideur, tout en connaissant l’existence des erreurs qu’il peut commettre, n’est pas en mesure dévaluer les risques qui leur sont associés avant la prise de sa décision. La théorie des tests, en ramenant cette dernière au choix entre deux hypothèses antagonistes, notées 0 H et 1 H , rend la démarche plus rigoureuse. L’hypothèse 0 H est privilégiée dans le sens où l’observateur souhaite la retenir tant qu’elle n’est pas infirmée par l’expérience. Dès lors, le test a pour but de mesurer l’adéquation de cette hypothèse à la réalité observable, c’est-à-dire aux résultats fournis par un échantillon. La démarche consiste tout d’abord à exprimer les erreurs en termes d’hypothèses « décider à tort » devient « décider de retenir une hypothèse alors que l’autre est vraie ». Ainsi, il devient possible de définir deux risques d’erreur et de calculer les probabilités qui leur correspondent, les probabilités étant liées au caractère aléatoire de tous les échantillons susceptibles d’être retenus. Dans une deuxième étape, il s’agit de construire le test, c’est-à-dire de mettre au point l’instrument de mesure de l’adéquation recherchée. A cette fin, et dans une formulation ex ante, sont conjointement proposées une statistique d’échantillonage adéquate (appelée conventionnellement fonction discriminante) et une zone de rejet de l’hypothèse 0 H (ou région critique) pour un risque d’erreur raisonnable. Une règle de décision est ensuite formulée, mais la décision proprement dite n’est prise qu’ultérieurement au vu de la valeur particulière retenue dans un échantillon particulier. Comme pour tout instrument de mesure, il sera exigé d’un test d’hypothèse d’être performant. La puissance d’un test, c’est-à-dire la probabilité de refuser l’hypothèse 0 H quand elle est fausse, est définie pour jouer ce rôle. Ainsi compte tenu de la diversité des situations concrètes envisageables, le critère de choix entre différents tests possibles sera celui correspondant à la puissance la plus élevée. 1. Risque d’erreur Deux grands « cas » se présentent : - ( ) x F X loi inconnue (1) - ( ) θ , x F X F connue, mais θ inconnu (2) Les hypothèses à tester sont : - ( ) x F X : H 0 (1) - 0 0 : H θ = θ (2) Soit on conservera l’hypothèse 0 H , soit on la rejettera. Les risques d’erreurs encourus par l’observateur peuvent alors être définis par : α : risque de première espèce : décider à tort que 0 H est fausse. Sa probabilité s’écrit : α = Prob[décider que 1 H est vraie / 0 H vraie] ou α = Prob[rejeter 0 H / 0 H vraie] α est fixé, souvent à 5%.

Upload: others

Post on 18-Apr-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 1/42

MODULE 3 : Construction d’un test d’hypothèses

Unité 1 : aspects méthodologiques

L’utilisation des intervalles de confiance comme moyen de décision est possible ; toutefois le décideur, tout en connaissant l’existence des erreurs qu’il peut commettre, n’est pas en mesure dévaluer les risques qui leur sont associés avant la prise de sa décision. La théorie des tests, en ramenant cette dernière au choix entre deux hypothèses antagonistes, notées 0H et 1H , rend la démarche plus rigoureuse.

L’hypothèse 0H est privilégiée dans le sens où l’observateur souhaite la retenir tant qu’elle n’est pas infirmée par l’expérience. Dès lors, le test a pour but de mesurer l’adéquation de cette hypothèse à la réalité observable, c’est-à-dire aux résultats fournis par un échantillon.

La démarche consiste tout d’abord à exprimer les erreurs en termes d’hypothèses « décider à tort » devient « décider de retenir une hypothèse alors que l’autre est vraie ». Ainsi, il devient possible de définir deux risques d’erreur et de calculer les probabilités qui leur correspondent, les probabilités étant liées au caractère aléatoire de tous les échantillons susceptibles d’être retenus.

Dans une deuxième étape, il s’agit de construire le test, c’est-à-dire de mettre au point l’instrument de mesure de l’adéquation recherchée. A cette fin, et dans une formulation ex ante, sont conjointement proposées une statistique d’échantillonage adéquate (appelée conventionnellement fonction discriminante) et une zone de rejet de l’hypothèse 0H (ou région critique) pour un risque d’erreur raisonnable. Une règle de décision est ensuite formulée, mais la décision proprement dite n’est prise qu’ultérieurement au vu de la valeur particulière retenue dans un échantillon particulier.

Comme pour tout instrument de mesure, il sera exigé d’un test d’hypothèse d’être performant. La puissance d’un test, c’est-à-dire la probabilité de refuser l’hypothèse 0H quand elle est fausse, est définie pour jouer ce rôle. Ainsi compte tenu de la diversité des situations concrètes envisageables, le critère de choix entre différents tests possibles sera celui correspondant à la puissance la plus élevée.

1. Risque d’erreur

Deux grands « cas » se présentent :

- ( )→≡ xFX loi inconnue (1)

- ( )→θ≡ ,xFX F connue, mais θ inconnu (2)

Les hypothèses à tester sont :

- ( )xFX:H0 ≡ (1)

- 00 :H θ=θ (2)

Soit on conservera l’hypothèse 0H , soit on la rejettera.

Les risques d’erreurs encourus par l’observateur peuvent alors être définis par :

• α : risque de première espèce : décider à tort que 0H est fausse. Sa probabilité s’écrit :

α = Prob[décider que 1H est vraie / 0H vraie] ou

α = Prob[rejeter 0H / 0H vraie]

α est fixé, souvent à 5%.

Page 2: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 2/42

• β : risque de deuxième espèce : décider à tort que 0H est vraie. Sa probabilité s’écrit :

β = Prob[décider que 0H est vraie / 1H vraie]

Il convient de noter que par un abus de langage, le risque et sa mesure sont confondus dans la pratique courante. Par exemple, l’expression « risque de première espèce » est utilisée à la place de « probabilité du risque de première espèce ».

Synthèse :

Décision

Décider 0H vraie Décider 1H vraie

0H α Etat de nature

1H β

2. Efficacité d’un test

Les deux cases vides du tableau précédent correspondent aux prababilités complémentaires à 1 de α et de β, mais ne traduisent pas des risques puisque dans les deux cas il n’y a pas d’erreur de décision. Dans celle de la première ligne, s’inscrirait la probabilité de retenir 0H quand celle-ci est vraie, cette probabilité doit être normalement élevée. En revanche, dans la case vide de la deuxième ligne se trouverait l’expression :

1 - β = 1 – Prob[décider 0H vraie / 1H vraie] = Prob[décider 1H vraie / 1H vraie]

c’est-à-dire la probabilité de rejeter l’hypothèse 0H quand elle fausse. Cette dernière probabilité est retenue comme caractéristique de la perfirmande d’un test d’hypothèses.

La puissance d’un test, notée η, est la probabilité de rejeter l’hypothèse 0H quand celle-ci n’est

pas vraie ; elle est égale à η = 1 - β où β est le risque de deuxième espèce.

La puissance d’un test est la mesure de l’efficacité de ce test. Elle est comparable à la précision dans le cas d’un instrument de mesure. Il devient évident qu’un test est considéré d’autant plus précis (par rapport à l’adéquation entre 0H et l’observation) que sa puissance est plus grande.

3. Elaboration d’une règle de décision

La démarche qui conduit à la prise de décision s’effectue en deux étapes. La première consiste à définir ex ante (avant tirage de l’échantillon) une statistique d’échantillonnage et une zone de rejet de l’hypothèse 0H pour un risque d’erreur donné, puis à élaborer une règle de décision. La deuxième étape s’accomplit ex post : une déicison est prise au vu d’une valeur particulière de la statistique retenue, conformément à la règle précédemment proposée.

3.1. Fonction discriminante

Etant donné un test d’hypothèses, la fonction discriminante ∆ est la statistique d’échantillonnage utilisée pour décider de l’acceptation ou du rejet de l’hypothèse 0H d’un test, celle-ci étant choisie en fonction de la caractéristique objet de ce test. La fonction discriminante retenue pour un test d’hypothèses doit être de loi de probabilité connue, lorsque l’hypothèse

0H d’un test s’exprime à l’aide d’une caractéristique θ d’une loi de probabilité.

Par exemple, 0H : « θ prend la valeur 0θ » (θ pouvant être aussi bien une moyenne qu’une variance ou une proportion). La fonction discriminante du test est en général un estimateur de la caractéristique (possédant les principales propriétés requises d’un bon estimateur) et sa loi de probabilité dépend donc de θ.

Page 3: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 3/42

3.2. Région critique

La région critique R d’un test d’hypothèses de fonction discriminante ∆ est l’ensemble des valeurs de ∆ qui induisent au rejet de l’hypothèse 0H avec un risque d’erreur donné. Cette nouvelle définition permet d’exprimer les décisions en termes de variables aléatoires. Les événements « décider que 1H est vraie » et « décider que 0H est vraie » se traduisent

respectivement par les événements : « ∆ n’appartient pas à R » et « ∆ appartient à R’ », R étant un intervalle de la droite des réels dont la forme (fermé, semi ouvert) et les bornes sont à préciser.

Le calcul des bornes de la région critique passe par l’expression des risques α et β en fonction de R, c’est-à-dire :

[ ]vraieH/CobPr 0≥∆=α

[ ]vraieH/CobPr 1<∆=β avec C : seuil critique.

3.3. Décision

Tous les éléments sont à présent réunis pour mettre au point une règle de décision. Cette dernière peut s’énoncer ex ante (avant tirage de l’échantillon) de la manière suivante : ne pas accepter l’hypothèse 0H au risque d’erreur α, si la valeur particulière de la fonction

discriminante ∆ (qui est une variable aléatoire) dans l’échantillon qui sera prélevé ultérieurement appartient à la région critique. Ainsi, il ne reste plus qu’à prendre la décision finale au vu de l’échantillon particulier. L’échantillon en présence conduit à cette conclusion, mais un autre échantillon peut très bien entraîner une décision contraire. On dira : j’accepte ou je refuse l’hypothèse 0H au risque de α% et compte tenu de l’information à ma disposition.

4. Typologie des tests d’hypothèses

4.1. Tests non paramétriques

Un test est dit non paramétrique lorsque l’état de nature exprimé par les hypohtèses est formulé en termes qualitatifs. Deux genres de tests non paramétriques seront présentés (appelés aussi tests de concordance).

• Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de la population.

• Test d’indépendance : ici l’échantillon est assimilé à un tableau d’effectif ou de contingence croisant deux caractères associés à chaque individu observé.

4.2. Tests paramétriques

• Tests de signification d’un paramètre :

00 :H θ=θ (m, σ, p)

• Tests de comparaison ou d’égalité de deux paramètres :

210 :H θ=θ (deux populations)

Page 4: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 4/42

5. Synthèse : démarche à suivre pour construire un test d’hypothèses

Niveau population

• Enoncer les hypothèses 0H et 1H

• Préciser les hypothèses de travail : loi de la variable dans la population…

Niveau échantillon ex ante

• Trouver une forme discriminante et proposer en la justifiant une forme de la région critique.

• Spécifier la loi de probabilité de la fonction discriminante dans le cadre de l’hypothèse 0H .

• Calculer la frontière de la région critique, étant donné un risque de première espèce α.

Niveau échantillon ex post

• Décider au vu de la valeur prise par la fonction discriminante dans l’échantillon particulier ⇒ formuler une règle de décision : Si valeur ∈ R, 0H rejetée

Si valeur ∉ R, 0H acceptée.

Unité 2 : Test du χ2

1. Test d’adéquation

1.1. Données du problème

Soit un échantillon aléatoire de taille n prélevé dans une population à laquelle est associée une variable aléatoire X. Un tableau des effectifs (fréquences absolues) est construit en regroupant les observations en k classes qui sont suivant le cas, soit des intervalles de valeurs (des classes), soit des valeurs entières uniques de la variable aléatoire X.

Classes Effectifs Effectifs

[ [10 e,e 1n 1x 1n

M M M M

[ [i1i e,e−

in ix in

M M M M

[ [k1k e,e−

kn nx kn

n n

La loi de la variable aléatoire X est soit :

- parfaitement déterminée,

- non parfaitement déterminée.

Les ix sont-elles les images de X ?

1.2. Construction du test

La démarche analytique est comparable à celle retenue pour la théorie de l’estimation. Le modèle théorique se situe ex ante, c’est-à-dire avant tirage. Ultérieurement, le prélévement d’un échantillon permettra d’accepter ou de refuser l’hypothèse 0H avec, bien entendu, un risque d’erreur toutefois mesurable.

Page 5: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 5/42

1.2.1. La formulation de l’hypothèse 0H

Soit une population à laquelle est associée une variable X liée à un paramètre θ et dont la loi de probabilité est notée L(θ). La question que l’on se pose est la suivante : les observations ix

sont-elles adéquates au modèle. On fait l’hypothèse 0H selon laquelle )(LX θ≡ (par exemple

)6;m(NX ≡ ou )(PX λ≡ avec m, σ, λ calculés sur les échantillons).

En posant comme vraie cette hypothèse, on peut calculer les probabilités ip rattachées à chaque classe i de la manière suivante :

� X : variable aléatoire continue

[ ]i1ii eXeobPrp <<=−

� X : variable aléatoire discrète

[ ]ii xXobPrp ==

Classes Effectifs Fréquences relatives if

Si 0H vraie

ip ∑= ii pF

[ [10 e,e 1n 1f 1p

M M M M

[ [i1i e,e−

in

nn

f ii = ip

M M M M

[ [k1k e,e−

kn

nn

f kk = kp

n 1f

k

1ii =∑

=

• soit lues dans les tables, dans le cas des variables aléatoires discrètes,

• soit calculés, dans le cas des variables aléatoires continues.

Il faut centrer et réduire les bornes des classes : ( )σ≡ ,mNX

[ ]

σ−<<σ

−=<< −

mpU

mePeXeP i1i

i1i )1;0(NU ≡

[ ] ( ) ( ) i1iii1i PuFuFuUuP =−=<<−−

1.2.2. La fonction discriminante

Les données en présence sont :

- Un échantillon aléatoire de taille n qui sera prélevé, l’effectif total de cet échantillon est réparti au hasard sur les k classes formant ainsi le tableau des effectifs observés notés in pour la classe i.

- Les probabilités ip qui sont calculées sur la base de l’hypothèse 0H (et à la suite d’un découpage de l’intervalle des valeurs possibles conformément aux classes du tableau de l’échantillon).

Page 6: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 6/42

L’adéquation entre l’hypothèse 0H ( )(LX θ≡ ) et l’observation est mesurée par la « distance » entre la distribution empirique et la distribution théorique, c’est-à-dire par une fonction des écarts entre in et inp . La fonction retenue est la suivante :

N.B. L’échantillon à prélever étant de taille n et les individus répartis au hasard entre les classes, l’effectif in de la classe i est une variable binomiale.

( )∑=

−k

1i i

2ii

npnpn

C’est une statistique d’échantillonnage puisque les in sont des variables aléatoires associées à l’échantillon qui sera prélevé. Elle est retenue comme fonction discriminante du test de l’adéquation d’une distribution empirique à un modèle théorique.

Karl Pearson a demontré, en cherchant la limite de la loi multinomiale, que :

( ) ( )1rknp

npn 2vraieHsi

n

k

1i i

2ii

0−−χ→−

∞→=∑

avec r : nombre de paramètres à estimer, k : nombre de classes,

in : effectifs observés,

inp : effectifs théoriques.

( )2f χ

α fixé (en principe 5%)

si aucun paramètre n’est à estimer

on a )1k(2 −χ , cas où la loi est parfaitement déterminée.

21 α−χ )1k(2 −χ

1.2.3. La région critique

Dans la relation précédente, la variable du 2χ mesure la distance « entre les effectifs observés et les effectifs théoriques. Une grande valeur de cette variable est symptomatique de la non concordance entre la distribution observée et le modèle théorique. En conséquent, il existe un seuil c au-delà duquel l’hypothèse 0H ne peut pas être retenue.

α = Prob[rejeter 0H / 0H vraie] : risque de première espèce

[ ]21

2oobPr α−χ>χ=α avec

( )∑=

−=χk

1i i

2ii2

o npnpn

1.2.4. La règle de décision

Si )12k(21

2o −−χ≥χ α− rejet de 0H au risque de première espèce α%.

Si )12k(21

2o −−χ<χ α− 0H acceptée au risque de première espèce α%.

α−1 α

Page 7: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 7/42

1.3. Considérations pratiques

Remarque : ce test s’applique à des données en classes. Il est asymptotique (n → ∞).

Si 0H : xx FF →′

Classes Effectifs Si 0H vraie

ip inp ( )2ii npn − ( )

i

2ii

npnpn −

[ [10 e,e 1n 1p 1np ( )211 npn −

M M M

[ [i1i e,e−

in ip inp ( )2ii npn − ( )i

2ii

npnpn −

M M M

[ [k1k e,e−

kn kp knp ( )2kk npn −

n 1 n ( )∑=

−=χk

1i i

2ii2

o npnpn

Simplification :

( ) ∑ ∑∑∑∑∑ +−=−+=−+

=−=χ=

nn2np

nn2np

np

n

np

npn2pnn

npnpn

i

2i

iii

2i

i

ii2i

22i

k

1i i

2ii2

o

nnp

nk

1i i

2i2

o −=χ ∑=

On peut donc calculer

−=χ ∑=

1pn

nn

k

1i i2

2i2

o

Regroupement des classes :

Si on a des classes de très faibles probabilités ( ip petits donc inp petits), on regroupe les

classes entre elles : en effet, on rique de voir 2oχ augmenter artificiellement et on risque de

rejeter 0H .

Pour éviter ce risque, on regroupe les classes lorsque les valeurs de inp et in sont trop

petites. En pratique, si inp est inférieur à 5.

S’il y a regroupement de classes, le degré de liberté du 2χ change et devient s – r – 1, avec s nombre de classes après regroupement.

Remarque : Le 2χ peut être considéré comme une méthode d’estimation : on l’appelle

méthode du 2χ minimum.

2. Test d’indépendance

On veut tester l’indépendance éventuelle de deux caractères attachés à chaque individu d’une même population.

Page 8: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 8/42

Dans ce cas, les deux distributions d’effectifs sont transcrites sous forme de tableaux à double entrée (ou tableaux de contingence), la distribution empirique résultant de l’observation et la distribution théorique étant déterminée à partir des fréquences… ?

2.1. Données du problème

Soit un échantillon aléatoire de taille n issu d’une population dont les individus possèdent deux caractères A et B (qualitatifs ou rendus tels). Le tableau des effectifs qui est construit se présente sous la forme suivante :

B

A 1B jB kB .in

1A 11n … j1n … k1n .1n

M

iA 1in … ijn … 1in .in

M

pA 1pn … pjn … pkn .pn

j.n 1.n … j.n … k.n n

ijn individus possèdent à la fois les deux modalités iA et jB ,

.in individus possèdent la modalité iA (∀ la modalité de B),

j.n individus possèdente la modalité jB (∀ la modalité de A).

2.2. Construction du test

2.2.1. Formulation de l’hypothèse

La condition d’indépendance entre les deux caractères A et B est exprimée par l’hypothèse :

0H : A et B indépendants

A possède p modalités : 1A … pA

B possède k modalités : 1B … kB

Sur chaque individu, on note la valeur du caractère A et celle du caractère B : { }ji b,a

2.2.2. Fonction discriminante

L’effectif total n de l’échantillon à prélever sera réparti au hasard dans les cellules d’un tableau à double entrée.

L’effectif ijn des individus possédant la modalité iA et jB est une variable aléatoire quels que

soient i et j.

On forme la fonction discriminante :

( )∑∑= =

−=χ

p

1i

k

1j ij

2ijij2

o np

npn

ijn représente les effectifs observés,

Page 9: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 9/42

ijnp les effectifs théoriques correspondant au cas de l’indépendance.

Sous l’hypothèse 0H , 2oχ suit approximativement une loi du 2χ

( ) ( )1rpknp

npn 2Hsi

n

p

1i

k

1j ij

2ijij2

o

0

−−χ−

=χ →∑∑∞→= =

avec r nombre de paramètres.

[ ] { }jijiij b,aIBAIobPrp =∩∈=

j..i

Hsi

ij pPp0

×=

B

A 1B … jB … kB .in

1A .1p

M

iA .ip

M

pA

j..iij pPp ×=

.pp

j.p 1.p … j.p … k.p 1

Recherche du nombre de paramètres à estimer :

.ip → à estimer p – 1

j.p → à estimer k – 1

Recherche du degré de liberté :

(pk – r- 1) = pk – p – k + 2 – 1

= pk – p – k + 1

= k (p - 1) - (p - 1)

=(p - 1) (k - 1)

nn

p .i.i =

nn

p J.j. =

p + k -2

Page 10: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 10/42

( ) ( )

( )

+−=

+−=

+−=

=

−−=χ

∑∑

∑∑ ∑∑ ∑∑

∑∑ ∑∑∑∑

∑∑

∑∑∑∑

= =

= = = = ==

= = = == =

= =

= == =

p

1i

k

1j j..i

2ij

p

1i

k

1j

p

1i

k

1j

k

1j

p

1i.i2ij

j..i

2ij

p

1i

k

1j

p

1i

k

1j j..i2

2j.

2.i

j..i

j..iijp

1i

k

1j j..i

2ij

p

1i

k

1j j..i

2j..i

ij

p

1i

k

1j j..i

2j..iij

p

1i

k

1j ij

2ijij2

o

12nn

nn

j.nnn

1n

n2

nn

nn

nnn

nn

nnn

nnn2

nn

nn

n

n

nn

n

n

n

nn

nn

pnp

pnpn

np

npn

( )( )1k1p1nn

nn 2

Hsi

n

p

1i

k

1j j..i

2ij2

o0 −−χ→

−=χ∞→= =

∑∑

2.2.3. Région critique et règle de décision

( )2f χ

21 α−χ ( ) )1k(1p2 −−χ

Si 21

2o α−χ≥χ rejet de 0H au risque de première espèce α%.

Si 21

2o α−χ<χ 0H acceptée au risque de première espèce α%.

2.3. Considérations pratiques

Dans les cases du tableau de contingence, mettre :

ijj..i

2ij cnn

n=

−=χ ∑∑= =

p

1i

k

1jij

2o 1cn

2oχ est toujours positif.

α−1 α

Page 11: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 11/42

2.4. Test d’homogénéité

On a un ensemble d’échantillons k21 EEE LL relatifs à des observations sur un caractère A.

A, caractère observé , possède p modalités.

E

A 1E … jE … kE .in

1A .1n

M

iA .in

M

pA

ijn

.pn

j.n j.n n

ijn : nombre d’observations de ij AE ∈

Question : peut-on considérer que tous les échantillons sont issus de la même population ?

Si oui, on dira qu’il y a homogénéité dans la population.

Si non, on dira qu’il y a hétérogénéité dans la population.

Y a-t-il homogénéité entre échantillons vis à vis de A ?

0H : homogénéité entre échantillon.

Cette hypothèse revient à teste :

0H : indépendance entre A et l’appartenance à un échantillon.

( )( )1k1p1nn

nn 2

Hsi

n

p

1i

k

1j j..i

2ij2

o0 −−χ→

−=χ∞→= =

∑∑

A 1E … jE … kE

1A 11n j1n k1n .1n

M

iA 1in ijn ikn .in nn

p

1i

k

1jij =∑∑

= =

M

pA 1pn pjn pkn .pn

1.n … j.n … k.n n

Page 12: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 12/42

( )2f χ

21 α−χ ( ) )1k(1p2 −−χ

Règle de décision :

Si 21

2o α−χ≥χ rejet de 0H au risque de première espèce α%.

Si 21

2o α−χ<χ 0H acceptée au risque de première espèce α%.

( )

=β=α

vraieH

fausseH/HaccepterobPr

vraieH/HrejeterobPr

1

00

00

Unité 3 : Test paramètriques

Il existe deux types de tests paramètriques :

- les tests de signification des paramètres,

- les tests de comparaison des paramètres.

1. Test de signification des paramètres

1.1. Problématique

Population : )(LX θ≡ θ paramètre inconnu

⇓ L loi connue

00 :H θ=θ hypothèse à tester

11 :H θ=θ hypothèse alternative

Echantillons possibles � Fonction discriminante

Région critique

Règle de décision : soit on conserve 0H , soit on la rejette.

Echantillon particulier � Valeur particulière de θ

α−1 α

Page 13: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 13/42

Soit une population dont un paramètre θ est inconnu et un estimateur θ de θ défini à partir de tous les échantillons de taille n. La donnée d’un échantillon particulier et donc d’une valeur

particulière de θ permettra de déterminer un intervalle de confiance de θ qui reste malgré tout inconnu.

Le test de signification d’un paramètre consiste à poser a priori le entre deux valeurs numériques pour θ ou encore le choix entre une valeur précise et un ensemble du type « plus grand que » ; « plus petit que » ou « différent de ».

Dans le premier cas, il s’agit de tester une hypothèse 0H simple contre une hypothèse

antagoniste 1H simple aussi ; dans le second, c’est une hypothèse 0H simple qui est opposée

à 1H composite.

( )( )

=β=α

vraieH/HaccepterobPr

vraieH/HrejeterobPr

10

00

1.2. Test de signification de la moyenne d’une loi normale lorsque la variance est connue

);m(NX σ≡ σ connu, m ?

( )n0 xx L échantillon de X.

• si n est petit, il faut être certain de l’hypothèse de normalité.

);m(NX σ≡

• si n est grand : utilisation de l’approximation noramle :

∑ ∑ ∑

σ→ 2iii ;mNindX

100 mm/mm:H ==

On cherche sur l’échantillon un estimateur de m : X

n;m(NX σ≡

)1,0(N

n

mX≡

σ

( )uf

1uα

21u α− u

α−1 α2

α1

Page 14: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 14/42

si 0H vraie )1,0(N

n

mX 0 ≡σ

−<=α− α−α 21 10 u

n

mXuobPr1

σ+<<σ+=α− α−α numX

numobPr1

21 100

σ+σ+∈=α− α−α num;

numXobPr1

21 100

Règle de décision :

σ+σ+∉

σ+σ+∈

α−α

α−α

rejetéeHn

um;n

umXsi

acceptéeHn

um;n

umXsi

0100

0100

21

21

α risque de première espèce : ( )vraieH/HrejeterobPr 00=α 00 mm:H =

( )vraieH/HaccepterobPr 10=β 11 mm:H =

=

σ+σ+∈=β α−α 1100 mm/n

um;n

umXobPr21

Si 1H : n;m(NX 1 σ≡

)1,0(N

n

mX 1 ≡σ

[ ]

σ−−

σ−=

σ−<σ

−<σ−=

=<<=β

n

maF

n

mbF

n

mb

n

1X

n

maobPr

mm/bXaobPr

11

11

1

Rappel : η=β−1 puissance du test

[ ]vraieH/HrejeterobPr1 10=β−

Courbe d’efficacité du test : ( ){ }1mβ , variation de β en fonction de 1m

Courbe de puissance : ( ){ }1mη

Page 15: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 15/42

� Intervalle bilatéral symétrique : 221 α=α=α

( )uf

2/uα 2/1u α− u

01100 mm:H/mm:H ≠=

−<=α− α−α 2/10

2/ u

n

mXuobPr1

Règle de décision :

σ±∉

σ±∈

α−

α−

rejetéeHn

umXsi

acceptéeHn

umXsi

02/10

02/10

� Intervalle unilatéral à droite : α=α=α 21 0

( )uf

α−1u u

01100 mm:H/mm:H >=

α−1 α/2

α/2

α−1 α

Page 16: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 16/42

+σ<=

−=α−

α−

α−

01

10

mn

uXobPr

u

n

mXobPr1

Règle de décision :

+σ≥+σ<

α−

α−

rejetéeHmn

uXsi

acceptéeHmn

uXsi

001

001

Ici

[ ]

=+σ≥==α

α− 001

00

mm/mn

uXobPr

vraieH/HrejeterobPr

� Intervalle unilatéral à gauche : 021 =αα=α

( )uf

αu u

01100 mm:H/mm:H <=

+σ>=

−=α−

α

α

0

0

mn

uXobPr

u

n

mXobPr1

Règle de décision :

+σ≤+σ>

α

α

rejetéeHmn

uXsi

acceptéeHmn

uXsi

00

00

1.3. Test de signification de la moyenne d’une loi normale lorsque la variance est inconnue

);m(NX σ≡ σ inconnu, m ?

n;m(NX σ≡ on prend un échantillon de taille n.

α−1

α

Page 17: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 17/42

Utilisation de la loi de Student :

( )n

smX

1nT

1ns

mX −≡−≡

− ( )

−χ≡σ 1nns 2

2

2

( )∑ −=2

i2 XX

n1

s ( )∑ −−

=2

i2 XX

1n1

s

( ))1n(Tf −

1tα

21t α− T(n-1)

100 mm/mm:H ==

<

−−<=α− α−α 21 1

0 t

1ns

mXtobPr1

−+<<−+=α− α−α 1n

stmX1n

stmobPr121 100

Règle de décision :

−+−+∉

−+−+∈

α−α

α−α

rejetéeH1n

stm;1n

stmXsi

acceptéeH1n

sum;1n

stmXsi

0100

0100

21

21

( )vraieH/HaccepterobPr 10=β 11 mm:H =

=

−+−+∈=β α−α 1

b

10

a

0 mm/1n

stm;1n

stmXobPr21

444 3444 21444 3444 21

Si )1n(T

1ns

mX:H 1

1 −≡

α−1

α1 α2

α1+α2=α

Page 18: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 18/42

−−−

−−=

−−<

−−<

−−=β

1ns

maF

1ns

mbF

1ns

mb

1ns

mX

1ns

maobPr

11

111

Fonction de répartition de la loi de Student

Si n-1>30, T(n-1)≡N(0,1)

Si n-1<30, tables de la fonction de répartition de T(n-1).

� Intervalle bilatéral symétrique : 2/21 α=α=α

( )Tf

2/tα 2/1t α− T(n-1)

01100 mm:H/mm:H ≠=

−+<<−+=

<

−−<=α−

α−α

α−α

1nstmX

1nstmobPr

t

1ns

mXtobPr1

2/102/0

2/10

2/

Règle de décision :

−±∉

−±∈

α

α

rejetéeH1n

stmXsi

acceptéeH1n

stmXsi

02/0

02/0

α−1 α/2

α/2

Page 19: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 19/42

� Intervalle unilatéral à droite : α=α=α 21 0

( )Tf

α−1t T(n-1)

01100 mm:H/mm:H >=

+−<=

<

−−=α−

α−

α−

01

10

m1n

stXobPr

t

1ns

mXobPr1

Règle de décision :

+−≥+−<

α−

α−

rejetéeHm1n

stXsi

acceptéeHm1n

stXsi

001

001

� Intervalle unilatéral à gauche : 021 =αα=α

( )Tf

αt T(n-1)

01100 mm:H/mm:H <=

α−1 α

α−1

α

Page 20: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 20/42

+−>=

>

−−=α−

α

α

0

0

m1n

stXobPr

t

1ns

mXobPr1

Règle de décision :

+−≤+−>

α

α

rejetéeHm1n

stXsi

acceptéeHm1n

stXsi

00

00

1.4. Test de signification de la variance d’une loi normale

);m(NX σ≡ 2σ ?

21

220

20 /:H σ=σσ=σ

On prend un échantillon de taille n.

)1n(ns 2

2

2−χ≡

σ

( )2f χ

12αχ 21

2α−χ )1n(2 −χ

χ<σ<χ=α−

α−α212

22

21

nsobPr1

Si

χ<σ<χ=α−

α−α212

0

22

021

nsobPr1:H

σχ<<σχ=α−α−α nsnobPr1

202

12

202

21

α−1

α1 α2

α1+α2=α

Page 21: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 21/42

Règle de décision :

σχσχ∉

σχσχ∈

α−α

α−α

rejetéeHn;nssi

acceptéeHn;nssi

0

202

1

2022

0

202

1

2022

21

21

( )vraieH/HaccepterobPr 10=β

σ=σ

σχ<<σχ=βα−α

21

2

b

202

12

a

202 /nsnobPr

214342143421

Si )1n(ns

:H 221

2

1 −χ≡σ

σ−

σ=

σ<σ<σ=β

21

21

21

21

2

21

anF

bnF

nb

nsnaobPr

Fonction de répartition de )1n(2 −χ

� Intervalle bilatéral symétrique :

( )2f χ

12αχ 21

2α−χ )1n(2 −χ

20

211

20

20 :H/:H σ≠σσ=σ

χ<σ<χ=α− α−α

22/12

22

2/ns

obPr1

Si

χ<σ<χ=α− α−α

22/12

0

22

2/0ns

obPr1:H

σχ<<σχ=α− α−α nsnobPr1202

2/12

202

2/

α−1

α/2 α/2

α1+α2=α/2

Page 22: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 22/42

Règle de décision :

σχσχ∉

σχσχ∈

α−α

α−α

rejetéeHn;nssi

acceptéeHn;nssi

0

202

2/1

202

2/2

0

202

2/1

202

2/2

� Intervalle unilatéral à gauche : 021 =αα=α

( )2f χ

αχ2 )1n(2 −χ

20

211

20

20 :H/:H σ<σσ=σ

[ ])1n(obPr1 22 −χ<χ=α− α

Si

σ<χ=α− α 20

22

0ns

obPr1:H

σχ>=α− α nsobPr12022

Règle de décision :

σχ≤

σχ>α

α

rejetéeHnssi

acceptéeHnssi

0

2022

0

2022

α−1

α

Page 23: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 23/42

� Intervalle unilatéral à droite : α=α=α 21 0

( )2f χ

21 α−χ )1n(2 −χ

20

211

20

20 :H/:H σ>σσ=σ

Si

χ<σ=α− α−

212

0

2

0ns

obPr1:H

σχ<=α− α− nsobPr1202

12

Règle de décision :

σχ≥

σχ<α−

α−

rejetéeHnssi

acceptéeHnssi

0

202

12

0

202

12

1.5. Test de signification d’une proportion

100 pp/pp:H ==

Soit X une variable aléatoire. Soient deux modalités dans une population :

p1q)A(pA

p)A(pA

−==→

=→

Un échantillon est tiré dans la population. La variable X associée au tirage d’un individu est une variable de Bernouilli. La variable Y associée au tirage de n individus est une variable binomiale (nombre de fois où A se produit).

( )npq,npN)p,n(BY L→≡

→=

npq

,pNnY

f

• Si n est petit, si 0H vraie : ( )0p,nBY ≡ , lecture dans la table de la loi binomiale.

• Si n est grand, si 0H vraie : ( )000 qnp,npNY →

α−1

α

Page 24: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 24/42

→=

nqp

,pNnY

f 000

Si )1,0(N

nqp

pf:H

00

00 ≡

( )uf

1uα

21u α− u

+<<+=

<−<=α−

α−α

α−α

nqp

upfnqp

upobPr

u

nqp

pfuobPr1

0010

000

100

0

21

21

Règle de décision :

++∉

++∈

α−α

α−α

rejetéeHnqp

up;nqp

upfsi

acceptéeHnqp

up;nqp

upfsi

000

1000

0

000

1000

0

21

21

� Intervalle bilatéral symétrique : 221 α=α=α

( )uf

2/uα 2/1u α− u

α−1 α2

α1

α1+α2=α

α−1 α/2

α/2

Page 25: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 25/42

01100 pp:H/pp:H ≠=

±∈=

<−<=α−

α

α−α

nqp

upfobPr

u

nqp

pfuobPr1

002/0

2/100

02/

Règle de décision :

±∉

±∈

α

α

rejetéeHnqp

upfsi

acceptéeHnqp

upfsi

000

2/0

000

2/0

� Intervalle unilatéral à gauche : 021 =αα=α

( )uf

αu u

01100 pp:H/pp:H <=

+>=

>−=α−

α

α

nqp

upfobPr

u

nqp

pfobPr1

000

00

0

Règle de décision :

+≤

+>

α

α

rejetéeHnqp

upfsi

acceptéeHnqp

upfsi

000

0

000

0

α−1

α

Page 26: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 26/42

� Intervalle unilatéral à droite : α=α=α 21 0

( )uf

α−1u u

01100 pp:H/pp:H >=

+<=

<−=α−

α−

α−

nqp

upfobPr

u

nqp

pfobPr1

0010

100

0

Règle de décision :

+≥

+<

α−

α−

rejetéeHnqp

upfsi

acceptéeHnqp

upfsi

000

10

000

10

2. Test de comparaison ou d’égalité des paramètres

2.1. Problématique

Soient deux populations :

( )( )22

11

LX

LX

θ≡θ≡

avec 21 et θθ inconnus.

210 :H θ=θ

Fonction discriminante

Région critique

Décision Echantillons particuliers

L’hypothèse 21 θ=θ peut être formulée sous la forme : 021 =θ−θ . Le test de comparaison de deux paramètres revient en un test de signification à zéro de la différence entre ces paramètres (ou signification à 1 du rapport des deux paramètres).

α−1 α

Page 27: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 27/42

2.2. Test de comparaison des moyennes de deux lois normales lorsque les variances sont connues

( )( )222

111

,mNX

,mNX

σ≡

σ≡

On tire deux échantillons de taille 1n et 2n dans ces deux populations.

• Si 21 n,n sont petits, formulation de l’hypothèse de normalité.

• Si 21 n,n sont grands, approximation par la loi normale.

0mmmm:H 21210 =−⇔=

λ=− 211 mm:H

σ≡

σ≡

2

222

1

111

n;mNX

n;mNX

( ) ( )

σ+σ−≡−

2

22

1

21

2121 nn;mmNXX

( ) ( ))1,0(N

nn

mmXX

2

22

1

21

2121 ≡σ

−−−

( )uf

1uα

21u α− u

Si ( )

<σ+σ−−<=α− α−α 21 1

2

22

1

21

210 u

nn

0XXuobPr1:H

( )

σ+σ<−<σ+σ=α− α−α 2

22

1

21

1212

22

1

21

nnuXX

nnuobPr1

21

α−1 α2

α1

α1+α2=α

Page 28: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 28/42

Règle de décision :

( )

( )

σ+σσ+σ∉−

σ+σσ+σ∈−

α−α

α−α

rejetéeHnn

u;nn

uXXsi

acceptéeHnn

u;nn

uXXsi

02

22

1

21

12

22

1

21

21

02

22

1

21

12

22

1

21

21

21

21

( )vraieH/HaccepterobPr 10=β

[ ]λ=−<−<=β 2121 mm/bXXaobPr

Si 1H vraie ( )

)1,0(N

nn

XX

2

22

1

21

21 ≡σ+σ

λ−−

( )

σ+σλ−<

σ+σλ−−<

σ+σλ−=β

2

22

1

21

2

22

1

21

21

2

22

1

21

nn

b

nn

XX

nn

aobPr

σ+σλ−−

σ+σλ−=β

2

22

1

21

2

22

1

21

nn

aF

nn

bF

( ){ }λβ courbe d’efficacité

( ){ }λη courbe de puissance β−=η 1

� Intervalle bilatéral symétrique: 221 α=α=α

( )uf

2/uα 2/1u α− u

α−1 α/2

α/2

Page 29: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 29/42

Si ( )

<σ+σ−−<=α− α−α 2/1

2

22

1

21

212/0 u

nn

0XXuobPr1:H

( )

σ+σ<−<σ+σ=α− α−α 2

22

1

21

2/1212

22

1

21

2/nn

uXXnn

uobPr1

Règle de décision :

( )

( )

σ+σ±∉−

σ+σ±∈−

α

α

rejetéeHnn

uXXsi

acceptéeHnn

uXXsi

02

22

1

21

2/21

02

22

1

21

2/21

� Intervalle unilatéral à gauche : 021 =αα=α

( )uf

αu u

21211

21210

mm0mm:H

0mmmm:H

<⇔<−

=−⇔=

Si ( )

>σ+σ

−=α− αu

nn

XXobPr1:H

2

22

1

21

210

( )

σ+σ>−=α− α 2

22

1

21

21nn

uXXobPr1

α−1

α

Page 30: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 30/42

Règle de décision :

( )( )

σ+σ≤−

σ+σ>−

α

α

rejetéeHnn

uXXsi

acceptéeHnn

uXXsi

02

22

1

21

21

02

22

1

21

21

� Intervalle unilatéral à droite : α=α=α 21 0

( )uf

α−1u u

21211

21210

mm0mm:H

0mmmm:H

>⇔>−

=−⇔=

Si ( )

<σ+σ

−=α− α−1

2

22

1

21

210 u

nn

XXobPr1:H

( )

σ+σ<−=α− α− 2

22

1

21

121nn

uXXobPr1

Règle de décision :

( )( )

σ+σ≥−

σ+σ<−

α−

α−

rejetéeHnn

uXXsi

acceptéeHnn

uXXsi

02

22

1

21

121

02

22

1

21

121

Interprétation des contre-hypothèses :

⇒≠ 211 mm:H la moyenne a-t-elle varié ?

⇒> 211 mm:H la moyenne a-t-elle diminué ?

⇒< 211 mm:H la moyenne a-t-elle augmenté ?

α−1 α

Page 31: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 31/42

2.3. Test de comparaison des moyennes de deux lois normales lorsque les variances sont inconnues

( )( )222

111

,mNX

,mNX

σ≡

σ≡ 21,σσ inconnus

0mmmm:H 21210 =−⇔=

λ=− 211 mm:H

( ) ( )

σ+σ−≡−

2

22

1

21

2121 nn;mmNXX

21,σσ inconnus, donc utilisation de la loi de Student. Il faut au préalable tester l’hypothèse 222

21σ=σ=σ (Cf. § suivant)

Remarque : si 22

21 σ≠σ , on ne peut pas utiliser le test de Student. On utilise alors les tables

statistiques de Darmois.

( ) ( ) ( )

2121

222

211

212121

n1

n1

2nnsnsn

mmXX2nnT

+−+

+

−−−≡−+

( )Tf

1tα

21t α− T

Si ( )

<+−+

+−−<=α− α−α 21 1

2121

222

211

210 t

n1

n1

2nnsnsn

0XXtobPr1:H

+−++<−<+−+

+=α− α−α2121

222

211

1212121

222

211

n1

n1

2nnsnsn

tXXn1

n1

2nnsnsn

tobPr121

α−1

α1 α2

α1+α2=α

Page 32: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 32/42

Règle de décision :

( )

( )

+−+++−+

+∉−

+−+++−+

+∈−

α−α

α−α

rejetéeHn1

n1

2nnsnsn

t;n1

n1

2nnsnsn

tXXsi

acceptéeHn1

n1

2nnsnsn

t;n1

n1

2nnsnsn

tXXsi

02121

222

211

12121

222

211

21

02121

222

211

12121

222

211

21

21

21

( )vraieH/HaccepterobPr 10=β

[ ]λ=−<−<=β 2121 mm/bXXaobPr

( )

+−++

λ−<+−+

+λ−−<

+−++

λ−=β2121

222

211

2121

222

211

21

2121

222

211

n1

n1

2nnsnsn

b

n1

n1

2nnsnsn

XX

n1

n1

2nnsnsn

aobPr

+−++

λ−−

+−++

λ−=β2121

222

211

2121

222

211

n1

n1

2nnsnsn

aF

n1

n1

2nnsnsn

bF

Fonction de répartition de ( )2nnT 21 −+

• Si →<−+ 302nn 21 lecture dans les tables de la fonction de répartition de la loi de Student.

• Si →>−+ 302nn 21 ( ) )1,0(N2nnT L21 →−+

� Intervalle bilatéral symétrique : 2/21 α=α=α

( )Tf

2/tα 2/1t α− T(n-1)

211210 mm:H/mm:H ≠=

α−1 α/2

α/2

Page 33: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 33/42

<+−+

+−<=α− α−α 2/1

2121

222

211

212/ t

n1

n1

2nnsnsn

XXtobPr1

Règle de décision :

( )

( )

+−++∉−

+−++∈−

α−

α−

rejetéeHn1

n1

2nnsnsn

tXXsi

acceptéeHn1

n1

2nnsnsn

tXXsi

02121

222

211

2/121

02121

222

211

2/121

� Intervalle unilatéral à droite : α=α=α 21 0

( )Tf

α−1t T

211210 mm:H/mm:H >=

( )

<+−+

+−=α− α−1

2121

222

211

21 t

n1

n1

2nnsnsn

XXobPr1

Règle de décision :

( )( )

+−++≥−

+−++<−

α−

α−

rejetéeHn1

n1

2nnsnsn

tXXsi

acceptéeHn1

n1

2nnsnsn

tXXsi

02121

222

211

121

02121

222

211

121

α−1 α

Page 34: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 34/42

� Intervalle unilatéral à gauche : 021 =αα=α

( )Tf

αt T

211210 mm:H/mm:H <=

( )

+−++

−<=α− α

2121

222

211

21

n1

n1

2nnsnsn

XXtobPr1

Règle de décision :

( )( )

+−++≤−

+−++>−

α

α

rejetéeHn1

n1

2nnsnsn

tXXsi

acceptéeHn1

n1

2nnsnsn

tXXsi

02121

222

211

21

02121

222

211

21

2.4. Test de comparaison des variances de deux lois normales

( )( )222

111

,mNX

,mNX

σ≡

σ≡ ?21 σ=σ

λ=σ−σ

=σσ⇔σ=σ

22

211

22

212

2210

:H

1:H

On tire dans la population 1 un échantillon de taille 1n , de moyenne 1X et d’écart-type 1S .

On tire dans la population 2 un échantillon de taille 2n , de moyenne 2X et d’écart-type 2S .

( )1n;1nFS

S

Sn

1n1n

Sn212

1

22

22

21

222

221

22

1

211 −−≡

σ

σ⋅=

−⋅

σ

σ⋅

Si ( )1n;1nFS

S:H 212

2

21

0 −−≡

α−1

α

Page 35: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 35/42

( )Ff

1Fα

21F α− )1n,1n(F 21 −−

Si

<<=α− α−α 21 12

2

21

0 FS

SFobPr1:H

Règle de décision :

( ) ( )[ ]( ) ( )[ ]

−−−−∉

−−−−∈

α−α

α−α

rejetéeH1n;1nF;1n;1nFS

Ssi

acceptéeH1n;1nF;1n;1nFS

Ssi

02112122

21

02112122

21

21

21

� Intervalle bilatéral symétrique :

( )Ff

1Fα

21F α− )1n;1n(F 21 −−

1:H/1:H22

21

122

21

0 ≠σ

σ=

σ

σ

Si

<<=α− α−α 2/12

2

21

2/0 FS

SFobPr1:H

α−1

α1 α2

α1+α2=α

α−1

α/2 α/2

α1+α2=α/2

Page 36: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 36/42

Règle de décision :

( ) ( )[ ]

( ) ( )[ ]

−−−−∉

−−−−∈

α−α

α−α

rejetéeH1n;1nF;1n;1nFS

Ssi

acceptéeH1n;1nF;1n;1nFS

Ssi

0212/1212/22

21

0212/1212/22

21

Attention à la lecture des tables de Fischer :

( ) ( )1n;1nF1

1n;1nF212/1

212/−−

=−−

α−α

� Intervalle unilatéral à droite : α=α=α 21 0

( )Ff

α−1F )1n;1n(F 21 −−

1:H/1:H22

21

122

2

01

σ=

σ

σ

Si

−−<=α− α− )1n;1n(FS

SobPr1:H 2112

2

21

0

Règle de décision :

• Si 1S

S22

21 >

−−≥

−−<

α−

α−

rejetéeH)1n;1n(FS

Ssi

acceptéeH)1n;1n(FS

Ssi

021122

21

021122

21

• Si 1S

S1

S

S21

22

22

21 >⇒<

( )1n;1nFS

S1212

1

22 −−≡ α−

α−1

α

Page 37: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 37/42

−−<

−−≥

α−

α−

acceptéeH)1n;1n(FS

Ssi

rejetéeH)1n;1n(FS

Ssi

012121

22

012121

22

� Intervalle unilatéral à gauche : 021 =αα=α

( )Ff

αF )1n;1n(F 21 −−

1:H/1:H22

21

122

2

01

σ=

σ

σ

Si

−−>=α− α )1n;1n(FS

SobPr1:H 212

2

21

0

Règle de décision :

• Si 1S

S22

21 >

−−≤

−−>

α

α

rejetéeH)1n;1n(FS

Ssi

acceptéeH)1n;1n(FS

Ssi

02122

21

02122

21

• Si 1S

S1

S

S21

22

22

21 >⇒<

( )1n;1nFS

S1212

1

22 −−≡ α−

−−>

−−≤

α

α

acceptéeH)1n;1n(FS

Ssi

rejetéeH)1n;1n(FS

Ssi

01221

22

01221

22

α−1

α

Page 38: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 38/42

2.5. Test de comparaison de deux proportions

Soit X1 une variable aléatoire. Soient deux modalités dans une population :

11

1

p1q)A(pA

p)A(pA

−==→

=→

Un échantillon est tiré dans la population. La variable X1 associée au tirage d’un individu est une variable de Bernouilli. La variable Y1 associée au tirage de n1 individus est une variable binomiale (nombre de fois où A se produit).

( )11111L

111 qpn,pnN)p,n(BY →≡

→=

1

111

1

1nqp

,pNnY

f

Soit X2 une variable aléatoire. Soient deux modalités dans une population :

22

2

p1q)B(pB

p)B(pB

−==→

=→

Un échantillon est tiré dans la population. La variable X2 associée au tirage d’un individu est une variable de Bernouilli. La variable Y2 associée au tirage de n2 individus est une variable binomiale (nombre de fois où B se produit).

( )22222L

222 qpn,pnN)p,n(BY →≡

→=

2

222

2

2nqp

,pNnY

f

λ=−=−⇔=

211

21210

pp:H

0pppp:H

+−→−

2

22

1

1121

L21 n

qpnqp

;ppNFF

Si ( )

)1,0(N

nqp

nqp

0FF:H

2

22

1

11

210 ≡

+

−−

( )uf

1uα

21u α− u

α−1 α2

α1

α1+α2=α

Page 39: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 39/42

+<−<+=

<

+−<=α−

α−α

α−α

2

22

1

11121

2

22

1

11

1

2

22

1

11

21

nqp

nqp

uFFnqp

nqp

uobPr

u

nqp

nqp

FFuobPr1

21

21

111

111

F1qq

Fpp

−=→

=→

222

222

F1qq

Fpp

−=→

=→

Or ici on teste F1q?qqq

Fp?ppp

21

21

−=→==

=→==

On prend pour variable aléatoire F :

21

21nnYY

F+

+=

L’estimateur F de p est égal à :

21

2211nn

FnFnF

+

+=

Si ( ) ( )

+−<−<

+−=α− α−α

21121

210 n

1n1

F1FuFFn1

n1

F1FuobPr1:H21

Utilisation de F et non pas de 1F et 2F

Règle de décision :

( ) ( )

( ) ( )

+−

+−∉−

+−

+−∈−

α−α

α−α

rejetéeHn1

n1

F1Fu;n1

n1

F1FuFFsi

acceptéeHn1

n1

F1Fu;n1

n1

F1FuFFsi

021

121

21

021

121

21

21

21

Interprétation de l’hypothèse 0H : différence non significative entre les fréquences relatives observées.

( )vraieH/HaccepterobPr 10=β

λ=−=−⇔=

211

21210

pp:H

0pppp:H

[ ]λ=−<−<=β 2121 pp/bFFaobPr

( ) ( ) ( ) ( )

+−−<

+−−−<

+−−=β

2

22

1

11

21

2

22

1

11

2121

2

22

1

11

21

nqp

nqp

ppba

nqp

nqp

ppFF

nqp

nqp

ppaobPr

Page 40: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 40/42

( ) ( )

+−−−

+−−=β

2

22

1

11

21

2

22

1

11

21

n

qp

n

qp

ppaF

n

qp

n

qp

ppbaF

111

111

F1qq

Fpp

−=→

=→

222

222

F1qq

Fpp

−=→

=→

On remplace 1p et 2p par leurs estimateurs.

� Intervalle bilatéral symétrique : 221 α=α=α

( )uf

2/uα 2/1u α− u

211210 pp:H/pp:H ≠=

Si ( )( )

<

+−

−−<=α− α−α 2/1

21

212/0 u

n1

n1

F1F

0FFuobPr1:H

Règle de décision :

( ) ( )

( ) ( )

+−±∉−

+−±∈−

α

α

rejetéeHn1

n1

F1FuFFsi

acceptéeHn1

n1

F1FuFFsi

021

2/21

021

2/21

α−1 α/2

α/2

Page 41: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 41/42

� Intervalle unilatéral à droite : α=α=α 21 0

( )uf

α−1u u

211210 pp:H/pp:H >=

( )( )

( ) ( )

+−<−=

<

+−

−−=α−

α−

α−

21121

1

21

21

n1

n1

F1FuFFobPr

u

n1

n1

F1F

0FFobPr1

Règle de décision :

( ) ( )

( ) ( )

+−≥−

+−<−

α−

α−

rejetéeHn1

n1

F1FuFFsi

acceptéeHn1

n1

F1FuFFsi

021

121

021

121

� Intervalle unilatéral à gauche : 021 =αα=α

( )uf

αu u

211210 pp:H/pp:H <=

α−1 α

α−1

α

Page 42: MODULE 3 : Construction d’un test d’hypothèses · tests de concordance). • Test d’adéquation entre la distribution observée ou empirique et la distribution théorique de

Echantillonnage M3

EchMod3 42/42

( )( )

( ) ( )

+−>−=

>

+−

−−=α−

α

α

2121

21

21

n1

n1

F1FuFFobPr

u

n1

n1

F1F

0FFobPr1

Règle de décision :

( ) ( )

( ) ( )

+−≤−

+−>−

α

α

rejetéeHn1

n1

F1FuFFsi

acceptéeHn1

n1

F1FuFFsi

021

21

021

21