les tests statistiques en pratique : comparaison de … › c4x › upsud › 42001s02 › asset ›...

14
Pr. Bruno Falissard Les tests statistiques en pratique : c omparaison de deux moyennes Introduction à la statistique avec R Chapitre 11

Upload: others

Post on 04-Jul-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Les tests statistiques en pratique :comparaison de deux moyennes

Introduction à la statistique avec R

Chapitre 11

Page 2: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Introduction à la statistique avec R > Comparaison de 2 moyennes

Le test t de Student

• Comparer deux moyennes avec un test t de

Student

Page 3: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Introduction à la statistique avec R > Comparaison de 2 moyennes

Le test t de Student

• Comparer deux moyennes avec un test t de

Student

• Conditions de validité :

– n > 30 ou distribution normale, en fait ces deux

conditions sont à considérer ensemble

– Variances égales (sinon approximation de Welch)

Page 4: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Introduction à la statistique avec R > Comparaison de 2 moyennes

Le test t de Student

Existe-t-il, en moyenne, une différence

significative d’âge entre les détenus ayant un

haut niveau d’évitement du danger et les

autres ?

Page 5: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student : normalité de la variable

age

Fre

qu

en

cy

20 30 40 50 60 70 80

02

04

06

08

01

00

12

0

Introduction à la statistique avec R > Comparaison de 2 moyennes

> hist(smp.c$age)

Page 6: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student : normalité de la variable

Introduction à la statistique avec R > Comparaison de 2 moyennes

• L’inspection visuelle de l’histogramme est

informative, mais pas très rigoureuse

Page 7: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student : normalité de la variable

Introduction à la statistique avec R > Comparaison de 2 moyennes

• L’inspection visuelle de l’histogramme est

informative, mais pas très rigoureuse

• Tester la normalité de la variable ?

– Ces tests existent

– Mais ils ne répondent pas à la question !

– Les tests de normalité sont fait pour affirmer qu’une

distribution n’est pas normale, et pas le contraire…

Page 8: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student : normalité de la variable

-3 -2 -1 0 1 2 3

20

30

40

50

60

70

80

Normal Q-Q Plot

Theoretical Quantiles

Sa

mp

le Q

ua

ntile

s

> qqnorm(smp.c$age); qqline(smp.c$age)

Introduction à la statistique avec R > Comparaison de 2 moyennes

Page 9: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student : égalité des variances

Introduction à la statistique avec R > Comparaison de 2 moyennes

> by(smp.c$age, smp.c$ed.b, sd, na.rm=TRUE)

smp.c$ed.b: 0

[1] 13.38593

-------------------------------------------

smp.c$ed.b: 1

[1] 13.29636

Page 10: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student

Introduction à la statistique avec R > Comparaison de 2 moyennes

> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)

Two Sample t-test

data: smp.c$age by smp.c$ed.b

t = 1.7142, df = 690, p-value = 0.08694

alternative hypothesis: true difference in means is not equal

to 0

95 percent confidence interval:

-0.2710524 4.0005138

sample estimates:

mean in group 0 mean in group 1

39.46383 37.59910

Page 11: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student

Introduction à la statistique avec R > Comparaison de 2 moyennes

> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)

Two Sample t-test

data: smp.c$age by smp.c$ed.b

t = 1.7142, df = 690, p-value = 0.08694

alternative hypothesis: true difference in means is not equal

to 0

95 percent confidence interval:

-0.2710524 4.0005138

sample estimates:

mean in group 0 mean in group 1

39.46383 37.59910

Page 12: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Test t de Student

Introduction à la statistique avec R > Comparaison de 2 moyennes

> t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)

Two Sample t-test

data: smp.c$age by smp.c$ed.b

t = 1.7142, df = 690, p-value = 0.08694

alternative hypothesis: true difference in means is not equal

to 0

95 percent confidence interval:

-0.2710524 4.0005138

sample estimates:

mean in group 0 mean in group 1

39.46383 37.59910

Page 13: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Le test de Mann-Whitney (Wilcoxon)

Introduction à la statistique avec R > Comparaison de 2 moyennes

> wilcox.test(smp.c$age~smp.c$ed.b)

Wilcoxon rank sum test with continuity correction

data: smp.c$age by smp.c$ed.b

W = 56769.5, p-value = 0.06091

alternative hypothesis: true location shift is not equal to 0

Page 14: Les tests statistiques en pratique : comparaison de … › c4x › UPSUD › 42001S02 › asset › MOOC...Pr. Bruno Falissard Introduction à la statistique avec R > Comparaison

Pr. Bruno Falissard

Conclusion

qqnorm(smp.c$age); qqline(smp.c$age)

by(smp.c$age, smp.c$ed.b, sd, na.rm=TRUE)

t.test(smp.c$age~smp.c$ed.b, var.equal=TRUE)

wilcox.test(smp.c$age~smp.c$ed.b)

Introduction à la statistique avec R > Comparaison de 2 moyennes