ensae-sénégal réalisé par: sous la supervision de: djimera ismaïla m. guindo sidiki kalivogui...

26
ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO N’Kari YOUM Amadou (chef de groupe) ANALYSE DE LA VARIANCE(ANOVA) SOUS STATA FILIERE: ITS NIVEAU: 3 1 Analyse de la variance_ITS3/ENSAE- Sénégal/2011

Upload: andrien-blondeau

Post on 03-Apr-2015

136 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

ENSAE-Sénégal

Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO N’Kari YOUM Amadou (chef de groupe)

ANALYSE DE LA VARIANCE(ANOVA) SOUS STATA

FILIERE: ITS NIVEAU: 3

1Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Page 2: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

PLANI. ANALYSE DE LA VARIANCE A UN FACTEUR(ANOVA1)

I.1.Principe I.2. Traitement et Résultats

II. ANALYSE DE LA VARIANCE A DEUX FACTEURS(ANOVA2)

II.2. Modèle sans interactions II. 3. Modèle avec interactions

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 2

Page 3: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

INTRODUCTIONLe présent exposé s’inscrit dans le cadre de l’application des cours théoriques acquises en analyse de la variance. L’analyse de la variance consiste à expliquer une variable quantitative par un ensemble de variables qualitatives. Pour y arriver, il est nécessaire de formaliser un bon modèle afin d’obtenir des interprétations pertinentes.Plusieurs logiciels tels que STATA, R, SPSS,... sont utilisés pour faire l’analyse. Tout au long de ce travail, seules l’analyse de la variance à un facteur(ANOVA 1) et l’analyse de la variance à deux facteurs(ANOVA 2) seront développées. Le logiciel STATA qui fonctionne avec des lignes de commande tapées par l’utilisateur sera utilisé pour le traitement des données.

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 3

Page 4: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

I. ANALYSE DE LA VARIANCE A UN FACTEUR

I.1. PrincipeConsidérons un éleveur de Podor qui souhaite savoir si la race de ses vaches a un effet sur sa production journalière de lait.Formalisation du modèle:Soit Y la quantité de lait produite, X la race des vaches.Le modèle s’écrit:Yik = a + bk +Uik où:• a = Effet commun au niveau de production de toutes les vaches;•bk = Effet du niveau de production spécifique à la race et commun pour chaque race; • Uik = Effet perturbateur lié au niveau de production;•Yik = Quantité de lait produite de la vache i appartenant à la race k.

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 4

Page 5: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Hypothèses fondamentales• les résidus sont distribués suivant une loi normal centrée.• la variance des résidus ne varie pas entre les traitements (Homoscédasticité). Hypothèse à tester

H0 : b1 = b2 = b3 (la race choisie n’ a pas d’influence sur la quantité de lait produite) contreH1 : э(k, k’) / bk ≠bk’ (la race choisie a une influence sur la quantité de lait produite).La région critique du test est: Wα= {Yik /Fcalculé>Fthéorique }

On rejette l’hypothèse nulle si Fcalculé>Fthéorique

c’est – dire si p-value = P (Fcalculé>Fthéorique) < α Estimateurs

а* =ȳ ; bk* = ȳk –ȳ; uik* = yik - ȳk

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 5

y

Page 6: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

I.2. Traitement et Résultats

Le traitement des données se fait sous le logiciel STATA

et on prendra pour seuil α = 0.05.

Test d’ANOVA 1• Procédure

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 6

Page 7: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 7

On peut également utiliser la commande anova.

Syntaxe: anova lait race

Page 8: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

• Résultats. anova lait raceNumber of obs=34 R- squared = 0.9481

Root MSE = 1.10881 Adj R- squared =0.9448

Commentaire: La p- value (0.0000) est inférieure à 0.05.

On rejette donc l’hypothèse H0 c’est- à- dire que la race

a une influence sur la quantité de lait produite.Analyse de la variance_ITS3/ENSAE-Sénégal/2011 8

SOURCE Partial SS df MS F Prob > F Model 696.48214 2 348.24107 283.25 0.0000

Race 696.48214 2 348.24107 283.25 0.0000

Residual 38.1133953 31 1.22946437 Total 734.595535 33 22.2604708

Page 9: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

• Regress (Estimation des paramètres du modèle)

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 9

Source SS df MS Model 696.48214 2 348.24107

Residual 38.1133953 31 1.22946437

Total 734.595535 33 22.2604708

Number of obs = 34

F(2 , 31) = 283.35

Prob > F = 0.0000

R-squared = 0.9481

Adj R- squared = 0.9448

Root MSE = 1.1088

Lait Coef. Sdt.Err. t t>ItI [95% Conf. Interval] Race 2 1.184091 0.4628443 2.56 0.016 0.2401136 2.128068

3 10.23636 0.4727991 21.65 0.000 9.272083 11.20064 _cons 21.99091 0.3343194 65.78 0.000 21.30906 22.67276

Page 10: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

• Test de normalité des résidus

On peut aussi utiliser la commande sktestSyntaxe: sktest lait race

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 10

Page 11: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

• RésultatsSkewness/kurtosis tests for normality

Commentaire: La probabilité de rejeter l’hypothèse de normalité des résidus est de 0.3480. On admet alors que les résidus suivent une loi normale centrée.

Remarque: A partir de la commande ttest on peut vérifier que la moyenne des résidus est nulle.

Syntaxe : ttest residu2 ==0, level (95)

Résultats

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 11

Variable Obs Pr(skewness) Pr(Kurtosis) Adj chi2(2) Prob> chi2

Residu 34 0.3022 0.3437 2.11 0.3480

Page 12: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

• Test d’homoscédasticitéLa commande utilisée pour ce test est hettestSyntaxe: hettest residu1• Résultats

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 12

Page 13: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Commentaire:Prob > Chi2 = 0.8437 est supérieure à 0.05. On

accepte donc H0(C’est – à dire les erreurs sont homocédastiques)

• Test d’égalité des variancesOn peut directement utiliser la commande

onewaySyntaxe: oneway lait race Résultats:Analysis of variance

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 13

Source ss df MS F Prob > b

Between groups 696.48214 2 348.24107 283.25 0.000

Within groups 38.1133953 31 1.22946437 Total 734.595535 33 22.2604708 Bartlett's test for equal variances: chi2 (2) = 4.1556 Prob>chi2 = 0.125

Page 14: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

II. ANALYSE DE LA VARIANCE A FACTEURS (ANOVA 2)

L’Eleveur de Podor pense que le type d’exploitation peut aussi avoir une influence sur la quantité de lait produite. On considérera dans ce cas deux modèles selon l’existence ou non d’interaction entre la race et le type d’exploitation.

II.1. Modèle sans interactionsLe modèle s’écrit:Yijk = a + bj +Ck+Uijk où Ck est l’effet spécifique

lié au type d’exploitation.• Test d’anovaOn utilise la commande anovaSyntaxe: anova lait race exploita

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 14

Page 15: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 15

Résultats

Ce tableau représente le tableau d’analyse de la variance

On utilise ensuite la commande regress pour estimer les paramètres.

Syntaxe: regress

Page 16: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 16

•Résultats

Après les estimations du modèle, on extrait les résidus.

Syntaxe: predictresidu, resid

Page 17: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 17

•Test de normalité des variances

Syntaxe: sktest residu2

•Résultats

Après la récupération des résidus, il sera question de tester si la moyenne des résidus est nulle; ensuite tester sur l’omission des variables explicatives pertinentes et en fin faire le test d’homoscédasticité.

Commentaire: On rémarque que Prob > chi2 = 0.2808 est supérieur à 0.05. Donc on accepte l’hypothèse de normalité des résidus.

Page 18: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 18

• Résultats

Page 19: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

II.2. Modèle avec interactions

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 19

Le modèle s’écrit: Yijk = a + bj + ck + djk +Uijk où:• a = Effet commun au niveau de production de

toutes les vaches;• bj = Effet spécifique lié à la race

• ck = Effet spécifique lié au type d’exploitation;

• d jk= Effet d’interaction entre le type d’exploitation et la race;

• Yijk = Quantité de lait produite de la vache i appartenant à la race j et au type d’exploitation k.

• Uijk = Effet perturbateur lié au niveau de production de lait.

Page 20: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

•Test d’ANOVA

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 20

D’après les résultats ((Prob >F)=0.0006), on peut conclure qu’il existe un effet d’interaction entre la race et le type d’exploitation

Page 21: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Regress (Estimation des paramètres Regress (Estimation des paramètres du modèle)du modèle)

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 21

Les résultats sont présentés dans le tableau ci-dessous

Page 22: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Test de normalité des résidusTest de normalité des résidus

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 22

L’hypothèse de normalité est vérifiée car (prob > chi2) = 0,0510 > 5%

Page 23: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

Test sur la nullité de la moyenne des Test sur la nullité de la moyenne des résidusrésidus

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 23

A 99% la moyenne des résidus se situe entre -0,34

et +0,34, c’est –à dire on accepte l’hypothèse selon laquelle la moyenne des résidus est nulle.

Page 24: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

•Test d’omission de variables explicatives pertinentes

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 24

Comme (Prob > F)=0,0006 < 5%, donc des variables explicatives ont été omises

Page 25: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

CONCLUSION

L’Analyse de la variance utilisée pour expliquer la production de lait par la race(ANOVA1) et en plus des exploitations (ANOVA2) nous permet de tirer les conclusions suivantes:

L’ANOVA1 a permis de montrer que 94.81% de la production de lait peut être expliquée par les types de race.

Pour l’ANOVA 2 sans interactions, on a vu que l’introduction de la variable exploitation a permis de mieux expliquer la production journalière de lait.

Pour l’ANOVA2 avec interaction on constate que la production journalière est encore mieux expliquée par la race, les types d’exploitation et l’interaction entre les deux facteurs.

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 26

Page 26: ENSAE-Sénégal Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO NKari YOUM Amadou

BIBILOGRAPHIE

Cours d’Analyse de la variance, ITS3, ENSAE-Sénégal 2011

Doucouré Fodiyé Bakary, Introduction à l’économétrie, Edition Arima

Manuel d’initiation à STATA(version8), Auteur Kangin KPODAR

Manuel d’utilisation de STATA(version7), Auteurs V. LAUWERS, P. GROCLAUDE, M. WHITE-KONING

Analyse de la variance_ITS3/ENSAE-Sénégal/2011 27