08/11/2011 cours 9 - webdepot.umontreal.ca€¦ · 08/11/2011 1 les tableaux croisés et le test...

11
08/11/2011 1 Les tableaux croisés et le test d’indépendance du Chi -deux Cours 9 1 Retour sur TP1 et Cours 8 Les tableaux croisés et le test du Chi-deux Utilité, postulats d’utilisation et logique Exemple de calcul dans SPSS Exemple d’interprétation Tableau croisé avec SPSS 2 Étudient la relation entre deux variables (variable dépendante et indépendante) Permettent non seulement de déterminer si deux variables sont associées (signification), mais également de déterminer le sens et la force de cette relation.

Upload: truongquynh

Post on 12-Sep-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

08/11/2011

1

Les tableaux croisés

et le test d’indépendance du Chi-deux

Cours 9

1

Retour sur TP1 et Cours 8

Les tableaux croisés et le test du Chi-deux

› Utilité, postulats d’utilisation et logique

› Exemple de calcul dans SPSS

› Exemple d’interprétation

Tableau croisé avec SPSS

2

Étudient la relation entre deux variables (variable dépendante et indépendante)

Permettent non seulement de déterminer si deux variables sont associées (signification),

mais également de déterminer le sens et la force de cette relation.

08/11/2011

2

Le type de test utilisé dépend du type de variables utilisées.

Trois possibilités avec deux familles de variables :

Une variable de type

En lien avec une

variable…

On utilise :

QUALITATIVE en lien

avec QUALITATIVE = Tableau croisé

QUALITATIVE en lien

avec

QUANTITATIVE = (ou ordinale)

Test de

moyennes

QUANTITATIVE en lien

avec

QUANTITATIVE = (ou ordinale)

Corrélation

Des postulats d’utilisation sont associés à chaque type de test.

Les postulats sont un ensemble de règles à respecter dans l’utilisation des statistiques pour assurer la validité des résultats.

Quand les postulats d’utilisation ne sont pas respectés, cela mène à une fausse sensibilité du test.

Vérification des postulats avant de réaliser les tests et d’analyser les résultats.

Permet de tester le lien d’indépendance entre 2 variables qualitatives.

› Tableau croisé (ou de contingence): montre la distribution des effectifs des deux variables.

› Chi-deux ou Chi-carré (Χ2) : statistique utilisée

pour vérifier si la relation entre les deux variables

est significative.

6

08/11/2011

3

› Avoir deux variables qualitatives (nominales ou ordinales)

› Avoir un minimum de cinq observations dans chaque case (intersection)(N≥5).

7

1. Existe-t-il un lien entre mes variables?

La question de la Signification

2. Ce lien est-il important? La question de la Force

3. Que veut dire ce lien en termes concrets?

La question du Sens (ou de la nature) de la relation

Le test d’indépendance du Chi-deux sert à répondre à la question suivante : Existe-t-il un lien entre deux variables qualitatives? Il sert donc à tester des hypothèses.

Le test de d’indépendance du Chi-deux est utile pour savoir si oui ou non il existe un lien entre deux variable : il nous indique la signification de la relation.

Lorsque c’est significatif à p<0.05, nous rejetons H0. Lorsque c’est supérieur, nous ne pouvons rejeter l’hypothèse nulle.

08/11/2011

4

La formule est la suivante

2 =

( Fréquence observée – Fréquence espérée - [0,5])2

_______________________________________________________________________________________

Fréquence espérée

Toutes les cellules

Calculer le test d’indépendance du Chi-deux revient à

comparer les résultats obtenus dans notre étude

(fréquences observées) aux résultats théoriquement

obtenus à l’aide du hasard (fréquences espérées ou

théoriques)

Plus la différence entre les deux ensembles de résultats

est élevée, plus la valeur du Chi-deux est élevée.

Plus la valeur du Chi-deux est élevée, plus y a de

probabilités que la relation entre les 2 variables soit

significative.

La logique :

› Nous nous intéressons aux opinions des étudiants en ce qui concerne la peine de mort. Nous voulons savoir si le sexe de l’étudiant a une influence sur son opinion de la peine de mort (pour/contre). Notre hypothèse est que les hommes seront significativement plus nombreux à se positionner pour la peine de mort que les femmes.

› Nous passons un questionnaire (d’une question !) à 100 étudiants (50 femmes et 50 hommes) d’une classe de baccalauréat.

› Sur les 100 étudiants, 60 disent être contre la peine de

mort et 40 pour.

Tableau 1. Répartition de l’opinion face à la peine de mort selon le sexe de l’étudiant

Données fictives

12

Sexe de l’étudiant Opinion face à la peine de mort

Total

Contre Pour

Femme 50

Homme

50

Total 60 40 100

08/11/2011

5

1. À quoi devrait-on s’attendre s’il n’y a pas de relation entre les 2 variables ? ( les fréquences espérées(FE)

Tableau 1. Répartition de l’opinion face à la peine de mort selon le sexe de l’étudiant

13

Sexe de l’étudiant Opinion face à la peine de mort

Total

Contre Pour

Femme FE 30 (50%) 20 (50%) 50 (100%)

Homme FE

30 (50%) 20 (50%) 50 (100%)

Total 60 40 100

FE = (Nombre total de sujets de la rangée X Nombre total

de sujet en colonne) / Nombre total de sujets

Maintenant, qu’est-ce qu’on obtient dans nos résultats ?(Fréquences observées FO)

14

Sexe de l’étudiant Opinion face à la peine de mort

Total

Contre Pour

Femme FE 30 (50%) 20 (50%)

50 (100%) FO 30 (50 %) 20 (50%)

Homme

FE

30 (50%) 20 (50%) 50 (100%)

FO 30 (50%) 20 (50%)

Total 60 40 100

Aucun lien entre le sexe et l’opinion face à la peine de mort,

les étudiants sont autant pour la peine de mort que les

étudiantes.

15

Sexe de l’étudiant Opinion face à la peine de mort

Total Contre Pour

Femme FT 30 (50%) 20 (50%)

50 (100%) FO 36 (72%) 14 (28%)

Homme

FT

30 (50%) 20 (50%) 50 (100%)

FO 24 (48%) 26 (52%)

Total 60 40 100

Chi-deux : 6 Significatif à 0,01

52 % des étudiants de sexe masculin sont pour la peine de mort comparativement à 28 % des

étudiants de sexe féminin.

08/11/2011

6

Le chi-deux donne la signification mais pas la force de la relation.

Il serait peut-être possible de connaître la relation entre deux variables en s’inspirant du niveau de signification. Par exemple, on pourrait croire qu’une relation significative à p<0.001 est plus forte qu’une relation significative à p<0.05. Pas vraiment…

Tableau X. Lien entre le sexe des répondants et l’attitude face à la peine de mort

Hommes Femmes Total

Pour 30 20 50

Contre 20 30 50

50 50 100

La valeur du Chi carré est de 4,0, p<0,05

Tableau X. Lien entre le sexe des répondants et l’attitude face à la peine de mort

Hommes Femmes Total

Pour 60 40 100

Contre 40 60 100

100 100 200

La valeur du Chi carré est de 8,0, p<0,01, soit exactement le double.

17

Déterminer la force de la relation (si significatif)

Dans le cadre du cours, nous utiliserons 2 indicateurs de force

pour ce type de test. Les 2 varient de 0 à 1 (plus ça tend vers 1

plus le lien est fort entre les 2 variables)

V. de Cramer

Phi

Valeur Force du lien statistique

0 Absence de relation

Entre 0,05 et 0,10 Très faible

Entre 0,10 et 0,20 Faible

Entre 0,20 et 0,40 Modérée

Entre 0,40 et 0,80 Forte

Entre 0.80 et 1 Louche (Colinéarité)

Le choix des mesures d’association (force)

pour les tableaux de contingence: Arbre décisionnel

Deux variables

NOMINALES

Nombre de cellules

du tableau

Tableaux de

contingence

2x22xk ou

kxk

PhiV de

Cramer

Choix de l’indicateur de force dépend du nombre

de cellules du tableau croisé (ou de contingence)

Ex: Mineurs/Adultes et Consomme/ Ne

consomme pas Ex: Mineurs/Adultes et Criminalité

Faible/Criminalité Moyenne/Criminalité Forte

08/11/2011

7

Le Phi : Mesure dérivé du Chi-deux. On se rappelle que la valeur du Chi est directement influencée par le nombre de sujets et la force de la relation. Le phi élimine l’effet de la taille de l’échantillon en divisant le Chi carré par n, et en extrayant la racine carrée. Phi aussi appelé Pearson's coefficient of mean-square contingency.

Il est utilisable dans le cas de tableaux 2x2. Pour un tableau de plus de 2x2, la valeur du phi dépasse 1, et le rend moins intéressant.

Le V de Cramer : Le V de Cramer est la mesure d’association la plus populaire basée sur une

variation du Chi deux. Il varie de 0 à 1, et est donc facile à utiliser et à interpréter.

Il est utilisable dans le cas de tableaux de plus de 2x2 (donc 2xK ou KxK).

Dans les tableaux croisés, le sens est plus difficile à interpréter (particulièrement

dans des tableaux de plus de 2 X 2).

Nous devons regarder les pourcentages

indiqués dans le tableau…

08/11/2011

8

Existe-t-il une relation entre le sexe de la victime d’une violence conjugale et la gravité des blessures subies lors de l’événement ?

› H0: Les deux variables sont indépendantes

Il n’y a pas de relation entre le sexe de la victime de

violence conjugale et la gravité des blessures subies .

› H1: Les deux variables sont dépendantes

Il y a une relation entre le sexe de la victime et la gravité des blessures :

Les femmes victimes de violence conjugale sont plus nombreuses que les hommes à subir des blessures graves.

Les hommes victimes de violence conjugale sont plus nombreuses que les femmes à subir des blessures graves.

22

23

1. Aller dans

Analyse/Statistiques

descriptives/Tableaux

croisés

2. Glisser la VI dans

la section Ligne et

la VD dans la

section Colonne.

3. Appuyer sur

Statistiques

4. Sélectionner Chi-

deux (signification) et

l’indice de force qui

s’applique.

Cliquer sur Poursuivre

24

5. Cliquer sur

Cellules

6. Sous Effectifs, cliquer sur

Observé pour obtenir les

fréquences observées

7. Sous

Pourcentages,

cliquer sur Ligne

pour avoir le % de

chacune des

rangées. Permet

d’obtenir le sens de

la relation)

8. Cliquer sur

Poursuivre

08/11/2011

9

SPSS produit 4 tableaux.

25

Sens

Signification

Force

Sommaire des cas

26

On vérifie si on a un minimum de

5 observations dans chaque case

(postulat d’utilisation)

Si oui, on regarde si le test du chi-

carré est significatif. Si non, on

recode pour avoir moins de catégories et on recommence.

Est-ce que la relation est significative ?

27

Seuil de signification p<0,05

Relation significative entre sexe des victimes

et blessures Le fameux Chi-2

08/11/2011

10

Quel serait le sens de la relation?

› Décrire les faits saillants

28

24,5% des hommes victimes subissent des

blessures graves vs. 10,1 % des femmes victimes.

Plus ces pourcentages sont

différents, plus il y a de chances

que ce soit significatif!

29

Quelle est la force de la relation? › S’applique uniquement lorsque la relation est significative

0,15 = relation faible

Dans notre cas, le coefficient de force à utiliser est le V de Cramer, puisque c’est du 2 (H-F) par 3 (Aucune blessures, blessures légères, blessures graves)

30

Tableau 1. Relation entre le sexe de la victime de violence conjugale et les blessures subies lors de l’événement (n=840).

Blessures subies lors d’un événement de violence conjugale

Sexe de la

victime de

violence

conjugale

Aucune blessure

Blessures légères

Blessures

graves

Total

Femme 240 (32,9%) 416 (57%) 74 (10,1%) 730 (100%)

Homme 26 (23,6%) 57 (51,8%) 27 (24,5%) 110 (100%)

Valeur

V de Cramer

0,15 (p =0,009)

08/11/2011

11

Interprétation

› Les résultats du tableau 1 montrent qu’il existe une relation statistiquement significative (p<0,001) entre le sexe de la victime de violence conjugale et les blessures subies lors de l’événement. En effet, il est possible de constater que 24 % des hommes victimes de violence conjugale subissent des blessures graves comparativement à une proportion de 10 % pour les femmes victimes de violence conjugale. Cette relation est toutefois assez faible comme en témoigne un V de Cramer de 0,15.

31

Quelle est la relation entre les deux variables?

› Significatif ou non?…sens, force si c’est significatif.

› Si non-significatif, quels sont les facteurs qui peuvent expliquer que non-relation?

Retour sur l’hypothèse de départ

› les résultats vont-ils dans le même sens…dans le sens contraire…?

Est-ce un résultat surprenant en fonction des recherches existantes ou du sens commun? Expliquer pourquoi on

observe ou non une relation significative.

Qu’est-ce que ce résultat implique par rapport à votre question de recherche, aux recherches futures?

32