analyse factorielle des correspondances

7
AFC ANALYSE FACTORIELLE DES CORRESPONDANCES Méthode permettant d’étudier la nature de la liaison entre deux variables quelconques (pouvant être qualitatives) Née dans les années 70, en France, JP Benzécri L’AFC est un complément du test du Chi-deux d’indépendance : - Le test du Chi-deux permet de détecter la dépendance de 2 variables - L’AFC permet de décrire la nature de cette dépendance On travaillera sur un « tableau de contingence »

Upload: reece

Post on 10-Jan-2016

179 views

Category:

Documents


16 download

DESCRIPTION

ANALYSE FACTORIELLE DES CORRESPONDANCES. Méthode permettant d’étudier la nature de la liaison entre deux variables quelconques (pouvant être qualitatives). Née dans les années 70, en France, JP Benzécri. L’AFC est un complément du test du Chi-deux d’indépendance : - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFCANALYSE FACTORIELLE DES

CORRESPONDANCES

Méthode permettant d’étudier la nature de la liaison entre deux variables quelconques (pouvant être qualitatives)

Née dans les années 70, en France, JP Benzécri

L’AFC est un complément du test du Chi-deux d’indépendance :

- Le test du Chi-deux permet de détecter la dépendance de 2 variables

- L’AFC permet de décrire la nature de cette dépendance

On travaillera sur un « tableau de contingence »

Page 2: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFC EXEMPLEEXEMPLE

On a demandé à un échantillon de 10000 étudiants la CSP de leur père et on a présenté les résultats en fonction de leur filière d’étude

Droit Sciences Eco Lettres Sciences Médecine Pharmacie Pluridiscip. IUT TOTALExploitant agricole 80 36 134 99 65 28 11 58 511

Salarié agricole 6 2 15 6 4 1 1 4 39Patron 168 74 312 137 208 53 21 62 1035

Prof. Libérale/Cadre Sup 470 191 806 400 876 164 45 79 3031Cadre moyen 236 99 493 264 281 56 36 87 1552

Employé 145 52 281 133 135 30 20 54 850Ouvrier 166 64 401 193 127 23 28 129 1131

Personnel de service 16 6 27 11 8 2 2 8 80Autres 305 115 624 247 301 47 42 90 1771TOTAL 1592 639 3093 1490 2005 404 206 571 10000

n12=36 n2 .=39 n. 3=3093 n. .=10000

f12=36/10000 fl12=36/511 fc12=36/639

Page 3: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFC On détermine le tableau des profils lignesPROFILS LIGNES DR ECO LET SCI MED PHAR PLUR IUT TOTAL

EAGR 15,66% 7,05% 26,22% 19,37% 12,72% 5,48% 2,15% 11,35% 1SAGR 15,38% 5,13% 38,46% 15,38% 10,26% 2,56% 2,56% 10,26% 1PAT 16,23% 7,15% 30,14% 13,24% 20,10% 5,12% 2,03% 5,99% 1

PLCS 15,51% 6,30% 26,59% 13,20% 28,90% 5,41% 1,48% 2,61% 1CMOY 15,21% 6,38% 31,77% 17,01% 18,11% 3,61% 2,32% 5,61% 1EMP 17,06% 6,12% 33,06% 15,65% 15,88% 3,53% 2,35% 6,35% 1OUV 14,68% 5,66% 35,46% 17,06% 11,23% 2,03% 2,48% 11,41% 1SER 20,00% 7,50% 33,75% 13,75% 10,00% 2,50% 2,50% 10,00% 1AUT 17,22% 6,49% 35,23% 13,95% 17,00% 2,65% 2,37% 5,08% 1

et celui des profils colonnesPROFILS COLONNES DR ECO LET SCI MED PHAR PLUR IUT

EAGR 5,03% 5,63% 4,33% 6,64% 3,24% 6,93% 5,34% 10,16%SAGR 0,38% 0,31% 0,48% 0,40% 0,20% 0,25% 0,49% 0,70%PAT 10,55% 11,58% 10,09% 9,19% 10,37% 13,12% 10,19% 10,86%

PLCS 29,52% 29,89% 26,06% 26,85% 43,69% 40,59% 21,84% 13,84%CMOY 14,82% 15,49% 15,94% 17,72% 14,01% 13,86% 17,48% 15,24%EMP 9,11% 8,14% 9,09% 8,93% 6,73% 7,43% 9,71% 9,46%OUV 10,43% 10,02% 12,96% 12,95% 6,33% 5,69% 13,59% 22,59%SER 1,01% 0,94% 0,87% 0,74% 0,40% 0,50% 0,97% 1,40%AUT 19,16% 18,00% 20,17% 16,58% 15,01% 11,63% 20,39% 15,76%

TOTAL 1 1 1 1 1 1 1 1

Page 4: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFC L’AFC sera une double ACP :L’AFC sera une double ACP : une sur le tableau des profils lignes

et une sur le tableau des profils colonnes

avec une métrique particulière

La métrique du La métrique du ²²2

.

'

.

..2

.)',(2

i

ji

i

ij

nn

nn

jnniid

j

jiij

f

flfliid

.

2'2 )',(2

Page 5: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFC Pourquoi la métrique du 2 ?

Pour donner une importance comparable à toutes les modalités

Pour qu’un regroupement de lignes ou de colonnes ne change pas les distances

Les résultats de cette double ACP seront portés sur un seul graphiqueLes résultats de cette double ACP seront portés sur un seul graphique

On commentera la proximité entre profils lignes

On commentera la proximité entre profils colonnes

On commentera avec prudence la proximité entre profils lignes et profils colonnes

Page 6: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFC Graphique symétrique (axes F1 et F2 : 95,20 %)

EAGR

SAGR

P AT P LCS

CMOYEMP

OUV

SER

AUT

DR

ECO

LET

SCIMED

P HAR

P LUR

IUT

-0,6

-0,4

-0,2

0

0,2

0,4

0,6

-0,6 -0,4 -0,2 0 0,2 0,4 0,6

-- axe F1 (83,72 %) -->

Lignes actives

Colonnes actives

Page 7: ANALYSE FACTORIELLE DES CORRESPONDANCES

AFCCombien d’axes faut-il retenir ?

On retiendra des axes tant que les valeurs propres correspondantes

sont significativement non nulles

Nombre d’axes

Vc Vc ddl ²

0 n.. x 475 7x8 74.5

1 n.. x ( 77 6x7 58.1

2 n.. x ( 23 5x6 43.8

3 n.. x ( 11 4x5 31.4

Somme des valeurs propres restantes dont on teste la nullité simultanée