chapitre vi: correlation et regression
TRANSCRIPT
![Page 1: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/1.jpg)
CHAPITRE VI: CORRELATION ET REGRESSION
Cliquer Ici, Accéder aux autres formations
![Page 2: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/2.jpg)
6. 1. Corrélation 6.1.1. Test de corrélation
La corrélation est une mesure de la relation entre deux variables. Il a une large application dans les entreprises et est très importante pour les consultants, analystes de données, chargés de suivi-Evaluation, etc.
![Page 3: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/3.jpg)
L'analyse de corrélation dans les affaires et les sciences sociales est couramment utilisée dans:
Marketing: le directeur du marketing veut savoir si la réduction des prix a un impact sur l'augmentation des ventes;
Production: le département de production veut savoir si le nombre d'articles défectueux produits a quelque chose à voir avec l'âge de la machine;7
6.1.2. Applications
![Page 4: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/4.jpg)
Ressources humaines: le département RH veut savoir si la productivité de ses travailleurs diminue avec le nombre d'heures qu'ils y consacrent;
Sciences sociales: un militant social veut savoir si l'augmentation de l'alphabétisation des femmes a un impact sur l'augmentation de l'âge du mariage des filles;
Recherche: un éducateur veut savoir si l'application de règles d'assiduité plus strictes aide les étudiants à obtenir de meilleurs résultats dans leurs études
![Page 5: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/5.jpg)
6.1.3. Niveaux de Corrélation
1. Relation Forte/Forte correlation 2. Relation Faible/Faible correlation
3. Pas de Relation
![Page 6: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/6.jpg)
Le coefficient de corrélation donne une valeur mathématique pour mesurer la force de la relation linéaire entre deux variables. Il peut prendre des valeurs de -1 à 1 avec:
1. +1 représentant la relation linéaire positive absolue (Plus X augmente, plus Y augmente);
2. 0 ne représentant pas de relation linéaire (X et Y n'ont pas de modèle/pas de relation).
3. -1 représente la relation inverse absolue (comme X augmente, Y diminue).
![Page 7: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/7.jpg)
6.1. 4. Le calcul du coefficient de corrélation Objectif:
# Rappel: La corrélation est utilisée pour tester la corrélation/relation entre des variables
# Les données analysées doivent être des données à échelle d’intervalle/ratio
Contexte:
# Y a-t-il une corrélation positive entre la motivation d’apprentissage et la réussite telle que montrée par la moyenne des notes cumulées des étudiants?
# Y a-t-il une relation entre l’expérience de travail et la productivité des employés?
Etude de Cas: Exemple de problème:
# Les données suivantes présentées sur la motivation et le GPA des étudiants
![Page 8: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/8.jpg)
6.1.5. Calcul du coefficient de corrélation:
Hypothèses
(1) Nulle: Ho ρ ≤ 0 bilatérale/two-
tailed (soit ρ<0 ou ρ=0)
(2) Alternative: Ha ρ > 0
Motivation GPA
58 3.54
45 2.82
54 3.41
48 3.25
61 3.36
54 3.38
52 3.43
50 3.66
58 3.27
60 3.3
48 3.19
62 3.33
44 3.16
56 3.4
53 3.16
61 3.38
63 3.2
46 3.09
57 3.31
49 3.34
55 3.39
48 3.11
58 3.12
52 3.35
60 3.45
54 3.15
Cliquer Ici, Accéder aux autres formations
![Page 9: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/9.jpg)
Cocher
Motivation GPA
58 3.54
45 2.82
54 3.41
48 3.25
61 3.36
54 3.38
52 3.43
50 3.66
58 3.27
60 3.3
48 3.19
62 3.33
44 3.16
56 3.4
53 3.16
61 3.38
63 3.2
46 3.09
57 3.31
49 3.34
55 3.39
48 3.11
58 3.12
52 3.35
60 3.45
54 3.15
![Page 10: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/10.jpg)
1. Cette section présente les résultats
de l’analyse de la corrélation et d’autres
mesures statistiques comme la somme
de carrées, le produit croisé et la
variance des covariances.
Pour lire le tableau, il suffit juste de
regarder le coefficient de Pearson (0,397) avec sig. (2-tailed/ bilatérale) de
0,045
2. Mais en prenant la valeur sig. (0,045) donnée et en déduire des conclusions, on ferait une erreur! Puisque l’ H0
est ρ ≤ 0 (c’est-à-dire ρ<0 ou ρ=0), la valeur sig. (bilatérale) doit être divisée par 2 de sorte qu’elle devienne
0,0225. La pratique de 1-tailed / unilatérale est couramment utilisée si on fait une prédiction d’une relation
positive ou négative entre deux variables. Si on pense da ns cette optique, on a commit aucune erreur en
prenant que la valeur sig. (2-tailed) est de 0,045.
Donc, en raison de la valeur sig. (0,0225) et α=0,05 (marge d’erreur): α=0,05> Sig. (=). H0 a été rejetée afin qu’il
puisse être conclu qu’il y avait une relation positive entre la motivation d’apprentissage et la réussite des étudiants.
![Page 11: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/11.jpg)
Bivariée
Les tests de corrélation à deux variables testent la force de la relation entre deux variables sans tenir compte de l'interférence que pourrait causer les autres variables à la relation entre les deux variables testées;
En corrélation partielle, nous sommes intéressés à connaître l'étendue de la relation spécifique entre deux variables, en isolant l'effet d'une ou plusieurs autres variables.
6.1.6. Correlation Bivariée versus partielle
![Page 12: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/12.jpg)
6.1.7. Exemple Concret pour les différencier
Il y a toujours un débat houleux dans les écoles de commerce pendant la semaine de
placement que les placements finaux, en général, sont arbitraires et les capacités d'un
candidat n'ont vraiment aucune corrélation avec le paquet de salaire offert à lui/ elle.
Pour vérifier la justesse de l'hypothèse ci-dessus, un échantillon de 30 étudiants a été
choisi au hasard dans une classe de MBA d'une école supérieure de commerce. Leurs
notes ont été prises comme mesure de leurs performances académiques. On leur a fait
passer des tests standards pour les évaluer en fonction de trois autres paramètres: la
capacité de communiquer, la culture générale et le niveau de QI. Après la semaine de
placement, des données sur le salaire ont été recueillies. Les données sont indiquées dans
le Tableau (voir Fichier Excel y relatif en annexe)
![Page 13: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/13.jpg)
Le tableau des resultats montre
qu’il y a une relation entre
Communication et Points; avec un
coefficient de correlation égal à
0,627 with sig. (bilatérale) de 0,001.
Donc, il y a une relation postive entre communication d’un étudiant
et les notes obtenues; et que cette
relation est significative à un niveau de signification égale a 0,01
b) Corrélation Bivariée
![Page 14: CHAPITRE VI: CORRELATION ET REGRESSION](https://reader030.vdocuments.net/reader030/viewer/2022012102/6169f63011a7b741a34d4b25/html5/thumbnails/14.jpg)
a) Corrélation Partielle
Nous pouvons voir que le
coefficient de corrélation n’est
pas seulement considérablement
plus petite (0,189 contre 0,627 en
cas de corrélation bivariée), mais
la valeur p est également
beaucoup plus élevée (0,376
contre moins de 0,001 en cas de
de corrélation bivariée). Cela
signifie que si nous contrôlons le
niveau de QI des étudiants,
l’aptitude de communication
ne sera pas significativement liée
au rendement académique des
étudiants