chapitre vi: correlation et regression

14
CHAPITRE VI: CORRELATION ET REGRESSION Cliquer Ici, Accéder aux autres formations

Upload: others

Post on 16-Oct-2021

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 2: CHAPITRE VI: CORRELATION ET REGRESSION

6. 1. Corrélation 6.1.1. Test de corrélation

La corrélation est une mesure de la relation entre deux variables. Il a une large application dans les entreprises et est très importante pour les consultants, analystes de données, chargés de suivi-Evaluation, etc.

Page 3: CHAPITRE VI: CORRELATION ET REGRESSION

L'analyse de corrélation dans les affaires et les sciences sociales est couramment utilisée dans:

Marketing: le directeur du marketing veut savoir si la réduction des prix a un impact sur l'augmentation des ventes;

Production: le département de production veut savoir si le nombre d'articles défectueux produits a quelque chose à voir avec l'âge de la machine;7

6.1.2. Applications

Page 4: CHAPITRE VI: CORRELATION ET REGRESSION

Ressources humaines: le département RH veut savoir si la productivité de ses travailleurs diminue avec le nombre d'heures qu'ils y consacrent;

Sciences sociales: un militant social veut savoir si l'augmentation de l'alphabétisation des femmes a un impact sur l'augmentation de l'âge du mariage des filles;

Recherche: un éducateur veut savoir si l'application de règles d'assiduité plus strictes aide les étudiants à obtenir de meilleurs résultats dans leurs études

Page 5: CHAPITRE VI: CORRELATION ET REGRESSION

6.1.3. Niveaux de Corrélation

1. Relation Forte/Forte correlation 2. Relation Faible/Faible correlation

3. Pas de Relation

Page 6: CHAPITRE VI: CORRELATION ET REGRESSION

Le coefficient de corrélation donne une valeur mathématique pour mesurer la force de la relation linéaire entre deux variables. Il peut prendre des valeurs de -1 à 1 avec:

1. +1 représentant la relation linéaire positive absolue (Plus X augmente, plus Y augmente);

2. 0 ne représentant pas de relation linéaire (X et Y n'ont pas de modèle/pas de relation).

3. -1 représente la relation inverse absolue (comme X augmente, Y diminue).

Page 7: CHAPITRE VI: CORRELATION ET REGRESSION

6.1. 4. Le calcul du coefficient de corrélation Objectif:

# Rappel: La corrélation est utilisée pour tester la corrélation/relation entre des variables

# Les données analysées doivent être des données à échelle d’intervalle/ratio

Contexte:

# Y a-t-il une corrélation positive entre la motivation d’apprentissage et la réussite telle que montrée par la moyenne des notes cumulées des étudiants?

# Y a-t-il une relation entre l’expérience de travail et la productivité des employés?

Etude de Cas: Exemple de problème:

# Les données suivantes présentées sur la motivation et le GPA des étudiants

Page 8: CHAPITRE VI: CORRELATION ET REGRESSION

6.1.5. Calcul du coefficient de corrélation:

Hypothèses

(1) Nulle: Ho ρ ≤ 0 bilatérale/two-

tailed (soit ρ<0 ou ρ=0)

(2) Alternative: Ha ρ > 0

Motivation GPA

58 3.54

45 2.82

54 3.41

48 3.25

61 3.36

54 3.38

52 3.43

50 3.66

58 3.27

60 3.3

48 3.19

62 3.33

44 3.16

56 3.4

53 3.16

61 3.38

63 3.2

46 3.09

57 3.31

49 3.34

55 3.39

48 3.11

58 3.12

52 3.35

60 3.45

54 3.15

Cliquer Ici, Accéder aux autres formations

Page 9: CHAPITRE VI: CORRELATION ET REGRESSION

Cocher

Motivation GPA

58 3.54

45 2.82

54 3.41

48 3.25

61 3.36

54 3.38

52 3.43

50 3.66

58 3.27

60 3.3

48 3.19

62 3.33

44 3.16

56 3.4

53 3.16

61 3.38

63 3.2

46 3.09

57 3.31

49 3.34

55 3.39

48 3.11

58 3.12

52 3.35

60 3.45

54 3.15

Page 10: CHAPITRE VI: CORRELATION ET REGRESSION

1. Cette section présente les résultats

de l’analyse de la corrélation et d’autres

mesures statistiques comme la somme

de carrées, le produit croisé et la

variance des covariances.

Pour lire le tableau, il suffit juste de

regarder le coefficient de Pearson (0,397) avec sig. (2-tailed/ bilatérale) de

0,045

2. Mais en prenant la valeur sig. (0,045) donnée et en déduire des conclusions, on ferait une erreur! Puisque l’ H0

est ρ ≤ 0 (c’est-à-dire ρ<0 ou ρ=0), la valeur sig. (bilatérale) doit être divisée par 2 de sorte qu’elle devienne

0,0225. La pratique de 1-tailed / unilatérale est couramment utilisée si on fait une prédiction d’une relation

positive ou négative entre deux variables. Si on pense da ns cette optique, on a commit aucune erreur en

prenant que la valeur sig. (2-tailed) est de 0,045.

Donc, en raison de la valeur sig. (0,0225) et α=0,05 (marge d’erreur): α=0,05> Sig. (=). H0 a été rejetée afin qu’il

puisse être conclu qu’il y avait une relation positive entre la motivation d’apprentissage et la réussite des étudiants.

Page 11: CHAPITRE VI: CORRELATION ET REGRESSION

Bivariée

Les tests de corrélation à deux variables testent la force de la relation entre deux variables sans tenir compte de l'interférence que pourrait causer les autres variables à la relation entre les deux variables testées;

En corrélation partielle, nous sommes intéressés à connaître l'étendue de la relation spécifique entre deux variables, en isolant l'effet d'une ou plusieurs autres variables.

6.1.6. Correlation Bivariée versus partielle

Page 12: CHAPITRE VI: CORRELATION ET REGRESSION

6.1.7. Exemple Concret pour les différencier

Il y a toujours un débat houleux dans les écoles de commerce pendant la semaine de

placement que les placements finaux, en général, sont arbitraires et les capacités d'un

candidat n'ont vraiment aucune corrélation avec le paquet de salaire offert à lui/ elle.

Pour vérifier la justesse de l'hypothèse ci-dessus, un échantillon de 30 étudiants a été

choisi au hasard dans une classe de MBA d'une école supérieure de commerce. Leurs

notes ont été prises comme mesure de leurs performances académiques. On leur a fait

passer des tests standards pour les évaluer en fonction de trois autres paramètres: la

capacité de communiquer, la culture générale et le niveau de QI. Après la semaine de

placement, des données sur le salaire ont été recueillies. Les données sont indiquées dans

le Tableau (voir Fichier Excel y relatif en annexe)

Page 13: CHAPITRE VI: CORRELATION ET REGRESSION

Le tableau des resultats montre

qu’il y a une relation entre

Communication et Points; avec un

coefficient de correlation égal à

0,627 with sig. (bilatérale) de 0,001.

Donc, il y a une relation postive entre communication d’un étudiant

et les notes obtenues; et que cette

relation est significative à un niveau de signification égale a 0,01

b) Corrélation Bivariée

Page 14: CHAPITRE VI: CORRELATION ET REGRESSION

a) Corrélation Partielle

Nous pouvons voir que le

coefficient de corrélation n’est

pas seulement considérablement

plus petite (0,189 contre 0,627 en

cas de corrélation bivariée), mais

la valeur p est également

beaucoup plus élevée (0,376

contre moins de 0,001 en cas de

de corrélation bivariée). Cela

signifie que si nous contrôlons le

niveau de QI des étudiants,

l’aptitude de communication

ne sera pas significativement liée

au rendement académique des

étudiants