Étude de marché 53-113-03 cours 5 les tableaux croisés, le chi-carré et la corrélation

40
Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Upload: charlemagne-cariou

Post on 03-Apr-2015

110 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Étude de marché53-113-03

COURS 5

Les tableaux croisés, le chi-carré et la corrélation

Page 2: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

La nature de la donnée en recherche commerciale

• Catégorique– Nominale

• Sexe, langue, marque favorite, etc.

– Ordinale• Attribut préféré, catégorie d’âge, etc.

• Continue– Catégorique

• Échelles likert ou autres

– Ratio• Salaire, âge, consommation etc

Page 3: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Le croisement entre deux variables (concomitance)

2 variables 2 ou plus

Catégoriques Chi-carré 1-Analyse des correspondance

2-Probit

Continues Correlations Régressions

Mixte t-Student ANOVA

Analyse de variance

Page 4: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Les tableaux croisés permettent• De synthétiser l ’information

• De faire le lien entre deux variables

• De tester l ’indépendance ou la dépendance entre deux variables

• Dans ce dernier cas le test utilisé est celui du ÷ 2 (chi-carré)

Page 5: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Pour tout tableau croisé il est tentant de trouver des liens entre les deux

variables en cause

Exemple: Si je prend un échantillon de 100 personnes, 50 hommes et 50 femmes et que je

leurs demande s ’ils écoutent l ’émission Fortier . Je trouve les

résultats suivants

Page 6: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Hommes Femmes Total

Écoute 50 0 50

N’écoutepas

0 50 50

Total 50 50 100

Dans cet exemple il semble y avoir un lien entre le sexe et la propension à regarder

Fortier. Le deux variables seront donc dépendantes l ’une de l ’autre

Page 7: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Quel serait la composition théorique de mon tableau

• Si les deux variables étaient indépendantes?

• Dans ce cas le tableau serait constitué comme suit:

Hommes Femmes Total

Écoute 25 25 50

N’écoutepas

25 25 50

Total 50 50 100

Page 8: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

• Ce dernier tableau est composé de fréquences théoriques qui sont celles que l ’on aurait si les deux variables étaient parfaitement indépendantes

• Les données, pour chaque cellule, sont trouvées comme suit:

Page 9: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Cellule ij=

((total rangée i X total colonne j)/total)

Page 10: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Tester l ’indépendance entre deux variables revient à tester la différence

entre les cellules observées et les valeurs théoriques. Comme ces dernières sont celles qui seraient obtenues si les deux

variables étaient indépendantes on procédera par calcul de différences entre

les valeurs théorique et les valeurs observées. Plus la somme de ces

différences se rapproche de 0, plus les 2 variables seront dites indépendantes

Page 11: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Le calcul sera alors donné parla formule suivante

Chi-carré = S[(f obs.- f théo)2/ fthéo ]

Page 12: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Count

19 23 28 19 12 5 106

8 12 10 9 7 1 47

8 17 28 19 7 8 87

10 14 13 9 10 7 63

45 66 79 56 36 21 303

MailChamplain

PlaceLongueuil

PromenadeSt-Bruno

Autre

Q28) Dernier grandcentre commercial amagasiné

Total

De 18 à24 ans

De 25 à34 ans

De 35 à44 ans

De 45 à54 ans

De 55 à64 ans

65 ans etplus

Q51) Groupe d'âge

Total

Crosstab

Liens observés entre la catégorie d ’âge des consommateurs et le centre commercial

fréquenté

Page 13: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Expected Count

15.7 23.1 27.6 19.6 12.6 7.3 106.0

7.0 10.2 12.3 8.7 5.6 3.3 47.0

12.9 19.0 22.7 16.1 10.3 6.0 87.0

9.4 13.7 16.4 11.6 7.5 4.4 63.0

45.0 66.0 79.0 56.0 36.0 21.0 303.0

MailChamplain

PlaceLongueuil

PromenadeSt-Bruno

Autre

Q28) Dernier grandcentre commercial amagasiné

Total

De 18 à24 ans

De 25 à34 ans

De 35 à44 ans

De 45 à54 ans

De 55 à64 ans

65 ans etplus

Q51) Groupe d'âge

Total

Crosstab

Valeurs théoriques

Page 14: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Exemplefréquences fréquences (fo-ft)2 (fo-ft)2/fo

observées théoriques19 15,7 10,89 0,6936305723 23,1 0,01 0,000432928 27,6 0,16 0,005797119 19,6 0,36 0,0183673512 12,6 0,36 0,028571435 7,3 5,29 0,724657538 7 1 0,14285714

12 10,2 3,24 0,3176470610 12,3 5,29 0,43008139 8,7 0,09 0,010344837 5,6 1,96 0,351 3,3 5,29 1,60303038 12,9 24,01 1,86124031

17 19 4 0,2105263228 22,7 28,09 1,2374449319 16,1 8,41 0,522360257 10,3 10,89 1,057281558 6 4 0,66666667

10 9,4 0,36 0,0382978714 13,7 0,09 0,0065693413 16,4 11,56 0,704878059 11,6 6,76 0,58275862

10 7,5 6,25 0,833333337 4,4 6,76 1,53636364

total 13,5831384

Page 15: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Test du chi carré÷2

13.647a

15 .552

14.310 15 .502

1.563 1 .211

303

PearsonChi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value df

Asymp.Sig.

(2-tailed)

Chi-Square Tests

2 cells (8.3%) have expected count less than5. The minimum expected count is 3.26.

a.

Page 16: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

37 54 15 106

33.2 61.2 11.5 106.0

14 29 5 48

15.0 27.7 5.2 48.0

19 58 9 86

27.0 49.7 9.4 86.0

25 34 4 63

19.8 36.4 6.9 63.0

95 175 33 303

95.0 175.0 33.0 303.0

Count

ExpectedCount

Count

ExpectedCount

Count

ExpectedCount

Count

ExpectedCount

Count

ExpectedCount

MailChamplain

PlaceLongueuil

PromenadeSt-Bruno

Autre

Q28) Dernier grandcentre commercial amagasiné

Total

Moinssouvent

Aussisouvent

Plussouvent

Q35) Vous fréquentez lesgrands centres commerciaux...

Total

Q28) Dernier grand centre commercial a magasiné * Q35) Vous fréquentez les grands centrescommerciaux... Crosstabulation

Page 17: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

8.962a

6 .176

9.201 6 .163

2.135 1 .144

303

PearsonChi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value df

Asymp.Sig.

(2-tailed)

Chi-Square Tests

0 cells (.0%) have expected count less than 5.The minimum expected count is 5.23.

a.

Page 18: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

35 32 19 86

23.1 43.3 19.6 86.0

35 104 33 172

46.3 86.6 39.1 172.0

8 10 14 32

8.6 16.1 7.3 32.0

78 146 66 290

78.0 146.0 66.0 290.0

Count

ExpectedCount

Count

ExpectedCount

Count

ExpectedCount

Count

ExpectedCount

Moinssouvent

Aussisouvent

Plussouvent

Q35) Vous fréquentez les grandscentres commerciaux...

Total

Moinssouvent

Aussisouvent

Plussouvent

Q37) Vous fréquentez lesgrandes surfaces...

Total

Q35) Vous fréquentez les grands centres commerciaux... * Q37) Vous fréquentez les grandes surfaces...Crosstabulation

Page 19: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

24.816a

4 .000

23.408 4 .000

7.289 1 .007

290

PearsonChi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value df

Asymp.Sig.

(2-tailed)

Chi-Square Tests

0 cells (.0%) have expected count less than 5.The minimum expected count is 7.28.

a.

Page 20: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Bref rappel sur le t de student• On utilise le t de student afin de tester la

différence entre les moyennes de deux groupes.

• Exemple: consommation hommes= ou ‡ consommation femmes

Page 21: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

La corrélation

Sert à tester le lien (dépendance) entre deux variables

continues/quantitative

Page 22: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Dans certains cas le gestionnaire aura besoin de plus d ’information. Afin de se bâtir un tableau de contrôle, il voudra aussi mesurer l ’impact qu ’aura une (ou plusieurs) variable(s) sur une autre. À titre d ’exemple un gestionnaire voudra savoir quel est l ’impact de son investissement publicitaire sur ses ventes. De sa politique de bonus sur la performance de ses employés. C ’est alors qu ’on aura recours à la régression.

Page 23: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Un modèle de régression comporte toujours deux types de variables

• La variable dépendante (Y) qui est généralement constituée par le phénomène que l ’on veut expliquer (ventes, satisfaction, absentéisme etc)

• La ou les variable(s) indépendantes (X; ou X1, X2, X3 etc.) qui, selon le gestionnaire , pourrait(ent) être en mesure d ’expliquer la variation de Y.

Page 24: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

• Lorsqu ’un modèle de régression ne comporte qu ’une variable indépendante on dit que c ’est une régression simple qui s ’exprime comme suit

• Y= +x+• Lorsqu ’un modèle comporte plusieurs

variables indépendantes on aura

• Y= +1x1+ 2x2 3x3+ 4x4+

Page 25: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

La fonctionY= +x+sera celle qui passera dans un nuage de points liant les Y au

X tout en minimisant la différence entre les Y réels et les Y estimés par la droite de

régression

Page 26: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

TOTALBUD

800070006000500040003000200010000

SHARE

18

16

14

12

10

8

6

4

Lien entre la part de marché d ’une marque de bière et le budget total de communication (en

milliers$)

Page 27: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Analyse de la corrélation entre la dépense en communication et la part de marché

10.5048 2.9305 27

4334.89 1914.833 27

PARTS

DÉPENSES

MOYENNE ÉCART N

Descriptive Statistics

1.000 .826

.826 1.000

. .000

.000 .

27 27

27 27

PARTS

DÉPENSES

PARTS

DÉPENSES

PARTS

DÉPENSES

PearsonCorrelation

Sig.(1-tailed)

N

SHARE TOTALBUD

Correlations

Page 28: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Impact du budget de communication sur les parts de marché

5.028 .816 6.161 .000

1.3E-03 .000 7.314 .000

(Constant)

TOTALBUD

Model1

B Std. Error

UnstandardizedCoefficients

t Sig.

Coefficientsa

Dependent Variable: SHAREa.

DÉPENSc,d .826 .681Model1

Entered

Variables

R R Square

Model Summarya,b

Dependent Variable: SHAREa.

Method: Enterb.

Independent Variables: (Constant),TOTALBUD

c.

All requested variables entered.d.

Page 29: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Le modèle peut alors s ’exprimer comme suit:

Part de marché (%)=

5.028+ .0013(X* milliers$ en communication)

Page 30: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Autrement dit

• Le modèle prédit une part de marché constante de 5%

• Un accroissement de 1% de P .M. pour chaque 1,000,000$ investit

Page 31: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Impact des trois composantes de la communication sur les parts de marché

10.5048 2.9305 27

2178.35 975.7836 27

1001.39 386.6282 27

1155.15 691.2625 27

SHARE

MEDIA$

PRODUC$

PROMO$

MeanStd.

Deviation N

Descriptive Statistics

1.000 .861** .775**

.861** 1.000 .734**

.775** .734** 1.000

. .000 .000

.000 . .000

.000 .000 .

27 27 27

27 27 27

27 27 27

MEDIA$

PRODUC$

PROMO$

MEDIA$

PRODUC$

PROMO$

MEDIA$

PRODUC$

PROMO$

PearsonCorrelation

Sig.(2-tailed)

N

MEDIA$ PRODUC$ PROMO$

Correlations

Correlation is significant at the 0.01 level (2-tailed).**.

Page 32: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Résultats de l ’analyse de régression

PROMO$,PRODUC$,MEDIA$

c,d

.859 .738

Model1

Entered

Variables

R R Square

Model Summarya,b

Dependent Variable: SHAREa.

Method: Enterb.

Independent Variables: (Constant),PROMO$, PRODUC$, MEDIA$

c.

All requested variables entered.d.

5.039 .874 5.763 .000

-1.6E-04 .001 -.233 .818

3.0E-03 .002 1.850 .077

2.4E-03 .001 3.318 .003

(Constant)

MEDIA$

PRODUC$

PROMO$

Model1

B Std. Error

UnstandardizedCoefficients

t Sig.

Coefficientsa

Dependent Variable: SHAREa.

Page 33: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

De une à trois variables

• Le pouvoir explicatif et managerial de trois variables est souvent plus grands que celui d ’une seule

• Mais ce n ’est le cas que si les variables indépendantes ne sont pas corrélées entre elles (D ’où leur nom)

• Autrement le R va augmenter sans que les ne soient significatifs (C ’est le problème dit de la multicollinéarité)

Page 34: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Bref rappel sur le t de student• On utilise le t de student afin de tester la

différence entre les moyennes de deux groupes.

• Exemple: consommation hommes= ou ‡ consommation femmes

Page 35: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Tester cette hypothèse revient à tester s ’il y a un lien entre la

variable sexe(variable catégorique/qualitative) et la

consommation (variable continue/quantitative)

Page 36: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Pour prendre ma décision

• Je puis utiliser un test du t de student qui vise à comparer deux moyennes

• Le test part des hypothèses que– nb magasins hommes=nb femmes– dép. hommes= dépé femmes

• Ceci reviendrait à tester – mag.hommes - mag. Femmes =0– dep.hommes - dep. Femmes = 0

Page 37: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

Je chercherai donc à voir

• Si le 0 est inclus dans l ’intervalle de confiance

• OÙ, accessoirement quelle est la probabilité de rejeter les hypothèses (les différences entre hommes et femmes=0) et de me tromper.

• Le tableau suivant nous donne la réponse

Page 38: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

.619 .432 -1.079 297 .281 -1.21 1.12 -3.41 1.00

-1.081 279.504 .281 -1.21 1.12 -3.41 .99

11.562 .001 1.781 297 .076 32.25 18.11 -3.39 67.90

1.630 174.628 .105 32.25 19.79 -6.81 71.31

Equal

variances

assumed

Equal

variances

not

assumed

Equal

variances

assumed

Equal

variances

not

assumed

Q31) Nbr

de

magasins

visités

Q32)

Montant

dépensé au

total lors de

cette visite

F Sig.

Levene's Test for Equality

of Variances

t df

Sig.

(2-tailed)

Mean

Difference

Std. Error

Difference Lower Upper

95% Confidence

Interval of the Mean

t-test for Equality of Means

Independent Samples Test

Sortie Spssx pour une test de t

Page 39: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

On peut conclure que

• Je ne puis dire que, de façon statistiquement significative, les femmes visitent plus de magasins que les hommes. L ’intervalle de confiance, de 95%, comprenant le 0.

• Je pourrais cependant dire qu ’à un intervalle de confiance de 72% j ’aurais accepté la différence

Page 40: Étude de marché 53-113-03 COURS 5 Les tableaux croisés, le chi-carré et la corrélation

On peut conclure que

• Je ne puis dire que, de façon statistiquement significative, les femmes dépensent moins que les hommes. L ’intervalle de confiance, de 95%, comprenant le 0.

• Je pourrais cependant dire qu ’à un intervalle de confiance de 90% j ’aurais accepté la différence