luento 3: varianssianalyysi

101
Luento 3: Varianssianalyysi Petri Nokelainen Kasvatustieteiden yksikkö Tampereen yliopisto [email protected] http://www.uta.fi/~petri.nokelainen

Upload: ismet

Post on 13-Jan-2016

228 views

Category:

Documents


0 download

DESCRIPTION

Luento 3: Varianssianalyysi. Petri Nokelainen. [email protected] http://www.uta.fi/~petri.nokelainen. Kasvatustieteiden yksikkö Tampereen yliopisto. Sisältö. 1. General Linear Model (GLM) 2. Varianssianalyysi (ANOVA) 2.1 Yksisuuntainen ANOVA 2.1.1 Esimerkki - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Luento 3: Varianssianalyysi

Luento 3: Varianssianalyysi

Petri Nokelainen

Kasvatustieteiden yksikköTampereen yliopisto

[email protected]://www.uta.fi/~petri.nokelainen

Page 2: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki (Two-Way ANOVA)

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 3: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Opintojaksolla on jo aiemmin esitelty malli, jonka perusteella tilastolliset analyysimenetelmät voidaan jakaa neljään pääryhmään sen mukaan, millaisen tutkimustehtävän ratkaisuun ne soveltuvat.

Page 4: Luento 3: Varianssianalyysi

(Nokelainen, 2008.)

Page 5: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Edellä kuvattuja parametrisia tilastollisia menetelmiä voidaan tarkastella myös yleistetyn lineaarisen mallin (GLM) erityistapauksina.– General Linear Model (GLM) viitekehystä ei pidä sekoittaa

Generalized Linear Model (GLZ) viitekehykseen.

– GLZ on GLM:n yleinen muoto joka mahdollistaa • muiden kuin normaalijakautuneiden ja jatkuvien riippuvien

muuttujien käytön

• epälineaaristen vaikutussuhteiden tarkastelun

Page 6: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• GLM perustuu lineaarisuuden (linearity) ja yhteenlaskettavuuden (additivity) käsitteille:– Muuttujaparien oletetaan olevan lineaarisessa

vaikutussuhteessa keskenään, ts. muuttujien välisiä suhteita voidaan kuvata suoralla viivalla.

– Ennustemallissa olevat muuttujat (IV, X) lasketaan painokertoimineen yhteen, olettaen että kukin muuttuja tuo edelliseen/edellisiin nähden lisää ennustusvoimaa malliin ja siten parantaa kiinnostuksen kohteena olevan selitettävän muuttujan (DV, Y) arvojen ennustamista.

Page 7: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Koska GLM perustuu ennustamiseen (prediction, regression), regressioyhtälö esittää DV –muuttujan arvon yhden tai useamman IV –muuttujan yhdistelmänä (lisättynä ennustevirheellä).

• Yksinkertaisin tapaus on kahden muuttujan välinen regressioyhtälö (bivariate regression):

B = X –muuttujassa tapahtuvan yhden yksikön muutoksen vaikutus Y:n arvoon.A = Vakio joka kuvaa Y:n odotettua arvoa kun X saa arvon 0.e = Yhtälöön sisältyvä ennustevirhe (error of prediction).

eBXAY (3.1)

Page 8: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Jos X ja Y standardoidaan (z score), uusilla zx ja zy –muuttujilla on sama mitta-asteikko ja niiden arvot kohtaavat pisteessä jossa molemmat saavat arvon 0.– Standardoinnissa muuttujan keskiarvoksi tulee 0 ja keskihajonnaksi 1:

SD

MXz

z = Standardoitu muuttujan arvo (keskiarvo = 0, keskihajonta = 1).X = Standardoitava muuttuja.M = Standardoitavan muuttujan keskiarvo.SD = Standardoitavan muuttujan keskihajonta.

Page 9: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

Page 10: Luento 3: Varianssianalyysi
Page 11: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Jos X ja Y standardoidaan (z score), uusilla zx ja zy –muuttujilla on sama mitta-asteikko ja niiden arvot kohtaavat pisteessä jossa molemmat saavat arvon 0.– Vakio A poistuu kaavasta 3.1, koska kun zy on 0, myös zx on silloin 0.

ezz xy

= Standardoiduilla X –muuttujilla vastaa Pearsonin tulomomenttikorrelaatiokerrointa.e = Yhtälöön sisältyvä ennustevirhe (error of prediction).

(3.2)

Page 12: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Kahden muuttujan regressioyhtälöstä päästään useamman muuttujan väliseen regressioyhtälöön (multivariate regression), jolloin yhden Y- muuttujan arvoja ennustetaan kahden tai useamman X –muuttujan painotetulla summalla:

k

ixiy ezz

i1

= Standardoitujen X –muuttujien painokertoimet – eivät ole enää korrelaatioita!e = Yhtälöön sisältyvä ennustevirhe (error of prediction).

(3.3)

Page 13: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Kertauksena edelliseen kaavaan liittyen summamerkintä (), joka on taloudellinen tapa ilmoittaa useiden yhteenlaskettavien lukujen jono:

k

ixixkxx

k

iik

ikzzzz

xxxx

121

121

21

Page 14: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

• Kun regressioyhtälöön sisällytetään useampi kuin yksi Y –muuttuja, päästään sen täydelliseen monimuuttujamuotoon:

• Mallissa on yhtälöitä niin monta (m) kuin on X tai Y –muuttujien lukumäärä (lasketaan sen mukaan kumman muuttujan lukumäärä on pienempi).

k

ixim

p

iyjm ezz

imjm11

= Standardoitujen Y –muuttujien painokertoimet. = Standardoitujen X –muuttujien painokertoimet.e = Yhtälöön sisältyvä ennustevirhe (error of prediction).m = k tai p (kumpi on pienempi).

(3.4)

Page 15: Luento 3: Varianssianalyysi

1. General Linear Model (GLM)

ezz xy (3.2)

k

ixiy ezz

i1

(3.3)

k

ixim

p

iyjm ezz

imjm11

(3.4)

Pearsonin tulomomenttikorrelaatiokerroin (r) 1, jatkuva 1, jatkuva

X (IV) Y (DV)

Regressioanalyysi (Multiple RA) n, jatkuva 1, jatkuvaVarianssianalyysi (n-way ANOVA) n, epäjatkuva 1, jatkuvaKahden ryhmän erotteluanalyysi (Two-group LDA) n, jatkuva 1, dikotominen

Monimuuttujaregressioanalyysi (Multivariate RA) n, jatkuva n, jatkuvaMonimuuttujavarianssianalyysi (MANOVA)1 n, epäjatkuva n, jatkuvaErotteluanalyysi (LDA) n, jatkuva n, epäjatkuvaFaktorianalyysi (EFA) n, latentti n, jatkuvaPääkomponenttianalyysi (PCA) n, latentti n, jatkuva

1 Multivariate = useita riippuvia (DV) muuttujia, eri asia kuin ”multiple”!

1 Multivariate = useita riippuvia (DV) muuttujia, eri asia kuin ”multiple”!

Page 16: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 17: Luento 3: Varianssianalyysi

2. Varianssianalyysi

• ANOVA = Analysis of Variance• Testaa ryhmien keskiarvojen välisiä eroja.

– Muuttujien arvojen vaihtelua (keskiarvon keskivirhe) arvioidaan variansseilla (keskihajontojen neliöillä).

– Analyysi perustuu ryhmien välisen ja ryhmien sisäisen vaihtelun vertaamiseen.

– Analyysissa on yksi tai useampia riippuvia muuttujia (DV) joiden arvojen vaihtelusta ollaan kiinnostuneita riippumattoman (IV, ns. ryhmittelevä muuttuja) muuttujan suhteen.

Page 18: Luento 3: Varianssianalyysi

2. Varianssianalyysi

• Yksisuuntaisessa varianssianalyysissa (One-way ANOVA) on yksi riippumaton/selittävä X –muuttuja (IV), kaksisuuntaisessa (Two-way ANOVA) on kaksi, jne.

• On myös olemassa monimuuttujavarianssianalyysi (MANOVA), jossa voi olla erotuksena edellisiin useita riippuvia/selitettäviä Y –muuttujia (DV).

Page 19: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 20: Luento 3: Varianssianalyysi

(Nokelainen, 2008.)

Page 21: Luento 3: Varianssianalyysi

1 jatkuva

n diskr.

Joitakin Fakt. ANCOVA

1 diskr.

n jatkuvaa

Ei Fakt. MANOVA

n diskr.

Joitakin Fakt. MANCOVA

Ei Yksis. MANOVA Hottelling´s T1 diskr.

Joitakin Yksis. MANCOVA

DV IV Kovariaatit Analyysi

Ryhmien välistenerojen

merkitsevyys

Ryhmien välistenerojen

merkitsevyys

Ei Fakt. ANOVA

Joitakin Yksis. ANCOVA

Ei Yksis. ANOVA t-testi

Page 22: Luento 3: Varianssianalyysi

General Linear Model (GLM)

ezz xy (3.2)

k

ixiy ezz

i1

(3.3)

k

ixim

p

iyjm ezz

imjm11

(3.4)

Pearsonin tulomomenttikorrelaatiokerroin (r) 1, jatkuva 1, jatkuva

X (IV) Y (DV)

Monimuuttujaregressioanalyysi (Multivariate RA) n, jatkuva n, jatkuvaMonimuuttujavarianssianalyysi (MANOVA) n, epäjatkuva n, jatkuvaErotteluanalyysi (LDA) n, jatkuva n, epäjatkuvaFaktorianalyysi (EFA) n, latentti n, jatkuvaPääkomponenttianalyysi (PCA) n, latentti n, jatkuva

Regressioanalyysi (Multiple RA) n, jatkuva 1, jatkuvaVarianssianalyysi (n-way ANOVA) n, epäjatkuva 1, jatkuvaKahden ryhmän erotteluanalyysi (Two-group LDA) n, jatkuva 1, dikotominen

Page 23: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• Varianssianalyysin edellytykset:– Riippumaton X –muuttuja (IV) on mitattu laatueroasteikolla

(nominaaliasteikko).• Ryhmien lukumäärä kolme tai enemmän.

• Jokaisen vertailtavan ryhmän koko > 20 ja ryhmät (suunnilleen) samankokoisia.

– Riippuva Y –muuttuja (DV) on mitattu vähintään välimatka-asteikolla.

• Muuttujan arvojen tulee olla normaalisti jakautuneita kaikilla IV –muuttujan ryhmillä.

• Muuttujan varianssien on oltava IV –muuttujan ryhmissä yhtäsuuret.

Page 24: Luento 3: Varianssianalyysi
Page 25: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• Varianssia tarkastellaan ryhmien sisäisenä (within groups) ja niiden välisenä (between groups) vaihteluna.

• Ryhmien sisäinen vaihtelu on analyysin kannalta harmillista satunnaista vaihtelua.– SSwithin= (Yij-Yj)2

• Ryhmien välinen vaihtelu on mielenkiintoista systemaattista vaihtelua.– SSbetween=n (Yj- Grand Mean)2

• Kokonaisneliösumma– SStotal= SSbetween + SSwithin

Page 26: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• F-testi kertoo jääkö H0 voimaan (vertailtavien ryhmien keskiarvojen välillä ei ole eroja).– H0 hylätään, jos p –arvo (SPSS merkitsee “Sig.”) on pienempi kuin .05,

tällöin keskiarvot eroavat toisistaan tilastollisesti merkisevästi.

k = ryhmien lukumääräN = otoskoko

)(

)1(

kNSSk

SS

Fwithin

between

Page 27: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• Etan neliö (2, eta squared) kuvaa vaikutuksen suuruutta, ts. kuinka monta prosenttia riippuvan muuttujan (DV) arvoista selittyy ryhmittelevillä muuttujilla (IV).

Cohen (1988):.01 = small effect.06 = medium effect.14 = large effecttotal

between

SS

SS2

Page 28: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• On syytä huomata, että SPSS –ohjelman laskema1 ositettu etan neliö (p

2, partial eta squared) ei kaikissa tapauksissa ole verrannollinen em. tunnusluvun kanssa, koska se voi saada ykköstä suurempia arvoja (Pierce, Block & Aguinis, 2004).

• Koska p2 saa suurempia arvoja kuin 2, se antaa

optimistisemman kuvan vaikutuksen voimakkuudesta eikä sitä voi tulkita Cohenin (1988) antamien raja-arvojen puitteissa.

total

between

SS

SS2

errorbetween

betweenp SSSS

SS

2

1SPSS: GLM->Univariate->Options->Estimates of effect size.

Page 29: Luento 3: Varianssianalyysi

2.1 Yksisuuntainen ANOVA

• Varianssianalyysin jatkotestit (post hoc) kertovat tarkemmin mitkä ryhmät poikkesivat keskiarvojen suhteen toisistaan.

• Seuraavat kolme ovat suositeltavia, koska ottavat huomioon Tyypin I virheen riskin kasvun:– Varianssit eri ryhmissä samansuuruiset:

• Bonferroni

• Scheffé

– Varianssit eri ryhmissä erisuuruiset:• Tamhane’s T2

Page 30: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 31: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Tutkitaan kolmen matemaattisesti lahjakkaan opiskelijan ryhmän käsityksiä itsestä (SaaS, Self-Confidence Attribute Attitude Scale):– SAAS_2 You can be successful in anything if you

work hard enough at it.– SAAS_5 Being smart is more important than working

hard.

• Analyysin voi suorittaa SPSS –ohjelmassa kahdella eri tavalla, joista vain toinen tulostaa efektikoon (ositetun etan neliön, p

2).

Page 32: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Analyysin ensimmäinen vaihe– VAIHTOEHTO 1: Analyze – Compare Means – One-Way ANOVA

• Dependent List: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-portaisen muuttujan keskiarvo).

• Factor: Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva, nominaaliasteikollinen.

• Options: Descriptive, Homogeneity of variance test.• Post Hoc: Ei valita mitään 1. analyysikerralla!• Contrasts: Ei valita mitään.

– VAIHTOEHTO 2: Analyze – General Linear Model – Univariate• Dependent Variable: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-

portaisen muuttujan keskiarvo).• Fixed Factor(s): Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva,

nominaaliasteikollinen.• Model: Full factorial.• Contrasts: None.• Plots: Ei valita mitään.• Post Hoc: Ei valita mitään 1. analyysikerralla!• Options: Descriptive statistics, Estimates for effect size, Homogeneity tests.

Page 33: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

! Ryhmien variansseissa on tilastollisesti merkitseviä eroja (Sig. > .05), joten jos saadaan seuraavassa kohdassa lupa, käytetään ”Equal Variances Not Assumed” post hoc testiä: Tamhane’s T2

! Ryhmien keskiarvojen välinen ero on tilastollisesti merkitsevä, joten voidaan edetä post hoc testiin.

Page 34: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

! Ryhmien variansseissa on tilastollisesti merkitseviä eroja (Sig. < .05), joten jos saadaan seuraavassa kohdassa lupa, käytetään ”Equal Variances Not Assumed” post hoc testiä: Tamhane’s T2

! Ryhmien keskiarvojen välinen ero on tilastollisesti merkitsevä (p<.001), joten voidaan edetä post hoc testiin.

Page 35: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Analyysin toinen vaihe– VAIHTOEHTO 1: Analyze – Compare Means – One-Way ANOVA

• Dependent List: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-portaisen muuttujan keskiarvo).

• Factor: Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva, nominaaliasteikollinen.

• Options: Descriptive, Homogeneity of variance test.• Post Hoc: Tamhane’s T2, Significance level: .05• Contrasts: Ei valita mitään.

– VAIHTOEHTO 2: Analyze – General Linear Model – Univariate• Dependent Variable: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-

portaisen muuttujan keskiarvo).• Fixed Factor(s): Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva,

nominaaliasteikollinen.• Model: Full factorial.• Contrasts: None.• Plots: Ei valita mitään.• Post Hoc: Siirrä IV –muuttuja ”Factor(s)” –kentästä ”PostHoc Tests for:” –kenttään ja valitse

”Tamhane’s T2”.• Options: Descriptive statistics, Estimates for effect size, Homogeneity tests.

Page 36: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Jälkitestinä käytetään Tamhane’s T2 –testiä, koska se soveltuu eri suuruisten varianssien analysoimiseen ja on konservatiivinen, ts. Tyypin I virheen riski (ns. ”alpha virhe”) pienenee.

• ”One-Way ANOVA” ja ”GLM Univariate” –tulosteet ovat ”Multiple Comparisons” –taulukon suhteen identtiset.

• Taulukosta näemme, että ”Olympians” –ryhmän vastaukset SAAS_2 –väittämään poikkesivat tilastollisesti merkitsevästi kahden muun ryhmän vastauksista.

Page 37: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Koska jälkitestikin osoitti ryhmien välisen tilastollisesti merkitsevän eron olemassaolon, tuloksen aukikirjoittamiseen tarvitaan enää efektikoon tarkastelu.

• Etan neliö lasketaan ”käsin” seuraavien taulukkojen avulla:

09.091.0764.236

528.212 total

between

SS

SS

One-Way ANOVA GLM Univariate

Cohen (1988):.01 = small effect.06 = medium effect.14 = large effect

Page 38: Luento 3: Varianssianalyysi

2.1.1 Yksisuuntainen ANOVAEsimerkki

• Ositettu etan neliö on valmiiksi laskettuna GLM Univariate –tulosteessa, mutta lasketaan se vielä varmuudeksi käsinkin:

09.091.0236.215528.21

528.212

errorbetween

betweenp SSSS

SS

One-Way ANOVA GLM Univariate

Page 39: Luento 3: Varianssianalyysi

• Yksisuuntaisen varianssianalyysin avulla tutkittiin kolmen matemaattisesti lahjakkaista opiskelijoista koostuvan ryhmän käsityksiä mahdollisuuksistaan vaikuttaa omaan menestymiseen.

• Ryhmät erosivat toisistaan tilastollisesti merkitsevästi väittämän SAAS_2 ”Voit menestyä missä tahansa jos yrität tarpeeksi kovasti” suhteen, F(2, 198)=9.802, p<.001, 2=.09. Tulosta voidaan Cohenin (1988) mukaan pitää tieteelliseltä merkitykseltään keskimääräisenä.

• Tarkempi tarkastelu osoitti, että matematiikan olympiakilpailuihin osallistuneet (M=3.24, SD=1.23) muodostivat oman ryhmänsä ja toisen muodostivat ammattikorkeakoulun matematiikkalinjalaiset (M=3.99, SD=.852) ja matematiikan olympialaisiin valmentautuvat nuoret (M=3.78, SD=1.03).

• Tulosta voi tulkita siten, että olympiakilpailuiden kovan tason omakohtaisesti todenneet eivät enää elä siinä uskossa että ”mistä tahansa” eteen tulevasta matemaattisesta tehtävästä voisi selvitä – vaikka sen pohtimiseen käyttäisi lopun ikänsä!

2.1.1 Yksisuuntainen ANOVAEsimerkki

Page 40: Luento 3: Varianssianalyysi

F(2, 198)=9.802, p<.001, 2=.09

F(k-1, n-1)=[ ], p<.001, 2=.09

2.1.1 Yksisuuntainen ANOVAEsimerkki

95% 5%

0 1 2 3

F –jakauman odotusarvo on yksi (jolloin nollahypoteesi on voimassa), sitä suuremmat arvot ovat harvinaisia ja viittaavat ryhmien keskiarvojen eroihin.

k = IV –muuttujan ryhmien lukumäärä. Esimerkissä k=3, jolloin vapausasteet (df) ovat 3-1=2.

n = otoskoko. Esimerkissä n=199, jolloin vapausasteet (df) ovat 199-1=198.

VAPAUSASTEET F-ARVO TILASTOLLINEN EFEKTIKOKO MERKITSEVYYS

(df) (Sig.) (Eta squared)

Page 41: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 42: Luento 3: Varianssianalyysi

(Nokelainen, 2008.)

Page 43: Luento 3: Varianssianalyysi

2.2 Kruskal-Wallisin H testi

• Kruskal-Wallis H test

• Epäparametrinen vastine yksisuuntaiselle varianssianalyysille.

• Voidaan käyttää jos varianssianalyysin oletukset eivät toteudu tai jos IV -muuttujat on mitattu järjestysasteikolla.

• Testi perustuu järjestyslukujakaumien mediaanien eron vertailuun, H0 = eroa ei ole.

• SPSS –ohjelmassa ei ole valmiina jälkitestejä, suositus on suorittaa ne erikseen Mann-Whitneyn U –testeinä kullekin muuttujaparille.

Page 44: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 45: Luento 3: Varianssianalyysi

2.2.1 Kruskal-Wallisin H testiEsimerkki

• Esimerkin vuoksi ajamme edellisen ajon uudestaan epäparametrisella menetelmällä, vaikka riippuva muuttuja ei olekaan mittaustasoltaan järjestysasteikollinen, vaan korkeamman mittaustason välimatka-asteikollinen.

• Analyysin suoritus– Analyze – Nonparametric Tests – K Independent Samples

• Test Variable List: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-portaisen muuttujan keskiarvo).

• Grouping Variable: Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva, nominaaliasteikollinen.

• Test Type: Kruskal-Wallis H

• Options: Descriptive.

• Exact: Monte Carlo (CL 99%, N of samples 10000).

Page 46: Luento 3: Varianssianalyysi

2.2.1 Kruskal-Wallisin H testiEsimerkki

! ! Järjestyslukujen keskiarvot (Rj) saadaan jakamalla jokaisen ryhmän järjestyslukujen summa ryhmän koolla. Esim. Olympians –ryhmän kohdalla järjestyslukujen summa on pienin, 6011 (74 * 81.23), ja näin R1 on myös pienin.

! ! Otoksesta ei aina ole mielekästä laskea asymptoottista merkitsevyyttä jos otos ei ole suuri (n>150) ja täytä normaalijakauman ehtoa. ”Monte Carlo” merkitsevyys antaa hyvin tarkan arvion pienemmänkin otoksen (jos on satunnainen) perusteella tilastollisesta merkitsevyydestä. ”Exact” merkitsevyys on tarkin, mutta laskenta vie aikaa .. eikä annetussa ajassa aina päästä lopputulokseen!

Otoksesta ei aina ole mielekästä laskea asymptoottista merkitsevyyttä jos otos ei ole suuri (n>150) ja täytä normaalijakauman ehtoa. ”Monte Carlo” merkitsevyys antaa hyvin tarkan arvion pienemmänkin otoksen (jos on satunnainen) perusteella tilastollisesta merkitsevyydestä. ”Exact” merkitsevyys on tarkin, mutta laskenta vie aikaa .. eikä annetussa ajassa aina päästä lopputulokseen!

Page 47: Luento 3: Varianssianalyysi

2.2.1 Kruskal-Wallisin H testiEsimerkki

43.136002034532000302.0

)1199(3))20.11574()19.10551()23.8174(()1199(199

12

)1(3)1(

12*

222

1

2

NRnNN

Hk

jjj

Khiin neliötaulukosta näemme, että vapausasteilla 2 tilastollinen merkitsevyys .05 tasolla saavutetaan arvolla 5.9915. Koska 13.43 > 5.99, voimme todeta että tulos on tilastollisestimerkitsevä .05 riskitasolla.

Page 48: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 49: Luento 3: Varianssianalyysi

1 jatkuva

n diskr.

Joitakin Fakt. ANCOVA

1 diskr.

n jatkuvaa

Ei Fakt. MANOVA

n diskr.

Joitakin Fakt. MANCOVA

Ei Yksis. MANOVA Hottelling´s T1 diskr.

Joitakin Yksis. MANCOVA

DV IV Kovariaatit Analyysi

Ryhmien välistenerojen

merkitsevyys

Ryhmien välistenerojen

merkitsevyys

Joitakin Yksis. ANCOVA

Ei Yksis. ANOVA t-testi

Ei Fakt. ANOVA

Page 50: Luento 3: Varianssianalyysi

General Linear Model (GLM)

ezz xy (3.2)

k

ixiy ezz

i1

(3.3)

k

ixim

p

iyjm ezz

imjm11

(3.4)

Pearsonin tulomomenttikorrelaatiokerroin (r) 1, jatkuva 1, jatkuva

X (IV) Y (DV)

Monimuuttujaregressioanalyysi (Multivariate RA) n, jatkuva n, jatkuvaMonimuuttujavarianssianalyysi (MANOVA) n, epäjatkuva n, jatkuvaErotteluanalyysi (LDA) n, jatkuva n, epäjatkuvaFaktorianalyysi (EFA) n, latentti n, jatkuvaPääkomponenttianalyysi (PCA) n, latentti n, jatkuva

Regressioanalyysi (Multiple RA) n, jatkuva 1, jatkuvaVarianssianalyysi (n-way ANOVA) n, epäjatkuva 1, jatkuvaKahden ryhmän erotteluanalyysi (Two-group LDA) n, jatkuva 1, dikotominen

Page 51: Luento 3: Varianssianalyysi

2.3 Useampisuuntainen ANOVA

• Two-Way ANOVA, Three-Way ANOVA, .. • Voidaan tarkastella kahden tai useamman IV -

muuttujan (”faktorin”) vaikutuksia riippuvaan muuttujaan (DV).

• Samat oletukset ovat voimassa kuin yksisuuntaisessa varianssianalyysissa– Ryhmien lukumäärä kolme tai enemmän.– Jokaisen vertailtavan ryhmän koko > 20 ja ryhmät (suunnilleen)

samankokoisia.– Muuttujan arvojen tulee olla normaalisti jakautuneita kaikilla IV –

muuttujan ryhmillä.– Muuttujan varianssien on oltava IV –muuttujan ryhmissä yhtäsuuret.

Page 52: Luento 3: Varianssianalyysi

2.3 Useampisuuntainen ANOVA

• Erotuksena yksisuuntaiseen varianssianalyysiin, useampisuuntaisessa voidaan erotella IV –muuttujien yksittäinen (päävaikutus, main effect) ja yhteinen (yhdysvaikutus, interaction effect) vaikutus DV –muuttujaan.– Yleensä toivotaan voimakkaita päävaikutuksia ja heikkoja

yhdysvaikutuksia.

Page 53: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 54: Luento 3: Varianssianalyysi

• Seuraavaksi ajetaan aiempi yksisuuntainen varianssianalyysi uudestaan kaksisuuntaisena siten, että toiseksi IV –muuttujaksi lisätään sukupuoli.

• Kyseessä on nyt 3 x 2 asetelma, ns. faktoriaalinen ANOVA. – Luvut 3 ja 2 kuvaavat IV muuttujien luokkien lukumääriä (kolme

matematiikkaryhmää, kaksi sukupuolta).

• Haluamme tutkia mikä vaikutus sukupuolella on matemaattisen lahjakkuuden lisäksi attribuutiouskomuksiin.– Yleensä tällainen asetelma tähtää siihen, että pyritään osoittamaan

päävaikutus yhdysvaikutuksista riippumattomaksi, ts. halutaan sanoa että matemaattisen osaamisen taso liittyy sukupuolesta riippumatta siihen, miten tärkeänä henkilö pitää ponnistelujen roolia menestymiselle.

2.3.1 Kaksisuuntainen ANOVAEsimerkki

Page 55: Luento 3: Varianssianalyysi

• Tutkimuskysymykset voidaan ilmaista tarkemmin:– Päävaikutukset

• Vaihteleeko käsitys ponnisteluista menestymisen selittäjänä eri matematiikkaryhmissä?

• Vaihteleeko käsitys ponnisteluista menestymisen selittäjänä sukupuolen mukaan?

– Yhdysvaikutus• Vaihteleeko miesten ja naisten käsitykset ponnisteluista

menestymisen selittäjänä sen mukaan mihin matematiikkaryhmään he kuuluvat?

2.3.1 Kaksisuuntainen ANOVAEsimerkki

Page 56: Luento 3: Varianssianalyysi

2.3.1 Kaksisuuntainen ANOVAEsimerkki

• Analyysin ensimmäinen vaihe– Analyze – General Linear Model – Univariate

• Dependent Variable: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-portaisen muuttujan keskiarvo).

• Fixed Factor(s): Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva, nominaaliasteikollinen; Gender (1=Male, 2=Female), epäjatkuva, nominaaliasteikollinen.

• Model: Full factorial. Sum of squares: Type III

• Contrasts: None.

• Plots: Group*Gender.

• Post Hoc: Ei valita mitään 1. analyysikerralla!

• Options: Descriptive statistics, Estimates for effect size, Homogeneity tests.

Page 57: Luento 3: Varianssianalyysi

2.3.1 Kaksisuuntainen ANOVAEsimerkki

! ! Ryhmien variansseissa on tilastollisesti merkitseviä eroja (Sig. < .05), joten jos saadaan seuraavassa kohdassa lupa, käytetään ”Equal Variances Not Assumed” post hoc testiä: Tamhane’s T2

! ! Ryhmien keskiarvojen välinen ero on tilastollisesti merkitsevä (p=.012), joten voidaan edetä post hoc testiin. Sukupuolen suhteen ei pää- eikä yhdysvaikutuksia ole.

Page 58: Luento 3: Varianssianalyysi

2.3.1 Kaksisuuntainen ANOVAEsimerkki

• Ryhmäjäsenyyden (Group) ja sukupuolen (Gender) välillä ei ole yhdysvaikutusta, mikä on nähtävissä oheisesta ”Plots” –komennolla tulostetusta kuviostakin.– Naiset tosin ovat aliedustettuina kahdessa ensimmäisessä ryhmässä!

Page 59: Luento 3: Varianssianalyysi

2.3.1 Kaksisuuntainen ANOVAEsimerkki

• Analyysin toinen vaihe– Analyze – General Linear Model – Univariate

• Dependent Variable: SAAS_2 (Success due effort), jatkuva, välimatka-asteikollinen (kahden 5-portaisen muuttujan keskiarvo).

• Fixed Factor(s): Group (1=Olympians, 2=Prefinalists, 3=Polytechnics), epäjatkuva, nominaaliasteikollinen; Gender (1=Male, 2=Female), epäjatkuva, nominaaliasteikollinen.

• Model: Full factorial. Sum of squares: Type III

• Contrasts: None.

• Plots: Group*Gender.

• Post Hoc: Siirrä Gender –muuttuja ”Factor(s)” –kentästä ”PostHoc Tests for:” –kenttään ja valitse ”Tamhane’s T2”.

• Options: Descriptive statistics, Estimates for effect size, Homogeneity tests.

Page 60: Luento 3: Varianssianalyysi

• Jälkitestinä käytetään Tamhane’s T2 –testiä, koska se soveltuu eri suuruisten varianssien analysoimiseen ja on konservatiivinen, ts. Tyypin I virheen riski (ns. ”alpha virhe”) pienenee.

• Taulukosta näemme, että ”Olympians” –ryhmän vastaukset SAAS_2 –väittämään poikkesivat tilastollisesti merkitsevästi kahden muun ryhmän vastauksista.

2.3.1 Kaksisuuntainen ANOVAEsimerkki

Page 61: Luento 3: Varianssianalyysi

• Koska jälkitestikin osoitti ryhmien välisen tilastollisesti merkitsevän eron olemassaolon, tuloksen raportointi edellyttää vielä vaikutuksen voimakkuuden tarkastelua.

04.042.0764.236

026.102 total

between

SS

SS

2.3.1 Kaksisuuntainen ANOVAEsimerkki

05.2 p

Page 62: Luento 3: Varianssianalyysi

• Kaksisuuntaisen 3 x 2 varianssianalyysin avulla tutkittiin kolmen matemaattisesti lahjakkaista opiskelijoista koostuvan ryhmän ja sukupuolen vaikutusta vastaajien käsityksiin mahdollisuudestaan vaikuttaa ponnistelujen kautta menestymiseen.

• Analyysi paljasti tilastollisesti merkitsevän päävaikutuksen matematiikkaryhmien ja attribuutiouskomusten (SAAS_2 ”Voit menestyä missä tahansa jos yrität tarpeeksi kovasti”) välillä, F(2, 198)=4.565, p=.012, 2=.04. Tulosta voidaan Cohenin (1988) mukaan pitää tieteelliseltä merkitykseltään vähäisenä. Tarkempi tarkastelu osoitti, että matematiikan olympiakilpailuihin osallistuneet (M=3.24, SD=1.23) muodostivat oman ryhmänsä ja toisen muodostivat ammattikorkeakoulun matematiikkalinjalaiset (M=3.99, SD=.852) ja matematiikan olympialaisiin valmentautuvat nuoret (M=3.78, SD=1.03). Tulosta voi tulkita siten, että olympiakilpailuiden kovan tason omakohtaisesti todenneet eivät enää elä siinä uskossa että ”mistä tahansa” eteen tulevasta matemaattisesta tehtävästä voisi selvitä – vaikka sen pohtimiseen käyttäisi lopun ikänsä!

• Sukupuolen ja attribuutiouskomusten välillä ei havaittu päävaikutusta, eikä sukupuolen ja ryhmän välillä yhdysvaikutusta.

2.3.1 Kaksisuuntainen ANOVAEsimerkki

Page 63: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 64: Luento 3: Varianssianalyysi

1 jatkuva

n diskr.

1 diskr.

n jatkuvaa

Ei Fakt. MANOVA

n diskr.

Joitakin Fakt. MANCOVA

Ei Yksis. MANOVA Hottelling´s T1 diskr.

Joitakin Yksis. MANCOVA

DV IV Kovariaatit Analyysi

Ryhmien välistenerojen

merkitsevyys

Ryhmien välistenerojen

merkitsevyys

Ei Fakt. ANOVA

Ei Yksis. ANOVA t-testi

Joitakin Yksis. ANCOVA

Joitakin Fakt. ANCOVA

Page 65: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Analysis of covariance.• Varianssianalyysin laajennus • Satunnaista vaihtelua rajoitetaan jonkin DV

muuttujaan korreloivan tekijän (covariate) suhteen.• Vastaa samaan kysymykseen kuin ANOVA: Onko

ryhmien keskiarvoissa tilastollisesti merkitsevää eroa?, mutta tarkennettuna:– Onko koe- ja kontrolliryhmien jälkitestin keskiarvoissa

(DV) eroa, kun niitä on korjattu esitestin (covariate) arvojen perusteella?

Page 66: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Kovarianssianalyysilla on kolme pääasiallista käyttötarkoitusta:– Testin herkkyyden kasvattaminen virhetermin

pienentämisen avulla.

– DV –muuttujien keskiarvojen erojen tasoittaminen kovariaatin informaation perusteella.

Page 67: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Ensimmäisessä sovelluksessa kontrolloidaan ei-toivottua kohinaa DV –muuttujassa. – Yksilölliset erot esitestissä kun mitataan kokeilun

vaikutuksia jälkitestissä.

Page 68: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Toisessa sovelluksessa poistetaan DV –muuttujaan vaikuttavien kovariaattien keskiarvoerot.– Miesten ja naisten tuloero kun halutaan keskittyä

mittaamaan käsityksiä esimiehen johtamistaidosta.

– Sosioekonomisen statuksen ja iän vaikutus kun tutkitaan alueellisesti eri puolueiden kannatusta.

Page 69: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Kolmannessa sovelluksessa testataan eri DV –muuttujia yksitellen, kun toisten DV –muuttujien (kovariaatit) vaikutus on poistettu.

Page 70: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Rajoitukset käytölle ovat samat kuin varianssianalyysissa ja regressioanalyysissa (GLM).

• Yksisuuntainen ANOVA:– Keskiarvomalli (Means Model)

– yij=i + ij , jossa i = i:nnen ryhmän keskiarvo ja ij = satunnaisvirhe

• F-testillä testataan H0: 1 = 2 = … = i

– Efektimalli (Effects Model)

– yij= + i + ij , jossa = ryhmän omavaikutus (main effect)

• F-testillä testataan H0: 1 = 0

Page 71: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Kaksisuuntainen ANOVA:– Y = + (k) + (m) + (km) + jkm

= yleiskeskiarvo (k) = muuttujaan X1 liittyvä omavaikutus ryhmässä k

(m) = muuttujaan X2 liittyvä omavaikutus ryhmässä m

(km) = muuttujien X1 ja X2 yhdysvaikutusparametreja (interaction)

jkm = jäännösvirheet (residuaalit)

• F-testillä testataan H0: (km) = 0

Page 72: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Rajoituksia:– Havainnot ovat toisistaan riippumattomia.

– Ryhmien populaatiot ovat normaalisti jakautuneita.

– Ryhmien varianssit ovat yhtä suuria.

– Residuaalit (ennustetun ja havaitun arvon välinen erotus) ovat normaalisti jakautuneita, riippumattomia, ja niiden hajonnat ovat homoskedastisia (tasaisia).

Page 73: Luento 3: Varianssianalyysi

3.1 ANCOVA

DV

(Y)

Covariate (X)

Ryhmä 1Ryhmä 2Ryhmä 3

DV

(Y)

Covariate (X)

Ryhmä 1Ryhmä 2

Ryhmä 3

Page 74: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Oletuksia:– Kovariaatin ja DV -muuttujan välillä tulee olla

lineaarinen yhteys.

– Em. yhteyden tulee olla samansuuruinen kaikissa ryhmissä.

– Usean kovariaatin tapauksessa ne eivät saisi korreloida keskenään (multikollineaarisuus, singulaarisuus).

– Kokeellisessa asetelmassa kovariaatin tulee olla riippumaton koevaikutuksesta.

Page 75: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Yksisuuntainen ANOVAY = + +

= yleiskeskiarvo = ryhmän X vaikutus

= mittausvirhe

• ANCOVAn perusyhtälöY - (c-c+) = + +

(c-c+) = regressiotermi viittaa kovariaatin tuomaan lisäinformaatioon

Y - (c-c+) = kovariaatilla korjattu Y:n arvoc = yksittäisen kovariaatin arvo

c+ = kovariaatin yleiskeskiarvo

Page 76: Luento 3: Varianssianalyysi

3.1 ANCOVA

• ANOVASSwithin= (Yij-Yj)2

SSbetween= n (Yj- Grand Mean)2

SStotal= SSbetween + SSwithin

• ANCOVAssa– Kovarianssimuuttujan neliösumma (sum of squares, SS, x2)

SStotal(c) = SSbetween(c) + SSwithin(c)

– Y –muuttujan ja kovariaatin C välinen tulosumma (sum of products, SP, xy)

SPtotal = SPbetween + SPwithin

Page 77: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Em. termien avulla voidaan laskea korjattu neliösumma ryhmien väliselle (between groups) ja sisäiselle (within groups) vaihtelulle:

SS´between = SSbetween – (SPtotal / SStotal(c) – (SPwithin)2 / SSwithin(c))

SS´within = SSwithin – (SPwithin)2 / SSwithin(c)

Page 78: Luento 3: Varianssianalyysi

3.1 ANCOVA

• F-testi kertoo jääkö H0 voimaan.

– H0 hylätään, jos Sig. < .05, tällöin keskiarvot eroavat toisistaan tilastollisesti merkittävästi.

SS´between / (k-1)

F =

SS´within / (N-k-c)k = ryhmien lukumääräN = otoskokoc = kovarianssien lukumäärä

Page 79: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Eta:n neliö (2) kuvaa vaikutuksen suuruutta. – Kuinka monta prosenttia riippuvan (DV) muuttujan

arvoista selittyy ryhmittelevillä (IV) muuttujilla.

SS´between

2 =

SS´totalCohen (1988):.01 = small effect.06 = medium effect.14 = large effect

Page 80: Luento 3: Varianssianalyysi

3.1 ANCOVA

• Post hoc -testit kertovat tarkemmin mitkä ryhmät poikkesivat keskiarvojen suhteen toisistaan.– Tukey (suuremmille aineistoille)

– Bonferroni (pienemmille aineistoille)

– Scheffé (hyvin konservatiivinen)

– Tamhanen T2 (jos ryhmien variansseissa on eroa)

Page 81: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 82: Luento 3: Varianssianalyysi

1 jatkuva

n diskr.

Joitakin Fakt. ANCOVA

1 diskr.

n jatkuvaa

n diskr.

Joitakin Fakt. MANCOVA

1 diskr.

Joitakin Yksis. MANCOVA

DV IV Kovariaatit Analyysi

Ryhmien välistenerojen

merkitsevyys

Ryhmien välistenerojen

merkitsevyys

Joitakin Yksis. ANCOVA

Ei Yksis. ANOVA t-testi

Ei Fakt. ANOVA

Ei Yksis. MANOVA Hottelling´s T

Ei Fakt. MANOVA

Page 83: Luento 3: Varianssianalyysi

General Linear Model (GLM)

ezz xy (3.2)

k

ixiy ezz

i1

(3.3)

k

ixim

p

iyjm ezz

imjm11

(3.4)

Pearsonin tulomomenttikorrelaatiokerroin (r) 1, jatkuva 1, jatkuva

X (IV) Y (DV)

Regressioanalyysi (Multiple RA) n, jatkuva 1, jatkuvaVarianssianalyysi (n-way ANOVA) n, epäjatkuva 1, jatkuvaKahden ryhmän erotteluanalyysi (Two-group LDA) n, jatkuva 1, dikotominen

Monimuuttujaregressioanalyysi (Multivariate RA) n, jatkuva n, jatkuvaMonimuuttujavarianssianalyysi (MANOVA) n, epäjatkuva n, jatkuvaErotteluanalyysi (LDA) n, jatkuva n, epäjatkuvaFaktorianalyysi (EFA) n, latentti n, jatkuvaPääkomponenttianalyysi (PCA) n, latentti n, jatkuva

Page 84: Luento 3: Varianssianalyysi

3.2 MANOVA

• Multivariate analysis of variance– Aito monimuuttujamenetelmä.

– Vastaa teknisesti eroteluanalyysia (LDA).

• Selvitetään yhden tai useamman yhtäaikaisen ryhmittelevän (IV) tekijän vaikutusta useampaan kuin yhteen selitettävään (DV) muuttujaan.

Page 85: Luento 3: Varianssianalyysi

3.2 MANOVA

• Vastaa esim. seuraavaan tutkimusongelmaan:– Kuinka ryhmäjäsenyys (ryhmä 1 ja 2) ja sukupuoli

selittävät koehermostuneisuutta (test anxiety).

Y1

Y2

Page 86: Luento 3: Varianssianalyysi

3.2 MANOVA

• Rajoitukset– DV –muuttujien taustalla normaalijakautuneet

populaatiot.

– Aineisto on satunnainen otos populaatiosta.

– Jokaisen solun varianssi-kovarianssimatriisit ovat samat.

– Residuaalit ovat normaalisia ja homoskedastisia.

– Ryhmien otoskoot ovat yhtäsuuret.

Page 87: Luento 3: Varianssianalyysi

3.2 MANOVA

• SPSS –ohjelmisto laskee MANOVAn regressioanalyysin avulla.– F –testi varsinaisille vaikutuksille, koko mallille ja

oletetulle vakiotermille.

– R2 –kerroin kuvaa muuttujien yhteisvaihtelun voimakkuutta.

Page 88: Luento 3: Varianssianalyysi

3.2 MANOVA

• Useiden selitettävien (DV) tekijöiden tapauksessa tehdään korjauksia merkitsevyystestauksissa.– Pillai´s Trace, Wilk´s Lambda ja Hottelling´s Trace

perustuvat ristitulomatriisin D(*) determinantteihin (matriisin varianssin mitta).

– Testisuureille ilmoitettu F-arvo arvioi matriisien varianssin yhtäsuuruutta.

• H0: ei vaikutusta (Sig. > .05).

Page 89: Luento 3: Varianssianalyysi

3.2 MANOVA

• Post hoc -testit kertovat tarkemmin mitkä ryhmät poikkesivat keskiarvojen suhteen toisistaan.– Tukey (suuremmille aineistoille)

– Bonferroni (pienemmille aineistoille)

– Scheffé (hyvin konservatiivinen)

– Tamhanen T2 (jos ryhmien variansseissa on eroa)

Page 90: Luento 3: Varianssianalyysi

3.2 MANOVA

• MANOVA vs. ANOVA– MANOVA toimii

• paremmin kohtuullisesti korreloivilla DV –muuttujilla

• huonommin korreloimattomilla tai voimakkaasti korrelloivilla DV -muuttujilla

• huonommin voimakkaasti korreloivilla IV –muuttujilla

– MANOVA on analyysimäärittelyiltä ja tulosten tulkinnalta huomattavasti haastavampi kuin yksi- ja useampisuuntaiset varianssianalyysit.

Page 91: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 92: Luento 3: Varianssianalyysi

1 jatkuva

n diskr.

Joitakin Fakt. ANCOVA

1 diskr.

n jatkuvaa

n diskr.

1 diskr.

DV IV Kovariaatit Analyysi

Ryhmien välistenerojen

merkitsevyys

Ryhmien välistenerojen

merkitsevyys

Joitakin Yksis. ANCOVA

Ei Yksis. ANOVA t-testi

Ei Fakt. ANOVA

Ei Yksis. MANOVA Hottelling´s T

Ei Fakt. MANOVA

Joitakin Yksis. MANCOVA

Joitakin Fakt. MANCOVA

Page 93: Luento 3: Varianssianalyysi

3.3 MANCOVA

• Multivariate analysis of covariance– Vastaa ANCOVAa (kovariaattien selitys), mutta

mallissa on (kuten MANOVAssa) useita DV –muuttujia.

Page 94: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 95: Luento 3: Varianssianalyysi

3.4 Profiilianalyysi

• MANOVAn erikoissovellus jossa on useita samalla asteikolla mitattuja DV –muuttujia.– Kahden ammattiryhmän (yliopisto-opettaja, psykologi)

eroja halutaan tutkia persoonallisuusprofiilien (minäkäsitys, ryhmätyötaidot) osalta.

– Tilastotieteen sovellustaitoja mittaava koe toistetaan alkutestauksen jälkeen (a) perinteisen luokkahuoneopetusjakson ja (b) tietokoneavusteisen opetusjakson jälkeen yliopisto-opiskelijoille.

Page 96: Luento 3: Varianssianalyysi

3.4 Profiilianalyysi

54321

Minäkäsitys Ryhmätyötaidot

PsykologiLehtori

Page 97: Luento 3: Varianssianalyysi

3.4 Profiilianalyysi

• Analyysia voidaan laajentaa – ryhmien sukupuolten välisten erojen testaukseen,

– erottelemaan kasvatustieteen / aikuiskasvatuksen opiskelijoiden saama hyöty/haitta tietokoneavusteisesta opiskelusta.

Page 98: Luento 3: Varianssianalyysi

3.4 Profiilianalyysi

• DV –muuttujat kannattaa normittaa (z score) muissa kuin toistokokeissa -> mittayksiköiden yhdenmukaisuus.

• Kontrastit ovat profiilianalyysin ”post hoc” testejä.

Page 99: Luento 3: Varianssianalyysi

Sisältö

1. General Linear Model (GLM)2. Varianssianalyysi (ANOVA)

2.1 Yksisuuntainen ANOVA2.1.1 Esimerkki

2.2 Kruskal-Wallisin H testi2.2.1 Esimerkki

2.3 Useampisuuntainen ANOVA2.3.1 Esimerkki

3. Lisälukemistoa ryhmien vertailutekniikoista3.1 ANCOVA 3.2 MANOVA3.3 MANCOVA3.4 Profiilianalyysi

Lähteet

Page 100: Luento 3: Varianssianalyysi

Lähteet

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297-334.

Gulliksen, H. (1950). Theory of Mental Tests. New York: John Wiley & Sons.

Howell, D. (1997). Statistical Methods for Psychology. Belmont, CA: Wadsworth Publishing Company.

Page 101: Luento 3: Varianssianalyysi

Lähteet

Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika, 2, 151-160.

Metsämuuronen, J. (2003). Tutkimuksen tekemisen perusteet ihmistieteissä. Helsinki: International Methelp Ky.

Nummenmaa, L. (2009). Käyttäytymistieteiden tilastolliset

menetelmät. Ensimmäinen painos, uudistettu laitos. Helsinki:

Tammi.Pierce, C. A., Block, R., & Aguinis, H. (2004). Cautionary note on

reporting Eta-squared values from multifactor ANOVA designs. Educational and Psychological Measurement, 64(6), 916-924.

Tabachnick, B ., & Fidell, L. (1996). Using Multivariate Statistics. Third Edition. New York: HarperCollins.