analiza varijanse i analiza kovarijanse

43
Analiza varijanse i analiza kovarijanse Jelena Marinković, maj 2012.

Upload: sbstojanovic

Post on 25-Oct-2014

643 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Analiza Varijanse i Analiza Kovarijanse

Analiza varijanse i

analiza kovarijanse

Jelena Marinković, maj 2012.

Page 2: Analiza Varijanse i Analiza Kovarijanse

A šta ćemo danas i narednih dana učiti?

p Koje statističke metode primeniti kada se radi o: n  Više od dva uzorka i/ili n  Više od dve varijable merene na istim

ispitanicima p Zašto u takvim situacijama višestruko

ponavljanje statističkih testova za dva uzorka nije ispravno?

Page 3: Analiza Varijanse i Analiza Kovarijanse

Kako rešiti ovaj problem? (nastavak)

p  Potrebne su neke druge, nove, statističke metode. Prva od njih je:

p Analiza varijanse (analiza varijansnog količnika, ANOVA - ANalysis Of VAriance).

Page 4: Analiza Varijanse i Analiza Kovarijanse

ANOVA Dizajn eksperimenta

Page 5: Analiza Varijanse i Analiza Kovarijanse

Opšte okruženje eksperimenta p  Istraživač kontroliše jednu ili više

nezavisnih varijabli n  ime im je faktori ili varijable tretmana n  svaki faktor ima bar dva nivoa / gradacije,

kategorije, klasifikacije / p  Istraživač meri efekte faktora na zavisnoj

varijabli p  Eksperimentalni dizajn – plan za testiranje

istraživačke hipoteze

Page 6: Analiza Varijanse i Analiza Kovarijanse

Eksperimentalni dizajn / plan, vrste p  Potpuno randomizovani faktorijalni plan

n  eksperimentalne jedinice su slučajno birane i randomizovano se dodeljuju tretmanima

p Randomizovani blok dizajn n  jedinice se dele u blokove i uparuju se jedinice

u različitim uzorcima p Dizajn ponovljenih merenja

n  jedinice se više puta mere

Page 7: Analiza Varijanse i Analiza Kovarijanse

Skala merenja

(samo jedne) rezultujuće varijable

Eksperimentalni dizajni / Istraživački planovi

Faktorijalni eksperiment Randomizovani

potpuni blok dizajn

Dizajn ponovljenih merenja

1 faktor 2 i više faktora 1 faktor i 1 kriterijum

klasifikacije 1 faktor i 1 kriterijum

klasifikacije

Omerna / Intervalna

Jednofaktorska ANOVA

Dvofaktorska i višefaktorske

ANOVE

Dvosmerna ANOVA (ili jednofaktorska

ANOVA sa blokovima)

Jednofaktorska ANOVA sa

ponovljenim merenjima (ili

dvosmerna ANOVA)

Ordinalna Kraskal-Volisova analiza varijanse

sa rangovima

Fridmanova dvosmerna analiza

varijanse sa rangovima

Fridmanova dvosmerna analiza

varijanse sa rangovima

Nominalna

Fišerov varijansni količnik za proporcije

Loglinearni modeli* Kohrejnov Q test Kohrejnov Q test

χ2 test za učestalosti / proporcije

Page 8: Analiza Varijanse i Analiza Kovarijanse

Opšti model analize varijanse p U opštem modelu analize varijanse

odnos variranja uobičajeno se predstavlja sledećim zapisom: Y = X + Z tj. Ukupno variranje (Y) = variranje čiji je izvor u organizovanom delu eksperimenta (X) + variranje čiji je izvor u neorganizovanom delu eksperimenta (Z)

Page 9: Analiza Varijanse i Analiza Kovarijanse

Faktorski varijablitet

grupa 1 grupa 2 grupa 3

x1x

2x3x

Page 10: Analiza Varijanse i Analiza Kovarijanse

Slučajni varijablitet

grupa 1 grupa 2 grupa 3

1x2x

3x

Page 11: Analiza Varijanse i Analiza Kovarijanse

Ukupan varijablitet

grupa 1 grupa 2 grupa 3

x

Page 12: Analiza Varijanse i Analiza Kovarijanse

Šta je ANOVA? p Analiza varijanse (ANOVA) je statistička

metoda zaključivanja zasnovana na generalnim linearnim modelima, koja ukupan varijabilitet skupa podataka deli na bar dve komponente (faktorsku-organizovanu i rezidualnu-slučajnu).

Page 13: Analiza Varijanse i Analiza Kovarijanse

A koje hipoteze testira? p H 0 : µ 1 = µ 2 = ...

= µ k p H 1: sve µ j nisu

jednake.

Page 14: Analiza Varijanse i Analiza Kovarijanse

Tablica sheme rezultata analize varijanse

Izvor variranja Disperzija

Broj stepena slobode

Varijansa F

Između grupa Cx dfx = k-1 sdx

2

Unutar grupa Cz dfz = n-k sdz

2

Opšti Cy dfy = n-1

Page 15: Analiza Varijanse i Analiza Kovarijanse

Višestruka poređenja p Uvek kada analiza varijanse dovede do

odluke o odbacivanju (neprihvatanju) nulte hipoteze postavlja se pitanje koji je par (ili parovi) prosečnih vrednosti značajno različit, odnosno, koju od (u datom primeru 10 mogućih) pojedinačnih hipoteza treba odbaciti.

Page 16: Analiza Varijanse i Analiza Kovarijanse

Metode post hoc testiranja: •  Tukey - najbolji balans odnosa greške prvog i

drugog tipa •  Scheffe – prikladniji nego Tukey ako se veličine

grupa razlikuju značajno •  Dunnett - kada treba porediti nekoliko grupa sa

kontrolnom grupom •  Bonferroni – više konzervativan (manja je

verovatnoća da će biti nađena statistička značajnost) u odnosu na Tukey i Scheffe

•  Newman-Keuls, Duncan, Fisher’s LSD – ne kotrolišu sveukupno alfa, više liberalni

Page 17: Analiza Varijanse i Analiza Kovarijanse

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

Page 18: Analiza Varijanse i Analiza Kovarijanse

Prirodno proširenje ove statističke metode je MANOVA p  Više od jedne zavisne varijable p  Zavisne varijable bi trebalo da budu povezane

konceptualno p  Zavisne varijable bi trebalo da budu slabo do

osrednje statistički povezane (korelisane). Ako između njih ne postoji nikakva povezanost, nema razloga da se one analiziraju zajedno u okviru MANOVA

Page 19: Analiza Varijanse i Analiza Kovarijanse

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

Page 20: Analiza Varijanse i Analiza Kovarijanse

ANCOVA Analiza kovarijanse

Page 21: Analiza Varijanse i Analiza Kovarijanse

ANCOVA – analiza kovarijanse p  Proverava  razlike  između  aritme0čkih  sredina  ishodne  (rezultujuće,  zavisne)  varijable  dve  ili  više  grupa  u  situaciji  kada  znamo  da  je  neka  druga  –  pridružena  varijabla  (kovarijata)  ili  više  njih  povezano  sa  ishodom.    

p  Koris0  se  da  kontroliše  kovarijatu,  tj.  da  otkloni  efekat  pridružene  varijable  kao  izvora  mogućeg  objašnjenja  razlike  tretmana.  

p Najčešće  se  koris0  kada  grupe  nisu  formirane  randomizacijom,  već  su  formirane  same  po  sebi,  npr.  pacijen0  koji  su  primili  određeni  tretman  na  osnovu  nekog  kriterijuma.      

Page 22: Analiza Varijanse i Analiza Kovarijanse

Slide  22  

Varijanse  

Slučajno  variranje Faktorsko  variranje

Ukupno  variranje  podataka

SV Kovarijata  

Page 23: Analiza Varijanse i Analiza Kovarijanse

Prednosti ANCOVE p  Redukuje  slučajnu  varijansu  

n  Objašnjavanjem  dela  slučajnog  variranja  pridruženom  varijablom  slučajna  varijansa  može  bi0  redukovana.  

p  Veća  eksperimentalna  kontrola:  p  Kontrolom  poznate  pridružene  varijable  s0čemo  bolje  

objašnjenje  o  efektu(ima)  faktora.  

p  Sta0s0čki  metod  za  kontrolu  inicijalnih  razlika  varijabli  u  istraživanju.  

Page 24: Analiza Varijanse i Analiza Kovarijanse

Nulta hipoteza u analizi kovarijanse Jednakost prilagođenih aritmetičkih sredina:

H0: µ1* = µ2* = ... = µj* U interpretaciji razmotriti i originalne i

prilagođene aritmetičke sredine.

Page 25: Analiza Varijanse i Analiza Kovarijanse

Prilagođavanje aritmetičkih sredina p  Podrazumeva prilagođavanje aritmetičkih

sredina grupa na one vrednosti koje bi inače imale kada bi sve grupe bile jednake na pridruženoj varijabli. Preduslov je jednakost regresionih nagiba za sve grupe

Page 26: Analiza Varijanse i Analiza Kovarijanse

Izbor pridružene vrijable p Svaka varijabla koja je povezana sa zavisnom

varijablom može biti analizirana kao pridružena varijabla

p Ako je u analizu uključeno više od jedne pridružene varijable, poželjno je da povezanost između njih bude slaba, jer tada svaka od njih uklanja relativno različite delove rezidualnog srednjeg kvadrata

Page 27: Analiza Varijanse i Analiza Kovarijanse

Primer p  Fieldov  (2009)  Viagra  eksperiment:  

n  Ishod  (ili  ZV)  =  Učesnikov  libido  n  Faktor  /  Prediktor  (ili  NV)  =  Doza  vijagre  (Placebo,  Niska  &  Visoka)  

n  Kovarijata  =  Partnerov  libido

Page 28: Analiza Varijanse i Analiza Kovarijanse

Odnosi između NV i kovarijate

Page 29: Analiza Varijanse i Analiza Kovarijanse

Homogenost regresionih nagiba

Page 30: Analiza Varijanse i Analiza Kovarijanse

Dose Par8cipant’s  

Libido Partner’s  Libido

Placebo 3.22  (1.79) 3.44  (2.07)

Low  Dose 4.88  (1.46) 3.12  (1.73)

High  Dose 4.85  (2.12) 2.00  (1.63)

Covariate210 bXbbY ii ++=

iii bDosebbLibido Libido sPartner'210 ++=

Page 31: Analiza Varijanse i Analiza Kovarijanse

Slide  31  

4.854.883.22

0

1

2

3

4

5

Placebo Low High

1.66

Page 32: Analiza Varijanse i Analiza Kovarijanse

ANCOVA u SPSS-u

Page 33: Analiza Varijanse i Analiza Kovarijanse

Kontrasti

Page 34: Analiza Varijanse i Analiza Kovarijanse

Opcije

Page 35: Analiza Varijanse i Analiza Kovarijanse

Slide  35  

Bez  u0caja  kovarijate  

Tests of Between-Subjects Effects

Dependent Variable: Libido

16.844a 2 8.422 2.416 .108535.184 1 535.184 153.522 .00016.844 2 8.422 2.416 .10894.123 27 3.486

683.000 30110.967 29

SourceCorrected ModelInterceptDOSEErrorTotalCorrected Total

Type III Sumof Squares df Mean Square F Sig.

R Squared = .152 (Adjusted R Squared = .089)a.

Page 36: Analiza Varijanse i Analiza Kovarijanse

Slide  36  

Izveštaj  Levene's Test of Equality of Error Variancesa

Dependent Variable: Libido

5.525 2 27 .010F df1 df2 Sig.

Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.

Design: Intercept+PARTNER+DOSEa.

Tests of Between-Subjects Effects

Dependent Variable: Libido

34.750a 3 11.583 3.952 .01912.171 1 12.171 4.152 .05217.906 1 17.906 6.109 .02028.337 2 14.169 4.833 .01676.216 26 2.931

683.000 30110.967 29

SourceCorrected ModelInterceptPARTNERDOSEErrorTotalCorrected Total

Type III Sumof Squares df Mean Square F Sig.

R Squared = .313 (Adjusted R Squared = .234)a.

Page 37: Analiza Varijanse i Analiza Kovarijanse

Slide  37  

SPSS  Output:  Contrasts  

Page 38: Analiza Varijanse i Analiza Kovarijanse

Slide  38  

Output  

Page 39: Analiza Varijanse i Analiza Kovarijanse

Slide  39  

4.854.883.22

0

1

2

3

4

5

Placebo Low High

3.22

4.88   4.85  

Neprilagođene  aritme0čke  sredine

Page 40: Analiza Varijanse i Analiza Kovarijanse

Glavni  efekat  

2.934.71

5.15

0

2

4

6

8

10

Placebo Low High

F(2, 26) = 4.14, p < .05

Page 41: Analiza Varijanse i Analiza Kovarijanse

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

Page 42: Analiza Varijanse i Analiza Kovarijanse

Prirodno proširenje ove statističke metode je MANCOVA p Dve ili više zavisnih varijabli, jedna ili više

pridruženih varijabli p  Pretpostavka je da postoji povezanost

skupa zavisnih varijabli i skupa pridruženih varijabli

Page 43: Analiza Varijanse i Analiza Kovarijanse

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku