anova analiza varijanse (anova)...povezanosti, koji predstavlja meru proporcije varijanse koja je...
TRANSCRIPT
16/11/2018
1
ANOVA
• Novembar 2018
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
2
Analiza varijanse (ANOVA)
• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
3
Analiza varijanse sa jednim faktorom
Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd
4
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
16/11/2018
2
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
5
Univarijacione tehnike za analizu podataka
Neparametarske statističke tehnike
Parametarske statističke tehnike
Podaci su nemetrički (nominalna i ordinalna skala)
Podaci su metrički (intervalna i skala odnosa)
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
6
Parametarske statističke tehnike
- t-test- z-test
Postoji samo jedan uzorak
Postoje dva ili više uzoraka
Nezavisni uzorci
Zavisni uzorci
- t-test- z-test- ANOVA
- Upareni t-test
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
7
Koncepti eksperimentalne analize na koje se pozivamo
U istraživanjima kad kažemo faktor češće mislimo na faktor u faktorskoj analizi
• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.
faktora• Svrha većine statističkih eksperimenata je:
1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i
2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
8
Analiza varijanse sa jednim
faktorom• Naziva se i jednosmerna analiza varijanse;
• Mere se efekti r tretmana jednog faktora na (jednu) varijablu ishoda
• Zatim se proverava da li postoje značajne razlike između srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti
• Računa se odnos između varijanse „između-tretmana“i varijanse „unutar-tretmana“
• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza
16/11/2018
3
Pretpostavke modelaPre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
9 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
10
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
11
Varijansa između tretmana
– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:
, t.j.:
SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost
np – broj opservacija za tretman pr – ukupan broj tretmana
€
SSb = np X p − X ( )2
p =1
r
∑
pXX €
MSSb =SSbr −1
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
12
Varijansa unutar tretmana
– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):
, t.j.:
SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p
np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka
pXipX€
SSw = xip − X p( )2
p =1
r
∑i=1
n p
∑
€
MSSw =SSwN − r
16/11/2018
4
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
13
Ukupna, objašnjena i neobjašnjena varijansa
• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana
• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana
• Ukupna (totalna) varijacija ili totalna suma kvadrata je:
wbt SSSSSS +=
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
14
ANOVA tabela
€
SSb = np X p − X ( )2
p =1
r
∑
€
MSSb =SSbr −1
€
MSSbMSSw
€
SSw = xip − X p( )2
p =1
r
∑i=1
k
∑
€
MSSw =SSwN − r
€
SSt = xip − X ( )2
p =1
r
∑i=1
k
∑
Izvor varijacije
Varijacija, suma kvadrata (SS)
St. slo-bode (df)
Ocena varijanse (MSS) F-odnos
Objašnje-na varijacija
r – 1
Neobjaš-njena varijacija
N – r
Ukupno N – 1
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
15
F-statistika
• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti
• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode
• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji
€
F =MSSbMSSw
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
16
Jačina povezanostir - deskriptivni statistički pokazatelj, mera jačine
povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :
– Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :
t
b
SSSS
=r
€
ˆ ω 2 =SSb − (r −1)MSSw
SSt + MSSw
16/11/2018
5
Primer: Koliko sati učiš nedeljno?
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
17
Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela
Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;
3.U pitanju su nezavisni slučajni uzorci.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
18
Primer: Koliko sati učiš nedeljno? –Test homogenosti varijanse
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
19
p=0,027 < α=0,05 è odbacujemo nultu hipotezu
Nulta hipoteza je da su varijanse reziduala različitihgrupa jednake, t.j. da postoji homoskedastičnost, ilihomogenost varijansi, putem Levinovog testa:
Respecifikacija varijabli putem logaritamske transformacije!
Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
20
16/11/2018
6
Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
21
➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju varijanse
➔Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti.
Kolmogorov-Smirnovljev test normalnosti
• Koristi se za testiranje hipoteze o normalnosti raspodele
• Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati
• Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
22
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
23
• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
24
Ukupna i srednje vrednosti grupa, kao i njihova odstupanja
16/11/2018
7
Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
25
➔Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔Na nivou značajnosti od 10% bismo odbacili Ho i zaključili
bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
26
Analiza varijanse sa više faktora
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
27
Proširena ANOVA tabela
• U ovom modelu postoji više varijabli tretmana (faktora)– Dodavanjem nove varijable tretmana tipično se povećava
objašnjeni varijabilitet– Druga varijabla tretmana se naziva blok-varijabla, jer se
formira jedan ili više blokova– Takođe je moguće da se uključi više varijabli tretmana
• Interakcija– Efekat interakcije znači da uticaj jednog tretmana neće biti
isti za svaki nivo onog drugog tretmana– Hipoteza o tome da nema interakcije se može testirati
korišćenjem ANOVA tabele
Primer dvofaktorske analize: Koliko sati učiš nedeljno?
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
28
16/11/2018
8
• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:
H0: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju,
Ha: postoji razlika među polovima u odnosu na broj časova provedenih u učenju;
H0: korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju,
Ha: korišćenje Fejsbuka utiče na broj časova provedenih u učenju;
H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,
Ha: postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
29
Levinov test jednakosti varijansi reziduala
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
30
p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
31
Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
32
➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju.
16/11/2018
9
• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj
časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj
časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova
provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih
u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u
odnosu na broj časova provedenih u učenju.
Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
33 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd
34
Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo?