anova analiza varijanse (anova)...povezanosti, koji predstavlja meru proporcije varijanse koja je...

9
16/11/2018 1 ANOVA Novembar 2018 Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 2 Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom Proširena ANOVA tabela Novembar 2018 Istraživanje tržišta Ekonomski fakultet , Beograd 3 Analiza varijanse sa jednim faktorom Decembar 2012 Istraživanje tržišta Ekonomski fakultet , Beograd 4 Tehnike za analizu podataka Univarijacione tehnike Multivarijacione tehnike Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno

Upload: others

Post on 23-Jan-2020

23 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

1

ANOVA

• Novembar 2018

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

2

Analiza varijanse (ANOVA)

• Analiza varijanse sa jednim faktorom• Proširena ANOVA tabela

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

3

Analiza varijanse sa jednim faktorom

Decembar 2012 Istraživanje tržištaEkonomski fakultet, Beograd

4

Tehnike za analizu podataka

Univarijacione tehnike

Multivarijacione tehnike

Posmatra se samo jedna promenljiva

Posmatra se više promenljivih istovremeno

Page 2: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

2

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

5

Univarijacione tehnike za analizu podataka

Neparametarske statističke tehnike

Parametarske statističke tehnike

Podaci su nemetrički (nominalna i ordinalna skala)

Podaci su metrički (intervalna i skala odnosa)

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

6

Parametarske statističke tehnike

- t-test- z-test

Postoji samo jedan uzorak

Postoje dva ili više uzoraka

Nezavisni uzorci

Zavisni uzorci

- t-test- z-test- ANOVA

- Upareni t-test

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

7

Koncepti eksperimentalne analize na koje se pozivamo

U istraživanjima kad kažemo faktor češće mislimo na faktor u faktorskoj analizi

• Varijabla ishoda – zavisna varijabla• “Faktori” – nezavisne varijable• Tretmani – različiti nivoi nezavisnih varijabli, t.j.

faktora• Svrha većine statističkih eksperimenata je:

1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i

2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

8

Analiza varijanse sa jednim

faktorom• Naziva se i jednosmerna analiza varijanse;

• Mere se efekti r tretmana jednog faktora na (jednu) varijablu ishoda

• Zatim se proverava da li postoje značajne razlike između srednjih vrednosti različitih tretmana:H0: μ1 = μ2 = μ3 = . . . = μrHa: najmanje 2 od μ1, μ2, μ3, . . . , μr su različiti

• Računa se odnos između varijanse „između-tretmana“i varijanse „unutar-tretmana“

• Ako je varijansa „između“ značajno veća nego varijansa „unutar“, odbacuje se nulta hipoteza

Page 3: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

3

Pretpostavke modelaPre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;3.U pitanju su nezavisni slučajni uzorci.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

9 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

10

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

11

Varijansa između tretmana

– Ocena varijanse „između“ tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana:

, t.j.:

SSb – suma kvadrata između nivoa tretmana – srednja vrednost za tretman p– ukupna srednja vrednost

np – broj opservacija za tretman pr – ukupan broj tretmana

SSb = np X p − X ( )2

p =1

r

pXX €

MSSb =SSbr −1

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

12

Varijansa unutar tretmana

– Ocena varijanse „unutar“ tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana (“neobjašnjena”):

, t.j.:

SSw – suma kvadrata unutar tretmana – srednja vrednost za tretman p– realizacija i za nivo tretmana p

np – ukupan broj opservacija za tretman pr – ukupan broj tretmanaN – ukupna veličina uzorka

pXipX€

SSw = xip − X p( )2

p =1

r

∑i=1

n p

MSSw =SSwN − r

Page 4: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

4

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

13

Ukupna, objašnjena i neobjašnjena varijansa

• Varijansa između tretmana se naziva i varijansom “objašnjenom” nivoom tretmana

• Varijansa unutar tretmana se naziva i varijansom “neobjašnjenom” nivoom tretmana

• Ukupna (totalna) varijacija ili totalna suma kvadrata je:

wbt SSSSSS +=

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

14

ANOVA tabela

SSb = np X p − X ( )2

p =1

r

MSSb =SSbr −1

MSSbMSSw

SSw = xip − X p( )2

p =1

r

∑i=1

k

MSSw =SSwN − r

SSt = xip − X ( )2

p =1

r

∑i=1

k

Izvor varijacije

Varijacija, suma kvadrata (SS)

St. slo-bode (df)

Ocena varijanse (MSS) F-odnos

Objašnje-na varijacija

r – 1

Neobjaš-njena varijacija

N – r

Ukupno N – 1

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

15

F-statistika

• Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti

• Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode

• Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji

F =MSSbMSSw

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

16

Jačina povezanostir - deskriptivni statistički pokazatelj, mera jačine

povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka :

– Vrednost r na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti :

t

b

SSSS

=r

ˆ ω 2 =SSb − (r −1)MSSw

SSt + MSSw

Page 5: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

5

Primer: Koliko sati učiš nedeljno?

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

17

Primer: Koliko sati učiš nedeljno? –Provera pretpostavki modela

Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela:1.Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti;2.Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse;

3.U pitanju su nezavisni slučajni uzorci.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

18

Primer: Koliko sati učiš nedeljno? –Test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

19

p=0,027 < α=0,05 è odbacujemo nultu hipotezu

Nulta hipoteza je da su varijanse reziduala različitihgrupa jednake, t.j. da postoji homoskedastičnost, ilihomogenost varijansi, putem Levinovog testa:

Respecifikacija varijabli putem logaritamske transformacije!

Primer: Koliko sati učiš nedeljno? –Logaritmovani podaci

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

20

Page 6: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

6

Primer: Koliko sati učiš nedeljno? –Ponovljeni test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

21

➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju varijanse

➔Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti.

Kolmogorov-Smirnovljev test normalnosti

• Koristi se za testiranje hipoteze o normalnosti raspodele

• Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati

• Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

22

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

23

• Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele!

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

24

Ukupna i srednje vrednosti grupa, kao i njihova odstupanja

Page 7: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

7

Primer: Koliko sati učiš nedeljno? –ANOVA izlazna tabela

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

25

➔Na nivou značajnosti od 5% ne bismo odbacili Ho; ➔Na nivou značajnosti od 10% bismo odbacili Ho i zaključili

bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

26

Analiza varijanse sa više faktora

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

27

Proširena ANOVA tabela

• U ovom modelu postoji više varijabli tretmana (faktora)– Dodavanjem nove varijable tretmana tipično se povećava

objašnjeni varijabilitet– Druga varijabla tretmana se naziva blok-varijabla, jer se

formira jedan ili više blokova– Takođe je moguće da se uključi više varijabli tretmana

• Interakcija– Efekat interakcije znači da uticaj jednog tretmana neće biti

isti za svaki nivo onog drugog tretmana– Hipoteza o tome da nema interakcije se može testirati

korišćenjem ANOVA tabele

Primer dvofaktorske analize: Koliko sati učiš nedeljno?

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

28

Page 8: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

8

• Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze:

H0: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju,

Ha: postoji razlika među polovima u odnosu na broj časova provedenih u učenju;

H0: korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju,

Ha: korišćenje Fejsbuka utiče na broj časova provedenih u učenju;

H0: nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju,

Ha: postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

29

Levinov test jednakosti varijansi reziduala

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

30

p=0,021 < α=0,05 è odbacujemo nultu hipotezuRespecifikacija varijabli putem logaritamske transformacije!

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

31

Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

32

➔Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju.

Page 9: ANOVA Analiza varijanse (ANOVA)...povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : –Vrednost rna bazi uzorka teži da bude pristrasna

16/11/2018

9

• Hipoteze koje testiramo:H0: ne postoji razlika među polovima u odnosu na broj

časova provedenih u učenju,Ha: postoji razlika među polovima u odnosu na broj

časova provedenih u učenju;H0: korišćenje Fejsbuka ne utiče na broj časova

provedenih u učenju,Ha: korišćenje Fejsbuka utiče na broj časova provedenih

u učenju;H0: nema interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju,Ha: postoji interakcije između pola i korišćenja Fejsbuka u

odnosu na broj časova provedenih u učenju.

Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

33 Novembar 2018 Istraživanje tržištaEkonomski fakultet, Beograd

34

Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo?