arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2 -próbával)

Post on 15-Jan-2016

35 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal). Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat  2 -próbával) Arányok összehasonlítása összetartozó és független minták segítségével Diszkrét változók kapcsolatvizsgálata. - PowerPoint PPT Presentation

TRANSCRIPT

1

8. Gyakorisági táblázatok elemzése (statisztikai elemzések arányokkal, illetve diszkrét változókkal)

2

Arányokra vonatkozó hipotézisek vizsgálata (eloszlásvizsgálat 2-próbával)

Arányok összehasonlítása összetartozó és független minták segítségével

Diszkrét változók kapcsolatvizsgálata

Tartalom

3

Diszkrét változók eloszlásában

Hol találkozunk arányokkal?

4

Példa diszkrét eloszlásra

0 1 2 3

Arány: 0,20 0,35 0,40 0,05

Érték:

5

Néhány példa diszkrét változóra Személy neme (x1 = férfi, x2 = nő)

Iskolázottsági szint (x1 = Alsófok, x2 = Középfok, x3 = Felsőfok)

5-fokú skálaváltozók Diagnózis (x1 = Neurózis, x2 = Szkizofrénia, ...)

Kor (x1 = 18-35 év, x2 = 36-55 év, x3 = 56-99 év)

6

Kvantitatív

Ordinális Nominális

Kvalitatív

Változó típusa

Arány Intervallum

Kiemelt fontosságú diszkrét változók

7

Statisztikai problématípusok arányok esetén

8

–Csoki nyuszitojást milyen színű papírban viszik (veszik) a leginkább? (piros, zöld ...)

–Fiúból, vagy lányból születik-e több?–Szmogriadó esetén, ha csak a páratlan

rendszámú autók közlekedhetnek: Kisebb-e a páros rendszámúak aránya? Kisebb-e 1/3-nál a páros rendszámúak aránya?

1. Eloszlásvizsgálatok

9

–Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között?

–Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

2a. Homogenitásvizsgálatok (Arányok összehasonlítása

független minták segítségével)

10

–Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?

–Változik-e a pártok kedveltségi aránya két vagy több időpont között?

2b. Homogenitásvizsgálatok (Arányok összehasonlítása

összetartozó minták segítségével)

11

–Függ-e a pártpreferencia az iskolázottságtól?–Milyen szoros kapcsolatban van a fenti két

változó egymással?

3. Két diszkrét változó kapcsolatának vizsgálata

(Kapcsolatvizsgálatok)

12

Problématípusok rendszere

Statisztikai probléma típusa

Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat

Független minták Összetartozó minták

13

Példa: A Koronás, a Kádár és a Kossuth címer kedveltsége egy 939 fős mintában.

1. Eloszlásvizsgálatok

Koronás címer

Kádár-címer

Kossuth-címer

Összes személy

708 109 122 939

14

00,10,20,30,40,50,60,70,8

Koronáscímer

Kádár-címer Kossuth-címer

Százalékos megoszlási arányok

15

a) H0: Koronás: 60%, Kádár: 20%, Kossuth: 20%

b) H0: Koronás: 40%, Kádár: 20%, Kossuth: 40%

c) H0: Koronás = Kádár = Kossuth = 33,3%

Lehetséges nullhipotézisek

16

A mintabeli kapott és a nullhipotézis igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása.

g

1i i

2ii2

várt

)vártkapott(

Szabadságfok: f = g - 1

A khi-négyzet-próba alapötlete

17

Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz.

Az eltérés egyik mértéke a 2 próbastatisztika. Ha igaz H0, ez a mennyiség közelítőleg 2-eloszlású.

Ha 2 elég nagy, akkor H0-t elutasítjuk.

Eloszlásvizsgálat khi-négyzet-próbával

18

A 2-próba végrehajtása

2 = (708-313)2/313 + ...8920920,01

921 (f = 2; p < 0,01 szignifikáns)

Mivel a 2-érték elég nagy, a nullhipotézist elutasítjuk.‘A 3 címert kedvelők aránya szignifikánsan különbözik.’

708 109 122 =939

Várt gyak. 313 313 313

Kapottgyak.

=939

19

Adatok: 1000 személy pártpreferencia értékei: melyik pártra szavazna?

Értékek: FIDESZ, MDF, MSZP, SZDSZ, JOBBIK, Egyéb (más párt vagy nem válaszol)

Kapott gyakoriságok:

n1 = 515, n2 = 13, n3 = 145, n4 = 12, n5 = 115

Másik példa: Választás 2010

20

Bekerül-e a parlamentbe az SZDSZ? – Nullhipotézis: P(SZDSZ) = 0,05

– Adatok: n1 = 12, n2 = 790, várt gyak. = ?

Győz-e az MSZP-vel szemben a FIDESZ?– Nullhipotézis: P(FIDESZ) = P(MSZP)

– Adatok: n1 = 515, n2 = 145, várt gyak. = ?

Megválaszolandó kérdések

21

2a. Két populáció összehasonlítása diszkrét változó segítségével

Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében?

Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok

22

116 15 32 n1 =163

Vidék 592 94 90

Bpest

n2 =776

Kétszempontosgyakorisági táblázat Koronás Kádár Kossuth Össz.

Össz.: 708 109 122 N =939

23

Arányok összehasonlítása (sorösszegek szerinti százalékok)

71,2% 9,2% 19,6% 100%

Vidék 76,3% 12,1% 11,6%

Bpest

100%

Koronás Kádár Kossuth Össz.

24

H0 igaz volta esetén a

próbastatisztika 2-eloszlást követ. Szabadságfok: f = (sorok száma - 1)(oszlopok száma - 1).

2 < 20,05: H0-t 5%-os szinten nem utasítjuk el.

2 20,05 : H0-t 5%-os szinten elutasítjuk.

j,i ij

2ijij2

várt

)vártkapott(

Általános khi-négyzet-próba

25

A címeres példa eredménye

Sorok száma: g = 2Oszlopok száma: h = 3Szabadságfok: f = (2-1)(3-1) = 12 = 2Kritikus értékek:

- 20,05 = 5,991 - 2

0,01 = 9,210Kiszámított khi-négyzet-érték: 2 = 8,144 Döntés: H0-t 5%-os szinten elutasítjuk.

26

A várt gyakoriságok ne legyenek kb. 5-nél kisebbek.

Engedmény: elég, ha 80%-ra teljesül.Például egy 22-es táblázatban 4 cella

van, ezért ezekre mind teljesülnie kell.

A 2-próba alkalmazási feltétele

27

Kis gyakoriságú sorok vagy oszlopok összevonása.

Nagyobb minta választása.22-es táblázat esetén a 22-es 2-próba

helyett a Fisher-egzakt-próba.

Mit tehetünk, ha az alkalmazási feltétel nem teljesül?

28

Példa oszlopok összevonására

Isk. szint 0 1 2 3 4 Össz.

Alsófok 3 2 16 10 24 55

Középfok 0 2 10 13 20 45

Felsőfok 0 4 17 5 16 42

Össz. 3 8 43 28 60 142

h6 változó értékei

29

Férfiak és nők feminitása (CPI)

0

10

20

30

40

50

60

70

80

90

100

Férfi Nő

Alacsony Fem

Magas Femszáz

alék

30

Fem ≤ 11 Fem > 11

Férfi (n = 12) 6 6Nő (n = 70) 7 63

2 = 12,286 (f = 1, p < 0,01), vártmin = 1,9

Fisher-egzakt-próba: p = 0,0027

Példa a Fisher-egzakt-próbára

31

– Két dichotóm változó összehasonlítása (McNemar-próba, Előjelpróba)

– Ketőnél több dichotóm változó összehasonlítása (Cochran-féle Q-próba)

– Két tetszőleges diszkrét változó összehasonlítása (Általános McNemar-próba, Bowker-féle szimmetria-próba)

2b. Összetartozó mintás homogenitásvizsgálatok

32

Két helyzet vagy időpont összehasonlítása egy dichotóm változó segítségével

Példa: Középiskolai osztályban előadást tartanak a dohányzás ártalmáról. 36 tanuló közül 8 leszokik, 3 rászokik a dohányzásra. Hatásos-e az előadás?

Nullhipotézis: A dohányzás változójának eloszlása az előadás előtt és után ugyanaz.

–Különbségváltozó: x1= leszokik, x2 = rászokik

–Nullhipotézis: H0: P(leszokás) = P(rászokás)

33

Adattáblázat:

Képlet és számolás: McNemar-próba

Alkalmazási feltétel: (b+c)/2 5

Hogyan lehetne itt az előjelpróbát alkalmazni?

Dohányzik? Utána igen Utána nemElőtte igen a b = 8Előtte nem c = 3 d

22 2

0 1028 3

8 32511

2 27

b c

b c

34

1. általánosítás: X dichotóm, h számú összetartozó minta összehasonlítása

Nullhipotézis: A h számú dichotóm változó eloszlása ugyanaz

35

Szakmai példa: h számú tesztkérdés nehézségének az összehasonlítása

Személy item1 item2 item3 item4

1. 0 1 1 0

2. 1 1 0 0

3. 0 0 1 0

4. 0 1 0 1 ... ... ... ... ...

Megoldási arány 0,28 0,56 0,48 0,22

36

Másik szakmai példa: elvonó kúra után állapotrögzítés több időpontban

Személy 1. hónap 3. hónap 6. hónap 9. hónap

1. 0 1 1 0

2. 1 1 0 0

3. 0 0 1 0

4. 0 1 0 1 ... ... ... ... ...

Visszaesők aránya 0,18 0,26 0,32 0,30

37

Cochran-féle Q-próba Nullhipotézis: A h számú dichotóm változó

eloszlása ugyanaz az 1 (és úgyszintén a 0) érték elméleti arányai megegyeznek

Alkalmazási feltétel: nh 24–n: személyek száma; h: változók száma

Próbastatisztika: Q, mely H0 igaz volta esetén közelítőleg 2-eloszlást követ

38

2. általánosítás: X tetszőleges, de csak két összetartozó mintát hasonlítunk össze (változik-e X eloszlása az egyik

helyzetről/időpontról a másikra?)

Sima McNemar-próba általánosítása: Általános McNemar-próba (vagy Bowker-féle szimmetria-próba)

39

2 diszkrét változó kapcsolatának vizsgálata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Kapcsolatvizsgálat homogenitásvizsgálat

Dohányzik Igen Nem ÖsszesenIgen 105 17 122Nem 469 340 809Összesen 574 357 931

40

Sorösszegek szerinti százalékok táblázata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Dohányzik Igen Nem ÖsszesenIgen 86,1 13,9 100Nem 58,0 42,0 100Összesen 61,7 38,3 100

41

A pártpreferencia függése az életkortól és a nemtől

• A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz.• A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

42

Függ-e ennek a személynek a kedveltsége az iskolai végzettségtől?

Iskolázottság és szimpátia

43

Eloszlás a 3 iskolázottsági szinten

0

10

20

30

40

50

Neg+ Neg 0 Poz Poz+

száz

alék

alsófok középfok felsőfok

44

X és Y függetlensége

• X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett• Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett• A függetlenség kölcsönös

45

A kapcsolat szorosságának mérése diszkrét változók esetén

Cramér-féle V kontingencia-együttható:

Ha X és Y független, V = 0. 0 ≤ V ≤ 1.

VN g h

2

1(min( , ) )

46

A kapcsolat szorosságának mérése dichotóm változók esetén

Dichotóm (kétértékű) változók esetén V φ kontingencia együttható, |φ| = V

-1 ≤ φ ≤ 1φ = Pearson-féle r korrelációs együttható

a sor- és az oszlopváltozó között

47

A kapcsolat szorosságának mérése dichotóm változók esetén

Kontingencia-együttható (φ) Pearson korreláció a numerikusan kódolt

dichotóm változók között

Yule-féle asszociációs együttható (, Y) Kendall-féle gamma dichotóm változókkal

Alfa esélyhányados

48

Az alfa esélyhányadosX= „” X=„+”

Y = férfi a b

c dY = nő

Alfa = (b/a) : (d/c) Ha alfa = 1, nincs különbség a 2 csoport között Ha alfa nagyon kicsi vagy nagyon nagy, komoly

különbség van a 2 csoport között

49

A φ együttható jelentése Kódoljuk X értékeit az 1 és a 2 számmal

(pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2

számmal (pl. 1 = igen, 2 = nem). φ a Pearson-féle korrelációs együttható

X és Y között

50

A együttható jelentése Kódoljuk X értékeit az 1 és a 2 számmal

(pl. 1 = férfi, 2 = nő). Kódoljuk Y értékeit ugyancsak az 1 és a 2

számmal (pl. 1 = igen, 2 = nem). a pozitív és a negatív együttjárás %-os

arányának különbsége (Kendall-féle Γ)

51

A kapcsolat szorosságának mérése ordinális változók esetén

Ordinális skálájú változók esetén: Kendall-féle monotonitási (asszociációs) együttható.

Jelentés: pozitív kapcsolat relatív fölénye a negatívval szemben: (Poz-Neg)/(Poz+Neg)

Egyirányú függés mérése:

Somers-féle monotonitási mérőszámok

top related