p-reikšmė

32
STATISTINĖS IŠVADOS ATSITIKTINUMO ĮVERTINIMAS Aušra Beržanskytė •Tikimybė •Hipotezės tikrinimas

Upload: valda-pauzuolyte

Post on 15-Jul-2016

12 views

Category:

Documents


5 download

DESCRIPTION

p-value

TRANSCRIPT

Page 1: P-reikšmė

STATISTINĖS IŠVADOS

ATSITIKTINUMO ĮVERTINIMAS

Aušra Beržanskytė

•Tikimybė•Hipotezės tikrinimas

Page 2: P-reikšmė

TIKIMYBĖ Išeičių dalis, kartojant eksperimentą daug

kartų. 0-1; iš 100 kūdikių 48 berniukai, tikimybė 0,48. Suma / atimtis atskirų tikimybių (1) – visiškai

nepriklausomi reiškiniai:- O:0,46; A:0,43; B:0,08; AB:0,03- 48 berniukų tikimybė 0,48, mergaičių 0,52.Jei nėra visiškai nepriklausomi - persikloja. Suma negalima.

Iš jos reikia atimti persiklojimo tikimybę.

Sandauga, jei reiškiniai nepriklausomi:- 3 žmonės O kr. gr. – 0,46x0,46x0,46=0,097- Jei reiškiniai priklausomi, sandauga netinka (pvz. tėvo ir

sūnaus ūgis)Aušra Beržanskytė

Page 3: P-reikšmė

TIKIMYBĖ

Imties (tyrimo) ir generalinės aibės ryšiui – tikimybės idėja.

Tikimybių skirstiniai: empiriniai – iš stebėtų duomenų; teoriniai – nusakoma matematinėmis

funkcijomis Naudojama apskaičiuoti teorines tikimybes Parametriniams metodams

Aušra Beržanskytė

Page 4: P-reikšmė

TIKIMYBĖ

Tikimybinis skirstinys – tai atsitiktinio dydžio (kuris atrenkamas atsitiktinai) skirstinys

2 pagrindiniai skirstiniai: Normalus (Gauso kreivė) – skaitmeniniams

kintamiesiems Binominis – kategoriniams dvinariams

kintamiesiems Puasono – retiems įvykiams

Aušra Beržanskytė

Page 5: P-reikšmė

TIKIMYBĖ

Idėja naudojama dviejų reiškinių priklausomybės įvertinimui, pvz. jei veiksnio paplitimo tarp ligonių ir kontrolinių, tikimybė skirtinga, reiškiniai nėra nepriklausomi.

Aušra Beržanskytė

Page 6: P-reikšmė

HIPOTEZĖS TIKRINIMAS

Kaip PI apibendrinimui Efektas ar tikrai, ar atsitiktinis

Tyrimo hipotezė Statistinė hipotezė – dalis statistinio

tyrimo. Dažniausiai siekiame atmesti H0.Statistinė hipotezė - teiginys apie populiacijos

parametrą, bet ne apie imties statistiką, neįrodoma, o tik priimama arba atmetama, atsižvelgiant į imties duomenis.

Aušra Beržanskytė

Page 7: P-reikšmė

HIPOTEZĖS TIKRINIMO ŽINGSNIAI:

1) Keliamas klausimas:

H0: μ1=μ2; p1=p2; (RR=1, OR=1, skirtumas=0)

Arba alternatyvi hipotezė:HA: μ1≠μ2; p1≠p2:

Kryptinga ar ne (vienpusis testas, dvipusis testas)

Aušra Beržanskytė

Page 8: P-reikšmė

HIPOTEZĖS TIKRINIMO ŽINGSNIAI:

2) Reikšmingumo lygio pasirinkimas α Kiek norima būti tikriems, atmetant

H0, t. y. kiek daug kartų iš 100 leisime paskelbti apie neteisingą H0.

α - I tipo klaida (klaidingai teigiamas rezultatas, t.y. atmetama H0, kai iš tikrųjų teisinga)

Paprastai 0,05

Aušra Beržanskytė

Page 9: P-reikšmė

HIPOTEZĖS TIKRINIMO ŽINGSNIAI:

3) Testo pasirinkimas, iš kurio gaunama P reikšmė (t-testas, χ2 ir t.t.).

P reikšmė parodo gauto ryšio (skirtumo) tikimybę, jei iš tikrųjų egzistuoja H0.

Arba P reikšmė yra tikimybė gauti nustatytą rezultatą (skirtumą) dėl ATSITIKTINUMO, kai iš tikrųjų egzistuoja H0.

Aušra Beržanskytė

Page 10: P-reikšmė

HIPOTEZĖS TIKRINIMO ŽINGSNIAI:

4) Gautoji p-reikšmė lyginama su reikšmingumo lygiu iš 2 žingsnio.

Aušra Beržanskytė

Page 11: P-reikšmė

HIPOTEZĖS TIKRINIMASP reikšmė yra nuo 0 iki 1.

Maža P reikšmė rodo žemą suderinamumą tarp H0 ir gauto skirtumo,

nes labai maža tikimybė būtų gauti šį rezultatą, jei H0 yra tikrovėje

reiškia, kad alternatyvi hipotezė yra geresnis duomenų paaiškinimas

leidžia manyti, jog neįtikėtina, kad atsitiktinumas būtų rezultato paaiškinimas.

Aušra Beržanskytė

Page 12: P-reikšmė

STATISTINIAI SUSITARIMAI

P<α, kuri 0,05 yra statistinio reikšmingumo riba

Jei P<0,05, sakome, kad rezultatai negali būti paaiškinami atsitiktinumu, todėl atmetama H0 ir priimama HA.

Jei P≥0.05, sakome, kad rastas skirtumas gali būti dėl atstiktinumo, todėl neatmetame H0.

Aušra Beržanskytė

Page 13: P-reikšmė

HIPOTEZĖS TIKRINIMASNaudojamas konkretus statistinis patikimumo

testas, kuris priklauso nuo tyrimo tipo, matavimo būdo, duomenų tipo jų skirstinio ir t.t.

Aušra Beržanskytė

Page 14: P-reikšmė

HIPOTEZĖS TIKRINIMAS

Aušra Beržanskytė

Testai (tikimybių skirstiniai):-z testas-t testas (vienos imties, dviejų nepriklausomų, dviejų priklausomų)-Χ2 (+ trendui)-F testas -Fišerio tikslusis- Mann-Whitney-Wilcoxon ir kt.

Page 15: P-reikšmė

HIPOTEZĖS TIKRINIMAS

Aušra Beržanskytė

Testo statistika (statistiniai testai) – bendra išraiška:Testas (z)=stebėta reikšmė – hipotetinė reikšmė

stebėtos reikšmės SE

Pvz.: Pacientai sergantys pirmine biliarine ciroze, jų albuminų koncentracija kraujyjeH0=33,5g/l, gauta 34,46g/l, SE=0,397g/lTestas=2,42, p=0,0155

Page 16: P-reikšmė

T-TESTAS

Testas= skirtumas tarp grupiųSE (bendra)

Aušra Beržanskytė

Page 17: P-reikšmė

Χ2 KRITERIJAUS STATISTIKA

Plačiausiai naudojama formulė (kategoriniams duomenims):

čia Oi – nustatyti/stebėti dažniai, Ei – tikėtini dažniai.

Aušra Beržanskytė

Page 18: P-reikšmė

Išeitis+ Išeitis+ Iš viso

F+ a b a+b=r1

F- c d c+d=r1

Iš viso a+c=s1 b+d=s1 a+b+c+d=n

Aušra Beržanskytė

2x2 lentelė

Taikoma formulė adaptuota 2x2 lentelei:Χ2 = n*(a*d-b*c)2 / r1*r2*s1*s2

Page 19: P-reikšmė

Aušra Beržanskytė

PavyzdysGydymo įtaka mirštamumui.1 žingsnis.H0 : Gydymas neturi reikšmės mirštamumui populiacijoje.HA: Gydymas turi reikšmės mirštamumui populiacijoje.

2 žingsnis. α = 0,05.3 žingsnis. χ2

χ2 skirstinio su (r-1)(s-1) laisvės laipsnių (degrees of freedom; df) α lygmens kritinė reikšmė, kur r eilučių skaičius, o s – stulpelių.Apskaičiuojama p-reikšmė.

http://www.graphpad.com/quickcalcs/pvalue1.cfm4 žingsnis. Gautoji p-reikšmė lyginama su pasikliovimo lygmeniu iš 2 žingsnio. Atliekamas sprendimas apie nulinę hipotezę. Užrašoma išvada apie nulinę hipotezę.

Page 20: P-reikšmė

Aušra Beržanskytė

Pavyzdys

1 žingsnis

H0 : Gydymas neturi reikšmės mirštamumui populiacijoje.HA: Gydymas turi reikšmės mirštamumui populiacijoje.

2 žingsnisα=0,05

Page 21: P-reikšmė

Mirė Gyvi Iš viso

Gydyti 36 (a) 14 (b) 50 (r1=a+b)

Negydyti 30 (c) 25 (d) 55 (r2+c+d)

Iš viso 66(s1=a+c)

39(s2=b+d)

105n=a+b+c+d

Aušra Beržanskytė

Pavyzdys

Taikoma formulė adaptuota 2x2 lentelei:Χ2 = n*(a*d-b*c)2 / r1*r2*s1*s2

Χ2 = 105*(36*25-14*30)2 / 50*55*39*66 = 3.42

3 žingsnis

Page 22: P-reikšmė

Mirė Gyvi Iš viso

Gydyti 36 14 50

Negydyti 30 25 55

Iš viso 66 39 105

Mirė Gyvi Iš viso

Gydyti 31,4 18,6 50

Negydyti 34,6 20,4 55

Iš viso 66 39 105

Aušra Beržanskytė

Stebėti dažniai (O) Tikėtini dažniai (E): E=ri*si/n

Taikoma bendra formulė:

(36-31,4)2/31,4+(14-18,6)2/18,6+(30-34,6)2/34,6+(25-20,4)2/20,4= =21,16/31,4+21,16/18,6+21,16/34,6+21,16/20,4= 0,67+1,14+0,61+1,04= 3,46

Pavyzdys

Page 23: P-reikšmė

Aušra Beržanskytė

Pavyzdys

4 žingsnisp-reikšmė lygi 0,063>0,05

Išvada: Vadinasi gydymas ir mirštamumas nėra statistiškai reikšmingai susiję.

Page 24: P-reikšmė

PAVYZDYS 1 žingsnis.

H0 : Gydymas neturi reikšmės mirštamumui populiacijoje.HA: Gydymas turi reikšmės mirštamumui populiacijoje.

2 žingsnis. α = 0,05. 3 žingsnis. χ2 = 3,46.

χ2 skirstinio su (r-1)(c-1) laisvės laipsnių (degrees of freedom; df) α lygmens kritinė reikšmė, kur r eilučių skaičius, o c – stulpelių.Apskaičiuojama p-reikšmė.

http://www.graphpad.com/quickcalcs/pvalue1.cfmp-reikšmė lygi 0,063.

4 žingsnis. Gautoji p-reikšmė lyginama su pasikliovimo lygmeniu iš 2 žingsnio. Atliekamas sprendimas apie nulinę hipotezę. Užrašoma išvada apie nulinę hipotezę.

Prisiminkite, kad jeigu p≥ α , tai hipotezė H0 neatmetama.Išvada: Vadinasi gydymas ir mirštamumas nėra statistiškai reikšmingai susiję.

Aušra Beržanskytė

Reziumė

Page 25: P-reikšmė

KITAS PAVYZDYS

Pvz.: DES (dietilsilbestrolis) ir krūties vėžys RR = 1,4 P reikšmė = 0,10

P daugiau už 0,05, todėl nelaikoma statistiškai reikšmingu.

Aušra Beržanskytė

Page 26: P-reikšmė

DAR APIE P REIKŠMĘ….

P reikšmė atspindi skirtumo ar ryšio buvimą

Galimos didžiulės imtys, kur netgi itin mažas skirtumas, rizikos padidėjimas ar sumažėjimas gali būti statistiškai reikšmingas

Galimos mažos imtys, kur netgi didelis skirtumas, rizikos padidėjimas ar sumažėjimas nėra statistiškai reikšmingas. Aušra Beržanskytė

Page 27: P-reikšmė

Praktinė užduotis P reikšmės ir pasikliautinių intervalų

interpretavimui

Buvo atlikti penki tyrimai, įvertinant tą patį veiksnio - ligos ryšį. Tarkim, jog nebuvo sisteminių klaidų ir TF. Rezultatai pateikti kitoje skaidrėje.

Aušra Beržanskytė

Page 28: P-reikšmė

PRAKTINĖ UŽDUOTIS

Aušra Beržanskytė

Tyrimas Imties dydis

Reliatyvi rizika

P reikšmė 95% PI

A 100 2,0 0,10 0,8 ; 4,2

B 500 2,0 0,06 0,9 ; 3,3

C 1000 3,5 0,02 2,6 ; 4,5

D 2000 3,0 0,015 2,2 ; 3,5

E 2500 3,2 0,001 2,8 ; 3,6

Page 29: P-reikšmė

Paaiškinkite kiekvieno tyrimo rezultatus pagal reliatyvią riziką, P reikšmę ir pasikliautinį intervalą.

Koks ryšys tarp imties dydžio ir pasikliautinio intervalo pločio?

Koks ryšys tarp imties dydžio ir P reikšmės?

Kas duoda daugiau informacijos: P reikšmė ar PI?

Aušra Beržanskytė

Page 30: P-reikšmė

Ar yra ryšys tarp imties dydžio ir reliatyvios rizikos?

Įvertinkite statistinį reikšmingumą pagal P reikšmę?

Įvertinkite statistinį reikšmingumą pagal PI

Kas yra klaidingas - P reikšmė ar pasikliautinis intervalas?

Aušra Beržanskytė

Page 31: P-reikšmė

APIBENDRINIMAS

P reikšmė pasako, kiek nulinė hipotezė suderinama su duomenimis.

PI pasako daugiau: nurodo intervalą, kuriame duomenys gali būti suderinami su hipoteze.

Aušra Beržanskytė

Page 32: P-reikšmė

APIBENDRINIMAS

P reikšmė ir PI nieko nepasako apie kitus galimus gauto rezultato paaiškinimus: bias ir TF.

P reikšmė ir PI nieko nepasako apie biologinį, klinikinį ar visuomenės sveikatos reikšmingumą.

Aušra Beržanskytė