neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/rolp_statisticka terminologija...
TRANSCRIPT
13.3.2017.
1
Kolegij: ROLP
Statistička terminologija I. -raspodjela i prikaz podataka
Doc. Dr. sc. Ksenija Baždarić
ožujak 2017.
Neki temeljni statistički postupci u znanstvenom istraživanju
• odabir uzorka• prikupljanje podataka
određivanje mjerne ljestvice• obrada podataka
raspodjela podatakaopis podataka (prikazi, ...)
KVANTITATIVNI (BROJČANI)
OMJERNA INTERVALNABMI
Krvni tlakRazina glukoze u krvi
Broj djeceBroj napadaja tjedno
Dob (god)
KVALITATIVNI (SKUPNI, KATEGORIČKI )
ORDINALNA NOMINALNAStupanj karcinoma
Bolje, jednako, lošijeNe slažem se, neopredijeljen/a, slažem se (Likertova ljestvica
(stavovi)
SpolPozitivan i negativan nalaz
Krvna grupaPripadnost rasi
VRSTE PODATAKA (mjerne ljestvice)Kvalitativni podatci - nominalna ljestvica
• frekvencije i relativne frekvencije - N(%)• grafički prikaz - stupčasti grafikon
Kvalitativni podatci - ordinalna ljestvica• sve kao kod nominalne ljestvice ali i mjere
središnjice i raspršenja - medijan, mod
Medcalc - kategorijski podatci
13.3.2017.
2
Kada se ispituje vrsta raspodjele?
... SAMO kada podaci vaših istraživanja pripadaju
INTERVALNOJ iliOMJERNOJ mjernoj ljestvici
- kontinuirani brojčani podatci: vrijednosti hemoglobina, broj leukocita u krvi, tjelesna težina, stav prema radu…
http://t2.gstatic.com/images?q=tbn:ANd9GcRH6n8Dpi9
IyT-R8g_XRiUZ84EiKaVOTLCWGVJbi3x1t4TRzfu-vg
Zašto je važno znati kakva je raspodjela podataka?
• za odabir mjere središnjice i mjere varijabilnosti
• za odabir statističkog testa
• u slikovnom prikazu daje jasan uvid u podatke
Mjere središnjice i odstupanja
Najčešće se upotrebljavaju:• aritmetička sredina i standardna devijacija (normalna
raspodjela, velik uzorak)• medijan i raspon (percentili, interkvartili)• interval pouzdanosti (aritmetičku sredina, medijan)
Rjeđe se upotrebljavaju: • varijanca, raspon, standardna pogrješka, mod
Mjere središnjice
Prikazuju prosječnu vrijednost neke skupine rezultata
• Aritmetička sredina• Medijan (središnja vrijednost)• Mod (najčešća vrijednost)
Aritmetička sredina (M, X)• srednja ili prosječna vrijednost
• Prosječna visina studenata • Srednja ocjena svih ispitanika na testu znanja
N
XXXXX
N++++
=...
321
Izračunavanje aritmetičke sredine
1 2 3 4 5
7 8 7 5 8
75
35
5
88775==
++++=X
13.3.2017.
3
Medijan (C)• centralna vrijednost• vrijednost koja se u nizu rezultata poredanih po
rastućem iznosu nalazi točno u sredini
• Raspodjela ispitanika prema životnoj dobi
1 2 3 ... 26 ... 49 50 51
10 18 20 ... 52 ... 80 81 90
Mod (D)• najčešća vrijednost u nizu rezultata poredanih
po rastućem iznosu
• Vrijeme provedeno u bolnici
5 5 6 6 6 6 7 8 8 9 9
Mjere raspršenja
…iskazuju odstupanja rezultata oko neke od mjera središnjice
• standardna devijacija• raspon• kvartili, percentili
Standardna devijacija (SD)• vrijednost prosječnog odstupanja od aritmetičke sredine
• prikaz rezultata mjerenja (x ± 1 SD)• 95% granice pouzdanosti (x ± 1,96 SD)• varijanca = SD2
( )1
2
−
−Σ=
N
XXSD
Raspon (R)• površna mjera raspršenja (varijabilnosti)• razlika između najveće i najmanje vrijednosti
rezultataR = xnajveći-xnajmanji
• Raspon životne dobi od 10-89; R=79
1 2 3 ... 26 ... 49 50 51
10 18 20 ... 52 ... 80 81 89
Kvartil
• Kvartil je rezultat koji se nalazi točno na četvrtini raspona
• Interkvartilni raspon (IR)• Raspon 25 i 75 percentila (1 i 3 kvartila)• Razlika vrijednosti 3. i 1. kvartila
1 2 5 ... 26 ... 47 50 51
10 18 34 ... 52 ... 71 81 89
Min 1. kvartil 2. kvartil 3. kvartil maxmedijan
13.3.2017.
4
Percentil• vrijednost odstupanja od medijana• određena mjestom gdje se nalazi u nizu
rezultata
1 2 ... 5 ... 26 ... 47 ... 50 51
10 18 ... 34 ... 52 ... 71 ... 81 89
10. percentila 90. percentila
Percentilna krivulja
Vrsta raspodjele određuje odabir mjere središnjice i mjere raspršenja
Normalna raspodjela: M i SDSrednja vrijednost membranskog biopotencijala iznosila je (70 ± 3,5) mV.
Odstupajuća raspodjela: medijan i percentilProsječna životna dob ispitanika iznosila je 52 (34 - 71) godine.
Prikaz rezultata deskriptivne statistike u programu MedCalc
Krivulja normalne raspodjele ili Gaussova krivulja
• simetrična u odnosu na aritmetičku sredinu• zvonolika• oblika koji ovisi o aritmetičkoj sredini i
standardnoj devijacijiSvojstva normalne raspodjele:• (x ± 1 SD) → 68,26% • (x ± 2 SD) → 95,44%• (x ± 3 SD) → 99,73%
Normalna raspodjela99.7 %99.7 %
aritmetička sredinaaritmetička sredina
XX
fxfx
-1SD-1SD-2SD-2SD-3SD-3SD +3SD+3SD+2SD +2SD +1SD +1SD
68 %68 %
95 %95 %
2,2%
13,6%
34% 34%
13,6%
2,2%
0,15%0,15%
13.3.2017.
5
Normalna raspodjela
• podatci se opisuju s pomoću aritmetičke sredine i standardne devijacije
1500 2000 2500 3000 3500 4000 4500 5000
rodna masa
0
10
20
30
40
50
60
70
80
90
100
110
N
Odstupajuća raspodjela
• podaci se opisuju s pomoću medijana i percentila (kvartila, raspona)
10 20 30 40 50 60 70 80 90
% prepisanog teksta
0
2
4
6
8
10
12
14
16
bro
j ra
dova
Kako ispitati normalnost raspodjele?
• Kolmogorov-Smirnovljev test
•P ≥≥≥≥ 0,05 empirijska raspodjela je normalna
•P < 0,05 empirijska raspodjela značajno odstupa od normalne raspodjele
Testiranje normalnosti raspodjele
Vrsta raspodjele određuje odabir statističkog testa
podatci broj skupina
test
Normalna raspodjela
Nezavisni
Zavisni
2
t-test
parni t-test
Odstupajućaraspodjela
Nezavisni
Zavisni
Mann-Whitney
Wilcoxon
Koji prikaz podataka odabrati?
Ovisi o• podatcima• populaciji kojoj se prezentiraju • našem znanju i vještinama
Najčešće se koriste • tablice• slike (grafikoni)
13.3.2017.
6
Tablični prikaz podataka
RB skupina dob spol ...
1 kontrola 56 M ...
... ... ... ... ...1 ispitanici 45 Ž ...
... ... ... ... ...
Vertikalni stupčasti grafikon(2 skupine)
Raspodjela ispitanika prema mjestu korištenja računala
0
5
10
15
20
25
30
35
40
ne služim se kod kuće na radnom mjestu kod kuće i na
radnom mjestu
%
KBC RI
KBD
Kružni dijagram Grafikon okvira s ručicama
Medijan Minimum Maximum 25. - 75. perc.
SE0 42 25 63 35 - 50
SE3 34 18 63 30 - 63
vrijednosti sedimentacije eritrocita prije (SE0) i tri tjedna poslije terapije (SE3)
25. percentil
75. percentil
odstupnici65
SE0 SE3
maksimum
minimum
medijan
60
55
50
45
40
35
30
25
20
15
I na kraju …