základy statistiky

48
Základy Základy statistiky statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU

Upload: ita

Post on 05-Jan-2016

55 views

Category:

Documents


3 download

DESCRIPTION

Základy statistiky. MUDr. Michal Jurajda, PhD. ÚPF LF MU. Definice. Statistika - věda Statistika - statisticky vyjádřené šetření. Statistika jako věda - definice. soubor postupů užívaných při sběru, zpracování a interpretaci dat směřujících ke zlepšení rozhodování - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Základy statistiky

Základy statistikyZáklady statistiky

MUDr. Michal Jurajda, PhD.

ÚPF LF MU

Page 2: Základy statistiky

DefiniceDefinice

Statistika - věda Statistika - statisticky vyjádřené šetření

Page 3: Základy statistiky

soubor postupů užívaných při sběru, zpracování a interpretaci dat směřujících ke zlepšení rozhodování

Soubor metod, které nám umožňují činit rozumná rozhodnutí v případě nejistoty.

Statistika jako věda - definiceStatistika jako věda - definice

Page 4: Základy statistiky

Slovo statistika má stejný původ jako slovo stát

Statistika vychází jako matematická věda především z počtu pravděpodobnosti a teorie her.

Studuje převážně tak zvané hromadné jevy

Page 5: Základy statistiky

StatistikaStatistika

popisná – základní

charakteristika získaných dat

vyčerpávající šetření

analytická, induktivní – charakterizace

určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru

výběr

Page 6: Základy statistiky

StatistikaStatistika

testování hypotéz explorativní statistika data mining

Page 7: Základy statistiky

Statistika a lékařStatistika a lékař

„sběratel“ dat „konzument“ výsledků

Page 8: Základy statistiky

Statistika se zabývá Statistika se zabývá variabilitou měřenívariabilitou měření

Metodologická, přesnost měření Časová, v rámci individua =

intraindividuální variabilita Interindividuální variabilita = populační

Page 9: Základy statistiky

Statistika opakovaných měřeníStatistika opakovaných měření

Sledujeme správnost a přesnost měření Měření

– Správné a přesné– Správné a nepřené– Nesprávné a přesné– Nesprávné a nepřesné

Page 10: Základy statistiky
Page 11: Základy statistiky

Zpracování naměřených datZpracování naměřených dat

Kontrola konzistence dat Zobrazení dat Testy normality (Vyřazení výsledků ovlivněných velkou

chybou) Odhad středních hodnot a variability

Page 12: Základy statistiky

Variabilita populacíVariabilita populací

Srovnávání populace s teoretickým předpokladem

Srovnávání populací mezi sebou

Page 13: Základy statistiky

StatistikaStatistika

experimentální design popisná analýza testování hypotéz explorativní statistika data mining

Page 14: Základy statistiky

Sběr datSběr dat data

– kvalitativní• kategoriální, nominální (např. pohlaví)

potřeba kódování

– kvantitativní • diskrétní x kontinuální (spojitá)• ordinální (např. známky ve škole 1,2,3,4,5)• intervalová• poměrová

Page 15: Základy statistiky

Sběr datSběr dat

měřítka– přímo naměřená hodnota– intervalové (o kolik?)– poměrové (kolikrát?)

Page 16: Základy statistiky

Sběr datSběr dat Vztah základní soubor x výběr

– každý prvek základního souboru musí mít stejnou pravděpodobnost, že se stane prvkem výběru!!!!

Definice výběrových kritérií / kritérií exkluze

Opakovatelnost výběru

Page 17: Základy statistiky

Sběr datSběr dat

dostupnost dat úplnost dat spolehlivost dat cena dat

Úvahy zahrnuté v plánování experimentu!!!!

Page 18: Základy statistiky

Sběr datSběr dat Databáze

– záznam: nositel znaku– pole: znaky/proměnné

Pole 1 Pole 2 Pole 3 Pole 4 Pole 5Záznam 1

Záznam 2

Záznam 3

Záznam 4

Data

Page 19: Základy statistiky

Zobrazení datZobrazení dat tabulka, četnostní tabulka, histogram četností)

originální setříděná histogramdata data115 <100: 0135 100-110: 1120 111-120: 0140 121-130: 2125 131-140: 4130 141-150: 8150 151-160: 4145 161-170: 11. >171: 0..

0

2

4

6

8

10

12

Page 20: Základy statistiky

hodnota sledované veličiny

četnost

Page 21: Základy statistiky

Zobrazení datZobrazení dat histogram box and whisker plot sloupcový graf koláčový graf

0

10

20

30

40

50

60

70

80

90

1. čtvrt. 2. čtvrt. 3. čtvrt. 4. čtvrt.

Boxplot by Group

Variable: m_slezina

Median 25%-75% Min-Max kontrola 3dny 3tydny

skup

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,1

1,2

m_

sle

zin

a

Histogram: Htc

K-S d=,14083, p> .20; Lilliefors p<,15 Expected Normal

0,20 0,25 0,30 0,35 0,40 0,45

X <= Category Boundary

0

2

4

6

8

10

12

14

16

18

No

. o

f o

bs.

Page 22: Základy statistiky

Zobrazení datZobrazení dat Tabulky absolutních četností Relativní četnost

– porovnání zastoupení jednotlivých kategorií mezi různě velikými skupinami

– vyjádření struktury, vztahu části k celku– indexy pro porovnání vývoje v čase (pevný

základ a zřetězený index)

Page 23: Základy statistiky

Popis datPopis dat

Distribuce– normální– Poissonova– binomická

Testy normality

Page 24: Základy statistiky

Popis datPopis dat

míry polohy– průměr ()– medián (= 50 percentil, frekvenční střed)– modus (= nejčastější hodnota)

Page 25: Základy statistiky

Popis datPopis dat

míry variability– min-max (=rozsah, range)– kvantily (horní 25%, dolní 75%)– směrodatná odchylka (SD, )– rozptyl (2)

Page 26: Základy statistiky

Normální rozloženíNormální rozložení

Page 27: Základy statistiky

symetrické

průměr=medián=modus

asymetrická

medián

průměr

Page 28: Základy statistiky

-3 -2 -1 +1 +2 +3 =medián =modus

Page 29: Základy statistiky

-3 -2 -1 +1 +2 +3 =medián =modus

68%

95,5%

99,7%

Page 30: Základy statistiky

Variabilita - příčinyVariabilita - příčiny

opakovaná měření, např. teploty18,2°C18,5°C19,1°C18,7°C variabilita výšky v populaci

180cm175cm165cm157cm

proměnlivost biologických společenstev

mezipopulační rozdílyrasové rozdíly

= BIODIVERZITA

časová proměnlivostfluktuace

čas

Page 31: Základy statistiky

symetrické

průměr=medián=modus

asymetrická

medián

průměr

Page 32: Základy statistiky

Transformace dat

Page 33: Základy statistiky

Odhady parametrů rozloženíOdhady parametrů rozložení

Vztahujeme na základní soubor

– průměr μ, směrodatná odchylka σ

Výběrové charakteristiky– průměr ,

směrodatná odchylka s

x

Page 34: Základy statistiky

PříkladyPříklady

Popisná statistika a zobrazení získaných dat

Page 35: Základy statistiky

Statistická indukceStatistická indukce

základní soubor (populace)

– soubor prvků, o kterém chceme statistickými metodami něco zjistit

výběr– reprezentativní část

dané populace (zákl. souboru), která má sloužit k odvození závěrů platných pro celou populaci

Page 36: Základy statistiky

Testování hypotézTestování hypotéz

porovnání výběrového souboru a teorie o základním souboru

porovnání dvou základních souborů na základě porovnání dvou výběrů

nulová hypotéza alternativní hypotéza

Page 37: Základy statistiky

Chyba 1. a 2. typuChyba 1. a 2. typu

Page 38: Základy statistiky

Postup při testování Postup při testování hypotézhypotéz

vyslovení hypotéz volba testu volba pravděpodobnosti chyby

zamítnutí, hladiny významnosti α výpočet zamítnutí/nezamítnutí nulové hypotézy

Page 39: Základy statistiky

Statistické testyStatistické testy

parametrické(pro normální nebo téměř normální rozložení)

neparametrické(pro jiné nežnormální rozložení)

testy nepárové párové

• t-test nezávislý(klasický t-test, two-sample)

• Mann-Whitney(=Wilcoxon nezávislý)

• mediánový test

• t-test závislý(one-sample)

• Wilcoxon závislý

• znaménkový test

srovnání parametrumezi 2 skupinamiobjektů

srovnání parametruu stejných objektův časové souslednosti

Page 40: Základy statistiky

Kontingenční tabulkyKontingenční tabulky

Chi-square Fischer exact test

Page 41: Základy statistiky

Regresní a korelační Regresní a korelační analýza analýza

Sleduje závislost dvou proměnných– Formální korelace– Korelace způsobená nehomogenitou– Korelace způsobená třetí veličinou

Page 42: Základy statistiky

Mnohorozměrná analýza datMnohorozměrná analýza dat

Shluková analýza

Page 43: Základy statistiky

Příklad 1Příklad 1

Porovnejte mzdy ve dvou virtuálních nemocnicích.

Stanovte hlavní rozdíly a porovnejte vypovídací schopnost aritmetického průměru o skutečném stavu

Page 44: Základy statistiky

Příklad 2Příklad 2

Porovnejte hmotnosti pacientů a zdravých jedinců

Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku,

rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Page 45: Základy statistiky

Příklad 3Příklad 3

Porovnejte systolický krevní tlak u pacientů před terapií a po terapii.

Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku,

rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Page 46: Základy statistiky

Příklad 4Příklad 4

Porovnejte hladiny IgE u pacientů a zdravých jedinců

Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku,

rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Page 47: Základy statistiky

Příklad 5Příklad 5

Analyzujte tabulku 2x2 Vyslovte nulovou a alternativní

hypotézu. Otestujte tabulky Fischer exact testem

Page 48: Základy statistiky

Příklad 6Příklad 6

Korelujte 10 řad náhodných čísel a interpretujte výsledek korelace