cvičebnice statistiky

174
Projekt Zdravotnické studijní programy v inovaci na FZS Univerzity Pardubice CZ.1.07/2.2.00/15.0357 Cvičebnice statistiky Cíl: procvičit statistické zpracování dat na modelových příkladech, za použití statistického programu IBM SPSS Statistics (verze 19) Září 2012

Upload: hedwig-phillips

Post on 01-Jan-2016

55 views

Category:

Documents


8 download

DESCRIPTION

Projekt Zdravotnické studijní programy v inovaci na FZS Univerzity Pardubice CZ.1.07/2.2.00/15.0357. Cvičebnice statistiky Cíl: procvičit statistické zpracování dat na modelových příkladech, za použití statistického programu IBM SPSS Statistics (verze 19) Září 2012. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Cvičebnice statistiky

Projekt Zdravotnické studijní programy v inovaci na FZS Univerzity Pardubice CZ.1.07/2.2.00/15.0357

Cvičebnice statistiky

Cíl: procvičit statistické zpracování dat na modelových příkladech, za použití statistického

programu IBM SPSS Statistics (verze 19)

Září 2012

Page 2: Cvičebnice statistiky

Předpokládá se, že student již rozumí základním principům statistického zpracování dat i používané terminologii. Student by měl již chápat, že základní otázkou statistické indukce je získání určitých závěrů o populaci na základě výsledků zjištěných na náhodném výběru z populace. Statistická indukce v sobě zahrnuje riziko omylu. Přitom se zabýváme testováním hypotéz (hypotézy nulové a alternativní). Student by již měl tomuto procesu rozumět, měl by chápat termíny jako je hladina významnosti, jednostranný / dvoustranný test atd.

Je vhodné si výše zmíněné postupy a příslušnou terminologii zopakovat, protože tato cvičebnice se již zabývá pouze procvičováním testování statistických hypotéz na základě vybraných druhů testů (jejichž výběr je podmíněn popsanou situací, která je analyzována).

V českém jazyce sice neexistují materiály specializující se na principy statistiky v ošetřovatelství, ale je možno vycházet z příbuzných disciplín (společenských věd, medicíny), např. z materiálu Škaloudové, viz www.pedf.cuni.cz/~www_kpsp/studentum/skaloudova/kurz.doc

Zdroje použité k tvorbě této cvičebnice jsou uvedené na jejím konci. Cvičebnice obsahuje příklady k procvičování, ty doprovázejí i zdrojová data v programu Microsoft Excel – student je může snadno zkopírovat do SPSS.

Page 3: Cvičebnice statistiky

Obsah:Typy veličin………………………………………………………………………………………………………… slide 4Příklad 1 (porovnání 2 typů intervence u 2 skupin, Mann Whitney U Test)…………. slide 5–46Příklad 2 (porovnání 2 typů intervence u 2 skupin, Dvouvýběrový T-Test)………….. slide 47–60Procvičování – příklad 1 („matky novorozenců“)…………………………………………...... slide 61–72Procvičování – příklad 2 („analgesie sestrou versus analgesie řízená pacientem“) slide 73–82Příklad 3 (porovnání skupiny před a po intervenci, Wilcoxon Signed Rank Test)….. slide 83–94Příklad 4 (porovnání skupiny před a po interenci, párový T-test)………………………… slide 95–108Procvičování – příklad 3 („hmotnost před a po rehabilitačním programu“)…….. slide 109–121Procvičování – příklad 4 („bolest po masáži versus po medikaci“)…………………….. slide 122–141Příklad 5 – korelace škál (dichotomizovaných výsledků, korelační koeficient phi)… slide 142–152Příklad 6 – korelace škál (skutečných skóre, Spearmanův korelační koeficient)……. slide 153–160Procvičování – příklad 5 („výška“ versus „skok daleký“)………………………………………. slide 161–172Použité zdroje…………………………………………………………………………………………………….. slide 173

Page 4: Cvičebnice statistiky

V tento moment si alespoň zopakujme typy veličin: Kvalitativní:a) Nominální – pohlaví, oddělení (číselné kódy pouze slouží k označení jednotlivých kategorií, např. 1 =

muž; 2 = žena) b) Ordinální – např. školní klasifikace (výborně = 1, chvalitebně = 2 atd.), stupeň souhlasu…dají se

seřadit, lze se ptát „nižší“, „vyšší“, ale ne, o kolik. Nominální a ordinální proměnné souhrnně označujeme za kvalitativní. Nemá smysl u nich zkoumat aritmetický průměr číselných kódů hodnot.

Kvantitativní (kardinální): c) Intervalové (rozdílové) – mají vlastnost ordinálního měřítka (škály) a navíc lze stanovit vzdálenost

mezi hodnotami určitou jednotkou měření. Přitom 0 neznamená „nic“ (nepřítomnost hodnoty). Příklad: teplota ve stupních Celsia. Lze se ptát „menší“, „větší“ a o kolik. Měření je relativní, ne absolutní.

d) Poměrová (podílová) – má všechny znaky nominální, ordinální, intervalové, navíc existuje absolutní nula a lze vypočítat podíl mezi hodnotami. Neexistují záporné hodnoty. Příklad: Teplota ve stupních Kelvina; počet obyvatel města; počet dětí v rodině, kolik edukačních lekcí se pacient zúčastnil či kolik bodů získal v testu (1, 2, 3, ……..); tělesná hmotnost, atd. (počet obyvatel města je diskrétní proměnná a může nabývat jen celých čísel; tělesná hmotnost je příklad spojité proměnné).

Nominální, ordinální a kvantitativní diskrétní proměnné = kategoriální.Zdroj: UK Praha, Pedagogická fakulta, http://it.pedf.cuni.cz/metodika/index.php?kap=6SPSS nerozlišuje mezi intervalovými a poměrovými úrovněmi měření – v obou případech je označujeme jako „scale“ (škála). Nominální úroveň měření označujeme „nominal“ a ordinální „ordinal“.

Page 5: Cvičebnice statistiky

Příklad 1. Chceme zjistit, která metoda edukace je účinnější – zda:a) využití samostudijního materiálu nebo b) videa s procvičováním dovedností. Studenty rozdělíme do dvou skupin – jedna skupina bude edukována pouze metodou a) a druhá pouze metodou b). Po absolvování edukace budou všichni studenti testováni stejným typem testu (post-testu).

Před statistickým zpracováním dat si stanovíme testovatelnou hypotézu. Např.:Ho: Mezi skupinami studentů nebude ve výkonu na post-testu statisticky významný rozdíl (tedy, obě metody edukace se jeví jako stejně efektivní).Ha: Mezi skupinami studentů bude ve výkonu na post-testu statisticky významný rozdíl (tedy, jedna metoda edukace se jeví jako více efektivní).Praktická významnost: Je důležité si předem stanovit, co je pro nás prakticky významné. Je možné, že např. nepatrný rozdíl ve výkonu na post-testu je statisticky významný. Nemusí to ale mít žádný praktický význam, pokud v jedné skupině studenti získají např. 80 % a ve skupině druhé 82 %. Tím pak i statisticky významný výsledek nemusí být příliš užitečný při rozhodování, kterou metodu edukace budeme aplikovat do praxe – je možné, že jiné faktory pro nás v ten moment budou důležitější (finanční náklady, „pracnost“ edukační metody, atd.).

Page 6: Cvičebnice statistiky

Výše stanovené hypotézy jsou spojeny s následující výzkumnou otázkou:Bude mezi skupinami studentů ve výkonu na post-testu statisticky významný rozdíl (tedy, bude se jedna z metod edukace jevit jako efektivnější)? Pro výpočet můžeme použít např. program Microsoft Excel, při výpočtu zjišťovat hodnotu testové statistiky za pomoci vzorců, tu pak porovnávat s kritickou hodnotou (nalezneme v tabulkách, často v přílohách knih pojednávajících o statistice). Velmi populární jsou ale i statistické programy. Jednak umožňují velmi rychlé zpracování dat (i grafické), dále např. poskytnou informace o konfidenčních intervalech (intervalech spolehlivosti).

Následuje zpracování výše uvedeného Příkladu 1 ve statistickém programu IBM SPSS, verze 19.

Page 7: Cvičebnice statistiky

1. Otevřeme nový (prázdný) soubor. 2. Pokud máme před sebou „Data

view“, klikneme na „Variable view“ (bude oranžové).

(pozn.: variable = proměnná; view = zobrazení)

Page 8: Cvičebnice statistiky

1. Začneme vpisovat informace týkající se jednotlivých proměnných, např. budeme chtít definovat sloupec „číslo respondenta“. (Name = jméno; musí začít písmenem, může obsahovat až 8 znaků, včetně písmen, čísel a _)

2. Jedná se o tzv. „String“ typ proměnné, tzn., že sice může obsahovat čísla, ale nejsou u ní povoleny matematické operace, jako je výpočet aritmetického průměru, směrodatné odchylky, atd. Typ je defaultně nastaven na „Numeric“, je nutno jej změnit na „String“ (viz další 2 slidy)

(pozn.: string = řada, série, řetězec)

Page 9: Cvičebnice statistiky

Klikneme na buňku, kde je napsáno „Numeric“, vpravo se objeví rámeček se třemi tečkami (…), na něj klikneme a rozbalí se nový rámeček pro změnu typu proměnné na „String“ (viz další slide)

Page 10: Cvičebnice statistiky

Po kliknutí na typu proměnné - „String“ – klikneme OK

Page 11: Cvičebnice statistiky

Dále definujeme, že úroveň měření bude ordinální

Page 12: Cvičebnice statistiky

Na druhý řádek vepíšeme „typ_edukace“, bude se jednat o stejný typ proměnné („String“), avšak budeme chtít označit, jakých hodnot typ edukace může nabývat, proto věnujeme pozornost sloupci „Values“ (hodnoty) – po kliknutí do buňky se objeví rámeček se třemi tečkami, po jeho zakliknutí se rozbalí další rámeček, nazvaný „Value labels“ - další postup viz další slide

Page 13: Cvičebnice statistiky

Zvolíme, že typ edukace bude nabývat hodnoty „1“ nebo „2“. Jedná se o dichotomickou proměnnou (nabývá pouze dvou hodnot). Po vyplnění pole „Value“ a „Label“ klikneme na „Add“ a do velkého rámečku vpravo naskočí „1 = samostudijní materiál“).

(pozn.: value = hodnota; add = přidat)

Page 14: Cvičebnice statistiky

Postup zopakujeme pro hodnotu 2, nakonec klikneme „Ok“.

Page 15: Cvičebnice statistiky

Dokončíme řádek tak, že vybereme nominální úroveň měření.

Page 16: Cvičebnice statistiky

1. Dokončíme řádek tak, že vybereme nominální úroveň měření.

1. Vepíšeme další položku, pro kterou potřebujeme vložit data – znalosti v post-testu (skóre). Jedná se o numerický typ proměnné, i když je diskrétní.

2. Věnujeme pozornost definování chybějících dat („Missing values“) – po rozbalení příslušného rámečku nadefinujeme, že „99“ má být pokládáno za chybějící data (ne u všech respondentů bylo vždy získáno skóre, někteří test nemuseli psát – např. odmítli či nebyli přítomni). Je možno vybrat jinou hodnotu než „99“ – důležité je, aby se nejednalo o skutečné skóre, kterého by respondenti mohli dosáhnout.

3. Definujeme „Measure“ – úroveň měření je „Scale“ (změníme, defaultně je uvedeno „Unknown“ 4. Po dokončení překlikneme z „Variable view“ na „Data view“.(Pozn.: unknown = neznámá)

Page 17: Cvičebnice statistiky

Nyní můžeme překliknout na „Data view“

Page 18: Cvičebnice statistiky

Zde se nám zobrazí názvy sloupců, tak jak jsme je vepsali ve „Variable view“

Page 19: Cvičebnice statistiky

Pravděpodobně již máme data v tabulce v programu Microsoft Excel. Okopírujeme je a vložíme do jednotlivých sloupců. Vidíme, že pokud jsme u daného edukanta (respondenta) měření neprovedli (a data nám tedy chybí), jsou tato chybějící data vyjádřena tak, jak jsme je definovali (hodnotou „99“)

Page 20: Cvičebnice statistiky

Pro náš typ úlohy je vhodné použít dvouvýběrový t-test, ovšem za splnění následujících předpokladů:a) Nezávislá proměnná (NP) se týká dvou nezávislých skupin (ano – NP je typ

edukace, ta je u každé skupiny edukantů jiná, skupiny jsou na sobě nezávislé)

b) Závislá proměnná (ZP) je na intervalové nebo podílové škále (ano – ZP je skóre, jedná se o podílovou škálu, má intervaly mezi hodnotami a navíc má nulu stanovenou absolutně a všechny hodnoty jsou kladné, i když diskrétní

c) ZP má přibližně normální rozdělení v každé skupině

Splnění předpokladu a) a b) je jasné již z výzkumného designu (plánu), tedy ještě před sběrem dat můžeme prohlásit, že tyto dva předpoklady jsou splněny.Splnění předpokladu c) není jasné z výzkumného designu, ale zjistíme ho až po sběru dat a jejich statistickém zpracování (provedeme test normality). Existují dvě hlavní metody testu normality: numerická a grafická. Posouzení normality z grafů vyžaduje jistou zkušenost. Začátečník by se naopak mohl spolehnout spíše na numerickou metodu, i když ta má též svoje nevýhody.

Page 21: Cvičebnice statistiky

Zjistíme, zda ZP má přibližně normální rozdělení: klikneme na „Analyze“ – „Descriptive Statistics“ – „Explore“(pozn.: analyze = analyzovat; explore = prozkoumat)

Page 22: Cvičebnice statistiky

V levém poli se nám objeví nabídka všech sloupců z tabulky s daty. Vybereme z nich závislou proměnnou, tedy znalosti na post-testu (skóre), klikneme na šipce vedoucí k poli „Dependent List“, tím se nám tato ZP přesune do tohoto pole.

(Pozn. dependent list = seznam závislých proměnných)

Page 23: Cvičebnice statistiky

Z pole na levé straně dále vybereme nezávislou proměnnou (NP), tedy typ edukace, klikneme na šipce vedoucí k poli „Factor List“, tím se nám tato NP přesune do tohoto pole.

Page 24: Cvičebnice statistiky
Page 25: Cvičebnice statistiky

Klikneme na „Plots“ a rozbalí se nám nové okno, kde můžeme zatrhnout „Normality plots with tests“, klikneme na „Continue“ (pokračovat). To je důležité pro zjišťování normality. (pozn.: plot = graf)

Page 26: Cvičebnice statistiky

Klikneme „Ok“.

Page 27: Cvičebnice statistiky

Klikneme na „Statistics“ a rozbalí se nám nové okno, kde můžeme zatrhnout, že chceme získat popisnou statistiku („Descriptives“), klikneme na „Continue“ (pokračovat).

Page 28: Cvičebnice statistiky

Získáme výsledky…Získáme celou řadu výsledků vzhledem k tomu, že příkaz „Explore“ je používán nejen na test normality, ale i k dalším účelům. Např. první tabulka obsahuje absolutní a relativní četnosti (vidíme, že opravdu v dvou případech jsou chybějící data - byly vloženy hodnoty „99“) . V 2. tabulce se zobrazí popisná statistika, např. průměr, medián, směrodatná odchylka, atd.Protože se ale zabýváme testem normality, zajímá nás jednak tabulka označená „Tests of Normality“ (pro numerickou metodu) a dále „Normal Q-Q Plots (pro grafickou metodu) zjišťování normality.

Page 29: Cvičebnice statistiky

Detail výsledků: absolutní a relativní četnosti v každé skupině respondentů

Page 30: Cvičebnice statistiky

Detail výsledků pro každou skupinu respondentů (popisná statistika)

Page 31: Cvičebnice statistiky

Vraťme se nyní k testu normality. Zde je prezentován výsledek testu normality – numerickou metodou. Pro malý soubor je vhodné se zaměřit na test Shapiro-Wilk, i když je možné tento test použít i pro větší vzorky. Zaměříme se na hodnotu ve sloupci „Sig.“ (significance = významnost). Ho = data jsou normálně rozloženaHa = data nejsou normálně rozloženaPokud je hodnota Sig. > 0,05, pak je rozložení dat pro daný typ edukace (samostudijní materiál nebo video s procvičováním dovedností) normální. Pokud je hodnota < 0,05, pak se distribuce dat signifikantně liší od normální distribuce dat.

Závěr testu normality: u obou typů edukace je Sig. < 0,05; distribuce dat se tedy signifikantně liší od normální distribuce. Proto není splněn předpoklad normality a testování rozdílů ve znalostech mezi dvěma skupinami bude muset proběhnout za použití neparametrické metody – Mann Whitney U Testu (ne za použití dvouvýběrového t-testu, jak jsme plánovali).

Page 32: Cvičebnice statistiky

Zde je prezentován výsledek testu normality i grafickou metodou (pro typ edukace = samostudijní materiál). Normálně rozložená data mají přímkový charakter. My jsme již numerickou metodou zjistili, že data nejsou normálně rozložena.

Page 33: Cvičebnice statistiky

Zde je prezentován výsledek testu normality i grafickou metodou (pro typ edukace = video s procvičováním dovedností). Normálně rozložená data mají přímkový charakter. My jsme již numerickou metodou zjistili, že data nejsou normálně rozložena. V dalších příkladech výsledky testu normality grafickou metodou pro jednoduchost zobrazovat nebudeme, i když tyto výsledky nám program SPSS poskytl.

Page 34: Cvičebnice statistiky

Než se pustíme do neparametrického testu, vrátíme se k definici jednotlivých typů proměnných. U typu edukace jsme typ definovali jako „String“, jedná se o speciální, binární proměnnou (tedy může nabývat jen dvou možných hodnot), na kterou někdy pohlížíme jako na numerickou. Typ v tento moment potřebujeme rekódovat právě na numerický typ, aby mohl proběhnout již zmíněný Mann Whitney U Test.

Testování rozdílů ve znalostech mezi dvěma skupinami za použití neparametrické metody – Mann Whitney U Testu

Page 35: Cvičebnice statistiky

Nyní jsme připraveni provést Mann Whitney U Test. Klikneme na „Analyze“ – „Nonparametric Tests“ – „Legacy Dialogues“ – „2 Independent Samples“

Page 36: Cvičebnice statistiky

Objeví se tento rámeček

Page 37: Cvičebnice statistiky

Závislou proměnnou – „znalosti_post_test“ – přesuneme do rámečku „Test Variable List“ a nezávislou proměnnou – „typ_edukace“ – do rámečku „Grouping Variable“ kliknutím na příslušnou šipku mezi rámečky.

Page 38: Cvičebnice statistiky

Závislou proměnnou – „znalosti_post_test“ – přesuneme do rámečku „Test Variable List“ a nezávislou proměnnou – „typ_edukace“ – do rámečku „Grouping Variable“ kliknutím na příslušné šipky mezi rámečky. Ujistíme se, že je zakliknut rámeček „Mann Whitney U“. Nyní klikneme na „Define Groups“ (k tomu je potřeba, aby byla „Grouping Variable“ vyznačena oranžově jako na tomto snímku)

Page 39: Cvičebnice statistiky

Objeví se nový rámeček, kde pro „Group 1“ vepíšeme hodnotu 1 a pro „Group 2“ hodnotu 2 (takto jsme oba typy edukace již na samém počátku definovali). Důvod, proč tyto informace nyní znovu vpisujeme je ten, že můžeme mít víc různých typů edukace (např. 3) a mohli bychom chtít porovnávat různé kombinace typů edukace, např. typ 1 oproti typu 2, typ 1 oproti typu 3 atd.

Page 40: Cvičebnice statistiky

Klikneme „Continue“ (pokračovat).

Page 41: Cvičebnice statistiky

Pokud chceme získat i popisnou statistiku, klikneme na „Options“ (= možnosti), objeví se další rámeček a zaškrtneme „Descriptives“ a „Quartiles“, poté klikneme na „Continue“.

Page 42: Cvičebnice statistiky

Klikneme „Ok“, abychom získali výsledek Mann Whitney U Testu.

Page 43: Cvičebnice statistiky

Získáme tři tabulky

Page 44: Cvičebnice statistiky

První tabulka obsahuje popisnou statistiku, ale data nejsou příliš užitečná vzhledem k tomu, že není rozlišeno, o jakou skupinu edukantů se jedná (data obou skupin byla sloučena), navíc nevíme, zda tato sloučená skupina edukantů má či nemá normální distribuci dat a zda je pro nás relevantní aritmetický průměr se směrodatnou odchylkou (tak by tomu bylo v případě normální distribuce dat) či medián a 25. a 75. percentil….(v případě nenormální distribuce dat…)Proto je lepší tuto tabulku ignorovat.

Page 45: Cvičebnice statistiky

Druhá tabulka již obsahuje informace, která skupina respondentů měla vyšší znalosti: získáme „mean rank“ (průměrné pořadí) a „sum of ranks“ (sumu pořadí). Protože vyšší skóre znamená lepší znalosti, lze také říci, že znalosti byly lepší pro skupinu s typem edukace „video s procvičováním dovedností“ („mean rank“ = 21, 40). U skupiny edukované „samostudijním materiálem“ je „mean rank“ = 18, 53. Třetí tabulka nám pomůže určit, zda se jedná o statisticky významný rozdíl.

Page 46: Cvičebnice statistiky

Třetí tabulka ukazuje hodnotu testové statistiky U (162,000) a hodnotu p (Asymp. Sig. 2-tailed = dvoustranný test). Protože je hodnota > 0,05 (je = 0,411), jedná se o statisticky nevýznamný rozdíl v mediánech znalostí u skupiny edukované jedním typem edukace oproti skupině edukované druhým typem edukace. Kdyby byla hodnota < 0,05, jednalo by se o statistiky významný rozdíl ve znalostech u jedné skupiny oproti druhé skupině.

Poznámka: hovoříme o mediánech.Kolik byl medián znalostí (skóre) pro každou skupinu? To již víme z tabulky s popisnou statistikou, kterou jsme získali při testu normality. Je patrno, že medián u obou skupin byl 5,00 – tedy, byl stejný. Proto není možné, aby byl zjištěn statisticky významný rozdíl ve znalostech. Rozdíl samozřejmě neexistuje ani z praktického hlediska. Z výsledků post-testu nemůžeme tvrdit, že „stojí za to“ provádět jeden typ edukace oproti druhému typu edukace.

Page 47: Cvičebnice statistiky

Příklad 2. Pokračujeme s novým příkladem. Jedná se stále o stejné edukanty a dva již definované typy edukace. Nyní však testujeme dovednosti (ne znalosti). Opět nás zajímá, zda bude existovat statisticky významný rozdíl v dovednostech v závislosti na tom, zda se jednalo o skupinu edukovanou samostudijním materiálem nebo videem s procvičováním dovedností. Vepíšeme novou proměnnou – „dovednosti_posttest“; tu definujeme podobně jako „znalosti_posttest“.

Page 48: Cvičebnice statistiky

Z dokumentu vytvořeném v programu Microsoft Excel obsahujícím data o edukantech vložíme skóre získaná na dovednostním post-testu. Pro chybějící data jsme vložili hodnotu „99“ (to bylo třeba definovat ve „Variable view“).

Page 49: Cvičebnice statistiky

Již známým způsobem zjistíme, zda ZP (skóre na dovednostním post-testu) má přibližně normální rozdělení: klikneme na „Analyze“ – „Descriptive statistics“ – „Explore“. Pokud ne, opět bychom prováděli Mann Whitney U Test. Pokud bude rozdělení dat normální, budeme moci provést parametrický test – Dvouvýběrový T-test s nezávislými výběry.

Page 50: Cvičebnice statistiky

Do rámečku „Dependent List“ přesuneme závislou proměnnou, tedy „dovednosti_post-test“ a do rámečku „Factor List“ nezávislou proměnnou, tedy typ edukace.

Page 51: Cvičebnice statistiky

Klikneme na „Plots“, objeví se nový rámeček, zaškrtneme „Normality plots with tests“, pak klikneme „Continue“.

Page 52: Cvičebnice statistiky

Klikneme „Ok“.

Page 53: Cvičebnice statistiky

Získáme tři tabulky včetně popisné statistiky.

Page 54: Cvičebnice statistiky

Třetí tabulka je testem normality. Opět se zaměříme na test Shapiro-Wilk. Pro obě skupiny je hodnota Sig. > 0,05, takže distribuce dat je normální a můžeme přistoupit k dvouvýběrovému T-testu s nezávislými výběry. Toto by bylo možné určit i grafickou metodou (grafy též získány ve výsledcích – ty v této cvičebnici nezobrazujeme).

Page 55: Cvičebnice statistiky

Dvouvýběrový T-test s nezávislými výběry: Klikneme na „Analyze“ – „Compare Means“ – „Independent Samples T Test“

Page 56: Cvičebnice statistiky

Objeví se rámeček, kde pro „Test Variable(s)“ vybereme závislou proměnnou (dovednosti na post-testu) a pro „Grouping Variable“ typ edukace. Klikneme na „Define Groups“ a skupiny opět nadefinujeme (vyplníme Group 1 = 1, Group 2 = 2).

Page 57: Cvičebnice statistiky

Klikneme „Continue“.

Page 58: Cvičebnice statistiky

Klikneme „Ok“.

Page 59: Cvičebnice statistiky

Výsledky: V první tabulce je popisná statistika včetně aritmetického průměru skóre získaných na příslušném dovednostním post-testu a včetně směrodatné odchylky pro každou skupinu edukantů. Je patrno, že skupina s videem a procvičováním dovedností získala lepší aritmetický průměr (7, 53 bodů) oproti skupině edukované samostudijním materiálem (6, 18 bodů). Na dalším slidu se zaměříme na druhou tabulku, kde je výsledek T-testu. Ten nám umožní zjistit, zda zjištěné rozdíly v aritmetických průměrech jsou statisticky významné nebo nejsou.

Page 60: Cvičebnice statistiky

Před každým T-testem se provádí F-test, což je test hypotézy o shodě dvou rozptylů. V programu SPPS je v tabulce ukázán výsledek na dvou řádcích, kde u prvního řádku se předpokládá, že výsledek F-testu prokázal shodnost dvou rozptylů. V druhém řádku se předpokládá, že výsledek F-testu neprokázal shodnost dvou rozptylů. Výsledek F-testu: ve sloupečku vedle hodnoty F je hodnota p (Sig.) – pokud je > 0,05, rozptyly v obou skupinách považujeme na shodné. V našem případě je uvedeno Sig. = 0,114, takže rozptyly v obou skupinách považujeme opravdu za shodné. Proto je pro nás relevantní výsledek T-testu v prvním řádku a druhý řádek můžeme ignorovat. Statistická významnost rozdílu mezi skupinami: Pro T-test (testovou statistiku t = -2,660 – viz první řádek s výsledky) jsme získali hodnotu p (Sig.) = 0,012. I zde porovnáváme, zda tato hodnota je menší nebo větší než 0,05. Protože 0,012 < 0,05, docházíme k závěru, že rozdíly v dovednostech jsou mezi skupinami statisticky významné (na hladině významnosti 0,05). To znamená, že k rozdílům nedošlo náhodou, ale že vliv zde hrál vliv edukace (s 95% jistotou). Z první tabulky již víme, jaký je aritmetický průměr u každé skupiny. Praktická významnost rozdílu mezi skupinami: Na závěr je nutno se rozhodnout, zda zjištěné rozdíly jsou pro nás důležité i z praktického hlediska. Pokud bychom bývali stanovili, že prakticky významný je pro nás rozdíl v průměrném skóre skupin > 2 body, byly by výsledky z praktického hlediska nevýznamné.

Page 61: Cvičebnice statistiky

Procvičování – příklad 1

Page 62: Cvičebnice statistiky

Procvičování - příklad 1: Je 60 respondentů – matek novorozenců. Jedna skupina matek podstoupila skupinovou přípravu na mateřství, při které se učila celou řadu úkonů od stravování (kojení) dítěte až po hygienu a navazování vztahu s dítětem. Druhá skupina žádnou přípravu neabsolvovala. Po 30 dnech se obě skupiny matek podrobily pozorování, kde byly sledovány, jak dobře se o dítě starají (např. zda dítě dobře drží při kojení atd.). Bylo sledováno celkem 20 položek, u každé položky byl možný jeden ze dvou výsledků (1 = správný postup; 0 = špatný postup), takže celkové skóre bylo minimálně 0 a maximálně 20. Existuje statisticky významný rozdíl v dovednostech matek dle toho, zda přípravu absolvovaly nebo neabsolvovaly?Připravte si data v programu Microsoft Excel, aby se do SPSS mohla přenést kopírováním. Matky č. 1-30 prošly přípravou, matky 31-60 přípravou neprošly.U matky č. 14, 22, 34 a 45 jsou chybějící skóre, matky se na testování nedostavily.Skóre byla následující: Skóre 18 -20 a 0-12: nikdo Skóre 13: matka 1, 2, 31, 32, 33Skóre 14: matka 3, 35, 36, 37, 38Skóre 15: matka 4, 5, 6, 39, 40, 41, 42, 43, 44Skóre 16: matka 7, 8, 46, 47, 48Skóre 17: všechny ostatní matkyBudeme za pomoci statistického testu zjišťovat, zda je mezi skupinami (matkami s přípravou oproti matkám bez přípravy) statisticky významný rozdíl v dovednostech matek (vyjádřeno získaným skóre).

Page 63: Cvičebnice statistiky

Data vložena do programu Microsoft Excel. Vkládáno s úmyslem definovat chybějící data v SPSS (v položce „Skóre“ hodnotou „99“); „absolvování přípravy“ již nyní reprezentováno číslem „1“ a „neabsolvování přípravy“ číslem „2“. Při kopírováním dat do SPSS však bude nutno význam (definici) těchto čísel nejprve zadat v záložce „Variable view“.

Řešení příkladu 1

Page 64: Cvičebnice statistiky
Page 65: Cvičebnice statistiky
Page 66: Cvičebnice statistiky

Získání popisné statistiky a provedení testu normality

Page 67: Cvičebnice statistiky

Popisná statistika pro obě skupiny

Page 68: Cvičebnice statistiky

Závěr testu normality: u obou typů přípravy je Sig. < 0,05; distribuce dat se tedy signifikantně liší od normální distribuce. Proto není splněn předpoklad normality a testování statistické významnosti rozdílů v dovednostech mezi dvěma skupinami bude muset proběhnout za použití neparametrické metody – Mann Whitney U Testu (ne za použití dvouvýběrového t-testu). Zároveň stanovíme, jaký rozdíl je pro nás prakticky významný. Např. rozdíl ve skóre ≥ 3 body je pro nás již významný z praktického hlediska. Toto nevyčteme v učebnicích, spíše se řídíme praktickými zkušenostmi, zajímá nás časová a finanční náročnost edukační metody, atd.

Page 69: Cvičebnice statistiky

Nezapomeneme předefinovat typ proměnné u „typ přípravy“ na „Numeric“.

Page 70: Cvičebnice statistiky

Mann Whitney U Test

Page 71: Cvičebnice statistiky

Rozdíl v dovednostech je statistiky významný (na hladině významnosti 0,05) – ve prospěch skupiny, která absolvovala přípravu, jak je patrno z tabulky „Ranks“ – tzn., že k tomuto rozdílu (s 95% jistotou) nedošlo náhodou a lze tak předpovídat, že rozdíl v dovednostech ve prospěch skupiny absolvující přípravu existuje nejen v našem vzorku, ale v celé populaci matek. Vrátíme se k tabulce s popisnou tabulkou a podíváme se, jaký byl medián dovedností u každé skupiny.

Page 72: Cvičebnice statistiky

Medián v dovednostech matek, které absolvovaly přípravu, je 17Medián v dovednostech matek, které neabsolvovaly přípravu, je 16.Z praktického hlediska se nejedná o významný rozdíl. Zřejmě nestojí za to tento program přípravy dále provozovat, nejeví se jako příliš efektivní, i když k pozorovaným rozdílům v dovednostech nedošlo náhodou, ale vlivem absolvování přípravy (s 95% jistotou).

Page 73: Cvičebnice statistiky

Procvičování – příklad 2

Page 74: Cvičebnice statistiky

Procvičování – příklad 2: Je 80 respondentů – pacientů po operaci kyčelního kloubu. Jedna skupina pacientů (pacient 1-40) dostávala po operaci analgesii od všeobecné sestry, druhá skupina (pacient 41-80) využívala tzv. „patient controlled analgesia“ (analgesii řízenou pacientem). Byla sledována rychlost, s jakou byli pacienti ve čtvrtý pooperační den schopni vstát z lůžka. Rychlost byla sledována v sekundách. Je mezi skupinami pacientů statisticky významný rozdíl v rychlosti vstávání, v závislosti na druhu použité analgesie?Připravte si data v programu Microsoft Excel, aby se do SPSS mohla přenést kopírováním.Rychlost vstávání byla následná: 0-4 s: nikdo 5 s: pacient 1-5, 41-496 s: pacient 6-7, 50-557 s: pacient 8, 56-598-10 s: nikdo11 s: pacient 9-13, 60-6512 s: pacient 14-18, 66-6713-14 s: nikdo15 s: pacient 19-28, 68-7516 s: pacient 29-33, 7617 s: pacient 77-7918 s: pacient 34-3819 s: pacient 3920 s: pacient 8021-27 s: nikdo28 s: pacient 40

Page 75: Cvičebnice statistiky

Data vložena do programu Microsoft Excel. „Analgesie sestrou“ již nyní reprezentována číslem „1“ a „analgesie řízená pacientem“ číslem „2“. Při kopírováním dat do SPSS však bude nutno význam (definici) těchto čísel nejprve zadat v záložce „Variable view“.

Řešení příkladu 2

Page 76: Cvičebnice statistiky

Proměnné nadefinovány v záložce „Variable view“.

Page 77: Cvičebnice statistiky

Data zkopírována z Excelu do záložky „Data view“.

Page 78: Cvičebnice statistiky

Test normality a získání popisné statistiky

Page 79: Cvičebnice statistiky

Popisná statistika, vrátíme se k ní později

Page 80: Cvičebnice statistiky

Výsledky testu normality:

U obou typů analgesie je dle testu Shapiro-Wilk Sig. < 0,05; distribuce dat se tedy signifikantně liší od normální distribuce. Proto není splněn předpoklad normality a testování statistické významnosti rozdílů v rychlosti vstávání mezi dvěma skupinami bude muset proběhnout za použití neparametrické metody – Mann Whitney U Testu (ne za použití dvouvýběrového t-testu). Stanovíme i praktickou významnost rozdílů, např. minimálně 4 s.

Page 81: Cvičebnice statistiky

Mann Whitney U Test. Nezapomeneme nejprve změnit typ proměnné pro „typ analgesie“ (ze „String“ na „Numeric“, k tomu je třeba překliknout na „Variable view“).

Page 82: Cvičebnice statistiky

Mann Whitney U Test. Tabulka „Ranks“ napovídá, že rychlost vstávání je nižší u skupiny, která měla analgesii řízenou pacientem. Asymp. Sig. Mann-Whitney U Testu je < 0,05, jedná se o statisticky významný rozdíl v mediánech rychlosti vstávání u obou skupin (efekt nevznikl náhodou, ale vlivem metody aplikace analgesie – s 95% jistotou). Medián rychlosti vstávání u skupiny s analgesií řízenou pacientem byl 11 s, u skupiny s analgesií sestrou byl 15 s (viz tabulka s popisnou statistikou). Rozdíl mezi skupinami je tedy i prakticky významný, laicky řečeno, „stojí to za to pacientům nabízet analgesii řízenou pacientem“ (protože efekt je „velký“….i přesto, že tento typ analgesie stojí více peněz, atd. atd.)

Page 83: Cvičebnice statistiky

Příklad 3. Vrátíme se k edukantům a ke studiu účinku edukace. Nyní nás zajímá rozdíl mezi znalostmi před edukací (znalostní před-test) a po absolvování edukace (znalostní post-test). Podstatným rozdílem mezi příkladem 3 a příkladem 1 v úvodu je to, že edukanti nejsou děleni na skupiny, avšak nyní všichni edukanti podstupují stejný typ edukace. Druhým podstatným rozdílem je, že stejní edukanti jsou testováni dvakrát – před a po edukaci. Pro tento typ situace je vhodný párový t-test, ovšem za předpokladu, že rozdíl mezi znalostmi v post-testu a před-testu má normální rozdělení. Více si situaci rozebereme na následujícím slidu.

Praktická významnost: např., edukace je účinná, pokud se znalosti zlepší alespoň o dva body.

Page 84: Cvičebnice statistiky

Rozepišme si, za jakých podmínek je možno u tohoto příkladu použít párový t-test. Je nutné, aby byly splněny následující předpoklady:a) Závislá proměnná (ZP) je na intervalové nebo podílové škále (ano – ZP je

skóre, jedná se o podílovou škálu, má intervaly mezi hodnotami a navíc má nulu stanovenou absolutně a všechny hodnoty jsou kladné, i když diskrétní

b) Nezávislá proměnná (NP) je jen jedna skupina (ano – jedna skupina edukantů, testovaná dvakrát)

c) Rozdíl mezi dvěma „skupinami“ má přibližně normální rozdělení (jedná se o rozdíl mezi znalostmi v před-testu a post-testu)

Splnění předpokladu a) a b) je jasné již z výzkumného designu (plánu), tedy ještě před sběrem dat můžeme prohlásit, že tyto dva předpoklady jsou splněny.Splnění předpokladu c) není jasné z výzkumného designu, ale zjistíme ho až po sběru dat a jejich statistickém zpracování (provedeme test normality). Existují dvě hlavní metody tohoto testu: numerická a grafická. Posouzení normality z grafů vyžaduje jistou zkušenost. Začátečník by se naopak mohl spolehnout spíše na numerickou metodu, i když ta má též svoje nevýhody.

Page 85: Cvičebnice statistiky

Pozor na definování chybějících dat u rozdílu. Na před-testu nebyla chybějící data, ale na post-testu ano, ta byla definována jako „99“. V závislosti na získaném skóre na před-testu mohla být chybějící data u rozdílu v rozpětí od 93 do 99 vzhledem k tomu, že maximální možné skóre na testu je 6 (např., pokud bylo skóre na před-testu 6 a na post-testu bylo skóre chybějící, je i rozdíl chybějící a jeho vypočítaná hodnota v programu Microsoft Excel je 99 – 6 = 93). Proto toto možné rozpětí chybějících hodnot uvedeme do pole „Range“, od „Low“ (= nízké) po „High“ (= vysoké).

Page 86: Cvičebnice statistiky

Test normality pro rozdíl ve znalostech (malý rámeček získáme kliknutím na „Plots“) a získání popisné statistiky (k tomu je třeba též zobrazit malý rámeček, který získáme kliknutím na „Statistics“). V malém rámečku nakonec vždy klikneme „Continue“, na závěr ve velkém rámečku klikneme „Ok“.

Page 87: Cvičebnice statistiky

Popisná statistika

Page 88: Cvičebnice statistiky

Test normality: dle Shapiro-Wilk, Sig. < 0,05. Distribuce dat (rozdílu mezi před-testem a post-testem) se tedy signifikantně liší od normální distribuce. Proto není splněn předpoklad normality a testování rozdílu mezi post-testem a před-testem bude muset proběhnout za použití neparametrické metody – Wilcoxon Signed Rank Test (ne za použití párového t-testu, jak jsme plánovali).

Page 89: Cvičebnice statistiky

Wilcoxon Signed_Rank Test:„Analyze“ – „Nonparametric Tests“ – „Legacy Dialogs“ – „2 Related Samples“.

Page 90: Cvičebnice statistiky

¨Znalosti_post-test“ přesuneme kliknutím na šipce do rámečku vpravo, do sloupce s „Variable 1“ „znalosti před-test“ stejným způsobem přesuneme do sloupce s „Variable 2“. Ujistíme se, že je zaškrtnuto pole „Wilcoxon“.

Page 91: Cvičebnice statistiky

Kliknutím na „Options“ se objeví menší rámeček, ve kterém je možno zatrhnout „Descriptive“ a „Quartiles“, čímž ve výsledcích získáme i popisnou statistiku. Klikneme „Continue“, menší rámeček zmizí a ve velkém rámečku klikneme „Ok“, čímž spustíme výpočet.

Page 92: Cvičebnice statistiky

Pokud jsme zatrhli, že chceme získat popisnou statistiku, objeví se tento výsledek. Protože používáme neparametrický test, měli bychom se zaměřit na popis výsledků za použití kvartilů.

Page 93: Cvičebnice statistiky

Z tabulky „Ranks“ je patrno, že 37 respondentů mělo v post-testu vyšší znalosti než v před-testu a 2 respondenti měli naopak nižší znalosti v post-testu než v před-testu.

Page 94: Cvičebnice statistiky

Z tabulky „Test Statistics“ můžeme zjistit, zda je rozdíl ve znalostech v před-testu a post-testu statisticky významný. Zaměříme se na hodnotu P, tedy Asymp. Sig. (2-tailed), která je v tomto případě 0,000 (testová statistika Z je přitom -5,415 - její hodnotu bychom používali při výpočtu s použitím statistických tabulek). Protože 0,000 < 0,05, jedná se o statisticky významný rozdíl ve skóre na post-testu a před-testu (na hladině významnosti 0,05 – tento rozdíl ve skóre nevznikl náhodou, ale vlivem edukace; s 95% jistotou). Z popisné statistiky již víme, že medián znalostí v post-testu je 5,00, kdežto medián znalostí v před-testu je 2,00.Na závěr se vrátíme k praktické významnosti výsledků. Je zlepšení na post-testu opravdu značné z praktického hlediska? Pozn.: I u předešlých případů porovnáváme hodnotu p s hodnotou 0,05. To proto, že závěry tvoříme pro tuto hladinu významnosti.

Page 95: Cvičebnice statistiky

Příklad 4. Stále studujeme edukanty a účinek edukace. Nyní nás zajímá rozdíl mezi postojem ke studované problematice před edukací (postoj před edukací) a po absolvování edukace (postoj po edukaci). Jednalo se totiž o edukaci zaměřenou na roli sestry při screeningu poruch polykání. Postoj je zjišťován za pomoci testu, kde maximální možné skóre je 8. Nízké skóre znamená, že respondenti vidí roli sestry v tomto screeningu jako zcela nedůležitou. Vysoké skóre znamená, že edukanti vidí roli sestry při screeningu jako v nejvyšší možné míře důležitou.Stejně jako v příkladu 3, edukanti nejsou děleni na skupiny; všichni podstupují stejný typ edukace. Stejní edukanti jsou opět dotazováni dvakrát – před a po edukaci. Pro tento typ situace je vhodný párový t-test, ovšem za předpokladu, že rozdíl mezi postojem v post-testu a před-testu má normální rozdělení. Situaci jsme již rozebrali na slidu u příkladu 3. Praktická významnost: např., edukace je účinná ve změně postoje k problematice (roli sestry při screeningu poruch polykání), pokud se postoj „zlepší“ alespoň o dva body.

Page 96: Cvičebnice statistiky

Chybějící hodnoty na rozdílu v postoji jsou v rozpětí 91-99 bodů, protože se jedná o test, na kterém lze získat maximálně 8 bodů. Pokud edukant post-test nepsal, označili jsme u něho hodnotu 99 bodů, na před-testu mohl získat max. 8 bodů, maximální možný rozdíl je tedy 91.

Page 97: Cvičebnice statistiky

Zkopírujeme data z programu Microsoft Exceu do „Data view“. Máme celkem 19 edukantů, žádná chybějící data.

Page 98: Cvičebnice statistiky

Test normality pro rozdíl v postoji…

Page 99: Cvičebnice statistiky

Test normality pro rozdíl v postoji…Test normality pro rozdíl v postoji…(malý rámeček získáme kliknutím na „Plots“, pak klikneme „Continue“)

Page 100: Cvičebnice statistiky

…a získání popisné statistiky (malý rámeček získáme kliknutím na „Statistics“, pak klikneme „Continue“). Nakonec klikneme „Ok“.

Page 101: Cvičebnice statistiky

Výsledek: získání popisné statistiky týkající se rozdílu v postoji před a po edukaci.

Page 102: Cvičebnice statistiky

Výsledek: ve třetí tabulce jsou informace týkající se normality. Dle testu Shapiro-Wilk je hodnota p (Sig.) 0,243 – je tedy větší než 0,05 a data mají normální rozložení. Je proto možno přistoupit k párovému T-testu.

Page 103: Cvičebnice statistiky

Párový T-test : Klikneme na „Analyze“ – „Compare means“ – „Paired Samples T Test“

Page 104: Cvičebnice statistiky

Párový T-test : Klikneme na „analyze“ – „compare means“ – „Paired Samples T Test“„Postoj_po_ed“ přesuneme kliknutím na šipce do rámečku vpravo, do sloupce s „Variable 1“ „postoj_před_ed“ stejným způsobem přesuneme do sloupce s „Variable 2“.

Page 105: Cvičebnice statistiky

Párový T-test : Klikneme na „analyze“ – „compare means“ – „Paired Samples T Test“„Postoj_po_ed“ přesuneme kliknutím na šipce do rámečku vpravo, do sloupce s „Variable 1“ „postoj_před_ed“ stejným způsobem přesuneme do sloupce s „Variable 2“.

Page 106: Cvičebnice statistiky

Ve výsledcích získáme tabulky s popisnou statistikou, dále i výsledek párového T testu.

Page 107: Cvičebnice statistiky

Průměrné skóre na testu vyjadřujícím postoj k roli sestry při screeningu poruch polykání je 6,26 bodů po edukaci a pouze 2,58 před edukací. Postoj se tedy „zlepšil“, tzn., že po edukaci vidí respondenti roli sestry při screeningu poruch polykání jako více důležitou.

Page 108: Cvičebnice statistiky

Výsledek párového T testu: Je důležité si uvědomit, že výsledky se týkají rozdílu, v nadpisu vidíme „paired differences“. Proto je „mean“ (aritmetický průměr) aritmetickým průměrem rozdílů v postoji před a po edukaci. Nejedná se tedy o průměrný postoj. Stejným způsobem musíme pohlížet i na další výsledky (směrodatnou odchylku, atd.). T je hodnota T testu, df = „degree of freedom“ (stupeň volnosti), nás zajímá hodnota p (Sig.), ta je = 0,000. Protože je tato hodnota menší než 0,05, rozdíl v postoji před a po edukaci je statisticky významný. Z výsledků popisné statistiky již víme, že postoj se „zlepšil“, a to o téměř 4 body.Jaká je praktická významnost tohoto rozdílu? „Stojí za to“ tuto edukaci provádět, pokud nám jde o to, aby respondenti „zlepšili“ svůj postoj k důležitosti role sestry při poruchách polykání?

Page 109: Cvičebnice statistiky

Procvičování – příklad 3

Page 110: Cvičebnice statistiky

Procvičování – příklad 3: Máme 30 respondentů – pacientů, kteří podstoupili rehabilitační program s cílem redukce tělesné hmotnosti. Respondenti byli zváženi před zahájením rehabilitačního programu a po ukončení programu po 3 měsících. Existuje statisticky významný rozdíl ve hmotnosti respondentů před a po absolvování rehabilitačního programu?Připravte si data v programu Microsoft Excel, aby se do SPSS mohla přenést kopírováním. Data jsou prezentována na následujícím slidu.

Page 111: Cvičebnice statistiky

č_resp hmotnost před hmotnost po rozdíl v hmotnosti1 50 47 32 64 63 13 88 86 24 74 75 -15 73 66 76 73 68 57 95 88 78 90 82 89 66 65 1

10 76 73 311 96 90 612 80 72 813 77 76 114 99 90 915 82 77 516 72 65 717 64 63 118 77 75 219 71 73 -220 88 82 621 66 64 222 90 80 1023 88 77 1124 69 62 725 70 68 226 86 85 127 90 90 028 68 65 329 71 70 130 64 61 3

Page 112: Cvičebnice statistiky

Řešení příkladu 3:

Data vložena do programu Microsoft Excel.

Page 113: Cvičebnice statistiky

V SPSS proměnné nadefinovány v záložce „Variable view“.

Page 114: Cvičebnice statistiky

Poté v záložce „Data view“ zkopírována data z programu Microsoft Excel.

Page 115: Cvičebnice statistiky

Test normality a získání popisné statistiky (viz následující slide). Pozor: do rámečku „dependent list“ je nutno zadat rozdíl v hmotnosti před a po rehabilitačním programu.

Page 116: Cvičebnice statistiky

Test normality (viz předcházející slide) a získání popisné statistiky. Na závěr klikneme „Ok“.

Page 117: Cvičebnice statistiky

Výsledky: popisná statistika

Page 118: Cvičebnice statistiky

Výsledky: test normality: dle testu Shapiro-Wilk je hodnota p (Sig.) > 0,05, data (rozdíl v hmotnosti) tedy mají normální rozdělení. Je možno dále postupovat dle párového T testu, abychom zjistili statistickou významnost rozdílu v hmotnosti před a po absolvování rehabilitačního programu. Praktická významnost: např. v tomto konkrétním případě se jedná o velmi intenzivní a finančně náročný program, do kterého je angažováno mnoho rehabilitačních pracovníků a používají se nákladné přístroje, bazén, atd. Aby se provozování tohoto programu opravdu vyplatilo, chceme vidět markantní úbytek tělesné hmotnosti.

Page 119: Cvičebnice statistiky

Párový T test

Page 120: Cvičebnice statistiky

Výsledek: popisná statistika. Průměrná tělesná hmotnost před zahájením rehabilitačního programu byla 77,23 kg a po ukončení programu byla 73,27 kg.

Page 121: Cvičebnice statistiky

Výsledek: párový T test. Hodnota P (Sig.) je < 0,05, jedná se tedy o statisticky významný rozdíl v hmotnosti. Z výsledků popisné statistiky již víme, že došlo k redukci průměrné hmotnosti po absolvování rehabilitačního programu.Praktická významnost: víme, že došlo k redukci průměrné tělesné hmotnosti cca o 4 kg. Zjišťováním dalších údajů (např. výpočtem BMI, k čemuž jsme navíc použili výšku respondentů) vidíme, že podstatná část respondentů je stále obézní. Nedošlo k markantnímu úbytku na váze a protože je program finančně náročný, nebyla splněna podmínka, kterou jsme si v úvodu stanovili (aby program mohl pokračovat dále, chceme vidět markantní úbytek na váze a žádnou obezitu po absolvování programu). Na základě těchto úvah docházíme k závěru, že výsledky nejsou z praktického hlediska významné a neprokazují, že program je efektivní.

Page 122: Cvičebnice statistiky

Procvičování – příklad 4

Page 123: Cvičebnice statistiky

Procvičování – příklad 4: Máme 131 respondentů – pacientů, kde prvních 70 získává medikaci pro bolest a zbývající respondenti získávají masáž. Respondenti pak na desetibodové škále hodnotí intenzitu svojí bolesti, kde 0 = žádná bolest, 10 = maximální možná bolest. Existuje statisticky významný rozdíl v intenzitě bolesti mezi skupinami pacientů, v závislosti na tom, který typ intervence dostávají (medikaci nebo masáž)?Zkopírujte si data z programu Microsoft Excel (viz doprovodný soubor).

Page 124: Cvičebnice statistiky

Připravíme se na zkopírování dat do SPSS – ve „Variable view“ nadefinujeme proměnné.

Řešení příkladu 4

Page 125: Cvičebnice statistiky

Zkopírování dat do SPSS – v „Data view“.

Page 126: Cvičebnice statistiky

Test normality a získání popisné statistiky

Page 127: Cvičebnice statistiky
Page 128: Cvičebnice statistiky
Page 129: Cvičebnice statistiky
Page 130: Cvičebnice statistiky

Výsledky: popisná statistika

Page 131: Cvičebnice statistiky

Výsledky: popisná statistika

Page 132: Cvičebnice statistiky

Výsledky: popisná statistika

Page 133: Cvičebnice statistiky

Výsledky: test normality. Pouze u masáže je distribuce dat normální, u medikace není. Statistickou významnost rozdílu ve skóre bolesti mezi skupinou s medikací a skupinou s masáží budeme tedy testovat za pomoci neparametrického testu (Mann Whitney U Testu), ne za pomoci dvouvýběrového T testu.

Page 134: Cvičebnice statistiky

Nezapomeneme změnit typ proměnné u typu intervence na „Numeric“.

Page 135: Cvičebnice statistiky

Mann Whitney U Test

Page 136: Cvičebnice statistiky

Mann Whitney U Test

Page 137: Cvičebnice statistiky

Mann Whitney U Test

Page 138: Cvičebnice statistiky

Mann Whitney U Test, včetně získání popisné statistiky

Page 139: Cvičebnice statistiky

Výsledky popisné statistiky (pokud jsme v předcházejících krocích zatrhli, že ji chceme) a Mann Whitney U Testu.

Page 140: Cvičebnice statistiky

První tabulku ignorujeme. Druhá napovídá, že intenzita bolesti je větší u masáže. Již při testu normality jsme získali detailní popisnou statistiku, kde bylo patrno, že ve skupině s medikací je medián bolesti 5 a ve skupině s masáží je medián bolesti 6.

Page 141: Cvičebnice statistiky

Výsledek Mann Whitney U testu: hodnota P - Asymp. Sig. (2-tailed) – je > 0,05, jedná se tedy o statisticky významný rozdíl mezi skupinami. Z popisné statistiky již víme, že se jedná o rozdíl ve prospěch skupiny s medikací (nižší bolest). Nutno se zamyslet nad praktickou významností tohoto rozdílu. „Stojí za to“ pacientům dávat medikaci oproti masáží? Co když je medikace velmi drahá, co když vede k mnoha nežádoucím účinkům, komplikacím atd.??? Pozn.: U velkých vzorků může být i malý rozdíl mezi skupinami statistiky významný. Jak jsme již viděli na předcházejícím příkladu, neznamená to, že statisticky významné rozdíly budeme automaticky propagovat jako ideální řešení nějakého praktického problému. Jinými slovy, i statisticky významné výsledky nakonec nemusí být prakticky použitelné. Je vhodné, aby se nad tímto student zamyslel (a např. tyto úvahy popsal, vyvodil z nich závěry).

Page 142: Cvičebnice statistiky

Příklad 5: Máme 2 již existující škály pro riziko pádů (škálu č. 1 a škálu č. 2). Chceme zkoumat třetí škálu, která se zatím používá pouze v zahraničí a chceme zjistit, zda riziko pádů dle této nové škály lépe koreluje se škálou č. 1 nebo se škálou č. 2. Každá z těchto škál má jiné maximální možné skóre a jiný tzv. cut-off point, tedy hraniční bod, kdy je již pacient považován za rizikového. U škály č. 1 je pacient rizikový, pokud je skóre ≤ 25 (tedy hraniční bod je 25), u škály č. 2 je pacient rizikový, pokud je skóre ≤ 16A u nové škály je pacient rizikový, pokud je skóre ≤ 18.

Každá škála je složena z několika sledovaných kategorií (pohyblivost, úroveň vědomí, atd.), přičemž ne všechny kategorie jsou u každé škály stejné. V každé kategorii je přitom možno získat několik bodů, např. u škály č. 1 je v kategorii pohyblivost možno získat až 4 body, kde 0 = velký problém a 4 = žádný problém.

Celkem proběhlo 53 měření na pacientech za použití všech tří škál.

V průběhu řešení příkladu budeme pracovat s dichotomizovanými výsledky, tedy s výsledky, kde jednou možností je „pacient je rizikový“ a druhou možností je „pacient je bez rizika“. Například, u škály č. 1 bude pacient rizikový např. pokud je skóre 10, 12, 14, 25 atd. a bez rizika, pokud je skóre 26, 28, 30 atd. Uvidíme, že všichni rizikoví pacienti takto získají skóre „1“ a všichni bezrizikoví pacienti skóre „0“.

Data jsou již připravena v programu Microsoft Excel (viz doprovodný materiál), aby se do SPSS mohla snadno přenést kopírováním.

Page 143: Cvičebnice statistiky

V SPSS nadefinujeme proměnné ve „Variable view“

Page 144: Cvičebnice statistiky

Zkopírujeme data z programu Microsoft Excel do SPSS v „Data view“

Page 145: Cvičebnice statistiky

Nemůžeme provádět korelaci skóre vzhledem k tomu, že maximální možné skóre u každé škály je jiné. Avšak můžeme provést korelaci dichotomizovaných výsledků („riziko ano“ oproti „riziko ne“). Jedná se o nominální proměnné, proto provádíme výpočet korelačního koeficientu phi.

Page 146: Cvičebnice statistiky

Klikneme „Analyze“ – „Descriptive Statistics“ – „Crosstabs“

Page 147: Cvičebnice statistiky

Objeví se rámeček „Crosstabs“ ( = kontingenční tabulka), šipkou přesuneme „škála nová_riziko“ do pole „Row“ ( = řádek) a „škála 1_riziko“ a škála 2_riziko“ do pole „Columns“ (= sloupce).

Page 148: Cvičebnice statistiky

Klikneme na „Statistics“ a v menším rámečku pak zatrhneme „Phi“, klikneme „Continue“

Page 149: Cvičebnice statistiky

Výsledky

Page 150: Cvičebnice statistiky

Výsledky: kontingenční tabulka – je patrno, že v 36 případech obě škály vedly ke stejnému závěru, že pacient nemá riziko pádu, a v dalších 4 případech ke stejnému závěru, že pacient má riziko pádu. Jinými slovy, škály se shodly ve 40 případech z 53. Avšak škála č. 1 v 11 případech označila pacienta za bezrizikového a přitom nová škála jej označila za rizikového. Jen ve dvou případech škála č. 1 označila pacienta za rizikového zatímco jej nová škála označila za bezrizikového.

Page 151: Cvičebnice statistiky

Výsledky: korelační koeficient je 0,304. Dle autorů Fowler et al. (2002) se jedná o slabou korelaci. Avšak korelace je statisticky významná (approx. Sig. < 0,05), tzn., že je nepravděpodobné, že výše uvedená korelace ( i když je slabá) vznikla náhodou.

Page 152: Cvičebnice statistiky

Podobným způsobem zanalyzujeme výsledky získané při porovnání škály č. 2 oproti nové škále. Škály se shodly celkem ve 44 případech. Počet případů, kdy jedna škála označila jako rizikového a druhá jako bezrizikového a naopak je více méně vyrovnaný (5 případů oproti 4 případům). Korelační koeficient phi je 0,574 – jedná se o střední korelaci, ta je statisticky významná (nevznikla jen náhodou). Celkově lze říci, že nová škála lépe koreluje se škálou č. 2 než se škálou č. 1.

Page 153: Cvičebnice statistiky

Příklad 6. Tento příklad navazuje na příklad předcházející. Vzhledem k tomu, že jak škála č. 1, tak i nová škála obsahují kategorii „pohyblivost“ a v obou případech je v této kategorii možno získat 0–4 body, kde 0 = velký problém a 4 = žádný problém (jediný rozdíl tedy je v tom, jakým způsobem má sestra respondenta hodnotit a jakým je popsán „výkon“ pacienta). Proto je možno vypočítat korelační koeficient u obou škál v této dané kategorii za použití skutečných skóre od 0 do 4 (tedy v tomto případě nebudeme uplatňovat dichotomizované výsledky – ty hrají roli pouze při určování celkového rizika na základě celkového skóre).

Page 154: Cvičebnice statistiky

Data v programu Microsoft Excel.

Page 155: Cvičebnice statistiky

V SPSS ve „Variable view“ nadefinujeme proměnné. Kategorie „pohyblivost“ má skórování od 0 do 4, je známa definice každé „úrovně“, tu vložíme do „Value Labels“.

Page 156: Cvičebnice statistiky

V SPSS ve „Variable view“ nadefinujeme proměnné. Pohyblivost je ordinální proměnná.

Page 157: Cvičebnice statistiky

Pro ordinální proměnné můžeme vypočítat Spearmanův korelační koeficient (není nutné, aby proměnné měly normální distribuci). Aby mohl proběhnout výpočet tohoto korelačního koeficientu, je třeba, aby u pohyblivosti byl typ nadefinován jako „Numeric“.

Page 158: Cvičebnice statistiky

Ujistíme se, že jsme z programu Microsoft Excel zkopírovali příslušná data. Klikneme „Analyze“ – „Correlate“ – „Bivariate“.

Page 159: Cvičebnice statistiky

Za pomoci šipky přesuneme do pravého pole „škála 1_pohyb“ a „škála nová_pohyb“, klikneme na „Spearman“, pak klikneme „Ok“.

Page 160: Cvičebnice statistiky

Korelační koeficient je 0,781 – jedná se tedy o silnou korelaci. Ta je navíc statisticky významná (a to na hladině 0,01), je tedy velmi nepravděpodobné, že k této korelaci došlo náhodou. V této dané položce tedy škála č. 1 a nová škála velmi dobře korelují.

Page 161: Cvičebnice statistiky

Procvičování – příklad 5

Page 162: Cvičebnice statistiky

Procvičování - příklad 5. Máme 37 respondentů. Zjistěte, jaká je korelace mezi jejich výškou a jejich výkonem při skoku dalekém. Měření jsou v cm.

Page 163: Cvičebnice statistiky

Pozor na definování chybějících hodnot. Vybráno číslo „999“, protože „99“ by mohlo představovat skutečnou výšku respondenta (např. malého dítěte) či skutečný výkon na skoku dalekém.

Page 164: Cvičebnice statistiky

Zkopírujeme data z programu Microsot Excel. Jedná se o poměrový typ proměnné, pro který lze použít Pearsonův korelační koeficient za předpokladu, že proměnné mají normální distribuci.

Page 165: Cvičebnice statistiky

Test normality a získání popisné statistiky

Page 166: Cvičebnice statistiky
Page 167: Cvičebnice statistiky
Page 168: Cvičebnice statistiky

Data mají normální rozložení pro všechny výšky.

Page 169: Cvičebnice statistiky
Page 170: Cvičebnice statistiky

Výpočet Pearsonova korelačního koeficientu.

Page 171: Cvičebnice statistiky

Výsledek

Page 172: Cvičebnice statistiky

Korelační koeficient je 0,834 – jedná se tedy o silnou korelaci. Ta je navíc statisticky významná (a to na hladině 0,01), je tedy velmi nepravděpodobné, že k této korelaci došlo náhodou. V této dané položce tedy škála č. 1 a nová škála velmi dobře korelují.

Page 173: Cvičebnice statistiky

Použité zdroje:Fink A. Conducting research literature reviews. 2010, Sage Publications, Inc., Thousand Oaks, CA, USA. ISBN 978-1-4129-7189-8.Fowler J, Jarvis P, Chevannes M. Practical Statistics for Nursing and Health Care. 2009, Wiley & Sons, Chichester, England. ISBN 978-0-471-49715-8.Greenhalgh T. How to read a paper. 2010. Wiley-Blackwell, London, UK. ISBN 978-1-4443-3436-4.IBM SPSS Statistics 19 Core System User’s Guide. Dostupný na http://www.helsinki.fi/~komulain/Tilastokirjat/IBM-SPSS-Statistics-User's-Guide.pdfhttp://statistics.laerd.com

Page 174: Cvičebnice statistiky

Projekt Zdravotnické studijní programy v inovaci na FZS Univerzity Pardubice CZ.1.07/2.2.00/15.0357

Děkuji Vám za pozornost

Tato cvičebnice byla vytvořena v rámci projektu spolufinancovaného z Evropského sociálního fondu a státního rozpočtu ČR.