neparametrijski testovi

Post on 18-Jan-2016

173 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

NEPARAMETRIJSKI TESTOVI. 2. M: 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 8, 9, 11, 13, 14, 18 8,5 2 Z: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 5, 6, 7, 8, 11, 11. 3,5. 2,5. 5,5. Da li ovi rezultati ukazuju na trend u koncentraciji hormona?. NEPARAMETRIJSKA ANOVA - PowerPoint PPT Presentation

TRANSCRIPT

NEPARAMETRIJSKI TESTOVINEPARAMETRIJSKI TESTOVI

Parametrijske metode: merljivi podaci koji se normalno distribuiraju

Neparametrijske metode: nije važno da li rezultati podležu

normalnoj raspodeli, često rezultati nisu izraženi mernim

jedinicama već frekvencijama "statistika slobodna od distribucije"

"snaga" neparametrijskih testova

< "snaga" parametrijskih testova

Pogodne za: preliminarna ispitivanja malog broja

merenja brza izračunavanja (često bez tablica) raspodela značajno odstupa od

normalne

Mera centralne tendencije: obično medijana Merilo disperzije: interkvartilni interval

Primer 1. Utvrđeno je da nivo proteina krvne plazme kod 20 muškaraca i 20 žena iznosi (mg/100 mL): M: 3 2 1 4 3 2 9 13 11 3 18 2 4 6 2

1 8 5 1 14 Ž: 6 5 2 1 7 2 2 11 2 1 1 3 11 3 2

3 2 1 4 8. Kakve informacije o razlici između nivoa ovog proteina kod muškaraca i žena možete dobiti na osnovu ovih rezultata?

M: 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 8, 9, 11, 13, 14, 18

8,5 2

Z: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2,3, 3, 3, 4, 5, 6, 7, 8, 11, 11

3,5

2

2,5

5,5

Rezultati se prikazuju u obliku tablice: min. niži medijana viši max kvartil kvartil

M: 1 2 3,5 8,5 18 Ž: 1 2 2,5 5,5 11 može i grafički nesimetrična distribucija metode koje

podrazumevaju normalnu raspodelu nisu pogodne

medijane slične interval vrednosti značajno širi za muškarce

proveriti pogodnim testom da li je ta razlika statistički značajna

Test predznaka (The sign test) najjednostavnija od svih neparametrijskih

metoda nalik t-testu može da se primeni na nekoliko načina

Primer 2. Neki farmaceutski preparat treba da ima medijanu sadržaja aktivne komponente od 8%. Ispitivanja uzastopnih šarži dala su sledeće rezultate: 7,3; 7,1; 7,9; 9,1; 8,0; 7,1; 6,8; 7,3%. Da li se podaci značajno razlikuju od postulirane medijane na nivou značajnosti od P = 0,05?

parametrijska metoda → t-test neparametrijski postupak:

)()()( knknk qpkP p = q = 1/2

P(6) = 7C6 × (1/2)6 × (1/2)1 = 7/128;

P(7) = 1/128 P(6 ili više "-") = 8/128

- dvosmerni test: P(6 ili više identičnih

znakova) = 16/128 = 0,125 > 0,05

Ne može da se odbaci H0

Može da se koristi i za poređenje dva seta rezultata;

da ukaže na trend

Primer 3. Nivo hormona u krvnoj plazmi pacijenta meren je u isto vreme tokom 10 dana. Dobijeni su sledeći rezultati:

Dan 1 2 3 4 5 6 7 8 9 10

ng/mL 5,8 7,3 4,9 6,1 5,5 5,5 6,0 4,9 6,0 5,0

Da li ovi rezultati ukazuju na trend u koncentraciji hormona?

Parametrijska metoda: linearna regresiona analiza i provera da li se nagib dobijene prave značajno razlikuje od 0

neparametrijska metoda – jednostavnija: H0: ne postoji trend u rezultatima. Postupak: podaci se podele u dva jednaka seta, pri čemu se zadrži njihov redosled:

5,8 7,3 4,9 6,1 5,5 5,5 6,0 4,9 6,0 5,0 + + 0 + + 4 rezultata, svi pozitivni P 4 ista znaka od 4 = 2 × 1/16 = 0,125 > 0,05 H0: nema trenda u rezultatima ne može da se odbaci na nivou značajnosti od P = 0,05.

Test homogenog niza (Wald-Wolfowitz runs test)

da li pojave imaju "+" ili "-" znak da li se ovi znaci javljaju u slučajnoj

sekvenci. Primer 4.

Linearna regresiona jednačina je primenjena za podešavanje prave od 12 kalibracionih tačaka. Znaci rezultujućih y-ostataka u nizu rastućih x-vrednosti su: ++++------++. Da li je bolje prihvatiti krivolinijsko podešavanje tačaka?

Nul-hipoteza: sekvenca + i - znakova je slučajna.

N = broj "+" znakova = 6

M = broj "–" znakova = 6

broj nizova = 3 (i jedan znak predstavlja niz)

Tablica: na nivou značajnosti od P = 0,05 broj nizova mora da bude < 4 da bi nulta hipoteza bila odbačena

ODBACUJEMO NUL-HIPOTEZU

KRIVOLINIJSKA ZAVISNOST

Test ekvivalentnih parova (Wilcoxon signed rank test)

Vilkoksonov test ekvivalentnih parova = Vilkoksonov test predznaka i ranga = Vilkoksonov test ranga sa predznakom da li su individualna merenja veća ili manja

od medijane, a veličina ovih devijacija se ne uzima u obzir;

Primer.

Nivo Pb u krvi (u pg/mL) sedmoro dece iznosi:

104; 79; 98; 150; 87; 136 i 101. Mogu li ovakvi podaci pripadati istoj populaciji, za koju je pretpostavljeno da je simetrična, sa medijanom (srednjom vrednošću) od 95 pg/mL?

Odstupanja od medijane iznose: 9, -16, 3, 55, -8, 41, 6.

Ove vrednosti se poređaju u rastući niz bez obzira na znak: 3, 6, 8, 9, 16, 41, 55, a onda im se pridružuju znaci: 3, 6, -8, 9, -16, 41, 55.

Brojevi se onda rangiraju uz zadržavanje predznaka: 1, 2, -3, 4, -5, 6, 7. Suma pozitivnih rangova = 20 Suma negativnih rangova = 8. - manja vrednost (8) se poredi sa tabličnom vrednošću

Wilcoxon-ov test sume rangova poređenje dva nezavisna uzorka koji ne

mogu da budu svedeni na jedan set podataka Primer: Uzorak fotografskog otpadnog materijala analiziran je na sadržaj Ag AAS-metodom i dobijeni su sledeći rezultati: 9,8; 10,2; 10,7; 9,5 i 10,5 g/cm3. Posle određenog hemijskog tretmana fotografski otpad je ponovo analiziran istim postupkom i dobijeni su rezultati: 7,7; 9,7; 8,0; 9,9 i 9,0 g/cm3.

Da li primenjeni hemijski tretman dovodi do značajnog sniženja sadržaja Ag? H0: Dva seta pripadaju istoj populaciji

p r v o : r a n g i r a n j e s v i h r e z u l t a t a :

2

1nnST 11

11

;

2

1nnST 22

22

n 1 = n 2 = 5 ; n i ( n i + 1 ) / 2 = 1 5 T 1 = 3 ; T 2 = 2 2 3 s e p o r e d i s a t a b l i č n i m v r e d n o s t i m a ( j e d n o s m e r n i t e s t ) : T n 4 o d b a c u j e s e H 0 d a d v a s e t a p r i p a d a j u i s t o j p o p u l a c i j i t j . h e m i j s k i t r e t m a n s m a n j u j e s a d r ž a j A g

NEPARAMETRIJSKA ANOVA

Jednofaktorska (više nezavisnih uzoraka): - (prošireni medijana-test) - Kruskal-Wallis-ov test: koristi rangove umesto “sirovih” podataka; “snažniji” od proširenog medijana-testa χ2

Više zavisnih uzoraka: - Friedman-ov test

Neparametrijske regresione metode

najjednostavnija tzv. Theil-ova "nepotpuna" metoda

Pretpostavka: serija tačaka (x1,y1), (x2, y2) ... koje se podešavaju pomoću prave y = a + bx.

Prvi korak: rangiranje tačaka u nizu rastućih x-vrednosti.

izračunavanja se uvek vrše sa parnim brojem tačaka

Za svaki par tačaka (xi, yi) (xj, yj), gde je j = n/2+i, nagib bij linije koja prolazi kroz te tačke može da se izračuna kao:

bij = (yj - yi) / (xj - xi).

medijana izračunatih vrednosti predstavlja nagib regresione prave

Sa ovom vrednošću b izračunavaju se a

vrednosti, koje se zatim poređaju u rastući niz čija medijana predstavlja najbolju izračunatu vrednost odsečka na y-osi.

Theil-ova potpuna metoda: Nagib se računa kao medijana nagiba za svaki par tačaka (1 ≤ i, j ≤ n) odsečak isto kao kod nepotpune metode više računanja

Prednosti Theil-ovih metoda:• ne pretpostavljaju greške samo u y-vrednostima• ne pretpostavljaju normalnu raspodelu grešaka • neosetljive na ekstremne vrednosti (outliers)

A comparison of best fit lines for data with outliers(Glaister, P. Int. J. Math. Educ. Sci. Technol. 2005, 36, 110–117)

KolmogorovKolmogorov-Smirnov-Smirnov-ljev-ljev test test

Za testiranje normalnosti raspodelePoredi krivu kumulativne frekvencije sa krivom pretpostavljene raspodelePodaci se transformišu u standardnu formu(izračunavaju se z-vrednosti)

x

z

top related