sıralı verilerle yapılan testler mann-whitney u testi
TRANSCRIPT
Sıralı Verilerle Yapılan Testler
Mann-Whitney U Testi
Parametrik testlerin, normal dağılım varsayımına
dayandığını, normal dağılıma sahip olmayan veriler
üzerinde kullanıldığında, elde edilen sonuçların
güvenilir olamayacağını biliyoruz
Örneklemin büyük olması durumunda, normal
dağılımdan sapma olması, parametrik testlerin
güvenilirliğini fazla etkilemeyebilir (merkezi limit
teoremi)
Örneklemin küçük ve dağılımın normal olmaması
durumunda ise, parametrik olmayan (dağılımdan
bağımsız) testlerin kullanılması gerekir
Parametrik olmayan testler, orijinal serilerden ziyade,
ranklarla (sıralanmış serilerle) yapılır; Dolayısıyla aşırı
değerlerden etkilenmez.
Veriler sıralı serilerden oluşmuşsa ve
açıkça normal (Gaussian) bir dağılıma
sahip değilse; Örneğin, bir sınıftaki
öğrencilerin başarı sıralaması, yeni doğan
bebeklerin “Apgar sağlık skorları”,
görsel analog ağrı skorları, görsel
(yıldızlı) kalite skorları, vs.
Elimizdeki veriler normal dağılıma sahip
olmamakla beraber, bazı aşırı değerler
(çok yüksek veya çok düşük) varsa ve bu
değerleri elimine etmek istemiyorsak,
parametrik olmayan testleri kullanırız
Parametrik olmayan testlerde rankların
yeri hiç bir zaman aşırı bir değeri
yansıtmaz
Eğer elimizdeki örneklem çok küçükse, verilerin normal dağılıma sahip olup olmadığı görsel olarak (grafikle) anlaşılamayabilir
Ayrıca, normallik testleri de (örneğin, Shapiro-Wilk veya Kolmogorov-Smirnov testleri) küçük örneklemden dolayı düşük istatistiki güçten dolayı güvenilir olmayabilir
Yukarıdaki durumlarda, çözüm olarak yine parametrik olmayan testler kullanabiliriz
Eğer örneklem aynı zamanda normal dağılıma sahipse parametrik testler kullanılır (daha çok istatiki güç elde edilir)
Eğer örneklem aynı zamanda normal dağılıma sahip değilse, yine de parametrik testler kullanılabilir; Çünkü normal dağılımdan sapma olduğu durumlarda dahi, merkezi limit teoremi nedeniyle, parametrik testlerin güvenilir sonuçlar verdiği görülmüştür
Parametrik olmayan testler, normal dağılıma sahip olan
büyük örneklemlerle de iyi çalışır, bununla birlikte,
parametrik testlerden çok küçük oranlarda daha az
istatistiki güce sahip olabilir
Normal dağılıma sahip olmayan küçük örneklemlerde
parametrik testler güvenilir sonuçlar vermez
Normal dağılıma sahip ve küçük örneklemlerde
parametrik olmayan testler daha büyük p-değerleri
verir (daha küçük istatistiki güç verir)
Normal dağılıma sahip olmayan küçük örneklemlerde
parametrik olayan testler daha büyük istatistiki güç
verir
Mann-Whitney U test, parametrik
“bağımsız gruplar t-testi”nin parametrik
olmayan karşılığıdır
Normal dağılıma sahip olmayan
populasyondan elde edilen verilerde iki
grup karşılaştırması için kullanılır
1
1
( 1)
2
i in
' rneklem b y kl
nA A
C i
i
C
n
i
i
A
n nM R
M Hesaplanan Mann WhitneyU test istatistiği
R Graup A ç rankların toplamı
n Grup A nınö ü ü üğü
0
1 0
( ; , )
: ayet
:
De eriA B
C T
T T n n
Hipotez Karar Kuralı
H A B Ş M M ise
H A B H hipotezi RET
Tablo ğ M M
0
1 0
(1 ) ( ; , )
: ayet
:
De eriA B
C T
T A B T n n
Hipotez Karar Kuralı
H A B Ş M M ise
H A B H hipotezi RET
Tablo ğ M n n M
0
1
0
( /2; , )
0
( /2; , )
:
:
ayet
De eri
ayet
De eri
A B
A B
C T
T T n n
C T
T A B T n n
Hipotez
H A B
H A B
Karar Kuralı
Ş M M ise
H hipotezi RET
Tablo ğ M M
veya
Ş M M ise
H hipotezi RET
Tablo ğ M n n M
Bir mikrobiyoloji uzmanı, değişik coğrafi
bölgedeki iki hastanenin “nosocomial
enfeksiyon” oranlarını karşılaştırmak
istemektedir
Tablo 1’de Hastane A ve Hastane B’ye ait
oranlar yer almaktadır
İki hastane arasında oranlar bakımından
önemli bir farkın olup olmadığını test
ediniz
X(A) Rank X(A)
X(B)
Rank X(B)
11.3 7.5 12.5 9 15.2 11 10.6 4.5 19 15 10.3 3 8.2 2 11 6 6.8 1 17 13
11.3 7.5 18.1 14 16 12 13.6 10 23 18 19.7 17
19.1 16 10.6 4.5
Toplam Rank 94.5 76.5
Hesaplanan değer (39.5), tablo alt sınır
(18) ve üst sınır (59) değerleri arasına
düştüğü için, sıfır hipotezi (H0)
reddedilemez.
1
( ; , ) (.05;10,8)
( 1) 10(10 1)94.5 39.5
2 2
0.05
deg 18A B
A AC A
i
T n n T
C T
n nM R
Tablo eri M M
M M
Ranks
Hastane N Mean Rank Sum of Ranks
Enfeksiyon.Orani Hastane A 10 9.45 94.50
Hastane B 8 9.56 76.50
Total 18
Test Statisticsb
Enfeksiyon.Orani
Mann-Whitney U 39.500
Wilcoxon W 94.500
Z -.044
Asymp. Sig. (2-tailed) .965
Exact Sig. [2*(1-tailed Sig.)] .965a
a. Not corrected for ties.
b. Grouping Variable: Hastane
0 A B
1 A B
1 ( ; , )
0
H : x x
H : x > x
(10)(8) 21 59
59
A BA B n n
C
M n n M
Sayet M H RET
0 A B
1 A B
( ; , ) (.05;10,8)
0
H : x x
H : x < x
21
21
A Bn n
C
M M M
Sayet M H RET