sınıflandırıcılarda hata Ölçülmesi ve karşılaştırılması için İstatistiksel...

30
Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi [email protected] http://www.cmpe.boun.edu.tr/~ethem SİU 2009

Upload: jovita

Post on 19-Mar-2016

111 views

Category:

Documents


2 download

DESCRIPTION

SİU 2009. Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler. Ethem Alpaydın Boğaziçi Üniversitesi [email protected] http://www.cmpe.boun.edu.tr/~ethem. Giriş. Sorular: Bir sınıflandırıcının hatasını nasıl ölçebiliriz? - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

Ethem AlpaydınBoğaziçi Ü[email protected]://www.cmpe.boun.edu.tr/~ethem

SİU 2009

Page 2: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20092

Giriş Sorular:

Bir sınıflandırıcının hatasını nasıl ölçebiliriz?

İki sınıflandırıcının hatasını nasıl karşılaştırabiliriz?

Öğrenme/geçerleme/deneme kümeleri Yeniden örnekleme: K-kat çapraz geçerleme Parametrik ve parametrik olmayan testler İkiden çok sınıflandırıcının karşılaştırılması Tek/çok veri kümesi Hata dışındaki ölçütlerin karşılaştırılması

Page 3: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20093

Yöntemlerin Karşılaştırılması Kıstaslar (Uygulamaya bağlı olarak):

Sınıflandırma hatası (Risk, kayıp fonksiyonları)

Öğrenme zaman/bellek karmaşıklığıDeneme zaman/bellek karmaşıklığıYorumlanabilirlikKolay programlanabilme

Masraf (karmaşıklık) duyarlı öğrenme

Page 4: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20094

Öğrenme, Ezberleme, Genelleme

Deneme Kümesi

Geçerleme Kümesi

Öğrenme Kümesi

Çapraz geçerleme

Page 5: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20095

Yeniden Örnekleme K-Kat Çapraz Geçerleme Birden çok öğrenme/gerçekleme kümesi yaratmak için

{Xi,Vi}i: kat i X, K parçaya ayırılıyor: Xi,i=1,...,K

K-2 parça ortak Sınıf olasılıklarının korunması

121

31222

32111

KKKK

K

K

XXXTXV

XXXTXVXXXTXV

Page 6: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20096

1510

2510

259

159

124

224

223

123

112

212

211

111

XVXTXVXT

XVXTXVXTXVXTXVXT

5×2 Çapraz Geçerleme 5 kere 2 kat çapraz geçerleme (Dietterich, 1998)

Page 7: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20097

Aralık Kestirimi X = { xt }t , xt ~ N ( μ, σ2) m ~ N ( μ, σ2/N)

100(1- α) %güven aralığı

1

950961961

950961961

22 Nzm

NzmP

.N

.mN

.mP

..mN.P

~mN

//

Z

Page 8: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20098

1

950641

950641

NzmP

.N

.mP

..mNP

Tek taraflı güven aralığı

Page 9: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 20099

1

1

1212

122

NStm

NStmP

t~SmNN/mxS

N,/N,/

Nt

t

σ2 bilinmediğinde:

Page 10: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200910

Hipotez Testleri Sıfır hipotezi H0

Örneğin, H0: μ = μ0 vs. H1: μ ≠ μ0 Eğer μ0 , 100(1- α) güven aralığına düşmüyorsa H0 reddedilir

X = { xt }t , xt ~ N ( μ, σ2)

Çift taraflı test 22

0// z,zmN

Page 11: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200911

Tek taraflı test: H0: μ ≤ μ0 vs. H1: μ > μ0 H0 reddedilmez eğer

Varyans bilinmiyorsa; z yerine t dağılımı H0: μ = μ0 reddedilmez eğer

z,mN 0

12120

N,/N,/ t,tSmN

Page 12: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200912

Testin hata tipleri ve gücü

Karar

Gerçek Kabul Red

H0 Doğru Doğru karar Birinci tip hata ()

H0 Yanlış İkinci tip hata ()

Doğru karar (Güç)

Page 13: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200913

Hata Ölçülmesi: H0: p ≤ p0 vs. H1: p > p0 Tek öğrenme/geçerleme kümesi: Binom

TestiHata olasılığı p0 ise, en az e hata yapma olasılığı çok küçükse reddet:

Page 14: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200914

Normal Approximation to the Binomial Hata sayısı X yaklaşık olarak N (Np0 ,

Np0(1-p0))

X = e için bu değer > zα ise reddet

1- α

Z~

pNpNpX

00

0

1

Page 15: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200915

Birden çok Öğrenme/Geçerleme xt

i = 1 eğer kat i’de örnek t yanlış sınıflandırılırsa Kat i’de hata:

H0: p ≤ p0 vs. H1: p > p0 reddederiz, eğer

> tα,K-1

Nx

pN

tti

i 1

1

0

Kt~S

pmK

Page 16: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200916

Sınıflandırıcıların Karşılaştırılması: H0: μ1 = μ2 vs. H1: μ1 ≠ μ2 K-kat Çapraz Geçerleme Eşlenmiş t testi pi

1, pi2: Sınıflandırıcı 1 ve 2’nin kat i’deki

hataları pi = pi

1 – pi2 : Kat i’deki eşlenmiş fark

Sıfır hipotezimiz pi ‘in beklenen değeri 0’dır:

1,2/1,2/1

1

221

00

, Reddet ~01

0: vs.0:

KKK

K

i iK

i i

tttsmK

smK

Kmp

sKp

m

HH

Page 17: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200917

5×2 Çapraz Geçerleme Eşlenmiş t Testi (Dietterich, 1998) 5×2 çapraz geçerleme ile 5 tekrarda 2 kat

öğrenme/geçerleme kümesi oluşturulur pi

(j) : sınıflandırıcılar 1 ve 2’nin kat j=1, 2 tekrar i=1,...,5’deki farkı

Çift taraflı : Reddet H0: μ1 = μ2 eğer (-tα/2,5,tα/2,5) Tek taraflı: Reddet H0: μ1 ≤ μ2 eğer > tα,5

551

2

11

2221221

5

2

t~/s

ppppps/ppp

i i

iiiiiiii

Page 18: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200918

5×2 Çapraz Geçerleme Eşlenmiş F Testi (Alpaydın, 1999)

Çift taraflı test: Reddet H0: μ1 = μ2 eğer > Fα,10,5

5105

12

51

21

2

2 ,

i i

i jj

i F~s

p

Page 19: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200919

L>2 Sınıflandırıcı: Varyans Analizi (Anova)

L sınıflandırıcının K kattaki hataları

Reddedilirse ikili testler

LH 210 :

K,...,i,L,...,j,,~X jij 1 12 N

Page 20: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200920

Anova tablosuDeğişken

liğin kaynağı

Karelerin toplamı

Serbestlik

derecesi

Ortalama Kare

F0

Gruplar arası

L-1

Grup içi L(K-1)Toplam LK-1

Page 21: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200921

Çoklu Anakütle Testleriyle İlgili Bonferroni düzeltmesi: Eğer m test

sonunda bir karara varılacaksa, sonuç karar hassasiyetinin α olabilmesi için, her bir testin hassasiyetinin α/m olması gerekir.

Kontrastlar

Page 22: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200922

MultiTest Yöntemiyle Sınıflandırıcıların Sıralanması (Yıldız ve Alpaydın, 2006) L sınıflandırıcı ön bir karmaşıklık ölçütüne

göre sıralanır: i<j olmak üzere ikili testlerle çizge

oluşturulur: Eğer H0: μi <= μj reddedilirse, (i,j) eklenir,

Topolojik olarak sıralanır

Page 23: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200923

Page 24: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200924

Page 25: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200925

Parametrik olmayan testler İşaret testi Sıralama (rank) testleri: Kruskal-Wallis

testi Friedman sıralama testi Kullanımı:

Birden çok veritabanı üzerinde karşılaştırma

Sınıflandırma hatası dışındaki ölçütlerin (hız, bellek, vs) karşılaştırılması

Page 26: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200926

Başarı Ölçütleri Hata = (FN+FP) / N Recall

= bulunan artılar/ toplam artılar = TP / (TP+FN) = sensitivity = hit rate

Precision = bulunan artılar / bulunanlar= TP / (TP+FP)

Specificity = TN / (TN+FP)

False alarm rate = FP / (FP+TN) = 1 - Specificity

Öngörü

Gerçek

Artı Eksi

Artı TP FN

Eksi FP TN

Page 27: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200927

ROC Eğrisi

Page 28: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200928

Page 29: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200929

Sonuçlar Güven aralıkları <=> Örnek kümesi

büyüklüğü Öğrenme, ezberleme, genelleme Deney tasarımı

Page 30: Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

SİU 2009 Eğitim semineri E Alpaydın Nisan 200930

Kaynaklar M. Aytaç (2004) “Matematiksel İstatistik,” Ezgi

Yayınevi.