besinci haftaturgaybilgin/2012-2013-guz/2012-2013... · 2016. 2. 17. · en yakın komşu...
TRANSCRIPT
-
Besinci HaftaSınıflandırma: Alternatif Teknikler
-
Örnek Tabanlı Sınıflayıcılar
Atr1 ……... AtrN Class
A
B
B
C
A
C
B
Set of Stored Cases
Atr1 ……... AtrN
Unseen Case
• Eğitim kayıtlarını depolaEğitim kayıtlarını depolaEğitim kayıtlarını depolaEğitim kayıtlarını depola
• ÖncedenÖncedenÖncedenÖnceden görülmeyen görülmeyen görülmeyen görülmeyen olayların sınıfını tahmin için olayların sınıfını tahmin için olayların sınıfını tahmin için olayların sınıfını tahmin için eğitim kayıtlarını kullaneğitim kayıtlarını kullaneğitim kayıtlarını kullaneğitim kayıtlarını kullan
-
Örnek Tabanlı Sınıflayıcılar
� Örnekler:
– Ezber-öğrenici� Ezberler eğitim verisine girer ve eğitim örneklerinden mükemmel şekilde eşleşen biri ile sınıflandırma yerine getirilir.
– En yakın komşu� Sınıflandırmayı yerine getirmek için k adet en kapalı nokta (en yakın komşular) kullanılır.
-
En yakın Komşu Sınıflayıcılar
� Temel fikir:
– Eğer bilinmeyen bir canlı, bir ördeğe benzer şekilde hareket eder ve sesi de ördeğinkine benzerse onun ördek olma ihtimali vardır.
Eğitim kayıtları
Test kaydıUzaklığı hesap et
En yakın komşulardan k
tanesini seç
-
En yakın Komşu Sınıflayıcılar
� Üç şeye ihtiyaç vardır:
– Kaydedilmiş veriler
– Kayıtlar arasındaki mesafeyi ölçme için bir uzaklık ölçümü
– k değeri, alınıp getirilecek komşuların adedi
� Bilinmeyen bir kaydı sınıflandırmak için :
– Diğer eğitim kayıtlarına uzaklık hesaplanır
– k tane en yakın komşu belirlenir
– Bilinmeyen kaydın sınıfını belirlemek için en yakın komşuların sınıf etiketleri kullanılır
Unknown record
-
En yakın Komşu Tanımı
X X X
(a) 1-nearest neighbor (b) 2-nearest neighbor (c) 3-nearest neighbor
Bir x kaydının k-en yakın komşusu; x değerine en küçük mesafede yer alan k tane veri noktasıdır.
-
En yakın Komşu Sınıflandırması
� İki nokta arasındaki mesafe hesabı:
– Öklidyen uzaklık
� En yakın komşu listesinden sınıfı belirle
– k-en yakın komşu arasından çoğunluk oylaması yoluyla sınıf etiketini al
– Mesafeye göre oylara ağırlık ver� ağırlık faktörü, w = 1/d2
∑ −=i ii
qpqpd 2)(),(
-
En yakın Komşu Sınıflandırması
� k değerinin seçimi:– Eğer k çok küçük ise gürültülü noktalara karşı duyarlı
olmak lazım
– Eğer k çok büyük ise, komşuluk diğer sınıflardan noktaları içerebilir.
-
En yakın Komşu Sınıflandırması
� Ökllidyen ölçümü ile ilgili problem:
– Yüksek boyutlu veri� boyutların aşırı fazlalığı
-
En yakın Komşu Sınıflandırması
� k-NN sınıflayıcılar tembel öğrencilerdir
– Modeller belirgin olarak inşa edilemez
– Kural tabanlı sistemler ve karar a acı ğtümevarımı gibi istekli ö renici de ildirğ ğ