accuracy measure - jurusan informatika · setiap sampel dari training set memiliki atribut dan klas...

15

Accuracy Measure Accuracy Measure Precision, Recall & F Precision, Recall & F - - Measure Measure Dr. Taufik Fuadi Abidin, S.Si., M.Tech Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Bahan Kuliah Data Mining

Upload: lamnhu

Post on 10-Mar-2019

218 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Accuracy MeasureAccuracy MeasurePrecision, Recall & FPrecision, Recall & F--MeasureMeasure

Dr. Taufik Fuadi Abidin, S.Si., M.Tech

Program Studi Teknik InformatikaFMIPA Universitas Syiah Kuala

www.informatika.unsyiah.ac.id/tfa

Bahan Kuliah Data Mining

Page 2: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Outline Pertemuan

Perhitungan Akurasi untuk Kasus Klasifikasi

Confusion Matriks

Definisi: Precision, Recall

F-Measure

Perhitungan Akurasi Menggunakan Perangkat Lunak Weka: Contoh Kasus Pima-Diabetes

Page 3: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Klasifikasi Perlu Training Set

Klasifikasi adalah proses pembelajaran secara terbimbing (supervised learning)

Untuk melakukan klasifikasi, dibutuhkan training set sebagai data pembelajaran

Setiap sampel dari training set memiliki atribut dan klas label. Contoh klas label:

Usulan kredit : diterima atau ditolak

Kelulusan : pujian, sangat memuaskan, memuaskan

Page 4: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Contoh Kasus KlasifikasiSebuah perusahaan kartu kredit (credit card) menerima ribuan aplikasi baru setiap hari untuk mengajukan kartu kredit baru. Setiap aplikasi memiliki informasi tentang peserta, misalnya:

UmurStatus perkawinanPendapatan per tahundan lain-lain

Problem: menentukan aplikasi mana yang dapat disetujui dan aplikasi mana yang harus ditolak

Page 5: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Mengukur Hasil Klasifikasi

Bagaimana cara mengukur sebuah metode klasifikasi (yang digunakan untuk menentukan klas label dari sampel baru) memiliki akurasi yang tinggi?

Atau, dalam memilih metode klasifikasi terbaik, apa sebenarnya yang diukur dan dibandingkan?

Bagaimana cara mengukur akurasi?

Page 6: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Dua Tahapan Klasifikasi

Learning (training): Pembelajaran menggunakan data training

Testing: Menguji metode atau model menggunakan data testing

diuji yang testingsampel Total

benar secara asidiklasifik yangJumlah =Akurasi

Sumber: Bing Liu, Web Data Mining

Page 7: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Asumsi Saat Pembelajaran

Distribusi dari training sample diasumsikan sama dengan distribusi dari testing sampel termasuk distribusi dari data baru (unclassified sample) yang ingin diduga klas labelnya

Untuk mendapat akurasi yang baik saat mengklasifikasi testing data maka training set harus mampu merepresentasikan keadaan dari data tes

Jika tidak, maka akurasi biasanya rendah (kurang baik)

Page 8: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Confusion Matriks

. .FNTP

TP r

FPTP

TPp

+=

+=

Sumber: Bing Liu, Web Data Mining

Precision (p) = jumlah sampel berkategori positif diklasifikasi benar dibagi dengan total sampel yang diklasifikasi sebagai sample positif

Recall (r) = jumlah sampel diklasifikasi positif dibagi total sampel dalam testing set berkategori positif

Page 9: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

ContohSumber: Bing Liu, Web Data Mining

precision p = 100%

recall r = 1%

Mengapa? Karena kita hanya berhasil mengklasifikasi satu sampel positif secara benar dan semua sampel negatif benar

Page 10: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

F-Measure (F1-Score)

F-Measure (F1) adalah harmonic mean dari precision dan recall

Range dari nilai F-Measure adalah 0 sd 1.

Page 11: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Hitung Precision, Recall dan F-Measure

Sumber: Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques

Page 12: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Ilustrasi Perhitungan Akurasi: Menggunakan Weka

Page 13: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Data: Pima-Diabetes

Page 14: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Hasil dan Akurasi: KNN, k=3

Page 15: Accuracy Measure - Jurusan Informatika · Setiap sampel dari training set memiliki atribut dan klas label. ... Contoh Kasus Klasifikasi ... klas label dari sampel baru) memiliki akurasi

Questions &

Discussion

INSTRUMEN PENILAIAN BAGI PENGIKTIRAFAN … · soal selidik telah digunakan untuk mendapatkan sampel daripada 73 orang pakar. Populasi penyelidikan ini ialah mereka yang memiliki kepakaran

PERTEMUAN 10 - donisyahalam.files.wordpress.com fileSampling acak sederhana (simple random sampling) • Suatu sampel dikatakan random jika setiap unsur atau anggota populasi memiliki

BAB III METODE PENELITIAN 3.1 Jenis Penelitiandigilib.unila.ac.id/21166/14/BAB III.pdf · Sampel merupakan bagian dari populasi yang memiliki ciri-ciri atau keadaan tertentu yang

POPULASI DAN SAMPEL POPULASI DAN SAMPEL Apakah

TEKNIK PENGAMBILAN SAMPEL€¦ · Merupakan pengambilan sampel dari populasi secara acak tanpa memperhatikan strata yang ada dalam populasi dan setiap anggota populasi memiliki kesempatan

PENGARUH BIAYA PERDAGANGAN MITRA DAN …e-journal.uajy.ac.id/6770/1/JURNAL.pdf · Penelitian ini menggunakan sampel 65 negara-negara di benua Asia ... Setiap negara di dunia memiliki

Besar Sampel & Cara Pengambilan Sampel

New FAKULTAS KESEHATAN MASYARAKAT UNIVERSITAS …repository.unimus.ac.id/2500/8/MANUSCRIPT.pdf · 2019. 1. 22. · Metode : penelitian cross sectional ini memiliki sampel sebanyak

revisi modul 6 populasi dan sampel · memiliki sifat yang sama, ... adalah sebagian dari jumlah dan karakteristik yang dimiliki oleh populasi. ... Pertanyaan yang harus selalu diajukan

S-klas · Web view2021. 2. 4. · Naam: Klas: S-klas. Week: 6 (8-12 febr. ) Naam: Klas: S-klas. S-klas (T)Huiswerk. S-klas (T)Huiswerk. Dag 1: Dag 2; N. ieuwsbegrip. de taak van

JURUSAN PENDIDIKAN KEPELATIHAN OLAHRAGA …lib.unnes.ac.id/2231/1/5579.pdf · Pengambilan sampel dengan cara teknik total sampling yaitu ... Hexos, Popmie, ... memiliki banyak prestasi

PERBEDAAN KUALITAS DAN NILAI GIZI SOSIS JAMUR …lib.unnes.ac.id/28213/1/5401411034.pdf · vii memiliki kriteria cukup disukai masyarakat, sampel B memiliki kriteria kurang disukai

Jumlah Sampel Yang Terkumpul Jumlah Sampel Keterangan

· Stamet Klas Ill Cut Bau Sabang Stamet Klas Ill tabing Padang Stamet Klas Ill Japura Rengat Star-net Klas I Hang Nadim Batam Stamet Klas Ill Binaka Gunung Sitoli Stamet Klas Ill

LAPORAN Survei Volume Penjualan Komoditas Spesifik · 1.4. Metodologi 1.4.1. Kerangka Sampel Kerangka sampel yang dibentuk ada 9 (sembilan) kerangka sampel. Kerangka sampel tersebut

BAB III METODOLOGI PENELITIAN - etheses.uin-malang.ac.idetheses.uin-malang.ac.id/2036/7/07510104_Bab_3.pdf · mengatakan bahwa sampel adalah bagian dari populasi yang memiliki ciri-ciri

BAB III METODE PENELITIAN A. Lokasi, Populasi, dan Sampel ...repository.upi.edu/12625/6/S_FIS_0905542_Chapter3.pdf · mengambil sampel salah satu kelas yang memiliki rata-rata nilai

HUBUNGAN KUALITAS BAHAN ORGANIK TANAH DAN LAJU … · Sukabumi dengan judul laporan “Eksplorasi Begonia Sebagai Tanaman Obat di ... Volume sampel tanah yang ... memiliki densitas

BAB III METODE PENELITIAN A. Desain Penelitianrepository.upi.edu/26844/6/S_PSPI_1201986_Chapter 3.pdf · penelitian”, agar sampel penelitian memiliki bobot yang representatif sebagai

PANDUAN - smart-tbk.com · kerangka pengambilan contoh/sampel, cara dan instrumen pengumpulan ... Memiliki SOP keselamatan dan ... pengaruhnya terhadap operasional gas engine 3)

PERBANDINGAN SAMPEL ACAK DAN SAMPEL DENGAN …repository.usd.ac.id/31543/2/133114025_full.pdf · sampel probabilitas dan nonprobabilitas, namun prosedur penarikan sampel yang secara

Virtuele klas -VK- versus klas in real life -klas IRL-

mediagizipangan.orgmediagizipangan.org/wp-content/uploads/2016/08/13.-Manjilala... · PENDAHULUAN Satu tahun pertama ... Sampel pada penelitian ini ialah ibu yang memiliki anak umur

Kata Pengantar - bsd. · PDF fileFILUM MOLLUSCA ..... 55 A. Klas Amphineura ... FILUM COELENTERATA . 92 . A. Klas Hydrozoa B. Klas Stromatoporoidea. 93 . C. Klas Anthozoa. 94 -- -95

Klas 2 & klas 3 - vanhaestrechtcollege.nl · Keuze klas 3 Basis / Kader 17 Keuze klas 3 Gemengde leerweg 19 Keuze klas 3 Theoretische leerweg 20 Voorwaarden 7 e vak 22. Keuzeboekje

MEMBUAT KUESIONER 2. TEKNIK PENGAMBILAN SAMPEL DAN UKURAN SAMPEL

Virtuele klas -VK- versus klas in real life -klas IRL- studenten

BAB III METODOLOGI PENELITIAN A. Tujuan Penelitianrepository.fe.unj.ac.id/2527/5/chapter3.pdfSampel yang diikutsertakan dalam analisis adalah sampel yang memiliki kriteria sebagai

Lampiran 1 Sampel Penelitian Keterangan Sampel Jumlahrepository.wima.ac.id/1188/7/Lampiran.pdfPerusahaan yang memiliki kelengkapan data variabel yang diteliti berturut-turut dari tahun

8. Sampel Pembanding Dan Sampel Pertinggal

Aspal, Klas a, Klas B,A

BAHAN AJAR MINGGU 1. 1 SOSIOLOGI KLS X PO… · Populasi dan sampel sebenarnya memiliki keterkaitan. Karena sampel merupakan bagian dari populasi. Berikut definisi sampel me- nurut

BEBERAPA KONSEP DASAR SURVEI...Memilih Metode Penarikan Contoh Probability Sampling •Setiap objek dalam populasi dijamin memiliki peluang untuk dipilih menjadi sampel •Ada sampling

Web viewMetode Pengambilan Sampel. Pengertian populasi dan sampel. Kegunaan sampel. Prosedur pengambilan sampel. Teknik sampling. Penentuan besarnya sampel

BAB III METODE PENELITIAN - idr.uin-antasari.ac.id III .pdf · 32 2. Sampel Sampel adalah bagian dari populasi yang memiliki karakteristik atau keadaan tertentu yang akan diteliti.35