implementasi gabungan metode hierarchy dan algoritma … · implementasi gabungan metode hierarchy...

12
IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh : Marisa Dyah Anggraini NIM. 201010370311064 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2015

Upload: truongdieu

Post on 30-Mar-2019

256 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

IMPLEMENTASI GABUNGAN

METODE HIERARCHY DAN ALGORITMA

K-MEANS DALAM CLUSTER DOKUMEN BERITA

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1

Teknik Informatika Universitas Muhammadiyah Malang

Oleh :

Marisa Dyah Anggraini

NIM. 201010370311064

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2015

Page 2: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

LEMBAR PERSETUJUAN

IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA

K-MEANS DALAM CLUSTER DOKUMEN BERITA

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1

Teknik Informatika Universitas Muhammadiyah Malang

Menyetujui

Pembimbing I

Yuda Munarko, S.Kom., M.Sc.

NIDN: 0706077902

Pembimbing II

Yufis Azhar, M.Kom.

NIDN: 0728088701

Page 3: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

LEMBAR PENGESAHAN

IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN

ALGORITMA K-MEANS DALAM CLUSTER

DOKUMEN BERITA

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1

Teknik Informatika Universitas Muhammadiyah Malang

Disusun Oleh:

Marisa Dyah Anggraini

NIM. 201010370311064

Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji

pada tanggal 16 Januari 2015

Menyetujui,

Mengetahui,

Ketua Jurusan Teknik Informatika

Yuda Munarko, S.Kom., M.Sc.

NIDN: 0706077902

Penguji I

Galih Wasis Wicaksono, S.Kom, M.Cs

NIDN: 0723028801

Penguji II

Agus Eko Minarno, M.Kom

NIDN : 0729118203

Page 4: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

LEMBAR PERNYATAAN

Yang bertanda tangan di bawah ini:

NAMA : MARISA DYAH ANGGRAINI

NIM : 201010370311064

FAK. / JUR. : TEKNIK / TEKNIK INFORMATIKA

Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul

“IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN

ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA”

beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis

orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang

telah disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila

kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya

saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya

siap menanggung segala bentuk resiko/sanksi yang berlaku.

Mengetahui,

Dosen Pembimbing

Yuda Munarko, S.Kom., M.Sc.

NIDN: 0706077902

Malang, 9 Januari 2015

Yang Membuat Pernyataan

Marisa Dyah Anggraini

NIM: 201010370311064

Page 5: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

iv

KATA PENGANTAR

Dengan mengucap puji dan syukur kehadirat Allah SWT, karena atas ridho

dan hidayah-Nya, sehingga penulis dapat menyelesaikan Tugas Akhir dengan

judul IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN

ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA, untuk

memenuhi persyaratan kelulusan program studi Strata 1 pada jurusan Teknik

Informatika di Univeristas Muhammadiyah Malang. Selain itu penulis juga dapat

mencoba menerapkan dan membandingkan pengetahuan dan keterampilan yang

diperoleh di bangku kuliah dengan kenyataan yang ada di lingkungan kerja.

Penulis merasa bahwa dalam menyusun laporan ini masih menemui

beberapa kesulitan dan hambatan di samping itu juga menyadari bahwa penulisan

laporan ini masih jauh dari sempurna dan masih banyak kekurangan lainnya,

maka dari itu penulis mengharapkan saran dan kritik yang membangun dari semua

pihak.

Malang. 9 Januari 2015

Penulis

Page 6: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

v

DAFTAR ISI

HALAMAN JUDUL

LEMBAR PERSETUJUAN

LEMBAR PENGESAHAN

LEMBAR PERNYATAAN KEASLIAN

ABSTRAK ....................................................................................................... i

ABSTRACT ..................................................................................................... ii

LEMBAR PERSEMBAHAN ....................................................................... iii

KATA PENGANTAR ................................................................................... iv

DAFTAR ISI ................................................................................................... v

DAFTAR GAMBAR .................................................................................... vii

DAFTAR TABEL ........................................................................................ viii

DAFTAR GRAFIK ........................................................................................ ix

BAB I : PENDAHULUAN

1.1 Latar Belakang .......................................................................................... 1

1.2 Rumusan Masalah ..................................................................................... 2

1.3 Tujuan Penelitian ...................................................................................... 2

1.4 Batasan Masalah......................................................................................... 3

1.5 Metodologi ................................................................................................ 3

1.5.1. Studi Pustaka .................................................................................. 3

1.5.2. Analisis Kebutuhan ......................................................................... 3

1.5.3. Perancangan Sistem ........................................................................ 4

1.5.4. Implementasi Program .................................................................... 4

1.5.5. Pengujian Sistem ............................................................................ 4

1.5.6. Penyusunan Laporan ....................................................................... 5

1.6 Sistematika Penulisan................................................................................. 5

BAB II : LANDASAN TEORI

2.1 Knowledge Discovery in Database (KDD) ............................................... 7

2.2 Clustering .................................................................................................. 9

2.3 Metode Hierarchy .................................................................................... 10

2.4 Centroid Linkage Hierarchy Method (CLHM) ........................................13

2.5 Metode K-Means ..................................................................................... 14

Page 7: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

vi

2.6 PHP (Hypertext Preprocessor) ............................................................... 15

2.7 MySQL .................................................................................................... 17

2.8 Unified Modeling Language (UML) ....................................................... 19

BAB III : ANALISIS DAN PERANCANGAN SISTEM

3.1 Analisis Kebutuhan Perangkat Lunak ......................................................22

3.1.1 Metode Analisis ............................................................................ 22

3.1.2 Hasil Analisis ................................................................................ 22

3.1.2.1 Analisis Kebutuhan Proses ............................................... 22

3.1.2.2 Analisis Kebutuhan Masukan ........................................... 23

3.1.2.3 Analisis Kebutuhan Keluaran ........................................... 23

3.1.2.4 Data Penelitian .................................................................. 23

3.1.3 Kebutuhan Antar Muka ................................................................ 25

3.1.4 Analisis Kebutuhan Perangkat Lunak .......................................... 26

3.1.5 Analisis Kebutuhan Minimum Perangkat Keras .......................... 26

3.2 Perancangan Perangkat Lunak ................................................................ 27

Metode Perancangan ............................................................................ 27

Hasil Perancangan ............................................................................... 27

BAB IV : IMPLEMENTASI DAN PENGUJIAN

4.1 Implementasi Perangkat Lunak ............................................................... 35

4.1.1. Batasan Implementasi ................................................................... 35

4.1.2. Implementasi Metode Hierarchy .................................................. 35

4.1.3. Implementasi Metode K-Means ................................................... 46

4.1.4. Implementasi Antar Muka ............................................................ 49

4.2 Pengujian Perangkat Lunak ............................................................ 53

4.2.1. Pengujian Fitur Perangkat Lunak ................................................. 53

4.2.2. Pengujian Performansi Algoritma ................................................ 54

BAB V : PENUTUP

5.1 Kesimpulan ...............................................................................................56

5.2 Saran ........................................................................................................ 56

DAFTAR PUSTAKA .................................................................................... 57

LAMPIRAN .................................................................................................. 59

BIOGRAFI PENULIS .................................................................................. 63

Page 8: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

vii

DAFTAR GAMBAR

Gambar 2.1 Tahapan Knowledge Discovery in Database (KDD) ...................7

Gambar 2.2 Hierarchy Clustering...................................................................11

Gambar 2.3 Agglomerative ............................................................................12

Gambar 2.4 Teknik-teknik dalam analisis cluster...........................................12

Gambar 2.5 Ilustrasi Algoritma Centroid Linkage Hierarchy Method ..........14

Gambar 2.6 Hubungan komponen-komponen PHP ...................................... 16

Gambar 2.7 Hubungan dari ketiga komponen utama dari halaman web

dinamis ...................................................................................... 16

Gambar 3.1 Use Case diagram aplikasi ........................................................ 28

Gambar 3.2 Activity diagram tambah dokumen ............................................ 31

Gambar 3.3 Activity diagram edit dokumen ................................................. 31

Gambar 3.4 Activity diagram hapus dokumen .............................................. 31

Gambar 3.5 Activity diagram klasterisasi dokumen ...................................... 32

Gambar 3.6 Sequence diagram ..................................................................... 32

Gambar 3.7 DFD Level 0 .............................................................................. 33

Gambar 3.8 DFD Level 1 .............................................................................. 33

Gambar 3.9 Flowchart .................................................................................. 34

Gambar 3.10 Halaman Utama ....................................................................... 34

Gambar 4.1 Dendogram ................................................................................ 46

Gambar 4.2 Halaman Utama ......................................................................... 50

Gambar 4.3 Proses manipulasi konten .......................................................... 50

Gambar 4.4 Tampilan untuk menambah dokumen berita ............................. 50

Gambar 4.5 Tampilan edit dokumen berita ................................................... 51

Gambar 4.6 Tampilan setelah proses cluster dokumen ................................ 51

Gambar 4.7 Tampilan nilai centroid di setiap cluster .................................... 52

Gambar 4.8 Tampilan isi dari cluster ............................................................. 52

Gambar 4.12 Tampilan bantuan untuk user .................................................. 53

Page 9: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

viii

DAFTAR TABEL

Tabel 3.1 List Keywords untuk Metadata .......................................................24

Tabel 3.2 Deskripsi Aktor ............................................................................. 28

Tabel 3.3 Deskripsi Use Case Deskripsi Use Case ....................................... 28

Tabel 3.4 Use Case Manage Dokumen ......................................................... 29

Tabel 3.5 Use Case Tambah Dokumen ......................................................... 29

Tabel 3.6 Use Case Edit Dokumen ............................................................... 29

Tabel 3.7 Use Case Hapus Dokumen .......................................................... 30

Tabel 3.8 Use Case Klasterisasi Dokumen ................................................... 30

Tabel 4.1 tabel tf.idf ...................................................................................... 36

Tabel 4.2 Iterasi 1 .......................................................................................... 41

Tabel 4.3 Agglomeration Schedule ............................................................... 41

Tabel 4.4 Nilai term cluster 4,5 .................................................................... 42

Tabel 4.5 Iterasi 2 .......................................................................................... 44

Tabel 4.6 Agglomeration Schedule ............................................................... 44

Tabel 4.7 Nilai term cluster 1,2,4,5 .............................................................. 44

Tabel 4.8 Iterasi 3 .......................................................................................... 45

Tabel 4.9 Agglomeration Schedule ............................................................... 45

Tabel 4.10 Tabel nilai centroid ..................................................................... 46

Tabel 4.11 Nilai centroid metode K-Means .................................................. 47

Tabel 4.12 Pengujian fitur pada perangkat lunak .......................................... 53

Tabel 4.13 Perhitungan akurasi ..................................................................... 54

Tabel 4.14 Perhitungan rata-rata prosentase akurasi ..................................... 55

Page 10: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

ix

DAFTAR GRAFIK

Grafik 3.1 Frekuensi Keyword ..................................................................... 25

Page 11: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

10

DAFTAR PUSTAKA

Andayani, Sri. 2007. Pembentukan cluster dalam Knowledge Discovery in

Database dengan Algoritma K-Means. FMIPA. UNY: Yogyakarta.

[Online]. Tersedia:

http://staff.uny.ac.id/sites/default/files/Pembentukan%20cluster%20dlm%20

KDD%20dgn%20Algoritma%20kmeans.pdf [Diakses 18 Januari 2014,

18:37]

Andre, Petrus. 2013. Konsep Dasar Belajar Bahasa Pemrograman PHP.

[Online]. Tersedia: http://www.andre.web.id/2013/10/belajar-php.html

[Diakses 16 April 2014, 13:16]

Damayanti, Nadia, Mubtadi’i, Nur Rosyid, dan Helen, Afrida. Temu Kembali

Informasi Berdasarkan Lokasi pada Dokumen yang Dikelompokkan

Menggunakan Metode Centroid Linkage Hierarchy. [Online]. Tersedia:

http://repo.eepis-its.edu/1115/1/7407040059.pdf [Diakses 18 Januari 2014,

14:31]

Eldira, Hervilorra. Web Mining untuk Pencarian Dokumen Bahasa Inggris

menggunakan Hill Climbing Automatic Cluster. [Online]. Tersedia:

http://repo.eepis-its.edu/733/1/1011.pdf [Diakses 18 Januari 2014, 14:23]

Hong, K. 2013. PHP & MYSQL TUTORIAL-REQUEST 2013. [Online]. Tersedia:

http://www.bogotobogo.com/php/php1.php [Diakses 16 April 2014, 12:59]

Karanjkar, Sushrut. 1998. Hierarchical Clustering. [Online]. Tersedia:

http://www-users.cs.umn.edu/~sushrut/research/pub/cover/node24.html

[Diakses 16 April 2014, 12:48]

Laboratorium Data Mining Jurusan Teknik Industri Fakultas Teknologi Industri

Universitas Islam Indonesia. 2014. Modul II CLUSTERING. [Online].

Tersedia: http://www.ss354.com/wp-content/uploads/2014/03/Data-Mining-

Modul-Clustering-Modul-Clustering.pdf [Diakses 18 Januari 2014, 18:40]

Minartiningtyas, Brigida Arie. 2013. Pengertian UML. [Online]. Tersedia:

http://informatika.web.id/pengertian-uml.htm [Diakses 18 April 2014,

19:40]

Pasaribu, Manaek Y.D. 2008. Analisa dan Implementasi Metode Hidden Markov

Model pada Intrusion Detection System (IDS). [Online]. Tersedia:

http://digilib.ittelkom.ac.id/index.php?option=com_content&view=article&i

Page 12: IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA … · IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR Sebagai Persyaratan

11

d=210:kdd&catid=20:informatika&Itemid=14 [Diakses 18 Maret 2014,

18:29]

Prasetyo, Eko. 2012. DATA MINING-Konsep dan Aplikasi Menggunakan

MATLAB. Yogyakarta: ANDI

Prasetyo, Wahid Budi. 2013. Definisi dan Fungsi Mysql, Apache dan PHP.

[Online]. Tersedia: http://comput-techno.blogspot.com/2013/01/definisi-

dan-fungsi-mysql-apache-dan-php.html [Diakses 16 April 2014, 13:18]

Rahmawati, Lina, Abadyo, dan Lestari, Trianingsih Eni. Analisis Kelompok

dengan Menggunakan Metode Hierarki untuk Pengelompokan

Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kesehatan. [Online].

Tersedia: http://jurnal-

online.um.ac.id/data/artikel/artikel1768E9E20B8E53209B2AAE90144ED6

6D.pdf [Diakses 16 April 2014, 12:51]

Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan

Bisnis, First Edition ed. Yogyakarta: Graha Ilmu

Universitas Kristen Duta Wacana. Analisis Cluster. [Online]. Tersedia:

http://lecturer.ukdw.ac.id/budsus/pdf/textwebmining/clustering.pdf

[Didownload 19 Januari 2014, 08:09]

Wibowo, Aan Tri. 2013. Pembuatan Aplikasi E-Commerce Pusat Oleh-Oleh Khas

Pacitan pada Toko Sari Rasa Pacitan. [Online]. Tersedia:

http://journal.ijns.org/index.php/ijns/article/view/47/46 [Diakses 16 April

2014, 13:09]

58