implementasi data mining pada dataset nilai akademik …

137
PENAMBANGAN ATURAN ASOSIASI PADA DATASET NILAI AKADEMIK MAHASISWA DENGAN ALGORITMA APRIORI Skripsi Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains Program Studi Ilmu Komputer Oleh : Francisca Andika P 023124045 PROGRAM STUDI ILMU KOMPUTER JURUSAN MATEMATIKA FAKULTAS MIPA UNIVERSITAS SANATA DHARMA YOGYAKARTA 2007 1

Upload: others

Post on 14-Jan-2022

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

PENAMBANGAN ATURAN ASOSIASI PADA DATASET NILAI

AKADEMIK MAHASISWA DENGAN ALGORITMA APRIORI

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Sains

Program Studi Ilmu Komputer

Oleh :

Francisca Andika P

023124045

PROGRAM STUDI ILMU KOMPUTER

JURUSAN MATEMATIKA

FAKULTAS MIPA

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2007

1

Page 2: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

2

Page 3: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

3

Page 4: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

HALAMAN PERSEMBAHAN

Ukuran tubuhmu kurang penting; ukuran otakmu agak

penting; ukuran hatimu adalah yang paling penting.

(B. C. Gorbes)

Saya hanyalah seorang manusia, tetapi saya adalah seseorang. Saya

tidak dapat melakukan segalanya , tetapi saya dapat melakukan sesuatu.

Saya tidak akan menolak melakukan sesuatu yang dapat saya lakukan.

(Martha Graham)

Karya ini kupersembahkan untuk :Yesus Kristus atas rahmat, karunia, dan berkatNya

Pa’e & Bu’e tercinta,Kekasihku Toro,

Adikku Linda,Sahabat-sahabatku,

Almamaterku.

4

Page 5: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya/bagian karya orang lain, kecuali yang telah disebutkan dalam

kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 26 Maret 2007

Penulis

Francisca Andika P

5

Page 6: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

ABSTRAKSI

Data mining adalah sebuah proses mengekstrak pola yang penting ataumenarik dari sejumlah data yang sangat besar. Salah satu metode yang dikenal didalam penambangan data (data mining) adalah analisis asosiasi yang menghasilkanaturan asosiasi (association rule). Analisis asosiasi adalah teknik data mining untukmenemukan aturan asosiasi antara suatu kombinasi item. Penting tidaknya suatuaturan asosiasi dapat diketahui dengan dua parameter, nilai penunjang (support) yaitupersentase kombinasi item tersebut dan nilai kepastian (confidence) yaitu kuatnyahubungan antar item dalam aturan asosiasi.

Pada tugas akhir ini diimplementasikan salah satu algoritma yang digunakanuntuk mencari aturan asosiasi yaitu algoritma Apriori. Implementasi algoritma iniakan digunakan untuk mencari pola keterkaitan antar tingkat keberhasilan atauketidakberhasilan suatu matakuliah dengan tingkat keberhasilan atauketidakberhasilan mata kuliah lain dengan menggunakan data akademik mahasiswayang diperoleh dari Program Studi Ilmu Komputer, Jurusan Matematika, FakultasMIPA, Universitas Sanata Dharma, Yogyakarta tahun angkatan 2001 dan 2002. Hasildari implementasi tersebut diperoleh aturan-aturan asosiasi yang terbentuk darikejadian 2 item atau lebih dengan melakukan percobaan dengan nilai minimumsupport antara 0.3 s.d 0.6.5 dan nilai minimum confidence antara 0.5 s.d 0.7.

6

Page 7: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

ABSTRACT

Data mining is a process to extract interesting or important patterns fromlarge amount of data. One of method in data mining is association analysis thatyielding association rule . Association analysis is technique of data mining to findthe association rule between item combination. Important or not in association rulewith two parameter , assess the supporter (support) that is the item combinationpercentage and assess the certainty (confidence) that is its strength of relationamong the item in association rule.

At the final project implementation one of algorithm used to look for theassociation rule that is Apriori algorithm .This algorithm implementation will beused to look for the related pattern usher the level of succeeding or fail of a lessonwith the level of succeeding or fail other lesson by using student academic recorddataset that obtained from Program Study of Computer Science, MathematicsMajors, Faculty MIPA, University of Sanata Dharma, Yogyakarta of generation year2001 and 2002. Result from the implementation obtained by a association rule whichis formed by occurence 2 item or more by conducting attempt with the value ofminimum support between 0.3 s.d 0.6.5 and assess the minimum confidence between0.5 s.d 0.7.

7

Page 8: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

KATA PENGANTAR

Segala puji dan syukur penulis panjatkan kepada Yesus Kristus atas karunia

rahmat dan berkatNya, sehingga skripsi dengan judul Penambangan Aturan Asosiasi

pada Dataset Nilai Akademik Mahasiswa dengan Algoritma Apriori selesai disusun.

Skripsi ini disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains

(S.Sc.) pada Program Studi Ilmu Komputer di Fakultas MIPA Universitas Sanata

Dharma Yogyakarta.

Sebagai manusia biasa, penulis menyadari bahwa hambatan dan rintangan

sekecil apapun merupakan pembelajaran dalam rangka menambah pengetahuan dan

pengalaman. Berkat bantuan, kerjasama, dukungan, dari berbagai pihak dalam

penyusunan skripsi ini maka skripsi ini dapat terselesaikan. Pada kesempatan ini

penulis mengucapkan terimakasih dalam dan setulusnya atas kepada :

1. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc, selaku dosen pembimbing yang

telah mencurahkan perhatian, waktu, ilmu, dan kesabarannya.

2. Drs. H.J. Haris Sriwindono, M.Kom. , selaku dosen penguji dan Kepala BAPSI

ketika penelitian berlangsung, atas kesediaan membantu dalam pengambilan

dataset, menguji serta masukan dan kritik yang membangun.

3. A. Rita Widiarti, S.Si, M.Kom., selaku dosen penguji, atas kesediaan menguji

serta masukan dan kritik yang membangun.

4. Ir. Ign. Aris Dwiatmoko, M.Sc., selaku Dekan Fakultas MIPA Universitas Sanata

Dharma Yogyakarta.

8

Page 9: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

5. Mas Diar, Mbak Retno selaku karyawan BAPSI yang telah membantu dalam

pengambilan dataset.

6. Pa’e & Bu’e tercinta, atas segala doa yang tiada hentinya, pengorbanan, kasih

sayang yang tak terhingga, semangat dan harapan yang tak padam.

7. Sayang Toro, yang begitu menyayangiku untuk kasih sayang, perhatian, semangat

dan dukungannya.

8. Pritty maniez makasih atas semua bantuannya, Nyit2 atas semangatnya, Astiwi

thanks to the “mobile”, Kost Lovely : Ophék, Dõra, Déw..ik (thank’s ya

kamarnya), Héncë, Plëndies, Pépéng, atas canda tawa dan persahabatan yang

indah, serta semua teman-teman IKOM angkatan 2002.

9. Piepiet & Bulan thanks atas doa, semangat, keceriaan, dukungan serta semangat

yang diberikan.

10. Kakak-kakakku Mbak Is, Mbak Anne, Mbak Etik, Mbak Atik, Mbak Oni serta

adikku Linda atas segala doa, dukungan, kasih sayang, semangat, perhatian,

canda tawa yang selalu mengiringiku.

11. Keluarga Bekasi Bapak, Ibuk, Mas Asta, & Tika, terimakasih karena telah

menerimaku dalam keluarga.

Serta semua pihak yang tidak dapat disebutkan satu persatu. Penulis

menyadari karya ini memiliki banyak kekurangan, untuk itu penulis mengharapkan

saran dan kritik untuk menyempurnakan karya ini. Semoga skripsi ini bermanfaat

bagi pengetahuan dan masyarakat.

Yoyakarta,26 Maret 2007

Penulis

9

Page 10: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

DAFTAR ISI

HALAMAN JUDUL...................................................................................... 1

HALAMAN PERSETUJUAN PEMBIMBING.......................................... 2

HALAMAN PENGESAHAN........................................................................ 3

HALAMAN PERSEMBAHAN..................................................................... 4

PERNYATAAN KEASLIAN KARYA......................................................... 5

ABSTRAKSI................................................................................................... 6

ABSTRACT..................................................................................................... 7

KATA PENGANTAR.................................................................................... 8

DAFTAR ISI................................................................................................... 10

DAFTAR TABEL………............................................................................... 12

DAFTAR GAMBAR…….............................................................................. 15

BAB I PENDAHULUAN……....................................................................... 17

A. Latar Belakang……............................................................................. 17

B. Rumusan Masalah…........................................................................... 19

C. Metodologi …..................................................................................... 19

D. Tujuan…............................................................................................. 20

E. BatasanMasalah….............................................................................. 20

F. Manfaat............................................................................................... 21

G. Sistematika Penulisan…...................................................................... 21

BAB II LANDASAN TEORI........................................................................ 23

A. Pengertian Data Mining...................................................................... 23

B. Tahap-tahap Data Mining.................................................................... 26

C. Teknik Data Mining............................................................................. 27

D. Aturan asosiasi (Association Rules) ................................................... 30

E. Algoritma Apriori…………………………......................................... 34

F. Contoh penerapan Algoritma Apriori dan pembentukan aturan asosiasi 37

10

Page 11: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB III ANALISIS DAN PERANCANGAN SISTEM.............................. 43

A. Identifikasi Masalah............................................................................. 43

B. Analisis Sistem.................................................................................... 44

1. Input............................................................................................... 44

2. Proses.............................................................................................. 48

3. Output............................................................................................. 52

4. Analisa Kebutuhan Sistem............................................................ 52

C. Perancangan………………................................................................. 53

1. Perancangan Modul………............................................................ 53

2. Perancangan Struktur Data…......................................................... 56

3. Perancangan Antar Muka dengan Pengguna…………………….. 60

BAB IV IMPLEMENTASI DATA MINING……………………………... 70

BAB V ANALISA HASIL DAN PEMBAHASAN..………………………. 93

A. Percobaan Jenis I ................................................................................ 93

1. Percobaan dengan Dataset I........................................................... 93

2. Percobaan dengan Dataset II.......................................................... 103

B. Percobaan Jenis II................................................................................. 116

C. Pembahasan.......................................................................................... 125

BAB VI KESIMPULAN DAN SARAN....................................................... 129

A. Kesimpulan………………………………………………………….. 129

B. Saran…………………………………………………………….…… 131

DAFTAR PUSTAKA………………………………………………………. 132

LAMPIRAN………………………………………………………………… 134

Lampiran 1 Data salah satu mahasiswa prodi Ilmu Komputer yang diperoleh

dari BAPSI…………………………………… 134

Lampiran 2 Gambar diagram Alir matakuliah

Algoritma dan Pemrograman I.........................…………...... 137

11

Page 12: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

DAFTAR TABEL

Tabel 2.1 Contoh Tabel Transaksi D………………………………….…... 32

Tabel 2.2 Tabel Transaksi ……………………………………….......……. 37

Tabel 2.3 Frequent itemset minimum support 40%..………………....…... 39

Tabel 3.1 Nim mahasiswa .............................……………………………... 45

Tabel 3.2 Matakuliah yang terdapat dalam satu rangkaian prasyarat........... 46

Tabel 3.3 Nilai mahasiswa .........................……………………………….. 47

Tabel 3.4 Tabel contoh itemset dengan matakuliah yang memperoleh nilai

C,D,E,F………………………………………………………….. 48

Tabel 3.5 Keterangan array itemset …………………………………….. 56

Tabel 3.6 Contoh salah satu isi array itemset ………………………….. 56

Tabel 3.7 Format listbox pada form Frequent 1_Itemset.………………….. 57

Tabel 3.8 Keterangan listbox pada form Frequent 1_Itemset ……………… 57

Tabel 3.9 Format listbox bagian atas pada form Frequent Itemset................. 58

Tabel 3.10 Keterangan listbox bagian atas pada form Frequent Itemset ……. 58

Tabel 3.11 Format listbox bagian bawah pada form Frequent Itemset ……... 58

Tabel 3.12 Keterangan listbox bagian bawah pada form Frequent Itemset…. 59

Tabel 3.13 Format listbox yang terdapat pada form Semua Rule………....... 59

Tabel 3.14 Keterangan listbox yang terdapat pada form Semua Rule………. 59

Tabel 3.15 Format listbox yang terdapat pada form Strong association rule… 60

Tabel 3.16 Keterangan listbox yang terdapat pada form Strong

association rule ..........……….………………………………….. 60

Tabel 4.1 Listbox Frequent Itemset………………………………..………. 79

Tabel 4.2 Listbox Keterangan Frequent Itemset………..………………….. 79

Tabel 5.1 Contoh format Dataset I…...…………………………………….. 93

Tabel 5.2 Frequent 1_itemset dengan minsup 0.4 pada dataset I…………... 94

Tabel 5.3 Frequent 2_itemset dengan minsup 0.4 pada dataset I………….. 95

Tabel 5.4 Frequent 3_itemset dengan minsup 0.4 pada dataset I…………… 95

Tabel 5.5 Aturan asosiasi dengan minsup 0.4 dan minconf 0,5 pada dataset I 95

12

Page 13: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Tabel 5.6 Frequent 1_itemset dengan minsup 0.45 pada dataset I…………… 98

Tabel 5.7 Frequent 2_itemset dengan minsup 0.45 pada dataset I…………... 98

Tabel 5.8 Frequent 3_itemset dengan minsup 0.45 pada dataset I………….. 99

Tabel 5.9 Aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset I 99

Tabel 5.10 Frequent 1_itemset dengan minsup 0.5 pada dataset I………… 100

Tabel 5.11 Frequent 2_itemset dengan minsup 0.5 pada dataset I……………. 100

Tabel 5.12 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset I 101

Tabel 5.13 Frequent 1_itemset dengan minsup 0.55 pada dataset I………….. 101

Tabel 5.14 Frequent 2_itemset dengan minsup 0.55 pada dataset I………….. 102

Tabel 5.15 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada dataset I 102

Tabel 5.16 Tabel frequent 1_itemset dengan minsup 0.6 pada dataset I……… 102

Tabel 5.17 Frequent 1_itemset dengan minsup 0.65 pada dataset I………….. 103

Tabel 5.18 Contoh format Dataset II…………………………………………. 103

Tabel 5.19 Frequent 1_itemset dengan minsup 0.3 pada dataset II…………… 104

Tabel 5.20 Frequent 2_itemset dengan minsup 0.3 pada dataset II………… 105

Tabel 5.21 Frequent 3_itemset dengan minsup 0.3 pada dataset II…………… 105

Tabel 5.22 Aturan asosiasi dengan minsup 0.3 dan minconf 0,5 pada dataset II 105

Tabel 5.23 Frequent 1_itemset dengan minsup 0.35 pada dataset II…………. 108

Tabel 5.24 Frequent 2_itemset dengan minsup 0.35 pada dataset II………… 108

Tabel 5.25 Frequent 3_itemset dengan minsup 0.35 pada dataset II………… 109

Tabel 5.26 Aturan asosiasi dengan minsup 0.35 dan minconf 0.5 pada dataset II 110

Tabel 5.27 Frequent 1_itemset dengan minsup 0.4 pada dataset II………….. 111

Tabel 5.28 Frequent 2_itemset dengan minsup 0.4 pada dataset II………….. 111

Tabel 5.29 Frequent 3_itemset dengan minsup 0.4 pada dataset II………….. 111

Tabel 5.30 Aturan asosiasi dengan minsup 0.4 dan minconf 0.5 pada dataset II 112

Tabel 5.31 Frequent 1_itemset dengan minsup 0.45 pada dataset II………… 112

Tabel 5.32 Frequent 2_itemset dengan minsup 0.45 pada dataset II………… 113

Tabel 5.33 Aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset II 113

Tabel 5.34 Frequent 1_itemset dengan minsup 0.5 pada dataset II…………. 113

Tabel 5.35 Frequent 2_itemset dengan minsup 0.5 pada dataset II…………. 114

Tabel 5.36 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset II 114

13

Page 14: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Tabel 5.37 Frequent 1_itemset dengan minsup 0.55 pada dataset II………… 114

Tabel 5.38 Frequent 2_itemset dengan minsup 0.55 pada dataset II………… 114

Tabel 5.39 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada

dataset II…………………………………………………………. 115

Tabel 5.40 Frequent 1_itemset dengan minsup 0.6 pada dataset II………….. 115

Tabel 5.41 Frequent 2_itemset dengan minsup 0.6 pada dataset II………….. 115

Tabel 5.42 Aturan asosiasi dengan minsup 0.6 dan minconf 0.5 pada dataset II 115

Tabel 5.43 Frequent 1_itemset dengan minsup 0.65 pada dataset II……….... 116

Tabel 5.44 Aturan asosiasi dengan minsup 0.4 dan minconf 0.6 pada dataset I 117

Tabel 5.45 Aturan asosiasi dengan minsup 0.4 dan minconf 0.7 pada dataset I 119

Tabel 5.46 Aturan asosiasi dengan minsup 0.45 dan minconf 0.6 pada dataset I 120

Tabel 5.47 Aturan asosiasi dengan minsup 0.45 dan minconf 0.7 pada dataset I 121

Tabel 5.48 Aturan asosiasi dengan minsup 0.5 dan minconf 0.6 pada dataset I 122

Tabel 5.49 Aturan asosiasi dengan minsup 0.5 dan minconf 0.7 pada dataset I 123

Tabel 5.50 Aturan asosiasi dengan minsup 0.55 dan minconf 0.6 pada dataset I 123

Tabel 5.51 Aturan asosiasi dengan minsup 0.55 dan minconf 0.7 pada dataset I 124

14

Page 15: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

DAFTAR GAMBAR

Gambar 2.1Data Mining merupakan bidang multidisipliner …..………… 24

Gambar 2.2 Tahap-tahap dalam Data Mining …….........................…….... 26

Gambar 2.3 Contoh dari decision tree pembeli komputer ..………………. 28

Gambar 2.4 Pencarian candidate itemset dan frequent itemset dengan

minimum support = 40%……………..............………………. 38

Gambar 3.1 Diagram Konteks ..................................……………………... 48

Gambar 3.2 DFD Level 1…………………………………………............. 49

Gambar 3.3 DFD Level 2………………………...…….............................. 50

Gambar 3.4 Perancangan Antar Muka Form Input ……............................. 60

Gambar 3.5 Perancangan Antar Muka Form Tabel Mahasiswa..…………. 61

Gambar 3.6 Perancangan Antar Muka Form Candidate 1_Itemset………… 62

Gambar 3.7 Perancangan Antar Muka Form Frequent Itemset................... 64

Gambar 3.8 Perancangan Antar Muka Form Candidate Itemset………….. 65

Gambar 3.9 Perancangan Antar Muka Form Semua Rule............................ 66

Gambar 3.10 Perancangan Antar Muka Form Strong association rule …….. 67

Gambar 3.11 Perancangan Antar Muka Form Frequent Itemset_1……..….. 68

Gambar 3.12 Perancangan Antar Muka Form Infrequent 1_Itemset............. 69

Gambar 4.1 Form Welcome ………………..…………………………….. 70

Gambar 4.2 Form Input …………………………….................………….. 71

Gambar 4.3 Form Dataset …………………………................................... 72

Gambar 4.4 Form Candidate 1_Itemset..………………………………….. 73

Gambar 4.5 Form Loading..................…...……………………………...... 74

Gambar 4.6 Form Frequent 1_Itemset dan Form Infrequent 1_Itemset ….. 75

Gambar 4.7 Pesan 1.......................................…………………………….... 77

Gambar 4.8 Pesan 2………...……………………………………………… 77

Gambar 4.9 Form Frequent Itemset.................................………………..... 78

Gambar 4.10 Form Candidate Itemset ……………….................................... 84

Gambar 4.11 Form Semua Rule…………………………………………..... 85

Gambar 4.12 Form Aturan Asosiasi Yang Terbentuk………………….…… 91

15

Page 16: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Gambar 4.13 Form Daftar Istilah……………………….……………….….. 92

Gambar 4.14 Form About ………………………………………………….. 92

Gambar 5.1 Grafik hubungan nilai minimum support terhadap jumlah aturan

asosiasi yang kuat pada dataset I……………………………... 125

Gambar 5.2 Grafik hubungan nilai minimum support terhadap jumlah aturan

asosiasi yang kuat pada dataset II…..………………………... 126

Gambar 5.3 Grafik hubungan nilai minimum confidence terhadap jumlah

aturan asosiasi yang kuat pada dataset I………………………. 127

16

Page 17: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB I

PENDAHULUAN

A. Latar Belakang

Data-data dalam suatu perusahaan biasanya disimpan dalam suatu basis data

untuk transaksi sehari-hari, seperti pencatatan transaksi jual beli, administrasi

pengiriman barang , dan lain-lain. Hal itu disebut OLTP (Online Transaction

Processing). Data-data tersebut akan semakin bertambah seiring berjalannya waktu.

Data-data yang tersimpan dalam kurun waktu yang cukup lama akan mencapai

ukuran gigabyte bahkan dapat mencapai terabyte.

Dengan menggunakan data-data tersebut, suatu perusahaan atau organisasi

dapat mengambil keputusan untuk mendapatkan informasi yang berguna. Untuk

mengambil keputusan melalui data-data tersebut, cara tradisional yang dipergunakan

adalah dengan membangun database yang disebut OLAP (Online Analytical

Processing). OLAP mendasarkan diri pada pemrosesan kueri atas data multidimensi,

seperti jenis barang, waktu, lokasi dan sebagainya. Semakin besar volume data,

kebutuhan menganalisa data untuk mempertahankan keunggulan dalam suatu

kompetisi semakin harus dikembangkan, namun belum ada teknologi untuk

membantu dalam menganalisis, memahami, bahkan memvisualisasikan data tersebut.

Dengan ukuran data yang sangat besar untuk mendapatkan informasi yang tidak

diketahui secara eksplisit sangat sulit hanya dengan laporan hasil kueri maupun

OLAP.

17

Page 18: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Salah satu instansi yang mempunyai data yang berukuran besar adalah

Universitas Sanata Dharma Yogyakarta. Banyak sekali data yang disimpan oleh

Universitas Sanata Dharma, salah satunya yaitu data nilai akademik mahasiswa yang

setiap semester selalu bertambah sesuai jumlah mahasiswa dan matakuliah yang

mereka ambil. Nilai tersebut dipakai untuk menentukan ipk, ips dan jumlah sks yang

akan diambil oleh mahasiswa pada semester berikutnya. Selanjutnya nilai tersebut

akan disimpan dan dibiarkan hingga dapat menjadi tumpukan data.

Dari data tersebut penulis mencoba untuk memanfaatkannya untuk mencari

suatu informasi yang berguna. Dalam skripsi ini penulis menggunakan data mining

untuk mencari informasi tersebut. Data mining merupakan serangkaian proses untuk

menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini

tidak diketahui secara manual. Dengan teknologi data mining penulis dapat

memperoleh informasi dari dataset nilai akademik mahasiswa sehingga tidak akan

menjadi tumpukan data saja.

Data nilai akademik dapat dimanfaatkan untuk mengetahui pola keterkaitan

antar tingkat keberhasilan / ketidakberhasilan suatu mata kuliah dengan tingkat

keberhasilan / ketidakberhasilan mata kuliah lain yang diprasyaratinya dalam satu

rangkaian aliran matakuliah.

Banyak algoritma yang dapat dipergunakan untuk menyelesaikan persoalan

pada data mining. Dalam kasus tersebut diatas teknik yang sesuai adalah pencarian

aturan asosiasi (association rule). Alasan memakai teknik pencarian aturan asosiasi

(association rule) karena teknik tersebut dapat digunakan untuk menemukan aturan

asosiasi antara suatu kombinasi item, yaitu dengan membuat korelasi antara item

18

Page 19: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

yang dikelompokkan ke dalam transaksi kemudian mengambil kesimpulan

berdasarkan hubungan yang terbentuk dari beberapa item data tersebut.

Penting atau tidaknya suatu aturan asosiasi dapat diketahui dengan dua

parameter, support yaitu presentase kombinasi item tersebut dalam database dan

confidence yaitu kuatnya hubungan antar item dalam aturan asosiasi. Algoritma yang

akan dipakai adalah algoritma Apriori karena di antara beberapa algoritma aturan

asosiasi yang dikembangkan, algoritma Apriori merupakan algoritma yang dinilai

paling efisien (Dyah,2005).

B. Rumusan Masalah

Bagaimana mengetahui pola keterkaitan antar tingkat keberhasilan atau

ketidakberhasilan suatu matakuliah dengan tingkat keberhasilan atau

ketidakberhasilan mata kuliah lain dari dataset nilai akademik mahasiswa dengan

data mining menggunakan teknik pencarian aturan asosiasi (association rule) dengan

algoritma Apriori?

C. Metodologi

1. Pembersihan data

Untuk membuang data yang tidak konsisten dan tidak diperlukan.

2. Integrasi data

Melakukan penggabungan data dari beberapa sumber.

3. Transformasi data

19

Page 20: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Melakukan penggabungan data menjadi bentuk yang sesuai untuk data

mining serta membangun model berdasarkan pola-pola yang

ditemukan pada langkah sebelumnya.

4. Aplikasi teknik data mining menggunakan algoritma Apriori.

5. Evaluasi pola yang ditemukan.

Untuk menemukan informasi yang bernilai dengan menggunakan algoritma

Apriori.

6. Presentasi pengetahuan.

Dengan menggunakan teknik visualisasi.

D. Tujuan

Untuk mengetahui pola keterkaitan antar tingkat keberhasilan atau

ketidakberhasilan suatu matakuliah dengan dengan tingkat keberhasilan atau

ketidakberhasilan mata kuliah lain dari dataset nilai akademik mahasiswa dengan

data mining menggunakan teknik pencarian aturan asosiasi (association rule) dengan

algoritma Apriori.

E. Batasan Masalah

Penelitian ini menggunakan data nilai akademik mahasiswa program studi

Ilmu Komputer Fakultas MIPA Universitas Sanata Dharma Yogyakarta tahun

angkatan 2001 dan 2002 karena dari kedua angkatan tersebut yang memakai

kurikulum yang sama. Nilai akademik yang dipakai adalah nilai matakuliah

Algoritma dan Pemrograman I dan nilai matakuliah lain yang diprasyaratinya, karena

20

Page 21: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

matakuliah Algoritma dan Pemrograman I merupakan matakuliah yang menjadi

syarat untuk pengambilan matakuliah-matakuliah lain (dapat dilihat pada lampiran

2).

F. Manfaat

Hasil penelitian dari data mining ini akan menghasilkan aturan asosiasi yang

merupakan hubungan keterkaitan tingkat keberhasilan atau ketidakberhasilan suatu

makuliah terhadap tingkat keberhasilan atau ketidakberhasilan matakuliah lain.

Kesimpulan dari aturan tersebut dapat digunakan sebagai pertimbangan untuk

perbaikan kurikulum program studi, dalam hal menentukan apakah suatu matakuliah

perlu diprasyarati oleh matakuliah lain dan menentukan sifat persyaratannya (nisbi

atau mutlak). Selain itu informasi yang diperoleh dapat pula dipakai untuk perbaikan

proses belajar mengajar dan pendampingan akademik.

G. Sistematika Penulisan

Bab I. Pendahuluan

Dalam bab ini akan dijelaskan mengenai latar belakang masalah, rumusan

masalah, metodologi, tujuan, batasan masalah, manfaat, dan sistematika

penulisan.

Bab II. Landasan Teori

Dalam bab ini akan dijelaskan mengenai pengetahuan yang menjadi dasar

teori untuk mengimplementasikan data mining dalam mencari informasi dari

dataset nilai akademik mahasiswa.

21

Page 22: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Bab III. Analisa dan Perancangan Data Mining

Dalam bab ini akan diidentifikasikan masalah yang akan diselesaikan dan

tahap-tahap penyelesaian masalah dalam data mining dengan algoritma

Apriori. Dalam bab ini pula akan dijelaskan perancangan program

implementasi data mining dengan algoritma Apriori.

Bab IV Implementasi Data Mining

Dalam bab ini akan dijelaskan tentang implementasi data mining dengan

algoritma Apriori.

Bab V. Analisa hasil dan Pembahasan

Berisi analisa hasil program dan pembahasan masalah berdasarkan hasil

yang telah didapat secara keseluruhan.

Bab VI. Kesimpulan dan Saran

Berisi kesimpulan dan saran dari hasil analisis serta pembahasan masalah

berdasarkan hasil yang telah didapat.

22

Page 23: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB II

LANDASAN TEORI

A. Pengertian Data Mining

Menurut Pramudiono (2003) perkembangan data mining yang pesat tidak

dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam

jumlah yang besar terakumulasi. Tetapi pertumbuhan yang pesat dari akumulasi data

telah menciptakan suatu kondisi yang disebut dengan “rich of data but poor of

information” karena data yang terkumpul itu tidak dapat digunakan dalam suatu

aplikasi yang berguna. Bahkan tidak jarang kumpulan data tersebut dibiarkan begitu

saja sehingga tercipta “data tombs” (kuburan data).

Dalam jurnal ilmiah, data mining juga dikenal dengan nama KDD

(Knowledge Discovery in Database). Namun pada tahun 1995, telah diadakan

International KDD Conference di Montreal yang berhasil mendefinisikan bahwa

KDD merupakan suatu proses dalam mengenali informasi atau suatu kebenaran baru

dan benar-benar berguna serta mengenali pola yang dapat dimengerti dari data.

Tujuan utama dari proses KDD adalah memprediksikan nilai-nilai yang berguna dari

variabel-variabel yang ada atau menemukan pola-pola dari sebuah gugusan data yang

dapat diinterpretasikan oleh manusia. Sesuai dengan tujuan tersebut, maka proses

dalam mengenali informasi baru dan penemuan pola tersebut perlu diaplikasikan

dengan data mining. Sehingga sebenarnya data mining merupakan suatu bagian yang

tidak dapat dilepaskan dari proses KDD.

23

Page 24: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Definisi data mining :

1. Menurut Pramudiono (2003), data mining merupakan serangkaian proses

untuk menggali nilai tambah baru suatu kumpulan data berupa

pengetahuan yang selama ini tidak diketahui secara manual.

2. Menurut Sucahyo (2003), definisi sederhana dari data mining adalah

ekstraksi informasi atau pola yang penting atau menarik dari data yang

ada di basis data yang besar.

3. Menurut Edelstein dari Two Crows Cooperations data mining digunakan

untuk menemukan pola yang tersembunyi dan hubungan antar data yang

membantu di dalam hal membuat keputusan bisnis yang lebih baik.

4. Menurut Kumar dan Joshi, data mining adalah eksplorasi dari analisis

baik secara otomatis maupun semi otomatis dari data yang berjumlah

besar dengan tujuan untuk menemukan pola dan aturan yang berarti.

Perlu diketahui bahwa data mining merupakan salah satu bidang yang cukup

banyak didukung oleh cabang ilmu lain di dalam teknologi informasi yaitu statistik,

teknologi basis data, machine learning, sistem pakar, algoritma paralel, algoritma

genetika, pengenalan pola, visualisasi data, dan lain-lain.

GeneticAlgoritm

ParallelAlgoritm Database

Visualisation

AppliedStatistic

Data Mining

MachineLearning Artificial

Intelegent

24

Gambar 2.1 Data mining merupakan bidang multidisipliner(www.stttelkom.ac.id)

Page 25: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Ada beberapa faktor yang menjadi alasan utama mengapa menggunakan data

mining:

1. Banyaknya data yang terkumpul sehingga memerlukan waktu yang

sangat lama dan tenaga ahli yang cukup banyak untuk

menganalisisnya.

2. Komputer menjadi salah satu pilihan utama karena kemampuannya

dalam kecepatan, ketepatan, tidak pernah lelah dan mudah

dioperasikan.

3. Tekanan dari kompetisi bisnis yang terus menguat sehingga

menjadikan informasi menjadi sangat penting dan harus segera

dimiliki.

4. Mampu menemukan suatu pola yang tidak terpikirkan sama sekali.

Menurut Sucahyo (2003) data mining merupakan salah satu aktifitas dibidang

perangkat lunak yang dapat memberikan ROI (Return of Investment) yang tinggi.

Hal yang perlu diperhatikan adalah bahwa data mining berbeda dengan query

tools. Query dan data mining merupakan dua hal yang saling melengkapi.

Keberadaan data mining bukan untuk menggantikan query tetapi menambahkan

beberapa tambahan yang berarti. Jika menggunakan query sederhana maka informasi

yang dapat diakses sekitar 80% dari data yang ada dalam basis data sedangkan 20%

lagi akan menjadi informasi tersembunyi yang memerlukan teknik-teknik khusus

dalam mengaksesnya (Adrians & Zantinge,1997).

25

Page 26: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

B. Tahap-Tahap Data Mining

Karena data mining adalah suatu rangkaian proses maka dibagi menjadi

beberapa tahap antara lain :

1. Pembersihan data: untuk membuang data yang tidak konsisten dan noise.

2. Integrasi data: untuk menggabungkan data dari beberapa sumber.

3. Transformasi data : untuk mengubah data menjadi bentuk yang sesuai

untuk di-mining.

4. Aplikasi teknik data mining.

5. Evaluasi pola yang ditemukan : untuk menemukan informasi yang

menarik ataupun bernilai.

6. Presentasi pengetahuan dengan teknik visualisasi.

Tahap-tahap diatas dapat digambarkan sebagai berikut :

Gambar 2.2 Tahap-tahap dalam data mining(www.ilmu komputer.com/umum/iko-datamining.php.2003)

26

Page 27: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

C. Teknik Data Mining

Berdasarkan proses:

1. Supervised Learning

Dalam supervised learning disyaratkan agar data analis telah

mengidentifikasi atribut tujuan. Sebagai contoh, bila ada suatu

pertanyaan tentang siapakah pelanggan yang baru-baru ini membeli

mobil baru, untuk itu dapat dibuat target atribut 1 untuk “YA” dan 0

untuk “TIDAK”. Teknik-teknik yang termasuk dalam bagian ini antar

lain Clasification, Regression, dan lain-lain.

2. Unsupervised Learning

Berbeda dengan supervised learning, dalam unsupervised learning data

analis tidak perlu mengidentifikasi atribut target. Teknik-teknik data

mining yang termasuk ke dalam bagian ini adalah Clustering,

Association Rule, dan lain-lain.

Berikut ini adalah gambaran tentang teknik data mining yang paling populer

dari teknik-teknik data mining yang ada:

1. Classification

Classification adalah proses untuk menemukan model atau fungsi

yang menjelaskan atau membedakan konsep atau kelas data, dengan

tujuan untuk dapat memperkirakan kelas dari suatu objek yang

labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika

maka”, decision tree ataupun formula matematis (Pramudiono, 2003).

27

Page 28: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Desicion tree merupakan salah satu metode clasification yang paling

populer karena mudah untuk diinterpretasikan oleh manusia. Contoh

dari decision tree dapat dilihat melalui gambar dibawah ini:

age

student credit rating

no yes

yes

no yes

<=30 >40

excellent

Gambar 2.3 Contoh dari decision tree pembeli komputer (www.ilmu komputer.com/umum/iko-datamining.php.2003)

Setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap

ujung pohon menyatakan kelas data atau atribut data. Dari decision

tree tersebut, diketahui bahwa salah satu kelompok yang potensial

membeli komputer adalah orang yang berusia dibawah atau sama

dengan 30 dan juga merupakan seorang pelajar.

Algoritma Decision tree yang sering dipakai adalah ID3 dan

C4.5, namun akhir-akhir ini sedang dikembangkan suatu algoritma

yang dikenal dengan RainForest. Metode-metode classification yang

lain adalah Bayesian, Neural Network, Genetic Algorithm, Fuzzy,

Case-based Reasoning dan K-Nearest Neigboor.

2. Association Rule

Merupakan teknik data mining untuk menemukan aturan

asosiasi antara kombinasi item. Teknik ini pada umumnya diterapkan

untuk basis data transaksi dimana transaksi terdiri dari sejumlah item.

28

Page 29: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Basis data transaksi tersebut dapat dipakai untuk menyelesaikan

masalah pemilik pasar swalayan atau toko antara lain dalam mengatur

tata letak barang, penyiapan stok barang, dan lain-lain. Dengan

menemukan semua aturan asosiasi dan korelasi di antara item data

dimana kehadiran salah satu dari sejumlah item data menunjukkan

secara tidak langsung adanya kehadiran item data lainnya, maka

masalah tersebut bisa diselesaikan. Contoh dari aturan asosiasi adalah

bisa diketahui berapa besar kemungkinan seorang pelanggan membeli

roti bersamaan dengan susu. Dengan informasi tersebut, seorang

pemilik pasar swalayan atau toko dapat mengambil keputusan-

keputusan strategis tentang pasar swalayan atau tokonya dalam

mengatur penempatan barang atau merancang kampanye pamasaran

dengan menggunakan kupon diskon untuk kombinasi barang. Adapun

algoritma pada teknik ini antara lain Apriori, FP-Growth,

Closure/closed dan lain-lain.

3. Clustering

Berbeda dengan classification dimana kelas data telah

ditentukan sebelumnya, clustering melakukan pengelompokan data

tanpa berdasarkan kelas tertentu. Bahkan clustering dapat dipakai

untuk memberikan label pada kelas data yang belum diketahui itu.

Prinsip clustering adalah memaksimalkan kesamaan antar anggota

satu kelas dan meminimumkan kesamaan antar kelas / cluster.

29

Page 30: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

D. Aturan asosiasi (Association Rules)

Association rule adalah salah satu teknik data mining yang sudah mulai

dipopulerkan oleh Rakesh Agrawal, seorang peneliti di IBM Almaden Research

Center yang berasal dari India, sejak tahun 1993 (Prasetyo,2006). Aturan asosiasi

sering dipakai dalam penggalian data transaksi. Proses pencarian aturan asosiasi

bertujuan untuk menemukan pola yang sering muncul, asosiasi antara suatu

kombinasi item yaitu dengan membuat korelasi antara item data yang dikelompokkan

ke dalam transaksi kemudian mengambil kesimpulan berdasarkan hubungan yang

terbentuk dari beberapa item data. Hal-hal tersebut dapat merepresentasikan

informasi penting yang ingin diketahui pada data yang ada.

Proses pencarian frequent itemset merupakan pra-syarat dan membutuhkan

waktu sangat banyak, sehingga banyak algoritma dikembangkan untuk lebih

mengefisienkan proses ini. Ada beberapa faktor yang mempengaruhi efisiensi

pencarian frequent itemset diantaranya adalah bila basis data besar (jumlah transaksi

yang banyak), item yang sangat banyak dan nilai support yang rendah.

Penting tidaknya suatu aturan asosiasi dapat diketahui dengan dua parameter,

support yaitu prosentase kombinasi item dalam database dan confidence yaitu

kuatnya hubungan antar item dalam aturan asosiasi (Pramudiono,2003). Pencarian

association rule bertujuan untuk menemukan semua aturan yang terdapat pada

database dengan minsup (minimum support) dan minconf (minimum confidence) yang

melebihi batas tertentu.

Berikut ini adalah definisi yang berkaitan dengan aturan asosiasi

(Sukarya,dkk):

30

Page 31: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Definisi 1 : Misalkan I = {I1, I2, …, Ik}, X I adalah kumpulan dari item-item yang

disebut itemset.

Definisi 2 : Misalkan I = {I1, I2, …, Ik} adalah sebuah gugus dari k atribut yang

berbeda, disebut juga literal. D adalah basis data, dimana setiap record (tuple) t

memiliki pengidentifikasi yang unik (TID), dan mengandung sebuah item sedemikian

hingga t I. Untuk transaksi t berisi X yang merupakan sekumpulan item yang ada

dalam I, sehingga X t, aturan asosiasi adalah sebuah aturan berbentuk X Y,

dimana X I, Y I, dan X Y = .

Definisi 3 : Support dari aturan asosiasi X Y adalah rasio dari record yang

mengandung X Y dengan total record dalam basis data. Secara matematis dapat

ditulis,

Supp(X Y) = DtYXDt |

...................................................(2.1)

Untuk mendapatkan nilai support menggunakan rumus :

Support (X,Y) = Count (X,Y) / |D|................................................(2.2)

Definisi 4: Minsup ( minimum support) menandakan ambang batas (threshold) yang

menentukan apakah sebuah itemset akan dipergunakan pada perhitungan selanjutnya

untuk pencarian aturan asosiasi.

Definisi 5: Frequent itemset merupakan itemset yang memiliki nilai support

melebihi minsup.

31

Page 32: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Definisi 6 : Confidence dari aturan asosiasi X Y adalah rasio dari record yang

mengandung X Y dengan total record yang mengandung X. Secara matematis

dapat ditulis,

Conf( X Y) = tXDttYXDt

||

.................................................(2.3)

Untuk mendapatkan nilai confidence menggunakan rumus:

Confidence (X Y) = support (X,Y) / support (X).........................(2.4)

Definisi 7 : Minconf (minimum confidence) menandakan ambang batas (threshold)

dari sebuah aturan asosiasi untuk menentukan aturan asosiasi yang kuat (strong

association rule).

Beberapa istilah lain yang digunakan dalam aturan asosiasi

adalah sebagai berikut :

· k-itemset : itemset dengan kardinalitas k (gugus item yang memiliki k buah item).

· candidate k-itemset : itemset yang mungkin merupakan frequent k-itemset.

· frequent k-itemset (Fk): frequent itemset dengan kardinalitas k.

· Aturan asosiasi yang kuat (strong association rule) : aturan asosiasi yang nilai

confidence-nya memenuhi parameter ambang batas minimum confidence.

Misalnya terdapat dataset transaksi D sebagai berikut:

Tabel 2.1. Contoh Tabel Transaksi D

TID ItemsetsT100 1 3 4T200 2 3 5T300 1 2 3 5T400 2 5

32

Page 33: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Jumlah transaksi D = |D| = 4

Jumlah transaksi yang terdiri dari item (2,3) = Count (2,3) = 2

Maka support (2,3) = Count (2,3) / |D|

= 2 / 4

= 0.5

Confidence (2 3) = support (2,3) / support (2)

= 0.5 / 0.75

= 0.67

Secara umum yang dilakukan dalam proses pencarian aturan asosiasi ini dapat

dibagi menjadi dua tahapan, yaitu :

· Pencarian frequent itemset

Yaitu proses pencarian semua frequent itemset dari kandidat itemset yang

memenuhi nilai minsup. Dalam skripsi ini proses pencarian frequent itemset

menggunakan algoritma Apriori.

· Pembentukan strong association rule

Yaitu proses mendapatkan aturan asosiasi yang kuat (strong association rule)

dari kombinasi frequent itemset yang membentuk aturan asosiasi yang

memiliki nilai confidence lebih besar atau sama dengan dari nilai minconf .

Aturan asosiasi dapat ditemukan dari setiap frequent itemset.

Dari proses ini akan menghasilkan aturan asosiasi yang kuat (strong

association rule).

33

Page 34: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

E. Algoritma Apriori

Algoritma Apriori adalah algoritma analisis keranjang pasar yang digunakan

untuk menghasilkan aturan asosiasi, dengan pola “if-then”. Algoritma ini

menggunakan pendekatan iteratif yang dikenal dengan level-wise search, dimana k-

kelompok produk digunakan untuk mengeksplorasi (k+1)-kelompok produk atau

(k+1)-itemset (Yulita dkk, 2004). Algoritma Apriori merupakan algoritma untuk

mencari frequent itemset yang berdasarkan prinsip Apriori, yaitu jika suatu itemset

merupakan frequent itemset, maka semua subset-nya akan berupa frequent itemset

(Sukarya,dkk). Pembentukan frequent itemset dilakukan dengan mencari semua

kombinasi item-item yang memiliki support lebih besar atau sama dengan minsup

yang telah ditentukan.

Proses pada algoritma ini membangkitkan frequent itemset per level, dimulai

dari level 1-itemset sampai ke itemset terpanjang, kandidat level yang baru dibentuk

dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai

support-nya. Detail algoritma Apriori adalah sebagai berikut :

Ck : candidate itemset dengan ukuran k

Fk : frequent itemset dengan ukuran k

D : data seluruh transaksi

F1 : {Frequent 1-itemset}

For (k=2; Fk-1 ≠ ; k++) do begin

//Join Step

Ck = apriori-gen(Fk-1);

For all transaksi t D do begin

34

Page 35: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

//Prune Step

Ct = subset (Ck, t);

For all kandidat c Ct do

c.count++;

end

Lk = { c Ck | c.count minsup}

End

Answer = kFk;

Berdasarkan algoritma di atas, pada iterasi pertama dihitung jumlah

kemunculan setiap item dalam transaksi untuk menentukan frequent 1-itemset. Pada

iterasi selanjutnya, Fk-1 yang merupakan set dari frequent (k-1)-itemset yang dibentuk

pada iterasi ke-(k-1), digunakan untuk membentuk Ck (himpunan dari candidate k-

itemset). Langkah ini merupakan tahap dari join step. Setelah itu, dilakukan

penelusuran dalam basis data untuk menghitung support bagi setiap candidate

itemset dalam Ck. Untuk setiap transaksi t, dicari semua candidate itemset t dalam set

Ck yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate

itemset dalam set Ck yang terkandung dalam transaksi t disebut Ct dan ditulis dengan

notasi Ct= subset (Ck, t). Langkah ini merupakan tahap dari prune step. Nilai support

dari semua candidate k-itemset dalam Ct dinaikkan. Penelusuran dilanjutkan pada

transaksi berikutnya sampai semua transaksi dalam basis data ditelusuri, kemudian

dicari candidate k-itemset yang memenuhi minsup. Semua candidate k-itemset yang

memenuhi minsup disimpan dalam Fk yang akan digunakan untuk membentuk

frequent (k+1)-itemset.

35

Page 36: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Secara lebih detail, algoritma untuk join step dan prune step adalah sebagai

berikut :

a. Join step

Pada langkah ini dilakukan join Fk-1 dengan Fk-1 untuk memperoleh superset

Ck. Union p q dari frequent (k-1)-itemset p,q Fk-1 dimasukkan ke dalam Ck jika

(k-2)-item pertama dari p dan q sama dan item p[k-1] < q[k-1].

Algoritma:

For all p,q Fk-1 p ≠ q

If ( p[1]=q[1]…p[k-2]=q[k-2] ) ( p[k-1] < q[k-1] )

Then r = p[1],p[2],…, p[k-1],q[k-1]

Insert r into Ck

Langkah pada algoritma ini merupakan perluasan dari setiap frequent (k-1)-

itemset dalam Fk-1 dengan setiap item pada basis data sehingga membentuk k-itemset,

kemudian membuang k-itemset yang memiliki subset ukuran (k-1) yang tidak berada

dalam F k-1.

b. Prune Step

Pada langkah ini dilakukan penelusuran dalam basis data untuk menghitung

support bagi setiap candidate itemset dalam Ck.

Algoritma:

For all itemsets c Ck do

For all (k-1)-subset s of c do

If (s Fk-1) Then

Delete c from Ck

End

36

Page 37: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Algoritma Apriori menggunakan arah pencarian bottom-up, dimana arah

pencarian dimulai dari frequent itemset menuju ke itemset terpanjang. Strategi yang

digunakan breadth-first search dimana proses pencarian dilakukan per level dan

untuk tiap levelnya ditentukan nilai support-nya untuk menentukan frequent itemset

pada level tersebut. Sedangkan strategi penghitungan nilai support dilakukan dengan

horizontal counting, dengan cara membaca transaksi satu persatu, jika ditemukan

itemset yang dicari pada transaksi tersebut maka counter bertambah satu, begitu

selanjutnya.

Contoh penerapan algoritma Apriori dan pembentukan aturan asosiasi

Dengan menggunakan contoh tabel transaksi yang diambil dari situs

www.stttelkom.ac.id/staf/MAB/TA-PA/jurnal-oyo.zip dibawah ini, akan ditunjukkan

cara kerja algoritma Apriori untuk menemukan frequent itemset dan pembangkitan

aturan asosiasi yang memenuhi minsup yang telah ditetapkan sebesar 40% dan

minconf 50%.

Tabel 2.2. Tabel Transaksi

TID

Item

1 B, C, D, E2 A, C3 B4 A, B, C, D5 A, B, D6 C, D7 A, B, D, E8 B, C, D9 B, C, D, E10 B, C, D

37

Page 38: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Dari tabel diatas maka proses pencarian frequent itemset dengan algoritma

Apriori adalah sebagai berikut :

Candidate1-itemset

Count Support(%)

Frequent1-Itemset

Count Support(%)

{A} 4 40% {A} 4 40%{B} 8 80% {B} 8 80%{C} 7 70% {C} 7 70%{D} 8 80% {D} 8 80%{E} 3 30%

Candidate2-itemset

Count Support(%)

Frequent2-Itemset

Count Support(%)

{A,B} 3 30% {B,C} 5 50%{A,C} 2 20% {B,D} 7 70%{A,D} 3 30% {C,D} 6 60%{B,C} 5 50%{B,D} 7 70%{C,D} 6 60%

Candidate 3-itemset

Count Support(%)

{B,C,D} 5 50%

Frequent 3-itemset

Count Support(%)

{B,C,D} 5 50%

Gambar 2.4. Pencarian candidate itemset dan frequent itemset denganminimum support = 40%

Karena jumlah item dari frequent 3-itemset hanya terdiri dari 3 item sehingga

tidak memungkinkan lagi dibentuk frequent 4-itemset maka proses pencarian

dihentikan. Berdasarkan pencarian frequent itemset diatas maka didapat tabel

frequent itemset sebagai berikut :

38

L1

C2 L2

C3 L3

C1

Page 39: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Tabel 2.3. Frequent itemset dengan minimum support 40%

Frequent Itemset Count Support (%){B,C} {B,C,D} 5 50%{C,D} 6 60%{C} {B,D} 7 70%{D} {B} 8 80%

Dari contoh diatas dapat dilihat bahwa bila nilai minsup diturunkan maka

akan banyak kandidat itemset yang terbentuk dan kardinalitas itemset yang lebih

besar lagi, sehingga menyebabkan banyak pengulangan. Tapi untuk nilai minsup yang

besar akan menyebabkan sedikit ditemukan frequent itemset sehingga menjadikan

algoritma ini efisien, karena sedikit sekali melakukan proses pembacaan basis data

dan penghitungan nilai support.

Sehingga dengan frequent itemset yang telah ditemukan diatas dapat diproses

sebagai berikut :

Subset dari frequent itemset: {B},{C},{D},{BC},{BD},{CD},{B,C,D}

Dari subset yang ada dibentuk aturan asosiasi sebagai berikut :

1. B C

Confidence (B C) = support (BC) / support (B)

= 50/80

= 0.625

= 62.5%

2. C B

Confidence (C B) = support (BC) / support (C)

= 50/70

39

Page 40: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

= 0.714

= 71.4%

3. B D

Confidence (B D) = support (BD) / support (B)

= 70/80

= 0.875

= 87.5%

4. D B

Confidence (DB) = support (BD) / support (D)

= 70/80

= 0.875

= 87.5%

5. D C

Confidence (D C) = support (CD) / support (D)

= 60/80

= 0.75

= 75%

6. CD

Confidence (C D) = support (CD) / support (C)

= 60/70

= 0.857

= 85.7%

7. B CD

40

Page 41: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Confidence (B CD) = support (BCD) / support (B)

= 50/80

= 0.625

= 62.5%

8. CD B

Confidence (CD B) = support (BCD) / support (CD)

= 50/60

= 0.833

= 83.3%

9. C BD

Confidence (C BD) = support (BCD) / support (C)

= 50/70

= 0.714

= 71.4%

10. BD C

Confidence (BD C) = support (BCD) / support (BD)

= 50/70

= 0.714

= 71.4%

11. D BC

Confidence (D BC) = support (BCD) / support (D)

= 50/80

41

Page 42: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

= 0. 625

= 62.5%

12. BC D

Confidence (BC D) = support (BCD) / support (BC)

= 50/50

= 1

= 100%

Dari semua aturan asosiasi yang ada ternyata mempunyai nilai confidence

50% sehingga semua aturan asosiasi yang terbentuk diatas merupakan aturan asosiasi

yang kuat (strong asociation rule).

42

Page 43: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB III

ANALISA DAN PERANCANGAN DATA MINING

A. Identifikasi Masalah

Setiap instansi selalu melakukan penyimpanan data. Adapun data yang

disimpan sangatlah banyak dan beragam. Data tersebut disimpan dalam bentuk

database dimana semakin banyak data yang disimpan maka semakin besar pula

memori yang diperlukan untuk menyimpannya. Data yang disimpan merupakan data

yang penting dan dibutuhkan demi terlaksananya kegiatan dalam instansi tersebut.

Salah satu instansi yang dibahas dalam karya tulis ini adalah sebuah

universitas yaitu Universitas Sanata Dharma Yogyakarta. Saat penelitian berlangsung

Universitas Sanata Dharma terdiri dari 8 fakultas dan 24 program studi dengan

jumlah mahasiswa sebanyak 11323 orang. Pihak universitas menyimpan banyak

sekali data, mulai dari data pribadi mahasiswa, data administrasi mahasiswa, data

matakuliah beserta staf pengajar, data staf pengajar, dan masih banyak lagi data yang

harus disimpan. Adapun data-data tersebut memiliki manfaat sesuai dengan

kebutuhan dari pihak universitas.

Data yang dipakai untuk penulisan karya tulis ini adalah data nilai akademik

mahasiswa khususnya program studi Ilmu Komputer. Data nilai akademik ini

merupakan hasil nilai yang diperoleh oleh setiap mahasiswa setiap semesternya.

Jumlah data ini sangat besar karena setiap semester data akan bertambah sebanyak

jumlah matakuliah yang diambil oleh setiap mahasiswa. Sedangkan jumlah

mahasiswa ilmu komputer angkatan 2001 dan 2002 pada bulan Maret 2006 sebanyak

43

Page 44: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

141 orang. Pihak universitas harus menyediakan memori dengan kapasitas yang besar

dan pengelolaan yang rumit untuk menyimpan data nilai akademik yang hanya

dipakai untuk menghitung nilai ipk dan ips mahasiswa tiap semester. Hal itu tidak

seimbang antara pengelolaan dan hasil yang diperoleh.

Untuk itu dengan teknologi yang tergolong baru, yaitu data mining penulis

akan menggunakan data nilai akademik tersebut untuk diolah agar menemukan

informasi yang terkandung di dalam data tersebut yang tidak bisa didapat secara

manual.

B. Analisa sistem

Sistem ini akan menghasilkan informasi baru tentang pola keterkaitan antara

tingkat keberhasilan suatu matakuliah dengan tingkat keberhasilan mata kuliah lain.

1. Input

Data diperoleh dari BAPSI (Biro Administrasi Perencanaan dan Sistem

Informasi) Universitas Sanata Dharma Yogyakarta. Data diperoleh dalam bentuk

Microsoft Excel yang terdiri dari mahasiswa prodi Ilmu Komputer dan prodi

Matematika sampai dengan angkatan 2002. Data tersebut telah dikelompokkan

menurut angkatannya. Contoh data dapat dilihat pada lampiran 1. Pada akhirnya

data yang dipakai hanya data nilai akademik mahasiswa ilmu komputer angkatan

2001 dan angkatan 2002 karena dari kedua angkatan tersebut memakai kurikulum

yang sama.

44

Page 45: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Data tersebut memiliki atribut sebagai berikut :

Ø Smt Ambil : saat mahasiswa mengambil matakuliah (berupa

tahun dan semester ganjil atau genap).

Ø Kode Mtk : kode matakuliah yang diambil oleh mahasiswa.

Ø Nama Mtk : nama matakuliah

Ø Sks : jumlah sks setiap matakuliah

Ø Nilai : nilai yang diperoleh mahasiswa setiap matakuliah

Ketika penelitian sedang berlangsung jumlah mahasiswa Ilmu Komputer

angkatan 2001 sebanyak 77 orang, yang masih aktif sebanyak 50 orang dan yang

telah lulus sebanyak 27 orang. Sedangkan mahasiswa Ilmu Komputer angkatan

2002 sebanyak 64 orang dan masih aktif semua.

Pada data tersebut dilakukan pemrosesan awal untuk dipakai dalam

penggalian aturan asosiasi. Yang dilakukan dalam pemrosesan awal adalah

memberikan tambahan atribut nim untuk membedakan antara mahasiswa yang

satu dengan yang lain. Atribut nim berupa integer yang terdiri 4 digit, 2 digit awal

menyatakan angkatan sedangkan 2 digit belakang adalah nomor urut mahasiswa.

Adapun atribut yang dihilangkan yaitu atribut Smt Ambil dan sks karena atribut

tersebut tidak diperlukan. Contoh nilai dari atribut nim dapat dilihat pada tabel

dibawah ini :

Tabel 3.1. Nim mahasiswa

Contoh nim Keterangan2104 Mahasiswa angkatan 2001 nomor urut 42201 Mahasiswa angkatan 2002 nomor urut 1

45

Page 46: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Langkah yang dilakukan selanjutnya adalah menghilangkan matakuliah

yang ganda yaitu matakuliah yang diambil oleh mahasiswa lebih dari satu kali

sehingga bersifat mengulang. Dalam hal ini data yang dipakai adalah data

matakuliah yang diambil pertama kali, karena nilai tersebut dianggap sebagai

nilai pencapaian murni mahasiswa jadi matakuliah yang sifatnya mengulang

dihapus atau dihilangkan. Kemudian apabila terdapat matakuliah yang atribut

nilainya kosong diisi dengan nilai F. Matakuliah yang digunakan dalam penelitian

adalah matakuliah yang berada dalam satu rangkaian diagram alir menurut

kurikulum program studi Ilmu Komputer tahun 2001 yaitu Algoritma dan

Pemrograman I dan matakuliah lain yang diprasyaratinya (dapat dilihat pada

lampiran 2).

Data nilai akademik yang telah dibersihkan digabung menjadi satu tabel.

Data tersebut memiliki atribut nim, kode mtk, mtk (nama matakuliah yang

diambil oleh mahasiswa), nilai (nilai yang diperoleh mahasiwa untuk setiap

matakuliah) dan sks. Total record sebanyak 1938 baris.

Tabel 3.2 Matakuliah yang terdapat dalam satu rangkaian prasyarat

No Kode Nama Matakuliah1. MAK 103 Algoritma dan Pemrograman I2. MAK 104 Algoritma Dan Pemrograman II3. MAK 406 Algoritma Genetika4. MAK 217 Analisis Algoritma5. MAK 312 Animasi Komputer6. MAK 209 Basis Data I7. MAK 303 Basis Data II8. MAK 221 Grafika Komputer Lanjut9. MAK 219 Jaringan Syaraf Tiruan10. MAK 411 Kompresi Data11. MAK 413 Konsep Bahasa Pemrograman

46

Page 47: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

12. MAK 414 Pemrograman Client Server13. MAK 417 Pemrosesan Bahasa Alami14. MAK 313 Pemrosesan Citra15. MAK 210 Pengantar Grafika Komputer & Multimedia16. MAK 416 Pengenalan Pola17. MAK 215 Rekayasa Perangkat Lunak I18. MAK 301 Rekayasa Perangkat Lunak II19. MAK 309 Robotika20. MAK 415 Sistem Basis Data Terdistribusi21. MAK 405 Sistem Berbasis Pengetahuan22. MAK 214 Sistem Cerdas23. MAK 205 Struktur Data24. MAK 418 Teknologi Multimedia

Tabel 3.3. Nilai mahasiswa

No Nilai mahasiswa1. A2. B3. C4. D5. E6. F

Dalam skripsi ini yang menjadi itemset adalah matakuliah beserta nilai

yang diperoleh. Untuk kepentingan skripsi ini dibuat 2 jenis dataset yaitu dataset

yang berisi itemset matakuliah dengan nilai A,B dan dataset yang berisi itemset

matakuliah dengan nilai C,D,E,F. Kedua dataset ini dibuat dengan alasan bahwa :

o Mahasiswa dikatakan berhasil dengan memuaskan jika memperoleh nilai

A atau B

o Mahasiswa dikatakan tidak berhasil jika memperoleh nilai D,E atau F

47

Page 48: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

o Jika mahasiswa mendapat nilai C, meskipun secara teoritis berhasil

namun pada hemat penulis nilai tersebut masih belum memuaskan

sehingga digabung/dikategorikan sebagai belum berhasil.

Secara konseptual itemset akan mempunyai format seperti pada tabel di

bawah ini :

Tabel 3.4. Tabel contoh itemset dengan matakuliah yang memperoleh nilaiC,D,E,F

Nim Matakuliah dengan nilai C,D,E.F (dikategorikan sebagaiketidakberhasilan)

2101 Analisis Algoritma, Basis Data II, Pengantar Grafika Komputer & Multimedia,Pengenalan Pola, Rekayasa Perangkat Lunak I, Animasi Komputer

2102 Algoritma dan Pemrograman I,Jaringan Syaraf Tiruan,Pemrosesan BahasaAlami,Sistem Berbasis Pengetahuan

2103 Algoritma dan Pemrograman I,Algoritma Dan Pemrograman II,Basis Data I,Kompresi Data,Rekayasa Perangkat Lunak I,Sistem Cerdas,TeknologiMultimedia,Analisis Algoritma,Basis Data II,Pengenalan Pola

2104 Algoritma dan Pemrograman I,Algoritma Dan Pemrograman II,Basis DataII,Grafika Komputer Lanjut,Sistem Basis Data Terdistribusi,Sistem Cerdas,Struktur Data,Analisis Algoritma,Basis Data I

dst dst

2. Proses

Diagram arus data yang terjadi dalam penggalian aturan asosiasi adalah

sebagai berikut :

Pengguna

0Proses

penggalianaturan

asosiasi

Database nilaiakademik

Aturan asosiasi

Minsupp

Minconf

nim, mtk

Gambar 3.1. Diagram Konteks

48

Page 49: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Proses penggalian aturan asosiasi membutuhkan 4 data input, yaitu data

mahasiswa yang terdiri dari nim dan mtk yang diakses dari database nilai

akademik, minimum support dan minimum confidence yang harus dimasukkan

oleh pengguna seperti terlihat pada diagram konteks diatas. Output dari proses

adalah data aturan asosiasi yang akan ditampilkan kepada pengguna.

1Pencarianfrequentk_itemset

2Pembentukan

aturanasosiasi

Pengguna

Database nilaiakademik

frequentk_itemset

Aturan asosiasi

MinsuppMinconf

nim, mtk

Pada DFD level 1 proses penggalian aturan asosiasi dipecah menjadi 2

proses yaitu proses pencarian frequent k-itemset dan proses pembentukan aturan

asosiasi. Proses pencarian frequent k-itemset membutuhkan 2 data input yaitu

data mahasiswa dan minsup. Sedangkan output dari proses tersebut adalah semua

frequent k-itemset. Semua frequent k-itemset akan digunakan sebagai input untuk

proses pembentukan aturan asosiasi. Jadi proses pembentukan aturan asosiasi

membutuhkan 2 data input yaitu frequent k-itemset (output dari proses pencarian

frequent k-itemset) dan minconf. Output dari proses pembentukan aturan asosiasi

adalah semua data aturan asosiasi yang memenuhi minconf.

49

Gambar 3.2. DFD Level 1

Page 50: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Database nilaiakademik

1.1Melakukan

kueri

Pengguna

1.2Pembentukan

kandidatitemset

1.3Pembentukan

frequentk_itemset

Minsupp

kandidatitemset

frequent k_itemset

nim, mtk

nim, mtkyang telah dikueri

Gambar 3.3. DFD level 2

Pada DFD level 2 ini proses pencarian frequent k-itemset dipecah menjadi

proses melakukan kueri, proses pembentukan kandidat itemset, dan proses

pembentukan frequent k-itemset. Pada proses melakukan kueri ini yang

dikerjakan adalah melakukan koneksi ke database nilai akademik kemudian data

mahasiswa yang terdiri dari nim, dan mtk akan dikueri berdasarkan TID. TID

adalah pengidentifikasi yang unik tiap record. Dalam kasus ini yang menjadi TID

adalah nim dan mtk. Output dari proses ini adalah data mahasiswa yang telah

dikueri dan akan menjadi input pada proses pembentukan kandidat itemset.

Output dari proses ini adalah kandidat itemset yang akan digunakan sebagai input

pada proses pembentukan frequent k-itemset. Dari proses pembentukan frequent

k-itemset akan menghasilkan output berupa frequent k-itemset yang nantinya akan

dipakai dalam pembentukan aturan asosiasi.

Notasi yang digunakan :

1. Ck : kandidat k-itemset, dimana k menunjukkan jumlah pasangan itemset.

2. Fk : frequent k-itemset

50

Page 51: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Pada proses pembentukan frequent k-itemset terdapat 2 proses yaitu :

1) Join (penggabungan), yaitu proses untuk menemukan Fk. Proses ini

dilakukan dengan pembangkitan Ck. Ck dibangkitkan dengan melakukan

proses join Fk-1 dengan dirinya sendiri, Ck=Fk-1*Fk-1.

2) Prune (pemangkasan/pemotongan), yaitu proses menghilangkan anggota

Ck yang memiliki support lebih kecil dari minimum support agar tidak

dimasukkan ke dalam Fk.

Tahapan yang dilakukan untuk membentuk frequent k-itemset adalah sebagai

berikut:

1. Menelusuri seluruh record pada TID dan menghitung support dari tiap

itemset. Ini akan menghasilkan kandidat 1-itemset, C1

2. Frequent k_itemset F1 dibentuk dengan menyaring C1 dengan support

yang lebih besar sama dengan minimum support untuk dimasukkan ke

dalam F1.

3. Untuk membentuk F2 dilakukan proses join untuk menghasilkan C2.

4. Dari C2, 2-itemset yang memiliki support yang lebih besar atau sama

dengan minimum support akan disimpan ke dalam F2.

5. Proses ini diulang sampai tidak ada lagi kemungkinan k-itemset.

Langkah-langkah pembentukan aturan asosiasi dari frequent itemset sebagai

berikut :

1. Untuk setiap itemset, bangkitkan seluruh subset yang tidak kosong.

2. Untuk setiap subset yang tidak kosong dikenai aturan asosiasi sehingga

terbentuk aturan.

51

Page 52: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

3. Hitung nilai confidence tiap aturan yang terbentuk.

4. Lakukan pengecekan terhadap nilai confidence tiap aturan. Aturan yang

memiliki nilai confidence lebih besar atau sama dengan minimum

confidence adalah strong association rule yang terbentuk.

3. Output

Output dari program adalah aturan asosiasi yang kuat yaitu aturan asosiasi

yang memenuhi minsup dan minconf. Aturan tersebut dapat digunakan untuk

melihat pola keterkaitan antar tingkat keberhasilan atau ketidakberhasilan suatu

matakuliah dengan tingkat keberhasilan atau ketidakberhasilan mata kuliah lain.

4. Analisa Kebutuhan Sistem

a Perangkat Lunak (Software)

Dalam pembuatan program ini perangkat lunak yang dibutuhkan antara

lain:

1). Microsoft Windows XP sebagai sistem operasi

2). Visual Foxpro 8 sebagai program aplikasi

b Perangkat Keras (Hardware)

Dalam pembuatan program ini perangkat keras yang digunakan antara

lain :

1). PC dengan prosesor Intel Pentium4 2.0 Mhz

2). Harddisk 40 GB

3). Memori DDR RAM 256 Mb

52

Page 53: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

C. Perancangan

1. Perancangan Modul

Rancangan modul – modul :

a. Modul hitung support

Input : dataset berupa tabel yang merupakan data akademik mahasiswa ;

itemset yang terbentuk dari dataset yang terdiri dari matakuliah dan

nilainya.

Output : nilai support tiap itemset.

Algoritma : mencari jumlah kejadian kandidat itemset pada dataset

kemudian dibagi jumlah total mahasiswa.

b. Modul hitung confidence

Input : nilai support tiap itemset.

Output : nilai confidence yang dipakai untuk menentukan aturan yang

merupakan hasil dari pencarian aturan dan merupakan informasi baru.

Algoritma : nilai support gabungan anteseden dan konsekuen dibagi

dengan nilai support anteseden.

c. Modul penggabungan (join)

Input : itemset atau frequent itemset.

Output : kandidat itemset.

Algoritma : menggabungkan atau memasangkan tiap itemset ataupun

frequent itemset dengan itemset atau frequent itemset yang lain.

d. Modul pemangkasan (prunning)

Input : kandidat itemset dan nilai support

53

Page 54: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Output : frequent itemset

Algoritma : menghilangkan atau mengabaikan itemset ataupun aturan

yang nilai supportnya lebih kecil daripada nilai minimum support.

e. Modul pencarian frequent itemset

Input : dataset yaitu tabel mahasiswa.

Output : frequent itemset

Algoritma :

1) Melakukan pembacaan tabel mahasiswa, kemudian menghitung nilai

support masing-masing kandidat itemset.

2) Setelah itu nilai support masing-masing kandidat itemset

dibandingkan dengan nilai minimum support, apabila lebih kecil maka

kandidat itemset tersebut diabaikan dan tidak akan dipakai untuk

pembentukan aturan sedangkan kandidat itemset yang memiliki

support lebih besar atau sama dengan nilai minimum support menjadi

frequent 1-itemset dan frequent 1_itemset inilah yang akan dibentuk

menjadi aturan asosiasi. Langkah ini bisa disebut juga dengan

prunning.

3) Setelah itu setiap frequent 1_itemset dipasangkan (join) dengan

frequent 1_itemset yang lain sehingga membentuk kandidat 2_itemset.

Setiap kandidat 2_itemset dihitung nilai supportnya kemudian

dilakukan prunning seperti langkah no 2 diatas. Dari langkah no 3 ini

akan meghasilkan frequent 2-itemset, kemudian frequent 2-itemset

dipasangkan lagi untuk membentuk kandidat 3-itemset begitu

54

Page 55: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

seterusnya. Proses ini dilakukan sampai tidak bisa terbentuk kandidat

itemset lagi.

f. Modul pembentukan aturan asosiasi.

Input : frequent itemset, nilai minconf.

Output : semua aturan asosiasi yang terbentuk dari semua frequent

itemset.

Algoritma :

1. Membuat subset untuk setiap frequent itemset

2. Membentuk frequent itemset yang ada menjadi aturan dengan cara

membagi menjadi anteseden dan konsekuen. Anteseden adalah itemset

yang terdapat pada sisi kiri dan dijadikan syarat sedangkan konsekuen

adalah itemset yang berada pada sisi kanan dan merupakan

kesimpulan dari syarat yang mengikutinya.

Misalnya terdapat aturan : A dibaca jika A maka B. Dari

pernyataan tersebut A merupakan anteseden sedangkan B merupakan

konsekuen.

g. Modul pembentukan aturan asosiasi yang kuat (strong association rule)

Input : semua aturan asosiasi yang telah terbentuk

Output : aturan asosiasi yang kuat (strong association rule)

Algoritma : Mencari nilai confidence dari setiap aturan asosiasi yang

terbentuk kemudian membandingkannya dengan nilai minimum

confidence. Aturan yang mempunyai nilai confidence lebih besar atau

sama dengan nilai minimum confidence adalah aturan asosiasi yang kuat

55

Page 56: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

(strong association rule) yang merupakan hasil akhir dari mining pada

dataset ini

2. Perancangan Struktur Data

a. Proses pencarian kandidat itemset membutuhkan input data berupa tabel

yang telah ada dalam basisdata yaitu tabel mahasiswa2. Proses ini akan

menghasilkan data berupa array itemset yang berisi semua itemset

yang akan digunakan untuk proses selanjutnya dalam pencarian aturan .

Deskripsi array itemset dapat dilihat pada gambar di bawah ini:

Namaarray

Ukuran Keterangan

Itemset 24 x 3 - Jumlah baris didapat dari jumlahmatakuliah

- Jumlah kolom (3) terdiri dari namaitemset,count, support.

Kemudian data yang telah tersimpan dalam array itemset akan

ditampilkan pada listbox yang terdapat pada form Candidate 1_Itemset

seperti contoh di bawah ini:

No Candidate 1_Itemset Count Support1 Algoritma Genetika 3 0.022 Algoritma dan Pemrograman I 62 0.463 Algoritma dan Pemrograman II 91 0.674 Analisis Algoritma 36 0.27

dst dst dst dst

56

Tabel 3.5 Keterangan array itemset

Tabel 3.6 Contoh salah satu isi array itemset

Page 57: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

b. Proses prunning membutuhkan data dalam array itemset yang akan

dipisahkan antara itemset yang memenuhi minimum support dan itemset

yang tidak memenuhi minimum support. Itemset yang memenuhi

minimum support akan disimpan dalam listbox yang terdapat pada form

Frequent 1_Itemset yang terdiri dari 4 kolom yaitu No Freq 1_Itemset,

Nama Freq 1_Itemset, Count dan Support.

No Freq 1_Itemset Nama Freq 1_Itemset Count Support

Nama Kolom Keterangan No Freq 1_Itemset nomor / indeks untuk tiap frequent 1_itemsetNama Freq 1_Itemset frequent 1_itemset yang dimaksud yaitu berupa

matakuliah dengan nilai tertentuCount banyaknya kejadian yang muncul tiap frequent

1_itemset yang terjadi berdasarkan tabelmahasiswa2

Support nilai support tiap frequent 1_itemset

c. Sedangkan itemset yang tidak memenuhi minimum support akan

ditampilkan pada listbox Infrequent 1_Itemset dimana format kolom dan

keterangan sama dengan listbox pada form Frequent 1_Itemset.

d. Proses pencarian frequent itemset yang lain membutuhkan data itemset

yang memenuhi minimum support yang telah dicari pada proses prunning

57

Tabel 3.7 Format listbox pada form Frequent 1_Itemset

Tabel 3.8 Keterangan listbox pada form Frequent 1_Itemset

Page 58: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

dan telah ditampilkan dalam listbox pada form Frequent 1_Itemset.

Sehingga dalam proses ini tinggal mengakses data pada listbox tersebut.

Proses ini akan menghasilkan itemset yang telah dikelompokkan menjadi

himpunan yang terdiri dari 2 itemset, 3 itemset dst yang akan menjadi

frequent itemset ke-n. Itemset tersebut disimpan dalam listbox bagian atas

pada form Frequent Itemset yang terdiri dari 4 kolom yaitu No Freq

Itemset, Jumlah Itemset, Count dan Support.

No Freq Itemset Jumlah Itemset Count Support

Nama Kolom KeteranganNo Freq Itemset indeks frequent itemsetJumlah Itemset Jumlah itemset dalam frequent itemset tersebutCount banyaknya kejadian yang memenuhi frequent

itemset tersebut dari tabel mahasiswa2Support nilai support tiap frequent itemset tersebut

Frequent 1_ itemset yang menyusun setiap frequent itemset yang telah

ditampilkan pada listbox bagian atas akan ditampilkan pada listbox bagian

bawah pada form Frequent Itemset.

No No Freq Itemset No Freq 1_ Itemset

58

Tabel 3.9 Format listbox bagian atas pada form Frequent Itemset

Tabel 3.11 Format listbox bagian bawah pada form Frequent Itemset

Tabel 3.10 Keterangan listbox bagian atas pada form Frequent Itemset

Page 59: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Nama Kolom KeteranganNo indeks listboxNo Freq Itemset no frequent itemset (merujuk No frequent

itemset pada listbox bagian atas)No Freq 1_Itemset no frequent 1_itemset yang menjadi anggota

frequent itemset

e. Proses pencarian semua aturan asosiasi membutuhkan data yang telah

ditampilkan pada kedua listbox yang terdapat pada form Frequent Itemset.

Data tersebut dipakai untuk menghitung nilai confidence dan mencari

aturan asosiasi.

Anteseden Konsekuen Nilai ConfidenceNo Rule No Freq

ItemsetNo Freq1_Itemset

No Rule No FreqItemset

No Freq1_Itemset

No Rule No FreqItemset

Confidence

Nama Kolom KeteranganNo Rule Nomor aturanNo Freq Itemset Nomor frequent itemset (merujuk Freq Itemset

pada listbox form Frequent Itemset )No Freq 1_Itemset Nomor frequent 1_itemset yang menjadi

antesedenNo Freq 1_Itemset Nomor frequent 1_itemse yang menjadi

konsekuenConfidence Nilai confidence tiap aturan

59

Tabel 3.12 Keterangan listbox bagian bawah pada form Frequent Itemset

Tabel 3.14 Keterangan listbox yang terdapat pada form Semua Rule

Tabel 3.13 Format listbox yang terdapat pada form Semua Rule

Page 60: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

f. Proses akhir yaitu menampilkan aturan asosiasi yang telah memenuhi

minimum confidence pada listbox yang terdapat pada form Strong

association rule.

Nilai Confidence Anteseden KonsekuenNoRule No Freq

ItemsetConfidence NoRule No Freq

ItemsetNo Freq1_Itemset

No Rule NoFreqItemset

No Freq1_Itemset

Nama Kolom KeteranganNo Rule Nomor strong association ruleNo FreqItemset

Nomor frequent itemset (merujuk Freq Itemsetpada listbox form Frequent Itemset )

No Freq1_Itemset

Nomor frequent 1_itemset yang menjadianteseden

No Freq1_Itemset

Nomor frequent 1_itemset yang menjadikonsekuen

Confidence Nilai confidence tiap aturan

3. Perancangan Antar Muka dengan Pengguna

1) Form Input

Gambar 3.4 Perancangan Antar Muka Form Input

60

Tabel 3.16 Keterangan listbox yang terdapat pada form Strong association rule

Tabel 3.15 Format listbox yang terdapat pada form Strong association rule

Page 61: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form ini digunakan untuk memasukkan nilai minimum support dan minimum

confidence.

Terdapat 2 buah tombol yaitu :

a) Reset : untuk mengosongkan kembali textbox Minimum Support dan

Minimum Confidence apabila pengguna ingin mengganti nilai yang telah

diketikkan.

b) Lanjut : untuk melanjutkan ke form berikutnya yaitu form Tabel

Mahasiswa.

2) Form Tabel Mahasiswa

Gambar 3.5 Perancangan Antar Muka Form Tabel Mahasiswa

61

Page 62: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form diatas untuk menampilkan tabel data akademik mahasiswa yang

merupakan dataset untuk proses data mining dengan algoritma Apriori.

Dalam form ini ditampilkan pula jumlah record yang terdapat pada tabel.

Dalam form terdapat sebuah tombol Proses Algoritma Apriori untuk

melanjutkan ke form Candidate 1_Itemset.

3) Form Candidate 1_Itemset

Gambar 3.6 Perancangan Antar Muka Form Candidate 1_Itemset

Form ini digunakan untuk menampilkan semua kandidat 1_itemset. Listbox

pada form ini akan menampilkan No , Nama Candidate 1_Itemset, Count dan

Support. Dalam form ini terdapat textbox yang akan menampilkan nilai

minimum support yang telah dimasukkan oleh pengguna dan textbox yang

62

Page 63: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

akan menampilkan jumlah kandidat 1_itemset secara otomatis. Tombol-

tombol yang terdapat dalam form yaitu :

a) TAMPIL CANDIDATE 1_ITEMSET : untuk menampilkan semua

Candidate 1_itemset beserta Count dan Nilai Supportnya dalam listbox.

b) PRUNNING : untuk menghilangkan atau mengabaikan kandidat

1_itemset yang mempunyai nilai support kurang dari nilai minimum

support.

c) SIMPAN : untuk menyimpan kandidat 1_itemset dalam bentuk .dbf.

d) : untuk melanjutkan ke form berikutnya yaitu form Frequent

Itemset.

63

Page 64: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Setelah pengguna menekan tombol maka akan muncul form Fequent

Itemset seperti dibawah ini :

4) Form Frequent Itemset

Gambar 3.7 Perancangan Antar Muka Form Frequent Itemset

Form ini berfungsi untuk menampilkan semua himpunan frequent itemset

yang mempunyai anggota lebih dari 1. Terdapat 2 buah listbox, dimana

listbox bagian atas akan menampilkan No Freq Itemset, Jumlah Itemset,

Count, dan Support. Sedangkan listbox bagian bawah merupakan listbox yang

akan memberi keterangan mengenai anggota dari frequent itemset yang

terjadi, sehingga akan ditampilkan No, No Freq Itemset, No Itemset.

64

Page 65: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Dalam form ini terdapat 3 buah tombol :

e) TAMPIL FREQUENT ITEMSET : untuk menampilkan semua frequent

itemset yang saling jumlah anggotanya lebih dari 1.

f) DETAIL : untuk menampilkan form Candidate Itemset yang akan

menampilkan semua kombinasi dari frequent 1_itemset (kandidat itemset

yang jumlah anggotanya lebih dari 1).

g) LANJUT : untuk menuju ke form berikutnya (Form Semua Rule).

5) Form Candidate Itemset

65

Gambar 3.8 Perancangan Antar Muka Form Candidate Itemset

Page 66: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form ini berfungsi untuk menampilkan semua kombinasi dari frequent

1_itemset (kandidat itemset yang jumlah anggotanya lebih dari 1) yang terjadi

yaitu dengan mengklik tombol TAMPIL CANDIDATE ITEMSET yang

terdapat pada form.

6) Form Semua Rule

Gambar 3.9 Perancangan Antar Muka Form Semua Rule

Form ini berfungsi untuk menampilkan semua aturan yang terbentuk dari

frequent itemset yang telah ditemukan. Aturan ini terbentuk dari frequent

itemset yang terdiri lebih dari 1 itemset. Didalam form ini terdapat 3 buah

listbox yang akan menampilkan aturan . Listbox anteseden akan menampilkan

66

Page 67: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

No Rule, No Freq Itemset dan No Freq 1_Itemset yang menjadi anteseden aturan ,

sedangkan listbox konsekuen menampilkan No Rule, No Freq Itemset dan No

Freq 1_Itemset yang menjadi konsekuen aturan tersebut. Listbox yang terakhir

akan menampilkan No rule, Freq Itemset dan Confidence dari aturan tersebut.

Terdapat 2 tombol yaitu :

a) TAMPIL SEMUA RULE : untuk menampilkan aturan pada listbox.

b) ASSOCIATION RULE : untuk menampilkan form Strong association

rule.

7) Form Strong association rule

Gambar 3.10 Perancangan Antar Muka Form Strong association rule

67

Page 68: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form ini adalah form yang akan menampilkan aturan asosiasi yang kuat

(strong association rule ) yang telah terbentuk dan merupakan aturan asosiasi

yang telah memenuhi nilai minimum support dan minimum confidence.

8) Form Frequent 1_Itemset

Gambar 3.11 Perancangan Antar Muka Form Frequent Itemset_1

Pada form ini akan ditampilkan frequent 1_ itemset yang memenuhi nilai

minimum support. Pada listbox akan ditampilkan No, Nama Freq 1_Itemset,

Count dan Support dari itemset tersebut.

68

Page 69: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

9) Form Infrequent 1_Itemset

Gambar 3.12 Perancangan Antar Muka Form Infrequent 1_Itemset

Pada form ini akan ditampilkan itemset yang tidak memenuhi nilai minimum

Support. Pada listbox akan ditampilkan No Itemset, Nama Itemset, Count dan

Support dari itemset tersebut.

69

Page 70: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB IV

IMPLEMENTASI DATA MINING

Pada saat program pertama kali dijalankan maka akan tampil form seperti

pada gambar dibawah ini:

Gambar 4.1. Form Welcome

Pada form diatas terdapat menu File, Window, Help. Menu File terdiri dari

beberapa submenu yaitu Program Apriori (menu untuk menampilkan Form

Input), Close (menu untuk menutup suatu form yang sedang aktif), Keluar (menu

untuk keluar dari program). Menu Window terdiri dari submenu antara lain

70

Page 71: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Hide (menu untuk menyembunyikan form yang aktif), dan terdapat submenu

untuk menampilkan form yang telah ditampilkan. Menu Help terdiri dari

submenu Daftar Istilah (menu untuk menampilkan istilah-istilah yang terdapat

dalam program serta terdapat beberapa keterangan mengenai program) dan

tentang pembuat. Pengguna dapat memilih salah satu menu atau dapat langsung

menekan tombol Lanjut atau dapat juga dapat menekan tombol Help yang

terdapat pada form untuk mengetahui segala sesuatu tentang program terlebih

dahulu. Jika pengguna menekan tombol Lanjut, maka program akan

menampilkan Form Input seperti gambar dibawah ini.

Gambar 4.2. Form Input

71

Page 72: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Pada form ini, jika pengguna menekan tombol Tambah Dataset maka akan

muncul Open dialog box yang akan menyajikan tabel baru yang akan

dimasukkan ke dalam database. Tombol Pilih Dataset maka combo box akan

menampilkan tabel-tabel yang ada dalam database. Apabila pengguna menekan

Reset, maka program mengosongkan textbox Minimum Support dan textbox

Minimum Confidence. Setelah pengguna memasukkan nilai minimum support

dan minimum confidence penekanan tombol Lanjut akan menampilkan form

Dataset seperti pada gambar dibawah ini :

Gambar 4.3. Form Dataset

72

Page 73: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Apabila pengguna menekan tombol Proses Apriori maka akan muncul

Form Candidate 1_Itemset seperti gambar dibawah ini :

Gambar 4.4. Form Candidate 1_Itemset

Tombol TAMPIL CANDIDATE 1_ITEMSET untuk menampilkan nama

kandidat 1_itemset, count (jumlah kejadian) dan nilai support masing-masing

kandidat 1_itemset yang pada listbox. Berikut ini listing program untuk mencari

kandidat 1_itemset, jumlah kejadian dan supportnya :

73

&&mendapatkan jumlah matakuliah pada tabel mahasiswa2SELECT count(distinct(mtk))as jml FROM mahasiswa2 INTO CURSORjum

&&itemset : jumlah matakuliah thisform.text1.Value = jum.jml

&&mendapatkan jumlah mahasiswa dari tabel mahasiswaSELECT count(distinct(nim)) as N FROM mahasiswa2 INTO CURSORjumNPUBLIC jumlahMahasiswajumlahMahasiswa=jumN.N

Page 74: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

&&mendapatkan matakuliah pada tabel mahasiswa2SELECT distinct(mtk)as matakuliah FROM mahasiswa2 INTO CURSOR mtk

&&index:index semua itemset(matakuliah beserta nilainya)PUBLIC indexindex=0

&&mencari support tiap item FOR i=1 TO jum.jml

GO i IN mtkRELEASE jumB index=index+1itemset(index,1)= mtk.matakuliahSELECT count(*) as jmlB from mahasiswa2 WHERE ALLTRIM(upper

(mtk))==ALLTRIM(UPPER(mtk.matakuliah));INTO CURSOR jumBitemset(index,2)= jumB.jmlB &&jumlah kejadianitemset(index,3)= jumB.jmlB/jumN.N &&support

Berikut ini listing program untuk menampilkan candidate 1_itemset pada

listbox :

&& inisialisasi list yang akan dipakai untuk menampilkan itemsetTHISFORM.container2.list1.clearTHISFORM.container2.list1.ColumnCount = 5THISFORM.container2.list1.ColumnLines = .f.THISFORM.container2.list1.Columnwidths = "60,250,40,100,70"

&&menampilkan semua itemset ke list FOR kol= 1 TO index

THISFORM.container2.list1.AddListItem(str(kol), kol,1)THISFORM.container2.list1.AddListItem(itemset(kol,1),kol,2)*THISFORM.container2.list1.AddListItem(itemset(kol,2),

kol,3)THISFORM.container2.list1.AddListItem(STR(itemset(kol,2)), kol,4)THISFORM.container2.list1.AddListItem(STR(itemset(kol,3),4,2), kol,5)

ENDFOR

Selama proses pencarian candidate 1_itemset berlangsung akan muncul

form Loading seperti gambar dibawah ini :

74

Gambar 4.5. Form Loading

Page 75: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form Loading akan hilang apabila proses pencarian kandidat 1_itemset

telah selesai dan semua candidate 1_itemset telah ditampilkan pada listbox.

Form Loading ini juga akan muncul apabila proses-proses lain berlangsung.

Setelah semua kandidat 1_itemset telah tampil selanjutnya pengguna harus

menekan tombol PRUNNING. Setelah itu akan muncul secara bersamaan form

Frequent 1_Itemset, form Infrequent 1_Itemset (Gambar 4.5) serta form Loading.

Form Frequent 1_Itemset terdiri dari sebuah listbox yang menampilkan frequent

1_itemset yang memenuhi minimum support sedangkan pada form Infrequent

1_Itemset terdiri dari sebuah listbox yang menampilkan kandidat 1_itemset yang

tidak memenuhi minimum support. Itemset yang dipakai untuk pembentukan

aturan adalah frequent 1_itemset yang tampil di listbox pada form Frequent

1_Itemset. Pada form Frequent 1_Itemset terdapat tombol Simpan yang berfungsi

untuk menyimpan Frequent 1_Itemset dalam bentuk dbf.

75

Gambar 4.6. Form Frequent 1_Itemset dan Form Infrequent

Page 76: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Listing program untuk proses prunning adalah sebagai berikut:

Listing program untuk menyimpan frequent 1_itemset adalah sebagai

berikut:

gcDelimName = '.dbf'gcDelimFile = PUTFILE('File Name:', gcDelimName, 'dbf')

76

PUBLIC form_dftr_ya_minsupPUBLIC no_minsupDO FORM form_prunning_itemset1 NAME no_minsupDO FORM form_itemset1 NAME form_dftr_ya_minsup

&&inisialisasi list yg terdapat pd form Infrequent 1_Itemsetno_minsup.list1.clearno_minsup.list1.ColumnCount = 5no_minsup.list1.ColumnLines = .f.no_minsup.list1.Columnwidths = "60,250,40,100,70"no_minsup.list1.Sorted = .T.

&&inisialisasi list yg terdapat pd form frequent 1_Itemsetform_dftr_ya_minsup.list1.clearform_dftr_ya_minsup.list1.ColumnCount = 5form_dftr_ya_minsup.list1.ColumnLines = .f.form_dftr_ya_minsup.list1.Columnwidths = "60,250,40,100,70"form_dftr_ya_minsup.list1.Sorted = .T.

&&index2: index itemset yang memenuhi minsupPUBLIC index2 index2=0kol=0&&dan tidak memenuhi minsup pada list dalam formFOR i=1 TO index IF itemset(i,3)>= minsup

index2=index2+1 itemset2(index2,1)= itemset(i,1) &&itemset itemset2(index2,3)= itemset(i,2) &&jumlah kejadian itemset2(index2,4)= itemset(i,3) &&support

&&menampilkan itemset yg memenuhi minsup form_dftr_ya_minsup.list1.AddListItem(str(index2), index2,1)

form_dftr_ya_minsup.list1.AddListItem(itemset(i,1),index2,2) form_dftr_ya_minsup.list1.AddListItem(STR(itemset(i,2)),

index2,4)form_dftr_ya_minsup.list1.AddListItem(STR(itemset(i,3),4,2),

index2,5) ELSE &&menampilkan itemset yg tidak memenuhi minsup kol=kol+1 no_minsup.list1.AddListItem(str(kol), kol,1) no_minsup.list1.AddListItem(itemset(i,1),kol,2) no_minsup.list1.AddListItem(STR(itemset(i,2)), kol,4) no_minsup.list1.AddListItem(STR(itemset(i,3),4,2),

kol,5) ENDIF

ENDFOR

Page 77: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

*mencari nama file table sajapos=RAT("\",gcDelimFile)+1 &&cari nama file setelah namapathnyapos3=RAT("\",gcDelimFile,2)+1nama_direktori_terakhir=SUBSTR(gcDelimFile,pos3,((pos-pos3)-1))table_baru2=SUBSTR(gcDelimFile,pos)pos2=RAT(".",table_baru2)-1 &&menghilangkan ekstensinya tableBaru=LEFT(table_baru2,pos2)CREATE TABLE &tableBaru (No_Item i(8) primary key,Nama_item c(35),Jmlkjadian i(5),Support f(4,2))FOR x=1 TO thisform.list1.ListCount

nit=VAL(thisform.list1.listitem(x,1))nait=thisform.list1.listitem(x,2)jum=VAL(thisform.list1.listitem(x,4))sup=VAL(thisform.list1.listitem(x,5))

insert into &tableBaru (No_Item, Nama_item,Jmlkjadian ,Support);VALUES (nit,nait,jum,sup)ENDFOR

Apabila tidak terdapat frequent 1_itemset yang memenuhi minimum

support maka pada program akan muncul pesan seperti dibawah ini :

Gambar 4.7. Pesan 1

Kemudian setelah pengguna menekan OK akan muncul pesan lagi seperti

dibawah ini :

Apabila pengguna menekan Yes maka akan muncul form Input, jika

menekan No maka program berhenti pada form Candidate 1_Itemset.

77

Gambar 4.8. Pesan2

Page 78: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Setelah proses Prunning selesai untuk melanjutkan proses selanjutnya

pengguna harus menekan tombol , maka akan muncul Form Frequent Itemset

seperti pada Gambar 4.9.

Pada form ini setelah pengguna menekan tombol TAMPIL FREQUENT

ITEMSET maka pada listbox akan muncul frequent itemset dengan jumlah

itemset lebih dari 1 dan frequent itemset tersebut merupakan frequent itemset

yang memenuhi minimum support. Pada listbox bagian bawah akan muncul

keterangan anggota dari frequent itemset tersebut. Apabila salah satu baris pada

listbox bagian atas oleh pengguna didouble klik maka pada listbox keterangan

akan tersorot anggota frequent itemset pada listbox bagian atas yang ditunjuk

oleh pengguna. Dibawah ini akan ditunjukkan contohnya :

78

ATAS

BAWAH

Gambar 4.9. Form Frequent Itemset

Page 79: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Tabel 4.1. Listbox Frequent Itemset No FreqItemset

Jumlah Itemset Count Support

1 2 75 0.532 2 73 0.52

Tabel 4.2 Listbox Keterangan Frequent Itemset

No No FreqItemset

No Freq1_Itemset

1 1 32 1 43 2 44 2 11

Pada tabel 4.1 terlihat bahwa No Freq Itemset 1 mempunyai Jumlah

Itemset sebanyak 2. Pasangan yang dimaksud dapat dilihat pada tabel 4.2. Pada

tabel dapat diketahui bahwa No Freq Itemset 1 terdiri dari Freq 1_Itemset dengan

no 3 dan no 4. Untuk mengetahui frequent itemset yang dimaksud dapat dilihat

pada form Frequent Itemset_1. Apabila tidak terdapat frequent itemset maka

akan muncul pesan 1 dan pesan 2.

Listing program yang terdapat pada tombol TAMPIL FREQUENT

ITEMSET adalah sebagai berikut:

PUBLIC lodi&& menampilkan form loading sekaligus menjadikan sbg objekDO FORM form_loading NAME lodi

&&inisialisasi list item yg telah dipasang2kan (hidden)THISFORM.container2.list1.clearTHISFORM.container2.list1.ColumnCount = 3THISFORM.container2.list1.ColumnLines = .f.THISFORM.container2.list1.Columnwidths = "90,90,90"

&&inisialisasi list untuk menampilkan jumlah pasangan dansuppportTHISFORM.container3.list1.clearTHISFORM.container3.list1.ColumnCount = 4THISFORM.container3.list1.ColumnLines = .f.THISFORM.container3.list1.Columnwidths = "130,100,110,100"

79

Page 80: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

&&inisialisasi list untuk menampilkan keteranganTHISFORM.container4.list2.clearTHISFORM.container4.list2.ColumnCount = 3THISFORM.container4.list2.ColumnLines = .f.THISFORM.container4.list2.Columnwidths = "90,90,90"

---------------pasangan 2 item -----------------------------*PUBLIC pisspiss=0 &&indeks keterangan frequent itemsetkol=0 && no pasangan

FOR i=1 TO index2FOR j=i+1 TO index2

*MENCARI JUMLAH KEJADIAN 2 ITEM

*inisialisasi variabel penyimpan sementaraRELEASE data_mhs,data_mhs2

*mendapatkan item yg pertamaSELECT nim FROM mahasiswa2 ;

WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(i,1)));INTO CURSOR data_mhs*mendapatkan item yg keduaSELECT nim FROM mahasiswa2 ;

WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(j,1)));INTO CURSOR data_mhs2

jum_mhs=0 &&jumlah mhs yg mempunyai 2 item yg muncul bersamaanFOR x=1 TO RECCOUNT('data_mhs')

FOR y=1 TO RECCOUNT('data_mhs2')*menyimpan nim mhs yg termasuk dlm cursor data_mhs kedalam nim1

GO x IN data_mhsnim1=data_mhs.nim

*menyimpan nim mhs yg termasuk dlm cursor data_mhs2 kedalam nim2GO y IN data_mhs2nim2=data_mhs2.nim*jika nim sama maka jumlah mhs bertambahIF nim1=nim2

jum_mhs=jum_mhs+1ENDIF

ENDFOR ENDFOR

*menghitung support pasangan 2 itemsup=jum_mhs/jumlahMahasiswa

*membentuk pasangan-pasangan item IF sup>=minsup

kol=kol+1THISFORM.container2.list1.AddListItem(str(kol), kol,1)

THISFORM.container2.list1.AddListItem(STR(i),kol,2)piss=piss+1

THISFORM.container4.list2.AddListItem(str(piss), piss,1)

80

Page 81: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(i), piss,3)THISFORM.container2.list1.AddListItem(STR(j),kol,3)piss=piss+1

THISFORM.container4.list2.AddListItem(str(piss), piss,1)THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(j), piss,3) THISFORM.container3.list1.AddListItem(str(kol), kol,1)THISFORM.container3.list1.AddListItem(STR(2),kol,2)THISFORM.container3.list1.AddListItem(STR(jum_mhs),kol,3)THISFORM.container3.list1.AddListItem(STR(sup,5,2),kol,4) ENDIF ENDFOR

ENDFOR

*-------------------------pasangan > 2----------------------*awl=1akhr=koljum_pas=3DO WHILE jum_pas<=index2

FOR i=awl TO akhrFOR j=VAL(thisform.container2.list1.ListItem(i,3))+1 TO index2

qq=0THISFORM.list3.clearTHISFORM.list3.ColumnCount = 2THISFORM.list3.ColumnLines = .f.THISFORM.list3.Columnwidths = "90,90"qq=qq+1THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(j), qq,2)

RELEASE data_mhs2DIMENSION mhs(jumlahMahasiswa),mhs2(jumlahMahasiswa)

SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(j,1)));

INTO CURSOR data_mhs2FOR p=1 TO RECCOUNT('data_mhs2')

GO p IN data_mhs2mhs(p)=data_mhs2.nim

ENDFOR jum_kej=RECCOUNT('data_mhs2')jum_pas_akar=VAL

(thisform.container3.list1.ListItem(i,2))no_item=VAL(thisform.container2.list1.ListItem(i,2))no_item2=VAL(thisform.container2.list1.ListItem(i,3))

DO WHILE jum_pas_akar>2qq=qq+1THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(no_item2), qq,2)

81

Page 82: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

RELEASE data_mhs2SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2

(no_item2,1)));INTO CURSOR data_mhs2

IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')

FOR o=1 TO jum_kejGO k IN data_mhs2IF mhs(o)=data_mhs2.nim

jum_mhs=jum_mhs+1mhs2(jum_mhs)=mhs(o)ENDIF

ENDFOR ENDFOR jum_kej=jum_mhsFOR k=1 TO jum_mhs

mhs(k)=mhs2(k)ENDFOR

ELSE jum_kej=0

ENDIF jum_pas_akar=VAL

(thisform.container3.list1.ListItem(no_item,2))nm=no_itemno_item=VAL(thisform.container2.list1.ListItem(nm,2))no_item2=VAL(thisform.container2.list1.ListItem(nm,3))

ENDDO IF jum_pas_akar=2 qq=qq+1 THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(no_item2), qq,2) qq=qq+1 THISFORM.list3.AddListItem(str(qq), qq,1) THISFORM.list3.AddListItem(STR(no_item), qq,2)

RELEASE data_mhs2SELECT nim FROM mahasiswa2 ;

WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(no_item,1)));INTO CURSOR data_mhs2

IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')

82

Page 83: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

FOR o=1 TO jum_kejGO k IN data_mhs2IF mhs(o)=data_mhs2.nim

jum_mhs=jum_mhs+1mhs2(jum_mhs)=mhs(o)ENDIF

ENDFOR ENDFOR FOR k=1 TO jum_mhs

mhs(k)=mhs2(k)ENDFOR jum_kej=jum_mhsRELEASE data_mhs2

SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(no_item2,1)));INTO CURSOR data_mhs2

IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')

FOR o=1 TO jum_kejGO k IN data_mhs2

IF mhs(o)=data_mhs2.nimjum_mhs=jum_mhs+1

mhs2(jum_mhs)=mhs(o) ENDIF

ENDFOR ENDFOR

jum_kej=jum_mhssup=jum_kej/jumlahMahasiswa

ELSEjum_kej=0sup=0

ENDIF ELSE

jum_kej=0sup=0

ENDIF ENDIF IF sup>=minsup

kol=kol+1THISFORM.container2.list1.AddListItem(str(kol), kol,1)THISFORM.container2.list1.AddListItem(STR(i),kol,2)THISFORM.container2.list1.AddListItem(STR(j),kol,3)THISFORM.container3.list1.AddListItem(str(kol), kol,1)THISFORM.container3.list1.AddListItem(STR(jum_pas),kol,2)THISFORM.container3.list1.AddListItem(STR(jum_kej),kol,3)THISFORM.container3.list1.AddListItem(STR(sup,5,2),kol,4)

83

Page 84: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

g=qqDO WHILE g>=1

no_it=VAL(thisform.list3.ListItem(g,2))piss=piss+1

THISFORM.container4.list2.AddListItem(str(piss), piss,1)THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(no_it), piss,3) g=g-1

ENDDO ENDIF

ENDFOR ENDFOR awl=akhrakhr=koljum_pas=jum_pas+1

ENDDO lodi.release()

Apabila pengguna menekan tombol DETAIL maka akan muncul form

Candidate Itemset yang akan menampilkan semua kombinasi frequent 1_itemset

seperti gambar di bawah ini :

84

Gambar 4.10. Form Candidate Itemset

Page 85: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Form ini akan menampilkan semua kombinasi frequent 1_itemset yang

mungkin terjadi. Untuk melanjutkan proses pengguna harus kembali ke form

Frequent Itemset.

Setelah pengguna mengklik tombol LANJUT pada form Frequent Itemset

maka akan muncul form Semua Rule seperti gambar di bawah ini :

Pada form Semua Rule ini pengguna akan menekan tombol Tampil Semua

Rule maka akan muncul semua aturan asosiasi yang terbentuk. Aturan tersebut

ditampilkan pada 2 buah listbox yaitu listbox anteseden yang terletak paling kiri

dan listbox konsekuen yang terletak di tengah. Sedangkan pada listbox yang

paling kanan merupakan listbox yang berisi nilai confidence tiap aturan.

Listing program untuk menampilkan aturan yang terdiri dari 2 item :

85

Gambar 4.11. Form Semua Rule

Page 86: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

*--------menyimpan sementara itemnya FOR j=1 TO jumPasYaMinsupnoPas=VAL(thisform.list5.ListItem(j))IF VAL(form_cari_sup.container3.list1.ListItem(noPas,2))=2

RELEASE sem2 DIMENSION sem2(2)oo=0FOR i=1 TO piss

IF VAL(form_cari_sup.container4.list2.ListItem(i,2))=noPasoo=oo+1 sem2(oo)=VAL

(form_cari_sup.container4.list2.ListItem(i,3))ENDIF

ENDFOR it=sem2(1)di=sem2(2)

*------------NAMPILIN RULE 1 ITEM-----------------*antesedennoRule=noRule+1kol_ante=kol_ante+1

THISFORM.list1.AddListItem(str(noRule), kol_ante,1) THISFORM.list1.AddListItem(STR(noPas),kol_ante,2)THISFORM.list1.AddListItem(STR(it),kol_ante,3)

*konsekuenkol_konse=kol_konse+1

THISFORM.list2.AddListItem(str(noRule), kol_konse,1) THISFORM.list2.AddListItem(STR(noPas),kol_konse,2)THISFORM.list2.AddListItem(STR(di),kol_konse,3)

*hitung confidence con=VAL(form_cari_sup.container3.list1.ListItem(noPas,4))/itemset2(it,4)

kol_con=kol_con+1THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(noPas),kol_con,2)THISFORM.list3.AddListItem(STR(con,5,2),kol_con,4) ENDIF

ENDFOR

Listing program untuk menampilkan rule yang terdiri dari 3 item :

* jika rule terdiri dari 3 itemIF jum_item=3

DIMENSION array_item[jum_item]&&-----------nyimpen item yang 3pasang--------------

ind=0FOR j=1 TO thisform.list7.ListCount

IF VAL(thisform.list7.listitem(j,2))= no_pasind=ind+1

array_item[ind]=thisform.list7.listitem(j,3)ENDIF

ENDFOR &&---nampilin anteseden-----FOR k=1 TO ind

noRule=noRule+1kol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),

kol_ante,1) thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(array_item[k],kol_ante,3)

86

Page 87: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

*----------nampilin support yg antesedenya 1-----FOR vv=1 TO form_dftr_ya_minsup.list1.listcount

IF VAL(array_item[k])=VAL(form_dftr_ya_minsup.list1.listitem(vv,1))

jj=jj+1supp=form_dftr_ya_minsup.list1.listitem(vv,5)thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)

*---------------nyari confidence-----------------cof=VAL(supp_pas)/VAL(supp)

kol_con=kol_con+1*--------------nampilin confidencenya----

THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)THISFORM.list3.AddListItem(supp_pas, kol_con,3)THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)

ENDIF ENDFOR

*-----------------------------------------------------ee=array_item[k]FOR l=1 TO ind

IF VAL(array_item[l]) != val(ee)kol_konse=kol_konse+1

*----nampilin konsekuennyathisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(array_item[l],kol_konse,3)

ENDIF ENDFOR

ENDIF ENDIF

ENDFOR &&-----nyimpen kombinasi 2 item-------------FOR s=1 TO ind

FOR t=s+1 TO indop=0DIMENSION pas2[2]noRule=noRule+1op=op+1pas2[op]=array_item[s]kol_ante=kol_ante+1

thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(pas2[op],kol_ante,3)

op=op+1pas2[op]=array_item[t]

&&----nampilin support yang anteseny 2-------FOR gm=1 TO form_cari_sup.container3.list1.listcountIF VAL(form_cari_sup.container3.list1.listitem(gm,2))=op

87

Page 88: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

total_sama=0 FOR mg=1 TO form_cari_sup.container4.list2.listcount IF VAL(form_cari_sup.container4.list2.listitem(mg,2))= gm

sama=0FOR sip=1 TO op

IF VAL(pas2[sip])=VAL(form_cari_sup.container4.list2.listitem(mg,3)) sama=sama+1

ENDIFENDFOR IF sama>0

total_sama=total_sama+1ENDIF

ENDIFENDFOR

IF total_sama=opjj=jj+1

supp=form_cari_sup.container3.list1.listitem(gm,4thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)

*hitung confidence rule yg antesedenya 2 itemcof=VAL(supp_pas)/VAL(supp)

*nampilin confidencenyakol_con=kol_con+1

THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)

THISFORM.list3.AddListItem(supp_pas, kol_con,3) THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)

ENDIF ENDIF

ENDFOR *-------------------------------------------------------

*nampilin anteseden yang terdiri dari 2 itemkol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),kol_ante,1

thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(pas2[op],kol_ante,3)

FOR x=1 TO indsama=0FOR z=1 TO op

IF VAL(array_item[x])=VAL(pas2[z])sama=sama+1

ENDIF ENDFORIF sama<1

*nampilin konsekuen yang terdiri dari 2 itemkol_konse=kol_konse+1

thisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(array_item[x],kol_konse,3)

ENDIF ENDFOR

ENDFOR ENDFOR

ENDIF

88

Page 89: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Untuk menampilkan aturan yang terdiri dari 4 item, proses awalnya sama

dengan yang untuk menampilkan 3 item hanya saja membutuhkan listbox

bantuan untuk menampung sementara antesedennya:

*---anteseden bantuan---* RELEASE pas2 DIMENSION pas2[3] op=0

FOR km=1 TO ind9IF km<=1

noRule=noRule+1kol_ante=kol_ante+1

thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)

thisform.list1.AddListItem(THISFORM.List9.ListItem(km,3),kol_ante,3)

*----------op=op+1pas2[op]=THISFORM.List9.ListItem(km,3)*----------ELSE

IF VAL(THISFORM.List9.ListItem(km,1))= VAL(THISFORM.List9.ListItem(km-1,1))

ELSEnoRule=noRule+1RELEASE pas2

DIMENSION pas2[3] op=0

ENDIF*-------nampilin support yang antesedeny 3-----

FOR gm=1 TOform_cari_sup.container3.list1.listcount

IF VAL(form_cari_sup.container3.list1.listitem(gm,2))=optotal_sama=0

FOR mg=1 TOform_cari_sup.container4.list2.listcount

IF VAL(form_cari_sup.container4.list2.listitem(mg,2))= gmsama=0FOR sip=1 TO op

IF VAL(pas2[sip])=VAL(form_cari_sup.container4.list2.listitem(mg,3))sama=sama+1

ENDIFENDFOR

IF sama>0total_sama=total_sama+1

ENDIFENDIF

ENDFORIF total_sama=op

jj=jj+1supp=form_cari_sup.container3.list1.listitem(gm,4)

thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)

cof=VAL(supp_pas)/VAL(supp)

89

Page 90: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

kol_con=kol_con+1THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)THISFORM.list3.AddListItem(supp_pas, kol_con,3) THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)

ENDIF ENDIF

ENDFOR*-------------------------------------------------

kol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)

thisform.list1.AddListItem(THISFORM.List9.ListItem(km,3),kol_ante,3)op=op+1pas2[op]=THISFORM.List9.ListItem(km,3)

ENDIFFOR km2=1 TO ind6

IF VAL(THISFORM.List6.ListItem(km2,1))=VAL(THISFORM.List9.ListItem(km,1))kol_konse=kol_konse+1

thisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(THISFORM.List6.ListItem(km2,3),kol_konse,3ENDIF

ENDFOR ENDFOR ENDIF ENDFOR

lodi.release()thisform.text1.Value=thisform.list3.ListCount

Setelah semua proses menampilkan semua aturan telah selesai kemudian

pengguna harus menekan tombol ASSOCIATION RULE untuk melakukan

proses selanjutnya. Kemudian akan tampil form Strong association rule ( gambar

4.10). Dalam form tersebut akan ditampilkan aturan asosiasi yang memenuhi

minimum confidence sering disebut aturan asosiasi yang kuat (Strong

Association Rule) Dalam form ini terdapat 3 buah listbox untuk menampilkan

nilai confidence , anteseden, konsekuen tiap aturan. Tombol Simpan untuk

menyimpan aturan yang terbentuk serta nilai confidencenya. Proses penyimpanan

90

Page 91: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

dilakukan 3 kali. Pertama menyimpan nilai confidence, kemudian anteseden lalu

yang terakhir konsekuen. Hasil penyimpanan dalam bentuk .dbf.

Form Daftar Istilah akan menampilkan istilah-istilah yang terdapat pada

program. Tampilannya dapat dilihat pada gambar dibawah ini :

91

Gambar 4.12. Form Aturan Asosiasi Yang Terbentuk

Page 92: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Dibawah ini adalah form tentang pembuat :

BAB V

ANALISA HASIL DAN PEMBAHASAN

92

Gambar 4.13. Form Daftar Istilah

Gambar 4.14. Form About

Page 93: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

A. Percobaan Jenis I

Dari program yang telah dibuat kemudian dilakukan percobaan jenis I dengan

pada 2 buah dataset dengan menginputkan nilai minimum support berkisar 0.3 sd

0.6.5 dan minimum confidence 0.5.

1. Percobaan dengan Dataset I

Dataset I merupakan dataset nilai akademik mahasiswa yang dinyatakan

berhasil dengan nilai tiap matakuliah A atau B. Pada Dataset I ini input minimum

support hanya berkisar 0.4 s.d 0.65 karena dengan minimum support yang lebih kecil

aturan asosiasi yang dihasilkan sangat banyak dan hasilnya kurang begitu bermakna.

Contoh format Dataset I adalah sebagai berikut :

Nim Kode _mtk Mtk Nilai 2101 MAK 205 Struktur Data A2101 MAK 103 Algoritma dan Pemrograman I B2101 MAK 104 Algoritma Dan Pemrograman II B2101 MAK 209 Basis Data I B2101 MAK 221 Grafika Komputer Lanjut B2101 MAK 411 Kompresi Data B2101 MAK 413 Konsep Bahasa Pemrograman B2101 MAK 313 Pemrosesan Citra B2101 MAK 301 Rekayasa Perangkat Lunak II B2101 MAK 214 Sistem Cerdas B2101 MAK 418 Teknologi Multimedia B2102 MAK 217 Analisis Algoritma A2102 MAK 209 Basis Data I A2102 MAK 309 Robotika A2102 MAK 104 Algoritma Dan Pemrograman II B2102 MAK 406 Algoritma Genetika B2102 MAK 303 Basis Data II B2102 MAK 413 Konsep Bahasa Pemrograman B2102 MAK 210 Pengantar Grafika Komputer & Multimedia B2102 MAK 416 Pengenalan Pola B2102 MAK 215 Rekayasa Perangkat Lunak I B2102 MAK 301 Rekayasa Perangkat Lunak II B2102 MAK 214 Sistem Cerdas B2102 MAK 205 Struktur Data B

93

Tabel 5.1 Contoh format Dataset I

Page 94: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

dst dst dst dst

a). Percobaan I.1.a

Minimum Support : 0.4

Menghasilkan frequent 1_itemset yang terdiri dari 16 itemset yaitu sebagai

berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Algoritma dan Pemrograman II} 50 0.363. {Analisis Algoritma} 96 0.704. {Basis Data I} 47 0.345. {Basis Data II} 75 0.556. {Grafika Komputer Lanjut } 42 0.317. {Kompresi Data} 35 0.268. {Konsep Bahasa Pemrograman} 66 0.489. {Pemrograman Client Server} 74 0.5410. {Pengantar Grafika Komputer & Multimedia} 105 0.7711. {Rekayasa Perangkat Lunak I} 54 0.3912. {Rekayasa Perangkat Lunak II} 50 0.3613. {Sistem Basis Data Terdistribusi} 41 0.3014. {Sistem Cerdas} 91 0.6615. {Struktur Data} 79 0.5816. {Teknologi Multimedia} 47 0.34

Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset dan frequent

3_itemset sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 63 0.462.

{1,6} 68 0.50

3. {1,7} 56 0.41

94

Tabel 5.2 Frequent 1_itemset dengan minsup 0.4 pada dataset I

Tabel 5.3 Frequent 2_itemset dengan minsup 0.4 pada dataset I

Page 95: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

4. {2,3} 64 0.475. {2,5} 64 0.476. {2,6} 79 0.587. {2,7} 76 0.558. {2,8} 61 0.459. {3,6} 64 0.4710. {3,7} 63 0.4611. {3,8} 55 0.4012. {5,6} 60 0.4413. {5,7} 58 0.4214. {6,7} 74 0.5415. {6,8} 64 0.4716. {7,8} 61 0.45

No Frequent 3-itemset Count Support1. {1,2,6} 57 0.422. {2,3,7} 67 0.423. {2,6,7} 65 0.47

Pada percobaan ini iterasi berhenti pada frequent 3_itemset kemudian dari

frequent itemset di atas terbentuk aturan asosiasi yang kuat (strong association rule)

sebagai berikut :

No Aturan Aturan asosiasi Confidence

1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman II Algoritma dan Pemrograman I 0.663. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.874. Grafika Komputer Lanjut Algoritma dan Pemrograman I 0.655. Algoritma dan Pemrograman I Kompresi Data 0.716. Kompresi Data Algoritma dan Pemrograman I 0.627. Algoritma dan Pemrograman II Analisis Algoritma 0.678. Analisis Algoritma Algoritma dan Pemrograman II 0.869. Algoritma dan Pemrograman II Basis Data II 0.67

95

Tabel 5.5 Aturan asosiasi dengan minsup 0.4 dan minconf 0,5 pada dataset I

Tabel 5.4 Frequent 3_itemset dengan minsup 0.4 pada dataset I

Page 96: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

10. Basis Data II Algoritma dan Pemrograman II 0.8711. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.8312. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.7613. Algoritma dan Pemrograman II Kompresi Data 0.7814. Kompresi Data Algoritma dan Pemrograman II 0.8315. Algoritma dan Pemrograman II Konsep Bahasa Pemrograman 0.6416. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7817. Analisis Algoritma Grafika Komputer Lanjut 0.8618. Grafika Komputer Lanjut Analisis Algoritma 0.6119. Analisis Algoritma Kompresi Data 0.8420. Kompresi Data Analisis Algoritma 0.6921. Analisis Algoritma Konsep Bahasa Pemrograman 0.7322. Konsep Bahasa Pemrograman Analisis Algoritma 0.6923. Basis Data II Grafika Komputer Lanjut 0.8124. Grafika Komputer Lanjut Basis Data II 0.5725. Basis Data II Kompresi Data 0.7826. Kompresi Data Basis Data II 0.6327. Grafika Komputer Lanjut Kompresi Data 0.7028. Kompresi Data Grafika Komputer Lanjut 0.8129. Grafika Komputer Lanjut Konsep Bahasa Pemrograman 0.6130. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8231. Kompresi Data Konsep Bahasa Pemrograman 0.6832. Konsep Bahasa Pemrograman Kompresi Data 0.7833. Algoritma dan Pemrograman I Algoritma dan Pemrograman II &

Grafika Komputer Lanjut 0.72

34. Algoritma dan Pemrograman II Algoritma dan Pemrograman I &Grafika Komputer Lanjut

0.60

35. Grafika Komputer Lanjut Algoritma dan Pemrograman I &Algoritma dan Pemrograman II

0.55

36. Algoritma dan Pemrograman I & Algoritma dan Pemrograman II Grafika Komputer Lanjut

0.91

37. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II

0.84

38. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I

0.72

39. Algoritma dan Pemrograman II Analisis Algoritma & KompresiData

0.60

40. Analisis Algoritma Algoritma dan Pemrograman II & KompresiData

0.76

41. Kompresi Data Algoritma dan Pemrograman II&AnalisisAlgoritma

0.64

96

Page 97: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

42. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData

0.89

43. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma

0.76

44. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II

0.91

45. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data

0.67

46. Grafika Komputer Lanjut Algoritma dan Pemrograman II &Kompresi Data

0.61

47. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut

0.71

48. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data

0.81

49. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut

0.85

50. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II

0.87

Dari aturan asosiasi yang terbentuk terdapat beberapa aturan yang janggal

misalnya aturan Analisis Algoritma Grafika Komputer Lanjut, karena pada

kenyataannya matakuliah Analisa Algoritma diambil bersamaan dengan matakuliah

Grafika Komputer Lanjut. Hal itu diduga karena karena pola pada dataset bersifat

menyebar.

b). Percobaan I.1.b

Minimum support : 0.45

Menghasilkan frequent 1_itemset yang terdiri dari 8 itemset yaitu

sebagai berikut:

97

Page 98: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Konsep Bahasa Pemrograman} 66 0.485. {Pemrograman Client / Server} 74 0.546. {Pengantar Grafika Komputer dan Multimedia} 105 0.777. {Sistem Cerdas} 91 0.668. {Struktur Data} 79 0.58

Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset dan frequent

3_itemset sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 63 0.462.

{1,6} 68 0.50

3. {2,3} 64 0.474. {2,5} 64 0.475. {2,6} 79 0.586. {2,7} 76 0.557. {3,6} 64 0.478. {3,7} 63 0.469. {6,7} 74 0.5410. {6,8} 64 0.47

No Frequent 3-itemset Count Support 1. {2,6,7} 65 0.47

98

Tabel 5.6 Frequent 1_itemset dengan minsup 0.45 pada dataset I

Tabel 5.7 Frequent 2_itemset dengan minsup 0.45 pada dataset I

Tabel 5.8 Frequent 3_itemset dengan minsup 0.45 pada dataset I

Page 99: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Pada percobaan ini iterasi berhenti pada frequent 3_itemset kemudian dari

frequent itemset diatas terbentuk aturan asosiasi yang kuat (strong association rule)

sebagai berikut:

NoAturan

Aturan asosiasi Confidence

1 Algoritma dan Pemrograman I Analisis Algoritma 0.802 Analisis Algoritma Algoritma dan Pemrograman I 0.663 Algoritma dan Pemrograman I Pengantar Grafika

dan Multimedia0.87

4 Pengantar Grafika dan Multimedia Algoritma danPemrograman I

0.65

5 Analisis Algoritma Basis Data II 0.676 Basis Data II Analisis Algoritma 0.867 Analisis Algoritma Pemrograman Client/server 0.678 Pemrograman Client/server Analisis Algoritma 0.879 Analisis Algoritma Pengantar Grafika dan

Multimedia0.83

10 Pengantar Grafika dan Multimedia AnalisisAlgoritma

0.76

11 Analisis Algoritma Sistem Cerdas 0.7812 Sistem Cerdas Analisis Algoritma 0.8313 Basis Data II Pengantar Grafika dan Multimedia 0.8614 Pengantar Grafika dan Multimedia Basis Data II 0.6115 Basis Data II Sistem Cerdas 0.8416 Sistem Cerdas Basis Data II 0.6917 Pengantar Grafika dan Multimedia Sistem Cerdas 0.7018 Sistem Cerdas Pengantar Grafika dan Multimedia 0.8119 Pengantar Grafika dan Multimedia Struktur Data 0.6120 Struktur Data Pengantar Grafika dan Multimedia 0.8221 Analisis Algoritma Pengantar Grafika dan

Multimedia & Sistem Cerdas0.67

22 Pengantar Grafika dan Multimedia AnalisisAlgoritma & Sistem Cerdas

0.61

23 Sistem Cerdas Analisis Algoritma & PengantarGrafika dan Multimedia

0.71

24 Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas

0.81

99

Tabel 5.9 aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset I

Page 100: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

25 Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia

0.85

26 Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma

0.87

c). Percobaan I.1.c

Minimum support : 0.5

Menghasilkan frequent 1_itemset yang terdiri dari 7 itemset yaitu

sebagai berikut:

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Pemrograman Client / Server} 74 0.545. {Pengantar Grafika Komputer dan Multimedia} 105 0.776. {Sistem Cerdas} 91 0.667. {Struktur Data} 79 0.58

Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset sebagai

berikut :

No Frequent 2-itemset Count Support1. {2,5} 79 0.582.

{2,6} 76 0.55

3. {5,6} 74 0.54

Pada percobaan ini iterasi berhenti pada frequent 2_itemset kemudian dari

frequent itemset diatas terbentuk aturan asosiasi yang kuat (strong association rule)

sebagai berikut:

100

Tabel 5.10 Frequent 1_itemset dengan minsup 0.5 pada dataset I

Tabel 5.11 Frequent 2_itemset dengan minsup 0.5 pada dataset I

Tabel 5.12 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset I

Page 101: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

d). Percobaan I.1.d

Minimum support : 0.55

Menghasilkan frequent 1_itemset yang terdiri dari 6 itemset yaitu

sebagai berikut:

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Pengantar Grafika Komputer dan Multimedia} 105 0.775. {Sistem Cerdas} 91 0.666. {Struktur Data} 79 0.58

Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset sebagai

berikut :

No Frequent 2-itemset Count Support1. {2,4} 79 0.58

101

NoAturan

Aturan asosiasi Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia

Sistem Cerdas0.70

6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia

0.81

Tabel 5.13 Frequent 1_itemset dengan minsup 0.55 pada dataset I

Tabel 5.14 Frequent 2_itemset dengan minsup 0.55 pada dataset I

Page 102: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

2.

{2,5} 76 0.55

Dari frequent 1_itemset diatas dapat dibentuk strong association rule sebagai

berikut :

e). Percobaan I.1.e

Minimum Support : 0.6

Terdapat frequent 1_itemset sebanyak 3 yaitu sebagai berikut :

No Frequent 1-itemset Count Support1. {Analisis Algoritma} 96 0.702. {Pengantar Grafika Komputer dan Multimedia} 105 0.773. {Sistem Cerdas} 91 0.66

Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga

tidak akan terbentuk aturan asosiasi yang kuat karena sebuah aturan asosiasi

terbentuk dari paling sedikit 2 itemset.

f). Percobaan I.1.f

Minimum support: 0.65

102

NoAturan

Aturan asosiasi Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83

Tabel 5.16 Tabel frequent 1_itemset dengan minsup 0.6 pada dataset I

Tabel 5.15 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada dataset I

Page 103: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Terdapat frequent 1_itemset sebanyak 3 yaitu sebagai berikut :

No Frequent 1-itemset Count Support1. {Analisis Algoritma} 96 0.702. {Pengantar Grafika Komputer dan Multimedia} 105 0.773. {Sistem Cerdas} 91 0.66

Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga

tidak akan terbentuk aturan asosiasi yang kuat karena sebuah aturan asosiasi

terbentuk dari paling sedikit 2 itemset.

2. Percobaan dengan Dataset II

Pada percobaan ini dataset yang dipakai adalah nilai akademik mahasiswa

yang dinyatakan kurang berhasil dalam hal ini tiap matakuliah mendapat nilai

C,D,E,atau F. Pada Dataset II ini input minimum support berkisar 0.3 s.d

0.65. Contoh format Dataset II adalah sebagai berikut :

Nim Kode_mtk Mtk Nilai2114 MAK 103 Algoritma dan Pemrograman I C2114 MAK 104 Algoritma Dan Pemrograman II C2114 MAK 217 Analisis Algoritma C2114 MAK 303 Basis Data II C2114 MAK 411 Kompresi Data C2114 MAK 215 Rekayasa Perangkat Lunak I C2114 MAK 301 Rekayasa Perangkat Lunak II C2114 MAK 214 Sistem Cerdas C2114 MAK 205 Struktur Data C2114 MAK 209 Basis Data I D2115 MAK 417 Pemrosesan Bahasa Alami C2115 MAK 301 Rekayasa Perangkat Lunak II C2115 MAK 221 Grafika Komputer Lanjut D2115 MAK 219 Jaringan Syaraf Tiruan D

103

Tabel 5.17 Frequent 1_itemset dengan minsup 0.65 pada dataset I

Tabel 5.18 Contoh format Dataset II

Page 104: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

2115 MAK 413 Konsep Bahasa Pemrograman Fdst dst dst dst

a). Percobaan I.2.a

Minimum support : 0.3

Terdapat frequent 1_itemset sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Sistem Cerdas} 48 0.368. {Struktur Data} 62 0.46

Dari frequent 1_itemset diatas terbentuk frequent 2_itemset dan frequent 3_itemset

sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 52 0.392.

{1,3} 51 0.38

3. {1,5} 44 0.334. {2,3} 76 0.565. {2,4} 49 0.366. {2,5} 63 0.477. {2,6} 51 0.38

104

Tabel 5.19 Frequent 1_itemset dengan minsup 0.3 pada dataset II

Tabel 5.20 Frequent 2_itemset dengan minsup 0.3 pada dataset II

Page 105: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

8. {2,8} 54 0.409. {3,4} 50 0.3710. {3,5} 66 0.4911. {3,6} 57 0.4212. {3,8} 56 0.4113. {4,5} 42 0.3114. {5,6} 44 0.3315. {5,8} 43 0.32

No Frequent 3-itemset Count Support1. {1,2,3} 45 0.332. {2,3,4} 45 0.333. {2,3,5} 55 0.414. {2,3,6} 47 0.355. {2,3,8} 50 0.376. {3,5,8} 42 0.31

Dari frequent 2_itemset dan frequent 3_itemset terbentuk strong association rule

sebanyak 59 yaitu sebagai berikut :

NoAturan

Aturan Asosiasi Confidence

1 Algoritma dan Pemrograman I Algoritma danPemrograman II

0.85

2 Algoritma dan Pemrograman II Algoritma danPemrograman I

0.58

3 Algoritma dan Pemrograman I Basis Data I 0.834 Basis Data I Algoritma dan Pemrograman I 0.555 Algoritma dan Pemrograman I Rekayasa Perangkat

Lunak I0.72

6 Rekayasa Perangkat Lunak I Algoritma danPemrograman I

0.52

7 Algoritma dan Pemrograman II Basis Data I 0.838 Basis Data I Algoritma dan Pemrograman II 0.809 Algoritma dan Pemrograman II Basis Data II 0.5310 Basis Data II Algoritma dan Pemrograman II 0.8211 Algoritma dan Pemrograman II Rekayasa Perangkat

Lunak I0.70

105

Tabel 5.22 Aturan asosiasi dengan minsup 0.3 dan minconf 0,5 pada dataset II

Tabel 5.21 Frequent 3_itemset dengan minsup 0.3 pada dataset II

Page 106: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

12 Rekayasa Perangkat Lunak I Algoritma danPemrograman II

0.74

13 Algoritma dan Pemrograman II Rekayasa PerangkatLunak

0.56

14 Rekayasa Perangkat Lunak Algoritma danPemrograman II

0.72

15 Algoritma dan Pemrograman II Struktur Data 0.5916 Struktur Data Algoritma dan Pemrograman II 0.8717 Basis Data I Basis Data II 0.5318 Basis Data II Basis Data I 0.8519 Basis Data I Rekayasa Perangkat Lunak I 0.7020 Rekayasa Perangkat Lunak I Basis Data I 0.7721 Basis Data I Rekayasa Perangkat Lunak 0.6022 Rekayasa Perangkat Lunak Basis Data I 0.8023 Basis Data I Struktur Data 0.5924 Struktur Data Basis Data I 0.8925 Basis Data II Rekayasa Perangkat Lunak I 0.7126 Rekayasa Perangkat Lunak I Rekayasa Perangkat

Lunak0.52

27 Rekayasa Perangkat Lunak Rekayasa Perangkat LunakI

0.63

28 Rekayasa Perangkat Lunak I Struktur Data 0.5029 Struktur Data Rekayasa Perangkat Lunak I 0.7030 Algoritma dan Pemrograman I Algoritma dan

Pemrograman II & Basis Data I0.72

31 Algoritma dan Pemrograman I Basis Data I 0.8532 Algoritma dan Pemrograman I & Basis Data I

Algoritma dan Pemrograman II0.87

33 Algoritma dan Pemrograman II & Basis Data I Algoritma dan Pemrograman I

0.59

34 Basis Data II Algoritma dan Pemrograman II & BasisData I

0.75

35 Algoritma dan Pemrograman II & Basis Data I Basis Data II

0.59

36 Algoritma dan Pemrograman II & Basis Data IIBasis Data I

0.92

37 Basis Data I & Basis Data II Algoritma danPemrograman II

0.89

38 Algoritma dan Pemrograman II Basis Data I &Rekayasa Perangkat Lunak I

0.61

39 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I

0.59

106

Page 107: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

40 Rekayasa Perangkat Lunak I Algoritma danPemrograman II & Basis Data I

0.64

41 Algoritma dan Pemrograman II & Basis Data IRekayasa Perangkat Lunak I

0.73

42 Algoritma dan Pemrograman II & Rekayasa PerangkatLunak I Basis Data I

0.87

43 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II

0.84

44 Algoritma dan Pemrograman II Basis Data I &Rekayasa Perangkat Lunak II

0.52

45 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak II

0.50

46 Rekayasa Perangkat Lunak II Algoritma danPemrograman II & Basis Data I

0.66

47 Algoritma dan Pemrograman II & Basis Data IRekayasa Perangkat Lunak II

0.63

48 Algoritma dan Pemrograman II & Rekayasa PerangkatLunak II Basis Data I

0.92

49 Basis Data I &Rekayasa Perangkat Lunak II Algoritma dan Pemrograman II

0.83

50 Algoritma dan Pemrograman II Basis Data I &Struktur Data

0.55

51 Basis Data I Algoritma dan Pemrograman II &Struktur Data

0.53

52 Struktur Data Algoritma dan Pemrograman II & BasisData I

0.80

53 Algoritma dan Pemrograman II & Basis Data I Struktur Data

0.66

54 Algoritma dan Pemrograman II & Struktur Data Basis Data I

0.93

55 Basis Data I & Struktur Data Algoritma danPemrograman II

0.90

56 Struktur Data Basis Data I & Rekayasa PerangkatLunak I

0.67

57 Basis Data I & Rekayasa Perangkat Lunak I Struktur Data

0.63

58 Basis Data I & Struktur Data Rekayasa PerangkatLunak I

0.76

59 Rekayasa Perangkat Lunak I &Struktur Data Basis Data I

0.97

b). Percobaan I.2.b

107

Page 108: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Minimum Support : 0.35

Terbentuk frequent 1_itemset sebanyak 8 itemset yaitu sebagai berikut

:

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Sistem Cerdas} 48 0.368. {Struktur Data} 62 0.46

Kemudian dari frequent 1_itemset diatas terbentuk frequent 2_itemset dan

frequent 3_itemset yaitu sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 52 0.392.

{1,3} 51 0.38

3. {2,3} 76 0.564. {2,4} 49 0.365. {2,5} 63 0.476. {2,6} 51 0.387. {2,8} 54 0.408. {3,4} 50 0.379. {3,5} 66 0.4910. {3,6} 57 0.4211. {3,8} 56 0.41

No Frequent 3-itemset

Count Support

108

Tabel 5.23 Frequent 1_itemset dengan minsup 0.35 pada dataset II

Tabel 5.24 Frequent 2_itemset dengan minsup 0.35 pada dataset II

Tabel 5.25 Frequent 3_itemset dengan minsup 0.35 pada dataset II

Page 109: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

1. {2,3,5} 55 0.412. {2,3,6} 47 0.353. {2,3,8} 50 0.37

Dari frequent itemset diatas dapat dibentuk strong association rule sebanyak 34

sebagai berikut :

109

Page 110: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

110

No Aturan Aturan Asosiasi Confidence1 Algoritma dan Pemrograman I Algoritma dan

Pemrograman II0.85

2 Algoritma dan Pemrograman II Algoritma danPemrograman I

0.58

3 Algoritma dan Pemrograman I Basis Data I 0.834 Basis Data I Algoritma dan Pemrograman I 0.555 Algoritma dan Pemrograman II Basis Data I 0.836 Basis Data I Algoritma dan Pemrograman II 0.807 Algoritma dan Pemrograman II Basis Data II 0.538 Basis Data II Algoritma dan Pemrograman II 0.829 Algoritma dan Pemrograman II Rekayasa

Perangkat Lunak I0.70

10 Rekayasa Perangkat Lunak I Algoritma danPemrograman II

0.74

11 Algoritma dan Pemrograman II RekayasaPerangkat Lunak II

0.56

12 Rekayasa Perangkat Lunak II Algoritma danPemrograman II

0.72

13 Algoritma dan Pemrograman II Struktur Data 0.5914 Struktur Data Algoritma dan Pemrograman II 0.8715 Basis Data I Basis Data II 0.5316 Basis Data II Basis Data I 0.8517 Basis Data I Rekayasa Perangkat Lunak I 0.7018 Rekayasa Perangkat Lunak I Basis Data I 0.7719 Basis Data I Rekayasa Perangkat Lunak II 0.6020 Rekayasa Perangkat Lunak II Basis Data I 0.8021 Basis Data I Struktur Data 0.5922 Struktur Data Basis Data I 0.8923 Algoritma dan Pemrograman II Basis Data I &

Rekayasa Perangkat Lunak I0.61

24 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I

0.59

25 Rekayasa Perangkat Lunak I Algoritma danPemrograman II & Basis Data I

0.64

26 Algoritma dan Pemrograman II & Basis Data I Rekayasa Perangkat Lunak I

0.73

27 Algoritma dan Pemrograman II & RekayasaPerangkat Lunak I Basis Data I

0.87

28 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II

0.84

29 Algoritma dan Pemrograman II Basis Data I & 0.55

Tabel 5.26 Aturan asosiasi dengan minsup 0.35 dan minconf 0.5 pada datasetII

Page 111: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Percobaan I.2.c

Minimum support : 0.4

Terbentuk frequent 1_itemset sebanyak 7 itemset seperti berikut ini :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Struktur Data} 62 0.46

Kemudian terbentuk frequent 2_itemset dan frequent 3_itemset sebagai

berikut :

No Frequent 2-itemset Count Support1. {2,3} 76 0.562. {2,5} 63 0.473. {2,7} 54 0.404. {3,5} 66 0.495. {3,6} 57 0.426. {3,7} 56 0.41

No Frequent 3-itemset

Count Support

1. {2,3,5} 55 0.41

Dari frequent 2_itemset dan frequent 3_itemset diatas terbentuk aturan

asosiasi sebagai berikut :

111

Tabel 5.28 Frequent 2_itemset dengan minsup 0.4 pada dataset II

Tabel 5.29 Frequent 3_itemset dengan minsup 0.4 pada dataset II

Tabel 5.27 Frequent 1_itemset dengan minsup 0.4 pada dataset II

Page 112: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Noaturan

Aturan Asosiasi Confidence

1 Algoritma dan Pemrograman II Basis Data I 0.832 Basis Data I Algoritma dan Pemrograman II 0.803 Algoritma dan Pemrograman II Rekayasa

Perangkat Lunak I0.70

4 Rekayasa Perangkat Lunak I Algoritma danPemrograman II

0.74

5 Algoritma dan Pemrograman II Struktur Data 0.596 Struktur Data Algoritma dan Pemrograman II 0.877 Basis Data I Rekayasa Perangkat Lunak I 0.708 Rekayasa Perangkat Lunak I Basis Data I 0.779 Basis Data I Rekayasa Perangkat Lunak II 0.6010 Rekayasa Perangkat Lunak II Basis Data I 0.8011 Basis Data I Struktur Data 0.5912 Struktur Data Basis Data I 0.8913 Algoritma dan Pemrograman II Basis Data I &

Rekayasa Perangkat Lunak I0.61

14 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I

0.59

15 Rekayasa Perangkat Lunak I Algoritma danPemrograman II

0.64

16 Algoritma dan Pemrograman II & Basis Data I Rekayasa Perangkat Lunak I

0.73

17 Algoritma dan Pemrograman II & RekayasaPerangkat Lunak I Basis Data I

0.87

18 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II

0.84

c). Percobaan I.2.d

Minimum support : 0.45

Frequent 1_itemset yang terbentuk adalah sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I} 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Rekayasa Perangkat Lunak I} 86 0.64

112

Tabel 5.31 Frequent 1_itemset dengan minsup 0.45 pada dataset II

Tabel 5.30 Aturan asosiasi dengan minsup 0.4 dan minconf 0.5 pada dataset II

Page 113: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

5. {Rekayasa Perangkat Lunak II} 71 0.536. {Struktur Data} 62 0.46

Kemudian terbentuk frequent 2_itemset sebagai berikut :

Aturan asosiasi yang kuat yang terbentuk adalah sebanyak 6 aturan yaitu

sebagai berikut :

NoAturan

Aturan assosiasi Confidence

1 Algoritma dan Pemrograman II Basis Data I 0.832 Basis Data I Algoritma dan Pemrograman II 0.803 Algoritma dan Pemrograman II Rekayasa

Perangkat Lunak I0.70

4 Rekayasa Perangkat Lunak I Algoritma danPemrograman II

0.74

5 Basis Data I Rekayasa Perangkat Lunak I 0.706 Rekayasa Perangkat Lunak I Basis Data I 0.77

Percobaan I.2.e

Minimum support : 0.5

Frequent 1_itemset yang terbentuk adalah sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.644. {Rekayasa Perangkat Lunak II} 71 0.53

113

No Frequent 2-itemset Count Support1. {2,3} 76 0.562. {2,4} 63 0.473. {3,4} 66 0.49

Tabel 5.32 Frequent 2_itemset dengan minsup 0.45 pada dataset II

Tabel 5.34 Frequent 1_itemset dengan minsup 0.5 pada dataset II

Tabel 5.33 Aturan Asosiasi dengan minsup 0.45 dan minconf 0.5

Page 114: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Kemudian terbentuk frequent 2_itemset sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 76 0.56

Sehingga terbentuk strong association rule seperti pada tabel dibawah ini :

Noaturan

Aturan asosiasi Confidence

1 Algoritma dan Pemrograman II Basis DataI

0.83

2 Basis Data I Algoritma dan PemrogramanII

0.80

Percobaan I.2.f

Minimum support : 0.55

Frequent 1_itemset yang terbentuk adalah sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.64

Kemudian terbentuk frequent 2_itemset sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 76 0.56

114

Tabel 5.35 Frequent 2_itemset dengan minsup 0.5 pada dataset II

Tabel 5.36 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 padadataset II

Tabel 5.37 Frequent 1_itemset dengan minsup 0.55 pada dataset II

Tabel 5.38 Frequent 2_itemset dengan minsup 0.55 pada dataset II

Page 115: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Sehingga terbentuk aturan asosiasi seperti pada tabel dibawah ini :

Noaturan

Aturan asosiasi Confidence

1 Algoritma dan Pemrograman II BasisData I

0.83

2 Basis Data I Algoritma danPemrograman II

0.80

Percobaan I.2.g

Minimum support : 0.6

Frequent 1_itemset yang terbentuk adalah sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.64

Kemudian terbentuk frequent 2_itemset sebagai berikut :

No Frequent 2-itemset Count Support1. {1,2} 76 0.56

Sehingga terbentuk aturan asosiasi seperti pada tabel dibawah ini :

115

NoAturan

Aturan asosiasi Confidence

1 Algoritma dan Pemrograman II BasisData I

0.83

2 Basis Data I Algoritma danPemrograman II

0.80

Tabel 5.39 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 padadataset II

Tabel 5.40 Frequent 1_itemset dengan minsup 0.6 pada dataset II

Tabel 5.41 Frequent 2_itemset dengan minsup 0.6 pada dataset II

Tabel 5.42 Aturan asosiasi dengan minsup 0.6 dan minconf 0.5 padadataset II

Page 116: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Percobaan I.2.h

Minimum support : 0.65

Frequent 1_itemset yang terbentuk adalah sebagai berikut :

No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.70

Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga

tidak akan terbentuk aturan asosiasi.

B. Percobaan Jenis II

Pada percobaan jenis II ini penulis melakukan percobaan dengan mengubah

nilai minimum confidence antara 0.6 s.d 0.7, karena suatu aturan dirasa valid apabila

mempunyai nilai confidence (nilai kepastian 50%). Dalam percobaan ini dipakai

Dataset I nilai minimum support 0.4 s.d 0.55 karena pada rentang tersebut terbentuk

aturan asosiasi yang kuat.

1. Percobaan II.1

Minimum Support 0.4

a). Percobaan II.1a

Minimum Confidence 0.6

Aturan asosiasi yang terbentuk sebanyak 48 aturan sebagai berikut :

116

Tabel 5.43 Frequent 1_itemset dengan minsup 0.65 pada dataset II

Page 117: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

NoAturan

Aturan Confidence

1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman II Algoritma dan Pemrograman I 0.663. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.874. Grafika Komputer Lanjut Algoritma dan Pemrograman I 0.655. Algoritma dan Pemrograman I Kompresi Data 0.716. Kompresi Data Algoritma dan Pemrograman I 0.627. Algoritma dan Pemrograman II Analisis Algoritma 0.678. Analisis Algoritma Algoritma dan Pemrograman II 0.869. Algoritma dan Pemrograman II Basis Data II 0.6710. Basis Data II Algoritma dan Pemrograman II 0.8711. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.8312. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.7613. Algoritma dan Pemrograman II Kompresi Data 0.7814. Kompresi Data Algoritma dan Pemrograman II 0.8315. Algoritma dan Pemrograman II Konsep Bahasa Pemrograman 0.6416. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7817. Analisis Algoritma Grafika Komputer Lanjut 0.8618. Grafika Komputer Lanjut Analisis Algoritma 0.6119. Analisis Algoritma Kompresi Data 0.8420. Kompresi Data Analisis Algoritma 0.6921. Analisis Algoritma Konsep Bahasa Pemrograman 0.7322. Konsep Bahasa Pemrograman Analisis Algoritma 0.6923. Basis Data II Grafika Komputer Lanjut 0.8124. Basis Data II Kompresi Data 0.7825. Kompresi Data Basis Data II 0.6326. Grafika Komputer Lanjut Kompresi Data 0.7027. Kompresi Data Grafika Komputer Lanjut 0.8128. Grafika Komputer Lanjut Konsep Bahasa Pemrograman 0.6129. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8230. Kompresi Data Konsep Bahasa Pemrograman 0.6831. Konsep Bahasa Pemrograman Kompresi Data 0.7832. Algoritma dan Pemrograman I Algoritma dan Pemrograman II

& Grafika Komputer Lanjut 0.72

33. Algoritma dan Pemrograman II Algoritma dan Pemrograman I& Grafika Komputer Lanjut

0.60

117

Tabel 5.44 Aturan asosiasi dengan minsup 0.4 dan minconf 0.6 pada dataset I

Page 118: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

34. Algoritma dan Pemrograman I & Algoritma dan Pemrograman IIGrafika Komputer Lanjut

0.91

35. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II

0.84

36. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I

0.72

37. Algoritma dan Pemrograman II Analisis Algoritma &Kompresi Data

0.60

38. Analisis Algoritma Algoritma dan Pemrograman II &Kompresi Data

0.76

39. Kompresi Data Algoritma dan Pemrograman II&AnalisisAlgoritma

0.64

40. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData

0.89

41. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma

0.76

42. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II

0.91

43. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data

0.67

44. Grafika Komputer Lanjut Algoritma dan Pemrograman II &Kompresi Data

0.61

45. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut

0.71

46. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data

0.81

47. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut

0.85

48. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II

0.87

b). Percobaan II.1b

Minimum Confidence 0.7

Aturan asosiasi yang terbentuk sebanyak 34 aturan sebagai berikut :

118

Page 119: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

NoAtura

n

Aturan asosiasi Confidence

1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.873. Algoritma dan Pemrograman I Kompresi Data 0.714. Analisis Algoritma Algoritma dan Pemrograman II 0.865. Basis Data II Algoritma dan Pemrograman II 0.876. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.837. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.768. Algoritma dan Pemrograman II Kompresi Data 0.789. Kompresi Data Algoritma dan Pemrograman II 0.8310. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7811. Analisis Algoritma Grafika Komputer Lanjut 0.8612. Analisis Algoritma Kompresi Data 0.8413. Kompresi Data Analisis Algoritma 0.6914. Analisis Algoritma Konsep Bahasa Pemrograman 0.7315. Basis Data II Grafika Komputer Lanjut 0.8116. Basis Data II Kompresi Data 0.7817. Grafika Komputer Lanjut Kompresi Data 0.7018. Kompresi Data Grafika Komputer Lanjut 0.8119. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8220. Kompresi Data Konsep Bahasa Pemrograman 0.6821. Konsep Bahasa Pemrograman Kompresi Data 0.7822. Algoritma dan Pemrograman I Algoritma dan Pemrograman II &

Grafika Komputer Lanjut 0.72

23. Algoritma dan Pemrograman I & Algoritma dan Pemrograman II Grafika Komputer Lanjut

0.91

24. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II

0.84

25. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I

0.72

26. Analisis Algoritma Algoritma dan Pemrograman II & KompresiData

0.76

27. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData

0.89

28. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma

0.76

119

Tabel 5.45 Aturan asosiasi dengan minsup 0.4 dan minconf 0.7 pada dataset I

Page 120: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

29. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II

0.91

30. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data

0.67

31. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut

0.71

32. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data

0.81

33. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut

0.85

34. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II

0.87

Percobaan II.2

Minimum Support 0.45

a). Percobaan II.2a

Minimum Confidence 0.6

Aturan asosiasi yang terbentuk sebanyak 26 yaitu sebagai berikut :

NoAtura

n

Aturan asosiasi Confidence

1 Algoritma dan Pemrograman I Analisis Algoritma 0.802 Analisis Algoritma Algoritma dan Pemrograman I 0.663 Algoritma dan Pemrograman I Pengantar Grafika

dan Multimedia0.87

4 Pengantar Grafika dan Multimedia Algoritma danPemrograman I

0.65

5 Analisis Algoritma Basis Data II 0.676 Basis Data II Analisis Algoritma 0.867 Analisis Algoritma Pemrograman Client/server 0.678 Pemrograman Client/server Analisis Algoritma 0.879 Analisis Algoritma Pengantar Grafika dan

Multimedia0.83

10 Pengantar Grafika dan Multimedia AnalisisAlgoritma

0.76

11 Analisis Algoritma Sistem Cerdas 0.78

120

Tabel 5.46 Aturan asosiasi dengan minsup 0.45 dan minconf 0.6 pada dataset I

Page 121: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

12 Sistem Cerdas Analisis Algoritma 0.8313 Basis Data II Pengantar Grafika dan Multimedia 0.8614 Pengantar Grafika dan Multimedia Basis Data II 0.6115 Basis Data II Sistem Cerdas 0.8416 Sistem Cerdas Basis Data II 0.6917 Pengantar Grafika dan Multimedia Sistem Cerdas 0.7018 Sistem Cerdas Pengantar Grafika dan Multimedia 0.8119 Pengantar Grafika dan Multimedia Struktur Data 0.6120 Struktur Data Pengantar Grafika dan Multimedia 0.8221 Analisis Algoritma Pengantar Grafika dan

Multimedia & Sistem Cerdas0.67

22 Pengantar Grafika dan Multimedia AnalisisAlgoritma & Sistem Cerdas

0.61

23 Sistem Cerdas Analisis Algoritma & PengantarGrafika dan Multimedia

0.71

24 Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas

0.81

25 Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia

0.85

26 Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma

0.87

Percobaan II.2b

Minimum Confidence 0.7

Aturan asosiasi yang terbentuk sebanyak 17 aturan sebagai berikut :

NoAturan

Aturan asosiasi Confidence

1. Algoritma dan Pemrograman I Analisis Algoritma 0.802. Algoritma dan Pemrograman I Pengantar Grafika

dan Multimedia0.87

3. Basis Data II Analisis Algoritma 0.864. Pemrograman Client/server Analisis Algoritma 0.875. Analisis Algoritma Pengantar Grafika dan

Multimedia0.83

6. Pengantar Grafika dan Multimedia AnalisisAlgoritma

0.76

7. Analisis Algoritma Sistem Cerdas 0.78

121

Tabel 5.47 Aturan asosiasi dengan minsup 0.45 dan minconf 0.7 pada dataset I

Page 122: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

8. Sistem Cerdas Analisis Algoritma 0.839. Basis Data II Pengantar Grafika dan Multimedia 0.8610. Basis Data II Sistem Cerdas 0.8411. Pengantar Grafika dan Multimedia Sistem Cerdas 0.7012. Sistem Cerdas Pengantar Grafika dan Multimedia 0.8113. Struktur Data Pengantar Grafika dan Multimedia 0.8214. Sistem Cerdas Analisis Algoritma & Pengantar

Grafika dan Multimedia0.71

15. Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas

0.81

16. Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia

0.85

17. Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma

0.87

Percobaan II.3

Minimum Support 0.5

a). Percobaan II.3a

Minimum Confidence 0.6

Aturan asosiasi yang terbentuk sebanyak 6 aturan yaitu sebagai berikut :

122

NoAturan

Aturan asosiasi Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia

Sistem Cerdas0.70

6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia

0.81

Tabel 5.48 Aturan asosiasi dengan minsup 0.5 dan minconf 0.6 pada dataset I

Page 123: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

b). Percobaan II.3b

Minimum Confidence 0.7

Percobaan II.4

Minimum Support 0.55

a). Percobaan II.4a

Minimum Confidence 0.6

Aturan asosiasi yang terbentuk sebanyak 4 aturan yaitu sebagai berikut :

123

NoAturan

Aturan asosiasi Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia

Sistem Cerdas0.70

6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia

0.81

NoAturan

Aturan asosiasi Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83

Tabel 5.49 Aturan asosiasi dengan minsup 0.5 dan minconf 0.7 pada dataset I

Tabel 5.50 Aturan asosiasi dengan minsup 0.55 dan minconf 0.6 pada dataset I

Page 124: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

b). Percobaan II.4b

Minimum Confidence 0.7

Aturan asosiasi yang terbentuk sama yaitu sebanyak 4 aturan sebagai

berikut :

124

NoAturan

Aturan Confidence

1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia

0.83

2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma

0.76

3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83

Tabel 5.51 Aturan asosiasi dengan minsup 0.55 dan minconf 0.7 pada dataset I

Page 125: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

C. PEMBAHASAN

Hasil dari percobaan-percobaan yang telah dilakukan dapat digambarkan pada

grafik-grafik dibawah ini :

1. Grafik hubungan nilai minimum support terhadap jumlah aturan

asosiasi yang kuat

ü Percobaan jenis I pada dataset I dengan minimum confidence 0.5

50

26

6 4 0 00102030405060

0,4 0,45 0,5 0,55 0,6 0,65

Nilai minimum supportJum

lah

atur

an a

sosi

asi y

ang

kuat

Gambar 5.1 Grafik hubungan nilai minimum support terhadap jumlah aturan asosiasiyang kuat pada dataset I

125

Page 126: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

ü Percobaan jenis I pada dataset II dengan minimum confidence 0.5

59

34

18

62 2 2 00

10

20

30

40

50

60

70

0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65

Nilai minimum support

jum

lah

atur

an a

sosi

asi y

g ku

at

Dari hasil percobaan yang dilakukan diatas dapat dilihat bahwa nilai

minimum support mempengaruhi jumlah frequent 1_itemset sehingga berpengaruh

juga terhadap jumlah aturan yang terbentuk. Terlihat pada grafik bahwa semakin

kecil nilai minimum support semakin banyak aturan asosiasi yang kuat yang

terbentuk, sebaliknya semakin besar nilai minimum support semakin sedikit aturan

asosiasi yang kuat yang terbentuk.

126

Gambar 5.2 Grafik hubungan nilai minimum support terhadap jumlah aturan asosiasiyang kuat pada dataset II

Page 127: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

48

34

26

17

6 64 40

10

20

30

40

50

60

0,6 0,7

Nilai minimum confidence

Jum

lah

atur

an a

sosi

asi y

ang

kuat

jml aturan asosiasi ygkuat dg minsup 0.4jml aturan asosiasi ygkuat dg minsup 0.45jml aturan asosiasi ygkuat dg minsup 0,5jml aturan asosiasi ygkuat dg support 0.55

2. Grafik hubungan nilai minimum confidence terhadap jumlah aturan

asosiasi yang kuat

Dengan melakukan perubahan nilai minimum confidence pada percobaan

yang telah dilakukan diatas, hasilnya dapat dilihat pada grafik dibawah ini :

ü Percobaan jenis II pada dataset I

Gambar 5.3 Grafik hubungan nilai minimum confidence terhadap jumlah aturanasosiasi yang kuat pada dataset I

Dari grafik diatas dapat dilihat bahwa dengan memperbesar nilai minimum

confidence jumlah aturan asosiasi yg kuat yang terbentuk semakin sedikit, tetapi ada

pula yang jumlahnya sama. Jumlah aturan yang sama disebabkan karena besarnya

nilai confidence yang dimiliki oleh frequent itemset.

Dari hasil percobaan-percobaan di atas ternyata tidak semua aturan asosiasi

yang kuat (Strong Association Rule) yang telah terbentuk merupakan aturan yang

cukup menarik atau bermakna sehingga aturan bisa merupakan aturan yang janggal

(misleading).

127

Page 128: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Dataset yang dipakai dalam skripsi ini tidak merepresentasikan urutan

pengambilan matakuliah sehingga memunculkan aturan yang janggal. Selain itu

pencarian pola pada dataset dengan metode Apriori ternyata tidak mendapatkan pola

yang diharapkan, karena diduga pola yang terdapat pada dataset bersifat menyebar.

128

Page 129: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

BAB VI

KESIMPULAN DAN SARAN

A. Kesimpulan

Beberapa kesimpulan yang dapat diperoleh sebagai hasil dari pembuatan

tugas akhir ini adalah sebagai berikut:

1. Dengan Metode Association Rule menggunakan algoritma Apriori yang

telah berhasil diimplementasikan dan diujicobakan pada dataset data

akademik mahasiswa Program Studi Ilmu Komputer, Jurusan Matematika,

Fakultas MIPA, Universitas Sanata Dharma, Tahun Angkatan 2001-2002

untuk mendapatkan informasi mengenai adanya keterkaitan antara tingkat

keberhasilan atau ketidakberhasilan suatu matakuliah dengan tingkat

keberhasilan atau ketidakberhasilan matakuliah lain.

2. Dengan program ini pengguna dapat melakukan simulasi untuk melihat

keterkaitan antara tingkat keberhasilan suatu matakuliah dengan matakuliah

lain dengan memasukkan nilai minimum support dan nilai minimum

confidence yang berbeda-beda.

3. Informasi mengenai keterkaitan keberhasilan atau ketidakberhasilan suatu

matakuliah terhadap matakuliah lain ini sangat dipengaruhi oleh nilai

minimum support dan minimum confidence yang dimasukkan pengguna.

Didapatkan hasil bahwa semakin besar minimum support, jumlah aturan

menjadi semakin sedikit, begitu juga dengan semakin besar minimum

confidence jumlah aturan yang diperoleh juga semakin kecil.

129

Page 130: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

4. Semakin besar nilai minimum support yang dimasukkan maka semakin

sedikit jumlah kandidat itemset yang tergolong sebagai frequent itemset. Hal

ini mengakibatkan berkurangnya jumlah aturan yang terbentuk.

5. Semakin besar nilai minimum confidence berarti ambang toleransi terhadap

probabilitas terjadinya suatu kejadian makin tinggi sehingga mengakibatkan

semakin sedikit jumlah aturan asosiasi yang kuat (strong association rule)

yang terbentuk.

6. Program ini telah diuji pada beberapa dataset fiktif dan mendapatkan hasil

aturan yang sama dengan perhitungan secara manual.

7. Tidak semua aturan asosiasi yang kuat (Strong Association Rule) yang telah

terbentuk merupakan aturan yang cukup menarik atau bermakna sehingga

aturan bisa merupakan aturan yang janggal (misleading).

8. Dataset yang dipakai dalam skripsi ini tidak merepresentasikan urutan

pengambilan matakuliah sehingga memunculkan aturan yang janggal. Selain

itu pencarian pola pada dataset dengan metode apriori ternyata tidak

mendapatkan pola yang diharapkan, karena diduga pola yang terdapat pada

dataset bersifat menyebar.

130

Page 131: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

B. Saran

Berdasarkan hasil dari analisa tugas akhir, program masih belum sempurna

sehingga penulis memberi saran untuk pengembangan lebih lanjut antara lain:

1. Saat ini program hanya bisa menerima input tabel data yang berformat .DBF,

maka program dapat dikembangkan lagi sehingga program dapat menerima

input yang berformat selain .DBF misalnya data dalam format MDB.

2. Aturan-aturan yang didapat pada program ini disimpan pada listbox yang

bersifat temporary. Untuk itu program dapat dikembangkan lagi sehingga

dapat menampung aturan dengan lebih baik dan lebih besar.

3. Untuk mendapatkan aturan asosiasi yang lebih baik dan tidak terkesan

janggal (misleading) dapat dilakukan upaya-upaya sebagai berikut :

a). Merepresentasikan urutan pengambilan matakuliah dalam dataset.

b). Memakai algoritma yang mampu mengenali korelasi antar variabel

seperti misalnya random walk algorithm.

c). Mempergunakan dataset yang lebih besar ukurannya sehingga pola yang

ada dapat lebih dikenali.

131

Page 132: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

DAFTAR PUSTAKA

Anonymous. Association Ruleshttpwww.aicomponents.comAlgorithmsAssociationRules.aspx

Anonymous. Data Mining Conceptshttp://msdn2.microsoft.com/ms176117%28en-us,SQL.90%29.aspx

Han, Jiawei Michelin Kamber. Data Mining Concept and Techniques,MorganKaufmann Publisher 2001.Academic Press USA

Mandvikar, Amit. Introduction to Data Mining Chapter 6. Association Ruleshttp://www.eas.asu.edu/~mining03/chap5/chap5_list.html

Moen, Pirjo. Data mining methods http://www.cs.helsinki.fi/u/ronkaine/tilome/luentomateriaali/

TiLoMe-140305.pdf

Pramudiono, Iko. Introduction to Data Mininghttp://datamining.japati.net/forum/index.php

Pramudiono, Iko. Pengantar Data Mining: Menambang Permata Pengetahuan diGunung Datahttp://www.ilmukomputer.com/umum/iko-datamining.php.2003

Prasetya, Bowo. Analisis Perilaku Pengunjung Menggunakan Data Mining.http://www.beritaiptek.com/pilihberita.php?id=155

Prasetyo , Philips Kokoh. Apriori.http://philips.wordpress.com/2006/06/07/apriori/

Prasetyo, Philips Kokoh. ,Association Rule Mining Process.http://philips.wordpress.com/2006/05/24/association-rule-mining-process/

132

Page 133: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Prewitaningsih, Dyah. Analisis Perbandingan Algoritma Apriori dan Min-Aprioriuntuk Implementasi Clustering berdasarkan Hipergraf Rule Asosiasihttp ://wiki .sttelkom.ac.id

Santoso, Leo Willyanto. Pembuatan Perangkat Lunak Data Mining UntukPenggalian Kaidah Assosiasi Menggunakan Metode Apriorihttp://fportfolio.petra.ac.id/user_files/03-023/Data%20Mining.pdf ? PHPSESSID=781df11f9a8e72d8f00f3a7dae14ef2d

Sucahyo, Yudho Giri, Data Mining Menggali Informasi yang Terpendam. http://ilmukomputer.com/populer/yudho-datamining.php.2003

Sucahyo, Yudho Giri, Penerapan Data Mining Permasalahan Apa Saja yangBisa Diselesaikan.http://ilmukomputer.com/populer/yudho/yudhodatamining.pdf.2003

Sukarya, Oyo & Moch. Arif Bijaksana & Dana Sulistiyo Kusumo, PerbandinganPencarian Frequent Itemset Menggunakan Algoritma Cut Both Ways danAlgoritma Apriori.http://www.stttelkom.ac.id/staf/MAB/TA-PA/jurnal-oyo.zip

133

Page 134: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

LAMPIRAN

Lampiran 1. Data salah satu mahasiswa prodi Ilmu Komputer yang diperoleh dariBAPSI

SmtAmbil Kode Mtk Nama Mtk Sks NilaiThn/Smt : 2001 / Ganjil

MAB 112 Bahasa Inggris I 2 BMAK 102 Pengantar Ilmu Komputer 2 BMAK 102P Praktikum Pengantar Ilmu Komputer 1 AMAK 103 Algoritma dan Pemrograman I 2 BMAK 103P Praktikum Algoritma Dan Pemrograman I 1 BMAM 108 Matematika Dasar I 3 CMAM 121 Logika Matematik 3 CUSD 104 Pendidikan Pancasila 2 DUSD 110 Pendidikan Agama 2 B

Tot SKS / IPS 18 2,50Thn/Smt : 2001 / Genap

MAB 113 Bahasa Inggris II 2 BMAF 103 Fisika Dasar 3 BMAK 104 Algoritma Dan Pemrograman II 2 BMAK 104P Praktikum Algoritma Dan Pemrograman II 1 AMAK 105 Sistem Digital 3 CMAK 105P Praktikum Sistem Digital 1 AMAK 208 Pemrograman Berorientasi Obyek I 2 AMAK 208P Prakt. Pemrograman Berorientasi Obyek I 1 AMAM 109 Matematika Dasar II 3 CMAM 151 Pengantar Teori Probabilitas 3 BUSD 111 Teologi Moral 2 BUSD 208 Ilmu Budaya Dasar 2 C

Tot SKS / IPS 25 2,88Thn/Smt : 2002 / Ganjil

MAK 205 Struktur Data 2 AMAK 205P Praktikum Struktur Data 1 BMAK 206 Organisasi Komputer 2 BMAK 206P Praktikum Organisasi Komputer 1 AMAK 431 Teori Bahasa dan Otomata 3 AMAM 230 Matematika Diskret 3 BMAM 232 Aljabar Linear Dan Matriks 2 AMAM 253 Statistika 2 BMAM 253P Praktikum Statistika 1 AUSD 123 Pendidikan Pancasila 2 CUSD 206 Pendidikan Kewarganegaraan 2 A

Tot SKS / IPS 21 3,43Thn/Smt : 2002 / Genap

MAK 207 Sistem Operasi 2 BMAK 207P Praktikum Sistem Operasi 1 D

134

Page 135: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

MAK 209 Basis Data I 2 BMAK 209P Praktikum Basis Data I 1 BMAK 210 Pengantar Grafika Komputer & Multimedia 2 CMAK 210P Prak. Peng. Grafika Komp. & Multimedia 1 BMAK 213 Jaringan Komputer 2 BMAK 213P Praktikum Jaringan Komputer 1 BMAK 216 Sistem Informasi Manajemen 3 BMAK 401 Kewirausahaan 2 BMAM 363 Metode Numeris 2 DMAM 363P Praktikum Metode Numerik 1 AMAM 466 Riset Operasi I 2 DMAM 466P Praktikum Riset Operasi I 1 C

Tot SKS / IPS 23 2,48Thn/Smt : 2003 / Ganjil

MAB 301 Etika Profesi 2 BMAK 214 Sistem Cerdas 2 BMAK 214P Praktikum Sistem Cerdas 1 AMAK 215 Rekayasa Perangkat Lunak I 2 CMAK 215P Praktikum Rekayasa Perangkat Lunak I 1 BMAK 217 Analisis Algoritma 2 CMAK 217P Praktikum Analisis Algoritma 1 BMAK 302 Pengembangan Aplikasi Berbasis Web 2 A

MAK 302PPrak. Pengembangan Aplikasi BerbasisWeb 1 B

MAK 402 Interaksi Manusia Dan Komputer 2 BMAK 411 Kompresi Data 2 BMAK 411P Praktikum Kompresi Data 1 A

Tot SKS / IPS 19 3,00Thn/Smt : 2003 / Genap

MAK 212 Pengembangan Sistem Informasi 3 BMAK 221 Grafika Komputer Lanjut 2 BMAK 221P Praktikum Grafika Komputer Lanjut 1 AMAK 301 Rekayasa Perangkat Lunak II 2 BMAK 301P Praktikum Rekayasa Perangkat Lunak II 1 BMAK 303 Basis Data II 2 CMAK 303P Praktikum Basis Data II 1 CMAK 304 Tugas Khusus 2 AMAK 313 Pemrosesan Citra 2 BMAK 313P Praktikum Pemrosesan Citra 1 AMAK 413 Konsep Bahasa Pemrograman 3 BMAM 466 Riset Operasi I 2 D

Tot SKS / IPS 22 2,86Thn/Smt : 2004 / Ganjil

MAK 105 Sistem Digital 3 CMAK 207P Praktikum Sistem Operasi 1 AMAK 312 Animasi Komputer 2 DMAK 312P Praktikum Animasi Komputer 1 CMAK 403 Sistem Informasi Geografis 2 BMAK 403P Praktikum Sistem Informasi Geografis 1 A

135

Page 136: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

MAK 489 Orientasi Tugas Akhir 1 CMAM 108 Matematika Dasar I 3 CMAM 121 Logika Matematik 3 BMAM 363 Metode Numeris 2 CUSD 410 Kuliah Kerja Nyata 3 A

Tot SKS / IPS 22 2,59Thn/Smt : 2004 / Genap

MAK 312 Animasi Komputer 2 CMAK 416 Pengenalan Pola 2 CMAK 416P Praktikum Pengenalan Pola 1 AMAK 418 Teknologi Multimedia 2 BMAK 490B Skripsi 5MAM 109 Matematika Dasar II 3 C

Tot SKS / IPS 10 2,40Thn/Smt : 2005 / Ganjil

MAK 105 Sistem Digital 3 BMAK 490L Skripsi Lanjutan 5MAM 108 Matematika Dasar I 3 CMAM 466 Riset Operasi I 2 B

Tot SKS / IPS 8 2,63

136

Page 137: IMPLEMENTASI DATA MINING PADA DATASET NILAI AKADEMIK …

Algoritma &Pemrograman I

Algoritma &Pemrograman II

Struktur Data

Basis Data I

Pengantar GrafikaKomputer

Multimedia

RekayasaPerangkat Lunak I

Sistem Cerdas

Analisis Algoritma

Grafika KomputerLanjut

RekayasaPerangkat Lunak

II

Basis Data II

Jaringan SyarafTiruan

AlgoritmaGenetika

Animasi Komputer

Pemrosesan Citra

Sistem berbasisPengetahuan

Kompresi Data

PemrogramanClient/Server

Sistem Basis Data Terdistribusi

PemrosesanBahasa Alami

Konsep BahasaPemrograman

TeknologiMultimedia

Pengenalan Pola

M M

M

N M

M

M

M

N

M

RobotikaM

M

M

M

N

N

M

M

N

M

M

M

M

DIAGRAM ALIR MATAKULIAH PRODI ILMU KOMPUTER

SEMESTER I SEMESTER II SEMESTER III SEMESTER IV SEMESTER V SEMESTER VI SEMESTER VII SEMESTER VIII

137Lampiran 2. Gambar diagram Alir matakuliah Algoritma dan Pemrograman I