implementasi data mining pada dataset nilai akademik …
TRANSCRIPT
PENAMBANGAN ATURAN ASOSIASI PADA DATASET NILAI
AKADEMIK MAHASISWA DENGAN ALGORITMA APRIORI
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Program Studi Ilmu Komputer
Oleh :
Francisca Andika P
023124045
PROGRAM STUDI ILMU KOMPUTER
JURUSAN MATEMATIKA
FAKULTAS MIPA
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2007
1
2
3
HALAMAN PERSEMBAHAN
Ukuran tubuhmu kurang penting; ukuran otakmu agak
penting; ukuran hatimu adalah yang paling penting.
(B. C. Gorbes)
Saya hanyalah seorang manusia, tetapi saya adalah seseorang. Saya
tidak dapat melakukan segalanya , tetapi saya dapat melakukan sesuatu.
Saya tidak akan menolak melakukan sesuatu yang dapat saya lakukan.
(Martha Graham)
Karya ini kupersembahkan untuk :Yesus Kristus atas rahmat, karunia, dan berkatNya
Pa’e & Bu’e tercinta,Kekasihku Toro,
Adikku Linda,Sahabat-sahabatku,
Almamaterku.
4
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya/bagian karya orang lain, kecuali yang telah disebutkan dalam
kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 26 Maret 2007
Penulis
Francisca Andika P
5
ABSTRAKSI
Data mining adalah sebuah proses mengekstrak pola yang penting ataumenarik dari sejumlah data yang sangat besar. Salah satu metode yang dikenal didalam penambangan data (data mining) adalah analisis asosiasi yang menghasilkanaturan asosiasi (association rule). Analisis asosiasi adalah teknik data mining untukmenemukan aturan asosiasi antara suatu kombinasi item. Penting tidaknya suatuaturan asosiasi dapat diketahui dengan dua parameter, nilai penunjang (support) yaitupersentase kombinasi item tersebut dan nilai kepastian (confidence) yaitu kuatnyahubungan antar item dalam aturan asosiasi.
Pada tugas akhir ini diimplementasikan salah satu algoritma yang digunakanuntuk mencari aturan asosiasi yaitu algoritma Apriori. Implementasi algoritma iniakan digunakan untuk mencari pola keterkaitan antar tingkat keberhasilan atauketidakberhasilan suatu matakuliah dengan tingkat keberhasilan atauketidakberhasilan mata kuliah lain dengan menggunakan data akademik mahasiswayang diperoleh dari Program Studi Ilmu Komputer, Jurusan Matematika, FakultasMIPA, Universitas Sanata Dharma, Yogyakarta tahun angkatan 2001 dan 2002. Hasildari implementasi tersebut diperoleh aturan-aturan asosiasi yang terbentuk darikejadian 2 item atau lebih dengan melakukan percobaan dengan nilai minimumsupport antara 0.3 s.d 0.6.5 dan nilai minimum confidence antara 0.5 s.d 0.7.
6
ABSTRACT
Data mining is a process to extract interesting or important patterns fromlarge amount of data. One of method in data mining is association analysis thatyielding association rule . Association analysis is technique of data mining to findthe association rule between item combination. Important or not in association rulewith two parameter , assess the supporter (support) that is the item combinationpercentage and assess the certainty (confidence) that is its strength of relationamong the item in association rule.
At the final project implementation one of algorithm used to look for theassociation rule that is Apriori algorithm .This algorithm implementation will beused to look for the related pattern usher the level of succeeding or fail of a lessonwith the level of succeeding or fail other lesson by using student academic recorddataset that obtained from Program Study of Computer Science, MathematicsMajors, Faculty MIPA, University of Sanata Dharma, Yogyakarta of generation year2001 and 2002. Result from the implementation obtained by a association rule whichis formed by occurence 2 item or more by conducting attempt with the value ofminimum support between 0.3 s.d 0.6.5 and assess the minimum confidence between0.5 s.d 0.7.
7
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Yesus Kristus atas karunia
rahmat dan berkatNya, sehingga skripsi dengan judul Penambangan Aturan Asosiasi
pada Dataset Nilai Akademik Mahasiswa dengan Algoritma Apriori selesai disusun.
Skripsi ini disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
(S.Sc.) pada Program Studi Ilmu Komputer di Fakultas MIPA Universitas Sanata
Dharma Yogyakarta.
Sebagai manusia biasa, penulis menyadari bahwa hambatan dan rintangan
sekecil apapun merupakan pembelajaran dalam rangka menambah pengetahuan dan
pengalaman. Berkat bantuan, kerjasama, dukungan, dari berbagai pihak dalam
penyusunan skripsi ini maka skripsi ini dapat terselesaikan. Pada kesempatan ini
penulis mengucapkan terimakasih dalam dan setulusnya atas kepada :
1. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc, selaku dosen pembimbing yang
telah mencurahkan perhatian, waktu, ilmu, dan kesabarannya.
2. Drs. H.J. Haris Sriwindono, M.Kom. , selaku dosen penguji dan Kepala BAPSI
ketika penelitian berlangsung, atas kesediaan membantu dalam pengambilan
dataset, menguji serta masukan dan kritik yang membangun.
3. A. Rita Widiarti, S.Si, M.Kom., selaku dosen penguji, atas kesediaan menguji
serta masukan dan kritik yang membangun.
4. Ir. Ign. Aris Dwiatmoko, M.Sc., selaku Dekan Fakultas MIPA Universitas Sanata
Dharma Yogyakarta.
8
5. Mas Diar, Mbak Retno selaku karyawan BAPSI yang telah membantu dalam
pengambilan dataset.
6. Pa’e & Bu’e tercinta, atas segala doa yang tiada hentinya, pengorbanan, kasih
sayang yang tak terhingga, semangat dan harapan yang tak padam.
7. Sayang Toro, yang begitu menyayangiku untuk kasih sayang, perhatian, semangat
dan dukungannya.
8. Pritty maniez makasih atas semua bantuannya, Nyit2 atas semangatnya, Astiwi
thanks to the “mobile”, Kost Lovely : Ophék, Dõra, Déw..ik (thank’s ya
kamarnya), Héncë, Plëndies, Pépéng, atas canda tawa dan persahabatan yang
indah, serta semua teman-teman IKOM angkatan 2002.
9. Piepiet & Bulan thanks atas doa, semangat, keceriaan, dukungan serta semangat
yang diberikan.
10. Kakak-kakakku Mbak Is, Mbak Anne, Mbak Etik, Mbak Atik, Mbak Oni serta
adikku Linda atas segala doa, dukungan, kasih sayang, semangat, perhatian,
canda tawa yang selalu mengiringiku.
11. Keluarga Bekasi Bapak, Ibuk, Mas Asta, & Tika, terimakasih karena telah
menerimaku dalam keluarga.
Serta semua pihak yang tidak dapat disebutkan satu persatu. Penulis
menyadari karya ini memiliki banyak kekurangan, untuk itu penulis mengharapkan
saran dan kritik untuk menyempurnakan karya ini. Semoga skripsi ini bermanfaat
bagi pengetahuan dan masyarakat.
Yoyakarta,26 Maret 2007
Penulis
9
DAFTAR ISI
HALAMAN JUDUL...................................................................................... 1
HALAMAN PERSETUJUAN PEMBIMBING.......................................... 2
HALAMAN PENGESAHAN........................................................................ 3
HALAMAN PERSEMBAHAN..................................................................... 4
PERNYATAAN KEASLIAN KARYA......................................................... 5
ABSTRAKSI................................................................................................... 6
ABSTRACT..................................................................................................... 7
KATA PENGANTAR.................................................................................... 8
DAFTAR ISI................................................................................................... 10
DAFTAR TABEL………............................................................................... 12
DAFTAR GAMBAR…….............................................................................. 15
BAB I PENDAHULUAN……....................................................................... 17
A. Latar Belakang……............................................................................. 17
B. Rumusan Masalah…........................................................................... 19
C. Metodologi …..................................................................................... 19
D. Tujuan…............................................................................................. 20
E. BatasanMasalah….............................................................................. 20
F. Manfaat............................................................................................... 21
G. Sistematika Penulisan…...................................................................... 21
BAB II LANDASAN TEORI........................................................................ 23
A. Pengertian Data Mining...................................................................... 23
B. Tahap-tahap Data Mining.................................................................... 26
C. Teknik Data Mining............................................................................. 27
D. Aturan asosiasi (Association Rules) ................................................... 30
E. Algoritma Apriori…………………………......................................... 34
F. Contoh penerapan Algoritma Apriori dan pembentukan aturan asosiasi 37
10
BAB III ANALISIS DAN PERANCANGAN SISTEM.............................. 43
A. Identifikasi Masalah............................................................................. 43
B. Analisis Sistem.................................................................................... 44
1. Input............................................................................................... 44
2. Proses.............................................................................................. 48
3. Output............................................................................................. 52
4. Analisa Kebutuhan Sistem............................................................ 52
C. Perancangan………………................................................................. 53
1. Perancangan Modul………............................................................ 53
2. Perancangan Struktur Data…......................................................... 56
3. Perancangan Antar Muka dengan Pengguna…………………….. 60
BAB IV IMPLEMENTASI DATA MINING……………………………... 70
BAB V ANALISA HASIL DAN PEMBAHASAN..………………………. 93
A. Percobaan Jenis I ................................................................................ 93
1. Percobaan dengan Dataset I........................................................... 93
2. Percobaan dengan Dataset II.......................................................... 103
B. Percobaan Jenis II................................................................................. 116
C. Pembahasan.......................................................................................... 125
BAB VI KESIMPULAN DAN SARAN....................................................... 129
A. Kesimpulan………………………………………………………….. 129
B. Saran…………………………………………………………….…… 131
DAFTAR PUSTAKA………………………………………………………. 132
LAMPIRAN………………………………………………………………… 134
Lampiran 1 Data salah satu mahasiswa prodi Ilmu Komputer yang diperoleh
dari BAPSI…………………………………… 134
Lampiran 2 Gambar diagram Alir matakuliah
Algoritma dan Pemrograman I.........................…………...... 137
11
DAFTAR TABEL
Tabel 2.1 Contoh Tabel Transaksi D………………………………….…... 32
Tabel 2.2 Tabel Transaksi ……………………………………….......……. 37
Tabel 2.3 Frequent itemset minimum support 40%..………………....…... 39
Tabel 3.1 Nim mahasiswa .............................……………………………... 45
Tabel 3.2 Matakuliah yang terdapat dalam satu rangkaian prasyarat........... 46
Tabel 3.3 Nilai mahasiswa .........................……………………………….. 47
Tabel 3.4 Tabel contoh itemset dengan matakuliah yang memperoleh nilai
C,D,E,F………………………………………………………….. 48
Tabel 3.5 Keterangan array itemset …………………………………….. 56
Tabel 3.6 Contoh salah satu isi array itemset ………………………….. 56
Tabel 3.7 Format listbox pada form Frequent 1_Itemset.………………….. 57
Tabel 3.8 Keterangan listbox pada form Frequent 1_Itemset ……………… 57
Tabel 3.9 Format listbox bagian atas pada form Frequent Itemset................. 58
Tabel 3.10 Keterangan listbox bagian atas pada form Frequent Itemset ……. 58
Tabel 3.11 Format listbox bagian bawah pada form Frequent Itemset ……... 58
Tabel 3.12 Keterangan listbox bagian bawah pada form Frequent Itemset…. 59
Tabel 3.13 Format listbox yang terdapat pada form Semua Rule………....... 59
Tabel 3.14 Keterangan listbox yang terdapat pada form Semua Rule………. 59
Tabel 3.15 Format listbox yang terdapat pada form Strong association rule… 60
Tabel 3.16 Keterangan listbox yang terdapat pada form Strong
association rule ..........……….………………………………….. 60
Tabel 4.1 Listbox Frequent Itemset………………………………..………. 79
Tabel 4.2 Listbox Keterangan Frequent Itemset………..………………….. 79
Tabel 5.1 Contoh format Dataset I…...…………………………………….. 93
Tabel 5.2 Frequent 1_itemset dengan minsup 0.4 pada dataset I…………... 94
Tabel 5.3 Frequent 2_itemset dengan minsup 0.4 pada dataset I………….. 95
Tabel 5.4 Frequent 3_itemset dengan minsup 0.4 pada dataset I…………… 95
Tabel 5.5 Aturan asosiasi dengan minsup 0.4 dan minconf 0,5 pada dataset I 95
12
Tabel 5.6 Frequent 1_itemset dengan minsup 0.45 pada dataset I…………… 98
Tabel 5.7 Frequent 2_itemset dengan minsup 0.45 pada dataset I…………... 98
Tabel 5.8 Frequent 3_itemset dengan minsup 0.45 pada dataset I………….. 99
Tabel 5.9 Aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset I 99
Tabel 5.10 Frequent 1_itemset dengan minsup 0.5 pada dataset I………… 100
Tabel 5.11 Frequent 2_itemset dengan minsup 0.5 pada dataset I……………. 100
Tabel 5.12 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset I 101
Tabel 5.13 Frequent 1_itemset dengan minsup 0.55 pada dataset I………….. 101
Tabel 5.14 Frequent 2_itemset dengan minsup 0.55 pada dataset I………….. 102
Tabel 5.15 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada dataset I 102
Tabel 5.16 Tabel frequent 1_itemset dengan minsup 0.6 pada dataset I……… 102
Tabel 5.17 Frequent 1_itemset dengan minsup 0.65 pada dataset I………….. 103
Tabel 5.18 Contoh format Dataset II…………………………………………. 103
Tabel 5.19 Frequent 1_itemset dengan minsup 0.3 pada dataset II…………… 104
Tabel 5.20 Frequent 2_itemset dengan minsup 0.3 pada dataset II………… 105
Tabel 5.21 Frequent 3_itemset dengan minsup 0.3 pada dataset II…………… 105
Tabel 5.22 Aturan asosiasi dengan minsup 0.3 dan minconf 0,5 pada dataset II 105
Tabel 5.23 Frequent 1_itemset dengan minsup 0.35 pada dataset II…………. 108
Tabel 5.24 Frequent 2_itemset dengan minsup 0.35 pada dataset II………… 108
Tabel 5.25 Frequent 3_itemset dengan minsup 0.35 pada dataset II………… 109
Tabel 5.26 Aturan asosiasi dengan minsup 0.35 dan minconf 0.5 pada dataset II 110
Tabel 5.27 Frequent 1_itemset dengan minsup 0.4 pada dataset II………….. 111
Tabel 5.28 Frequent 2_itemset dengan minsup 0.4 pada dataset II………….. 111
Tabel 5.29 Frequent 3_itemset dengan minsup 0.4 pada dataset II………….. 111
Tabel 5.30 Aturan asosiasi dengan minsup 0.4 dan minconf 0.5 pada dataset II 112
Tabel 5.31 Frequent 1_itemset dengan minsup 0.45 pada dataset II………… 112
Tabel 5.32 Frequent 2_itemset dengan minsup 0.45 pada dataset II………… 113
Tabel 5.33 Aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset II 113
Tabel 5.34 Frequent 1_itemset dengan minsup 0.5 pada dataset II…………. 113
Tabel 5.35 Frequent 2_itemset dengan minsup 0.5 pada dataset II…………. 114
Tabel 5.36 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset II 114
13
Tabel 5.37 Frequent 1_itemset dengan minsup 0.55 pada dataset II………… 114
Tabel 5.38 Frequent 2_itemset dengan minsup 0.55 pada dataset II………… 114
Tabel 5.39 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada
dataset II…………………………………………………………. 115
Tabel 5.40 Frequent 1_itemset dengan minsup 0.6 pada dataset II………….. 115
Tabel 5.41 Frequent 2_itemset dengan minsup 0.6 pada dataset II………….. 115
Tabel 5.42 Aturan asosiasi dengan minsup 0.6 dan minconf 0.5 pada dataset II 115
Tabel 5.43 Frequent 1_itemset dengan minsup 0.65 pada dataset II……….... 116
Tabel 5.44 Aturan asosiasi dengan minsup 0.4 dan minconf 0.6 pada dataset I 117
Tabel 5.45 Aturan asosiasi dengan minsup 0.4 dan minconf 0.7 pada dataset I 119
Tabel 5.46 Aturan asosiasi dengan minsup 0.45 dan minconf 0.6 pada dataset I 120
Tabel 5.47 Aturan asosiasi dengan minsup 0.45 dan minconf 0.7 pada dataset I 121
Tabel 5.48 Aturan asosiasi dengan minsup 0.5 dan minconf 0.6 pada dataset I 122
Tabel 5.49 Aturan asosiasi dengan minsup 0.5 dan minconf 0.7 pada dataset I 123
Tabel 5.50 Aturan asosiasi dengan minsup 0.55 dan minconf 0.6 pada dataset I 123
Tabel 5.51 Aturan asosiasi dengan minsup 0.55 dan minconf 0.7 pada dataset I 124
14
DAFTAR GAMBAR
Gambar 2.1Data Mining merupakan bidang multidisipliner …..………… 24
Gambar 2.2 Tahap-tahap dalam Data Mining …….........................…….... 26
Gambar 2.3 Contoh dari decision tree pembeli komputer ..………………. 28
Gambar 2.4 Pencarian candidate itemset dan frequent itemset dengan
minimum support = 40%……………..............………………. 38
Gambar 3.1 Diagram Konteks ..................................……………………... 48
Gambar 3.2 DFD Level 1…………………………………………............. 49
Gambar 3.3 DFD Level 2………………………...…….............................. 50
Gambar 3.4 Perancangan Antar Muka Form Input ……............................. 60
Gambar 3.5 Perancangan Antar Muka Form Tabel Mahasiswa..…………. 61
Gambar 3.6 Perancangan Antar Muka Form Candidate 1_Itemset………… 62
Gambar 3.7 Perancangan Antar Muka Form Frequent Itemset................... 64
Gambar 3.8 Perancangan Antar Muka Form Candidate Itemset………….. 65
Gambar 3.9 Perancangan Antar Muka Form Semua Rule............................ 66
Gambar 3.10 Perancangan Antar Muka Form Strong association rule …….. 67
Gambar 3.11 Perancangan Antar Muka Form Frequent Itemset_1……..….. 68
Gambar 3.12 Perancangan Antar Muka Form Infrequent 1_Itemset............. 69
Gambar 4.1 Form Welcome ………………..…………………………….. 70
Gambar 4.2 Form Input …………………………….................………….. 71
Gambar 4.3 Form Dataset …………………………................................... 72
Gambar 4.4 Form Candidate 1_Itemset..………………………………….. 73
Gambar 4.5 Form Loading..................…...……………………………...... 74
Gambar 4.6 Form Frequent 1_Itemset dan Form Infrequent 1_Itemset ….. 75
Gambar 4.7 Pesan 1.......................................…………………………….... 77
Gambar 4.8 Pesan 2………...……………………………………………… 77
Gambar 4.9 Form Frequent Itemset.................................………………..... 78
Gambar 4.10 Form Candidate Itemset ……………….................................... 84
Gambar 4.11 Form Semua Rule…………………………………………..... 85
Gambar 4.12 Form Aturan Asosiasi Yang Terbentuk………………….…… 91
15
Gambar 4.13 Form Daftar Istilah……………………….……………….….. 92
Gambar 4.14 Form About ………………………………………………….. 92
Gambar 5.1 Grafik hubungan nilai minimum support terhadap jumlah aturan
asosiasi yang kuat pada dataset I……………………………... 125
Gambar 5.2 Grafik hubungan nilai minimum support terhadap jumlah aturan
asosiasi yang kuat pada dataset II…..………………………... 126
Gambar 5.3 Grafik hubungan nilai minimum confidence terhadap jumlah
aturan asosiasi yang kuat pada dataset I………………………. 127
16
BAB I
PENDAHULUAN
A. Latar Belakang
Data-data dalam suatu perusahaan biasanya disimpan dalam suatu basis data
untuk transaksi sehari-hari, seperti pencatatan transaksi jual beli, administrasi
pengiriman barang , dan lain-lain. Hal itu disebut OLTP (Online Transaction
Processing). Data-data tersebut akan semakin bertambah seiring berjalannya waktu.
Data-data yang tersimpan dalam kurun waktu yang cukup lama akan mencapai
ukuran gigabyte bahkan dapat mencapai terabyte.
Dengan menggunakan data-data tersebut, suatu perusahaan atau organisasi
dapat mengambil keputusan untuk mendapatkan informasi yang berguna. Untuk
mengambil keputusan melalui data-data tersebut, cara tradisional yang dipergunakan
adalah dengan membangun database yang disebut OLAP (Online Analytical
Processing). OLAP mendasarkan diri pada pemrosesan kueri atas data multidimensi,
seperti jenis barang, waktu, lokasi dan sebagainya. Semakin besar volume data,
kebutuhan menganalisa data untuk mempertahankan keunggulan dalam suatu
kompetisi semakin harus dikembangkan, namun belum ada teknologi untuk
membantu dalam menganalisis, memahami, bahkan memvisualisasikan data tersebut.
Dengan ukuran data yang sangat besar untuk mendapatkan informasi yang tidak
diketahui secara eksplisit sangat sulit hanya dengan laporan hasil kueri maupun
OLAP.
17
Salah satu instansi yang mempunyai data yang berukuran besar adalah
Universitas Sanata Dharma Yogyakarta. Banyak sekali data yang disimpan oleh
Universitas Sanata Dharma, salah satunya yaitu data nilai akademik mahasiswa yang
setiap semester selalu bertambah sesuai jumlah mahasiswa dan matakuliah yang
mereka ambil. Nilai tersebut dipakai untuk menentukan ipk, ips dan jumlah sks yang
akan diambil oleh mahasiswa pada semester berikutnya. Selanjutnya nilai tersebut
akan disimpan dan dibiarkan hingga dapat menjadi tumpukan data.
Dari data tersebut penulis mencoba untuk memanfaatkannya untuk mencari
suatu informasi yang berguna. Dalam skripsi ini penulis menggunakan data mining
untuk mencari informasi tersebut. Data mining merupakan serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini
tidak diketahui secara manual. Dengan teknologi data mining penulis dapat
memperoleh informasi dari dataset nilai akademik mahasiswa sehingga tidak akan
menjadi tumpukan data saja.
Data nilai akademik dapat dimanfaatkan untuk mengetahui pola keterkaitan
antar tingkat keberhasilan / ketidakberhasilan suatu mata kuliah dengan tingkat
keberhasilan / ketidakberhasilan mata kuliah lain yang diprasyaratinya dalam satu
rangkaian aliran matakuliah.
Banyak algoritma yang dapat dipergunakan untuk menyelesaikan persoalan
pada data mining. Dalam kasus tersebut diatas teknik yang sesuai adalah pencarian
aturan asosiasi (association rule). Alasan memakai teknik pencarian aturan asosiasi
(association rule) karena teknik tersebut dapat digunakan untuk menemukan aturan
asosiasi antara suatu kombinasi item, yaitu dengan membuat korelasi antara item
18
yang dikelompokkan ke dalam transaksi kemudian mengambil kesimpulan
berdasarkan hubungan yang terbentuk dari beberapa item data tersebut.
Penting atau tidaknya suatu aturan asosiasi dapat diketahui dengan dua
parameter, support yaitu presentase kombinasi item tersebut dalam database dan
confidence yaitu kuatnya hubungan antar item dalam aturan asosiasi. Algoritma yang
akan dipakai adalah algoritma Apriori karena di antara beberapa algoritma aturan
asosiasi yang dikembangkan, algoritma Apriori merupakan algoritma yang dinilai
paling efisien (Dyah,2005).
B. Rumusan Masalah
Bagaimana mengetahui pola keterkaitan antar tingkat keberhasilan atau
ketidakberhasilan suatu matakuliah dengan tingkat keberhasilan atau
ketidakberhasilan mata kuliah lain dari dataset nilai akademik mahasiswa dengan
data mining menggunakan teknik pencarian aturan asosiasi (association rule) dengan
algoritma Apriori?
C. Metodologi
1. Pembersihan data
Untuk membuang data yang tidak konsisten dan tidak diperlukan.
2. Integrasi data
Melakukan penggabungan data dari beberapa sumber.
3. Transformasi data
19
Melakukan penggabungan data menjadi bentuk yang sesuai untuk data
mining serta membangun model berdasarkan pola-pola yang
ditemukan pada langkah sebelumnya.
4. Aplikasi teknik data mining menggunakan algoritma Apriori.
5. Evaluasi pola yang ditemukan.
Untuk menemukan informasi yang bernilai dengan menggunakan algoritma
Apriori.
6. Presentasi pengetahuan.
Dengan menggunakan teknik visualisasi.
D. Tujuan
Untuk mengetahui pola keterkaitan antar tingkat keberhasilan atau
ketidakberhasilan suatu matakuliah dengan dengan tingkat keberhasilan atau
ketidakberhasilan mata kuliah lain dari dataset nilai akademik mahasiswa dengan
data mining menggunakan teknik pencarian aturan asosiasi (association rule) dengan
algoritma Apriori.
E. Batasan Masalah
Penelitian ini menggunakan data nilai akademik mahasiswa program studi
Ilmu Komputer Fakultas MIPA Universitas Sanata Dharma Yogyakarta tahun
angkatan 2001 dan 2002 karena dari kedua angkatan tersebut yang memakai
kurikulum yang sama. Nilai akademik yang dipakai adalah nilai matakuliah
Algoritma dan Pemrograman I dan nilai matakuliah lain yang diprasyaratinya, karena
20
matakuliah Algoritma dan Pemrograman I merupakan matakuliah yang menjadi
syarat untuk pengambilan matakuliah-matakuliah lain (dapat dilihat pada lampiran
2).
F. Manfaat
Hasil penelitian dari data mining ini akan menghasilkan aturan asosiasi yang
merupakan hubungan keterkaitan tingkat keberhasilan atau ketidakberhasilan suatu
makuliah terhadap tingkat keberhasilan atau ketidakberhasilan matakuliah lain.
Kesimpulan dari aturan tersebut dapat digunakan sebagai pertimbangan untuk
perbaikan kurikulum program studi, dalam hal menentukan apakah suatu matakuliah
perlu diprasyarati oleh matakuliah lain dan menentukan sifat persyaratannya (nisbi
atau mutlak). Selain itu informasi yang diperoleh dapat pula dipakai untuk perbaikan
proses belajar mengajar dan pendampingan akademik.
G. Sistematika Penulisan
Bab I. Pendahuluan
Dalam bab ini akan dijelaskan mengenai latar belakang masalah, rumusan
masalah, metodologi, tujuan, batasan masalah, manfaat, dan sistematika
penulisan.
Bab II. Landasan Teori
Dalam bab ini akan dijelaskan mengenai pengetahuan yang menjadi dasar
teori untuk mengimplementasikan data mining dalam mencari informasi dari
dataset nilai akademik mahasiswa.
21
Bab III. Analisa dan Perancangan Data Mining
Dalam bab ini akan diidentifikasikan masalah yang akan diselesaikan dan
tahap-tahap penyelesaian masalah dalam data mining dengan algoritma
Apriori. Dalam bab ini pula akan dijelaskan perancangan program
implementasi data mining dengan algoritma Apriori.
Bab IV Implementasi Data Mining
Dalam bab ini akan dijelaskan tentang implementasi data mining dengan
algoritma Apriori.
Bab V. Analisa hasil dan Pembahasan
Berisi analisa hasil program dan pembahasan masalah berdasarkan hasil
yang telah didapat secara keseluruhan.
Bab VI. Kesimpulan dan Saran
Berisi kesimpulan dan saran dari hasil analisis serta pembahasan masalah
berdasarkan hasil yang telah didapat.
22
BAB II
LANDASAN TEORI
A. Pengertian Data Mining
Menurut Pramudiono (2003) perkembangan data mining yang pesat tidak
dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam
jumlah yang besar terakumulasi. Tetapi pertumbuhan yang pesat dari akumulasi data
telah menciptakan suatu kondisi yang disebut dengan “rich of data but poor of
information” karena data yang terkumpul itu tidak dapat digunakan dalam suatu
aplikasi yang berguna. Bahkan tidak jarang kumpulan data tersebut dibiarkan begitu
saja sehingga tercipta “data tombs” (kuburan data).
Dalam jurnal ilmiah, data mining juga dikenal dengan nama KDD
(Knowledge Discovery in Database). Namun pada tahun 1995, telah diadakan
International KDD Conference di Montreal yang berhasil mendefinisikan bahwa
KDD merupakan suatu proses dalam mengenali informasi atau suatu kebenaran baru
dan benar-benar berguna serta mengenali pola yang dapat dimengerti dari data.
Tujuan utama dari proses KDD adalah memprediksikan nilai-nilai yang berguna dari
variabel-variabel yang ada atau menemukan pola-pola dari sebuah gugusan data yang
dapat diinterpretasikan oleh manusia. Sesuai dengan tujuan tersebut, maka proses
dalam mengenali informasi baru dan penemuan pola tersebut perlu diaplikasikan
dengan data mining. Sehingga sebenarnya data mining merupakan suatu bagian yang
tidak dapat dilepaskan dari proses KDD.
23
Definisi data mining :
1. Menurut Pramudiono (2003), data mining merupakan serangkaian proses
untuk menggali nilai tambah baru suatu kumpulan data berupa
pengetahuan yang selama ini tidak diketahui secara manual.
2. Menurut Sucahyo (2003), definisi sederhana dari data mining adalah
ekstraksi informasi atau pola yang penting atau menarik dari data yang
ada di basis data yang besar.
3. Menurut Edelstein dari Two Crows Cooperations data mining digunakan
untuk menemukan pola yang tersembunyi dan hubungan antar data yang
membantu di dalam hal membuat keputusan bisnis yang lebih baik.
4. Menurut Kumar dan Joshi, data mining adalah eksplorasi dari analisis
baik secara otomatis maupun semi otomatis dari data yang berjumlah
besar dengan tujuan untuk menemukan pola dan aturan yang berarti.
Perlu diketahui bahwa data mining merupakan salah satu bidang yang cukup
banyak didukung oleh cabang ilmu lain di dalam teknologi informasi yaitu statistik,
teknologi basis data, machine learning, sistem pakar, algoritma paralel, algoritma
genetika, pengenalan pola, visualisasi data, dan lain-lain.
GeneticAlgoritm
ParallelAlgoritm Database
Visualisation
AppliedStatistic
Data Mining
MachineLearning Artificial
Intelegent
24
Gambar 2.1 Data mining merupakan bidang multidisipliner(www.stttelkom.ac.id)
Ada beberapa faktor yang menjadi alasan utama mengapa menggunakan data
mining:
1. Banyaknya data yang terkumpul sehingga memerlukan waktu yang
sangat lama dan tenaga ahli yang cukup banyak untuk
menganalisisnya.
2. Komputer menjadi salah satu pilihan utama karena kemampuannya
dalam kecepatan, ketepatan, tidak pernah lelah dan mudah
dioperasikan.
3. Tekanan dari kompetisi bisnis yang terus menguat sehingga
menjadikan informasi menjadi sangat penting dan harus segera
dimiliki.
4. Mampu menemukan suatu pola yang tidak terpikirkan sama sekali.
Menurut Sucahyo (2003) data mining merupakan salah satu aktifitas dibidang
perangkat lunak yang dapat memberikan ROI (Return of Investment) yang tinggi.
Hal yang perlu diperhatikan adalah bahwa data mining berbeda dengan query
tools. Query dan data mining merupakan dua hal yang saling melengkapi.
Keberadaan data mining bukan untuk menggantikan query tetapi menambahkan
beberapa tambahan yang berarti. Jika menggunakan query sederhana maka informasi
yang dapat diakses sekitar 80% dari data yang ada dalam basis data sedangkan 20%
lagi akan menjadi informasi tersembunyi yang memerlukan teknik-teknik khusus
dalam mengaksesnya (Adrians & Zantinge,1997).
25
B. Tahap-Tahap Data Mining
Karena data mining adalah suatu rangkaian proses maka dibagi menjadi
beberapa tahap antara lain :
1. Pembersihan data: untuk membuang data yang tidak konsisten dan noise.
2. Integrasi data: untuk menggabungkan data dari beberapa sumber.
3. Transformasi data : untuk mengubah data menjadi bentuk yang sesuai
untuk di-mining.
4. Aplikasi teknik data mining.
5. Evaluasi pola yang ditemukan : untuk menemukan informasi yang
menarik ataupun bernilai.
6. Presentasi pengetahuan dengan teknik visualisasi.
Tahap-tahap diatas dapat digambarkan sebagai berikut :
Gambar 2.2 Tahap-tahap dalam data mining(www.ilmu komputer.com/umum/iko-datamining.php.2003)
26
C. Teknik Data Mining
Berdasarkan proses:
1. Supervised Learning
Dalam supervised learning disyaratkan agar data analis telah
mengidentifikasi atribut tujuan. Sebagai contoh, bila ada suatu
pertanyaan tentang siapakah pelanggan yang baru-baru ini membeli
mobil baru, untuk itu dapat dibuat target atribut 1 untuk “YA” dan 0
untuk “TIDAK”. Teknik-teknik yang termasuk dalam bagian ini antar
lain Clasification, Regression, dan lain-lain.
2. Unsupervised Learning
Berbeda dengan supervised learning, dalam unsupervised learning data
analis tidak perlu mengidentifikasi atribut target. Teknik-teknik data
mining yang termasuk ke dalam bagian ini adalah Clustering,
Association Rule, dan lain-lain.
Berikut ini adalah gambaran tentang teknik data mining yang paling populer
dari teknik-teknik data mining yang ada:
1. Classification
Classification adalah proses untuk menemukan model atau fungsi
yang menjelaskan atau membedakan konsep atau kelas data, dengan
tujuan untuk dapat memperkirakan kelas dari suatu objek yang
labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika
maka”, decision tree ataupun formula matematis (Pramudiono, 2003).
27
Desicion tree merupakan salah satu metode clasification yang paling
populer karena mudah untuk diinterpretasikan oleh manusia. Contoh
dari decision tree dapat dilihat melalui gambar dibawah ini:
age
student credit rating
no yes
yes
no yes
<=30 >40
excellent
Gambar 2.3 Contoh dari decision tree pembeli komputer (www.ilmu komputer.com/umum/iko-datamining.php.2003)
Setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap
ujung pohon menyatakan kelas data atau atribut data. Dari decision
tree tersebut, diketahui bahwa salah satu kelompok yang potensial
membeli komputer adalah orang yang berusia dibawah atau sama
dengan 30 dan juga merupakan seorang pelajar.
Algoritma Decision tree yang sering dipakai adalah ID3 dan
C4.5, namun akhir-akhir ini sedang dikembangkan suatu algoritma
yang dikenal dengan RainForest. Metode-metode classification yang
lain adalah Bayesian, Neural Network, Genetic Algorithm, Fuzzy,
Case-based Reasoning dan K-Nearest Neigboor.
2. Association Rule
Merupakan teknik data mining untuk menemukan aturan
asosiasi antara kombinasi item. Teknik ini pada umumnya diterapkan
untuk basis data transaksi dimana transaksi terdiri dari sejumlah item.
28
Basis data transaksi tersebut dapat dipakai untuk menyelesaikan
masalah pemilik pasar swalayan atau toko antara lain dalam mengatur
tata letak barang, penyiapan stok barang, dan lain-lain. Dengan
menemukan semua aturan asosiasi dan korelasi di antara item data
dimana kehadiran salah satu dari sejumlah item data menunjukkan
secara tidak langsung adanya kehadiran item data lainnya, maka
masalah tersebut bisa diselesaikan. Contoh dari aturan asosiasi adalah
bisa diketahui berapa besar kemungkinan seorang pelanggan membeli
roti bersamaan dengan susu. Dengan informasi tersebut, seorang
pemilik pasar swalayan atau toko dapat mengambil keputusan-
keputusan strategis tentang pasar swalayan atau tokonya dalam
mengatur penempatan barang atau merancang kampanye pamasaran
dengan menggunakan kupon diskon untuk kombinasi barang. Adapun
algoritma pada teknik ini antara lain Apriori, FP-Growth,
Closure/closed dan lain-lain.
3. Clustering
Berbeda dengan classification dimana kelas data telah
ditentukan sebelumnya, clustering melakukan pengelompokan data
tanpa berdasarkan kelas tertentu. Bahkan clustering dapat dipakai
untuk memberikan label pada kelas data yang belum diketahui itu.
Prinsip clustering adalah memaksimalkan kesamaan antar anggota
satu kelas dan meminimumkan kesamaan antar kelas / cluster.
29
D. Aturan asosiasi (Association Rules)
Association rule adalah salah satu teknik data mining yang sudah mulai
dipopulerkan oleh Rakesh Agrawal, seorang peneliti di IBM Almaden Research
Center yang berasal dari India, sejak tahun 1993 (Prasetyo,2006). Aturan asosiasi
sering dipakai dalam penggalian data transaksi. Proses pencarian aturan asosiasi
bertujuan untuk menemukan pola yang sering muncul, asosiasi antara suatu
kombinasi item yaitu dengan membuat korelasi antara item data yang dikelompokkan
ke dalam transaksi kemudian mengambil kesimpulan berdasarkan hubungan yang
terbentuk dari beberapa item data. Hal-hal tersebut dapat merepresentasikan
informasi penting yang ingin diketahui pada data yang ada.
Proses pencarian frequent itemset merupakan pra-syarat dan membutuhkan
waktu sangat banyak, sehingga banyak algoritma dikembangkan untuk lebih
mengefisienkan proses ini. Ada beberapa faktor yang mempengaruhi efisiensi
pencarian frequent itemset diantaranya adalah bila basis data besar (jumlah transaksi
yang banyak), item yang sangat banyak dan nilai support yang rendah.
Penting tidaknya suatu aturan asosiasi dapat diketahui dengan dua parameter,
support yaitu prosentase kombinasi item dalam database dan confidence yaitu
kuatnya hubungan antar item dalam aturan asosiasi (Pramudiono,2003). Pencarian
association rule bertujuan untuk menemukan semua aturan yang terdapat pada
database dengan minsup (minimum support) dan minconf (minimum confidence) yang
melebihi batas tertentu.
Berikut ini adalah definisi yang berkaitan dengan aturan asosiasi
(Sukarya,dkk):
30
Definisi 1 : Misalkan I = {I1, I2, …, Ik}, X I adalah kumpulan dari item-item yang
disebut itemset.
Definisi 2 : Misalkan I = {I1, I2, …, Ik} adalah sebuah gugus dari k atribut yang
berbeda, disebut juga literal. D adalah basis data, dimana setiap record (tuple) t
memiliki pengidentifikasi yang unik (TID), dan mengandung sebuah item sedemikian
hingga t I. Untuk transaksi t berisi X yang merupakan sekumpulan item yang ada
dalam I, sehingga X t, aturan asosiasi adalah sebuah aturan berbentuk X Y,
dimana X I, Y I, dan X Y = .
Definisi 3 : Support dari aturan asosiasi X Y adalah rasio dari record yang
mengandung X Y dengan total record dalam basis data. Secara matematis dapat
ditulis,
Supp(X Y) = DtYXDt |
...................................................(2.1)
Untuk mendapatkan nilai support menggunakan rumus :
Support (X,Y) = Count (X,Y) / |D|................................................(2.2)
Definisi 4: Minsup ( minimum support) menandakan ambang batas (threshold) yang
menentukan apakah sebuah itemset akan dipergunakan pada perhitungan selanjutnya
untuk pencarian aturan asosiasi.
Definisi 5: Frequent itemset merupakan itemset yang memiliki nilai support
melebihi minsup.
31
Definisi 6 : Confidence dari aturan asosiasi X Y adalah rasio dari record yang
mengandung X Y dengan total record yang mengandung X. Secara matematis
dapat ditulis,
Conf( X Y) = tXDttYXDt
||
.................................................(2.3)
Untuk mendapatkan nilai confidence menggunakan rumus:
Confidence (X Y) = support (X,Y) / support (X).........................(2.4)
Definisi 7 : Minconf (minimum confidence) menandakan ambang batas (threshold)
dari sebuah aturan asosiasi untuk menentukan aturan asosiasi yang kuat (strong
association rule).
Beberapa istilah lain yang digunakan dalam aturan asosiasi
adalah sebagai berikut :
· k-itemset : itemset dengan kardinalitas k (gugus item yang memiliki k buah item).
· candidate k-itemset : itemset yang mungkin merupakan frequent k-itemset.
· frequent k-itemset (Fk): frequent itemset dengan kardinalitas k.
· Aturan asosiasi yang kuat (strong association rule) : aturan asosiasi yang nilai
confidence-nya memenuhi parameter ambang batas minimum confidence.
Misalnya terdapat dataset transaksi D sebagai berikut:
Tabel 2.1. Contoh Tabel Transaksi D
TID ItemsetsT100 1 3 4T200 2 3 5T300 1 2 3 5T400 2 5
32
Jumlah transaksi D = |D| = 4
Jumlah transaksi yang terdiri dari item (2,3) = Count (2,3) = 2
Maka support (2,3) = Count (2,3) / |D|
= 2 / 4
= 0.5
Confidence (2 3) = support (2,3) / support (2)
= 0.5 / 0.75
= 0.67
Secara umum yang dilakukan dalam proses pencarian aturan asosiasi ini dapat
dibagi menjadi dua tahapan, yaitu :
· Pencarian frequent itemset
Yaitu proses pencarian semua frequent itemset dari kandidat itemset yang
memenuhi nilai minsup. Dalam skripsi ini proses pencarian frequent itemset
menggunakan algoritma Apriori.
· Pembentukan strong association rule
Yaitu proses mendapatkan aturan asosiasi yang kuat (strong association rule)
dari kombinasi frequent itemset yang membentuk aturan asosiasi yang
memiliki nilai confidence lebih besar atau sama dengan dari nilai minconf .
Aturan asosiasi dapat ditemukan dari setiap frequent itemset.
Dari proses ini akan menghasilkan aturan asosiasi yang kuat (strong
association rule).
33
E. Algoritma Apriori
Algoritma Apriori adalah algoritma analisis keranjang pasar yang digunakan
untuk menghasilkan aturan asosiasi, dengan pola “if-then”. Algoritma ini
menggunakan pendekatan iteratif yang dikenal dengan level-wise search, dimana k-
kelompok produk digunakan untuk mengeksplorasi (k+1)-kelompok produk atau
(k+1)-itemset (Yulita dkk, 2004). Algoritma Apriori merupakan algoritma untuk
mencari frequent itemset yang berdasarkan prinsip Apriori, yaitu jika suatu itemset
merupakan frequent itemset, maka semua subset-nya akan berupa frequent itemset
(Sukarya,dkk). Pembentukan frequent itemset dilakukan dengan mencari semua
kombinasi item-item yang memiliki support lebih besar atau sama dengan minsup
yang telah ditentukan.
Proses pada algoritma ini membangkitkan frequent itemset per level, dimulai
dari level 1-itemset sampai ke itemset terpanjang, kandidat level yang baru dibentuk
dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai
support-nya. Detail algoritma Apriori adalah sebagai berikut :
Ck : candidate itemset dengan ukuran k
Fk : frequent itemset dengan ukuran k
D : data seluruh transaksi
F1 : {Frequent 1-itemset}
For (k=2; Fk-1 ≠ ; k++) do begin
//Join Step
Ck = apriori-gen(Fk-1);
For all transaksi t D do begin
34
//Prune Step
Ct = subset (Ck, t);
For all kandidat c Ct do
c.count++;
end
Lk = { c Ck | c.count minsup}
End
Answer = kFk;
Berdasarkan algoritma di atas, pada iterasi pertama dihitung jumlah
kemunculan setiap item dalam transaksi untuk menentukan frequent 1-itemset. Pada
iterasi selanjutnya, Fk-1 yang merupakan set dari frequent (k-1)-itemset yang dibentuk
pada iterasi ke-(k-1), digunakan untuk membentuk Ck (himpunan dari candidate k-
itemset). Langkah ini merupakan tahap dari join step. Setelah itu, dilakukan
penelusuran dalam basis data untuk menghitung support bagi setiap candidate
itemset dalam Ck. Untuk setiap transaksi t, dicari semua candidate itemset t dalam set
Ck yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate
itemset dalam set Ck yang terkandung dalam transaksi t disebut Ct dan ditulis dengan
notasi Ct= subset (Ck, t). Langkah ini merupakan tahap dari prune step. Nilai support
dari semua candidate k-itemset dalam Ct dinaikkan. Penelusuran dilanjutkan pada
transaksi berikutnya sampai semua transaksi dalam basis data ditelusuri, kemudian
dicari candidate k-itemset yang memenuhi minsup. Semua candidate k-itemset yang
memenuhi minsup disimpan dalam Fk yang akan digunakan untuk membentuk
frequent (k+1)-itemset.
35
Secara lebih detail, algoritma untuk join step dan prune step adalah sebagai
berikut :
a. Join step
Pada langkah ini dilakukan join Fk-1 dengan Fk-1 untuk memperoleh superset
Ck. Union p q dari frequent (k-1)-itemset p,q Fk-1 dimasukkan ke dalam Ck jika
(k-2)-item pertama dari p dan q sama dan item p[k-1] < q[k-1].
Algoritma:
For all p,q Fk-1 p ≠ q
If ( p[1]=q[1]…p[k-2]=q[k-2] ) ( p[k-1] < q[k-1] )
Then r = p[1],p[2],…, p[k-1],q[k-1]
Insert r into Ck
Langkah pada algoritma ini merupakan perluasan dari setiap frequent (k-1)-
itemset dalam Fk-1 dengan setiap item pada basis data sehingga membentuk k-itemset,
kemudian membuang k-itemset yang memiliki subset ukuran (k-1) yang tidak berada
dalam F k-1.
b. Prune Step
Pada langkah ini dilakukan penelusuran dalam basis data untuk menghitung
support bagi setiap candidate itemset dalam Ck.
Algoritma:
For all itemsets c Ck do
For all (k-1)-subset s of c do
If (s Fk-1) Then
Delete c from Ck
End
36
Algoritma Apriori menggunakan arah pencarian bottom-up, dimana arah
pencarian dimulai dari frequent itemset menuju ke itemset terpanjang. Strategi yang
digunakan breadth-first search dimana proses pencarian dilakukan per level dan
untuk tiap levelnya ditentukan nilai support-nya untuk menentukan frequent itemset
pada level tersebut. Sedangkan strategi penghitungan nilai support dilakukan dengan
horizontal counting, dengan cara membaca transaksi satu persatu, jika ditemukan
itemset yang dicari pada transaksi tersebut maka counter bertambah satu, begitu
selanjutnya.
Contoh penerapan algoritma Apriori dan pembentukan aturan asosiasi
Dengan menggunakan contoh tabel transaksi yang diambil dari situs
www.stttelkom.ac.id/staf/MAB/TA-PA/jurnal-oyo.zip dibawah ini, akan ditunjukkan
cara kerja algoritma Apriori untuk menemukan frequent itemset dan pembangkitan
aturan asosiasi yang memenuhi minsup yang telah ditetapkan sebesar 40% dan
minconf 50%.
Tabel 2.2. Tabel Transaksi
TID
Item
1 B, C, D, E2 A, C3 B4 A, B, C, D5 A, B, D6 C, D7 A, B, D, E8 B, C, D9 B, C, D, E10 B, C, D
37
Dari tabel diatas maka proses pencarian frequent itemset dengan algoritma
Apriori adalah sebagai berikut :
Candidate1-itemset
Count Support(%)
Frequent1-Itemset
Count Support(%)
{A} 4 40% {A} 4 40%{B} 8 80% {B} 8 80%{C} 7 70% {C} 7 70%{D} 8 80% {D} 8 80%{E} 3 30%
Candidate2-itemset
Count Support(%)
Frequent2-Itemset
Count Support(%)
{A,B} 3 30% {B,C} 5 50%{A,C} 2 20% {B,D} 7 70%{A,D} 3 30% {C,D} 6 60%{B,C} 5 50%{B,D} 7 70%{C,D} 6 60%
Candidate 3-itemset
Count Support(%)
{B,C,D} 5 50%
Frequent 3-itemset
Count Support(%)
{B,C,D} 5 50%
Gambar 2.4. Pencarian candidate itemset dan frequent itemset denganminimum support = 40%
Karena jumlah item dari frequent 3-itemset hanya terdiri dari 3 item sehingga
tidak memungkinkan lagi dibentuk frequent 4-itemset maka proses pencarian
dihentikan. Berdasarkan pencarian frequent itemset diatas maka didapat tabel
frequent itemset sebagai berikut :
38
L1
C2 L2
C3 L3
C1
Tabel 2.3. Frequent itemset dengan minimum support 40%
Frequent Itemset Count Support (%){B,C} {B,C,D} 5 50%{C,D} 6 60%{C} {B,D} 7 70%{D} {B} 8 80%
Dari contoh diatas dapat dilihat bahwa bila nilai minsup diturunkan maka
akan banyak kandidat itemset yang terbentuk dan kardinalitas itemset yang lebih
besar lagi, sehingga menyebabkan banyak pengulangan. Tapi untuk nilai minsup yang
besar akan menyebabkan sedikit ditemukan frequent itemset sehingga menjadikan
algoritma ini efisien, karena sedikit sekali melakukan proses pembacaan basis data
dan penghitungan nilai support.
Sehingga dengan frequent itemset yang telah ditemukan diatas dapat diproses
sebagai berikut :
Subset dari frequent itemset: {B},{C},{D},{BC},{BD},{CD},{B,C,D}
Dari subset yang ada dibentuk aturan asosiasi sebagai berikut :
1. B C
Confidence (B C) = support (BC) / support (B)
= 50/80
= 0.625
= 62.5%
2. C B
Confidence (C B) = support (BC) / support (C)
= 50/70
39
= 0.714
= 71.4%
3. B D
Confidence (B D) = support (BD) / support (B)
= 70/80
= 0.875
= 87.5%
4. D B
Confidence (DB) = support (BD) / support (D)
= 70/80
= 0.875
= 87.5%
5. D C
Confidence (D C) = support (CD) / support (D)
= 60/80
= 0.75
= 75%
6. CD
Confidence (C D) = support (CD) / support (C)
= 60/70
= 0.857
= 85.7%
7. B CD
40
Confidence (B CD) = support (BCD) / support (B)
= 50/80
= 0.625
= 62.5%
8. CD B
Confidence (CD B) = support (BCD) / support (CD)
= 50/60
= 0.833
= 83.3%
9. C BD
Confidence (C BD) = support (BCD) / support (C)
= 50/70
= 0.714
= 71.4%
10. BD C
Confidence (BD C) = support (BCD) / support (BD)
= 50/70
= 0.714
= 71.4%
11. D BC
Confidence (D BC) = support (BCD) / support (D)
= 50/80
41
= 0. 625
= 62.5%
12. BC D
Confidence (BC D) = support (BCD) / support (BC)
= 50/50
= 1
= 100%
Dari semua aturan asosiasi yang ada ternyata mempunyai nilai confidence
50% sehingga semua aturan asosiasi yang terbentuk diatas merupakan aturan asosiasi
yang kuat (strong asociation rule).
42
BAB III
ANALISA DAN PERANCANGAN DATA MINING
A. Identifikasi Masalah
Setiap instansi selalu melakukan penyimpanan data. Adapun data yang
disimpan sangatlah banyak dan beragam. Data tersebut disimpan dalam bentuk
database dimana semakin banyak data yang disimpan maka semakin besar pula
memori yang diperlukan untuk menyimpannya. Data yang disimpan merupakan data
yang penting dan dibutuhkan demi terlaksananya kegiatan dalam instansi tersebut.
Salah satu instansi yang dibahas dalam karya tulis ini adalah sebuah
universitas yaitu Universitas Sanata Dharma Yogyakarta. Saat penelitian berlangsung
Universitas Sanata Dharma terdiri dari 8 fakultas dan 24 program studi dengan
jumlah mahasiswa sebanyak 11323 orang. Pihak universitas menyimpan banyak
sekali data, mulai dari data pribadi mahasiswa, data administrasi mahasiswa, data
matakuliah beserta staf pengajar, data staf pengajar, dan masih banyak lagi data yang
harus disimpan. Adapun data-data tersebut memiliki manfaat sesuai dengan
kebutuhan dari pihak universitas.
Data yang dipakai untuk penulisan karya tulis ini adalah data nilai akademik
mahasiswa khususnya program studi Ilmu Komputer. Data nilai akademik ini
merupakan hasil nilai yang diperoleh oleh setiap mahasiswa setiap semesternya.
Jumlah data ini sangat besar karena setiap semester data akan bertambah sebanyak
jumlah matakuliah yang diambil oleh setiap mahasiswa. Sedangkan jumlah
mahasiswa ilmu komputer angkatan 2001 dan 2002 pada bulan Maret 2006 sebanyak
43
141 orang. Pihak universitas harus menyediakan memori dengan kapasitas yang besar
dan pengelolaan yang rumit untuk menyimpan data nilai akademik yang hanya
dipakai untuk menghitung nilai ipk dan ips mahasiswa tiap semester. Hal itu tidak
seimbang antara pengelolaan dan hasil yang diperoleh.
Untuk itu dengan teknologi yang tergolong baru, yaitu data mining penulis
akan menggunakan data nilai akademik tersebut untuk diolah agar menemukan
informasi yang terkandung di dalam data tersebut yang tidak bisa didapat secara
manual.
B. Analisa sistem
Sistem ini akan menghasilkan informasi baru tentang pola keterkaitan antara
tingkat keberhasilan suatu matakuliah dengan tingkat keberhasilan mata kuliah lain.
1. Input
Data diperoleh dari BAPSI (Biro Administrasi Perencanaan dan Sistem
Informasi) Universitas Sanata Dharma Yogyakarta. Data diperoleh dalam bentuk
Microsoft Excel yang terdiri dari mahasiswa prodi Ilmu Komputer dan prodi
Matematika sampai dengan angkatan 2002. Data tersebut telah dikelompokkan
menurut angkatannya. Contoh data dapat dilihat pada lampiran 1. Pada akhirnya
data yang dipakai hanya data nilai akademik mahasiswa ilmu komputer angkatan
2001 dan angkatan 2002 karena dari kedua angkatan tersebut memakai kurikulum
yang sama.
44
Data tersebut memiliki atribut sebagai berikut :
Ø Smt Ambil : saat mahasiswa mengambil matakuliah (berupa
tahun dan semester ganjil atau genap).
Ø Kode Mtk : kode matakuliah yang diambil oleh mahasiswa.
Ø Nama Mtk : nama matakuliah
Ø Sks : jumlah sks setiap matakuliah
Ø Nilai : nilai yang diperoleh mahasiswa setiap matakuliah
Ketika penelitian sedang berlangsung jumlah mahasiswa Ilmu Komputer
angkatan 2001 sebanyak 77 orang, yang masih aktif sebanyak 50 orang dan yang
telah lulus sebanyak 27 orang. Sedangkan mahasiswa Ilmu Komputer angkatan
2002 sebanyak 64 orang dan masih aktif semua.
Pada data tersebut dilakukan pemrosesan awal untuk dipakai dalam
penggalian aturan asosiasi. Yang dilakukan dalam pemrosesan awal adalah
memberikan tambahan atribut nim untuk membedakan antara mahasiswa yang
satu dengan yang lain. Atribut nim berupa integer yang terdiri 4 digit, 2 digit awal
menyatakan angkatan sedangkan 2 digit belakang adalah nomor urut mahasiswa.
Adapun atribut yang dihilangkan yaitu atribut Smt Ambil dan sks karena atribut
tersebut tidak diperlukan. Contoh nilai dari atribut nim dapat dilihat pada tabel
dibawah ini :
Tabel 3.1. Nim mahasiswa
Contoh nim Keterangan2104 Mahasiswa angkatan 2001 nomor urut 42201 Mahasiswa angkatan 2002 nomor urut 1
45
Langkah yang dilakukan selanjutnya adalah menghilangkan matakuliah
yang ganda yaitu matakuliah yang diambil oleh mahasiswa lebih dari satu kali
sehingga bersifat mengulang. Dalam hal ini data yang dipakai adalah data
matakuliah yang diambil pertama kali, karena nilai tersebut dianggap sebagai
nilai pencapaian murni mahasiswa jadi matakuliah yang sifatnya mengulang
dihapus atau dihilangkan. Kemudian apabila terdapat matakuliah yang atribut
nilainya kosong diisi dengan nilai F. Matakuliah yang digunakan dalam penelitian
adalah matakuliah yang berada dalam satu rangkaian diagram alir menurut
kurikulum program studi Ilmu Komputer tahun 2001 yaitu Algoritma dan
Pemrograman I dan matakuliah lain yang diprasyaratinya (dapat dilihat pada
lampiran 2).
Data nilai akademik yang telah dibersihkan digabung menjadi satu tabel.
Data tersebut memiliki atribut nim, kode mtk, mtk (nama matakuliah yang
diambil oleh mahasiswa), nilai (nilai yang diperoleh mahasiwa untuk setiap
matakuliah) dan sks. Total record sebanyak 1938 baris.
Tabel 3.2 Matakuliah yang terdapat dalam satu rangkaian prasyarat
No Kode Nama Matakuliah1. MAK 103 Algoritma dan Pemrograman I2. MAK 104 Algoritma Dan Pemrograman II3. MAK 406 Algoritma Genetika4. MAK 217 Analisis Algoritma5. MAK 312 Animasi Komputer6. MAK 209 Basis Data I7. MAK 303 Basis Data II8. MAK 221 Grafika Komputer Lanjut9. MAK 219 Jaringan Syaraf Tiruan10. MAK 411 Kompresi Data11. MAK 413 Konsep Bahasa Pemrograman
46
12. MAK 414 Pemrograman Client Server13. MAK 417 Pemrosesan Bahasa Alami14. MAK 313 Pemrosesan Citra15. MAK 210 Pengantar Grafika Komputer & Multimedia16. MAK 416 Pengenalan Pola17. MAK 215 Rekayasa Perangkat Lunak I18. MAK 301 Rekayasa Perangkat Lunak II19. MAK 309 Robotika20. MAK 415 Sistem Basis Data Terdistribusi21. MAK 405 Sistem Berbasis Pengetahuan22. MAK 214 Sistem Cerdas23. MAK 205 Struktur Data24. MAK 418 Teknologi Multimedia
Tabel 3.3. Nilai mahasiswa
No Nilai mahasiswa1. A2. B3. C4. D5. E6. F
Dalam skripsi ini yang menjadi itemset adalah matakuliah beserta nilai
yang diperoleh. Untuk kepentingan skripsi ini dibuat 2 jenis dataset yaitu dataset
yang berisi itemset matakuliah dengan nilai A,B dan dataset yang berisi itemset
matakuliah dengan nilai C,D,E,F. Kedua dataset ini dibuat dengan alasan bahwa :
o Mahasiswa dikatakan berhasil dengan memuaskan jika memperoleh nilai
A atau B
o Mahasiswa dikatakan tidak berhasil jika memperoleh nilai D,E atau F
47
o Jika mahasiswa mendapat nilai C, meskipun secara teoritis berhasil
namun pada hemat penulis nilai tersebut masih belum memuaskan
sehingga digabung/dikategorikan sebagai belum berhasil.
Secara konseptual itemset akan mempunyai format seperti pada tabel di
bawah ini :
Tabel 3.4. Tabel contoh itemset dengan matakuliah yang memperoleh nilaiC,D,E,F
Nim Matakuliah dengan nilai C,D,E.F (dikategorikan sebagaiketidakberhasilan)
2101 Analisis Algoritma, Basis Data II, Pengantar Grafika Komputer & Multimedia,Pengenalan Pola, Rekayasa Perangkat Lunak I, Animasi Komputer
2102 Algoritma dan Pemrograman I,Jaringan Syaraf Tiruan,Pemrosesan BahasaAlami,Sistem Berbasis Pengetahuan
2103 Algoritma dan Pemrograman I,Algoritma Dan Pemrograman II,Basis Data I,Kompresi Data,Rekayasa Perangkat Lunak I,Sistem Cerdas,TeknologiMultimedia,Analisis Algoritma,Basis Data II,Pengenalan Pola
2104 Algoritma dan Pemrograman I,Algoritma Dan Pemrograman II,Basis DataII,Grafika Komputer Lanjut,Sistem Basis Data Terdistribusi,Sistem Cerdas,Struktur Data,Analisis Algoritma,Basis Data I
dst dst
2. Proses
Diagram arus data yang terjadi dalam penggalian aturan asosiasi adalah
sebagai berikut :
Pengguna
0Proses
penggalianaturan
asosiasi
Database nilaiakademik
Aturan asosiasi
Minsupp
Minconf
nim, mtk
Gambar 3.1. Diagram Konteks
48
Proses penggalian aturan asosiasi membutuhkan 4 data input, yaitu data
mahasiswa yang terdiri dari nim dan mtk yang diakses dari database nilai
akademik, minimum support dan minimum confidence yang harus dimasukkan
oleh pengguna seperti terlihat pada diagram konteks diatas. Output dari proses
adalah data aturan asosiasi yang akan ditampilkan kepada pengguna.
1Pencarianfrequentk_itemset
2Pembentukan
aturanasosiasi
Pengguna
Database nilaiakademik
frequentk_itemset
Aturan asosiasi
MinsuppMinconf
nim, mtk
Pada DFD level 1 proses penggalian aturan asosiasi dipecah menjadi 2
proses yaitu proses pencarian frequent k-itemset dan proses pembentukan aturan
asosiasi. Proses pencarian frequent k-itemset membutuhkan 2 data input yaitu
data mahasiswa dan minsup. Sedangkan output dari proses tersebut adalah semua
frequent k-itemset. Semua frequent k-itemset akan digunakan sebagai input untuk
proses pembentukan aturan asosiasi. Jadi proses pembentukan aturan asosiasi
membutuhkan 2 data input yaitu frequent k-itemset (output dari proses pencarian
frequent k-itemset) dan minconf. Output dari proses pembentukan aturan asosiasi
adalah semua data aturan asosiasi yang memenuhi minconf.
49
Gambar 3.2. DFD Level 1
Database nilaiakademik
1.1Melakukan
kueri
Pengguna
1.2Pembentukan
kandidatitemset
1.3Pembentukan
frequentk_itemset
Minsupp
kandidatitemset
frequent k_itemset
nim, mtk
nim, mtkyang telah dikueri
Gambar 3.3. DFD level 2
Pada DFD level 2 ini proses pencarian frequent k-itemset dipecah menjadi
proses melakukan kueri, proses pembentukan kandidat itemset, dan proses
pembentukan frequent k-itemset. Pada proses melakukan kueri ini yang
dikerjakan adalah melakukan koneksi ke database nilai akademik kemudian data
mahasiswa yang terdiri dari nim, dan mtk akan dikueri berdasarkan TID. TID
adalah pengidentifikasi yang unik tiap record. Dalam kasus ini yang menjadi TID
adalah nim dan mtk. Output dari proses ini adalah data mahasiswa yang telah
dikueri dan akan menjadi input pada proses pembentukan kandidat itemset.
Output dari proses ini adalah kandidat itemset yang akan digunakan sebagai input
pada proses pembentukan frequent k-itemset. Dari proses pembentukan frequent
k-itemset akan menghasilkan output berupa frequent k-itemset yang nantinya akan
dipakai dalam pembentukan aturan asosiasi.
Notasi yang digunakan :
1. Ck : kandidat k-itemset, dimana k menunjukkan jumlah pasangan itemset.
2. Fk : frequent k-itemset
50
Pada proses pembentukan frequent k-itemset terdapat 2 proses yaitu :
1) Join (penggabungan), yaitu proses untuk menemukan Fk. Proses ini
dilakukan dengan pembangkitan Ck. Ck dibangkitkan dengan melakukan
proses join Fk-1 dengan dirinya sendiri, Ck=Fk-1*Fk-1.
2) Prune (pemangkasan/pemotongan), yaitu proses menghilangkan anggota
Ck yang memiliki support lebih kecil dari minimum support agar tidak
dimasukkan ke dalam Fk.
Tahapan yang dilakukan untuk membentuk frequent k-itemset adalah sebagai
berikut:
1. Menelusuri seluruh record pada TID dan menghitung support dari tiap
itemset. Ini akan menghasilkan kandidat 1-itemset, C1
2. Frequent k_itemset F1 dibentuk dengan menyaring C1 dengan support
yang lebih besar sama dengan minimum support untuk dimasukkan ke
dalam F1.
3. Untuk membentuk F2 dilakukan proses join untuk menghasilkan C2.
4. Dari C2, 2-itemset yang memiliki support yang lebih besar atau sama
dengan minimum support akan disimpan ke dalam F2.
5. Proses ini diulang sampai tidak ada lagi kemungkinan k-itemset.
Langkah-langkah pembentukan aturan asosiasi dari frequent itemset sebagai
berikut :
1. Untuk setiap itemset, bangkitkan seluruh subset yang tidak kosong.
2. Untuk setiap subset yang tidak kosong dikenai aturan asosiasi sehingga
terbentuk aturan.
51
3. Hitung nilai confidence tiap aturan yang terbentuk.
4. Lakukan pengecekan terhadap nilai confidence tiap aturan. Aturan yang
memiliki nilai confidence lebih besar atau sama dengan minimum
confidence adalah strong association rule yang terbentuk.
3. Output
Output dari program adalah aturan asosiasi yang kuat yaitu aturan asosiasi
yang memenuhi minsup dan minconf. Aturan tersebut dapat digunakan untuk
melihat pola keterkaitan antar tingkat keberhasilan atau ketidakberhasilan suatu
matakuliah dengan tingkat keberhasilan atau ketidakberhasilan mata kuliah lain.
4. Analisa Kebutuhan Sistem
a Perangkat Lunak (Software)
Dalam pembuatan program ini perangkat lunak yang dibutuhkan antara
lain:
1). Microsoft Windows XP sebagai sistem operasi
2). Visual Foxpro 8 sebagai program aplikasi
b Perangkat Keras (Hardware)
Dalam pembuatan program ini perangkat keras yang digunakan antara
lain :
1). PC dengan prosesor Intel Pentium4 2.0 Mhz
2). Harddisk 40 GB
3). Memori DDR RAM 256 Mb
52
C. Perancangan
1. Perancangan Modul
Rancangan modul – modul :
a. Modul hitung support
Input : dataset berupa tabel yang merupakan data akademik mahasiswa ;
itemset yang terbentuk dari dataset yang terdiri dari matakuliah dan
nilainya.
Output : nilai support tiap itemset.
Algoritma : mencari jumlah kejadian kandidat itemset pada dataset
kemudian dibagi jumlah total mahasiswa.
b. Modul hitung confidence
Input : nilai support tiap itemset.
Output : nilai confidence yang dipakai untuk menentukan aturan yang
merupakan hasil dari pencarian aturan dan merupakan informasi baru.
Algoritma : nilai support gabungan anteseden dan konsekuen dibagi
dengan nilai support anteseden.
c. Modul penggabungan (join)
Input : itemset atau frequent itemset.
Output : kandidat itemset.
Algoritma : menggabungkan atau memasangkan tiap itemset ataupun
frequent itemset dengan itemset atau frequent itemset yang lain.
d. Modul pemangkasan (prunning)
Input : kandidat itemset dan nilai support
53
Output : frequent itemset
Algoritma : menghilangkan atau mengabaikan itemset ataupun aturan
yang nilai supportnya lebih kecil daripada nilai minimum support.
e. Modul pencarian frequent itemset
Input : dataset yaitu tabel mahasiswa.
Output : frequent itemset
Algoritma :
1) Melakukan pembacaan tabel mahasiswa, kemudian menghitung nilai
support masing-masing kandidat itemset.
2) Setelah itu nilai support masing-masing kandidat itemset
dibandingkan dengan nilai minimum support, apabila lebih kecil maka
kandidat itemset tersebut diabaikan dan tidak akan dipakai untuk
pembentukan aturan sedangkan kandidat itemset yang memiliki
support lebih besar atau sama dengan nilai minimum support menjadi
frequent 1-itemset dan frequent 1_itemset inilah yang akan dibentuk
menjadi aturan asosiasi. Langkah ini bisa disebut juga dengan
prunning.
3) Setelah itu setiap frequent 1_itemset dipasangkan (join) dengan
frequent 1_itemset yang lain sehingga membentuk kandidat 2_itemset.
Setiap kandidat 2_itemset dihitung nilai supportnya kemudian
dilakukan prunning seperti langkah no 2 diatas. Dari langkah no 3 ini
akan meghasilkan frequent 2-itemset, kemudian frequent 2-itemset
dipasangkan lagi untuk membentuk kandidat 3-itemset begitu
54
seterusnya. Proses ini dilakukan sampai tidak bisa terbentuk kandidat
itemset lagi.
f. Modul pembentukan aturan asosiasi.
Input : frequent itemset, nilai minconf.
Output : semua aturan asosiasi yang terbentuk dari semua frequent
itemset.
Algoritma :
1. Membuat subset untuk setiap frequent itemset
2. Membentuk frequent itemset yang ada menjadi aturan dengan cara
membagi menjadi anteseden dan konsekuen. Anteseden adalah itemset
yang terdapat pada sisi kiri dan dijadikan syarat sedangkan konsekuen
adalah itemset yang berada pada sisi kanan dan merupakan
kesimpulan dari syarat yang mengikutinya.
Misalnya terdapat aturan : A dibaca jika A maka B. Dari
pernyataan tersebut A merupakan anteseden sedangkan B merupakan
konsekuen.
g. Modul pembentukan aturan asosiasi yang kuat (strong association rule)
Input : semua aturan asosiasi yang telah terbentuk
Output : aturan asosiasi yang kuat (strong association rule)
Algoritma : Mencari nilai confidence dari setiap aturan asosiasi yang
terbentuk kemudian membandingkannya dengan nilai minimum
confidence. Aturan yang mempunyai nilai confidence lebih besar atau
sama dengan nilai minimum confidence adalah aturan asosiasi yang kuat
55
(strong association rule) yang merupakan hasil akhir dari mining pada
dataset ini
2. Perancangan Struktur Data
a. Proses pencarian kandidat itemset membutuhkan input data berupa tabel
yang telah ada dalam basisdata yaitu tabel mahasiswa2. Proses ini akan
menghasilkan data berupa array itemset yang berisi semua itemset
yang akan digunakan untuk proses selanjutnya dalam pencarian aturan .
Deskripsi array itemset dapat dilihat pada gambar di bawah ini:
Namaarray
Ukuran Keterangan
Itemset 24 x 3 - Jumlah baris didapat dari jumlahmatakuliah
- Jumlah kolom (3) terdiri dari namaitemset,count, support.
Kemudian data yang telah tersimpan dalam array itemset akan
ditampilkan pada listbox yang terdapat pada form Candidate 1_Itemset
seperti contoh di bawah ini:
No Candidate 1_Itemset Count Support1 Algoritma Genetika 3 0.022 Algoritma dan Pemrograman I 62 0.463 Algoritma dan Pemrograman II 91 0.674 Analisis Algoritma 36 0.27
dst dst dst dst
56
Tabel 3.5 Keterangan array itemset
Tabel 3.6 Contoh salah satu isi array itemset
b. Proses prunning membutuhkan data dalam array itemset yang akan
dipisahkan antara itemset yang memenuhi minimum support dan itemset
yang tidak memenuhi minimum support. Itemset yang memenuhi
minimum support akan disimpan dalam listbox yang terdapat pada form
Frequent 1_Itemset yang terdiri dari 4 kolom yaitu No Freq 1_Itemset,
Nama Freq 1_Itemset, Count dan Support.
No Freq 1_Itemset Nama Freq 1_Itemset Count Support
Nama Kolom Keterangan No Freq 1_Itemset nomor / indeks untuk tiap frequent 1_itemsetNama Freq 1_Itemset frequent 1_itemset yang dimaksud yaitu berupa
matakuliah dengan nilai tertentuCount banyaknya kejadian yang muncul tiap frequent
1_itemset yang terjadi berdasarkan tabelmahasiswa2
Support nilai support tiap frequent 1_itemset
c. Sedangkan itemset yang tidak memenuhi minimum support akan
ditampilkan pada listbox Infrequent 1_Itemset dimana format kolom dan
keterangan sama dengan listbox pada form Frequent 1_Itemset.
d. Proses pencarian frequent itemset yang lain membutuhkan data itemset
yang memenuhi minimum support yang telah dicari pada proses prunning
57
Tabel 3.7 Format listbox pada form Frequent 1_Itemset
Tabel 3.8 Keterangan listbox pada form Frequent 1_Itemset
dan telah ditampilkan dalam listbox pada form Frequent 1_Itemset.
Sehingga dalam proses ini tinggal mengakses data pada listbox tersebut.
Proses ini akan menghasilkan itemset yang telah dikelompokkan menjadi
himpunan yang terdiri dari 2 itemset, 3 itemset dst yang akan menjadi
frequent itemset ke-n. Itemset tersebut disimpan dalam listbox bagian atas
pada form Frequent Itemset yang terdiri dari 4 kolom yaitu No Freq
Itemset, Jumlah Itemset, Count dan Support.
No Freq Itemset Jumlah Itemset Count Support
Nama Kolom KeteranganNo Freq Itemset indeks frequent itemsetJumlah Itemset Jumlah itemset dalam frequent itemset tersebutCount banyaknya kejadian yang memenuhi frequent
itemset tersebut dari tabel mahasiswa2Support nilai support tiap frequent itemset tersebut
Frequent 1_ itemset yang menyusun setiap frequent itemset yang telah
ditampilkan pada listbox bagian atas akan ditampilkan pada listbox bagian
bawah pada form Frequent Itemset.
No No Freq Itemset No Freq 1_ Itemset
58
Tabel 3.9 Format listbox bagian atas pada form Frequent Itemset
Tabel 3.11 Format listbox bagian bawah pada form Frequent Itemset
Tabel 3.10 Keterangan listbox bagian atas pada form Frequent Itemset
Nama Kolom KeteranganNo indeks listboxNo Freq Itemset no frequent itemset (merujuk No frequent
itemset pada listbox bagian atas)No Freq 1_Itemset no frequent 1_itemset yang menjadi anggota
frequent itemset
e. Proses pencarian semua aturan asosiasi membutuhkan data yang telah
ditampilkan pada kedua listbox yang terdapat pada form Frequent Itemset.
Data tersebut dipakai untuk menghitung nilai confidence dan mencari
aturan asosiasi.
Anteseden Konsekuen Nilai ConfidenceNo Rule No Freq
ItemsetNo Freq1_Itemset
No Rule No FreqItemset
No Freq1_Itemset
No Rule No FreqItemset
Confidence
Nama Kolom KeteranganNo Rule Nomor aturanNo Freq Itemset Nomor frequent itemset (merujuk Freq Itemset
pada listbox form Frequent Itemset )No Freq 1_Itemset Nomor frequent 1_itemset yang menjadi
antesedenNo Freq 1_Itemset Nomor frequent 1_itemse yang menjadi
konsekuenConfidence Nilai confidence tiap aturan
59
Tabel 3.12 Keterangan listbox bagian bawah pada form Frequent Itemset
Tabel 3.14 Keterangan listbox yang terdapat pada form Semua Rule
Tabel 3.13 Format listbox yang terdapat pada form Semua Rule
f. Proses akhir yaitu menampilkan aturan asosiasi yang telah memenuhi
minimum confidence pada listbox yang terdapat pada form Strong
association rule.
Nilai Confidence Anteseden KonsekuenNoRule No Freq
ItemsetConfidence NoRule No Freq
ItemsetNo Freq1_Itemset
No Rule NoFreqItemset
No Freq1_Itemset
Nama Kolom KeteranganNo Rule Nomor strong association ruleNo FreqItemset
Nomor frequent itemset (merujuk Freq Itemsetpada listbox form Frequent Itemset )
No Freq1_Itemset
Nomor frequent 1_itemset yang menjadianteseden
No Freq1_Itemset
Nomor frequent 1_itemset yang menjadikonsekuen
Confidence Nilai confidence tiap aturan
3. Perancangan Antar Muka dengan Pengguna
1) Form Input
Gambar 3.4 Perancangan Antar Muka Form Input
60
Tabel 3.16 Keterangan listbox yang terdapat pada form Strong association rule
Tabel 3.15 Format listbox yang terdapat pada form Strong association rule
Form ini digunakan untuk memasukkan nilai minimum support dan minimum
confidence.
Terdapat 2 buah tombol yaitu :
a) Reset : untuk mengosongkan kembali textbox Minimum Support dan
Minimum Confidence apabila pengguna ingin mengganti nilai yang telah
diketikkan.
b) Lanjut : untuk melanjutkan ke form berikutnya yaitu form Tabel
Mahasiswa.
2) Form Tabel Mahasiswa
Gambar 3.5 Perancangan Antar Muka Form Tabel Mahasiswa
61
Form diatas untuk menampilkan tabel data akademik mahasiswa yang
merupakan dataset untuk proses data mining dengan algoritma Apriori.
Dalam form ini ditampilkan pula jumlah record yang terdapat pada tabel.
Dalam form terdapat sebuah tombol Proses Algoritma Apriori untuk
melanjutkan ke form Candidate 1_Itemset.
3) Form Candidate 1_Itemset
Gambar 3.6 Perancangan Antar Muka Form Candidate 1_Itemset
Form ini digunakan untuk menampilkan semua kandidat 1_itemset. Listbox
pada form ini akan menampilkan No , Nama Candidate 1_Itemset, Count dan
Support. Dalam form ini terdapat textbox yang akan menampilkan nilai
minimum support yang telah dimasukkan oleh pengguna dan textbox yang
62
akan menampilkan jumlah kandidat 1_itemset secara otomatis. Tombol-
tombol yang terdapat dalam form yaitu :
a) TAMPIL CANDIDATE 1_ITEMSET : untuk menampilkan semua
Candidate 1_itemset beserta Count dan Nilai Supportnya dalam listbox.
b) PRUNNING : untuk menghilangkan atau mengabaikan kandidat
1_itemset yang mempunyai nilai support kurang dari nilai minimum
support.
c) SIMPAN : untuk menyimpan kandidat 1_itemset dalam bentuk .dbf.
d) : untuk melanjutkan ke form berikutnya yaitu form Frequent
Itemset.
63
Setelah pengguna menekan tombol maka akan muncul form Fequent
Itemset seperti dibawah ini :
4) Form Frequent Itemset
Gambar 3.7 Perancangan Antar Muka Form Frequent Itemset
Form ini berfungsi untuk menampilkan semua himpunan frequent itemset
yang mempunyai anggota lebih dari 1. Terdapat 2 buah listbox, dimana
listbox bagian atas akan menampilkan No Freq Itemset, Jumlah Itemset,
Count, dan Support. Sedangkan listbox bagian bawah merupakan listbox yang
akan memberi keterangan mengenai anggota dari frequent itemset yang
terjadi, sehingga akan ditampilkan No, No Freq Itemset, No Itemset.
64
Dalam form ini terdapat 3 buah tombol :
e) TAMPIL FREQUENT ITEMSET : untuk menampilkan semua frequent
itemset yang saling jumlah anggotanya lebih dari 1.
f) DETAIL : untuk menampilkan form Candidate Itemset yang akan
menampilkan semua kombinasi dari frequent 1_itemset (kandidat itemset
yang jumlah anggotanya lebih dari 1).
g) LANJUT : untuk menuju ke form berikutnya (Form Semua Rule).
5) Form Candidate Itemset
65
Gambar 3.8 Perancangan Antar Muka Form Candidate Itemset
Form ini berfungsi untuk menampilkan semua kombinasi dari frequent
1_itemset (kandidat itemset yang jumlah anggotanya lebih dari 1) yang terjadi
yaitu dengan mengklik tombol TAMPIL CANDIDATE ITEMSET yang
terdapat pada form.
6) Form Semua Rule
Gambar 3.9 Perancangan Antar Muka Form Semua Rule
Form ini berfungsi untuk menampilkan semua aturan yang terbentuk dari
frequent itemset yang telah ditemukan. Aturan ini terbentuk dari frequent
itemset yang terdiri lebih dari 1 itemset. Didalam form ini terdapat 3 buah
listbox yang akan menampilkan aturan . Listbox anteseden akan menampilkan
66
No Rule, No Freq Itemset dan No Freq 1_Itemset yang menjadi anteseden aturan ,
sedangkan listbox konsekuen menampilkan No Rule, No Freq Itemset dan No
Freq 1_Itemset yang menjadi konsekuen aturan tersebut. Listbox yang terakhir
akan menampilkan No rule, Freq Itemset dan Confidence dari aturan tersebut.
Terdapat 2 tombol yaitu :
a) TAMPIL SEMUA RULE : untuk menampilkan aturan pada listbox.
b) ASSOCIATION RULE : untuk menampilkan form Strong association
rule.
7) Form Strong association rule
Gambar 3.10 Perancangan Antar Muka Form Strong association rule
67
Form ini adalah form yang akan menampilkan aturan asosiasi yang kuat
(strong association rule ) yang telah terbentuk dan merupakan aturan asosiasi
yang telah memenuhi nilai minimum support dan minimum confidence.
8) Form Frequent 1_Itemset
Gambar 3.11 Perancangan Antar Muka Form Frequent Itemset_1
Pada form ini akan ditampilkan frequent 1_ itemset yang memenuhi nilai
minimum support. Pada listbox akan ditampilkan No, Nama Freq 1_Itemset,
Count dan Support dari itemset tersebut.
68
9) Form Infrequent 1_Itemset
Gambar 3.12 Perancangan Antar Muka Form Infrequent 1_Itemset
Pada form ini akan ditampilkan itemset yang tidak memenuhi nilai minimum
Support. Pada listbox akan ditampilkan No Itemset, Nama Itemset, Count dan
Support dari itemset tersebut.
69
BAB IV
IMPLEMENTASI DATA MINING
Pada saat program pertama kali dijalankan maka akan tampil form seperti
pada gambar dibawah ini:
Gambar 4.1. Form Welcome
Pada form diatas terdapat menu File, Window, Help. Menu File terdiri dari
beberapa submenu yaitu Program Apriori (menu untuk menampilkan Form
Input), Close (menu untuk menutup suatu form yang sedang aktif), Keluar (menu
untuk keluar dari program). Menu Window terdiri dari submenu antara lain
70
Hide (menu untuk menyembunyikan form yang aktif), dan terdapat submenu
untuk menampilkan form yang telah ditampilkan. Menu Help terdiri dari
submenu Daftar Istilah (menu untuk menampilkan istilah-istilah yang terdapat
dalam program serta terdapat beberapa keterangan mengenai program) dan
tentang pembuat. Pengguna dapat memilih salah satu menu atau dapat langsung
menekan tombol Lanjut atau dapat juga dapat menekan tombol Help yang
terdapat pada form untuk mengetahui segala sesuatu tentang program terlebih
dahulu. Jika pengguna menekan tombol Lanjut, maka program akan
menampilkan Form Input seperti gambar dibawah ini.
Gambar 4.2. Form Input
71
Pada form ini, jika pengguna menekan tombol Tambah Dataset maka akan
muncul Open dialog box yang akan menyajikan tabel baru yang akan
dimasukkan ke dalam database. Tombol Pilih Dataset maka combo box akan
menampilkan tabel-tabel yang ada dalam database. Apabila pengguna menekan
Reset, maka program mengosongkan textbox Minimum Support dan textbox
Minimum Confidence. Setelah pengguna memasukkan nilai minimum support
dan minimum confidence penekanan tombol Lanjut akan menampilkan form
Dataset seperti pada gambar dibawah ini :
Gambar 4.3. Form Dataset
72
Apabila pengguna menekan tombol Proses Apriori maka akan muncul
Form Candidate 1_Itemset seperti gambar dibawah ini :
Gambar 4.4. Form Candidate 1_Itemset
Tombol TAMPIL CANDIDATE 1_ITEMSET untuk menampilkan nama
kandidat 1_itemset, count (jumlah kejadian) dan nilai support masing-masing
kandidat 1_itemset yang pada listbox. Berikut ini listing program untuk mencari
kandidat 1_itemset, jumlah kejadian dan supportnya :
73
&&mendapatkan jumlah matakuliah pada tabel mahasiswa2SELECT count(distinct(mtk))as jml FROM mahasiswa2 INTO CURSORjum
&&itemset : jumlah matakuliah thisform.text1.Value = jum.jml
&&mendapatkan jumlah mahasiswa dari tabel mahasiswaSELECT count(distinct(nim)) as N FROM mahasiswa2 INTO CURSORjumNPUBLIC jumlahMahasiswajumlahMahasiswa=jumN.N
&&mendapatkan matakuliah pada tabel mahasiswa2SELECT distinct(mtk)as matakuliah FROM mahasiswa2 INTO CURSOR mtk
&&index:index semua itemset(matakuliah beserta nilainya)PUBLIC indexindex=0
&&mencari support tiap item FOR i=1 TO jum.jml
GO i IN mtkRELEASE jumB index=index+1itemset(index,1)= mtk.matakuliahSELECT count(*) as jmlB from mahasiswa2 WHERE ALLTRIM(upper
(mtk))==ALLTRIM(UPPER(mtk.matakuliah));INTO CURSOR jumBitemset(index,2)= jumB.jmlB &&jumlah kejadianitemset(index,3)= jumB.jmlB/jumN.N &&support
Berikut ini listing program untuk menampilkan candidate 1_itemset pada
listbox :
&& inisialisasi list yang akan dipakai untuk menampilkan itemsetTHISFORM.container2.list1.clearTHISFORM.container2.list1.ColumnCount = 5THISFORM.container2.list1.ColumnLines = .f.THISFORM.container2.list1.Columnwidths = "60,250,40,100,70"
&&menampilkan semua itemset ke list FOR kol= 1 TO index
THISFORM.container2.list1.AddListItem(str(kol), kol,1)THISFORM.container2.list1.AddListItem(itemset(kol,1),kol,2)*THISFORM.container2.list1.AddListItem(itemset(kol,2),
kol,3)THISFORM.container2.list1.AddListItem(STR(itemset(kol,2)), kol,4)THISFORM.container2.list1.AddListItem(STR(itemset(kol,3),4,2), kol,5)
ENDFOR
Selama proses pencarian candidate 1_itemset berlangsung akan muncul
form Loading seperti gambar dibawah ini :
74
Gambar 4.5. Form Loading
Form Loading akan hilang apabila proses pencarian kandidat 1_itemset
telah selesai dan semua candidate 1_itemset telah ditampilkan pada listbox.
Form Loading ini juga akan muncul apabila proses-proses lain berlangsung.
Setelah semua kandidat 1_itemset telah tampil selanjutnya pengguna harus
menekan tombol PRUNNING. Setelah itu akan muncul secara bersamaan form
Frequent 1_Itemset, form Infrequent 1_Itemset (Gambar 4.5) serta form Loading.
Form Frequent 1_Itemset terdiri dari sebuah listbox yang menampilkan frequent
1_itemset yang memenuhi minimum support sedangkan pada form Infrequent
1_Itemset terdiri dari sebuah listbox yang menampilkan kandidat 1_itemset yang
tidak memenuhi minimum support. Itemset yang dipakai untuk pembentukan
aturan adalah frequent 1_itemset yang tampil di listbox pada form Frequent
1_Itemset. Pada form Frequent 1_Itemset terdapat tombol Simpan yang berfungsi
untuk menyimpan Frequent 1_Itemset dalam bentuk dbf.
75
Gambar 4.6. Form Frequent 1_Itemset dan Form Infrequent
Listing program untuk proses prunning adalah sebagai berikut:
Listing program untuk menyimpan frequent 1_itemset adalah sebagai
berikut:
gcDelimName = '.dbf'gcDelimFile = PUTFILE('File Name:', gcDelimName, 'dbf')
76
PUBLIC form_dftr_ya_minsupPUBLIC no_minsupDO FORM form_prunning_itemset1 NAME no_minsupDO FORM form_itemset1 NAME form_dftr_ya_minsup
&&inisialisasi list yg terdapat pd form Infrequent 1_Itemsetno_minsup.list1.clearno_minsup.list1.ColumnCount = 5no_minsup.list1.ColumnLines = .f.no_minsup.list1.Columnwidths = "60,250,40,100,70"no_minsup.list1.Sorted = .T.
&&inisialisasi list yg terdapat pd form frequent 1_Itemsetform_dftr_ya_minsup.list1.clearform_dftr_ya_minsup.list1.ColumnCount = 5form_dftr_ya_minsup.list1.ColumnLines = .f.form_dftr_ya_minsup.list1.Columnwidths = "60,250,40,100,70"form_dftr_ya_minsup.list1.Sorted = .T.
&&index2: index itemset yang memenuhi minsupPUBLIC index2 index2=0kol=0&&dan tidak memenuhi minsup pada list dalam formFOR i=1 TO index IF itemset(i,3)>= minsup
index2=index2+1 itemset2(index2,1)= itemset(i,1) &&itemset itemset2(index2,3)= itemset(i,2) &&jumlah kejadian itemset2(index2,4)= itemset(i,3) &&support
&&menampilkan itemset yg memenuhi minsup form_dftr_ya_minsup.list1.AddListItem(str(index2), index2,1)
form_dftr_ya_minsup.list1.AddListItem(itemset(i,1),index2,2) form_dftr_ya_minsup.list1.AddListItem(STR(itemset(i,2)),
index2,4)form_dftr_ya_minsup.list1.AddListItem(STR(itemset(i,3),4,2),
index2,5) ELSE &&menampilkan itemset yg tidak memenuhi minsup kol=kol+1 no_minsup.list1.AddListItem(str(kol), kol,1) no_minsup.list1.AddListItem(itemset(i,1),kol,2) no_minsup.list1.AddListItem(STR(itemset(i,2)), kol,4) no_minsup.list1.AddListItem(STR(itemset(i,3),4,2),
kol,5) ENDIF
ENDFOR
*mencari nama file table sajapos=RAT("\",gcDelimFile)+1 &&cari nama file setelah namapathnyapos3=RAT("\",gcDelimFile,2)+1nama_direktori_terakhir=SUBSTR(gcDelimFile,pos3,((pos-pos3)-1))table_baru2=SUBSTR(gcDelimFile,pos)pos2=RAT(".",table_baru2)-1 &&menghilangkan ekstensinya tableBaru=LEFT(table_baru2,pos2)CREATE TABLE &tableBaru (No_Item i(8) primary key,Nama_item c(35),Jmlkjadian i(5),Support f(4,2))FOR x=1 TO thisform.list1.ListCount
nit=VAL(thisform.list1.listitem(x,1))nait=thisform.list1.listitem(x,2)jum=VAL(thisform.list1.listitem(x,4))sup=VAL(thisform.list1.listitem(x,5))
insert into &tableBaru (No_Item, Nama_item,Jmlkjadian ,Support);VALUES (nit,nait,jum,sup)ENDFOR
Apabila tidak terdapat frequent 1_itemset yang memenuhi minimum
support maka pada program akan muncul pesan seperti dibawah ini :
Gambar 4.7. Pesan 1
Kemudian setelah pengguna menekan OK akan muncul pesan lagi seperti
dibawah ini :
Apabila pengguna menekan Yes maka akan muncul form Input, jika
menekan No maka program berhenti pada form Candidate 1_Itemset.
77
Gambar 4.8. Pesan2
Setelah proses Prunning selesai untuk melanjutkan proses selanjutnya
pengguna harus menekan tombol , maka akan muncul Form Frequent Itemset
seperti pada Gambar 4.9.
Pada form ini setelah pengguna menekan tombol TAMPIL FREQUENT
ITEMSET maka pada listbox akan muncul frequent itemset dengan jumlah
itemset lebih dari 1 dan frequent itemset tersebut merupakan frequent itemset
yang memenuhi minimum support. Pada listbox bagian bawah akan muncul
keterangan anggota dari frequent itemset tersebut. Apabila salah satu baris pada
listbox bagian atas oleh pengguna didouble klik maka pada listbox keterangan
akan tersorot anggota frequent itemset pada listbox bagian atas yang ditunjuk
oleh pengguna. Dibawah ini akan ditunjukkan contohnya :
78
ATAS
BAWAH
Gambar 4.9. Form Frequent Itemset
Tabel 4.1. Listbox Frequent Itemset No FreqItemset
Jumlah Itemset Count Support
1 2 75 0.532 2 73 0.52
Tabel 4.2 Listbox Keterangan Frequent Itemset
No No FreqItemset
No Freq1_Itemset
1 1 32 1 43 2 44 2 11
Pada tabel 4.1 terlihat bahwa No Freq Itemset 1 mempunyai Jumlah
Itemset sebanyak 2. Pasangan yang dimaksud dapat dilihat pada tabel 4.2. Pada
tabel dapat diketahui bahwa No Freq Itemset 1 terdiri dari Freq 1_Itemset dengan
no 3 dan no 4. Untuk mengetahui frequent itemset yang dimaksud dapat dilihat
pada form Frequent Itemset_1. Apabila tidak terdapat frequent itemset maka
akan muncul pesan 1 dan pesan 2.
Listing program yang terdapat pada tombol TAMPIL FREQUENT
ITEMSET adalah sebagai berikut:
PUBLIC lodi&& menampilkan form loading sekaligus menjadikan sbg objekDO FORM form_loading NAME lodi
&&inisialisasi list item yg telah dipasang2kan (hidden)THISFORM.container2.list1.clearTHISFORM.container2.list1.ColumnCount = 3THISFORM.container2.list1.ColumnLines = .f.THISFORM.container2.list1.Columnwidths = "90,90,90"
&&inisialisasi list untuk menampilkan jumlah pasangan dansuppportTHISFORM.container3.list1.clearTHISFORM.container3.list1.ColumnCount = 4THISFORM.container3.list1.ColumnLines = .f.THISFORM.container3.list1.Columnwidths = "130,100,110,100"
79
&&inisialisasi list untuk menampilkan keteranganTHISFORM.container4.list2.clearTHISFORM.container4.list2.ColumnCount = 3THISFORM.container4.list2.ColumnLines = .f.THISFORM.container4.list2.Columnwidths = "90,90,90"
---------------pasangan 2 item -----------------------------*PUBLIC pisspiss=0 &&indeks keterangan frequent itemsetkol=0 && no pasangan
FOR i=1 TO index2FOR j=i+1 TO index2
*MENCARI JUMLAH KEJADIAN 2 ITEM
*inisialisasi variabel penyimpan sementaraRELEASE data_mhs,data_mhs2
*mendapatkan item yg pertamaSELECT nim FROM mahasiswa2 ;
WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(i,1)));INTO CURSOR data_mhs*mendapatkan item yg keduaSELECT nim FROM mahasiswa2 ;
WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(j,1)));INTO CURSOR data_mhs2
jum_mhs=0 &&jumlah mhs yg mempunyai 2 item yg muncul bersamaanFOR x=1 TO RECCOUNT('data_mhs')
FOR y=1 TO RECCOUNT('data_mhs2')*menyimpan nim mhs yg termasuk dlm cursor data_mhs kedalam nim1
GO x IN data_mhsnim1=data_mhs.nim
*menyimpan nim mhs yg termasuk dlm cursor data_mhs2 kedalam nim2GO y IN data_mhs2nim2=data_mhs2.nim*jika nim sama maka jumlah mhs bertambahIF nim1=nim2
jum_mhs=jum_mhs+1ENDIF
ENDFOR ENDFOR
*menghitung support pasangan 2 itemsup=jum_mhs/jumlahMahasiswa
*membentuk pasangan-pasangan item IF sup>=minsup
kol=kol+1THISFORM.container2.list1.AddListItem(str(kol), kol,1)
THISFORM.container2.list1.AddListItem(STR(i),kol,2)piss=piss+1
THISFORM.container4.list2.AddListItem(str(piss), piss,1)
80
THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(i), piss,3)THISFORM.container2.list1.AddListItem(STR(j),kol,3)piss=piss+1
THISFORM.container4.list2.AddListItem(str(piss), piss,1)THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(j), piss,3) THISFORM.container3.list1.AddListItem(str(kol), kol,1)THISFORM.container3.list1.AddListItem(STR(2),kol,2)THISFORM.container3.list1.AddListItem(STR(jum_mhs),kol,3)THISFORM.container3.list1.AddListItem(STR(sup,5,2),kol,4) ENDIF ENDFOR
ENDFOR
*-------------------------pasangan > 2----------------------*awl=1akhr=koljum_pas=3DO WHILE jum_pas<=index2
FOR i=awl TO akhrFOR j=VAL(thisform.container2.list1.ListItem(i,3))+1 TO index2
qq=0THISFORM.list3.clearTHISFORM.list3.ColumnCount = 2THISFORM.list3.ColumnLines = .f.THISFORM.list3.Columnwidths = "90,90"qq=qq+1THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(j), qq,2)
RELEASE data_mhs2DIMENSION mhs(jumlahMahasiswa),mhs2(jumlahMahasiswa)
SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(j,1)));
INTO CURSOR data_mhs2FOR p=1 TO RECCOUNT('data_mhs2')
GO p IN data_mhs2mhs(p)=data_mhs2.nim
ENDFOR jum_kej=RECCOUNT('data_mhs2')jum_pas_akar=VAL
(thisform.container3.list1.ListItem(i,2))no_item=VAL(thisform.container2.list1.ListItem(i,2))no_item2=VAL(thisform.container2.list1.ListItem(i,3))
DO WHILE jum_pas_akar>2qq=qq+1THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(no_item2), qq,2)
81
RELEASE data_mhs2SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2
(no_item2,1)));INTO CURSOR data_mhs2
IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')
FOR o=1 TO jum_kejGO k IN data_mhs2IF mhs(o)=data_mhs2.nim
jum_mhs=jum_mhs+1mhs2(jum_mhs)=mhs(o)ENDIF
ENDFOR ENDFOR jum_kej=jum_mhsFOR k=1 TO jum_mhs
mhs(k)=mhs2(k)ENDFOR
ELSE jum_kej=0
ENDIF jum_pas_akar=VAL
(thisform.container3.list1.ListItem(no_item,2))nm=no_itemno_item=VAL(thisform.container2.list1.ListItem(nm,2))no_item2=VAL(thisform.container2.list1.ListItem(nm,3))
ENDDO IF jum_pas_akar=2 qq=qq+1 THISFORM.list3.AddListItem(str(qq), qq,1)THISFORM.list3.AddListItem(STR(no_item2), qq,2) qq=qq+1 THISFORM.list3.AddListItem(str(qq), qq,1) THISFORM.list3.AddListItem(STR(no_item), qq,2)
RELEASE data_mhs2SELECT nim FROM mahasiswa2 ;
WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(no_item,1)));INTO CURSOR data_mhs2
IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')
82
FOR o=1 TO jum_kejGO k IN data_mhs2IF mhs(o)=data_mhs2.nim
jum_mhs=jum_mhs+1mhs2(jum_mhs)=mhs(o)ENDIF
ENDFOR ENDFOR FOR k=1 TO jum_mhs
mhs(k)=mhs2(k)ENDFOR jum_kej=jum_mhsRELEASE data_mhs2
SELECT nim FROM mahasiswa2 ;WHERE ALLTRIM(UPPER(mtk))==ALLTRIM(UPPER(itemset2(no_item2,1)));INTO CURSOR data_mhs2
IF jum_kej>0RELEASE mhs2DIMENSION mhs2(jum_kej)jum_mhs=0FOR k=1 TO RECCOUNT('data_mhs2')
FOR o=1 TO jum_kejGO k IN data_mhs2
IF mhs(o)=data_mhs2.nimjum_mhs=jum_mhs+1
mhs2(jum_mhs)=mhs(o) ENDIF
ENDFOR ENDFOR
jum_kej=jum_mhssup=jum_kej/jumlahMahasiswa
ELSEjum_kej=0sup=0
ENDIF ELSE
jum_kej=0sup=0
ENDIF ENDIF IF sup>=minsup
kol=kol+1THISFORM.container2.list1.AddListItem(str(kol), kol,1)THISFORM.container2.list1.AddListItem(STR(i),kol,2)THISFORM.container2.list1.AddListItem(STR(j),kol,3)THISFORM.container3.list1.AddListItem(str(kol), kol,1)THISFORM.container3.list1.AddListItem(STR(jum_pas),kol,2)THISFORM.container3.list1.AddListItem(STR(jum_kej),kol,3)THISFORM.container3.list1.AddListItem(STR(sup,5,2),kol,4)
83
g=qqDO WHILE g>=1
no_it=VAL(thisform.list3.ListItem(g,2))piss=piss+1
THISFORM.container4.list2.AddListItem(str(piss), piss,1)THISFORM.container4.list2.AddListItem(STR(kol), piss,2)THISFORM.container4.list2.AddListItem(STR(no_it), piss,3) g=g-1
ENDDO ENDIF
ENDFOR ENDFOR awl=akhrakhr=koljum_pas=jum_pas+1
ENDDO lodi.release()
Apabila pengguna menekan tombol DETAIL maka akan muncul form
Candidate Itemset yang akan menampilkan semua kombinasi frequent 1_itemset
seperti gambar di bawah ini :
84
Gambar 4.10. Form Candidate Itemset
Form ini akan menampilkan semua kombinasi frequent 1_itemset yang
mungkin terjadi. Untuk melanjutkan proses pengguna harus kembali ke form
Frequent Itemset.
Setelah pengguna mengklik tombol LANJUT pada form Frequent Itemset
maka akan muncul form Semua Rule seperti gambar di bawah ini :
Pada form Semua Rule ini pengguna akan menekan tombol Tampil Semua
Rule maka akan muncul semua aturan asosiasi yang terbentuk. Aturan tersebut
ditampilkan pada 2 buah listbox yaitu listbox anteseden yang terletak paling kiri
dan listbox konsekuen yang terletak di tengah. Sedangkan pada listbox yang
paling kanan merupakan listbox yang berisi nilai confidence tiap aturan.
Listing program untuk menampilkan aturan yang terdiri dari 2 item :
85
Gambar 4.11. Form Semua Rule
*--------menyimpan sementara itemnya FOR j=1 TO jumPasYaMinsupnoPas=VAL(thisform.list5.ListItem(j))IF VAL(form_cari_sup.container3.list1.ListItem(noPas,2))=2
RELEASE sem2 DIMENSION sem2(2)oo=0FOR i=1 TO piss
IF VAL(form_cari_sup.container4.list2.ListItem(i,2))=noPasoo=oo+1 sem2(oo)=VAL
(form_cari_sup.container4.list2.ListItem(i,3))ENDIF
ENDFOR it=sem2(1)di=sem2(2)
*------------NAMPILIN RULE 1 ITEM-----------------*antesedennoRule=noRule+1kol_ante=kol_ante+1
THISFORM.list1.AddListItem(str(noRule), kol_ante,1) THISFORM.list1.AddListItem(STR(noPas),kol_ante,2)THISFORM.list1.AddListItem(STR(it),kol_ante,3)
*konsekuenkol_konse=kol_konse+1
THISFORM.list2.AddListItem(str(noRule), kol_konse,1) THISFORM.list2.AddListItem(STR(noPas),kol_konse,2)THISFORM.list2.AddListItem(STR(di),kol_konse,3)
*hitung confidence con=VAL(form_cari_sup.container3.list1.ListItem(noPas,4))/itemset2(it,4)
kol_con=kol_con+1THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(noPas),kol_con,2)THISFORM.list3.AddListItem(STR(con,5,2),kol_con,4) ENDIF
ENDFOR
Listing program untuk menampilkan rule yang terdiri dari 3 item :
* jika rule terdiri dari 3 itemIF jum_item=3
DIMENSION array_item[jum_item]&&-----------nyimpen item yang 3pasang--------------
ind=0FOR j=1 TO thisform.list7.ListCount
IF VAL(thisform.list7.listitem(j,2))= no_pasind=ind+1
array_item[ind]=thisform.list7.listitem(j,3)ENDIF
ENDFOR &&---nampilin anteseden-----FOR k=1 TO ind
noRule=noRule+1kol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),
kol_ante,1) thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(array_item[k],kol_ante,3)
86
*----------nampilin support yg antesedenya 1-----FOR vv=1 TO form_dftr_ya_minsup.list1.listcount
IF VAL(array_item[k])=VAL(form_dftr_ya_minsup.list1.listitem(vv,1))
jj=jj+1supp=form_dftr_ya_minsup.list1.listitem(vv,5)thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)
*---------------nyari confidence-----------------cof=VAL(supp_pas)/VAL(supp)
kol_con=kol_con+1*--------------nampilin confidencenya----
THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)THISFORM.list3.AddListItem(supp_pas, kol_con,3)THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)
ENDIF ENDFOR
*-----------------------------------------------------ee=array_item[k]FOR l=1 TO ind
IF VAL(array_item[l]) != val(ee)kol_konse=kol_konse+1
*----nampilin konsekuennyathisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(array_item[l],kol_konse,3)
ENDIF ENDFOR
ENDIF ENDIF
ENDFOR &&-----nyimpen kombinasi 2 item-------------FOR s=1 TO ind
FOR t=s+1 TO indop=0DIMENSION pas2[2]noRule=noRule+1op=op+1pas2[op]=array_item[s]kol_ante=kol_ante+1
thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(pas2[op],kol_ante,3)
op=op+1pas2[op]=array_item[t]
&&----nampilin support yang anteseny 2-------FOR gm=1 TO form_cari_sup.container3.list1.listcountIF VAL(form_cari_sup.container3.list1.listitem(gm,2))=op
87
total_sama=0 FOR mg=1 TO form_cari_sup.container4.list2.listcount IF VAL(form_cari_sup.container4.list2.listitem(mg,2))= gm
sama=0FOR sip=1 TO op
IF VAL(pas2[sip])=VAL(form_cari_sup.container4.list2.listitem(mg,3)) sama=sama+1
ENDIFENDFOR IF sama>0
total_sama=total_sama+1ENDIF
ENDIFENDFOR
IF total_sama=opjj=jj+1
supp=form_cari_sup.container3.list1.listitem(gm,4thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)
*hitung confidence rule yg antesedenya 2 itemcof=VAL(supp_pas)/VAL(supp)
*nampilin confidencenyakol_con=kol_con+1
THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)
THISFORM.list3.AddListItem(supp_pas, kol_con,3) THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)
ENDIF ENDIF
ENDFOR *-------------------------------------------------------
*nampilin anteseden yang terdiri dari 2 itemkol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),kol_ante,1
thisform.list1.AddListItem(STR(no_pas),kol_ante,2)thisform.list1.AddListItem(pas2[op],kol_ante,3)
FOR x=1 TO indsama=0FOR z=1 TO op
IF VAL(array_item[x])=VAL(pas2[z])sama=sama+1
ENDIF ENDFORIF sama<1
*nampilin konsekuen yang terdiri dari 2 itemkol_konse=kol_konse+1
thisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(array_item[x],kol_konse,3)
ENDIF ENDFOR
ENDFOR ENDFOR
ENDIF
88
Untuk menampilkan aturan yang terdiri dari 4 item, proses awalnya sama
dengan yang untuk menampilkan 3 item hanya saja membutuhkan listbox
bantuan untuk menampung sementara antesedennya:
*---anteseden bantuan---* RELEASE pas2 DIMENSION pas2[3] op=0
FOR km=1 TO ind9IF km<=1
noRule=noRule+1kol_ante=kol_ante+1
thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)
thisform.list1.AddListItem(THISFORM.List9.ListItem(km,3),kol_ante,3)
*----------op=op+1pas2[op]=THISFORM.List9.ListItem(km,3)*----------ELSE
IF VAL(THISFORM.List9.ListItem(km,1))= VAL(THISFORM.List9.ListItem(km-1,1))
ELSEnoRule=noRule+1RELEASE pas2
DIMENSION pas2[3] op=0
ENDIF*-------nampilin support yang antesedeny 3-----
FOR gm=1 TOform_cari_sup.container3.list1.listcount
IF VAL(form_cari_sup.container3.list1.listitem(gm,2))=optotal_sama=0
FOR mg=1 TOform_cari_sup.container4.list2.listcount
IF VAL(form_cari_sup.container4.list2.listitem(mg,2))= gmsama=0FOR sip=1 TO op
IF VAL(pas2[sip])=VAL(form_cari_sup.container4.list2.listitem(mg,3))sama=sama+1
ENDIFENDFOR
IF sama>0total_sama=total_sama+1
ENDIFENDIF
ENDFORIF total_sama=op
jj=jj+1supp=form_cari_sup.container3.list1.listitem(gm,4)
thisform.list10.AddListItem(STR(noRule),jj,1)thisform.list10.AddListItem(supp,jj,2)
cof=VAL(supp_pas)/VAL(supp)
89
kol_con=kol_con+1THISFORM.list3.AddListItem(str(noRule), kol_con,1) THISFORM.list3.AddListItem(STR(no_pas),kol_con,2)THISFORM.list3.AddListItem(supp_pas, kol_con,3) THISFORM.list3.AddListItem(STR(cof,5,2),kol_con,4)
ENDIF ENDIF
ENDFOR*-------------------------------------------------
kol_ante=kol_ante+1thisform.list1.AddListItem(STR(noRule),kol_ante,1)thisform.list1.AddListItem(STR(no_pas),kol_ante,2)
thisform.list1.AddListItem(THISFORM.List9.ListItem(km,3),kol_ante,3)op=op+1pas2[op]=THISFORM.List9.ListItem(km,3)
ENDIFFOR km2=1 TO ind6
IF VAL(THISFORM.List6.ListItem(km2,1))=VAL(THISFORM.List9.ListItem(km,1))kol_konse=kol_konse+1
thisform.list2.AddListItem(STR(noRule),kol_konse,1)thisform.list2.AddListItem(STR(no_pas),kol_konse,2)thisform.list2.AddListItem(THISFORM.List6.ListItem(km2,3),kol_konse,3ENDIF
ENDFOR ENDFOR ENDIF ENDFOR
lodi.release()thisform.text1.Value=thisform.list3.ListCount
Setelah semua proses menampilkan semua aturan telah selesai kemudian
pengguna harus menekan tombol ASSOCIATION RULE untuk melakukan
proses selanjutnya. Kemudian akan tampil form Strong association rule ( gambar
4.10). Dalam form tersebut akan ditampilkan aturan asosiasi yang memenuhi
minimum confidence sering disebut aturan asosiasi yang kuat (Strong
Association Rule) Dalam form ini terdapat 3 buah listbox untuk menampilkan
nilai confidence , anteseden, konsekuen tiap aturan. Tombol Simpan untuk
menyimpan aturan yang terbentuk serta nilai confidencenya. Proses penyimpanan
90
dilakukan 3 kali. Pertama menyimpan nilai confidence, kemudian anteseden lalu
yang terakhir konsekuen. Hasil penyimpanan dalam bentuk .dbf.
Form Daftar Istilah akan menampilkan istilah-istilah yang terdapat pada
program. Tampilannya dapat dilihat pada gambar dibawah ini :
91
Gambar 4.12. Form Aturan Asosiasi Yang Terbentuk
Dibawah ini adalah form tentang pembuat :
BAB V
ANALISA HASIL DAN PEMBAHASAN
92
Gambar 4.13. Form Daftar Istilah
Gambar 4.14. Form About
A. Percobaan Jenis I
Dari program yang telah dibuat kemudian dilakukan percobaan jenis I dengan
pada 2 buah dataset dengan menginputkan nilai minimum support berkisar 0.3 sd
0.6.5 dan minimum confidence 0.5.
1. Percobaan dengan Dataset I
Dataset I merupakan dataset nilai akademik mahasiswa yang dinyatakan
berhasil dengan nilai tiap matakuliah A atau B. Pada Dataset I ini input minimum
support hanya berkisar 0.4 s.d 0.65 karena dengan minimum support yang lebih kecil
aturan asosiasi yang dihasilkan sangat banyak dan hasilnya kurang begitu bermakna.
Contoh format Dataset I adalah sebagai berikut :
Nim Kode _mtk Mtk Nilai 2101 MAK 205 Struktur Data A2101 MAK 103 Algoritma dan Pemrograman I B2101 MAK 104 Algoritma Dan Pemrograman II B2101 MAK 209 Basis Data I B2101 MAK 221 Grafika Komputer Lanjut B2101 MAK 411 Kompresi Data B2101 MAK 413 Konsep Bahasa Pemrograman B2101 MAK 313 Pemrosesan Citra B2101 MAK 301 Rekayasa Perangkat Lunak II B2101 MAK 214 Sistem Cerdas B2101 MAK 418 Teknologi Multimedia B2102 MAK 217 Analisis Algoritma A2102 MAK 209 Basis Data I A2102 MAK 309 Robotika A2102 MAK 104 Algoritma Dan Pemrograman II B2102 MAK 406 Algoritma Genetika B2102 MAK 303 Basis Data II B2102 MAK 413 Konsep Bahasa Pemrograman B2102 MAK 210 Pengantar Grafika Komputer & Multimedia B2102 MAK 416 Pengenalan Pola B2102 MAK 215 Rekayasa Perangkat Lunak I B2102 MAK 301 Rekayasa Perangkat Lunak II B2102 MAK 214 Sistem Cerdas B2102 MAK 205 Struktur Data B
93
Tabel 5.1 Contoh format Dataset I
dst dst dst dst
a). Percobaan I.1.a
Minimum Support : 0.4
Menghasilkan frequent 1_itemset yang terdiri dari 16 itemset yaitu sebagai
berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Algoritma dan Pemrograman II} 50 0.363. {Analisis Algoritma} 96 0.704. {Basis Data I} 47 0.345. {Basis Data II} 75 0.556. {Grafika Komputer Lanjut } 42 0.317. {Kompresi Data} 35 0.268. {Konsep Bahasa Pemrograman} 66 0.489. {Pemrograman Client Server} 74 0.5410. {Pengantar Grafika Komputer & Multimedia} 105 0.7711. {Rekayasa Perangkat Lunak I} 54 0.3912. {Rekayasa Perangkat Lunak II} 50 0.3613. {Sistem Basis Data Terdistribusi} 41 0.3014. {Sistem Cerdas} 91 0.6615. {Struktur Data} 79 0.5816. {Teknologi Multimedia} 47 0.34
Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset dan frequent
3_itemset sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 63 0.462.
{1,6} 68 0.50
3. {1,7} 56 0.41
94
Tabel 5.2 Frequent 1_itemset dengan minsup 0.4 pada dataset I
Tabel 5.3 Frequent 2_itemset dengan minsup 0.4 pada dataset I
4. {2,3} 64 0.475. {2,5} 64 0.476. {2,6} 79 0.587. {2,7} 76 0.558. {2,8} 61 0.459. {3,6} 64 0.4710. {3,7} 63 0.4611. {3,8} 55 0.4012. {5,6} 60 0.4413. {5,7} 58 0.4214. {6,7} 74 0.5415. {6,8} 64 0.4716. {7,8} 61 0.45
No Frequent 3-itemset Count Support1. {1,2,6} 57 0.422. {2,3,7} 67 0.423. {2,6,7} 65 0.47
Pada percobaan ini iterasi berhenti pada frequent 3_itemset kemudian dari
frequent itemset di atas terbentuk aturan asosiasi yang kuat (strong association rule)
sebagai berikut :
No Aturan Aturan asosiasi Confidence
1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman II Algoritma dan Pemrograman I 0.663. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.874. Grafika Komputer Lanjut Algoritma dan Pemrograman I 0.655. Algoritma dan Pemrograman I Kompresi Data 0.716. Kompresi Data Algoritma dan Pemrograman I 0.627. Algoritma dan Pemrograman II Analisis Algoritma 0.678. Analisis Algoritma Algoritma dan Pemrograman II 0.869. Algoritma dan Pemrograman II Basis Data II 0.67
95
Tabel 5.5 Aturan asosiasi dengan minsup 0.4 dan minconf 0,5 pada dataset I
Tabel 5.4 Frequent 3_itemset dengan minsup 0.4 pada dataset I
10. Basis Data II Algoritma dan Pemrograman II 0.8711. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.8312. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.7613. Algoritma dan Pemrograman II Kompresi Data 0.7814. Kompresi Data Algoritma dan Pemrograman II 0.8315. Algoritma dan Pemrograman II Konsep Bahasa Pemrograman 0.6416. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7817. Analisis Algoritma Grafika Komputer Lanjut 0.8618. Grafika Komputer Lanjut Analisis Algoritma 0.6119. Analisis Algoritma Kompresi Data 0.8420. Kompresi Data Analisis Algoritma 0.6921. Analisis Algoritma Konsep Bahasa Pemrograman 0.7322. Konsep Bahasa Pemrograman Analisis Algoritma 0.6923. Basis Data II Grafika Komputer Lanjut 0.8124. Grafika Komputer Lanjut Basis Data II 0.5725. Basis Data II Kompresi Data 0.7826. Kompresi Data Basis Data II 0.6327. Grafika Komputer Lanjut Kompresi Data 0.7028. Kompresi Data Grafika Komputer Lanjut 0.8129. Grafika Komputer Lanjut Konsep Bahasa Pemrograman 0.6130. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8231. Kompresi Data Konsep Bahasa Pemrograman 0.6832. Konsep Bahasa Pemrograman Kompresi Data 0.7833. Algoritma dan Pemrograman I Algoritma dan Pemrograman II &
Grafika Komputer Lanjut 0.72
34. Algoritma dan Pemrograman II Algoritma dan Pemrograman I &Grafika Komputer Lanjut
0.60
35. Grafika Komputer Lanjut Algoritma dan Pemrograman I &Algoritma dan Pemrograman II
0.55
36. Algoritma dan Pemrograman I & Algoritma dan Pemrograman II Grafika Komputer Lanjut
0.91
37. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II
0.84
38. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I
0.72
39. Algoritma dan Pemrograman II Analisis Algoritma & KompresiData
0.60
40. Analisis Algoritma Algoritma dan Pemrograman II & KompresiData
0.76
41. Kompresi Data Algoritma dan Pemrograman II&AnalisisAlgoritma
0.64
96
42. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData
0.89
43. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma
0.76
44. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II
0.91
45. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data
0.67
46. Grafika Komputer Lanjut Algoritma dan Pemrograman II &Kompresi Data
0.61
47. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut
0.71
48. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data
0.81
49. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut
0.85
50. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II
0.87
Dari aturan asosiasi yang terbentuk terdapat beberapa aturan yang janggal
misalnya aturan Analisis Algoritma Grafika Komputer Lanjut, karena pada
kenyataannya matakuliah Analisa Algoritma diambil bersamaan dengan matakuliah
Grafika Komputer Lanjut. Hal itu diduga karena karena pola pada dataset bersifat
menyebar.
b). Percobaan I.1.b
Minimum support : 0.45
Menghasilkan frequent 1_itemset yang terdiri dari 8 itemset yaitu
sebagai berikut:
97
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Konsep Bahasa Pemrograman} 66 0.485. {Pemrograman Client / Server} 74 0.546. {Pengantar Grafika Komputer dan Multimedia} 105 0.777. {Sistem Cerdas} 91 0.668. {Struktur Data} 79 0.58
Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset dan frequent
3_itemset sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 63 0.462.
{1,6} 68 0.50
3. {2,3} 64 0.474. {2,5} 64 0.475. {2,6} 79 0.586. {2,7} 76 0.557. {3,6} 64 0.478. {3,7} 63 0.469. {6,7} 74 0.5410. {6,8} 64 0.47
No Frequent 3-itemset Count Support 1. {2,6,7} 65 0.47
98
Tabel 5.6 Frequent 1_itemset dengan minsup 0.45 pada dataset I
Tabel 5.7 Frequent 2_itemset dengan minsup 0.45 pada dataset I
Tabel 5.8 Frequent 3_itemset dengan minsup 0.45 pada dataset I
Pada percobaan ini iterasi berhenti pada frequent 3_itemset kemudian dari
frequent itemset diatas terbentuk aturan asosiasi yang kuat (strong association rule)
sebagai berikut:
NoAturan
Aturan asosiasi Confidence
1 Algoritma dan Pemrograman I Analisis Algoritma 0.802 Analisis Algoritma Algoritma dan Pemrograman I 0.663 Algoritma dan Pemrograman I Pengantar Grafika
dan Multimedia0.87
4 Pengantar Grafika dan Multimedia Algoritma danPemrograman I
0.65
5 Analisis Algoritma Basis Data II 0.676 Basis Data II Analisis Algoritma 0.867 Analisis Algoritma Pemrograman Client/server 0.678 Pemrograman Client/server Analisis Algoritma 0.879 Analisis Algoritma Pengantar Grafika dan
Multimedia0.83
10 Pengantar Grafika dan Multimedia AnalisisAlgoritma
0.76
11 Analisis Algoritma Sistem Cerdas 0.7812 Sistem Cerdas Analisis Algoritma 0.8313 Basis Data II Pengantar Grafika dan Multimedia 0.8614 Pengantar Grafika dan Multimedia Basis Data II 0.6115 Basis Data II Sistem Cerdas 0.8416 Sistem Cerdas Basis Data II 0.6917 Pengantar Grafika dan Multimedia Sistem Cerdas 0.7018 Sistem Cerdas Pengantar Grafika dan Multimedia 0.8119 Pengantar Grafika dan Multimedia Struktur Data 0.6120 Struktur Data Pengantar Grafika dan Multimedia 0.8221 Analisis Algoritma Pengantar Grafika dan
Multimedia & Sistem Cerdas0.67
22 Pengantar Grafika dan Multimedia AnalisisAlgoritma & Sistem Cerdas
0.61
23 Sistem Cerdas Analisis Algoritma & PengantarGrafika dan Multimedia
0.71
24 Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas
0.81
99
Tabel 5.9 aturan asosiasi dengan minsup 0.45 dan minconf 0.5 pada dataset I
25 Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia
0.85
26 Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma
0.87
c). Percobaan I.1.c
Minimum support : 0.5
Menghasilkan frequent 1_itemset yang terdiri dari 7 itemset yaitu
sebagai berikut:
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Pemrograman Client / Server} 74 0.545. {Pengantar Grafika Komputer dan Multimedia} 105 0.776. {Sistem Cerdas} 91 0.667. {Struktur Data} 79 0.58
Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset sebagai
berikut :
No Frequent 2-itemset Count Support1. {2,5} 79 0.582.
{2,6} 76 0.55
3. {5,6} 74 0.54
Pada percobaan ini iterasi berhenti pada frequent 2_itemset kemudian dari
frequent itemset diatas terbentuk aturan asosiasi yang kuat (strong association rule)
sebagai berikut:
100
Tabel 5.10 Frequent 1_itemset dengan minsup 0.5 pada dataset I
Tabel 5.11 Frequent 2_itemset dengan minsup 0.5 pada dataset I
Tabel 5.12 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 pada dataset I
d). Percobaan I.1.d
Minimum support : 0.55
Menghasilkan frequent 1_itemset yang terdiri dari 6 itemset yaitu
sebagai berikut:
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 79 0.582. {Analisis Algoritma} 96 0.703. {Basis Data II} 75 0.554. {Pengantar Grafika Komputer dan Multimedia} 105 0.775. {Sistem Cerdas} 91 0.666. {Struktur Data} 79 0.58
Dari frequent 1_itemset diatas dapat dibentuk frequent 2_itemset sebagai
berikut :
No Frequent 2-itemset Count Support1. {2,4} 79 0.58
101
NoAturan
Aturan asosiasi Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia
Sistem Cerdas0.70
6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia
0.81
Tabel 5.13 Frequent 1_itemset dengan minsup 0.55 pada dataset I
Tabel 5.14 Frequent 2_itemset dengan minsup 0.55 pada dataset I
2.
{2,5} 76 0.55
Dari frequent 1_itemset diatas dapat dibentuk strong association rule sebagai
berikut :
e). Percobaan I.1.e
Minimum Support : 0.6
Terdapat frequent 1_itemset sebanyak 3 yaitu sebagai berikut :
No Frequent 1-itemset Count Support1. {Analisis Algoritma} 96 0.702. {Pengantar Grafika Komputer dan Multimedia} 105 0.773. {Sistem Cerdas} 91 0.66
Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga
tidak akan terbentuk aturan asosiasi yang kuat karena sebuah aturan asosiasi
terbentuk dari paling sedikit 2 itemset.
f). Percobaan I.1.f
Minimum support: 0.65
102
NoAturan
Aturan asosiasi Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83
Tabel 5.16 Tabel frequent 1_itemset dengan minsup 0.6 pada dataset I
Tabel 5.15 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 pada dataset I
Terdapat frequent 1_itemset sebanyak 3 yaitu sebagai berikut :
No Frequent 1-itemset Count Support1. {Analisis Algoritma} 96 0.702. {Pengantar Grafika Komputer dan Multimedia} 105 0.773. {Sistem Cerdas} 91 0.66
Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga
tidak akan terbentuk aturan asosiasi yang kuat karena sebuah aturan asosiasi
terbentuk dari paling sedikit 2 itemset.
2. Percobaan dengan Dataset II
Pada percobaan ini dataset yang dipakai adalah nilai akademik mahasiswa
yang dinyatakan kurang berhasil dalam hal ini tiap matakuliah mendapat nilai
C,D,E,atau F. Pada Dataset II ini input minimum support berkisar 0.3 s.d
0.65. Contoh format Dataset II adalah sebagai berikut :
Nim Kode_mtk Mtk Nilai2114 MAK 103 Algoritma dan Pemrograman I C2114 MAK 104 Algoritma Dan Pemrograman II C2114 MAK 217 Analisis Algoritma C2114 MAK 303 Basis Data II C2114 MAK 411 Kompresi Data C2114 MAK 215 Rekayasa Perangkat Lunak I C2114 MAK 301 Rekayasa Perangkat Lunak II C2114 MAK 214 Sistem Cerdas C2114 MAK 205 Struktur Data C2114 MAK 209 Basis Data I D2115 MAK 417 Pemrosesan Bahasa Alami C2115 MAK 301 Rekayasa Perangkat Lunak II C2115 MAK 221 Grafika Komputer Lanjut D2115 MAK 219 Jaringan Syaraf Tiruan D
103
Tabel 5.17 Frequent 1_itemset dengan minsup 0.65 pada dataset I
Tabel 5.18 Contoh format Dataset II
2115 MAK 413 Konsep Bahasa Pemrograman Fdst dst dst dst
a). Percobaan I.2.a
Minimum support : 0.3
Terdapat frequent 1_itemset sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Sistem Cerdas} 48 0.368. {Struktur Data} 62 0.46
Dari frequent 1_itemset diatas terbentuk frequent 2_itemset dan frequent 3_itemset
sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 52 0.392.
{1,3} 51 0.38
3. {1,5} 44 0.334. {2,3} 76 0.565. {2,4} 49 0.366. {2,5} 63 0.477. {2,6} 51 0.38
104
Tabel 5.19 Frequent 1_itemset dengan minsup 0.3 pada dataset II
Tabel 5.20 Frequent 2_itemset dengan minsup 0.3 pada dataset II
8. {2,8} 54 0.409. {3,4} 50 0.3710. {3,5} 66 0.4911. {3,6} 57 0.4212. {3,8} 56 0.4113. {4,5} 42 0.3114. {5,6} 44 0.3315. {5,8} 43 0.32
No Frequent 3-itemset Count Support1. {1,2,3} 45 0.332. {2,3,4} 45 0.333. {2,3,5} 55 0.414. {2,3,6} 47 0.355. {2,3,8} 50 0.376. {3,5,8} 42 0.31
Dari frequent 2_itemset dan frequent 3_itemset terbentuk strong association rule
sebanyak 59 yaitu sebagai berikut :
NoAturan
Aturan Asosiasi Confidence
1 Algoritma dan Pemrograman I Algoritma danPemrograman II
0.85
2 Algoritma dan Pemrograman II Algoritma danPemrograman I
0.58
3 Algoritma dan Pemrograman I Basis Data I 0.834 Basis Data I Algoritma dan Pemrograman I 0.555 Algoritma dan Pemrograman I Rekayasa Perangkat
Lunak I0.72
6 Rekayasa Perangkat Lunak I Algoritma danPemrograman I
0.52
7 Algoritma dan Pemrograman II Basis Data I 0.838 Basis Data I Algoritma dan Pemrograman II 0.809 Algoritma dan Pemrograman II Basis Data II 0.5310 Basis Data II Algoritma dan Pemrograman II 0.8211 Algoritma dan Pemrograman II Rekayasa Perangkat
Lunak I0.70
105
Tabel 5.22 Aturan asosiasi dengan minsup 0.3 dan minconf 0,5 pada dataset II
Tabel 5.21 Frequent 3_itemset dengan minsup 0.3 pada dataset II
12 Rekayasa Perangkat Lunak I Algoritma danPemrograman II
0.74
13 Algoritma dan Pemrograman II Rekayasa PerangkatLunak
0.56
14 Rekayasa Perangkat Lunak Algoritma danPemrograman II
0.72
15 Algoritma dan Pemrograman II Struktur Data 0.5916 Struktur Data Algoritma dan Pemrograman II 0.8717 Basis Data I Basis Data II 0.5318 Basis Data II Basis Data I 0.8519 Basis Data I Rekayasa Perangkat Lunak I 0.7020 Rekayasa Perangkat Lunak I Basis Data I 0.7721 Basis Data I Rekayasa Perangkat Lunak 0.6022 Rekayasa Perangkat Lunak Basis Data I 0.8023 Basis Data I Struktur Data 0.5924 Struktur Data Basis Data I 0.8925 Basis Data II Rekayasa Perangkat Lunak I 0.7126 Rekayasa Perangkat Lunak I Rekayasa Perangkat
Lunak0.52
27 Rekayasa Perangkat Lunak Rekayasa Perangkat LunakI
0.63
28 Rekayasa Perangkat Lunak I Struktur Data 0.5029 Struktur Data Rekayasa Perangkat Lunak I 0.7030 Algoritma dan Pemrograman I Algoritma dan
Pemrograman II & Basis Data I0.72
31 Algoritma dan Pemrograman I Basis Data I 0.8532 Algoritma dan Pemrograman I & Basis Data I
Algoritma dan Pemrograman II0.87
33 Algoritma dan Pemrograman II & Basis Data I Algoritma dan Pemrograman I
0.59
34 Basis Data II Algoritma dan Pemrograman II & BasisData I
0.75
35 Algoritma dan Pemrograman II & Basis Data I Basis Data II
0.59
36 Algoritma dan Pemrograman II & Basis Data IIBasis Data I
0.92
37 Basis Data I & Basis Data II Algoritma danPemrograman II
0.89
38 Algoritma dan Pemrograman II Basis Data I &Rekayasa Perangkat Lunak I
0.61
39 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I
0.59
106
40 Rekayasa Perangkat Lunak I Algoritma danPemrograman II & Basis Data I
0.64
41 Algoritma dan Pemrograman II & Basis Data IRekayasa Perangkat Lunak I
0.73
42 Algoritma dan Pemrograman II & Rekayasa PerangkatLunak I Basis Data I
0.87
43 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II
0.84
44 Algoritma dan Pemrograman II Basis Data I &Rekayasa Perangkat Lunak II
0.52
45 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak II
0.50
46 Rekayasa Perangkat Lunak II Algoritma danPemrograman II & Basis Data I
0.66
47 Algoritma dan Pemrograman II & Basis Data IRekayasa Perangkat Lunak II
0.63
48 Algoritma dan Pemrograman II & Rekayasa PerangkatLunak II Basis Data I
0.92
49 Basis Data I &Rekayasa Perangkat Lunak II Algoritma dan Pemrograman II
0.83
50 Algoritma dan Pemrograman II Basis Data I &Struktur Data
0.55
51 Basis Data I Algoritma dan Pemrograman II &Struktur Data
0.53
52 Struktur Data Algoritma dan Pemrograman II & BasisData I
0.80
53 Algoritma dan Pemrograman II & Basis Data I Struktur Data
0.66
54 Algoritma dan Pemrograman II & Struktur Data Basis Data I
0.93
55 Basis Data I & Struktur Data Algoritma danPemrograman II
0.90
56 Struktur Data Basis Data I & Rekayasa PerangkatLunak I
0.67
57 Basis Data I & Rekayasa Perangkat Lunak I Struktur Data
0.63
58 Basis Data I & Struktur Data Rekayasa PerangkatLunak I
0.76
59 Rekayasa Perangkat Lunak I &Struktur Data Basis Data I
0.97
b). Percobaan I.2.b
107
Minimum Support : 0.35
Terbentuk frequent 1_itemset sebanyak 8 itemset yaitu sebagai berikut
:
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Sistem Cerdas} 48 0.368. {Struktur Data} 62 0.46
Kemudian dari frequent 1_itemset diatas terbentuk frequent 2_itemset dan
frequent 3_itemset yaitu sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 52 0.392.
{1,3} 51 0.38
3. {2,3} 76 0.564. {2,4} 49 0.365. {2,5} 63 0.476. {2,6} 51 0.387. {2,8} 54 0.408. {3,4} 50 0.379. {3,5} 66 0.4910. {3,6} 57 0.4211. {3,8} 56 0.41
No Frequent 3-itemset
Count Support
108
Tabel 5.23 Frequent 1_itemset dengan minsup 0.35 pada dataset II
Tabel 5.24 Frequent 2_itemset dengan minsup 0.35 pada dataset II
Tabel 5.25 Frequent 3_itemset dengan minsup 0.35 pada dataset II
1. {2,3,5} 55 0.412. {2,3,6} 47 0.353. {2,3,8} 50 0.37
Dari frequent itemset diatas dapat dibentuk strong association rule sebanyak 34
sebagai berikut :
109
110
No Aturan Aturan Asosiasi Confidence1 Algoritma dan Pemrograman I Algoritma dan
Pemrograman II0.85
2 Algoritma dan Pemrograman II Algoritma danPemrograman I
0.58
3 Algoritma dan Pemrograman I Basis Data I 0.834 Basis Data I Algoritma dan Pemrograman I 0.555 Algoritma dan Pemrograman II Basis Data I 0.836 Basis Data I Algoritma dan Pemrograman II 0.807 Algoritma dan Pemrograman II Basis Data II 0.538 Basis Data II Algoritma dan Pemrograman II 0.829 Algoritma dan Pemrograman II Rekayasa
Perangkat Lunak I0.70
10 Rekayasa Perangkat Lunak I Algoritma danPemrograman II
0.74
11 Algoritma dan Pemrograman II RekayasaPerangkat Lunak II
0.56
12 Rekayasa Perangkat Lunak II Algoritma danPemrograman II
0.72
13 Algoritma dan Pemrograman II Struktur Data 0.5914 Struktur Data Algoritma dan Pemrograman II 0.8715 Basis Data I Basis Data II 0.5316 Basis Data II Basis Data I 0.8517 Basis Data I Rekayasa Perangkat Lunak I 0.7018 Rekayasa Perangkat Lunak I Basis Data I 0.7719 Basis Data I Rekayasa Perangkat Lunak II 0.6020 Rekayasa Perangkat Lunak II Basis Data I 0.8021 Basis Data I Struktur Data 0.5922 Struktur Data Basis Data I 0.8923 Algoritma dan Pemrograman II Basis Data I &
Rekayasa Perangkat Lunak I0.61
24 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I
0.59
25 Rekayasa Perangkat Lunak I Algoritma danPemrograman II & Basis Data I
0.64
26 Algoritma dan Pemrograman II & Basis Data I Rekayasa Perangkat Lunak I
0.73
27 Algoritma dan Pemrograman II & RekayasaPerangkat Lunak I Basis Data I
0.87
28 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II
0.84
29 Algoritma dan Pemrograman II Basis Data I & 0.55
Tabel 5.26 Aturan asosiasi dengan minsup 0.35 dan minconf 0.5 pada datasetII
Percobaan I.2.c
Minimum support : 0.4
Terbentuk frequent 1_itemset sebanyak 7 itemset seperti berikut ini :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I } 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Basis Data II} 59 0.445. {Rekayasa Perangkat Lunak I} 86 0.646. {Rekayasa Perangkat Lunak II} 71 0.537. {Struktur Data} 62 0.46
Kemudian terbentuk frequent 2_itemset dan frequent 3_itemset sebagai
berikut :
No Frequent 2-itemset Count Support1. {2,3} 76 0.562. {2,5} 63 0.473. {2,7} 54 0.404. {3,5} 66 0.495. {3,6} 57 0.426. {3,7} 56 0.41
No Frequent 3-itemset
Count Support
1. {2,3,5} 55 0.41
Dari frequent 2_itemset dan frequent 3_itemset diatas terbentuk aturan
asosiasi sebagai berikut :
111
Tabel 5.28 Frequent 2_itemset dengan minsup 0.4 pada dataset II
Tabel 5.29 Frequent 3_itemset dengan minsup 0.4 pada dataset II
Tabel 5.27 Frequent 1_itemset dengan minsup 0.4 pada dataset II
Noaturan
Aturan Asosiasi Confidence
1 Algoritma dan Pemrograman II Basis Data I 0.832 Basis Data I Algoritma dan Pemrograman II 0.803 Algoritma dan Pemrograman II Rekayasa
Perangkat Lunak I0.70
4 Rekayasa Perangkat Lunak I Algoritma danPemrograman II
0.74
5 Algoritma dan Pemrograman II Struktur Data 0.596 Struktur Data Algoritma dan Pemrograman II 0.877 Basis Data I Rekayasa Perangkat Lunak I 0.708 Rekayasa Perangkat Lunak I Basis Data I 0.779 Basis Data I Rekayasa Perangkat Lunak II 0.6010 Rekayasa Perangkat Lunak II Basis Data I 0.8011 Basis Data I Struktur Data 0.5912 Struktur Data Basis Data I 0.8913 Algoritma dan Pemrograman II Basis Data I &
Rekayasa Perangkat Lunak I0.61
14 Basis Data I Algoritma dan Pemrograman II &Rekayasa Perangkat Lunak I
0.59
15 Rekayasa Perangkat Lunak I Algoritma danPemrograman II
0.64
16 Algoritma dan Pemrograman II & Basis Data I Rekayasa Perangkat Lunak I
0.73
17 Algoritma dan Pemrograman II & RekayasaPerangkat Lunak I Basis Data I
0.87
18 Basis Data I & Rekayasa Perangkat Lunak I Algoritma dan Pemrograman II
0.84
c). Percobaan I.2.d
Minimum support : 0.45
Frequent 1_itemset yang terbentuk adalah sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman I} 62 0.462. {Algoritma dan Pemrograman II} 91 0.673. {Basis Data I} 94 0.704. {Rekayasa Perangkat Lunak I} 86 0.64
112
Tabel 5.31 Frequent 1_itemset dengan minsup 0.45 pada dataset II
Tabel 5.30 Aturan asosiasi dengan minsup 0.4 dan minconf 0.5 pada dataset II
5. {Rekayasa Perangkat Lunak II} 71 0.536. {Struktur Data} 62 0.46
Kemudian terbentuk frequent 2_itemset sebagai berikut :
Aturan asosiasi yang kuat yang terbentuk adalah sebanyak 6 aturan yaitu
sebagai berikut :
NoAturan
Aturan assosiasi Confidence
1 Algoritma dan Pemrograman II Basis Data I 0.832 Basis Data I Algoritma dan Pemrograman II 0.803 Algoritma dan Pemrograman II Rekayasa
Perangkat Lunak I0.70
4 Rekayasa Perangkat Lunak I Algoritma danPemrograman II
0.74
5 Basis Data I Rekayasa Perangkat Lunak I 0.706 Rekayasa Perangkat Lunak I Basis Data I 0.77
Percobaan I.2.e
Minimum support : 0.5
Frequent 1_itemset yang terbentuk adalah sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.644. {Rekayasa Perangkat Lunak II} 71 0.53
113
No Frequent 2-itemset Count Support1. {2,3} 76 0.562. {2,4} 63 0.473. {3,4} 66 0.49
Tabel 5.32 Frequent 2_itemset dengan minsup 0.45 pada dataset II
Tabel 5.34 Frequent 1_itemset dengan minsup 0.5 pada dataset II
Tabel 5.33 Aturan Asosiasi dengan minsup 0.45 dan minconf 0.5
Kemudian terbentuk frequent 2_itemset sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 76 0.56
Sehingga terbentuk strong association rule seperti pada tabel dibawah ini :
Noaturan
Aturan asosiasi Confidence
1 Algoritma dan Pemrograman II Basis DataI
0.83
2 Basis Data I Algoritma dan PemrogramanII
0.80
Percobaan I.2.f
Minimum support : 0.55
Frequent 1_itemset yang terbentuk adalah sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.64
Kemudian terbentuk frequent 2_itemset sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 76 0.56
114
Tabel 5.35 Frequent 2_itemset dengan minsup 0.5 pada dataset II
Tabel 5.36 Aturan asosiasi dengan minsup 0.5 dan minconf 0.5 padadataset II
Tabel 5.37 Frequent 1_itemset dengan minsup 0.55 pada dataset II
Tabel 5.38 Frequent 2_itemset dengan minsup 0.55 pada dataset II
Sehingga terbentuk aturan asosiasi seperti pada tabel dibawah ini :
Noaturan
Aturan asosiasi Confidence
1 Algoritma dan Pemrograman II BasisData I
0.83
2 Basis Data I Algoritma danPemrograman II
0.80
Percobaan I.2.g
Minimum support : 0.6
Frequent 1_itemset yang terbentuk adalah sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.703. {Rekayasa Perangkat Lunak I} 86 0.64
Kemudian terbentuk frequent 2_itemset sebagai berikut :
No Frequent 2-itemset Count Support1. {1,2} 76 0.56
Sehingga terbentuk aturan asosiasi seperti pada tabel dibawah ini :
115
NoAturan
Aturan asosiasi Confidence
1 Algoritma dan Pemrograman II BasisData I
0.83
2 Basis Data I Algoritma danPemrograman II
0.80
Tabel 5.39 Aturan asosiasi dengan minsup 0.55 dan minconf 0.5 padadataset II
Tabel 5.40 Frequent 1_itemset dengan minsup 0.6 pada dataset II
Tabel 5.41 Frequent 2_itemset dengan minsup 0.6 pada dataset II
Tabel 5.42 Aturan asosiasi dengan minsup 0.6 dan minconf 0.5 padadataset II
Percobaan I.2.h
Minimum support : 0.65
Frequent 1_itemset yang terbentuk adalah sebagai berikut :
No Frequent 1-itemset Count Support1. {Algoritma dan Pemrograman II} 91 0.672. {Basis Data I} 94 0.70
Dari frequent 1_itemset diatas tidak terbentuk frequent 2_ itemset sehingga
tidak akan terbentuk aturan asosiasi.
B. Percobaan Jenis II
Pada percobaan jenis II ini penulis melakukan percobaan dengan mengubah
nilai minimum confidence antara 0.6 s.d 0.7, karena suatu aturan dirasa valid apabila
mempunyai nilai confidence (nilai kepastian 50%). Dalam percobaan ini dipakai
Dataset I nilai minimum support 0.4 s.d 0.55 karena pada rentang tersebut terbentuk
aturan asosiasi yang kuat.
1. Percobaan II.1
Minimum Support 0.4
a). Percobaan II.1a
Minimum Confidence 0.6
Aturan asosiasi yang terbentuk sebanyak 48 aturan sebagai berikut :
116
Tabel 5.43 Frequent 1_itemset dengan minsup 0.65 pada dataset II
NoAturan
Aturan Confidence
1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman II Algoritma dan Pemrograman I 0.663. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.874. Grafika Komputer Lanjut Algoritma dan Pemrograman I 0.655. Algoritma dan Pemrograman I Kompresi Data 0.716. Kompresi Data Algoritma dan Pemrograman I 0.627. Algoritma dan Pemrograman II Analisis Algoritma 0.678. Analisis Algoritma Algoritma dan Pemrograman II 0.869. Algoritma dan Pemrograman II Basis Data II 0.6710. Basis Data II Algoritma dan Pemrograman II 0.8711. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.8312. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.7613. Algoritma dan Pemrograman II Kompresi Data 0.7814. Kompresi Data Algoritma dan Pemrograman II 0.8315. Algoritma dan Pemrograman II Konsep Bahasa Pemrograman 0.6416. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7817. Analisis Algoritma Grafika Komputer Lanjut 0.8618. Grafika Komputer Lanjut Analisis Algoritma 0.6119. Analisis Algoritma Kompresi Data 0.8420. Kompresi Data Analisis Algoritma 0.6921. Analisis Algoritma Konsep Bahasa Pemrograman 0.7322. Konsep Bahasa Pemrograman Analisis Algoritma 0.6923. Basis Data II Grafika Komputer Lanjut 0.8124. Basis Data II Kompresi Data 0.7825. Kompresi Data Basis Data II 0.6326. Grafika Komputer Lanjut Kompresi Data 0.7027. Kompresi Data Grafika Komputer Lanjut 0.8128. Grafika Komputer Lanjut Konsep Bahasa Pemrograman 0.6129. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8230. Kompresi Data Konsep Bahasa Pemrograman 0.6831. Konsep Bahasa Pemrograman Kompresi Data 0.7832. Algoritma dan Pemrograman I Algoritma dan Pemrograman II
& Grafika Komputer Lanjut 0.72
33. Algoritma dan Pemrograman II Algoritma dan Pemrograman I& Grafika Komputer Lanjut
0.60
117
Tabel 5.44 Aturan asosiasi dengan minsup 0.4 dan minconf 0.6 pada dataset I
34. Algoritma dan Pemrograman I & Algoritma dan Pemrograman IIGrafika Komputer Lanjut
0.91
35. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II
0.84
36. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I
0.72
37. Algoritma dan Pemrograman II Analisis Algoritma &Kompresi Data
0.60
38. Analisis Algoritma Algoritma dan Pemrograman II &Kompresi Data
0.76
39. Kompresi Data Algoritma dan Pemrograman II&AnalisisAlgoritma
0.64
40. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData
0.89
41. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma
0.76
42. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II
0.91
43. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data
0.67
44. Grafika Komputer Lanjut Algoritma dan Pemrograman II &Kompresi Data
0.61
45. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut
0.71
46. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data
0.81
47. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut
0.85
48. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II
0.87
b). Percobaan II.1b
Minimum Confidence 0.7
Aturan asosiasi yang terbentuk sebanyak 34 aturan sebagai berikut :
118
NoAtura
n
Aturan asosiasi Confidence
1. Algoritma dan Pemrograman I Algoritma dan Pemrograman II 0.802. Algoritma dan Pemrograman I Grafika Komputer Lanjut 0.873. Algoritma dan Pemrograman I Kompresi Data 0.714. Analisis Algoritma Algoritma dan Pemrograman II 0.865. Basis Data II Algoritma dan Pemrograman II 0.876. Algoritma dan Pemrograman II Grafika Komputer Lanjut 0.837. Grafika Komputer Lanjut Algoritma dan Pemrograman II 0.768. Algoritma dan Pemrograman II Kompresi Data 0.789. Kompresi Data Algoritma dan Pemrograman II 0.8310. Konsep Bahasa Pemrograman Algoritma dan Pemrograman II 0.7811. Analisis Algoritma Grafika Komputer Lanjut 0.8612. Analisis Algoritma Kompresi Data 0.8413. Kompresi Data Analisis Algoritma 0.6914. Analisis Algoritma Konsep Bahasa Pemrograman 0.7315. Basis Data II Grafika Komputer Lanjut 0.8116. Basis Data II Kompresi Data 0.7817. Grafika Komputer Lanjut Kompresi Data 0.7018. Kompresi Data Grafika Komputer Lanjut 0.8119. Konsep Bahasa Pemrograman Grafika Komputer Lanjut 0.8220. Kompresi Data Konsep Bahasa Pemrograman 0.6821. Konsep Bahasa Pemrograman Kompresi Data 0.7822. Algoritma dan Pemrograman I Algoritma dan Pemrograman II &
Grafika Komputer Lanjut 0.72
23. Algoritma dan Pemrograman I & Algoritma dan Pemrograman II Grafika Komputer Lanjut
0.91
24. Algoritma dan Pemrograman I & Grafika Komputer Lanjut Algoritma dan Pemrograman II
0.84
25. Algoritma dan Pemrograman II& Grafika Komputer Lanjut Algoritma dan Pemrograman I
0.72
26. Analisis Algoritma Algoritma dan Pemrograman II & KompresiData
0.76
27. Algoritma dan Pemrograman II&Analisis Algoritma KompresiData
0.89
28. Algoritma dan Pemrograman II&Kompresi Data AnalisisAlgoritma
0.76
119
Tabel 5.45 Aturan asosiasi dengan minsup 0.4 dan minconf 0.7 pada dataset I
29. Analisis Algoritma&Kompresi Data Algoritma danPemrograman II
0.91
30. Algoritma dan Pemrograman II Grafika Komputer Lanjut &Kompresi Data
0.67
31. Kompresi Data Algoritma dan Pemrograman II & GrafikaKomputer Lanjut
0.71
32. Algoritma dan Pemrograman II & Grafika Komputer Lanjut Kompresi Data
0.81
33. Algoritma dan Pemrograman II&Kompresi Data Grafika Komputer Lanjut
0.85
34. Grafika Komputer Lanjut &Kompresi Data Algoritma danPemrograman II
0.87
Percobaan II.2
Minimum Support 0.45
a). Percobaan II.2a
Minimum Confidence 0.6
Aturan asosiasi yang terbentuk sebanyak 26 yaitu sebagai berikut :
NoAtura
n
Aturan asosiasi Confidence
1 Algoritma dan Pemrograman I Analisis Algoritma 0.802 Analisis Algoritma Algoritma dan Pemrograman I 0.663 Algoritma dan Pemrograman I Pengantar Grafika
dan Multimedia0.87
4 Pengantar Grafika dan Multimedia Algoritma danPemrograman I
0.65
5 Analisis Algoritma Basis Data II 0.676 Basis Data II Analisis Algoritma 0.867 Analisis Algoritma Pemrograman Client/server 0.678 Pemrograman Client/server Analisis Algoritma 0.879 Analisis Algoritma Pengantar Grafika dan
Multimedia0.83
10 Pengantar Grafika dan Multimedia AnalisisAlgoritma
0.76
11 Analisis Algoritma Sistem Cerdas 0.78
120
Tabel 5.46 Aturan asosiasi dengan minsup 0.45 dan minconf 0.6 pada dataset I
12 Sistem Cerdas Analisis Algoritma 0.8313 Basis Data II Pengantar Grafika dan Multimedia 0.8614 Pengantar Grafika dan Multimedia Basis Data II 0.6115 Basis Data II Sistem Cerdas 0.8416 Sistem Cerdas Basis Data II 0.6917 Pengantar Grafika dan Multimedia Sistem Cerdas 0.7018 Sistem Cerdas Pengantar Grafika dan Multimedia 0.8119 Pengantar Grafika dan Multimedia Struktur Data 0.6120 Struktur Data Pengantar Grafika dan Multimedia 0.8221 Analisis Algoritma Pengantar Grafika dan
Multimedia & Sistem Cerdas0.67
22 Pengantar Grafika dan Multimedia AnalisisAlgoritma & Sistem Cerdas
0.61
23 Sistem Cerdas Analisis Algoritma & PengantarGrafika dan Multimedia
0.71
24 Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas
0.81
25 Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia
0.85
26 Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma
0.87
Percobaan II.2b
Minimum Confidence 0.7
Aturan asosiasi yang terbentuk sebanyak 17 aturan sebagai berikut :
NoAturan
Aturan asosiasi Confidence
1. Algoritma dan Pemrograman I Analisis Algoritma 0.802. Algoritma dan Pemrograman I Pengantar Grafika
dan Multimedia0.87
3. Basis Data II Analisis Algoritma 0.864. Pemrograman Client/server Analisis Algoritma 0.875. Analisis Algoritma Pengantar Grafika dan
Multimedia0.83
6. Pengantar Grafika dan Multimedia AnalisisAlgoritma
0.76
7. Analisis Algoritma Sistem Cerdas 0.78
121
Tabel 5.47 Aturan asosiasi dengan minsup 0.45 dan minconf 0.7 pada dataset I
8. Sistem Cerdas Analisis Algoritma 0.839. Basis Data II Pengantar Grafika dan Multimedia 0.8610. Basis Data II Sistem Cerdas 0.8411. Pengantar Grafika dan Multimedia Sistem Cerdas 0.7012. Sistem Cerdas Pengantar Grafika dan Multimedia 0.8113. Struktur Data Pengantar Grafika dan Multimedia 0.8214. Sistem Cerdas Analisis Algoritma & Pengantar
Grafika dan Multimedia0.71
15. Analisis Algoritma & Pengantar Grafika danMultimedia Sistem Cerdas
0.81
16. Analisis Algoritma & Sistem Cerdas PengantarGrafika dan Multimedia
0.85
17. Pengantar Grafika dan Multimedia & Sistem Cerdas Analisis Algoritma
0.87
Percobaan II.3
Minimum Support 0.5
a). Percobaan II.3a
Minimum Confidence 0.6
Aturan asosiasi yang terbentuk sebanyak 6 aturan yaitu sebagai berikut :
122
NoAturan
Aturan asosiasi Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia
Sistem Cerdas0.70
6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia
0.81
Tabel 5.48 Aturan asosiasi dengan minsup 0.5 dan minconf 0.6 pada dataset I
b). Percobaan II.3b
Minimum Confidence 0.7
Percobaan II.4
Minimum Support 0.55
a). Percobaan II.4a
Minimum Confidence 0.6
Aturan asosiasi yang terbentuk sebanyak 4 aturan yaitu sebagai berikut :
123
NoAturan
Aturan asosiasi Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.835 Pengantar Grafika Komputer dan Multimedia
Sistem Cerdas0.70
6 Sistem Cerdas Pengantar Grafika Komputerdan Multimedia
0.81
NoAturan
Aturan asosiasi Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83
Tabel 5.49 Aturan asosiasi dengan minsup 0.5 dan minconf 0.7 pada dataset I
Tabel 5.50 Aturan asosiasi dengan minsup 0.55 dan minconf 0.6 pada dataset I
b). Percobaan II.4b
Minimum Confidence 0.7
Aturan asosiasi yang terbentuk sama yaitu sebanyak 4 aturan sebagai
berikut :
124
NoAturan
Aturan Confidence
1 Analisis Algoritma Pengantar GrafikaKomputer dan Multimedia
0.83
2 Pengantar Grafika Komputer dan Multimedia Analisis Algoritma
0.76
3 Analisis Algoritma Sistem Cerdas 0.784 Sistem Cerdas Analisis Algoritma 0.83
Tabel 5.51 Aturan asosiasi dengan minsup 0.55 dan minconf 0.7 pada dataset I
C. PEMBAHASAN
Hasil dari percobaan-percobaan yang telah dilakukan dapat digambarkan pada
grafik-grafik dibawah ini :
1. Grafik hubungan nilai minimum support terhadap jumlah aturan
asosiasi yang kuat
ü Percobaan jenis I pada dataset I dengan minimum confidence 0.5
50
26
6 4 0 00102030405060
0,4 0,45 0,5 0,55 0,6 0,65
Nilai minimum supportJum
lah
atur
an a
sosi
asi y
ang
kuat
Gambar 5.1 Grafik hubungan nilai minimum support terhadap jumlah aturan asosiasiyang kuat pada dataset I
125
ü Percobaan jenis I pada dataset II dengan minimum confidence 0.5
59
34
18
62 2 2 00
10
20
30
40
50
60
70
0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65
Nilai minimum support
jum
lah
atur
an a
sosi
asi y
g ku
at
Dari hasil percobaan yang dilakukan diatas dapat dilihat bahwa nilai
minimum support mempengaruhi jumlah frequent 1_itemset sehingga berpengaruh
juga terhadap jumlah aturan yang terbentuk. Terlihat pada grafik bahwa semakin
kecil nilai minimum support semakin banyak aturan asosiasi yang kuat yang
terbentuk, sebaliknya semakin besar nilai minimum support semakin sedikit aturan
asosiasi yang kuat yang terbentuk.
126
Gambar 5.2 Grafik hubungan nilai minimum support terhadap jumlah aturan asosiasiyang kuat pada dataset II
48
34
26
17
6 64 40
10
20
30
40
50
60
0,6 0,7
Nilai minimum confidence
Jum
lah
atur
an a
sosi
asi y
ang
kuat
jml aturan asosiasi ygkuat dg minsup 0.4jml aturan asosiasi ygkuat dg minsup 0.45jml aturan asosiasi ygkuat dg minsup 0,5jml aturan asosiasi ygkuat dg support 0.55
2. Grafik hubungan nilai minimum confidence terhadap jumlah aturan
asosiasi yang kuat
Dengan melakukan perubahan nilai minimum confidence pada percobaan
yang telah dilakukan diatas, hasilnya dapat dilihat pada grafik dibawah ini :
ü Percobaan jenis II pada dataset I
Gambar 5.3 Grafik hubungan nilai minimum confidence terhadap jumlah aturanasosiasi yang kuat pada dataset I
Dari grafik diatas dapat dilihat bahwa dengan memperbesar nilai minimum
confidence jumlah aturan asosiasi yg kuat yang terbentuk semakin sedikit, tetapi ada
pula yang jumlahnya sama. Jumlah aturan yang sama disebabkan karena besarnya
nilai confidence yang dimiliki oleh frequent itemset.
Dari hasil percobaan-percobaan di atas ternyata tidak semua aturan asosiasi
yang kuat (Strong Association Rule) yang telah terbentuk merupakan aturan yang
cukup menarik atau bermakna sehingga aturan bisa merupakan aturan yang janggal
(misleading).
127
Dataset yang dipakai dalam skripsi ini tidak merepresentasikan urutan
pengambilan matakuliah sehingga memunculkan aturan yang janggal. Selain itu
pencarian pola pada dataset dengan metode Apriori ternyata tidak mendapatkan pola
yang diharapkan, karena diduga pola yang terdapat pada dataset bersifat menyebar.
128
BAB VI
KESIMPULAN DAN SARAN
A. Kesimpulan
Beberapa kesimpulan yang dapat diperoleh sebagai hasil dari pembuatan
tugas akhir ini adalah sebagai berikut:
1. Dengan Metode Association Rule menggunakan algoritma Apriori yang
telah berhasil diimplementasikan dan diujicobakan pada dataset data
akademik mahasiswa Program Studi Ilmu Komputer, Jurusan Matematika,
Fakultas MIPA, Universitas Sanata Dharma, Tahun Angkatan 2001-2002
untuk mendapatkan informasi mengenai adanya keterkaitan antara tingkat
keberhasilan atau ketidakberhasilan suatu matakuliah dengan tingkat
keberhasilan atau ketidakberhasilan matakuliah lain.
2. Dengan program ini pengguna dapat melakukan simulasi untuk melihat
keterkaitan antara tingkat keberhasilan suatu matakuliah dengan matakuliah
lain dengan memasukkan nilai minimum support dan nilai minimum
confidence yang berbeda-beda.
3. Informasi mengenai keterkaitan keberhasilan atau ketidakberhasilan suatu
matakuliah terhadap matakuliah lain ini sangat dipengaruhi oleh nilai
minimum support dan minimum confidence yang dimasukkan pengguna.
Didapatkan hasil bahwa semakin besar minimum support, jumlah aturan
menjadi semakin sedikit, begitu juga dengan semakin besar minimum
confidence jumlah aturan yang diperoleh juga semakin kecil.
129
4. Semakin besar nilai minimum support yang dimasukkan maka semakin
sedikit jumlah kandidat itemset yang tergolong sebagai frequent itemset. Hal
ini mengakibatkan berkurangnya jumlah aturan yang terbentuk.
5. Semakin besar nilai minimum confidence berarti ambang toleransi terhadap
probabilitas terjadinya suatu kejadian makin tinggi sehingga mengakibatkan
semakin sedikit jumlah aturan asosiasi yang kuat (strong association rule)
yang terbentuk.
6. Program ini telah diuji pada beberapa dataset fiktif dan mendapatkan hasil
aturan yang sama dengan perhitungan secara manual.
7. Tidak semua aturan asosiasi yang kuat (Strong Association Rule) yang telah
terbentuk merupakan aturan yang cukup menarik atau bermakna sehingga
aturan bisa merupakan aturan yang janggal (misleading).
8. Dataset yang dipakai dalam skripsi ini tidak merepresentasikan urutan
pengambilan matakuliah sehingga memunculkan aturan yang janggal. Selain
itu pencarian pola pada dataset dengan metode apriori ternyata tidak
mendapatkan pola yang diharapkan, karena diduga pola yang terdapat pada
dataset bersifat menyebar.
130
B. Saran
Berdasarkan hasil dari analisa tugas akhir, program masih belum sempurna
sehingga penulis memberi saran untuk pengembangan lebih lanjut antara lain:
1. Saat ini program hanya bisa menerima input tabel data yang berformat .DBF,
maka program dapat dikembangkan lagi sehingga program dapat menerima
input yang berformat selain .DBF misalnya data dalam format MDB.
2. Aturan-aturan yang didapat pada program ini disimpan pada listbox yang
bersifat temporary. Untuk itu program dapat dikembangkan lagi sehingga
dapat menampung aturan dengan lebih baik dan lebih besar.
3. Untuk mendapatkan aturan asosiasi yang lebih baik dan tidak terkesan
janggal (misleading) dapat dilakukan upaya-upaya sebagai berikut :
a). Merepresentasikan urutan pengambilan matakuliah dalam dataset.
b). Memakai algoritma yang mampu mengenali korelasi antar variabel
seperti misalnya random walk algorithm.
c). Mempergunakan dataset yang lebih besar ukurannya sehingga pola yang
ada dapat lebih dikenali.
131
DAFTAR PUSTAKA
Anonymous. Association Ruleshttpwww.aicomponents.comAlgorithmsAssociationRules.aspx
Anonymous. Data Mining Conceptshttp://msdn2.microsoft.com/ms176117%28en-us,SQL.90%29.aspx
Han, Jiawei Michelin Kamber. Data Mining Concept and Techniques,MorganKaufmann Publisher 2001.Academic Press USA
Mandvikar, Amit. Introduction to Data Mining Chapter 6. Association Ruleshttp://www.eas.asu.edu/~mining03/chap5/chap5_list.html
Moen, Pirjo. Data mining methods http://www.cs.helsinki.fi/u/ronkaine/tilome/luentomateriaali/
TiLoMe-140305.pdf
Pramudiono, Iko. Introduction to Data Mininghttp://datamining.japati.net/forum/index.php
Pramudiono, Iko. Pengantar Data Mining: Menambang Permata Pengetahuan diGunung Datahttp://www.ilmukomputer.com/umum/iko-datamining.php.2003
Prasetya, Bowo. Analisis Perilaku Pengunjung Menggunakan Data Mining.http://www.beritaiptek.com/pilihberita.php?id=155
Prasetyo , Philips Kokoh. Apriori.http://philips.wordpress.com/2006/06/07/apriori/
Prasetyo, Philips Kokoh. ,Association Rule Mining Process.http://philips.wordpress.com/2006/05/24/association-rule-mining-process/
132
Prewitaningsih, Dyah. Analisis Perbandingan Algoritma Apriori dan Min-Aprioriuntuk Implementasi Clustering berdasarkan Hipergraf Rule Asosiasihttp ://wiki .sttelkom.ac.id
Santoso, Leo Willyanto. Pembuatan Perangkat Lunak Data Mining UntukPenggalian Kaidah Assosiasi Menggunakan Metode Apriorihttp://fportfolio.petra.ac.id/user_files/03-023/Data%20Mining.pdf ? PHPSESSID=781df11f9a8e72d8f00f3a7dae14ef2d
Sucahyo, Yudho Giri, Data Mining Menggali Informasi yang Terpendam. http://ilmukomputer.com/populer/yudho-datamining.php.2003
Sucahyo, Yudho Giri, Penerapan Data Mining Permasalahan Apa Saja yangBisa Diselesaikan.http://ilmukomputer.com/populer/yudho/yudhodatamining.pdf.2003
Sukarya, Oyo & Moch. Arif Bijaksana & Dana Sulistiyo Kusumo, PerbandinganPencarian Frequent Itemset Menggunakan Algoritma Cut Both Ways danAlgoritma Apriori.http://www.stttelkom.ac.id/staf/MAB/TA-PA/jurnal-oyo.zip
133
LAMPIRAN
Lampiran 1. Data salah satu mahasiswa prodi Ilmu Komputer yang diperoleh dariBAPSI
SmtAmbil Kode Mtk Nama Mtk Sks NilaiThn/Smt : 2001 / Ganjil
MAB 112 Bahasa Inggris I 2 BMAK 102 Pengantar Ilmu Komputer 2 BMAK 102P Praktikum Pengantar Ilmu Komputer 1 AMAK 103 Algoritma dan Pemrograman I 2 BMAK 103P Praktikum Algoritma Dan Pemrograman I 1 BMAM 108 Matematika Dasar I 3 CMAM 121 Logika Matematik 3 CUSD 104 Pendidikan Pancasila 2 DUSD 110 Pendidikan Agama 2 B
Tot SKS / IPS 18 2,50Thn/Smt : 2001 / Genap
MAB 113 Bahasa Inggris II 2 BMAF 103 Fisika Dasar 3 BMAK 104 Algoritma Dan Pemrograman II 2 BMAK 104P Praktikum Algoritma Dan Pemrograman II 1 AMAK 105 Sistem Digital 3 CMAK 105P Praktikum Sistem Digital 1 AMAK 208 Pemrograman Berorientasi Obyek I 2 AMAK 208P Prakt. Pemrograman Berorientasi Obyek I 1 AMAM 109 Matematika Dasar II 3 CMAM 151 Pengantar Teori Probabilitas 3 BUSD 111 Teologi Moral 2 BUSD 208 Ilmu Budaya Dasar 2 C
Tot SKS / IPS 25 2,88Thn/Smt : 2002 / Ganjil
MAK 205 Struktur Data 2 AMAK 205P Praktikum Struktur Data 1 BMAK 206 Organisasi Komputer 2 BMAK 206P Praktikum Organisasi Komputer 1 AMAK 431 Teori Bahasa dan Otomata 3 AMAM 230 Matematika Diskret 3 BMAM 232 Aljabar Linear Dan Matriks 2 AMAM 253 Statistika 2 BMAM 253P Praktikum Statistika 1 AUSD 123 Pendidikan Pancasila 2 CUSD 206 Pendidikan Kewarganegaraan 2 A
Tot SKS / IPS 21 3,43Thn/Smt : 2002 / Genap
MAK 207 Sistem Operasi 2 BMAK 207P Praktikum Sistem Operasi 1 D
134
MAK 209 Basis Data I 2 BMAK 209P Praktikum Basis Data I 1 BMAK 210 Pengantar Grafika Komputer & Multimedia 2 CMAK 210P Prak. Peng. Grafika Komp. & Multimedia 1 BMAK 213 Jaringan Komputer 2 BMAK 213P Praktikum Jaringan Komputer 1 BMAK 216 Sistem Informasi Manajemen 3 BMAK 401 Kewirausahaan 2 BMAM 363 Metode Numeris 2 DMAM 363P Praktikum Metode Numerik 1 AMAM 466 Riset Operasi I 2 DMAM 466P Praktikum Riset Operasi I 1 C
Tot SKS / IPS 23 2,48Thn/Smt : 2003 / Ganjil
MAB 301 Etika Profesi 2 BMAK 214 Sistem Cerdas 2 BMAK 214P Praktikum Sistem Cerdas 1 AMAK 215 Rekayasa Perangkat Lunak I 2 CMAK 215P Praktikum Rekayasa Perangkat Lunak I 1 BMAK 217 Analisis Algoritma 2 CMAK 217P Praktikum Analisis Algoritma 1 BMAK 302 Pengembangan Aplikasi Berbasis Web 2 A
MAK 302PPrak. Pengembangan Aplikasi BerbasisWeb 1 B
MAK 402 Interaksi Manusia Dan Komputer 2 BMAK 411 Kompresi Data 2 BMAK 411P Praktikum Kompresi Data 1 A
Tot SKS / IPS 19 3,00Thn/Smt : 2003 / Genap
MAK 212 Pengembangan Sistem Informasi 3 BMAK 221 Grafika Komputer Lanjut 2 BMAK 221P Praktikum Grafika Komputer Lanjut 1 AMAK 301 Rekayasa Perangkat Lunak II 2 BMAK 301P Praktikum Rekayasa Perangkat Lunak II 1 BMAK 303 Basis Data II 2 CMAK 303P Praktikum Basis Data II 1 CMAK 304 Tugas Khusus 2 AMAK 313 Pemrosesan Citra 2 BMAK 313P Praktikum Pemrosesan Citra 1 AMAK 413 Konsep Bahasa Pemrograman 3 BMAM 466 Riset Operasi I 2 D
Tot SKS / IPS 22 2,86Thn/Smt : 2004 / Ganjil
MAK 105 Sistem Digital 3 CMAK 207P Praktikum Sistem Operasi 1 AMAK 312 Animasi Komputer 2 DMAK 312P Praktikum Animasi Komputer 1 CMAK 403 Sistem Informasi Geografis 2 BMAK 403P Praktikum Sistem Informasi Geografis 1 A
135
MAK 489 Orientasi Tugas Akhir 1 CMAM 108 Matematika Dasar I 3 CMAM 121 Logika Matematik 3 BMAM 363 Metode Numeris 2 CUSD 410 Kuliah Kerja Nyata 3 A
Tot SKS / IPS 22 2,59Thn/Smt : 2004 / Genap
MAK 312 Animasi Komputer 2 CMAK 416 Pengenalan Pola 2 CMAK 416P Praktikum Pengenalan Pola 1 AMAK 418 Teknologi Multimedia 2 BMAK 490B Skripsi 5MAM 109 Matematika Dasar II 3 C
Tot SKS / IPS 10 2,40Thn/Smt : 2005 / Ganjil
MAK 105 Sistem Digital 3 BMAK 490L Skripsi Lanjutan 5MAM 108 Matematika Dasar I 3 CMAM 466 Riset Operasi I 2 B
Tot SKS / IPS 8 2,63
136
Algoritma &Pemrograman I
Algoritma &Pemrograman II
Struktur Data
Basis Data I
Pengantar GrafikaKomputer
Multimedia
RekayasaPerangkat Lunak I
Sistem Cerdas
Analisis Algoritma
Grafika KomputerLanjut
RekayasaPerangkat Lunak
II
Basis Data II
Jaringan SyarafTiruan
AlgoritmaGenetika
Animasi Komputer
Pemrosesan Citra
Sistem berbasisPengetahuan
Kompresi Data
PemrogramanClient/Server
Sistem Basis Data Terdistribusi
PemrosesanBahasa Alami
Konsep BahasaPemrograman
TeknologiMultimedia
Pengenalan Pola
M M
M
N M
M
M
M
N
M
RobotikaM
M
M
M
N
N
M
M
N
M
M
M
M
DIAGRAM ALIR MATAKULIAH PRODI ILMU KOMPUTER
SEMESTER I SEMESTER II SEMESTER III SEMESTER IV SEMESTER V SEMESTER VI SEMESTER VII SEMESTER VIII
137Lampiran 2. Gambar diagram Alir matakuliah Algoritma dan Pemrograman I