penerapan penggalian aturan asosiasi untuk sistem rekomendasi pengambilan mata kuliah di jurusan...
DESCRIPTION
Proposal Tugas AkhirTRANSCRIPT
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 1/22
JURUSAN SISTEM INFORMASI
FAKULTAS TEKNOLOGI INFORMASI
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
USULAN TUGAS AKHIR
IDENTITAS PENGUSUL
NAMA : PUTRI CAHYANING BWANANESIA
NRP : 5210 100 142
DOSEN PEMBIMBING I : Prof. Ir. Arif Djunaidy, M.Sc., PhD.
DOSEN PEMBIMBING II : Renny Pradina Kusumawardani, S.T., M.T.
LAB : Sistem Pendukung Keputusan dan Intelegensia Bisnis
1. JUDUL TUGAS AKHIR
PENERAPAN PENGGALIAN ATURAN ASOSIASI UNTUK SISTEM REKOMENDASI
PENGAMBILAN MATA KULIAH DI JURUSAN SISTEM INFORMASI ITS
SURABAYA
2. ABSTRAK
Pengambilan mata kuliah pada tiap semester hendaknya disesuaikan dengan
kemampuan individu tiap mahasiswa sehingga mahasiswa dapat menyelesaikan perkuliahan
selama satu semester dengan baik. Oleh karena itu, mahasiswa sering kali membutuhkan
arahan untuk memilih mata kuliah yang tepat. Tugas akhir ini bertujuan untuk membuat
sistem rekomendasi pengambilan mata kuliah berdasarkan data-data akademik mahasiswa
Jurusan Sistem Informasi – Fakultas Teknologi Informasi – Institut Teknologi Sepuluh
Nopember (ITS) Surabaya dengan menggunakan teknik penggalian aturan asosiasi
(association rule mining). Variabel yang akan dieksplorasi antara lain mata kuliah yang
diambil tiap semester, nilai mata kuliah yang diambil tiap semester, mata kuliah pra syarat,
jumlah SKS yang diambil tiap semester, mata kuliah yang diulang, Indeks Prestasi Semester
(IPS), Indeks Prestasi Kumulatif (IPK), dan semester tempuh mahasiswa.
Kata kunci : penggalian data, penggalian aturan asosiasi, sistem rekomendasi berbasis
aturan, rekomendasi mata kuliah
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 2/22
3. PENDAHULUAN
Pada bab pendahuluan ini akan dibahas latar belakang, rumusan permasalahan, batasan
permasalahan, tujuan, dan manfaat dari pengerjaan tugas akhir.
3.1. Latar Belakang
Salah satu tri dharma Perguruan Tinggi yang wajib dijalankan oleh setiap
instansi Perguruan Tinggi di Indonesia adalah menyelenggarakan pendidikan.
Dengan semakin tingginya tuntutan dunia kerja akan lulusan berkualitas dari
Perguruan Tinggi serta semakin ketatnya persaingan global, maka Perguruan Tinggi
dituntut untuk dapat menyusun sebuah sistem penjaminan mutu internal. Sistem
penjaminan mutu internal tersebut diharapkan dapat menjadi pedoman bagi
Perguruan Tinggi untuk menyelenggarakan pendidikan yang berkualitas bagi
mahasiswanya, sehingga Perguruan Tinggi dapat menghasilkan lulusan yang
berkualitas pula. Kualitas sistem pendidikan tersebut dapat ditinjau dari beberapa
aspek, salah satunya adalah performa mahasiswa. Perguruan Tinggi harus terus
melakukan evaluasi terhadap performa mahasiswanya agar dapat mencapai standar
pendidikan nasional yang telah ditetapkan oleh pemerintah (Sailah, 2010).
Peningkatan performa mahasiswa salah satunya dapat dimulai dengan memilih mata
kuliah yang tepat untuk mahasiswa tersebut, sesuai dengan bidang minat dan
kemampuannya. Perguruan Tinggi telah menyediakan banyak mata kuliah yang dapat
dipilih oleh mahasiswa untuk diikuti namun sering kali mahasiswa mengalami
kebingungan untuk memilih mata kuliah yang tepat baginya. Keputusan untuk
memilih atau mengambil kuliah tertentu biasanya berdasarkan pada saran yang
diberikan oleh teman atau dosen wali (Bendakir & Aimeur, 2006). Mahasiswa
cenderung mengambil mata kuliah yang diikuti oleh sebagian besar teman-temannya
atau mata kuliah yang disarankan oleh dosen wali berdasarkan penilaian pribadi
dosen wali terhadap mahasiswa tersebut. Padahal, saran yang diberikan oleh teman
atau dosen wali bisa saja tidak sesuai dengan kemampuan mahasiswa tersebut. Hal
ini dapat disebabkan karena teman yang memberikan rekomendasi mungkin saja
tidak mengetahui informasi-informasi mengenai mata kuliah yang akan diambil dan
dosen wali bisa saja salah dalam menilai kemampuan dari mahasiswa tersebut karena
penilaian tidak didukung oleh data-data yang menyatakan kemampuan mahasiswa.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 3/22
Oleh karena itu, sistem rekomendasi pengambilan mata kuliah akan sangat berguna
bagi mahasiswa untuk menentukan mata kuliah apa yang tepat atau sesuai dengan
kemampuannya sehingga mahasiswa tersebut dapat memperoleh nilai yang
memuaskan pada tiap semester dan dapat menyelesaikan studinya dengan tepat
waktu. Sistem rekomendasi ini akan dibangun berdasarkan data histori mahasiswa-
mahasiswa yang telah mengambil mata kuliah pada periode sebelumnya. Lalu,
rekomendasi pengambilan mata kuliah akan dilakukan dengan cara mencocokkan
profil mahasiswa yang akan menerima rekomendasi untuk mengambil mata kuliah
tertentu dengan profil mahasiswa yang telah menyelesaikan mata kuliah tersebut pada
periode sebelumnya. Profil mahasiswa yang dimaksud adalah kemampuan akademik
mahasiswa berdasarkan data-data akademik yang disimpan pada sistem.
Pembuatan sistem rekomendasi pengambilan mata kuliah dapat dilakukan
dengan menggunakan teknik penggalian data, salah satunya dengan menerapkan
penggalian aturan asosiasi (association rule mining). Dengan menggunakan
penggalian aturan asosiasi, data-data mahasiswa akan dianalisis untuk mencari
informasi tersembunyi dalam data. Hasil dari proses analisis tersebut adalah aturan
yang digunakan untuk merekomendasikan mata kuliah yang tepat bagi mahasiswa.
Hasil dari tugas akhir ini diharapkan dapat membantu Jurusan Sistem Informasi ITS
untuk membantu tugas dosen wali setiap awal semester saat harus menyusun rencana
studi bersama mahasiswa, sehingga dosen wali akan lebih mudah membimbing
mahasiswa dalam menentukan mata kuliah apa yang harus diambil pada tiap
semester.
3.2. Perumusan Masalah
Permasalahan yang akan diselesaikan dalam tugas akhir ini adalah bagaimana
membuat sistem rekomendasi pengambilan mata kuliah bagi mahasiswa Jurusan
Sistem Informasi ITS dengan metode penggalian aturan asosiasi (association rule
mining) ?
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 4/22
3.3. Batasan Tugas Akhir
Adapun batasan masalah yang digunakan pada tugas akhir ini, antara lain :
a. Data yang digunakan merupakan data mahasiswa dan alumni yang menempuh
studi pada jenjang sarjana program reguler di Jurusan Sistem Informasi – Fakultas
Teknologi Informasi – Institut Teknologi Sepuluh Nopember (ITS) Surabaya.
b. Data yang digunakan adalah data akademik mulai tahun 2008 sampai tahun 2012.
c. Metode yang digunakan untuk membuat sistem rekomendasi pengambilan mata
kuliah adalah penggalian aturan asosiasi.
d. Aplikasi yang digunakan untuk melakukan penggalian aturan asosiasi adalah
WEKA (Waikato Environment for Knowledge Analysis) versi 3.6.10.
e. Aplikasi yang digunakan untuk membuat sistem rekomendasi pengambilan mata
kuliah adalah NetBeans versi 7.4 dengan menggunakan bahasa pemrograman
Java.
3.4. Tujuan Tugas Akhir
Tujuan yang hendak dicapai dalam pembuatan tugas akhir ini adalah membuat sistem
rekomendasi pengambilan mata kuliah bagi mahasiswa Jurusan Sistem Informasi ITS
dengan menggunakan teknik penggalian aturan asosiasi.
3.5. Relevansi atau Manfaat Tugas Akhir
Bagi penulis
a. Mengetahui implementasi teknik penggalian data dengan metode penggalian
aturan asosiasi untuk membuat sistem rekomendasi pengambilan mata kuliah.
Bagi institur sebagai klien
a. Hasil dari Tugas Akhir ini dapat menjadi rekomendasi bagi dosen wali ketika
melakukan persetujuan (validasi) mata kuliah saat awal semester.
b. Membantu mahasiswa Jurusan Sistem Informasi ITS untuk menentukan mata
kuliah yang harus diambil pada semester tertentu.
4. TINJAUAN PUSTAKA DAN DASAR TEORI
Pada bab tinjauan pustaka dan dasar teori akan dijelaskan mengenai teori-teori yang
digunakan sebagai referensi untuk pengerjaan tugas akhir ini.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 5/22
4.1. Penggalian data
Kemajuan di bidang penerimaan data digital dan teknologi penyimpanan data
menyebabkan semakin besarnya jumlah data yang harus disimpan dalam database
(Hand, Heikki, & Padhraic, 2001). Dengan jumlah data yang sangat besar, diperlukan
sebuah teknik khusus untuk menganalisis informasi yang tersembunyi dalam data-
data tersebut sehingga dapat menghasilkan keputusan yang berguna bagi pihak
pengambil keputusan. Menurut Gartner Group, penggalian data merupakan proses
menemukan sebuah hubungan, pola dan tren (kecenderungan) dengan menyaring
data dalam jumlah besar yang disimpan dalam sebuah repositori, menggunakan
teknik pemahaman pola, statistika dan matematika (Larose, 2005). Sedangkan
menurut buku Principles of Data Mining, penggalian data adalah analisis pengamatan
sekumpulan data (terkadang dalam jumlah besar) untuk mencari hubungan tidak
terduga dan meringkas data dalam cerita yang dipahami dan berguna bagi pemilik
data (Hand, Heikki, & Padhraic, 2001). Berdasarkan fakta yang diungkapkan pada
MIT Technology Review, penggalian data disebutkan sebagai salah satu dari 10
teknologi berkembang yang akan mengubah dunia (Larose, 2005). Hal ini juga
didukung dengan semakin banyaknya perusahaan yang menyimpan datanya di
tempat penyimpanan data (data warehouse) secara online. Banyak perusahaan yang
saat ini telah menggunakan strategi data warehouse dan mereka ingin mencari tahu
apa yang dapat mereka lakukan dengan semua data yang disimpan dalam data
warehouse tersebut. Beberapa faktor yang mendorong semakin berkembang pesatnya
bidang penggalian data menurut Daniel T. Larose dalam buku Discovering
Knowledge in Data, antara lain :
1. Perkembangan yang pesat di bidang pengumpulan data.
2. Penyimpanan data yang beralih pada data warehouse.
3. Ketersediaan dari peningkatan akses ke data dari navigasi web dan intranet.
4. Tekanan kompetitif untuk meningkatkan market share dalam ekonomi global.
5. Pengembangan aplikasi-aplikasi komersial yang mendukung penggunaan
penggalian data.
6. Perkembangan bidang komputasi dan kapasitas penyimpanan yang sangat
dahsyat.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 6/22
Penggalian data dikenal juga dengan sebutan knowledge discovery in
databases (KDD). Sebutan ini mulanya berasal dari bidang penelitian artificial
intelligence (AI). Terdapat beberapa tahapan dalam KDD, yaitu : menentukan target
data, pra proses data, transformasi data (jika diperlukan), melakukan penggalian data
untuk menemukan pola dan hubungan dalam data, serta menerjemahkan dan menilai
pola yang ditemukan (Hand, Heikki, & Padhraic, 2001).
4.1.1 Tugas Penggalian Data
Menurut buku Principles of Data Mining, penggalian data dapat
dikelompokkan menjadi beberapa bagian berdasarkan jenis tugas yang dapat
dilakukan, antara lain :
a. Exploratory Data Analysis (EDA)
EDA bertujuan untuk mengeksplorasi data tanpa mengetahui apa yang
akan dicari (tidak ada target yang ditentukan). Teknik ini lebih interaktif
dan visual, namun ketika jumlah dimensi bertambah banyak, maka akan
lebih susah untuk divisualisasikan. Contoh penerapan EDA yaitu pie
chart.
b. Pemodelan Deskriptif
Tujuan dari pemodelan deskriptif adalah mendeskripsikan semua data
atau proses dalam menghasilkan data. Contoh penerapan pemodelan
deskriptif antara lain : estimasi densitas, analisis cluster, dan segmentasi.
c. Pemodelan Prediktif : Klasifikasi dan Regresi.
Tujuan dari pemodelan prediktif adalah membangun sebuah model yang
akan memprediksi nilai dari suatu variabel berdasarkan nilai dari
variabel-variabel lain yang telah diketahui. Pada klasifikasi, variabel yang
akan diprediksi adalah variabel categorical, sedangkan pada regresi,
variabel yang akan diprediksi adalah variabel kuantitatif. Perbedaan
pemodelan deskriptif dan pemodelan prediktif adalah pemodelan
prediktif mempunyai sebuah variabel unik yang menjadi target variabel
yang akan diprediksi, sedangkan pada pemodelan deskriptif, tidak ada
satu variabel yang menjadi target dari model yang digunakan.
d. Menemukan Pola dan Hubungan
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 7/22
Ketiga tugas penggalian data yang telah disampaikan sebelumnya adalah
berfokus pada membangun model dari data. Penerapan lain dari
penggalian data yaitu bidang yang fokus pada deteksi pola pada data.
Selain itu, penggalian data juga dapat digunakan untuk mencari
kombinasi beberapa item yang sering muncul pada transaksi-transaksi
yang terdapat pada database. Teknik ini biasanya diselesaikan dengan
menggunakan algoritma penggalian aturan asosiasi.
e. Pengambilan Berdasarkan Isi
Tugas penggalian data pada bagian ini adalah ketika pengguna telah
mempunyai sebuah pola ketertarikan tertentu dan ingin mencari
kemiripan pola pada data. Penerapan pengambilan berdasarkan isi
biasanya banyak digunakan untuk data yang berbentuk teks atau gambar.
Untuk data berbentuk teks, pola yang dicari dapat berupa kata kunci dan
pengguna ingin mencari dokumen-dokumen yang relevan dengan kata
kunci tersebut. Sedangkan untuk data berbentuk gambar, pengguna
biasanya mempunyai contoh gambar atau deskripsi gambar dan pengguna
ingin mencari gambar-gambar yang sejenis (mirip) dari sekumpulan data
gambar.
4.1.2 Cross-Industry Standard Process for Data Mining (CRISP-DM)
CRISP-DM merupakan sebuah standar proses dalam penggalian data
yang dikembangkan pada tahun 1996 oleh para analis yang mewakili
DaimlerChrysler, SPSS, dan NCR (Larose, 2005). Standar ini tersedia secara
bebas dan dapat digunakan sebagai acuan untuk meletakkan penggalian data
secara tepat ke dalam strategi pemecahan masalah general dari suatu bisnis
atau unit penelitian tertentu. Berdasarkan CRISP-DM, sebuah proyek
penggalian data mempunyai siklus yang terdiri dari enam fase, seperti yang
dapat dilihat pada Gambar 1. Namun keenam fase tersebut tidak bersifat
permanen tetapi dapat disesuaikan dengan proyek penggalian data yang
dikerjakan.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 8/22
Gambar 1. Siklus CRISP-DM yang terdiri dari enam fase (Wirth & Hipp)
Berikut adalah penjabaran dari keenam fase CRISP-DM :
a. Fase Pemahaman Bisnis
Mendefinisikan tujuan proyek penggalian data dan
menjelaskan kebutuhan proyek secara lengkap dalam hal bisnis
atau unit penelitian secara keseluruhan.
Menerjemahkan tujuan-tujuan dan menentukan batasan dalam
rumusan masalah yang akan diselesaikan dengan penggalian
data.
Menyiapkan strategi awal untuk mencapai tujuan yang telah
ditentukan.
b. Fase Pemahaman Data
Mengumpulkan data dan mengeksplorasi data yang diperoleh.
Eksplorasi dapat dilakukan dengan mencari tahu gambaran
awal dari data yang diperoleh serta memahami variabel-
variabel yang melekat pada data.
Mengevaluasi kualitas data. Evaluasi terhadap kualitas data
dapat dilakukan dengan Evaluasi tersebut dapat dilihat dari
beberapa aspek, antara lain : missing values, noise dan outliers,
redudansi data, dan lain-lain (Tan, Steinbach, & Kumar, 2004).
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 9/22
Jika perlu, pilih beberapa bagian yang memiliki pola yang
dapat ditindaklanjuti.
c. Fase Penyiapan Data
Mempersiapkan data set akhir dari data awal yang diperoleh.
Data set akhir inilah yang akan digunakan sebagai data yang
dianalisis pada fase-fase berikutnya.
Menentukan studi kasus dan variabel yang tepat untuk
dianalisis.
Melakukan transformasi pada variabel-variabel tertentu jika
diperlukan.
Melakukan pra proses data pada data set akhir sehingga siap
untuk digunakan pada tool pemodelan.
d. Fase Pemodelan
Memilih dan menggunakan teknik pemodelan yang sesuai.
Menyesuaikan pengaturan model sehingga menghasilkan hasil
yang optimal.
Beberapa teknik penggalian data yang berbeda biasanya dapat
digunakan pada kasus penggalian data yang sama.
Jika perlu, kembali ke fase persiapan data untuk menyiapkan
data yang sesuai dengan teknik penggalian data yang
digunakan.
e. Fase Evaluasi
Mengevaluasi satu atau lebih model yang dihasilkan pada fase
pemodelan untuk mencari model yang paling berkualitas dan
efisien sebelum model tersebut diimplementasikan.
Menilai apakah model yang dihasilkan dapat menjawab tujuan
yang ditentukan pada fase pertama.
Menentukan apakah ada aspek penting dari permasalahan
bisnis yang belum terselesaikan.
Menentukan keputusan mengenai penggunaan hasil
penggalian data.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 10/22
f. Fase Implementasi Model
Memanfaatkan model yang telah dihasilkan sesuai dengan
tujuan yang ingin dicapai.
4.2. Penggalian aturan asosiasi
Pada penjelasan sebelumnya, telah disebutkan bahwa penggalian data dapat
melakukan beberapa tugas. Bagian ini akan menjelaskan secara lebih rinci mengenai
salah satu tugas yang dapat dilakukan melalui penggalian data, yaitu asosiasi.
Asosiasi yang dilakukan melalui penggalian data adalah suatu proses pencarian
atribut-atribut yang sering muncul secara bersamaan. Pada dunia bisnis, proses ini
sering disebut sebagai analisis afinitas atau market basket analysis. Tugas dari
asosiasi adalah membentuk aturan yang ditentukan berdasarkan hubungan antar dua
atau lebih atribut. Aturan asosiasi ditentukan sebagai “Jika antecedent (penyebab),
maka consequent (akibat)”, dengan perhitungan support dan confidence untuk
masing-masing aturan. Contohnya, pada sebuah supermarket terdapat 1000
pelanggan yang berbelanja pada hari kamis malam, 200 orang membeli popok dan
dari 200 orang yang membeli popok, 50 diantaranya juga membeli bir. Dari sana
dapat dibentuk sebuah aturan “Jika membeli popok, maka membeli bir” dengan nilai
support 200/1000 = 20% dan confidence 50/200 = 25%. Saat melakukan penggalian
aturan asosiasi, terdapat dua bentuk (format) data yang dapat digunakan, yaitu format
data transaksional dan format data tabular. Format data transaksional mempunyai dua
kolom, yaitu ID dan konten, setiap baris merepresentasikan sebuah item tunggal.
Tabel 1 menunjukkan contoh format data transaksional.
Tabel 1. Format Data Transaksional
ID Mahasiswa Mata kuliah yang diambil
1 KS1309
1 KS1310
2 KS1309
2 KS1311
... ...
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 11/22
Sedangkan format data tabular merepresentasikan data dengan memisahkan setiap
transaksi dengan memberikan nilai 1 atau 0 pada setiap item.
Tabel 2. Format Data Tabular
ID Mahasiswa KS1309 KS1310 KS1311
1 1 1 0
2 1 0 1
...
Rumus yang digunakan untuk menghitung support dari sebuah penggalian aturan
asosiasi AB (Jika A, maka B) adalah proporsi dari semua transaksi D yang berisi
A dan B, sehingga :
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 = 𝑠 = 𝑃(𝐴 ∩ 𝐵) =𝑗𝑢𝑚𝑙𝑎ℎ 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑖𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵
𝑗𝑢𝑚𝑙𝑎ℎ 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑡𝑜𝑡𝑎𝑙
Sedangkan untuk menghitung nilai confidence dari sebuah penggalian aturan asosiasi
AB (Jika A, maka B) adalah persentase dari transaksi D yang berisi A dan juga
berisi B, sehingga :
𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = 𝑐 = 𝑃(𝐵|𝐴) =𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑖𝑠𝑖 𝐴 𝑑𝑎𝑛 𝐵
𝑗𝑢𝑚𝑙𝑎ℎ 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑖𝑠𝑖 𝐴
Analis akan mengehendaki aturan yang mempunyai nilai support dan confidence
yang tinggi. Aturan yang kuat (bagus) adalah aturan yang dapat melampaui nilai
minimum support dan confidence yang ditentukan. Pada kasus penggalian aturan
asosiasi, terdapat itemset yang terdiri dari kumpulan item yang tersimpan pada I dan
k-itemset adalah itemset yang terdiri dari k item. Frekuensi dari sebuah itemset
dihitung dari banyaknya jumlah transaksi yang mengandung itemset tersebut. Sebuah
itemset dikatakan sebagai itemset yang sering muncul (frequent itemset), jika itemset
tersebut dapat melampaui nilai minimum kemunculan itemset yang ditetapkan.
Secara ringkas, penggalian aturan asosiasi mempunyai dua tahapan yang harus
dilakukan, yaitu mencari semua itemset yang sering muncul, lalu dari itemset yang
sering muncul tersebut akan dihasilkan aturan asosiasi yang melampaui nilai
minimum support dan confidence.
Masalah yang kemungkinan akan muncul saat menerapkan penggalian aturan
asosiasi adalah dimensionalitas. Jumlah aturan yang dihasilkan akan semakin banyak
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 12/22
sesuai dengan bertambahnya jumlah atribut. Algoritma apriori adalah salah satu
algoritma yang dapat digunakan dalam penggalian aturan asosiasi. Algoritma
tersebut dapat mereduksi jumlah aturan menjadi jumlah yang lebih sedikit dengan
mengurangi jumlah kemungkinan itemset yang sering muncul. Algoritma ini
menyatakan jika Z adalah sebuah itemset yang tidak sering muncul, maka
menambahkan item A pada itemset Z tidak akan membuat Z menjadi lebih sering
muncul. Oleh karena itu, jika Z tidak sering muncul, maka Z ∪ A akan menjadi
itemset yang tidak sering muncul. Dengan kata lain, tidak ada superset dari Z (itemset
yang berisi Z) yang akan sering muncul. Algoritma ini akan sangat berguna untuk
mengurangi ruang pencarian dalam menentukan itemset yang sering muncul (Larose,
2005).
Ketika penggalian aturan asosiasi dengan menggunakan algoritma apriori
telah selesai dilakukan, maka akan dihasilkan beberapa aturan. Dalam rangka menilai
efektifitas dari setiap aturan yang dihasilkan tersebut, maka dilakukan evaluasi
terhadap tiap aturan. Evaluasi ini dilakukan untuk menilai apakah sistem rekomendasi
yang hendak dibangun dapat merekomendasikan mata kuliah tertentu dengan hanya
mempertimbangkan satu mata kuliah atau dua mata kuliah pertama yang disebutkan.
Ukuran yang digunakan untuk melakukan evaluasi tersebut adalah coverage dan
akurasi. Nilai coverage menyatakan kemampuan sistem untuk menghasilkan semua
mata kuliah yang kemungkinan akan direkomendasikan bagi mahasiswa. Secara
matematis, rumus perhitungan coverage yaitu :
𝐶𝑜𝑣𝑒𝑟𝑎𝑔𝑒 = |𝑅 (𝑠𝑖) ∩ 𝑇 (𝑠𝑖)|
|𝑇 (𝑠𝑖)|
Sedangkan akurasi menyatakan kemampuan sistem untuk menyediakan rekomendasi
yang benar bagi mahasiswa. Secara matematis, rumus perhitungan akurasi yaitu :
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = |𝑅 (𝑠𝑖) ∩ 𝑇 (𝑠𝑖)|
|𝑅 (𝑠𝑖)|
Dengan 𝑅 (𝑠𝑖) = mata kuliah yang direkomendasikan dan 𝑇 (𝑠𝑖) = sisa mata kuliah
yang harus diambil. Apabila analis ingin menghasilkan performa sistem rekomendasi
yang optimal, maka perlu dicari nilai rekomendasi coverage dan akurasi yang tepat.
Semakin tinggi nilai coverage dan akurasi yang dihasilkan, maka sistem rekomendasi
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 13/22
akan semakin baik dalam memprediksi mata kuliah apa yang harus
direkomendasikan (Bendakir & Aimeur, 2006).
4.3. Peraturan Akademik ITS
Berdasarkan Peraturan Akademik Institut Teknologi Sepuluh Nopember
Tahun 2009-2014 pasal 14, untuk membantu setiap mahasiswa mengembangkan
kemampuannya agar dapat menyelesaikan pendidikan dengan baik dan tepat waktu,
ditetapkan seorang tenaga pengajar tetap sebagai dosen wali. Dosen wali bertugas
memantau perkembangan studi mahasiswa. Setiap awal semester, mahasiswa harus
menyusun rencana studinya bersama dosen wali dan rencana studi tersebut
dituangkan dalam FRS (Formulir Rencana Studi) online. Mahasiswa berhak
mendapat bimbingan dosen wali dalam hal mendapatkan informasi tentang program
pendidikan di ITS, pengarahan dalam menyusun rencana studi untuk semester yang
akan berlangsung, dan bantuan dalam menyelesaikan masalah akademik. Pada pasal
19, ukuran keberhasilan pembelajaran dinyatakan dengan Indeks Prestasi. Indeks
Prestasi (IP) dihitung sebagai berikut :
𝐼𝑃 =𝑏𝑜𝑏𝑜𝑡 𝑚𝑎𝑡𝑎 𝑘𝑢𝑙𝑖𝑎ℎ
𝑡𝑜𝑡𝑎𝑙 𝑠𝑘𝑠=
∑ 𝐾𝑖 × 𝑁𝑖𝑛𝑖=1
∑ 𝐾𝑖𝑛𝑖=1
Dengan :
n = jumlah mata kuliah yang telah diambil.
N = nilai numerik hasil evaluasi masing-masing mata kuliah;
Skala pengukuran hasil evaluasi pembelajaran mahasiswa dinyatakan sebagai
berikut :
Tabel 3. Hasil evaluasi pembelajaran
Nilai Angka Nilai Huruf Nilai Numerik Sebutan
81 – 100 A 4 Istimewa
71 – 80 AB 3,5 Sangat baik
66 – 70 B 3 Baik
61 – 65 BC 2,5 Cukup baik
56 – 60 C 2 Cukup
41 – 55 D 1 Kurang
0 – 40 E 0 Sangat kurang
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 14/22
K = besar SKS masing-masing mata kuliah;
Menurut Peraturan Akademik ITS Tahun 2009-2014 Pasal 4, sistem
penyelenggaraan pendidikan menggunakan Sistem Kredit Semester (SKS) yang
diartikan sebagai suatu sistem penyelenggaraan pendidikan dengan
menggunakan satuan kredit semester untuk menyatakan beban mahasiswa, beban
kerja dosen, dan beban penyelenggaraan program. Satu SKS untuk
penyelenggaraan mata kuliah diartikan sebagai beban studi mahasiswa untuk
mengikuti keseluruhan tiga kegiatan per minggu, yaitu 50 menit kegiatan tatap
muka terjadwal dengan tenaga pengajar, 50 – 100 menit kegiatan akademik
terstruktur, dan 50 – 100 menit kegiatan akademik mandiri dalam satu semester
(18 minggu perkuliahan).
Pada setiap semester, terdapat ukuran keberhasilan pembelajaran yang
dinyatakan dengan Indeks Prestasi Semester )IPS). IPS adalah IP yang dihitung dari
semua mata kuliah yang diambil dalam semester yang bersangkutan. Beban studi
yang dapat diambil pada tiap semester ditentukan oleh IPS yang dicapai pada
semester berikutnya, dengan acuan sebagai berikut :
Tabel 4. Beban studi berdasarkan IPS
IPS Beban studi maksimal yang dapat diambil
𝐼𝑃𝑆 < 2,00 16 SKS
2,00 ≤ 𝐼𝑃𝑆 < 3,00 20 SKS
𝐼𝑃𝑆 ≥ 3,00 24 SKS
Sedangkan untuk mahasiswa baru program sarjana wajib mengambil seluruh beban
studi pada semester 1 dan sekurang-kurangnya seluruh beban studi pada semester 2.
Pengambilan mata kuliah harus memperhatikan mata kuliah prasyaratnya, dengan
nilai mata kuliah prasyarat sekurang-kurangnya D untuk program sarjana (Institut
Teknologi Sepuluh Nopember, 2009).
5. METODE PENGERJAAN TUGAS AKHIR
Bagian metode pengerjaan tugas akhir ini menjabarkan langkah-langkah yang akan
dilakukan dalam proses mengerjakan tugas akhir. Permasalahan pada tugas akhir ini akan
diselesaikan dengan metode yang mengacu pada Cross Industry Standard Process for Data
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 15/22
Mining (CRISP-DM). Gambar 2 di bawah ini menunjukkan tahapan dari metode pengerjaan
tugas akhir berdasarkan CRISP-DM serta keluaran dari setiap proses tersebut.
Penjelasan untuk setiap tahap dalam metode tersebut adalah sebagai berikut.
a. Penentuan Tujuan
Tahap penentuan tujuan adalah tahap untuk memahami permasalahan yang terjadi di
Jurusan Sistem Informasi ITS, menetapkan tujuan, dan menentukan batasan dari
permasalahan yang akan diselesaikan melalui tugas akhir yang dikerjakan. Selain itu,
pada tahap ini juga dapat dilakukan studi literatur untuk mencari strategi pemecahan
masalah dengan menggunakan teknik penggalian data tertentu. Studi literatur tersebut
digunakan sebagai dasar teori yang digunakan sebagai referensi / acuan dalam pengerjaan
tugas akhir. Referensi utama yang digunakan pada tugas akhir ini adalah paper berjudul
Using Association Rules for Course Recommendation. Paper tersebut ditulis oleh
Narimel Bendakir dan Esma Aïmeur dari Université de Montréal sebagai hasil workshop
yang diselenggarakan oleh Association for the Advancement of Artificial Intelligence
pada tahun 2006. Referensi lain yang digunakan pada tugas akhir ini adalah referensi
mengenai konsep penggalian data, CRISP-DM, dan teknik penggalian aturan asosiasi.
Referensi mengenai ketiga topik tersebut didapatkan dari e-book yang berjudul
Introduction to Data Mining karangan Tan, Steinbach, Kumar, Discovering Knowledge
Keluaran :
Tujuan & referensi penelitian
Keluaran :
Data final yang akan digunakan
Keluaran :
Hasil dari association rule &
Desain sistem rekomendasi
Keluaran :
Hasil uji coba sistem rekomendasi
Keluaran :
Buku Tugas AkhirDokumentasi
Implementasi dan Uji Coba
Pemodelan dan Desain Sistem
Penyiapan Data
Penentuan Tujuan dan
Studi Literatur
Gambar 2. Metode pengerjaan tugas akhir
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 16/22
in Data karangan Daniel T. Larose, serta Principles of Data Mining karangan Hand,
Heikki, Smyth. Sedangkan referensi mengenai peraturan akademik ITS didapatkan dari
buku peraturan akademik ITS tahun 2009 yang beredar di kalangan internal ITS
Surabaya.
b. Penyiapan Data
Pada tahap penyiapan data, dilakukan pengumpulan data-data awal yang akan digunakan
dalam pengerjaan tugas akhir. Data yang digunakan pada tahap ini merupakan data-data
akademik mahasiswa yang didapat dari Pusat Data dan Pelaporan LPTSI ITS. Data yang
diambil adalah data mulai tahun 2008 sampai 2012. Sebagai batasan, data yang diambil
hanya data mahasiswa dan alumni yang menempuh studi pada jenjang sarjana program
reguler yang menempuh studi di Jurusan Sistem Informasi ITS. Tahap ini merupakan
tahap untuk memahami data yang diperoleh, yaitu memahami tipe data, variabel-variabel
yang melekat pada data, dan jumlah data. Selain itu, dilakukan pula evaluasi terhadap
kualitas data. Tahap selanjutnya adalah mempersiapkan data final yang akan digunakan
untuk proses pemodelan. Data final yang dimaksud adalah data yang telah melalui proses
pra proses sehingga menjadi data yang berkualitas baik. Bila perlu, dapat dilakukan
proses transformasi pada variabel tertentu untuk menunjang proses pemodelan. Pada
tahap ini juga dilakukan peninjauan terhadap mata kuliah yang disediakan. Mata kuliah
yang sudah tidak ditawarkan atau mata kuliah yang kodenya berubah akan disesuaikan
dengan kode mata kuliah yang digunakan saat ini (sesuai aturan ekivalensi yang berlaku
di ITS). Selain itu, akan ditambahkan variabel baru yaitu laboratorium yang dipilih
mahasiswa sesuai dengan tugas akhir yang dikerjakannya. Format data yang digunakan
akan disesuaikan dengan format masukan file WEKA yaitu ARFF (Attribute-Relation
File Format). Keluaran dari tahap ini adalah final data set yang akan digunakan pada
tahap-tahap berikutnya.
c. Pemodelan dan Desain Sistem
Pemodelan merupakan tahap pemodelan terhadap final data set yang telah disiapkan
sebelumnya. Pada tahap ini, data final tersebut dianalisis menggunakan tool yaitu WEKA
versi 3.6.10. WEKA merupakan aplikasi open source untuk penggalian data dan machine
learning. Analisis yang dilakukan melalui WEKA menggunakan metode penggalian
aturan asosiasi dengan algoritma apriori untuk menghasilkan aturan tentang rekomendasi
pengambilan mata kuliah. Algoritma apriori mempunyai dua parameter yaitu support dan
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 17/22
confidence yang akan mempengaruhi aturan yang akan dihasilkan. Penggalian aturan
asosiasi akan menghasilkan aturan yang mencapai atau melebihi batas minimum support
dan confidence yang ditentukan. Sedangkan algoritma apriori akan menentukan itemset
yang sering muncul dalam data set yang digunakan (Lihat Bab 4. Tinjauan Pustaka
bagian 4.2). Pada tahap ini dilakukan training pada data. Keluaran dari tahap ini adalah
aturan yang digunakan untuk merekomendasikan mata kuliah tertentu.
Setelah aturan untuk merekomendasikan mata kuliah dihasilkan, maka selanjutnya
dilakukan desain sistem rekomendasi yang akan dibangun. Sistem tersebut akan
dibangun menggunakan bahasa pemrograman Java dengan bantuan tool NetBeans versi
7.4 dan database MySQL. Sistem rekomendasi ini akan mengevaluasi aturan yang
dihasilkan berdasarkan bobot mata kuliah (Lihat Bab 4. Tinjauan Pustaka bagian 4.3).
Jika bobot mata kuliah kurang dari batasan penerimaan mata kuliah, maka sistem akan
menghapus mata kuliah tersebut dari aturan yang digunakan. Namun jika yang terjadi
sebaliknya, maka mata kuliah tersebut akan tetap menjadi mata kuliah yang
direkomendasikan. Hal ini dilakukan untuk meningkatkan kualitas aturan yang
dihasilkan dari proses penggalian aturan asosiasi. Secara ringkas, gambaran dari sistem
rekomendasi pengambilan mata kuliah yang akan dibuat ditunjukkan pada gambar 3.
Gambar 3. Desain sistem rekomendasi pengambilan mata kuliah
d. Implementasi dan Uji Coba
Pada tahap implementasi akan dilakukan pembuatan sistem rekomendasi pengambilan
mata kuliah dengan menggunakan Java. Tahap ini merupakan tahap lanjutan dari tahap
desain sistem, sehingga langkah-langkah yang dilakukan pada tahap implementasi
merupakan tindak lanjut tahap desain sistem. Pada awalnya, data akademik mahasiswa
yang telah melalui pra proses dimasukkan ke dalam database MySQL. Lalu dibentuklah
Input
•Data mahasiswa
•Data mata kuliah
Proses
•Penerapan penggalian aturan asosiasi
•Evaluasi aturan
Output
•Mata kuliah yang direkomen-dasikan
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 18/22
sistem yang dapat menyimpan aturan-aturan yang telah dihasilkan pada proses
penggalian aturan asosiasi sebelumnya. Aturan-aturan tersebut kemudian dievaluasi
untuk meningkatkan kualitas aturan yang dihasilkan. Evaluasi dilakukan berdasarkan
komparasi antara bobot mata kuliah dan batas nilai penerimaan mata kuliah yang akan
direkomendasikan. Setelah sistem menyeleksi aturan-aturan tersebut, sistem akan
memperbarui data mata kuliah yang direkomendasikan dan menghapus aturan yang tidak
sesuai. Tahap uji coba sistem akan menggunakan data testing yang berbeda dari data
training yang telah digunakan sebelumnya. Selain itu, pada tahap ini dilakukan evaluasi
apakah model yang dihasilkan sudah dapat menjawab tujuan yang ditentukan di tahap
sebelumnya. Jika masih ada tujuan yang belum terjawab, maka dapat dilakukan
peninjauan kembali terhadap model yang didapatkan.
e. Dokumentasi
Tahap dokumentasi merupakan tahap terakhir dalam proses pengerjaan tugas akhir.
Tahap ini tidak termasuk dalam enam fase CRISP-DM tetapi merupakan fase tambahan
yang dianggap penting dalam pengerjaan tugas akhir. Pada tahap ini dilakukan
pendokumentasian hasil tugas akhir serta analisis terhadap hasil yang didapatkan.
Keluaran dari tahap ini adalah buku tugas akhir.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 19/22
6. DAFTAR PUSTAKA
Bendakir, N., & Aimeur, E. (2006). Using Association Rules for Course Recommendation.
AAAI Workshop on Educational Data Mining (Vol. 3). Montreal: Association for
the Advancement of Artificial Intelligence.
Hand, D., Heikki, M., & Padhraic, S. (2001). Principles of Data Mining. London: The MIT
Press.
Institut Teknologi Sepuluh Nopember. (2009). Peraturan Akademik 2009. Surabaya: ITS
Press.
Larose, D. T. (2005). Discovering Knowledge in Data. New Jersey: John Wiley & Sons,
Inc.
Sailah, I. (2010). Sistem Penjaminan Mutu Perguruan Tinggi (SPM-PT). Jakarta: Dikti.
Tan, P.-N., Steinbach, M., & Kumar, V. (2004). Introduction to Data Mining. Boston:
Pearson Education, Inc.
Wirth, R., & Hipp, J. (t.thn.). CRISP-DM : Towards a Standard Process Model for Data
Mining.
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 20/22
7. JADWAL KEGIATAN
Tabel 5. Jadwal kegiatan tugas akhir
No Kegiatan Februari Maret April Mei Juni
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Penentuan Tujuan
a. Survey ke instansi penyedia
data akademik ITS
b. Identifikasi permasalahan
dan penentuan batasan
masalah
c. Studi literatur terkait
masalah yang akan
diselesaikan
d. Studi literatur mengenai
teknik penggalian data yang
akan digunakan
2. Penyiapan Data
a. Pengumpulan data
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 21/22
No Kegiatan Februari Maret April Mei Juni
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
b. Evaluasi kualitas data
c. Seleksi dan transformasi data
d. Pra proses data
4. Pemodelan dan Desain Sistem
a. Pengolahan data menggunakan
metode penggalian aturan
asosiasi
b. Desain sistem rekomendasi
pengambilan mata kuliah
5. Implementasi dan Uji Coba
6. Dokumentasi
a. Analisis hasil penggalian data
b. Penyusunan buku tugas akhir
Paraf pembimbing I : ______________ Paraf pembimbing II : ______________
hal : 22/22
Surabaya, 13 Maret 2014
Dosen Pembimbing 1
Prof. Ir. Arif Djunaidy, M.Sc., Ph.D.
NIP. 19581005 198603 1 003
Dosen Pembimbing 2
Renny Pradina Kusumawardani, S.T., M.T.
NIP. SI.1209.00.19