implementasi algoritma decision tree untuk prediksi
TRANSCRIPT
IMPLEMENTASI ALGORITMA DECISION TREE
UNTUK PREDIKSI KELULUSAN MAHASISWA
TEPAT WAKTU
LAPORAN SKRIPSI
RAMADHINA PUTRI PERMATASARI
4617010061
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA DAN
KOMPUTER
POLITEKNIK NEGERI JAKARTA
2021
IMPLEMENTASI ALGORITMA DECISION TREE
UNTUK PREDIKSI KELULUSAN MAHASISWA
TEPAT WAKTU
LAPORAN SKRIPSI
Dibuat untuk Melengkapi Syarat-Syarat yang Diperlukan untuk
Memperoleh Diploma Empat Politeknik
RAMADHINA PUTRI PERMATASARI
4617010061
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA DAN KOMPUTER
POLITEKNIK NEGERI JAKARTA
2021
iii
HALAMAN PERNYATAAN ORISINALITAS
Skripsi ini adalah hasil karya saya sendiri, dan semua sumber baik yang
dikutip maupun dirujuk telah saya nyatakan dengan benar.
Nama : Ramadhina Putri Permatasari
NPM : 4617010061
Tanggal : Rabu, 21 Juli 2021
Tanda Tangan :
iv
LEMBAR PENGESAHAN
Skripsi diajukan oleh:
Nama : Ramadhina Putri Permatasari
NIM : 4617010061
Program Studi : Teknik Informatika
Judul Skripsi : Implementasi Algoritma Decision Tree untuk
Prediksi Kelulusan Mahasiswa Tepat Waktu
Telah diuji oleh tim penguji dalam Sidang Skripsi pada hari Kamis, Tanggal 5,
Bulan Agustus, Tahun 2021 dan dinyatakan LULUS.
Disahkan oleh
Pembimbing I : Euis Oktavianti, S.Si., M.T.I. (……………………………)
Penguji I : Iwan Sonjaya,ST.,MMT.,MT. (……………………………)
Penguji II : Anggi Mardiyono S.Kom.,
M.Kom.
(……………………………)
Penguji III : Ariawan Andi Suhandana,
S.Kom., aM.T.I.
(……………………………)
Mengetahui : Jurusan Teknik Informatika dan Komputer
Ketua
Mauldy Laya, S.Kom., M.Kom.
NIP. 197802112009121003
v
KATA PENGANTAR
Puji syukur penulis panjatkan atas kehadirat Allah SWT karena atas rahmat
dan karunia Nya-lah laporan skripsi ini dapat diselesaikan. Skripsi ini
berjudul “Implementasi Algoritma Decision Tree untuk Prediksi Kelulusan
Mahasiswa Tepat Waktu”. Pada kesempatan ini penulis mengucapkan
banyak terima kasih kepada berbagai pihak atas bantuan, bimbingan dan
dukungannya sehingga penulisan ini berjalan lancar, yaitu:
a. Allah SWT yang telah memberikan penulis rezeki berupa akal
sehat serta kesehatan sehingga mampu menyelesaikan skripsi ini.
b. Ibu Euis Oktavianti, S.Si., M.T.I. selaku dosen pembimbing skripsi
yang telah meluangkan waktu, tenaga, dan pikiran untuk
membimbing dan membantu penulis dalam menyusun laporan
skripsi.
c. Orang tua dan keluarga penulis yang tak pernah luput mendoakan
penulis serta memberikan dukungan dan bantuan moral maupun
material kepada penulis.
d. Teman-teman yang telah membantu penulis menyelesaikan
penyusunan skripsi .
Akhir kata, penulis berharap Allah SWT berkenan membalas segala
kebaikan yang telah dilakukan Bapak/Ibu serta teman-teman dan semoga
laporan skripsi ini dapat bermanfaat.
Jakarta, Juli 2021
Ramadhina Putri Permatasari
vi
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI
UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Politeknik Negeri Jakarta, saya yang bertanda tangan di
bawah ini:
Nama : Ramadhina Putri Permatasari
NIM : 4617010061
Program Studi : Teknik Informatika
Jurusan : Teknik Informatika dan Komputer
Jenis karya : Skripsi
demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Politeknik Negeri Jakarta Hak Bebas Royalti Noneksklusif (Non-exclusive
Royalty Free Right) atas karya ilmiah saya yang berjudul :
IMPLEMENTASI ALGORITMA DECISION TREE UNTUK PREDIKSI
KELULUSAN MAHASISWA TEPAT WAKTU
beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti
Noneksklusif ini Politeknik Negeri Jakarta berhak menyimpan,
mengalihmedia/format-kan, mengelola dalam bentuk pangkalan data (database),
merawat, dan memublikasikan skripsi saya selama tetap mencantumkan nama
saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.
Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di : Depok, Pada
tanggal : 18 Agustus 2021
Yang menyatakan
( Ramadhina Putri Permatasari )
vii
Implementasi Algoritma Decision Tree untuk Prediksi Kelulusan Mahasiswa
Tepat Waktu
Abstrak
Perguruan tinggi adalah institusi yang menyelenggarakan pendidikan akademik
bagi mahasiswa yang diharapkan dapat memberikan pendidikan yang berkualitas
agar mahasiswa dapat menjadi insan yang berilmu sehingga bisa memberikan
kontribusi bagi pembangunan nasional. Seluruh mahasiswa tentunya
menginginkan kelulusan yang tepat waktuKetepatan waktu kelulusan mahasiswa
dipengaruhi faktor faktor yang telah ditentukan perguruan tinggi. Tujuan
penelitian ini untuk melakukan prediksi kelulusan mahasiswa tepat waktu dengan
memberikan informasi nilai akademik mahasiswa. Metode yang digunakan dalam
penelitian ini adalah decision tree. Hasil evaluasi model menunjukkan akurasi
sebesar 85%.
Kata kunci: Prediksi, Decision Tree.
viii
DAFTAR ISI
HALAMAN PERNYATAAN ORISINALITAS ......................................................... iii
LEMBAR PENGESAHAN ......................................................................................... iv
KATA PENGANTAR .................................................................................................. v
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI UNTUK
KEPENTINGAN AKADEMIS ................................................................................... vi
Abstrak ........................................................................................................................ vii
DAFTAR ISI .............................................................................................................. viii
DAFTAR TABEL ........................................................................................................ xi
DAFTAR GAMBAR .................................................................................................. xii
BAB I ............................................................................................................................ 1
PENDAHULUAN ........................................................................................................ 1
1.1 Latar Belakang ........................................................................................................ 1
1.2 Perumusan Masalah ................................................................................................ 2
1.3 Batasan Masalah ..................................................................................................... 2
1.4 Tujuan dan Manfaaat .............................................................................................. 3
1.4.1 Tujuan .................................................................................................................. 3
1.4.2 Manfaat ................................................................................................................ 3
1.5 Metode Penyelesaian Masalah ................................................................................ 3
1.5.1 Identifikasi Masalah ............................................................................................. 3
1.5.2 Pengumpulan Data ............................................................................................... 3
1.5.3 Metode Pengembangan Sistem ............................................................................ 4
1.5.4 Analisis dan Desain Perancangan Sistem ............................................................ 5
1.5.5 Implementasi ........................................................................................................ 5
1.5.6 Pengujian .............................................................................................................. 6
1.5.7 Kesimpulan dan Saran ......................................................................................... 6
ix
BAB II ........................................................................................................................... 7
TINJAUAN PUSTAKA ............................................................................................... 7
2.1 Implementasi ........................................................................................................... 7
2.3 Fitur Seleksi ............................................................................................................ 7
2.4 Prediksi ................................................................................................................... 7
2.5 Mahasiswa ............................................................................................................... 7
2.8 Metode Pengembangan Sistem ............................................................................... 8
2.8.1 Requirement Gathering ........................................................................................ 8
1.8.2 Analisis ................................................................................................................ 9
2.8.3 Desain ................................................................................................................ 11
2.8.4 Implementasi ...................................................................................................... 14
2.8.5 Testing ................................................................................................................ 15
2.8.6 Deployment ........................................................................................................ 15
2.10 CRISP-DM .......................................................................................................... 15
2.10.1 Business Understanding ................................................................................... 16
2.10.2 Data Understanding ......................................................................................... 16
2.10.3 Data Preparation ............................................................................................... 16
2.10.4 Modelling ......................................................................................................... 18
2.10.5 Evaluation ........................................................................................................ 19
2.10.6 Deployment ...................................................................................................... 22
2.11 Penelitian Terdahulu ........................................................................................... 22
BAB III ....................................................................................................................... 24
PERENCANAAN DAN REALISASI ........................................................................ 24
3.1 Perancangan Program Aplikasi ............................................................................. 24
3.1.1 Deskripsi Program Aplikasi ............................................................................... 24
3.1.2 Requirement Analysis ........................................................................................ 24
3.1.3 Desain Sistem ..................................................................................................... 25
3.1.4 Implementasi Sistem .......................................................................................... 29
BAB IV ....................................................................................................................... 46
PEMBAHASAN ......................................................................................................... 46
x
4.1 Pengujian ............................................................................................................... 46
4.2 Deskripsi Pengujian .............................................................................................. 46
4.4 Data Hasil Pengujian ............................................................................................. 46
4.5 Analisis Pengujian ................................................................................................ 48
BAB V ........................................................................................................................ 50
KESIMPULAN ........................................................................................................... 50
5.1 Kesimpulan ........................................................................................................... 50
5.2 Saran ..................................................................................................................... 50
DAFTAR PUSTAKA ................................................................................................. 51
xi
DAFTAR TABEL
Tabel 3. 1 Tabel Data Nilai Matakuliah Mahasiswa ................................................... 31
Tabel 3. 2 Tabel Fitur Terpilih .................................................................................... 34
Tabel 3. 3 Tabel Fitur dan Information Gain .............................................................. 39
Tabel 4. 1 Hasil pengujian sistem ............................................................................... 46
Tabel 4. 2Tabel rasio pembagian data training dan testing......................................... 48
xii
DAFTAR GAMBAR
Gambar 2. 1 Tahapan metode waterfall ........................................................................ 8
Gambar 2. 2 Contoh flowchart .................................................................................... 11
Gambar 2. 3 Contoh diagram use case ....................................................................... 12
Gambar 2. 4 Contoh diagram activity ......................................................................... 14
Gambar 2. 5 Siklus Hidup CRISP-DM ....................................................................... 16
Gambar 2. 6 Struktur decision tree ............................................................................. 18
Gambar 2. 7 Confusion Matrix untuk klasifikasi biner .............................................. 20
Gambar 3. 1 Diagram Flowchart Sistem ..................................................................... 25
Gambar 3. 2 Diagram use case sistem ........................................................................ 26
Gambar 3. 3 Diagram activity sistem ......................................................................... 27
Gambar 3. 4 Tampilan Data Mahasiswa ..................................................................... 28
Gambar 3. 5 Tampilan Hasil Lulus Tepat Waktu ....................................................... 28
Gambar 3. 6 Tampilan Hasil Tidak Lulus Tepat Waktu ............................................. 29
Gambar 3. 7 Halaman input data nilai mahasiswa ...................................................... 29
Gambar 3. 8 Halaman yang tampil jika hasil klasifikasi adalah lulus tepat waktu..... 30
Gambar 3. 9 Halaman yang tampil jika hasil klasifikasi adalah tidak lulus tepat
waktu ........................................................................................................................... 30
Gambar 3. 10 Informasi tipe data dan keutuhan data ................................................. 35
Gambar 3. 11Baris kode data preparation ................................................................... 36
Gambar 3. 12 Baris kode data preparation .................................................................. 37
Gambar 3. 13 Baris kode data preparation .................................................................. 38
Gambar 3. 14 Baris kode data preparation .................................................................. 38
Gambar 3. 16 Baris kode model decision tree ............................................................ 39
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Perguruan tinggi merupakan institusi yang menyelenggarakan pendidikan
akademik bagi mahasiswa yang diharapkan dapat memberikan pendidikan yang
berkualitas agar mahasiswa dapat menjadi insan yang berilmu sehingga bisa
memberikan kontribusi bagi pembangunan nasional. Pendidikan dapat dikatakan
berhasil jika telah memenuhi tujuan pendidikan nasional dan proses belajar
mengajar yang diterapkan secara efektif dan efisien. Kesuksesan dan keberhasilan
pihak perguruan tinggi seringkali dapat dilihat dari keberhasilan dan prestasi
belajar mahasiswa, sedangkan kegagalan atau rendahnya kualitas mahasiswa
seringkali menjadi cerminan ketidakmampuan pihak perguruan tinggi dalam
menyelenggarakan proses pendidikan tinggi.
Semua mahasiwa tentunya mengharapkan kelulusan yang tepat waktu dan tidak
menambah semester. Adapun ketepatan waktu kelulusan mahasiswa dipengaruhi
faktor faktor tertentu yang ditentukan oleh perguruan tinggi yang bersangkutan.
Untuk dapat mengetahui kelulusan mahasiswa yang tepat waktu,dapat dilakukan
prediksi kelulusan tepat waktu dengan algoritma data mining. Adapun parameter
utama yang bisa digunakan adalah nilai akademik mahasiswa.
Prediksi kelulusan mahasiswa tepat waktu dapat diselesaikan dengan algoritma
prediksi data mining. Algoritma decision tree adalah algoritma yang cocok untuk
melakukan prediksi kelulusan mahasiswa tepat waktu dikarenakan algoritma
decision tree merupakan algoritma yang memiliki fleksibilitas dalam memilih
fitur dari internal nodes internal nodes yang berbeda, fitur yang terpilih akan
membedakan kriteria satu dengan kriteria lainnya di dalam node yang sama.
Karena sifatnya yang fleksibel, algoritma decision tree dapat meningkatkan
2
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
kualitas keputusan yang dihasilkan. Selain itu, dengan algoritma decision tree,
daerah keputusan yang sebelumnya kompleks dan sangat global, dapat menjadi
diubah menjadi lebih simpel dan spesifik (Syamsu et al., 2019).
Namun demikian, algoritma decision tree memiliki kekurangan yaitu memiliki
kesulitan dalam mendesain pohon keputusan yang optimal yang menyebabkan
desain pohon keputusan yang dibuat memengaruhi hasil kualitas keputusan yang
didapatkan. Oleh karena itu, dalam penelitian ini akan digunakan pemilihan fitur
menggunakan nilai information gain terbesar (Ke et al., 2017). Dengan model
decision tree membagi setiap node pada fitur yang paling informatif atau dengan
information gain terbesar, diharapkan desain pohon keputusan menjadi lebih
optimal sehingga dapat meningkatkan kualitas keputusan.
Adapun beberapa algoritma lain adalah naive bayes dan k-nearest neighbor.
Namun, algoritma lain tersebut memiliki kekurangan. Yang pertama adalah naive
bayes memiliki kelemahan bahwa harus memiliki asumsi bahwa antar fitur tidak
memiliki keterkaitan ketika dalam realitanya seringkali antar fitur memiliki
keterkaitan (Syarli & Muin, 2016). Yang kedua adalah k-nearest neighbor
memiliki kelemahan bahwa nilai parameter k yang paling sesuai harus dicari
terlebih dahulu (Prasetya, 2017).
1.2 Perumusan Masalah
Berdasarkan latar belakang yang telah diuraikan di atas,
maka perumusan masalah dalam pembuatan sistem ini adalah:
Bagaimana algoritma decision tree dapat melakukan prediksi kelulusan
mahasiswa tepat waktu?
1.3 Batasan Masalah
Batasan masalah dalam pembuatan sistem ini adalah:
a. Sistem menggunakan algoritma decision tree dengan entropy untuk
melakukan prediksi kelulusan mahasiswa tepat waktu.
b. Data yang digunakan pada model adalah data nilai akademik mahasiswa
3
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
bertipe file csv di program studi Teknik Informatika jurusan Teknik
Informatika dan Komputer Politeknik Negeri Jakarta
c. Data nilai akademik yang digunakan pada model adalah adalah matakuliah
wajib tingkat 1, IP semester dan IPK mahasiswa
d. Sistem berbasis website
e. Sistem memberikan informasi mahasiswa yang lulus tepat waktu
1.4 Tujuan dan Manfaaat
1.4.1 Tujuan
Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma decision
tree untuk melakukan prediksi kelulusan mahasiswa tepat waktu.
1.4.2 Manfaat
Manfaat yang dapat diperoleh dari pembuatan sistem ini tersebut antara lain
adalah untuk dapat membantu staf Politeknik Negeri Jakarta dalam melakukan
prediksi kelulusan mahasiswa yang tepat waktu secara otomatis.
1.5 Metode Penyelesaian Masalah
Metode yang dilakukan dalam penelitian ini terdiri dari beberapa tahapan yaitu
sebagai berikut:
1.5.1 Identifikasi Masalah
Tahap ini mengidentifikasikan permasalahan yang muncul ditempuh dengan cara
melakukan observasi lapangan. Observasi dilakukan untuk mengetahui
permasalahan yang terjadi di lapangan, yaitu ketepatan waktu kelulusan
mahasiswa. Identifikasi masalah dari hasil observasi yaitu diperlukannya sistem
yang bermanfaat untuk membantu melakukan prediksi kelulusan mahasiswa yang
tepat waktu.
1.5.2 Pengumpulan Data
Metode pengumpulan data yang digunakan terdiri dari:
4
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
1. Data Sekunder
Penulis juga mengumpulkan data akademik mahasiswa dari staf akademik terkait
data yang akan diujikan kedalam sistem yang dibuat.
2. Tinjauan Pustaka
Tahap ini penulis melakukan studi literatur, yaitu pengumpulan bahan-bahan
referensi dari buku, artikel jurnal, maupun situs internet yang berkaitan dengan
sistem yang akan dibuat.
1.5.3 Metode Pengembangan Sistem
Metode pengembangan yang akan digunakan dalam pembuatan aplikasi ini adalah
waterfall. Waterfall Development Method adalah pendekatan SDLC paling awal
yang digunakan untuk pengembangan perangkat lunak. Hal ini juga disebut
sebagai model SDLC linear-sekuensial. Hal ini sangat sederhana untuk
memahami dan menggunakanya dalam mengimplementasikan sebuah
sistem. Dalam Model Waterfall, setiap tahap harus berurutan, dan tidak dapat
meloncat ketahap berikutnya, harus menyelesaikan tahap pertama baru lanjut ke
tahap ke berikutnya (Susilo, 2018). Tahapan tahapan tersebut antara lain adalah :
a. Requirement Gathering
Tahap ini akan menghasilkan daftar kebutuhan dari sistem untuk mengatasi
permasalahan yang ada dengan cara melakukan analisis terhadap masalah yang
sedang terjadi pada objek penelitian yang dilakukan dengan studi literatur dan
wawancara dengan pihak universitas
b. Analisis
Tahap ini dilakukan analisis kebutuhan, analisis kebutuhan ini nantinya dijadikan
sebagai alat bantu yang digunakan dalam proses pembuatan desain hingga
menjadi aplikasi final
c. Desain
5
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Informasi yang telah didapatkan pada tahap analisis akan dibuatkan suatu desain
interaktif dari aplikasi yang akan dibangun. Adapun desain yang dilakukan adalah
desain terhadap infrastruktur dan tampilan sistem.
d. Implementasi
Informasi yang telah dikumpulkan pada tahap sebelumnya akan menjadi bahan
acuan untuk ditransformasikan ke dalam bentuk syntax code. Disini akan banyak
dilakukan debug pada setiap komponen aplikasi yang telah dibangun di tahap ini.
e. Testing
Aplikasi yang telah selesai dibangun akan dilakukan proses pengujian pada
seluruh komponen aplikasi untuk memastikan semua komponen aplikasi dapat
bekerja dengan baik tanpa adanya error.
f. Instalasi
Tahap ini adalah tahap terakhir yang dimana dilakukan instalasi sistem yang siap
untuk digunakan oleh pihak perguruan tinggi
1.5.4 Analisis dan Desain Perancangan Sistem
Tahap ini meliputi kegiatan analisa kebutuhan fungsional dari sistem berdasarkan
studi literature yang dilakukan pada tahap sebelumnya. Kemudian dilanjutkan
dengan melakukan perancangan model sistem. Perancangan adalah suatu bagian
dari metodologi pengembangan pembangunan. Perancangan yang dibuat
mencakup flowchart
1.5.5 Implementasi
Tahap ini dilakukan dengan cara menerapkan rancangan sistem yang telah dibuat
sebelumnya. Selain itu, tahap ini juga menjelaskan bagaimana implementasi dari
perancangan yang telah dibuat pada tahap sebelumnya, bagaimana infrastuktur
sistem dan bahasa pemrograman yang digunakan. Sebagai rencana awal, aplikasi
dibangun menggunakan framework laravel.
6
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
1.5.6 Pengujian
Tahap ini yaitu melakukan uji coba sistem prediksi. Tujuan dari tahap ini yaitu
untuk memastikan aplikasi telah sesuai dengan kebutuhan yang sudah
didefinisikan sebelumnya. Aplikasi diuji berdasarkan metode akurasi untuk
mengetahui berapa persen error yang terjadi pada sistem.
1.5.7 Kesimpulan dan Saran
Tahap ini merupakan proses untuk menarik kesimpulan dan saran atas apa yang
dilakukan selama pengerjaan tugas akhir. Dasar pengambilan kesimpulan dan
saran diantaranya adalah hasil analisa dan pembahasan. Tahap ini bertujuan untuk
menghasilkan gambaran penelitian secara ringkas, jelas, dan mudah dipahami.
7
BAB II
TINJAUAN PUSTAKA
2.1 Implementasi
Implementasi sistem dapat didefinisikan sebagai sebuah proses untuk penerapan
suatu sistem atau kebijakan dalam sebuah aktivitas. Implementasi dapat juga
diartikan sebagai penerapan dan pelaksanaan sebuah kebijakan. Implementasi
dilakukan berdasarkan suatu kerangka yang telah dibuat.
2.3 Fitur Seleksi
Proses pemilihan suatu subset dari fitur asli dengan menghilangkan fitur yang
tidak relevan disebut dengan feature selection atau fitur seleksi. Fitur seleksi
seringkali digunakan untuk meningkatkan efisiensi dari suatu model. Fitur seleksi
bertujuan untuk mencari sebuah data yang paling relevan terhadap suatu kelas
dikarenakan fitur yang tidak relevan ataupun yang berlebihan dapat memengaruhi
hasil dari suatu model (Bode, 2017).
2.4 Prediksi
Prediksi merupakan suatu proses perkiraan yang dilakukan terhadap sekumpulan
data. Prediksi di dalam data mining merupakan proses perkiraan sekumpulan data,
dapat dilakukan pada data terstruktur atau tidak terstruktur. Adapun label adalah
atribut yang akan diprediksi oleh mesin.
2.5 Mahasiswa
Mahasiswa merupakan orang yang belajar di perguruan tinggi, baik di universitas,
institut atau akademi. Mahasiswa adalah orang orang yang terdaftar sebagai
pelajar di perguruan tinggi. Dengan mengejar pendidikan yang lebih tinggi,
mahasiswa diharapkan dapat menjadi insan yang kreatif dan berilmu untuk dapat
memberikan kontribusi di dalam pembangunan nasional (Nurhayati et al., 2015).
8
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
2.8 Metode Pengembangan Sistem
Waterfall Development Method adalah pendekatan SDLC paling awal yang
digunakan untuk pengembangan perangkat lunak. Hal ini juga disebut sebagai
model SDLC linear-sekuensial. Hal ini sangat sederhana untuk memahami dan
menggunakanya dalam mengimplementasikan sebuah sistem. Dalam
Model Waterfall, setiap tahap harus berurutan, dan tidak dapat meloncat ketahap
berikutnya, harus menyelesaikan tahap pertama baru lanjut ke tahap ke berikutnya
(Susilo, 2018).
Gambar 2. 1 Tahapan metode waterfall
(Sumber : Maulani, 2020)
Gambar 2.1 merupakan tahapan dari metode waterfall. Pada algoritma ini terdapat
tahapan tahapan yang antara lain adalah tahapan perencanaan ataupun seringkali
berupa requirement gathering, analisis, desain, implementasi, serta penggunaan
atau yang bisa juga disebut dengan deployment.
2.8.1 Requirement Gathering
Dalam tahap analisis kebutuhan software ini bertujuan untuk menganalisa
kebutuhan software dan hardware yang dibutuhkan untuk menentukan solusi
untuk fitur dan interface yang digunakan. Adapun kebutuhuan Functional
Requirement dan Non-Functional Requirement pada aplikasi ini adalah:
a. Functional Requirement
9
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Kebutuhan fungsi dari sistem ini adalah di dalam sistem dapat melakukan input
nilai matakuliah wajib tingkat 1, serta IP setiap semester dan IPK. Sistem dapat
memroses nilai yang dimasukkan, serta sistem dapat menampilkan hasil prediksi
ketepatan waktu kelulusan mahasiswa
b. Non-Functional Requirement
Persyaratan untuk sistem ini yaitu menggunakan bahasa pemrograman PHP,
framework Laravel untuk membuat interface web. Yang terakhir adalah metode
yang akan diterapkan dalam sistem adalah algoritma decision tree dengan
menggunakan bahasa Python dan juga libraries Python.
1.8.2 Analisis
Dalam tahap analisis kebutuhan software ini bertujuan untuk menganalisa
kebutuhan software dan hardware yang dibutuhkan untuk menentukan solusi
untuk fitur dan interface yang digunakan. Adapun hasil dari analisa adalah :
a. Bahasa pemrograman PHP
PHP merupakan singkatan dari "PHP: Hypertext Prepocessor", yakni bahasa
pemrograman yang digunakan secara luas untuk penanganan pembuatan dan
pengembangan sebuah situs web dan bisa digunakan bersamaan dengan HTML.
PHP diciptakan oleh Rasmus Lerdorf pertama kali tahun 1994. Pada awalnya PHP
adalah singkatan dari "Personal Home Page Tools". Selanjutnya diganti menjadi
FI ("Forms Interpreter").Sejak versi 3.0, nama bahasa ini diubah menjadi "PHP:
Hypertext Prepocessor" dengan singkatannya "PHP". PHP versi terbaru adalah
versi ke-5 (ubaya.ac.id, 2014).
b. Framework Laravel
Laravel merupakan sebuah MVC web development framework yang dibuat untuk
membangun perangkat lunak dengan kualitas yang lebih baik dengan
meminimalisir biaya pengembangan dan perbaikan serta meningkatkan
produktifitas pekerjaan dengan sintak yang bersih dan fungsional yang dapat
mengurangi banyak waktu untuk implementasi (Luthfi, 2017).
10
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
c. Decision Tree
Decision tree merupakan salah satu algoritma data mining. Algoritma decision
tree menghasilkan pohon keputusan yang mempresentasikan aturan dari fakta
yang sangat besar. Aturan ini dapat dengan mudah dipahami oleh manusia.
Sebuah decision tree merupakan sebuah struktur yang digunakan untuk membagi
sekumpulan besar data menjadi himpunan himpunan record yang lebih kecil
dengan menggunakan serangkaian aturan keputusan.
d. Bahasa pemrograman Python
Python merupakan yang kemampuan, menggabungkan kapabilitas, dan sintaks
kode yang sangat jelas dan juga dilengkapi dengan libraries yang memberikan
ekstensi fungsi. Python merupakan golongan dari bahasa pemrograman dengan
level tinggi yang dirancang agar mudah dipahami dan dipelajari (baktikominfo.id,
2019).
e. Pandas
Pandas merupakan salah satu library yang berjenis open source yang
menyediakan struktur dan dengan alat analisa data berkinerja tinggi dan mudah
digunakan dalam bahasa pemrograman Python. Pandas sering digunakan untuk
membaca data atau memanggil data dari berbagai macam jenis data khususnya
data tekstual (Turmudi, 2020).
f. TFScikit-Learn(Sklearn)
Sklearn merupakan salah satu library open source yang bekerja dengan bahasa
pemrograman Python. Sklearn memiliki fungsi pengintegrasian banyak algoritma
dalam pembelajaran mesin. Pustaka sklearn awalnya dikembangkan oleh
Cournapeu pada tahun 2007, akan tetapi untuk rilisan pertama secara resmi pada
tahun 201 Sklearn merupakan bagian dari pustaka SciPy (Science Python),
dimana satu set pustaka ini dibuat untuk komputasi ilmiah khususnya analisa data
(Turmudi, 2020).
11
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
2.8.3 Desain
Tahap desain dilakukan sesuai dengan kebutuhan sistem user interface. Alur user
melakukan input data nilai mahasiswa, melakukan submit data dan yang terakhir
adalah sistem akan menampilkan output prediksi kelulusan tepat waktu
mahasiswa. Pada tahapan desain, dilakukan perancangan diagram kerja dari
sistem dan juga desain antar muka sistem. Adapun diagram yang akan dibuat pada
tahap desain ini adalah diagram flowchart, diagram use case dan juga diagram
activity.
a. Diagram Flowchart
Flowchart dapat diartikan sebagai gambaran algoritma yang terstruktur dan
mudah dipahami oleh orang lain. Flowchart menggambarkan urutan logika dari
suatu prosedur dalam sebuah pemecahan masalah, sehingga flowchart dapat
diartikan sebagai langkah langkah penyelesaian masalah yang diselesaikan dengan
simbol simbol tertentu. Flowchart memiliki tujuan untuk menggambarkan suatu
tahapan penyelesaian masalah secara sederhana, terurai, rapi dan jelas
menggunakan simbol-simbol yang standar (Sitorus, 2015). Berikut adalah contoh
flowchart menurut (Maulida et al., 2016) :
Gambar 2. 2 Contoh flowchart
(Sumber : Maulida, Penerapan Metode Waterfall Pada Pengembangan Aplikasi, 2016)
12
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 2.2 Merupakan contoh diagram flowchart. Diagram ini memuat proses
kerja sistem yang dibuat. Setiap bangun datar merupakan simbol dari sebuah
proses dan antar proses tersebut dihubungkan dengan tanda panah.
b. Diagram Use Case
Use case diagram merupakan diagram yang mendeskripsikan fungsi fungsi yang
dilakukan didalam sistem. Diagram usecase menyediakan cara mendiskripsikan
pandangan eksternal terhadap sistem dan interaksi-interaksinya terhadap dunia
luar (Handayani, 2018). Use case diagram merepresentasikan model untuk
kelakukan sistem yang dibuat dengan tujuan untuk mengetahui fungsi fungsi yang
ada di dalam suatu sistem dan siapa saja yang berhak mengakses fungsi fungsi
tersebut (Hendini, 2016). Berikut adalah contoh dari use case diagram :
Gambar 2. 3 Contoh diagram use case
13
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
(Sumber : Suendri, Implementasi Diagram UML (Unified Modelling Language) Pada Perancangan
Sistem Informasi Remunerasi Dosen Dengan Database Oracle (Studi Kasus: UIN Sumatera Utara
Medan), 2018)
Gambar 2.3 merupakan contoh diagram dari sebuah sistem yang dibangun,
adapun komponen dari diagram tersebut adalah aktor atau user yang
menggunakan sistem dan juga use case, use case merupakan sebuah aktivitas yang
dapat dilakukan oleh aktor di dalam sistem tersebut. Adapun garis yang
menghubungkan antara aktor dengan use case menunjukkan bahwa aktor tersebut
dapat melakukan aktivitas dari use case yang terhubung.
c. Diagram Activity
Activity Diagram merupakan gambaran workflow (aliran kerja) atau aktivitas dari
sebuah sistem atau proses bisnis (Hendini, 2016). Digram acivity menggambarkan
sistem dalam bentuk sekumpulan aksi aksi, bagaimana setiap aksi tersebut
dimulai, keputusan yang mungkin terjadi, hingga berakhirnya aksi tersebut.
Diagram activity juga dapan menggambarkan proses lebih dari satu aksi dalam
waktu yang bersamaan (Suendri, 2018). Adapun contoh dari diagram activity
adalah sebagai berikut :
14
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 2. 4 Contoh diagram activity
(Sumber : Suendri, Implementasi Diagram UML (Unified Modelling Language) Pada Perancangan
Sistem Informasi Remunerasi Dosen Dengan Database Oracle (Studi Kasus: UIN Sumatera Utara
Medan), 2018)
Gambar 2.4 merupakan contoh diagram activity dari sebuah sistem yang dibuat.
Adapun komponennya menunjukkan setiap alur dari activity yang dilakukan oleh
dosen dan sistem. Adapun panah yang ada menunjukkan hubungan antar activity
yang dilakukan.
2.8.4 Implementasi
Tahap implementasi dilakukan pembuatan aplikasi berdasarkan analisis dan
desain yang sudah dilakukan di tahap sebelumnya dengan dilakukan coding. Pada
tahap ini dilakukan coding menggunakan bahasa pemrograman PHP dan
15
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
framework Laravel untuk melakukan pengembangan aplikasi berbasis web,
menggunakan algoritma decision tree dengan Python dan libraries Python untuk
melakukan prediksi ketepatan waktu kelulusan mahasiswa. Penerapan sistem ini
dilakukan pada laptop sebagai server dengan spesifikasi processor Intel Core i5,
Memory 4GB, HDD 1TB.
2.8.5 Testing
Tahap ini dilakukan pemeriksaan dan pengujian program secara keseluruhan.
Pengujian akan menggunakan metode Black Box untuk mengetahui apakah sistem
dapat berjalan dengan baik dan sesuai dengan yang diharapkan. Pengujian sistem
ini dilakukan simulasi penggunaan sistem dengan melakukan input dan submit
data dan juga melihat apakah hasil output sudah sesuai dengan hasil testing yang
ada.
2.8.6 Deployment
Tahapan terakhir adalah tahapan deployment. Pada tahapan ini sistem yang sudah
dibuat akan dioperasikan oleh pengguna yakni pihak perguruan tinggi. Pada
tahapan ini sistem diharapkan berjalan sebagaimana seharusnya setelah dilakukan
tahap testing.
2.10 CRISP-DM
CRISP-DM atau Cross-Industry Standard Process untuk Data Mining merupakan
standarisasi proses data mining sebagai strategi pemecahan masalah secara umum
dari bisnis atau unit penelitian. Dalam CRISP-DM sebuah proyek data mining
memiliki siklus hidup yang terbagi dalam enam fase (Feblian & Daihani, 2017).
Berikut adalah siklus hidup dari CRISP-DM :
16
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 2. 5 Siklus Hidup CRISP-DM
(Sumber : sis.binus.ac.id, 2020)
2.10.1 Business Understanding
Tahap ini dilakukan pendalaman terhadap pemahaman bisnis yang akan dijadikan
tumpuan dalam mengembangkan sistem. Dalam tahap ini dilakukan penentuan
tujuan projek dan kebutuhan secara detail dalam lingkup bisnis atau unit
penelitian secara keseluruhan serta menerjemahkan tujuan dan batasan menjadi
formula dan definisi dari permasalahan data mining.
2.10.2 Data Understanding
Tahap ini dilakukan pendalaman terkait pemahaman data yang akan digunakan.
Adapun tahapannya adalah mengumpulkan data, melakukan analisis penyelidikan
data untuk mengenali lebih lanjut mengenai data dan pencarian awal pengetahuan
yang ada didalamnya serta mengevaluasi kualitas data
2.10.3 Data Preparation
Tahap ini melibatkan ETL(Extract-Transform-Load) proses yang dapat mengubah
beberapa bagian informasi data dari berbagai sumber menjadi sesuatu yang
berguna dari algoritma dan proses. Menyiapkan data yang tersedia dari awal, fase
ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif, memilih
kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang
akan dilakukan, melakukan perubahan pada beberapa variabel jika dibutuhkan
17
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
serta menyiapkan data awal sehingga siap untuk perangkat pemodelan.
Information gain adalah salah satu teknik feature selection atau seleksi fitur yang
sering digunakan untuk memilih fitur terbaik atau yang paling sesuai dalam proses
pembelajaran dengan melakukan perhitungan nilai entropy, entropy adalah ukuran
dari ketidakpastian kelas menggunakan probabilitas dari suatu atribut tertentu.
Information gain berperan dalam membuat keputusan klasifikasi dengan cara
mengukur berapa banyak informasi kehadiran dan ketidakhadiran dari suatu
atribut (Utami, 2015). Berikut adalah tahapan dari perhitungan information gain
(Yessy Nabella et al., 2019):
2. Mencari nilai entropi seluruh kelas dengan persamaan :
( ) ∑
Keterangan :
S adalah himpunan (dataset) kasus
c adalah jumlah kelas
Pi adalah jumlah sampel setiap kelas i
3. Mencari nilai gain setiap fitur A dengan rumus persamaan
( ) ( ) ∑ ( ) | |
| | ( )
Keterangan :
S adalah ruang (data) sample data training
A adalah fitur
( ) adalah nilai-nilai untuk fitur A
| | adalah jumlah sampel v
| | adalah jumlah seluruh data
( ) adalah entropi untuk data dengan nilai v
18
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
2.10.4 Modelling
Tahap ini bertanggungjawab atas hasil yang akan diperoleh atau membantu
memenuhi tujuan proyek dan tahap ini merupakan core dari machine learning
project. Pada langkah ini, development team akan menggunakan metode model
statistik, seperti: linear regressions, decision trees, random forest modelling, dll
dalam membangun model untuk menguji data dan mencari jawaban
atas objective yang diberikan.
Dalam tahap modeling, akan digunakan algoritma decision tree. Salah satu
algoritma klasifikasi dan prediksi yang kuat dan terkenal adalah algoritma
decision tree. Algoritma decision tree menghasilkan pohon keputusan yang
mempresentasikan aturan dari fakta yang sangat besar. Aturan ini dapat dengan
mudah dipahami oleh manusia. Sebuah decision tree merupakan sebuah struktur
yang digunakan untuk membagi sekumpulan besar data menjadi himpunan
himpunan record yang lebih kecil dengan menggunakan serangkaian aturan
keputusan (Muzakir & Wulandari, 2016). Berikut adalah struktur decision tree :
Gambar 2. 6 Struktur decision tree
(Sumber : Muzakir & Wulandari, Model Data Mining sebagai Prediksi Penyakit Hipertensi
Kehamilan dengan Teknik Decision Tree, 2016)
Root node atau node akar merupakan node yang terletak paling atas dari suatu
pohon. Internal Node ini merupakan node percabangan, dimana pada node ini
hanya terdapat satu input dan mempunyai minimal dua output. Sedangkan Leaf
19
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Node ini merupakan node akhir, hanya memiliki satu input, dan tidak memiliki
output. Pada pohon keputusan setiap leaf node menandai label kelas.
ID3 merupakan salah satu teknik yang digunakan dalam algoritma decision tree
yang dibuat oleh yang dibuat oleh J. Ross Quinlan. ID3 menggunakan algoritma
basic tree induction yang memberi atribut ke node pada tree berdasar berapa
banyak informasi bertambah dari node tersebut. Metode ID3 memperbolehkan
sebuah atribut untuk memiliki dua atau lebih nilai pada sebuah node atau titik
split. Atribut yang dipilih untuk setiap node adalah atribut yang memaksimalkan
information gain. ID3 dapat mengklasifikasikan data yang besar dalam waktu
yang relatif cepat, tergantung seberapa besar data set yang digunakan (Sebastian
et al., 2015). Berikut adalah tahapan dari pembuatan pohon keputusan dengan
teknik ID3:
1. Memasukkan data training dan variabel
2. Melakukan perhitungan Entropy dan Information Gain dari setiap variabel
3. Memilih variabel dengan nilai information gain terbesar.
4. Bentuk node yang berisi variabel tersebut
5. Mengulangi proses perhitungan information gain secara terus menerus sampai
semua data telah termasuk dalam kelas yang sama. Variabel yang telah terpilih
sebelumnya tidak diikutsertakan dalam perhitungan information gain berikutnya.
2.10.5 Evaluation
Tahap ini, akan dilakukan verifikasi atau penilaian data yang sudah dimodelkan
untuk memastikan bahwa hasil yang didapatkan adalah valid dan benar. Jika
terjadi hasilnya salah, maka pada metodologi ini memperbolehkan untuk kembali
ke tahap business understanding untuk mengetahui penyebab terjadinya hasil
yang salah. Pada tahap ini, akan digunakan data testing untuk memverifikasi
model yang dibuat adalah akurat dengan kenyataan. Dalam mengembangkan
model prediksi tentunya salah satu tahapan penting yang dibutuhkan adalah
melakukan evaluasi kinerja model. Evaluasi model prediksi dilihat beberapa
20
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
parameter terkait. Parameter parameter ini akan diujikan kepada model yang
nantinya akan menghasilkan suatu nilai atau skor. Evaluasi dibutuhkan untuk
mengetahui seberapa akurat dan seberapa andal model yang dibuat. Adapun
parameter evaluasi yang akan digunakan dalam penelitian ini adalah confusion
matrix, accuracy, precision, recall, f1 score dan auc score (Alvi Pranandha Syah,
Adiwijaya, 2017)
Confusion matrix adalah matriks berukuran N x N yang digunakan untuk
melakukan evaluasi performa dari sebuah model klasifikasi. Matriks ini
membandingkan nilai target yang sebenarnya dengan nilai target yang diprediksi.
Berikut adalah confusion matrix untuk klasifikasi biner
Gambar 2. 7 Confusion Matrix untuk klasifikasi biner
Classification accuracy adalah rasio jumlah prediksi yang benar dengan jumlah
total sampel input, yang biasanya kita sebut dengan istilah akurasi. Adapun rumus
dari accuracy adalah :
Precision adalah kemampuan model klasifikasi untuk tidak memberi label positif
pada sampel yang negatif. Adapun rumus dari precision adalah :
21
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Recall adalah kemampuan model klasifikasi untuk menemukan semua sampel
positif. Adapun rumus dari recall adalah :
Dimana :
TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan
benar oleh sistem.
TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan
benar oleh sistem.
FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah
oleh sistem.
FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah
oleh sistem
F1-score adalah skor yang merupakan rata rata tertimbang dari precision dan
recall. Adapun rumus perhitungan f1-score adalah sebagai berikut :
AUC score adalah Area Under the Curve (AUC) adalah ukuran kemampuan
classifier untuk membedakan antar kelas dan digunakan sebagai ringkasan dari
kurva ROC. Semakin besar skor AUC, maka ini menandakan semakin baik
kinerja model dalam membedakan kelas positif dan negatif.
22
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
2.10.6 Deployment
Pada tahap ini, model dapat digunakan dalam sistem, hasil dari model dapat
dibuat sebagai laporan ataupun insight bagi pihak perguruan tinggi.
2.11 Penelitian Terdahulu
Berdasarkan penelitian yang dilakukan oleh (Widiyati et al., 2018) yang berjudul
“Penerapan Algoritma ID3 Decision Tree Pada Penentuan Penerima Program
Bantuan Pemerintah Daerah di Kabupaten Kutai Kartanegara” dapat melakukan
klasifikasi dengan metode ID3 menggunakan rapidminer menghasilkan akurasi
sebesar 97,89 % dengan 92 data sehingga algoritma ini sangat baik digunakan
dalam klasifikasi penentuan penerima program bantuan lanjut usia. Aplikasi ini
dapat membantu dalam memaksimalkan kinerja pihak Dinas Sosial dalam proses
seleksi khususnya dalam hal menentukan calon penerima program bantuan yang
akan diterima secara lebih obyektif dan sesuai dengan yang diharapkan.
Adapun penelitian lain dari (Sugianto, 2017) dengan judul “Penerapan Teknik
Data Mining Untuk Menentukan Hasil Seleksi Masuk Sman 1 Gibeber Untuk
Siswa Baru Menggunakan Decision Tree” dengan tujuan melakukan penentuan
prediksi tingkat akurasi siswa baru di SMA Negeri 1 Cibeber yang diterima
dilakukan dengan menggunakan Algoritma C4.5 mencapai tingkat akurasi yang
cukup tinggi yaitu mencapai sebesar 99.05%. Hal ini menunjukan tingkat akurasi
yang cukup tinggi dari data penyeleksian nilai yang disajikan dalam
pengelompokan mata pelajaran pelajaran dalam Ujian Nasional, sehingga dapat
dikatakan proses seleksi siswa baru menggunakan metode ini merupakan metode
yang tepat untuk digunakan dalam metode komputasi untuk seleksi masuk siswa
ke SMA Negeri 1 Cibeber.
Penelitian sejenis pernah juga dilakukan oleh (Muzakir & Wulandari, 2016)
dengan judul “Model Data Mining sebagai Prediksi Penyakit Hipertensi
Kehamilan dengan Teknik Decision Tree” dapat melakukan prediksi penyakit
hipertensi dalam kehamilan. Pada penelitian ini dilakukan evaluasi dengan
supplied test set menggunakan WEKA dihasilkan kesalahan (error) 7.3427% dan
23
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
tingkat akurasi 92.6573%. Data training yang berjumlah 286 instances, hal ini
menunjukkan bahwa terdapat 265 instances yang akurat dan 21 instances yang
error atau prediksinya salah
24
BAB III
PERENCANAAN DAN REALISASI
3.1 Perancangan Program Aplikasi
3.1.1 Deskripsi Program Aplikasi
Aplikasi prediksi kelulusan mahasiswa tepat waktu adalah aplikasi yang berfungsi
untuk melakukan memprediksi ketepatan waktu kelulusan mahasiswa pada
Jurusan Teknik Informatika dan Komputer Politeknik Negeri Jakarta agar
mahasiswa yang terprediksi tidak lulus tepat waktu dapat diketahui bagi
stakeholder Jurusan Teknik Informatika dan Komputer Politeknik Negeri Jakarta.
Data yang digunakan merupakan data nilai matakuliah wajib mahasiswa tingkat 1
(semester 1 dan 2), IP dan IPK. Prediksi yang dilakukan menggunakan algoritma
decision tree.
3.1.2 Requirement Analysis
Pada tahapan ini dilakukan analisa kebutuhan fungsional dan juga non fungsional
dari sistem yang dibuat. Tahapan ini adalah tahapan pertama dari metode
pengembangan waterfall. Adapun analisa kebutuhannya adalah sebagai berikut:
Analisa Kebutuhan Fungsional dan Non Fungsional
a. Analisa Kebutuhan Fungsional
- Sistem dapat melakukan input data
- Sistem dapat melihat hasil prediksi ketepatan waktu kelulusan mahasiswa
b. Analisa Kebutuhan Non Fungsional
- Sistem ini yaitu menggunakan bahasa pemrograman PHP dan framework
Laravel untuk membuat interface web.
- Sistem ini menggunakan bahasa Python dan juga libraries Python.
25
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
3.1.3 Desain Sistem
Pada tahap desain sistem, dilakukan perancangan diagram kerja dari sistem yang
dibuat serta rancangan antar muka dari sistem. Kedua rancangan ini kemudian
akan digunakan pada saat implementasi atau pengembangan sistem. Tahapan ini
adalah tahapan kedua dari metode pengembangan waterfall.
a. Flowchart Diagram
Gambar 3. 1 Diagram Flowchart Sistem
Gambar 3.1 Merupakan alur dari sistem yang dibuat, adapun alurnya adalah
pertama tama, user melakukan input data nilai mahasiswa. Kemudian, setelah data
nilai telah terisi lengkap, user dapat menekan tombol submit. Maka akan keluar
ouput ketepatan waktu kelulusan dari mahasiswa terkait
b. Use Case Diagram
26
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 2 Diagram use case sistem
Gambar 3.2 merupakan desain use case dari sistem. Pada sistem, user dapat
melakukan pengisian data nilai mahasiswa pada form yang terdapat dalam sistem,
user juga dapat melakukan submit data nilai tersebut serta melihat hasil dari
prediksi ketepatan waktu kelulusan mahasiswa.
c. Activity Diagram
27
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 3 Diagram activity sistem
Gambar 3.3 merupakan diagram activity dari sistem. Pada sistem, pertama tama
user mengisi data nilai mahasiswa pada form yang terdapat dalam sistem lalu
mengklik tombol submit. Setelah itu sistem akan melakukan prediksi ketepatan
waktu kelulusan mahasiswa dengan mengeksekusi file python. Hasil dari prediksi
tersebut akan ditampilkan kepada user berupa keterangan TEPAT WAKTU atau
TIDAK TEPAT WAKTU.
d. Rancangan Antar Muka
Berdasarkan analisa kebutuhan pada sub-bab sebelumnya, maka tahap selanjutnya
adalah melakukan mockup antar muka dari sistem yang akan
dirancang. Hal ini bertujuan agar user dapat melihat gambaran sistem yang akan
dibangun. Berikut adalah rancangan antar muka dari sistem yang dibuat :
28
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 4 Tampilan Data Mahasiswa
Gambar 3. 5 Tampilan Hasil Tepat Waktu
29
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 6 Tampilan Hasil Tidak Tepat Waktu
3.1.4 Implementasi Sistem
Pada tahapan implementasi sistem, dilakukan pengembangan dengan penulisan
baris kode untuk bagian front end dan back end dari sistem. Tahapan ini adalah
tahapan ketiga dari metode pengembangan waterfall.
a. Implementasi Program Aplikasi
Tahap ini dilakukan implementasi sistem dengan penulisan baris kode untuk
pembuatan halaman website serta model decision tree yang ada didalamnya.
Adapun hasil implementasi website adalah sebagai gambar berikut :
Gambar 3. 7 Halaman input data nilai mahasiswa
30
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 8 Halaman yang tampil jika hasil prediksi adalah tepat waktu
Gambar 3. 9 Halaman yang tampil jika hasil prediksi tidak tepat waktu
b. Algoritma Decision Tree untuk Prediksi Ketepatan Waktu Kelulusan
Mahasiswa
1. Business Understanding
Proses prediksi ketepatan waktu kelulusan mahasiswa dimulai dari business
understanding yaitu memahami masalah yang harus diselesaikan. Masalah
tersebut adalah bagaimana cara melakukan prediksi ketepatan waktu kelulusan
31
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
mahasiswa pada data evaluasi semester mahasiswa untuk dapat melakukan
prediksi ketepatan waktu kelulusan mahasiswadi masa yang akan datang secara
otomatis.
2. Data Understanding
Tahap ini melakukan eksplorasi data untuk memahami kekuatan dan keterbatasan
data karena jarang ada kecocokan yang tepat dengan masalah. Data mentah yang
selanjutnya akan dipersiapkan dan digunakan adalah data nilai matakuliah dasar
mahasiswa tingkat 1, IP dan IPK. Nama dan deskripsi masing-masing nilai
mahasiswa dapat dilihat pada tabel berikut:
Tabel 3. 1 Tabel Data Nilai Matakuliah Mahasiswa
No Nama Deskripsi
1. NO Index baris dari data
2. NIM NIM mahasiswa
3. NAMA Nama mahasiswa
4. Pendidikan Kewarganegaraan Nilai Pendidikan
Kewarganegaraan
5. Pendidikan Agama dalam TIK Nilai Pendidikan Agama
dalam TIK
6. Kepemimpinan dan Pengembangan
Karakter
Nilai Kepemimpinan dan
Pengembangan Karakter
7. Bahasa Indonesia untuk TI Nilai Bahasa Indonesia
untuk TI
8. Matematika Diskrit Nilai Matematika Diskrit
9. Pengantar Multimedia Nilai Pengantar Multimedia
10. Algoritma dan Pemrograman Nilai Algoritma dan
Pemrograman
32
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
11. Rekayasa Perangkat Lunak Nilai Rekayasa Perangkat
Lunak
12. Jaringan Komputer dan Komunikasi Nilai Jaringan Komputer
dan Komunikasi
13. Aljabar Linier Nilai Aljabar Linier
14. Struktur Data Nilai Struktur Data
15. Sistem Basis Data Nilai Sistem Basis Data
16. Data Mining Nilai Data Mining
17. Sistem Terdistribusi Nilai Sistem Terdistribusi
18. Pemrograman Bergerak Nilai Pemrograman
Bergerak
19. Pengolahan Citra Digital Nilai Pengolahan Citra
Digital
20. Bahasa Inggris Nilai Bahasa Inggris
21. Sistem Operasi Nilai Sistem Operasi
22. Pemrograman Berorientasi Objek Nilai Pemrograman
Berorientasi Objek
23. Pemrograman Web Nilai Pemrograman Web
24. Hukum dan Etika dalam Teknologi
Informasi dan Komunikasi
Nilai Hukum dan Etika
dalam Teknologi Informasi
dan Komunikasi
25. Struktur Data Nilai Struktur Data
26. Sistem Informasi Manajemen Nilai Sistem Informasi
Manajemen
27. Keamanan Komputer dan Pemulihan
Bencana
Nilai Keamanan Komputer
dan Pemulihan Bencana
28. Pemrograman Visual Nilai Pemrograman Visual
29. Metode Numerik Nilai Metode Numerik
30. Grafika Komputer Nilai Grafika Komputer
31. Kecerdasan Buatan Nilai Kecerdasan Buatan
32. Perancangan Antarmuka Nilai Perancangan
33
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Antarmuka
33. Data Warehouse Nilai Data Warehouse
34. Sistem Pendukung Keputusan Nilai Sistem Pendukung
Keputusan
35. Metodologi Penelitian Nilai Metodologi Penelitian
36. Probabilitas dan Statistik Nilai Probabilitas dan
Statistik
37. Pembelajaran Mesin Nilai Pembelajaran Mesin
38. Penjaminan Kualitas Perangkat Lunak
(SQA)
Nilai Penjaminan Kualitas
Perangkat Lunak (SQA)
39. Manajemen Proyek TIK Nilai Manajemen Proyek
TIK
40. IP_smt1 Nilai IP_smt1
41. IP_smt2 Nilai IP_smt2
42. IP_smt3 Nilai IP_smt3
43. IP_smt4 Nilai IP_smt4
44. IP_smt5 Nilai IP_smt5
45. IP_smt6 Nilai IP_smt6
46. IP_s8 Nilai IP_s8
47. IPK Nilai IPK
48. TARGET Status Kelulusan Mahasiswa
3. Data Preparation
Data preparation merupakan tahap menyiapkan data agar dapat digunakan untuk
dipelajari oleh model pada tahap Modeling. Tahap ini penting untuk menyiapkan
data mentah sebelum dilakukan fitting data kepada model sehingga data layak
untuk digunakan. Proses membersihkan data dapat berupa pemilihan terhadap
fitur yang sekiranya akan digunakan dan mengatasi missing value, one hot
encoding dan standard scaling.
Tahap yang pertama dilakukan adalah melakukan pemilihan fitur dan data yang
sekiranya cocok untuk digunakan pada model. Pemilihan fitur dan data ini
34
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
dilakukan secara manual terhadap data mentah yang dimiliki yang berupa file
excel. Adapun hasil fitur yang terpilih dari data mentah tersebut adalah sebagai
berikut :
Tabel 3. 2 Tabel Fitur Terpilih
No Nama Deskripsi
1. NO Index baris dari data
2. NIM NIM mahasiswa
3. NAMA Nama mahasiswa
4. Matematika Diskrit Nilai Matematika Diskrit
5. Pengantar Multimedia Nilai Pengantar Multimedia
6. Algoritma dan Pemrograman Nilai Algoritma dan
Pemrograman
7. Rekayasa Perangkat Lunak Nilai Rekayasa Perangkat
Lunak
8. Jaringan Komputer dan Komunikasi Nilai Jaringan Komputer
dan Komunikasi
9. Aljabar Linier Nilai Aljabar Linier
10. Struktur Data Nilai Struktur Data
11. Sistem Basis Data Nilai Sistem Basis Data
12. IP_smt1 Nilai IP_smt1
13. IP_smt2 Nilai IP_smt2
14. IP_smt3 Nilai IP_smt3
15. IP_smt4 Nilai IP_smt4
16. IP_smt5 Nilai IP_smt5
17. IP_smt6 Nilai IP_smt6
18. IP_s8 Nilai IP_s8
19. IPK Nilai IPK
20. TARGET Status Kelulusan Mahasiswa
35
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Setelah menentukan fitur yang terpilih dari data mentah, selanjutnya akan
dilakukan pemeriksaan data terlebih dahulu untuk melihat kualitas data secara
keseluruhan.
Gambar 3. 10 Informasi tipe data dan keutuhan data
Gambar 3.10 menunjukkan bahwa terdapat 82 baris pada data nilai akademik
mahasiswa yang akan diolah menjadi model. Tidak ada data yang kosong atau
null. Disini juga dapat dilihat bahwa seluruh tipe data sudah sesuai dengan yang
diinginkan kecuali kolom NIM yang seharusnya bertipe object.
36
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 11Baris kode data preparation
Gambar 3.11 adalah baris kode preparasi data yang dimana bertujuan untuk
mempersiapkan data testing terlebih dahulu. Dilakukan replace value apabila
value mengandung nilai null atau empt maka akan diganti dengan value „kosong‟
bertipe string. Kemudian pada dibuat dataframe untuk data testing tersebut.
Setelah itu, dilakukan replace data yang memiliki value „kosong‟ dengan value
np.NaN. Setelah itu data testing yang merupakan input dari user akan
ditambahkan kedalam data training dengan tujuan untuk menyiapkan data testing
apabila pada fitur data testing terdapat nilai dengan value NaN.
37
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 12 Baris kode data preparation
Gambar 3.12 merupakan proses persiapan data yang dilakukan untuk mengisi data
yang kosong dengan teknik imputasi. Adapun fitur yang memiliki tipe data
numerik, yakni fitur IP_smt1, IP_smt2, IP_smt3, IP_smt4, IP_smt5, IP_smt6,
IP_smt7, IP_s8, dan IPK, fitur tersebut apabila terdapat value null akan dilakukan
imputasi dengan nilai median. Sedangkan fitur fitur bertipe data kategorikal, yakni
fitur Pendidikan Kewarganegaraan, Pendidikan Agama dalam TIK ,
Kepemimpinan dan Pengembangan Karakter, Bahasa Indonesia untuk TI ,
Matematika Diskrit , Pengantar Multimedia, Algoritma dan Pemrograman,
Rekayasa Perangkat Lunak, Jaringan Komputer dan Komunikasi, Aljabar Linier,
Struktur Data, Sistem Basis Data maka apabila terdapat value null akan dilakukan
imputasi dengan nilai modus.
38
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 13 Baris kode data preparation
Gambar 3.13, Setelah melakukan imputasi data, hal yang dilakukan adalah
menyiapkan pipeline untuk melakukan standard scaling atau standarisasi
terhadap tipe data numerik. Teknik standarisasi akan mengubah data sehingga
memiliki distribusi nilai mean sama dengan 0 dan standar deviasi sama dengan 1.
Selain itu juga menyiapkan pipeline untuk mengkonversi fitur bertipe kategorikal
menjadi bernilai numerik, hal ini dapat dilakukan dengan teknik yang digunakan
adalah One hot encoding yaitu mengkonversi nilai menjadi kolom baru pada data
dan memberikan nilai 1 pada kolom baru tersebut jika nilai pada data sesuai
dengan nama kolom yang baru. Kedua pipeline tersebut akan dienkapsulasi
dengan column transformer yang nantinya akan digunakan pada tahap modeling.
Gambar 3. 14 Baris kode data preparation
Gambar 3.14 merupakan baris kode untuk seleksi fitur yang digunakan pada
model, adapun fitur fitur tersebut adalah data nilai matakuliah dan IP semester 1 ,
semester 2 dan IPK. Adapun beberapa atribut yang di drop adalah atribut NAMA,
NIM, NO., IP_smt3, IP_smt4, IP_smt5, IP_smt6, IP_smt7, IP_s8, Pendidikan
Kewarganegaraan, Pendidikan Agama dalam TIK, Kepemimpinan dan
Pengembangan Karakter, Bahasa Indonesia untuk TI Sehingga yang tersisa
adalah 11 atribut/fitur yang akan digunakan untuk membangun model. Yang
diantaranya adalah Matematika Diskrit, Pengantar Multimedia, Algoritma dan
39
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Pemrograman, Rekayasa Perangkat Lunak, Jaringan Komputer dan Komunikasi,
Aljabar Linier, Struktur Data, Sistem Basis Data, IP_smt1, IP_smt2, dan IPK.
Selain itu juga dilakukan pemilihan data training dan data testing, adapun data
training diambil dari baris 1 hingga 82 sedangkan data testing adalah data baris ke
83 yang dimana data testing merupakan 1 baris data yang sebelumnya adalah data
input dari mahasiswa.
4. Modeling
Tahap Modeling ini bertujuan untuk melatih model algoritma menggunakan data
training nilai akademik mahasiswa untuk melakukan prediksi ketepatan kelulusan
mahasiswa. Algoritma yang digunakan pada tahap Modeling ini adalah decision
tree dan data yang digunakan berjumlah 82 baris dan fitur yang digunakan
berjumlah 15.
Gambar 3. 15 Baris kode model decision tree
Gambar 3.15, merupakan model decision tree berikut preprocessing yang di
bentuk dalam sebuah satu pipeline. Parameter criterion entropy digunakan sebagai
pembobotan fitur serta dilakukan fitting data training kepada model
Adapun nilai nilai entropy dan information gain untuk seluruh fitur adalah sebagai
berikut :
Tabel 3. 3 Tabel Fitur dan Information Gain
Nama Fitur Value
Fitur
Nilai Entropy
40
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Jumlah IPK
(Information Gain =
0.456)
<= 3.11 0.535
> 3.11 0.535
Jumlah IP smt 1
(Information Gain = 0.011)
<= 3.215 0.989
> 3.215 0.989
Jumlah IP smt 2
(Information Gain = 0.1)
<= 3.15 0.901
> 3.15 0.901
Matematika Diskrit
(Information Gain = 0.298)
A 0.887
A- 1
B 0.811
B+ 0.764
B- 0.592
C 0.811
C+ 0.946
D 0
E 0
Pengantar Multimedia
(Information Gain = 0.187)
A 0.985
A- 0.787
B 0.918
B+ 0.811
B- 0.918
C 1
C+ 0
D 1
E 0.414
Algoritma dan
Pemrograman
(Information Gain = 0.271)
A 0.971
A- 0.971
B 1
B+ 0.439
B- 0
C 0.946
41
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
C+ 0.918
D 0
E 0
Rekayasa Perangkat Lunak
(Information Gain = 0.326)
A 0.9
A- 0.469
B 0.896
B+ 0.650
B- 0.918
C 0.918
C+ 0.650
D 0
E 0
Jaringan Komputer dan
Komunikasi
(Information Gain = 0.310)
A 0.811
A- 0.863
B 0
B+ 0.792
B- 0.918
C 0.954
C+ 0
D 0.722
E 0
Aljabar Linier
(Information Gain = 0.316)
A 0.863
A- 0.896
B 0.503
B+ 0.811
B- 0.650
C 0.985
C+ 0.811
D 0.592
E 0
Struktur Data A 1
42
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
(Information Gain = 0.322) A- 0.959
B 0.650
B+ 0.811
B- 0.650
C 0
C+ 1
D 0
E 0
Basis Data
(Information Gain = 0.237)
A 0.918
A- 1
B 0.985
B+ 1
B- 0.439
C 0.811
C+ 0.918
D 0.918
E 0
Pada Tabel 3.3 dapat dilihat bahwa fitur degan information gain terbesar
merupakan fitur IPK. Adapun fitting yang dilakukan dengan pembagian data
training dan data testing dengan perbandingan 60 : 40 dengan data berjumlah
49:34 menghasilkan tree seperti berikut yang dimana root adalah IPK yang sesuai
dengan fitur dengan nilai information gain terbesar:
Gambar 3. 16 Model tree yang dihasilkan
43
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
5. Evaluation
Tahap ini dilakukan evaluasi model yang telah dibangun, adapun parameter yang
akan digunakan adalah accuracy, precision, recall, f1 score dan auc score,
adapun baris kodenya adalah sebagai berikut:
Gambar 3. 17 Baris kode pengujian accuracy, precision, recall, f1score untuk setiap pembagian
rasio data
44
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Gambar 3. 18 Hasil pengujian untuk setiap pembagian rasio data
Pada Gambar 3.18 dapat disimpulkan bahwa split terbaik ada pada split 60:40
yang menghasilkan nilai akurasi sebesar 0.85 (85%), nilai precision 0.84(84%),
nilai recall 0.89(89%), nilai f1 score 0.86(86%), serta nilai auc score 0.85(85%).
6. Deployment
Tahap deployment merupakan penerapan model terhadap business understanding
yang ada. Model telah di evaluasi terlebih dahulu dengan beberapa parameter
evaluasi dan telah menghasilkan nilai yang baik yakni dengan nilai akurasi
sebesar 0.85 (85%), nilai precision 0.84(84%), nilai recall 0.89(89%), nilai f1
score 0.86(86%), serta nilai auc score 0.85(85%). Model ini akan digunakan pada
45
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
sistem yang berupa website untuk dapat melakukan prediksi ketepatan waktu
kelulusan mahasiswa pada data evaluasi semester mahasiswa untuk dapat
melakukan prediksi ketepatan waktu kelulusan mahasiswa di masa yang akan
datang secara otomatis.
46
BAB IV
PEMBAHASAN
4.1 Pengujian
Bagian ini akan menjelaskan mengenai pengujian, mulai dari deskripsi
pengujian, prosedur pengujian, hingga menampilkan data hasil pengujian. Hasil
dari dari pengujian yang telah dilakukan akan dievaluasi pada sub bab berikutnya
4.2 Deskripsi Pengujian
Pengujian merupakan tahapan yang penting dalam proses rancang bangun sistem
sebelum digunakan secara utuh, tahap ini akan dilakukan apabila tahap
sebelumnya telah selesai. Pengujian bertujuan memastikan sistem bekerja dengan
baik, menerima input dengan benar dan memberikan output yang sesuai.
Pengujian yang akan dilakukan dalam penelitian ini adalah melakukan pengujian
terhadap model decision tree yang telah dibangun.
4.4 Data Hasil Pengujian
Tahap ini dilakukan dengan pengujian alpha testing. Alpha testing dilakukan
secara berkali-kali dalam masa pengembangan, pengujian ini dilakukan dengan
teknik black box testing untuk melihat hasil kesesuaian hasil keluaran sistem
dengan yang diharapkan oleh pengguna. Pada pengujian ini digunakan pengujian
dengan metode black box testing pada aplikasi web terkait fitur yang ada.
Keterangan : Simbol √ menunjukkan hasil pengujian sesuai dengan yang
diharapkan sedangkan simbol X menunjukkan hasil pengujian tidak sesuai dengan
yang diharapkan.
Tabel 4. 1 Hasil pengujian sistem
47
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
No Skenario Pengujian Yang
Diharapkan
Pengamatan Hasil
1. Tidak mengisi text box
nilai IP semester 1 dan 2
Menampikan
alert jika textbox
kosong
Menampikan alert jika
textbox kosong
√
2. Tidak mengisi text box
nilai IP selain semester 1
dan 2
Tidak
menampikan
alert jika textbox
kosong
Tidak menampikan
alert jika textbox
kosong
√
3. Mengisi text box nilai IP
tidak dengan angka
Menampikan
alert jika textbox
berisi tidak
dengan angka
Menampikan alert jika
textbox berisi tidak
dengan angka
√
4. Mengisi text box nilai IP
dengan angka lebih dari 4
dan kurang dari 0.1
Menampikan
alert jika textbox
berisi angka
lebih dari 4 dan
kurang dari 0.1
Menampikan alert jika
textbox berisi angka
lebih dari 4 dan
kurang dari 0.1
√
5. Tidakmemilih nilai pada
combo box nilai
matakuliah
Tidak
memunculkan
alert saat tidak
memilih nilai
pada combo box
nilai matakuliah
Tidak memunculkan
alert saat tidak
memilih nilai pada
combo box nilai
matakuliah
√
6. Menekan tombol submit Menampilkan
hasil prediksi
ketika menekan
tombol submit
Menampilkan hasil
prediksi ketika
menekan tombol
submit
√
7. Hasil prediksi yang
dihasilkan TIDAK
TEPAT WAKTU
Menampilkan
halaman dengan
tulisan TIDAK
TEPAT
Menampilkan halaman
dengan tulisan TIDAK
TEPAT WAKTU
√
48
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
WAKTU
8. Hasil prediksi yang
dihasilkan TEPAT
WAKTU
Menampilkan
halaman dengan
tulisan TEPAT
WAKTU
Menampilkan halaman
dengan tulisan TEPAT
WAKTU
√
9. Menekan tombol
KEMBALI pada halaman
TEPAT WAKTU
Redirect ke
halaman index
Redirect ke halaman
index
√
10. Menekan tombol
KEMBALI pada halaman
TIDAK TEPAT
WAKTU
Redirect ke
halaman index
Redirect ke halaman
index
√
4.5 Analisis Pengujian
Pengujian model decision tree dilakukan dengan cara menggunakan data training
untuk melatih model memprediksi target class pada data testing. Selanjutnya,
hasil dari evaluasi model akan diukur akurasinya dengan menggunakan 6
parameter evaluasi. Pada tahap ini dilakukan pengujan data dengan pembagian
sebagai berikut:
Tabel 4. 2Tabel rasio pembagian data training dan testing
Data
training
Data
testing
Accuracy Precision Recall F1Score AUCScore
90 10 0.78 0.83 0.83 0.83 0.75
80 20 0.82 0.86 0.75 0.80 0.82
70 30 0.72 0.79 0.73 0.76 0.71
60 40 0.85 0.84 0.89 0.86 0.85
Pengujian model decision tree yang telah dilakukan menggunakan data
training dan data testing menghasilkan akurasi yang berbeda beda. Dari hasil
49
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
evaluasi di Tabel 4.2, diambil pembagian data dengan rasio 60:40 untuk
kesimpulan hasil analisis dengan jumlah data training dan testing yang digunakan
masing-masing berjumlah 49 baris data training dan 34 baris data testing
menghasilkan nilai akurasi sebesar 0.85 (85%), nilai precision 0.84(84%), nilai
recall 0.89(89%), nilai f1 score 0.86(86%), serta nilai auc score 0.85(85%).
50
BAB V
KESIMPULAN
5.1 Kesimpulan
Sistem prediksi kelulusan mahasiswa tepat waktu berhasil dibuat dengan
menerapkan algoritma decision tree untuk melakukan prediksi kelulusan
mahasiswa tepat waktu. Adapun kesimpulan yang dapat diambil setelah
pembuatan sistem ini yaitu tujuan penelitian telah tercapai. Ketepatan waktu
kelulusan mahasiswa berhasil diprediksi menggunakan model decision tree dan
juga sistem prediksi kelulusan mahasiswa tepat waktu berhasil dibuat. Data total
data yang digunakan berjumlah 82 data nilai akademik mahasiswa. Hasil
pengujian model decision tree menggunakan 60%(49) data training dan 40%(34)
data testing dari 82 data nilai akademik mahasiswa berupa nilai akurasi sebesar
0.85 (85%), nilai precision 0.84(84%), nilai recall 0.89(89%), nilai f1 score
0.86(86%), serta nilai auc score 0.85(85%). Berdasarkan hasil evaluasi tersebut
dapat dikatakan bahwa model bekerja dengan baik, serta fitur yang digunakan
memengaruhi faktor kelulusan mahasiswa dengan cukup besar.
Selain itu, manfaat yang bisa didapatkan dari penelitian ini adalah proses prediksi
ketepatan waktu kelulusan mahasiswa dapat dilakukan dalam waktu yang lebih
singkat daripada sebelumnya di mana proses dilakukan secara manual. Namun,
dengan adanya sistem prediksi ini, proses prediksi ketepatan waktu kelulusan
mahasiswa dikerjakan dalam hitungan menit saja.
5.2 Saran
Saran penulis untuk pengembangan sistem prediksi ketepatan waktu kelulusan
mahasiswa ke depannya adalah untuk menambah data nilai akademik mahasiswa
serta fitur lain yang mungkin berupa data non akademik yang sekiranya
berpengaruh terhadap kelulusan mahasiswa untuk meningkatkan kualitas model.
51
DAFTAR PUSTAKA
Alvi Pranandha Syah, Adiwijaya, S. A. F. (2017). Analisis Sentimen Pada Data
Ulasan Produk Toko Online Dengan Metode Maximum Entropy. E-
Proceeding of Engineering, 4(3), 4632–4640.
Bode, A. (2017). K-Nearest Neighbor Dengan Feature Selection Menggunakan
Backward Elimination Untuk Prediksi Harga Komoditi Kopi Arabika.
ILKOM Jurnal Ilmiah, 9(2), 188–195.
https://doi.org/10.33096/ilkom.v9i2.139.188-195
Feblian, D., & Daihani, D. U. (2017). Implementasi Model Crisp-Dm Untuk
Menentukan Sales Pipeline Pada Pt X. Jurnal Teknik Industri, 6(1), 1–12.
https://doi.org/10.25105/jti.v6i1.1526
Fiska, R. R. (2017). Penerapan Teknik Data Mining dengan Metode Support
Vector Machine. Sains Dan Teknologi Informasi (SATIN), 3(1).
Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T. Y.
(2017). LightGBM: A highly efficient gradient boosting decision tree.
Advances in Neural Information Processing Systems, 2017-Decem(Nips),
3147–3155.
Luthfi, F. (2017). Penggunaan Framework Laravel Dalam Rancang Bangun
Modul Back-End Artikel Website Bisnisbisnis.ID. JISKA (Jurnal
Informatika Sunan Kalijaga), 2(1), 34.
https://doi.org/10.14421/jiska.2017.21-05
Maulani, J., Informasi, F. T., Islam, U., Muhammad, K., Al, A., & Banjarmasin,
B. (2020). Penerapan Metode Waterfall Pada Pengembangan Aplikasi.
52
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Technologia, 11(2), 64–70.
Maulida, I., Suyatno, A., Rahmania Hatta, H., & Mulawarman, U. (2016). Seleksi
Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode
Information Gain. JSM STMIK Mikroskil, 17(2), 249–258.
Muzakir, A., & Wulandari, R. A. (2016). Model Data Mining sebagai Prediksi
Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree. Scientific
Journal of Informatics, 3(1), 19–26. https://doi.org/10.15294/sji.v3i1.4610
Nurhayati, S., Luthfi, E. T., & Papua, U. Y. (2015). Prediksi Mahasiswa
Menggunakan Metode Support Vector. Prediksi Menggunakan SVM, 3(6),
82–93.
Prasetya, C. S. D. (2017). Sistem Rekomendasi Pada E-Commerce Menggunakan
K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer, 4(3),
194. https://doi.org/10.25126/jtiik.201743392
Sebastian, B., Budhi, G. S., & Adipranata, R. (2015). Penggunaan Decision Tree
Dengan ID3 Algorithm Untuk Mengenali Dokumen Beraksara Jawa. Jurnal
Infra, 3, 142.
Sugianto, C. A. (2017). Penerapan Teknik Data Mining Untuk Menentukan Hasil
Seleksi Masuk Sman 1 Gibeber Untuk Siswa Baru Menggunakan Decision
Tree. 39–43. https://doi.org/10.31227/osf.io/vedu7
Susanti, Martha, S., & Sulistianingsih, E. (2018). K-Nearest Neighbor Dalam
Imputasi Missing Data. Buletin Ilmiah Math. Stat. Dan Terapannya
(Bimaster), 07(1), 9–14.
Susilo, M. (2018). Rancang Bangun Website Toko Online Menggunakan Metode
53
Jurusan Teknik Informatika dan Komputer – Politeknik Negeri Jakarta
Waterfall. InfoTekJar (Jurnal Nasional Informatika Dan Teknologi
Jaringan), 2(2), 98–105. https://doi.org/10.30743/infotekjar.v2i2.171
Syamsu, S., Muhajirin, M., & Wijaya, N. S. (2019). Rules Generation Untuk
Klasifikasi Data Bakat dan Minat Berdasarkan Rumpun Ilmu Dengan
Decision Tree. Inspiration: Jurnal Teknologi Informasi Dan Komunikasi,
9(1), 40. https://doi.org/10.35585/inspir.v9i1.2495
Syarli, S., & Muin, A. (2016). Metode Naive Bayes Untuk Prediksi Kelulusan
(Studi Kasus: Data Mahasiswa Baru Perguruan Tinggi). Jurnal Ilmiah Ilmu
Komputer, 2(1), 22–26.
Utami, L. D. (2015). Integrasi Metode Information Gain untuk Seleksi Fitur dan
AdaBoost untuk Mengurangi Bias pada Analisis Sentimen Review Restoran
Menggunakan Algoritma Naive Bayes. Journal of Intelligent Systems, 1(2),
120–126.
Widiyati, D. K., Wati, M., & Pakpahan, H. S. (2018). Penerapan Algoritma ID3
Decision Tree Pada Penentuan Penerima Program Bantuan Pemerintah
Daerah di Kabupaten Kutai Kartanegara. Jurnal Rekayasa Teknologi
Informasi (JURTI), 2(2), 125. https://doi.org/10.30872/jurti.v2i2.1864
Yessy Nabella, F., Arum Sari, Y., & Cahya Wihandika, R. (2019). Seleksi Fitur
Information Gain Pada Klasifikasi Citra Makanan Menggunakan Hue
Saturation Value dan Gray Level Co-Occurrence Matrix. Jurnal
Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(2), 1892–1900.
http://j-ptiik.ub.ac.id