identifikasi pencurian tenaga listrik menggunakan ... · identifikasi pencurian tenaga listrik...
TRANSCRIPT
Identifikasi Pencurian Tenaga Listrik menggunakan
Algoritma Klasifikasi Naive Bayes
Artikel Ilmiah
Peneliti:
Gabriela Ori Lumondo (672015253)
Dr. Kristoko Dwi Hartomo, M.Kom.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Januari 2018
Identifikasi Pencurian Tenaga Listrik menggunakan
Algoritma Klasifikasi Naive Bayes
Artikel Ilmiah
Diajukan kepada
Fakultas Teknologi Informasi
untuk memperoleh Gelar Sarjana Komputer
Peneliti:
Gabriela Ori Lumondo (672015253)
Dr. Kristoko Dwi Hartomo, M.Kom.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Januari 2018
1
Identifikasi Pencurian Tenaga Listrik menggunakan
Algoritma Klasifikasi Naive Bayes
1)
Gabriela Ori Lumondo, 2)
Kristoko Dwi Hartomo
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Jl. Dr. O. Notohamidjojo, Kel.Blotongan, Kec. Sidorejo, Salatiga 50714, Indonesia
Email: 1)
Abstract
These days, almost all life aspects need electricity. The more electricity
consumption needed, the bigger the expense will be. Some customers would even steal the
electric power to fulfill their need. Naive Bayes algorithm is used to solve this matter on
this research. The application of Naive Bayes is used to classify theft done by PLN
customers. From the data tested by Naive Bayes, it is known that 14.28% of customers is
identified as operation target, 9.52% is on fraud, and 76.2% is categorized as normal.
Keywords: Electricity, Classification Naive Bayes Algorithm
Abstrak
Hampir semua aspek kehidupan manusia sekarang ini membutuhkan listrik.
Semakin banyak tenaga listrik yang dibutuhkan maka semakin banyak biaya yang harus
dikeluarkan. Sehingga ada pelanggan yang melakukan pencurian tenaga listrik untuk
memenuhi kebutuhan tersebut. Algoritma Naive Bayes digunakan untuk menyelesaikan
masalah pada penelitian kali ini. Penerapan Naive Bayes ini bertujuan untuk
mengklasifikasi pencurian yang dilakukan pelanggan PLN. Dari data yang diuji oleh
Naive Bayes dihasilkan 14,28 persen pelanggan diidentifikasikan dalam golongan sasaran
operasi, kemudian 9,52 persen dalam golongan penyimpangan, dan 76,2 persen
digolongkan normal.
Kata Kunci: Listrik, Algoritma Klasifikasi Naive Bayes
1)Mahasiswa Fakultas Teknologi Informasi Program Studi Teknik Informatika, Universitas Kristen Satya
Wacana Salatiga. 2) Pengajar Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana Salatiga.
2
I. Pendahuluan
Hampir semua aspek kehidupan manusia sekarang ini membutuhkan
tenaga listrik. Tak terkecuali di negara kita Indonesia. Seperti yang telah
diketahui, bahwa di Indonesia ada Perusahaan Listrik Negara sebagai Badan
Usaha Milik Negara yang berbentuk Perusahaan Perseroan (Persero)
berkewajiban untuk menyediakan tenaga listrik bagi kepentingan umum
dengan tetap memperhatikan tujuan perusahaan yaitu menghasilkan keuntungan sesuai dengan Undang – Undang Nomor 19 Tahun
2003 Pasal 12 tentang Badan Usaha Milik Negara. Namun dalam usaha
menghasilkan keuntungan tersebut, PT PLN masih mengalami beberapa
kendala salah satunya pencurian yang dilakukan oleh pelanggan PLN. Terdapat
empat jenis pencurian P2TL. Pencurian golongan I (P I), merupakan pencurian
yang mempengaruhi batas tenaga. Pencurian golongan II (P II), merupakan
pencurian yang mempengaruhi pengukuran energi. Pencurian golongan III (P
III), merupakan pencurian yang mempengaruhi batas tenaga dan
mempengaruhi pengukuran energi. Sedangkan pencurian yang terakhir adalah
pencurian golongan IV (P IV), merupakan pencurian yang dilakukan oleh
bukan pelanggar. Pencurian seperti di atas dapat menghasilkan susut, karena ada tenaga
listrik yang digunakan secara cuma-cuma tanpa membayar, yang disebut
sebagai energi yang hilang. Seperti yang tertulis dalam Surat Keputusan
Menteri Keuangan Nomor : 431/KMK.06/2002, bahwa “Susut adalah sejumlah
energi yang hilang dalam proses pengaliran energi listrik mulai dari Gardu
Induk sampai dengan konsumen. Apabila tidak terdapat gardu induk, susut
dimulai dari gardu distribusi sampai dengan konsumen.” Susut sendiri
dibedakan menjadi dua susut yang disebabkan oleh masalah teknis atau non
teknis. Susut yang disebabkan oleh pencurian tenaga listrik adalah susut non
teknis. Dalam usaha mengurangi jumlah susut yang diakibatkan oleh pencurian
tenaga listrik, maka PLN mengambil langkah dengan menertibkan pengguna
atau pemakaian Tenaga Listrik melalui P2TL, singkatan dari Penertiban
Pemakaian Tenaga Listrik. Namun PT PLN masih mengalami sedikit kendala
dalam menjalannya program P2TL, yaitu saat melakukan perhitungan ternyata
hasil perhitungan kurang valid. Sehingga sering terjadi kesalahan perkiraan. Penelitian ini akan membantu program P2TL dalam memprediksi obyek sasaran pencurian penggunaan tenaga listrik dengan lebih tepat dengan
mengunakan metode klasifikasi algoritma Naive Bayes. Pada penelitian
sebelumnya algoritma Naive Bayes juga digunakan memprediksi besarnya
penggunaan listrik rumah tangga [1]. Metode Bayes juga dinilai berpotensi
baik dalam mengklasifikasi dokumen dibandingkan metode pengklasifikasian
yang lain dalam hal akurasi dan efisiensi komputasi [2]
3
II. Tinjauan Pustaka
“Pengunaan listrik harus seimbang persediaan listrik. Oleh karena itu
setiap rumah tangga haruslah paham penggunaan listrik yang efektif.
Penerapan metode naïve bayes diharapkan mampu untuk memprediksi
besarnya penggunaan listrik tiap rumah tangga agar lebih mudah mengatur
penggunaan listrik dari 60 data penggunaan listrik rumah tangga yang diuji
dengan metode naïve bayes, maka diperoleh hasil persentase 78,3333% untuk
keakuratan prediksi, di mana dari 60 data penggunaan listrik rumah tangga
yang diuji terdapat 47 data penggunaan listrik rumah tangga yang berhasil
diklasifikasikan dengan benar.” [1]
“Permasalahan pencurian listrik adalah permasalahan yang kompleks
karena penyebab maupun modusnya beragam. Untuk mengamati mekanisme
terjadinya pencurian listrik, menguji kebijakan penanganan pencurian listrik
yang ada saat ini, serta mengetahui kebijakan yang baik untuk mengurangi
angka pencurian listrik ini, maka dibangunlah model berbasis agen untuk
mensimulasikan pola pencurian listrik ini. Mekanisme pengambilan keputusan
agen disini menggunakan permainan norma dari Axelrod (1986) dan learning
proses masing-masing agen diadaptasi dari teori lokus control (Rotter, 1966)
dimana agen dibedakan menjadi lokus kontrol internal dan lokus kontrol
eksternal. Hasil simulasi yang dijalankan menunjukkan bahwa kebijakan
penanganan pencurian listrik yang ada saat ini masih tidak dapat mengurangi
angka pencurian listrik. Dengan memberikan reward bagi pelapor kegiatan
pencurian listrik, jumlah pencurian listrik dapat dikurangi, namun pengurangan
tenaga yang hilang akibat kegiatan pencurian listrik tidak signifikan.” [3]
“Kondisi yang ada pada pelaksanaan P2TL adalah masalah kurangnya
optimalisasi pelaksanaan P2TL, dan cara mengoptimalisasikannya dengan
menggunakan metode kombinasi kualitatif dan kuantitatif. Pendekatan yang
digunakan melalui observasi. Hasil penelitian ini mencatat bahwa penghematan
kWh yang diperoleh pada bulan Januari-Maret sebesar 48.599 kWh atau sekitar
13% dari tabungan yang ditargetkan melalui pelaksanaan P2TL kWh, sehingga
disimpulkan bahwa kinerja P2TL belum optimal. Efek dari kWh yang
disimpan mampu menekan penyusutan pada bulan Januari sebesar 0,16% dan
pada bulan Maret sebesar 0,5%. Upaya yang harus dilakukan dalam rangka
optimalisasi pelaksanaan P2TL secara teknis adalah melalui Deteksi Dini
Pencurian.” [4]
Pada penelitian yang dilakukan oleh Alfa Saleh ditemukan cara
memprediksi besarnya penggunaan listrik rumah tangga menggunakan
algoritma Naive Bayes. Algoritma tersebut sudah tepat hanya saja data yang
digunakan dalam penilitian ini masih kurang banyak untuk mendapatkan hasil
yang lebih akurat. Cara tersebut juga dapat diaplikasikan dalam penelitian ini,
hanya saja penelitian ini tidak memprediksi besarnya penggunaan listrik rumah
tangga namun memprediksi adanya pencurian pemakaian tenaga listrik.
Sedangkan pada penelitian dari Devilla Sari, Utomo Sarjono Putro,Yos
Sunitiyoso, Pri Hermawan, dan Dhanan Sarwo Utomo memiliki tujuan yang
sama dengan penilitian ini yaitu untuk mengatasi pencurian listrik, namun pada
4
penelitian ini menggunakan aplikasi Norm Game dan Locus of Control.
Namun pada penelitian ini lebih kearah penanggulangan terjadinya pencurian
tenaga listrik tersebut. Menurut Irene Ega Novena Putri, ArkhanSubari
penertiban pemakaian tenaga listrik harus di optimalkan, berbanding lurus
dengan penelitian ini. Namun pada penelitian tersebut lebih tentang bagaimana
cara melakukan optimalisasi upaya peningkatan saving Kwh. Penelitian
tersebut sudah cukup baik karena masalah dapat diselesaikan hanya saja data –
data yang ada belum direkap dengan baik sehingga perhitungannya bisa lebih
efisien.
III. Metodologi Penelitian
Tahapan penelitian yang digunakan dalam Sistem Pendukung
Keputusan Pemilihan Mentor untuk kegiatan Mentoring pada Fakultas
Teknologi Informasi UKSW menggunakan Fuzzy Multi-Atribute Decision
Making-Simple Additive Weighting, ditunjukkan pada Gambar 1.
Tahapan Penelitian pada Gambar 1 dijelaskan sebagai berikut, tahap 1
adalah analisis masalah, pada tahap ini menganalisis dan mengamati
permasalahan yang berhubungan dengan faktor – faktor pencurian atau
pencurian penggunaan tenaga listrik. Sehingga dapat ditemukan rumusan
Analisis Masalah
Studi Literatur
Mengumpulkan Data
Analisa Data
Pengujian
Pengambilan Kesimpulan
Metodologi Penelitian
Gambar 1 Plot Atribut Tenaga dengan Label Hasil Periksa.
5
masalah dalam penelitian. Tahap 2 adalah mencari studi literatur, mempelajari
dan memperdalam tentang P2TL (Penertiban Pemakaian Tenaga Listrik) juga
tentang algoritma Naive Bayes. Studi literatur yang didapatkan bisa berupa
jurnal, buku, penelitian-penelitian terdahulu tentang P2TL atau tentang
algoritma Naive Bayes.
Tahap 3 adalah pengumpulan data , pada penelitian ini data – data yang
dikumpulkan atau yang akan digunakan adalah data – data masa lalu atau
berdasarkan kejadian sebelumnya. Data-data nya seperti nama pelanggan,
pemakaian kWh, atau jam pakai nya, hal-hal yang berhubungan dengan
penggunaan atau pemakain listrik sehingga nantinya kita bisa menentukan
variabel apa saja yang akan digunakan. Setelah data terkumpul, maka pada
tahap selanjutnya yaitu tahap ke-4 ada metodologi penelitian, pada tahap ini
dibahas tentang algoritma atau metode apa yang akan digunakan dalam
penilitian, di sini menggunakan algoritma Naive Bayes dalam menyelesaikan
masalah.
Tahap ke-5 akan dilakukan analisa data tersebut menggunakan
Algoritma Naive Bayes dengan Tools yang digunakan adalah tools R. Pada
tahap analisis data akan ditemukan hasil dari perhitungan menggunakan Naive
Bayes tersebut. Tahap 6 pengujian keakuratan hasil atau solusi dari analisa
data. Maka pada tahap ini dilakukan pengujian menggunakan data testing.
Dilakukan pengujian dengan tujuan mengetahui apakah penelitian yang telah
dilakukan berhasil, apakah tepat perhitungannya. Jika solusi atau hasil dari
analisa data sudah teruji akurat, maka sudah bisa diambil keputusan dari
penelitian ini, atau di ambil kesimpulannya. Tahap ke-7 ini adalah pengambilan
kesimpulan.
IV. Pembahasan dan Hasil Pengujian
Data yang telah didapat akan melewati proses penghapusan data yang
tidak konsisten. Data yang digunakan dalam penelitian ini memiliki beberapa
record yang tidak sesuai/ salah ketik. Data yang tidak konsisten tersebut
diubah/dilengkapi agar menjadi data yang konsisten. Saat data dimasukkan ke
dalam rapidminer, ternyata tidak ditemukan missing values sehingga tahap ini
dilewati.
Selanjutnya dilakukan proses penggabungan data dari beberapa sumber
yang menunjang. Data yang didapatkan untuk proses ini ada dua yaitu data jam
nyala penggunaan listrik dan data pembelian token listrik. Kedua data tersebut
digabungkan menjadi satu sehingga atributnya bisa saling melengkapi.
6
Tabel 1 Hasil Penggabungan Data Jam Nyala dan Data Pembelian Token
Row
No.
IDPEL HASIL
PERIKSA
DAYA KWH JAM
NYALA
KRITERIA
1 523013192979 SASARAN
OPERASI
240000 9600 40 > 6
2 523100542286 NORMAL 41500 4939 119 < 6
3 523020545413 SASARAN
OPERASI
345000 13368 39 > 6
4 523100327691 NORMAL 7700 1450 188 < 6
5 523030862410 NORMAL 1300 110 85 < 6
6 523030612427 NORMAL 1300 150 115 < 6
... ... ... ... ... ... ...
3000 523021863281 NORMAL 450 124 53 < 6
Pada tabel 1 menunjukkan hasil dari penggabungan dua data yaitu data
jam nyala penggunaan listrik dan data pembelian token. Sebelumnya, data jam
nyala tidak memiliki atribut pembelian token, begitu sebaliknya. Setelah
digabungkan, maka dalam satu tabel bisa memiliki atribut jam nyala dan
pembelian token. Sehingga semua atribut yang dibutuhkan bisa berada di satu
tabel yang sama.
Selanjutnya data diseleksi, mana yang digunakan dan tidak digunakan.
Namun pada data yang digunakan pada percobaan kali ini tidak memiliki
atribut yang tidak berpengaruh sehingga semua atribut digunakan. Jam nyala
adalah atribut tentang jam nyala listrik yang digunakan oleh pelanggan PLN
selama satu bulan, daya adalah besarnya daya yang digunakan, kWh adalah
besarnya energi yang digunakan, dan kriteria adalah atribut mengenai jarak
waktu berapa lama pembelian token yang dilakukan pelanggan PLN terakhir
kali. Semua itu adalah atribut yang diperlukan dalam proses.
Tabel 2 Data Jam Nyala yang Tadinya Numerik diubah Menjadi Nominal.
Row
No.
IDPEL HASIL
PERIKSA
CLUSTER DAYA KWH KRITERIA
1 523013192979 SASARAN
OPERASI
Cluster_0 450 171 <6
2 523100542286 NORMAL Cluster_0 450 158 <6
3 523020545413 SASARAN
OPERASI
Cluster_0 450 82 <6
4 523100327691 NORMAL Cluster_2 1300 241 <6
5 523030862410 NORMAL Cluster_0 900 136 <6
6 523030612427 NORMAL Cluster_0 555000 52208 <6
... ... ... ... ... ... ...
3000 523021863281 NORMAL Cluster_0 124 53 < 6
Tabel 2 merupakan data yang telah melalui tranformasi. Data numerik
yang ada diubah menjadi polinominal atau binominal agar mudah dalam
penghitungan Naive Bayes. Data jam nyala memiliki tipe data numerik yang
diubah dalam bentuk polinominal untuk mempermudah dalam perhitungan
algoritma Naive Bayes. Tranformasi dilakukan menggunakan metode
clustering. Clustering adalah metode pembagian data ke dalam kelompok
dengan objek yang serupa. Setiap kelompok atau cluster terdiri dari objek yang
7
serupa atau sejenis namun berbeda antara satu kelompok dengan kelompok
lainnya [13]. Dapat dilihat pada gambar tersebut bahwa atribut jam nyala
memiliki tipe data numerik, sedangkan attribute cluster adalah nilai dari atribut
jam nyala yang telah diubah tipe datanya menjadi polinominal.
Pengelompokkan data menggunakan nilai k = 3, yang artinya dibagi menjadi 3
cluster.
Setelah dilakukan beberapa tahapan di atas maka dihasilkan data
training seperti pada tabel 4 di bawah ini. Data training adalah data latihan
yang digunakan untuk melatih algoritma yang digunakan. Data training yang
digunakan adalah data pemakaian listrik 3000 pelanggan PT PLN Distribusi
Jawa Tengah dan D.I.Yogyakarta yang ada di Semarang.
Algoritma Naive Bayes merupakan pengklasifikasian dengan metode
probabilitas dan statistik yang dikemukakan Thomas Bayes, yaitu memprediksi
peluang di masa depan berdasarkan pengalaman di masa sebelumnya [7].
Algoritma ini merupakan salah satu algoritma dari metode klasifikasi. Jadi,
data masa lalu yang dimiliki akan digunakan sebagai tolak ukur dalam
menentukan hasil dari data di masa sekarang, atau data yang akan diuji. Pada
penelitian ini digunakan algoritma Naive Bayes karena Metode ini
memanfaatkan data training untuk menghasilkan probabilitas setiap kriteria
untuk class yang berbeda. Data penggunaan tenaga listrik berdasarkan jam
nyala dan pembelian token tersebut dijadikan sebagai data training yang bisa
menghasilkan probabilitas apakah pelanggan melakukan pencurian tenaga
listrik atau tidak. Berikut algoritma Naive Bayes :
Persamaan Metode Naive Bayes
Persamaan dari teorema Bayes adalah [8] :
P(𝐻|𝑋)= ( | ) ( )
( ) (1)
Di mana :
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X (posteriori
probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas X
Untuk menjelaskan metode Naive Bayes, perlu diketahui bahwa
proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan
kelas apa yang cocok bagi sampel yang dianalisis tersebut. Karena itu,
metode Naive Bayes di atas disesuaikan sebagai berikut:
8
P(𝐶|𝐹1 … 𝐹𝑛) = ( ) ( | )
( ) (2)
Di mana :
C : Class
F1...Fn : Karakteristik petunjuk yang dibutuhkan untuk
melakukan klasifikasi
P(C|F1...Fn) : Probabilitas karakteristik tertentu pada kelas C.
P(C) : Probabilitas class (prior probabilitas)
P(F1...Fn|C) : Probabilitas karakteristik-karakteristik sampel pada
kelas C
P(F1...Fn) : Probabilitas karakteristik-karakteristik sampel secara
global.
Di mana Variabel C merepresentasikan kelas, sementara variabel
F1 ... Fn merepresentasikan karakteristik petunjuk yang dibutuhkan
untuk melakukan klasifikasi. Maka rumus tersebut menjelaskan bahwa
peluang masuknya sampel karakteristik tertentu dalam kelas C
(Posterior) adalah peluang munculnya kelas C (sebelum masuknya
sampel tersebut, seringkali disebut prior), dikali dengan peluang
kemunculan karakteristik-karakteristik sampel pada kelas C (disebut
juga likelihood), dibagi dengan peluang kemunculan karakteristik-
karakteristik sampel secara global (disebut juga evidence). Karena itu,
rumus di atas dapat pula ditulis secara sederhana sebagai berikut:
Posterior =
(3)
Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel.
Nilai dari posterior tersebut nantinya akan dibandingkan dengan nilai-
nilai posterior kelas lainnya untuk menentukan kekelas apa suatu
sampel akan diklasifikasikan. Penjabaran lebih lanjut rumus Bayes
tersebut dilakukan dengan menjabarkan P(𝐶|𝐹1, … , 𝐹𝑛) menggunakan
aturan perkalian sebagai berikut:
P (𝐶|𝐹1, … , = 𝑃(𝐶)𝑃(𝐹1, … , 𝐹𝑛|𝐶)
= (𝐶)(𝐹1 |𝐶)𝑃(𝐹2, … , 𝐹𝑛|𝐶, 𝐹1)
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2|𝐶, 𝐹1 )𝑃(𝐹3, … , 𝐹𝑛|𝐶, 𝐹1,𝐹2
= (𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2)𝑃(𝐹4, … , 𝐹𝑛|𝐶, 𝐹1, 𝐹2,
𝐹3)
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2) … 𝑃(𝐹𝑛 |𝐶, 𝐹1, 𝐹2, 𝐹3, …
, 𝐹𝑛−1 ) (4)
Dapat dilihat bahwa hasil penjabaran tersebut menyebabkan
semakin banyak dan semakin kompleksnya faktor-faktor syarat yang
mempengaruhi nilai probabilitas, yang hampir mustahil untuk dianalisa
satu per satu. Akibatnya, perhitungan tersebut menjadi sulit untuk
9
dilakukan. Di sinilah digunakan asumsi independensi yang sangat tinggi
(naif), bahwa masing-masing petunjuk (F1,F2...Fn) saling bebas
(independen) satu sama lain. Dengan asumsi tersebut, maka berlaku
suatu kesamaan sebagai berikut:
P(𝐹𝑖 |𝐹𝑗) = ( )
( ) =
( ) ( )
( ) = (𝐹𝑖 ) (5)
Untuki≠j ,sehingga
P(𝐹𝑖 |𝐶, 𝐹𝑗) = 𝑃(𝐹𝑖 |𝐶) (6)
Persamaan di atas merupakan model dari teorema Naive Bayes
yang selanjutnya akan digunakan dalam proses klasifikasi. Untuk
klasifikasi dengan data kontinyu digunakan rumus Densitas Gauss :
P(𝑋𝑖 = 𝑥𝑖 |𝑌 = 𝑦𝑗)=
√ ( )
(7)
Di mana :
P : Peluang
Xi : Atribut ke i
xi : Nilai atribut ke i
Y : Kelas yang dicari
yi : Sub kelas Y yang dicari
µ : Mean, menyatakan rata-rata dari seluruh atribut
σ : Deviasi standar, menyatakan varian dari seluruh atribut.
Data training yang tadi telah diolah akan digunakan untuk melatih
algoritma Naive Bayes. Algoritma Naive Bayes dihubungkan dengan data
training. Setelah algoritma Naive Bayes dihubungkan dengan data training,
maka algoritma Naive Bayes akan merubah parameter pada dirinya untuk
menyesuaikan dengan data latihan. Selanjutnya dihubungkan dengan Apply
Model untuk menerapkan model tersebut.
Setelah model diterapkan maka akan diuji lagi, namun sebelum
melakukan pengujian, dapat dilihat plot hubungan antar atribut dengan label
hasil periksa terlebih dahulu seperti pada gambar berikut ini :
10
Gambar 2 menunjukkan plot antara atribut jam nyala dengan label hasil
periksa. Berdasarkan gambar tersebut dapat disimpulkan bahwa pemakaian jam
nyala dengan nilai yang rendah bisa diklasifikasikan menjadi sasaran operasi.
Pengguna yang masuk ke dalam klasifikasi normal adalah pelanggan PLN
dengan jam nyala sedang. Sedangkan pelanggan dengan jam nyala yang sangat
tinggi diklasifikasikan ke dalam penyimpangan.
Gambar 3 menunjukkan plot atribut tenaga dengan label hasil periksa.
Berdasarkan data yang ada, pelangan PLN yang masuk klasifikasi normal bisa
siapa saja pelanggan dengan tenaga berapapun. Sama halnya dengan klasifikasi
sasaran operasi. Sedangkan pada data tersebut klasifikasi penyimpangan
ditemukan pada pelanggan dengan tenaga 450, 1300, 3500, 4400, 16500,
19700, 345000.
Gambar 2 Plot Atribut Jam Nyala dengan Label Hasil Periksa.
Gambar 3 Plot Atribut Tenaga dengan Label Hasil Periksa.
11
Gambar 4 menunjukkan plot atribut kWh dengan label hasil periksa.
Berdasarkan data yang ada, dapat dilihat bahwa atribut kWh tidak terlalu
memiliki pengaruh yang besar dalam menentukan klasifikasi sasaran operasi,
normal atau penyimpangan karena pada gambar ditunjukkan rata – rata plot
yang sama diantara ketiganya.
Gambar 5 menunjukkan plot atribut kriteria dengan label hasil periksa.
Atribut kriteria ini menjelaskan selang waktu pelanggan membeli token listrik
yang dibagi menjadi dua bagian yaitu kurang dari enam bulan dan lebih dari
enam bulan. Bedasarkan data training yang ada, pelanggan yang masuk
klasifikasi sasaran operasi adalah pelanggan yang dengan kriteria lebih dari
enam bulan. Sedangkan yang masuk klasifikasi penyimpangan adalah
pelanggan dengan kriteria kurang dari enam bulan. Klasifikasi normal bisa
dimungkinkan untuk pelanggan dengan kriteria lebih ataupun kurang dari enam
bulan.
Gambar 4 Plot Atribut kWh dengan Label Hasil Periksa.
Gambar 5 Plot Atribut Kriteria dengan Label Hasil Periksa.
12
Tabel 3 Data Testing yang digunakan Dalam Proses.
Row
No.
NAMA ALAMAT TENAGA KWH JAM
NYALA
KRITERIA
1 SO IM DS
SEKOPEK/SARI
REJO
450 171 380 <6
2 NGATNO JL TM
BOROBUDUR
RMR RT 8 RW 9
MANYARAN
450 158 351 <6
3 PIATUN DS
TUNGGULSRI
BRANGS
450 82 182 <6
4 KARNO JL WR
SUPRATMAN 15
RT 5
GISIKDRONO
1300 241 185 <6
5 MUSLIKHAH
BT BASRI
GG .MASJID
RT.4/2 REJ
900 136 151 <6
6 IBIS
BUDGET
HOTEL
JL PIERE
TENDEAN 21
SEMARANG
555000 52208 94 <6
7 MDA
MIFTAHUL
ATHFAL
DS PIDODO
WETAN PTB
1300 113 87 <6
8 EDY
MUDJIANTO
DS ROWOSARI
METESEH RT 05
RW 5 BOJA
11000 952 87 <6
... ... ... ... ... ... ...
21 YATNO
HADI
PU RWOSARI 6
RT7 RK1
450 342 760 <6
Pengujian algoritma dengan menggunakan data testing. Data testing
pada tabel 3 dimasukkan ke dalam proses dengan menggunakan data training
dan algoritma Naive Bayes. Setelah proses dijalankan maka hasilnya seperti
tabel di bawah ini.
13
Tabel 4 Hasil Pengujian.
N
o
Prediction
(Hasil
Periksa)
Confiden
ce
(Sasaran
Operasi)
Confiden
ce
(Normal
Confiden
ce
(Penyim
pangan)
Nama Alamat Ten
aga
kW
h
Jam
Nya
la
Kriteria
1 Normal 0 0,791 0,209 SO IM DS
SEKOPE
K/SARI
REJO
450 171 380 <6
2 Normal 0 0,890 0,110 NGATNO JL TM
BOROB
UDUR
RMR RT
8 RW 9
MANYA
RAN
450 158 351 <6
3 Normal 0 0,998 0,002 PIATUN DS
TUNGG
ULSRI
BRANG
S
450 82 182 <6
4 Normal 0 1,000 0 KARNO JL WR
SUPRAT
MAN 15
RT 5
GISIKD
RONO
130
0
241 185 <6
5 Normal 0 1,000 0 MUSLIKH
AH BT
BASRI
GG
.MASJID
RT.4/2
REJ
900 136 151 <6
... ... ... ... ... ... ... ... ... ... ...
21 Penyimpan
gan
0 0 1,000 YATNO
HADI
PU
RWOSA
RI 6 RT7
RK1
450 342 760 <6
Jadi implementasinya adalah dari 21 data testing yang ada, dihasilkan
klasifikasi sebagai berikut, ada 3 pelanggan yang masuk ke dalam klasifikasi
sasaran operasi, 2 pelanggan masuk ke dalam klasifikasi penyimpangan, dan 16
pelanggan masuk ke dalam klasifikasi normal.
V. Simpulan
Berdasarkan hasil pengujian dengan algoritma Naive Bayes terhadap
data penggunaan listrik pelanggan PLN Semarang, maka dapat diambil
beberapa kesimpulan sebagai berikut : (1) Algoritma Naive Bayes dapat
menyelesaikan masalah yang ada yaitu mengklasifikasi pencurian yang
dilakukan pelanggan PLN, apakah masuk ke dalam klasifikasi sasaran operasi,
14
normal atau penyimpangan; (2) Algoritma klasifikasi Naive Bayes adalah
algoritma yang tepat dalam implementasi proses pencarian pencurian
pelanggan PLN.
Berdasarkan pengujian yang telah dilakukan memang sudah mencapai
tujuan namun masih ada kekurangan. Kekurangan dapat dikembangkan pada
penelitian lain. Ada saran yang mungkin dilakukan untuk penelitian lain
menggunakan atribut yang lebih detail jika ada, menggunakan data lebih dari
3000 data sehingga hasilnya bisa lebih akurat lagi, bisa menggabungkan dua
algoritma atau lebih.
VI. Daftar Pustaka
[1]. Saleh, A.,2015, Implementasi Metode Klasifikasi Naive Bayes Dalam
Memprediksi Besarnya Penggunaan Listrik Rumah Tangga, Citec
Journal, Vol.2 No.3, pp 207-217.
[2]. Ting, S. L., Ip, W. H.,& Tsang, A. H.C., 2011, Is Naive Bayes a Good
Classifier for Document Classification?, International Journal of
Software Engineering and Its Applications, Vol. 5, No. 3, Hal 37-46.
[3]. Sari, Devilla, dkk, 2010, Aplikasi Norm Game dan Locus of Control
untuk Pengembangan Kebijakan Penanggulangan Pencurian Listrik,
Jurnal Manajemen Teknologi, Vol. 9 No.1.
[4]. Putri, I.E.N,& Arkhan, S.,2015,Optimasi Pelaksanaan Penertiban
Pemakaian Tenaga Listrik (P2TL) Sebagai Upaya Peningkatan Saving
KWH dan Penekanan Susut Non Teknis di PT.PLN (Persero) Rayon
Semarang Selatan, Jurnal Gema Teknologi, Vol. 18 No.2 Periode
Oktober 2014 – April 2015.
[5]. Taruna R., S.,& Hiranwal, S., 2013, Enhanced Naive Bayes Algorithm
for Intrusion Detection in Data Mining, International Journal of
Computer Science and Information Technologies, Vol.6, No. 4, Hal
960-962.
[6]. Ridwan, M., dkk, 2013, Penerapan Data Mining untuk Evaluasi
Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes
Classifier, Jurnal EECCIS, Vol 1, No. 7, Hal. 59-64
15
[7]. Bustami, 2014, Penerapan Algoritma Naive Bayes untuk
Mengklasifikasi Data Nasabah Asuransi, Jurnal Informatika,Vol.8
No.1, pp. 884-898.
[8]. Bustami, 2013, Penerapan Algoritma Naive Bayes Untuk
Mengklasifikasi Data Nasabah Asuransi, TECHSI : Jurnal Penelitian
Teknik Informatika, Vol. 3, No.2, Hal. 127-146.
[9]. Verma, A.,& Ashwani K., 2014, Performance Enhancement of
KMeans Clustering Algorithms for High Dimensional Data Sets,
International Journal of Advanced Research in Computer Science and
Software Engineering, Vol.4, Issue 1, January 2014.