ekstraksi opini tokoh publik berdasarkan analisis

13
EKSTRAKSI OPINI TOKOH PUBLIK BERDASARKAN ANALISIS SENTIMENT DATA TWITTER MENGGUNAKAN NAÏVE BAYES BERBASIS PARTICLE SWARM OPTIMIZATION TUGAS AKHIR Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang LIA NURAINI 201210370311115 JURUSAN INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2019 brought to you by CORE View metadata, citation and similar papers at core.ac.uk provided by UMM Institutional Repository

Upload: others

Post on 28-Jan-2022

15 views

Category:

Documents


0 download

TRANSCRIPT

1

EKSTRAKSI OPINI TOKOH PUBLIK

BERDASARKAN ANALISIS SENTIMENT DATA

TWITTER MENGGUNAKAN NAÏVE BAYES

BERBASIS PARTICLE SWARM OPTIMIZATION

TUGAS AKHIR

Diajukan Untuk Memenuhi

Persyaratan Guna Meraih Gelar Sarjana Strata 1

Teknik Informatika Universitas Muhammadiyah Malang

LIA NURAINI

201210370311115

JURUSAN INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2019

brought to you by COREView metadata, citation and similar papers at core.ac.uk

provided by UMM Institutional Repository

i

ii

iii

LEMBAR PERNYATAAN

Yang bertanda tangan di bawah ini:

Nama : Lia Nuraini

Tempat / Tgl Lahir : Banjarmasin, 18 Mei 1994

NIM : 201210370311115

Fakultas / Jurusan : Teknik / Teknik Informatika

Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “Ekstraksi

Opini Tokoh Publik Berdasarkan Analisis Sentiment Data Twitter

Menggunakan Naïve Bayes Berbasis Particle Swarm Optimization” beserta

seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang

lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah

disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya.

Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam

karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini

maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.

Mengetahui, Malang, 15 Januari 2019

Dosen Pembimbing I

Nur Hayatin, S.ST., M.Kom

NIP 108.0907.0476

Yang Membuat Pernyataan

Lia Nuraini

NIM 201210370311115

iv

LEMBAR PERSEMBAHAN

Alhamdulillahi Robbil `Alamin, puji syukur penulis ucapkan kepada Allah

SWT atas segala limpahan rahmat dan karunia-Nya, serta kepada Nabi

Muhammad SAW atas segala kebarokahan. Ucapan syukur yang tidak terhingga

kepada Allah SWT yang selalu memberikan bantuan yang tidak terduga,

kesabaran dan rasa tanggung jawab untuk bisa menyelesaikan Tugas Akhir ini.

Dalam penulisan Tugas Akhir Ini penulis banyak mendapatkan dukungan

serta bantuan dari berbagai pihak. Dalam kesempatan ini dengan segala

kerendahan hati, penulis mengucapkan terimakasih kepada :

1. Kedua orang tua penulis, yaitu Bapak Mulyadi dan Ibu Puji Astuti yang

selalu memberikan semangat untuk tidak menyerah dalam proses

penyelesaian Tugas Akhir ini, do’a mereka yang tidak pernah putus menjadi

perantara pertolongan didalam proses pengerjaan, serta dukungan moril

maupun materil kepada penulis selama ini.

2. Kepada semua saudara kandung penulis yaitu Tuti Nurlaili S.T, Renny

Nurhayani, dan Wulan Nuroctaviani yang selalu memberikan semangat dan

bantuannya.

3. Kepada Ibu Nur Hayatin S.ST., M.Kom dan Ibu Gita Indah Marthasari S.T.,

M.Kom selaku dosen pembimbing tugas akhir.

4. Ibu Gita Indah Marthasari S.T., M.Kom selaku Ketua Jurusan Teknik

Informatika Universitas Muhammadiyah Malang.

5. Teman-teman seperjuangan kelas Informatika C angkatan 2012 dan teman

seperjuangan lainnya yaitu Annisa Rizky Ananda S.Ikom yang selalu

memberikan dukungan berupa kritik, saran dan waktunya dalam proses

penyelesaian Tugas Akhir ini.

6. Dan semua pihak yang telah membantu dalam terselesaikannya tugas akhir

ini

vii

KATA PENGANTAR

Alhamdulillahi Robbil `Alamin, segala puji bagi Allah SWT yang telah

memberikan rahmat dan petunjuk serta melancarkan jalan sehingga penulis dapat

menyelesaikan penelitian yang berjudul “Ekstraksi Opini Tokoh Publik

Berdasarkan Analisis Data Twitter Menggunakan Naïve Bayes Berbasis Particle

Swarm Optimization”.

Pada penelitian ini dibuat suatu sistem klasifikasi tweet berbahasa

Indonesia yang membahas tentang Pilkada DKI Jakarta tahun 2017 lalu. Sistem

ini dirancang untuk menentukan sentiment positif dan negatif dari opini

masyarakat, dengan cara menerapkan algoritma Particle Swarm Optimization

pada klasifikasi Naïve Bayes yang bertujuan untuk meningkatkan hasil akurasi

dari kinerja klasifikasi Naïve Bayes.

Penulis menyadari bahwa penelitian ini masih jauh dari kesempurnaan.

Oleh karena itu penulis mengharapkan kritik dan saran yang membangun untuk

pengembangan kedepannya.

Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang

telah membantu hingga tugas akhir ini terselesaikan.

Malang, 15 Januari 2019

Penulis

viii

DAFTAR ISI

LEMBAR PERSETUJUAN ......................................................................... i

LEMBAR PENGESAHAN .......................................................................... ii

LEMBAR PERNYATAAN ........................................................................... iii

LEMBAR PERSEMBAHAN ....................................................................... iv

ABSTRAK ...................................................................................................... v

ABSTRACT ................................................................................................... vi

KATA PENGANTAR ................................................................................... vii

DAFTAR ISI ................................................................................................. viii

DAFTAR TABEL ......................................................................................... xi

DAFTAR GAMBAR ..................................................................................... xii

BAB I PENDAHULUAN ............................................................................... 1

1.1. Latar Belakang ................................................................................. 1

1.2. Rumusan Masalah .......................................................................... 3

1.3. Batasan Masalah ............................................................................. 4

1.4. Tujuan Penelitian ............................................................................ 4

1.5. Metodologi ..................................................................................... 4

1.6. Sistematika Penulisan ..................................................................... 6

BAB II LANDASAN TEORI ........................................................................ 8

2.1. Twitter ............................................................................................ 8

2.2. Sentiment Analysis ......................................................................... 9

2.3. Text Mining .................................................................................... 9

2.4. Text Preprocessing ......................................................................... 10

2.4.1 Case Folding ....................................................................... 10

2.4.2 Tokenizing .......................................................................... 11

2.4.3 Normalisasi ......................................................................... 11

2.4.4 Stopword Removal ............................................................. 12

2.4.5 Stemming ............................................................................ 13

2.5. Algoritma Confix-stripping ............................................................ 14

2.5.1. Aturan Peluruhan Kata Dasar ............................................. 15

ix

2.6. Klasifikasi Teks .............................................................................. 17

2.6.1 Naïve Bayes ........................................................................ 17

2.6.2 Pembobotan Naïve Bayes ................................................... 19

2.8. Naïve Bayes Berbasis Particle Swarm Optimization ........................ 20

2.8.1. Teori Algoritma ................................................................... 20

2.8.2. Prosedur Algoritma Naïve Bayes Berbasis Particle

Swarm Optimization ..................................................................... 21

2.9. Metode Pengujian ........................................................................... 23

2.9.1. Cross Validation ................................................................. 23

2.10. Penelitian Terdahulu ....................................................................... 25

BAB III ANALISIS DAN PERANCANGAN SISTEM ............................. 27

3.1. Perancangan Sistem ........................................................................ 27

3.2. Dataset .......................................................................................... 28

3.3. Pengolahan Data ............................................................................. 29

3.3.1. Manual Labelling ................................................................ 29

3.3.2. Preprocessing ...................................................................... 30

3.3.2.1. Tahapan Normalisasi .......................................... 30

3.3.2.2. Tahapan Case folding ......................................... 31

3.3.2.3. Tahapan Tokenizing ............................................ 31

3.3.2.4. Tahapan Stopword Removal ............................... 32

3.3.2.5. Tahapan Stemming ............................................. 32

3.3.2.6. Specific Feature .................................................. 33

3.4. Metode Klasifikasi yang di Usulkan ............................................. 33

3.4.1. Naïve Bayes Berbasis Particle Swarm Optimization .......... 34

3.5. Perancangan Skenario Pengujian .................................................... 36

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM ........................ 38

4.1. Implementasi Sistem ....................................................................... 38

4.2. Kebutuhan Sistem ........................................................................... 38

4.2.1. Kebutuhan Perangkat Keras ............................................... 38

4.2.2. Kebutuhan Perangkat Lunak ............................................... 39

x

4.3. Implementasi Proses Dataset .......................................................... 39

4.4. Implementasi dan Hasil Eksperimen Algoritma Klasifikasi

Naïve Bayes .................................................................................... 44

4.4.1 Implementasi Klasifikasi Naïve Bayes .................................. 44

4.5. Penerapan Algoritma Particle Swarm Optimization pada

Klasifikasi Naïve Bayes ................................................................. 49

4.5.1. Pengujian Model Klasifikasi Naïve Bayes Berbasis PSO

dengan Merubah Parameter dari Population Size dan

Inertia Weight pada Algoritma PSO ..................................... 50

4.6. Evaluasi Hasil dan Validasi Model ............................................... 51

BAB V PENUTUP .......................................................................................... 53

5.1. Kesimpulan ..................................................................................... 53

5.2. Saran ............................................................................................... 53

DAFTAR PUSTAKA .................................................................................... 55

xi

DAFTAR TABEL

Tabel 2.1 Case Folding ................................................................................... 10

Tabel 2.2 Tokenizing ....................................................................................... 11

Tabel 2.3 Normalisasi ..................................................................................... 12

Tabel 2.4 Stopword Removal .......................................................................... 13

Tabel 2.5 Stemming ......................................................................................... 14

Tabel 2.6 Kombinasi Prefix dan Sufiks yang tidak diperbolehkan ................ 15

Tabel 2.7 Aturan Peluruhan Kata Dasar (Adriani et al, 2007) ........................ 15

Tabel 2.9 Penelitian Terdahulu ....................................................................... 26

Tabel 3.1 Data Tweet Berdasarkan Keyword ................................................. 28

Tabel 3.2 Pelabelan Data Tweet ...................................................................... 29

Tabel 3.3 Hasil Normalisasi ............................................................................ 30

Tabel 3.4 Hasil Case Folding ......................................................................... 31

Tabel 3.5 Tokenizing ....................................................................................... 31

Tabel 3.6 Stopword Removal .......................................................................... 32

Tabel 3.7 Stemming ......................................................................................... 33

Tabel 3.8 Tabel Sentiment ............................................................................. 33

Tabel 3.9 Pembagian Data Training dan Data Testing ................................... 36

Tabel 3.10 Confusion Matrix .......................................................................... 37

Tabel 4.1 Hasil Preprocessing Data Training ................................................ 44

Tabel 4.2 Hasil Prediksi Data Testing ............................................................ 46

Tabel 4.3 Hasil Accuracy dengan Metode 10-fold Cross Validation .............. 48

Tabel 4.4 Hasil Eksperimen Algoritma Naïve Bayes Berbasis

PSO Dengan Merubah Parameter dari Population Size ................. 50

Tabel 4.5 Hasil Eksperimen Algoritma Naïve Bayes Berbasis

PSO Dengan Merubah Parameter dari Inertia Weight ................... 51

Tabel 4.6 Perbandingan Hasil Akurasi ........................................................... 52

xii

DAFTAR GAMBAR

Gambar 2.1 Ilustrasi 10-fold Cross Validation ............................................... 24

Gambar 3.1 Alur Sistem Analisis Sentiment Tweet Tokoh Publik ................. 27

Gambar 3.2 Flowchart Klasifikasi Naïve Bayes berbasis Particle

Swarm Optimization ................................................................................. 34

Gambar 4.1 Proses Pemilihan Operator View ................................................ 40

Gambar 4.2 Proses Input Dataset .................................................................... 40

Gambar 4.3 Inputan Dataset Training ............................................................ 41

Gambar 4.4 Proses Pemilihan Atribute Menjadi Label ................................... 42

Gambar 4.5 Proses Document From Data ...................................................... 42

Gambar 4.6 Proses Preprocessing Dataset ..................................................... 43

Gambar 4.7 Transformation Pembobotan TF-IDF ......................................... 43

Gambar 4.8 Model Klasifikasi Naïve Bayes pada Tools Rapidminer ............. 45

Gambar 4.9 Implementasi Pengujian 10-fold Cross Validation ..................... 47

Gambar 4.10 Confusion Matrix Algoritma Naïve Bayes ................................ 48

Gambar 4.11 Penerapan Algoritma Particle Swarm Optimization pada

Klasifikasi Naïve Bayes ............................................................ 49

Gambar 4.12 Confusion Matrix Algoritma Naïve Bayes Berbasis

Particle Swarm Optimization .................................................... 51

55

DAFTAR PUSTAKA

Hayatin, Nur., Mentari, Mustika., dan Izzah, Abidatul. 2014. Opinion Extraction

of Public Figure Based on Sentiment Analysis in Twitter. IPTEK, Journal

of Engineering, Vol.1, No.1.

Nurhadi, Achmad. 2016. “Implementasi Algoritma Naïve Bayes Classifier

Berbasis Particle Swarm Optimization (PSO) untuk Klasifikasi Konten

Berita Digital Bahasa Indonesia”. Akademi Manajemen Informatika dan

Komputer, BSI Pontianak.

Ernawati, Siti. 2016. “Penerapan Particle Swarm Optimization untuk Seleksi Fitur

pada Analisis Sentimen Review Perusahaan Penjualan Online

Menggunakan Naïve Bayes”. Program Studi Sistem Informasi, STMIK

Nusa Mandiri, Jakarta.

Prabowo, Alvino Dwi Rachman. “Prediksi Nasabah yang Berpotensi Membuka

Simpanan Deposito Menggunakan Naïve Bayes Berbasis Particle Swarm

Optimization”. Program Studi Teknik Infromatika, Fakultas Ilmu

Komputer, Universitas Dian Nuswantoro Semarang.

Manulu, Boy Utomo. 2014. “Analisis Sentimen pada Twitter Menggunakan Text

Mining”. Program Studi Teknologi Informasi, Fakultas Ilmu Komputer

dan Teknologi Informasi, Universitas Sumatera Utara, Medan.

Kumar, A., & Sebastian, T.M. 2012. Sentiment Analysis on Twitter, International

Journal of Computer Science Issues (IJCSI), 9(3), pp.1694-0814.

Lien, J., & Yu, J. 2011. Weighted Naïve Bayes Classification Algorithm Based on

Particle Swarm Optimization. Information School. Yunnan University of

Finance and Economics. Yunnan Kunming, China. IEEE.

F. Tala, “A Study of Stemming Effects on Information

Retrieval in Bahasa Indonesia,” Institute for Logic, Language

and Computation, Universiteit van Amsterdam, 2003.

Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M., Williams, H.E. 2007.

Stemming Indonesian : A Confix-Stripping Approach. Transaction on

Asian Language Information Processing. Vol. 6, No. 4, Articel 13.

Association for Computing Machinery : New York .

H, Aris Tri Jaka. 2015. Preprocessing Text untuk Meminimalisir Kata yang Tidak

Berarti dalam Proses Text Mining. Program Studi Informatika, Fakultas

TEKNIK, Universitas PGRI Semarang. Jurnal Informatika UPGRIS,

Volume 1 Edisi Juni 2015.

56

Agusta, L. 2009. Perbandingan Algoritma stemming Porter dengan algoritma

Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia.

Proceeding Konferensi Nasional Sistem dan Informatika. Yogyakarta. Hal

196-201.

Li, Jun, Lixin Ding, and Bo Li. "A Novel Naive Bayes Classification Algorithm

Based on Particle Swarm Optimization." The Open Automation and

Control Systems Journal 6.1 (2014).

J. Kennedy and R. C. Eberhart. Particle Swarm Optimization. In Proceedings of

the 1995 IEEE International Conference on Neural Networks. IEEE

Service Center, Piscataway, 1995.

Kouloumpis, E., Wilson, T., Moore, J. 2011. Twitter Sentiment Analysis: The

Good the Bad and the OMG!. Proceedings of the Fifth International AAAI

Conference on Weblogs and Social Media, Menlo Park, California. pp.

538- 541.