implementasi algoritma backpropagation...
Post on 03-Mar-2020
26 Views
Preview:
TRANSCRIPT
i UIN Syarif Hidayatullah Jakarta
IMPLEMENTASI ALGORITMA BACKPROPAGATION
PADA PENGENALAN EMOSI
BERDASARKAN SUARA MANUSIA
Skripsi
Oleh:
LULUT DWI PUTRI BAGASWARI
NIM: 11140910000041
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2019 M / 1440 H
ii UIN Syarif Hidayatullah Jakarta
IMPLEMENTASI ALGORITMA BACKPROPAGATION
PADA PENGENALAN EMOSI
BERDASARKAN SUARA MANUSIA
Skripsi
Oleh:
LULUT DWI PUTRI BAGASWARI
NIM: 11140910000041
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2019 M / 1440 H
iii UIN Syarif Hidayatullah Jakarta
LEMBAR PERSETUJUAN
IMPLEMENTASI ALGORITMA BACKPROPAGATION
PADA PENGENALAN EMOSI
BERDASARKAN SUARA MANUSIA
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh:
Lulut Dwi Putri Bagaswari
11140910000041
Menyetujui,
Pembimbing I,
Feri Fahrianto, M.Sc
NIP. 19800829 201101 1 002
Pembimbing II,
Luh Kesuma Wardhani, MT
NIP. 19780424 200801 2 022
Mengetahui,
Ketua Program Studi Teknik Informatika
Imam M. Shofi, MT
NIP. 19720205 200801 1 010
iv UIN Syarif Hidayatullah Jakarta
LEMBAR PENGESAHAN
Skripsi berjudul “Implementasi Algoritma Backpropagation Pada Pengenalan
Emosi Berdasarkan Suara Manusia” yang ditulis oleh Lulut Dwi Putri Bagaswari,
NIM 11140910000041 telah diuji dan dinyatakan lulus dalam sidang munaqosyah
Fakultas Sains dan Teknologi, UIN Syarif Hidayatullah Jakarta pada hari Rabu, 29
Mei 2019. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh
gelar Sarjana Komputer (S.Kom) pada Program Studi Teknik Informatika.
Jakarta, 29 Mei 2019
Tim Penguji,
Penguji I,
Fitri Mintarsih, M.Sc
NIP. 19800829 201101 1 002
Penguji II,
Hendra Bayu Suseno, M.Kom
NIP. 1982121 200912 1 003
Tim Pembimbing,
Pembimbing I,
Feri Fahrianto, M.Sc
NIP. 19800829 201101 1 002
Pembimbing II,
Luh Kesuma Wardhani, MT
NIP. 19780424 200801 2 022
Mengetahui,
v UIN Syarif Hidayatullah Jakarta
PERNYATAAN ORISINALITAS
Dengan ini saya menyatakan bahwa:
1. Skripsi ini merupakan hasil karya asli saya yang diajukan untuk memenuhi salah
satu persyaratan memperoleh gelar strata 1 di UIN Syarif Hidayatullah Jakarta.
2. Semua sumber yang tercantum dalam penulisan ini telah saya cantumkan sesuai
dengan ketentuan yang berlaku di UIN Syarif Hidayatullah Jakarta.
3. Apabila di kemudian hari terbukti karya ini bukan hasil karya asli saya, maka
saya bersedia menerima sanksi yang telah ditetapkan di UIN Syarif Hidayatullah
Jakarta.
Jakarta, 29 Mei 2019
Lulut Dwi Putri Bagaswari
vi UIN Syarif Hidayatullah Jakarta
PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI
Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang bertanda
tangan di bawah ini:
Nama : Lulut Dwi Putri Bagaswari
NIM : 11140910000041
Program Studi : Teknik Informatika
Fakultas : Sains dan Teknologi
Jenis Karya : Skripsi
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Islam negeri Syarif Hidayatullah Jakarta Hak Bebas Royalti
Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yag
berjudul:
IMPLEMENTASI ALGORITMA BACKPROPAGATION
PADA PENGENALAN EMOSI
BERDASARKAN SUARA MANUSIA
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti
Noneksklusif ini Universitas Islam Negeri Syarif Hidayatullah Jakarta berhak
menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data
(database), merawat, dan mempublikasikan tugas akhir saya selama tetap
mencantumkan nama saya sebagai penulis/pencipta dan pemilik Hak Cipta.
Demikian pernyataan ini saya buat dengan sebenarnya.
Jakarta, 29 Mei 2019
Lulut Dwi Putri Bagaswari
vii UIN Syarif Hidayatullah Jakarta
Nama : Lulut Dwi Putri Bagaswari (11140910000041)
Program Studi : Teknik Informatika
Judul : Implementasi Algoritma Backpropagation Pada Pengenalan
Emosi Berdasarkan Suara Manusia
ABSTRAK
Speech recognition merupakan salah satu komponen penting dalam interaksi
manusia dan komputer. Speech membawa informasi penting, salah satunya adalah
kondisi emosional. Terdapat empat kondisi emosi dasar pada manusia, yakni
marah, netral, sedih, dan senang. Dalam proses pengenalan emosi berdasarkan
suara manusia terdapat empat modul utama, mulai dari input data, ekstraksi ciri,
klasifikasi, hingga output yang berupa hasil identifikasi emosinya. Telah banyak
penelitian terkait dengan berbagai macam metode pengklasifikasian, namun belum
banyak yang mendapatkan tingkat keberhasilan yang mendekati sempurna.
Sehingga penulis mencoba berkontribusi untuk melakukan implementasi
pengenalan emosi berdasarkan suara ini dengan menggunakan algoritma
backpropagation. Sebelum dilakukan pengenalan, suara yang telah direkam dalam
bentuk .wav ini harus diekstraksi cirinya terlebih dahulu untuk mendapatkan
informasi mengenai kandungan emosinya. Beberapa ekstraksi ciri yang penulis
gunakan adalah frekuensi, energi, pitch, dan formant. Hasil dari penelitian ini
menunjukkan bahwa sistem ini memiliki rata-rata tingkat keberhasilan sebesar
73,05%.
Kata Kunci : Speech recognition, Emosi, Frekuensi, Energi, Pitch,
Formant, Backpropagation
Jumlah Halaman : xvii + 83
Jumlah Pustaka : 21 sumber (15 buku + 5 jurnal + 1 website)
viii UIN Syarif Hidayatullah Jakarta
Author : Lulut Dwi Putri Bagaswari (11140910000041)
Stydy Program : Informatics
Title : Implementation Backpropagation Algorithm for Human
Speech Emotion Recognition
ABSTRACT
Speech recognition is one of the important components in human and computer
interaction. Speech brings important information, one of which is emotional
conditions. There are four basic emotional conditions in humans, namely anger,
neutral, sad, and happy. In the process of speech emotion recognition there are four
main modules, starting from input data, feature extraction, classification, to output
in the form of the identification of emotions. There have been many studies related
to various types of classification methods, but not many have achieved near-perfect
success rates. With that, the author tried to contribute by implementing speech
emotion recognition using backpropagation algorithm. Before recognition was
made, the speech that has been recorded in the form of .wav format must be
extracted first to get information about the content of the emotions. Some feature
extractions that the author used are frequency, energy, pitch, and formant. The
results of this study indicate that this system has an average success rate of 73.05%.
Keywords : Speech recognition, Emotion, Frequency, Energy, Pitch,
Formant, Backpropagation
Number of Pages : xvii + 83
Number of Reference : 21 references (15 books + 5 journals + 1 website)
ix UIN Syarif Hidayatullah Jakarta
KATA PENGANTAR
Alhamdulillah segala puji dan syukur penulis panjatkan kehadirat Allah
SWT yang telah memberikan Rahmat dan Hidayahnya-Nya sehingga penulis
dapat menyelesaikan skripsi ini. Tak lupa shalawat serta salam kepada Nabi
Muhammad SAW, beserta keluarga, para sahabat, dan para pengikutnya dari awal
hingga akhir zaman.
Skripsi berjudul “IMPLEMENTASI ALGORITMA
BACKPROPAGATION PADA PENGENALAN EMOSI BERDASARKAN
SUARA MANUSIA” disusun untuk memenuhi persyaratan guna mendapatkan
gelar Sarjana Komputer (S.Kom) pada Program Studi Teknik Informatika di
Universitas Islam Negeri Syarif Hidayatullah Jakarta.
Selama proses penyusunan skripsi ini, penulis mendapat banyak bimbingan,
bantuan, masukan, dukungan, serta motivasi yang sangat bermanfaat dari berbagai
pihak. Oleh karena itu melalui kata pengantar ini penulis ingin menyampaikan
terima kasih banyak kepada:
1. Prof. Dr. Lily Surayya Eka Putri M.Env.Stud selaku dekan Fakultas Sains
dan Teknologi.
2. Bapak Imam M. Shofi, MT. selaku Ketua Program Studi Teknik
Informatika.
3. Bapak Feri Fahrianto, M.Sc dan Ibu Luh Kesuma Wardhani, MT. selaku
Dosen Pembimbing I dan II yang senantiasa memberikan bimbingan,
semangat, motivasi serta arahan yang sangat membantu penulis untuk dapat
menyelesaikan skripsi ini.
4. Seluruh dosen dan staff UIN Jakarta, khususnya Fakultas Sains dan
Teknologi yang telah memberikan ilmu dan pengalaman yang berharga.
x UIN Syarif Hidayatullah Jakarta
5. Kedua orang tua, ibu dan bapak yang senantiasa memberikan dukungan.
Terima kasih banyak, atas doa-doa dan jerih payah kalian lah penulis dapat
menyelesaikan studi di jenjang perguruan tinggi ini.
6. Kedua saudara penulis, mbak Febty dan dek Sukma serta kakak ipar yang
selalu memberikan semngat selama ini, membantu penulis agar dapat
menyelesaikan studi ini.
7. Siti Nurul Hidayati, sahabat penulis yang telah membantu, menyemangati
serta menghibur dalam penelitian skripsi ini juga masa perkuliahan.
8. Seluruh teman-teman Teknik Informatika angkatan 2014, khususnya kelas
TI-B tercinta. Terima kasih atas kebersamaan, kenangan, ilmu dan
pengalaman selama masa kuliah.
9. Seluruh pihak yang tidak dapat disebutkan satu persatu yang secara
langsung maupun tidak langsung telah membantu dalam menyelesaikan
skripsi ini.
Penulisan skripsi ini masih jauh dari kata sempurna. Untuk itu, sangat
diperlukan kritik dan saran yang membangun bagi penulis. Akhir kata, semoga
laporan skripsi ini dapat bermanfaat bagi penulis dan orang lain.
Jakarta, 29 Mei 2019
Penulis
Lulut Dwi Putri Bagaswari
11140910000041
xi UIN Syarif Hidayatullah Jakarta
DAFTAR ISI
LEMBAR PERSETUJUAN................................................................................... iii
LEMBAR PENGESAHAN ................................................................................... iv
PERNYATAAN ORISINALITAS ......................................................................... v
PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI .................................. vi
ABSTRAK ............................................................................................................ vii
ABSTRACT ......................................................................................................... viii
KATA PENGANTAR ........................................................................................... ix
DAFTAR ISI .......................................................................................................... xi
DAFTAR GAMBAR ............................................................................................ xv
DAFTAR TABEL ............................................................................................... xvii
BAB I PENDAHULUAN ....................................................................................... 1
1.1. Latar Belakang ............................................................................................... 1
1.2. Rumusan Masalah .......................................................................................... 3
1.3. Batasan Masalah ............................................................................................ 3
1.4. Tujuan dan Manfaat Penelitian ...................................................................... 3
1.5. Metodologi Penelitian .................................................................................... 4
1.5.1. Metode Pengumpulan Data ............................................................... 4
1.5.2. Metode Pengembangan Sistem ......................................................... 5
1.6. Sistematika Penulisan .................................................................................... 5
BAB II LANDASAN TEORI ................................................................................. 7
2.1. Sinyal Suara Manusia .................................................................................... 7
2.2. Teori Emosi ................................................................................................... 8
2.3. Pengenalan Emosi Berdasarkan Suara........................................................... 9
xii UIN Syarif Hidayatullah Jakarta
2.4. Preprocessing ............................................................................................... 10
2.4.1. Sampling ......................................................................................... 11
2.5. Ekstraksi Ciri ............................................................................................... 13
2.5.1. Frekuensi ......................................................................................... 13
2.5.2. Energi .............................................................................................. 14
2.5.3. Pitch ................................................................................................ 15
2.5.4. Formant ........................................................................................... 16
2.6. Jaringan Syaraf Tiruan ................................................................................. 18
2.6.1. Komponen Jaringan Syaraf Tiruan ................................................. 18
2.6.2. Fungsi Aktivasi ............................................................................... 21
2.7. Algoritma Backpropagation......................................................................... 22
2.7.1. Arsitektur Backpropagation ............................................................ 22
2.7.2. Fungsi Aktivasi ............................................................................... 23
2.7.3. Pelatihan Backpropagation.............................................................. 25
2.8. Metode Prototipe ......................................................................................... 27
2.9. Matlab .......................................................................................................... 28
2.10. Teknik Sampling .......................................................................................... 28
2.11. Studi Literatur Sejenis ................................................................................. 30
BAB III METODOLOGI PENELITIAN.............................................................. 32
3.1. Metode Pengumpulan Data.......................................................................... 32
3.1.1. Studi Pustaka ................................................................................... 32
3.1.2. Studi Literatur ................................................................................. 32
3.2. Metode Pengembangan Sistem .................................................................... 33
3.2.1. Komunikasi ..................................................................................... 33
3.2.2. Perancangan Cepat .......................................................................... 34
xiii UIN Syarif Hidayatullah Jakarta
3.2.3. Pemodelan Desain Cepat................................................................. 35
3.2.4. Konstruksi Prototipe ....................................................................... 35
3.2.5. Deployment Delivery and Feedback ............................................... 35
3.3. Data yang Digunakan .................................................................................. 35
3.4. Alur Penelitian ............................................................................................. 38
BAB IV PERANCANGAN SISTEM DAN IMPLEMENTASI .......................... 39
4.1. Komunikasi .................................................................................................. 39
4.1.1. Analisa Masalah .............................................................................. 39
4.1.2. Identifikasi Masalah ........................................................................ 40
4.1.3. Usulan Penyelesaian Masalah ......................................................... 40
4.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak ......................... 40
4.2. Perancangan Cepat....................................................................................... 41
4.2.1. Sinyal Suara .................................................................................... 41
4.2.2. Preprocessing .................................................................................. 43
4.2.3. Ekstraksi Ciri ................................................................................... 45
4.2.4. Klasifikasi Backpropagation ........................................................... 51
4.3. Pemodelan Desain Cepat ............................................................................. 56
4.4. Konstruksi Prototipe .................................................................................... 57
4.3.1. Ekstraksi Ciri ................................................................................... 57
4.3.2. Pelatihan Backpropagation.............................................................. 60
4.3.3. Pengujian Backpropagation ............................................................ 60
BAB V ANALISIS DAN PENGUJIAN SISTEM .............................................. 62
5.1. Analisis Masukan dan Keluaran .................................................................. 62
5.2. Tujuan Pengujian Sistem ............................................................................. 62
5.3. Skenario Pengujian ...................................................................................... 62
xiv UIN Syarif Hidayatullah Jakarta
5.3.1. Skenario Pertama ............................................................................ 63
5.3.2. Skenario Kedua ............................................................................... 65
5.3.3. Skenario Ketiga ............................................................................... 66
BAB VI PENUTUP .............................................................................................. 71
6.1. Kesimpulan .................................................................................................. 71
6.2. Saran ............................................................................................................ 71
DAFTAR PUSTAKA ........................................................................................... 72
LAMPIRAN .......................................................................................................... 74
xv UIN Syarif Hidayatullah Jakarta
DAFTAR GAMBAR
Gambar 2.1. Ilustrasi plot F0 untuk emosi bahagia dan bosan ............................. 10
Gambar 2.2. Ilustrasi proses sampling pada domain waktu .................................. 11
Gambar 2.3. Ilustrasi teorema sampling Nyquist .................................................. 12
Gambar 2.4. Spektral Frekuensi kalimat “a-i-u-e-o”.............................................14
Gambar 2.5. Bentuk gelombang dan fungsi autokorelasi pada estimasi pitch...... 16
Gambar 2.6. Susunan Neuron Jaringan Syaraf Tiruan .......................................... 19
Gambar 2.7. Jaringan Syaraf dengan 3 lapisan ..................................................... 20
Gambar 2.8. Arsitektur Backpropagation dengan n buah masukan ...................... 23
Gambar 2.9. Grafik fungsi sigmoid biner ............................................................. 24
Gambar 2.10. Grafik fungsi sigmoid bipolar ........................................................ 24
Gambar 2.11. Pendekatan Prototipe ...................................................................... 27
Gambar 3.1. Alur Penelitian.................................................................................. 38
Gambar 4.1. Diagram Blok Sistem Pengenalan Emosi ......................................... 41
Gambar 4.2. Contoh Sinyal Suara Manusia dalam Emosi Marah ........................ 42
Gambar 4.3. Contoh Sinyal Suara Manusia dalam Emosi Netral ......................... 42
Gambar 4.4. Contoh Sinyal Suara Manusia dalam Emosi Sedih .......................... 43
Gambar 4.5. Contoh Sinyal Suara Manusia dalam Emosi Senang ....................... 43
Gambar 4.6. Contoh Hasil Preprocessing............................................................. 45
Gambar 4.7. Proses Ekstraksi Ciri ........................................................................ 46
Gambar 4.8. Contoh Representasi Sinyal pada Domain Frekuensi ..................... 47
Gambar 4.9. Contoh Representasi Energi Terhadap Sinyal Asli .......................... 49
Gambar 4.10. Persebaran Nilai Pitch pada Data Latih ......................................... 50
Gambar 4.11. Diagram Alir Proses Pelatihan Backpropagation .......................... 53
xvi UIN Syarif Hidayatullah Jakarta
Gambar 4.12. Diagram Alir Proses Pengujian Backpropagation ......................... 55
Gambar 4.13. Desain antar muka pengguna ......................................................... 57
Gambar 4.14. Screenshot pengkodean tahap preprocessing ................................. 58
Gambar 4.15 Screenshot pengkodean tahap ekstraksi ciri .................................... 59
Gambar 4.16 Screenshot pengkodean tahap pelatihan backpropagation ............. 60
Gambar 4.17 Screenshot pengkodean tahap pengujian backpropagation ............ 61
Gambar 5.1. Akurasi Rata-Rata Hasil Pengujian .................................................. 66
xvii UIN Syarif Hidayatullah Jakarta
DAFTAR TABEL
Tabel 3.1. Perhitungan Jumlah Data Latih Tiap Jenis Emosi ............................... 36
Tabel 4.1. Perangkat Lunak Yang Digunakan ...................................................... 40
Tabel 5.1. Pengaruh jumlah Hidden Layer dan Hidden Neuron terhadap parameter
lainnya ................................................................................................................... 65
Tabel 5.2. Akurasi Rata-rata Hasil Pengujian ....................................................... 65
Tabel 5.3. Rentang nilai ekstraksi ciri dari masin-masing label emosi ................. 65
Tabel 5.4. Pengenalan data uji “Marah (37).wav” ................................................ 67
Tabel 5.5. Pengenalan data uji “Netral (30).wav” ................................................ 68
Tabel 5.6. Pengenalan data uji “Sedih (24).wav” ................................................. 69
Tabel 5.7. Pengenalan data uji “Senang (27).wav” ............................................... 70
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Perkembangan ilmu pengetahuan dan teknologi telah memberikan
dampak yang sangat besar dalam kehidupan manusia. Salah satunya adalah
teknologi interaksi manusia dan komputer yang sedang berkembang pesat
beberapa tahun terakhir ini. Untuk mewujudkan komunikasi antara manusia
dan komputer, komputer perlu mengenali, memahami, dan menanggapi
ucapan manusia. Pengenalan suara manusia (speech recognition) merupakan
salah satu komponen terpenting dalam komunikasi manusia dan komputer.
Dalam bahasa manusia, selain informasi linguistik, informasi paralinguistik
yang mengacu pada pesan implisit seperti keadaan emosional dari pembicara
juga disampaikan. Emosi manusia merupakan kondisi mental dan fisiologis,
yang tidak hanya mencerminkan suasana hati, tetapi juga kepribadian
manusia. Hal ini berkaitan dengan perasaan, pikiran, dan perilaku manusia.
Meskipun keadaan emosional yang disampaikan tidak mengubah konten
linguistik, emosi membawa informasi penting pada pembicara, seperti
keinginan, niat, dan tanggapannya terhadap dunia luar. Untuk mewujudkan
interaksi yang alami antara manusia dan komputer, komputer harus mampu
mengenali tidak hanya isi linguistik tetapi juga keadaan emosional yang
disampaikan dalam bahasa manusia sehingga tanggapan yang dipersonalisasi
dapat disampaikan dengan tepat dalam aplikasi interaksi manusia dan
komputer (Konar & Chakraborty, 2015: 216).
Menurut Cen et al. (dalam Konar & Chakraborty, 2015: 216),
pengenalan emosi manusia telah diimplementasikan pada banyak aplikasi di
berbagai bidang, seperti pembelajaran (e-learning), keamanan, obat-obatan,
dan hiburan. Namun, untuk memahami emosi berdasarkan suara bukanlah
tugas yang mudah karena tidak ada definisi dan model emosi yang tepat.
Menurut Krothapalli & Koolagudi (2013:2), ada lebih dari 300 emosi yang
UIN Syarif Hidayatullah Jakarta
2
UIN Syarif Hidayatullah Jakarta
diidentifikasi oleh para peneliti. Tetapi, tidak semuanya dialami dalam
kehidupan sehari-hari. Menurut Mower et al. (dalam Chakraborty et al.,
2017:12), terdapat empat emosi dasar yakni marah, senang, netral, dan sedih.
Pengenalan emosi berbasis suara bertujuan untuk mengidentifikasi
keadaan emosional manusia dari suaranya secara otomatis. Hal ini didasarkan
pada analisis mendalam dari mekanisme generasi sinyal suara, penggalian
beberapa fitur atau ciri yang berisi informasi emosional dari suara pembicara,
dan mengambil metode pengenalan pola yang khas, sistem pengenalan emosi
terdiri dari empat modul utama, yaitu emosi masukan, ekstraksi ciri,
klasifikasi, dan emosi keluaran. Banyak peneliti telah mengusulkan ciri suara
penting yang mengandung informasi mengenai emosi, seperti energi,
frekuensi, frekuensi pitch, frekuensi formant, dan beberapa ciri spektrum
seperti Linear Predictive Coefficients (LPC), Linear Prediction Cepstrum
Coefficients (LPCC), Mel-Frequency Cepstrum Coefficients ( MFCC), dan
turunan pertamanya. Selain itu, banyak peneliti telah mengeksplorasi
beberapa metode klasifikasi, seperti Jaringan Syaraf, Gaussian Mixture
Model (GMM), Hidden Markov Model (HMM), Maximum Likelihood
Bayesian Classifier (MLC), K-Nearest Neighbor (KNN), dan Support Vector
Machines (SVM) (Pan et al., 2012: 101-102).
Penelitian terdahulu menghasilkan tingkat keberhasilan 74% pada
pengenalan pola suara menggunakan ekstraksi LPC dan klasifikasi
backpropagation (Faradiba, 2017), tingkat keberhasilan 86,66% pada
pengenalan suara emosi menggunakan ekstraksi pitch, energi, dan formant
dengan klasifikasi HMM (Prasetio et al., 2017), tingkat keberhasilan 89%
pada pengenalan suara emosi menggunakan ekstraksi MFCC dan klasifikasi
backpropagation (Putra et al., 2019).
Dari uraian latar belakang di atas, penulis tertarik untuk melakukan
penelitian mengenai pengenalan emosi berdasarkan suara dengan
menggabungkan beberapa ekstraksi ciri menggunakan algoritma
Backpropagation. Adapun judul yang diangkat adalah “Implementasi
3
UIN Syarif Hidayatullah Jakarta
Algoritma Backpropagation Pada Pengenalan Emosi Berdasarkan Suara
Manusia”.
1.2. Rumusan Masalah
Rumusan masalah dari penelitian ini adalah bagaimana implementasi
algoritma backpropagation pada pengenalan emosi berdasarkan suara
manusia.
1.3. Batasan Masalah
Pada penelitian ini, penulis membatasi pembahasannya pada:
1. Metode pengumpulan data pada penelitian ini menggunakan studi pustaka
dan studi literatur.
2. Metode pengembangan sistem pada penelitian ini menggunakan metode
prototipe
3. Sistem dirancang menggunakan tools Matlab
4. Jenis emosi yang digunakan adalah marah, senang, netral, dan sedih.
5. Ciri yang diekstraksi adalah frekuensi, energi, pitch, dan formant
6. Metode pengenalan emosi berdasarkan suara yang digunakan adalah
Algoritma Backpropagation.
7. Data yang digunakan berasal dari rekaman suara pria yang diperoleh dari
Berlin Database of Emotional Speech.
1.4. Tujuan dan Manfaat Penelitian
1.4.1. Tujuan Penelitian
Tujuan dari penelitian ini adalah mengimplementasikan
algoritma backpropagation pada pengenalan emosi berdasarkan suara
manusia.
4
UIN Syarif Hidayatullah Jakarta
1.4.2. Manfaat Penelitian
a. Bagi Penulis
1. Dapat menerapkan Algoritma Backpropagation pada
pengenalan emosi berdasarkan suara.
2. Menambah wawasan penulis tentang interaksi manusia dan
komputer, khususnya di bidang pengenalan suara (speech
recognition).
3. Untuk memenuhi salah satu syarat dalam meraih gelar sarjana
dalam Fakultas Sains dan Teknologi jurusan Teknik Informatika
Universitas Islam Negeri Syarif Hidayatullah Jakarta.
b. Bagi Universitas
1. Menambah referensi literatur kepustakaan Universitas Islam
Negeri Syarif Hidayatullah Jakarta
2. Bahan masukan bagi mahasiswa Universitas Islam Negeri
Syarif Hidayatulladfrttttth Jakarta dalam pengembangan
penulisan atau penelitian lainnya terkait penulisan ini.
3. Mengetahui kemampuan mahasiswanya dalam menguasai ilmu
yang telah didapatkan di bangku perkuliahan.
c. Bagi Pengguna
1. Dalam pengimplementasiannya dapat dijadikan salah satu alat
komunikasi antara komputer dengan manusia yang didesain
untuk melayani pemiliknya.
1.5. Metodologi Penelitian
Metode penelitian yang penulis gunakan dalam penelitian skripsi ini
adalah sebagai berikut:
1.5.1. Metode Pengumpulan Data
Metode yang digunakan dalam pengumpulan data pada
penilitian ini adalah:
5
UIN Syarif Hidayatullah Jakarta
1. Studi Pustaka
Penulis melakukan studi pustaka sebagai bahan dalam
pembuatan skripsi. Pengumpulan data diambil dari sumber-
sumber media cetak maupun elektronik yang dapat dijadikan
sebagai acuan penelitian dan penulisan skripsi ini.
2. Studi Literatur
Penulis melakukan studi literatur beberapa jurnal terdahulu
yang berkaitan dengan pengenalan emosi berdasarkan suara,
ekstraksi ciri, dan juga mengenai algoritma backpropagation.
1.5.2. Metode Pengembangan Sistem
Metode pengembangan sistem yang digunakan penulis dalam
penelitian ini adalah metode Prototipe, tahapan-tahapannya adalah
sebagai berikut:
1. Komunikasi
2. Perancangan Cepat
3. Pemodelan Desain Cepat
4. Konstruksi Prototipe
5. Deployment Delivery and Feedback
1.6. Sistematika Penulisan
Sistematika penulisan pada skripsi ini disusun ke dalam lima bab,
secara singkat akan diuraikan sebagai berikut :
BAB I PENDAHULUAN
Pada bab ini menjelaskan tentang latar belakang, rumusan masalah,
batasan masalah, tujuan dan manfaat penelitian, dan sistematika
penulisan.
BAB II LANDASAN TEORI
Pada bab ini akan diuraikan teori-teori yang digunakan dalam
pengembangan aplikasi dan relevan dengan permasalah yang ada.
6
UIN Syarif Hidayatullah Jakarta
BAB III METODOLOGI PENELITIAN
Bab ini akan dijabarkan metodologi yang digunakan dalam
menyusun skripsi ini, seperti metodologi pengumpulan data dan
metodologi pengembangan sistem.
BAB IV PERANCANGAN SISTEM DAN IMPLEMENTASI
Pada bab ini menjelaskan mengenai pembahasan dan pemaparan
mengenai langkah-langkah perancangan hingga implementasi
pembangunan sistem berdasarkan metode prototipe
BAB V ANALISIS DAN PENGUJIAN SISTEM
Bab ini menjabarkan pengujian dan evaluasi terhadap sistem yang
telah dibangun sehingga mendapatkan hasil pengujian yang sesuai
dengan tujuan yang telah ditentukan
BAB VI PENUTUP
Bab ini berisi tentang kesimpulan dari penelitian yang dilakukan dan
saran untuk pengembangan sistem ke depannya agar menjadi lebih
baik lagi.
7
UIN Syarif Hidayatullah Jakarta
BAB II
LANDASAN TEORI
2.1. Sinyal Suara Manusia
Speech (wicara) adalah modalitas utama komunikasi dengan cara yang
alami dan paling efektif untuk bertukar informasi antar manusia (Abhang et
al., 2016:13). Cara merepresentasikan wicara sendiri dapat melalui sinyal atau
bentuk gelombang yang membawa pesan atau informasi. Sinyal wicara
ditransmisikan, disimpan, dan diproses dengan berbagai cara dalam sistem
komunikasi.
Wicara yang dihasilkan oleh manusia adalah dalam bentuk sinyal
analog yang terus berubah seiring berjalannya waktu. Untuk pemrosesan
sinyal wicara menjadi digital, kita dapat mengubah sinyal wicara analog
menjadi digital. Bentuk yang paling mudah untuk merepresentasikan sinyal
wicara adalah dengan jumlah sinusoid, karena mengarah ke solusi mudah
untuk masalah seperti estimasi formant, estimasi pitch, dan lain-lain (Anne et
al., 2015:1).
Sistem komunikasi ucapan atau wicara manusia menghasilkan gagasan
(urutan kata) yang dibuat di dalam otak pembicara. Urutan kata-kata ini
disampaikan oleh generator teksnya. Sistem vokal manusia pada umumnya
dimodelkan oleh generator wicara. Generator wicara mengubah urutan kata
menjadi sinyal wicara dan ditransfer ke pendengar melalui udara atau dengan
kata lain wicara dihasilkan oleh gelombang tekanan udara yang berasal dari
mulut dan lubang hidung pembicara. Sedangkan disisi pendengar, sistem
pengdengaran manusia menerima sinyal akustik ini dan otak pendengar
memulai pemrosesan sinyal untuk memahami isinya. Pengenal ucapan atau
wicara yang dimodelkan ole dekoder ucapan menerjemakan sinyal akustik ke
dalam urutan kata. Jadi, produksi wicara dan persepsi wicara berada dalam
proses terbalik dalam aplikasi pengenalan wicara (Anne et al., 2015:2).
7
8
UIN Syarif Hidayatullah Jakarta
Ada berbagai cara untuk mengklasifikasikan bagian-bagian atau
komponen sinyal suara. Salah satu cara yang sederhana adalah dengan cara
mengklasifikasikannya menjadi tiga keadaan yang berbeda, yaitu:
1. Silence (S), keadaan pada saat tidak ada ucapan yang diucapkan.
2. Unvoiced (U), keadaan pada saat vocal cord tidak melakukan vibrasi,
sehingga suara yang dihasilkan bersifat tidak periodik atau bersifat
random.
3. Voiced (V), keadaan pada saat terjadiya vibrasi pada vocal cord,
sehingga menggerakkan udara ke kerongkongan melalui mekanisme
akustik sampai keluar dari mulut dan menghasilkan sinyal wicara
(Rabiner & Juang, 1993: 18).
Sinyal suara mentransmisikan dua pesan utama. Pertama, berisi pesan
eksplisit atau informasi mengenai sesuatu atau tidak sama sekali. Kedua,
berisi pesan implisit mengenai pembicara, seperti usia, jenis kelamin, emosi,
kondisi kesehatan, dan lain-lain.
2.2. Teori Emosi
Emosi secara instrinsik terhubung dengan cara orang berinteraksi satu
sama lain. Emosi memberikan pengaruh yang besar dalam menentukan
perilaku manusia. Manusia dapat membaca keadaan emosional manusia lain
dan berperilaku dengan cara terbaik untuk meningkatkan komunikasi mereka
pada saat itu. Hal ini dikarenakan emosi dapat dikenali melalui kata-kata,
intonasi suara, ekspresi wajah, dan bahasa tubuh.
Emosi telah dipelajari dalam beberapa disiplin ilmu, seperti fisiologi,
psikologi, ilmu bicara, ilmu saraf, psikiatri, komunikasi, dan sebagainya.
Akibatnya, perspektif yang khas pada konsep emosi telah muncul, sesuai
dengan kompleksitas dan variasi emosi. Emosi manusia dapat dilihat sebagai
pengalaman kompleks dari kesadaran (psikologi), reaksi tubuh (fisiologi),
dan perilaku (Abhang et al., 2016:1-2).
9
UIN Syarif Hidayatullah Jakarta
Perubahan psikologi dan fisiologi yang disebabkan karena pengalaman
emosional menyebabkan tindakan tertentu. Wicara adalah salah satu hasil
penting dari keadaan emosi manusia. Sinyal wicara dihasilkan dari kontribusi
sistem vocal tract yang digerakkan sinyal sumber eksitasi. Oleh karena itu,
informasi spesifik suara dapat diekstraksi dari sistem vocat tract dan
karakteristik sumber eksitasi. Karakteristik emosi dari wicara dapat dikaitkan
dengan:
1. Karakteristik sumber eksitasi
2. Urutan bentuk sistem vocal tract saat mengeluarkan emosi yang
berbeda
3. Karakteristik supra-segmental (durasi, pitch, dan energi)
4. Informasi linguistik (Krothapalli & Koolagudi, 2013:3)
Pada umumnya emosi diungkapkan dengan cara positif dan negatif.
Emosi positif seperti kebahagiaan (happiness), kegembiraan (excitement),
sukacita (joy), dan lain-lain. Sedangkan emosi negatif seperti kesedihan,
kemarahan, ketakutan, dan lain-lain. Menurut Mower et al. (dalam
Chakraborty et al., 2017:12), emosi dasar manusia terdiri dari empat, yaitu
marah, senang, netral, dan sedih.
2.3. Pengenalan Emosi Berdasarkan Suara
Perubahan psikologis yang intens karena lingkungan di mana individu
bertahan dapat menimbulkan perasaan marah, bosan, jijik, takut, dan bahagia
yang disebut sebagai emosi. Konten linguistik adalah isyarat penting untuk
pengenalan emosi manusia. Ketika informasi linguistik tidak tersedia,
menjadi lebih sulit untuk menentukan emosi yang tepat. Manifestasi emosi
dalam berbicara juga tergantung pada pembicara. Pilihan kata yang
digunakan oleh pembicara merupakan isyarat penting untuk pengenalan
emosi.
Manusia mengenali emosi seorang pembicara dari ekspresi wajah dan
ciri-ciri ucapan tertentu. Saat berbicara, manusia tidak hanya menyampaikan
pesan, tetapi juga informasi mengenai pembicara, bahasa, dan emosi yang
10
UIN Syarif Hidayatullah Jakarta
mendasarinya. Kualitas suara manusia ini dapat digunakan untuk mengenali
emosi bahkan tanpa pengetahuan bahasa yang digunakan untuk
menyampaikannya. Analisis suara emosional telah menunjukkan bahwa
parameter prosodik seperti pitch dan durasi memainkan peran penting dalam
manifestasi emosi. Pitch dalam suara berisi informasi mengenai emosi,
karena tergantung pada ketegangan lipatan vokal dan tekanan udara
subglottal yang bervariasi dengan emosi. Untuk mengilustrasikan efek pitch,
kontur F0 untuk dua emosi yang berbeda – kebahagiaan dan kebosanan,
adalah sebagai berikut (Mary, 2019:15-16):
Gambar 2.1. Ilustrasi plot F0 untuk emosi bahagia dan bosan
Sumber: (Mary, 2019:17)
2.4. Preprocessing
Sinyal ucapan biasanya diproses terlebih dahulu sebelum ciri
diekstraksi untuk meningkatkan akurasi dan efisiensi proses ekstraksi ciri
(Anne et al., 2015:18).
11
UIN Syarif Hidayatullah Jakarta
2.4.1. Sampling
Gambar 2.2. Ilustrasi proses sampling pada domain waktu
Sumber: (Owens, 1993:18)
Proses sampling sinyal diilustrasikan pada gambar 2.2.
Pengambilan sampel dilakukan pada interval waktu T yang berbeda,
di mana ini dikenal sebagai periode sampel. Jumlah sampel per detik
atau frekuensi sampling f, pada Hz sama dengan reciprocal dari
periode sampel, yaitu fs = 1/T. Nilai frekuensi sampling digunakan
dalam situasi tertentu yang ditentukan oleh teorema sampling
Nyquist, yang menyatakan bahwa jika komponen frekuensi tertinggi
dalam sinyal yaitu fh Hz, maka nilai frekuensi sampling minimum dua
kali nilai ini ( fs ≥ 2 fh ), agar sinyal dapat dibangun kembali dengan
benar dari sampel digital. Dengan kata lain, jumlah minimum sampel
yang diperlukan untuk mewakili sinusoid adalah 2 sampel per siklus
seperti yang diilustrasikan pada gambar 2.3 (a). Jika sampel lebih
sedikit digunakan maka fenomena yang dikenal sebagai aliasing
terjadi di mana sinyal frekuensi tertentu dapat muncul sebagai
frekuensi yang lebih rendah pada saat konstruksi ulang. Ini
diilustrasikan pada gambar 2.3 (b). Garis tebal menunjukkan sinusoid
12
UIN Syarif Hidayatullah Jakarta
yang diambil sampelnya kurang dari tingkat Nyquist. Jika sinyal harus
dibangun kembali dari sampel, maka sinyal frekuensi rendah yang
ditunjukkan oleh garis putus-putus dapat terjadi. Oleh karena itu,
komponen mengambil identitas yang berbeda dan merupakan alias
dari komponen yang benar. Jika aliasing terjadi dalam sinyal
kompleks seperti wicara, komponen frekuensi yang tidak diinginkan
dimasukkan yang mana mendistorsi sinyal.
Gambar 2.3. Ilustrasi teorema sampling Nyquist
Sumber: (Owens, 1993:18)
Untuk sinyal kompleks, termasuk wicara (speech), komponen
frekuensi tinggi tidak diketahui secara jelas dan oleh karena itu perlu
untuk membatasi sinyal dengan memfilternya sebelum digitasi
(Owens, 1993:18). Dalam wicara (speech), rentang frekuensi yang
relevan yaitu dari 50 Hz hingga 6 KHz (Eyben, 2016:18).
13
UIN Syarif Hidayatullah Jakarta
2.5. Ekstraksi Ciri
Modul penting dalam desain sistem pengenalan suara emosi adalah
pemilihan fitur atau ciri yang paling baik untuk mengklasifikasikan emosi.
Ciri-ciri ini membedakan emosi dari berbagai kategori pada sampel suara.
2.5.1. Frekuensi
Frekuensi adalah banyaknya sesuatu yang terjadi setiap
detiknya. Dalam kajian getaran, frekuensi dapat diartikan sebagai
banyaknya getaran yang terjadi dalam satu detik. Sedangkan dalam
kajian gelombang, frekuensi dapat diartikan sebagai banyaknya
gelombang yang terjadi setiap satu sekon. Satuan yang digunakan
untuk mengukur frekuensi adalah 1/s yang disebut juga Hertz
disingkat Hz, yang diambil dari nama fisikawan Jerman Heinrich
Rudolf Hertz (1857-1894). Satuan frekuensi sering juga dituliskan
dengan cps (cycle per second) (Abhang et al., 2016: 50).
Salah satu cara untuk mentransformasi sinyal dari domain waktu
ke dalam domain frekuensi adalah dengan menggunakan Discrete
Fourier Transform (DFT).
𝑥(𝑘) = ∑ 𝑥(𝑛). 𝑒−𝑗2𝜋(𝑘
𝑁)𝑛𝑁−1
𝑛=0
Persamaan di atas menyatakan bahwa sinyal akan periodik pada
setiap nilai. Untuk mengoptimalkan proses kompurasi, DFT bias
dimodifikasi dengan satu algoritma yang sering dikenal sebagai Fast
Fourier Transform (FFT). Dengan FFT proses komputasi bias
direduksi dari N2 menjadi N log2 N. Misalnya dengan menggunakan
DFT kita akan melakukan transformasi sebanyak N=1024 titik, maka
kita memerlukan perkalian sebanyak N2 = 1.048.576. Sedangkan
dengan menggunakan FFT perkalian yang diperlukan sebanyak N log2
N = 5120 perkalian. Pada gambar 2.4 ditunjukkan sebuah hasil proses
FFT untuk kalimat “a-i-u-e-o” (Fadlisyah et al., 2013:10-11).
14
UIN Syarif Hidayatullah Jakarta
Gambar 2.4. Spektral Frekuensi kalimat “a-i-u-e-o”
Sumber: (Fadlisyah et al., 2013:12)
2.5.2. Energi
Energi adalah ciri dasar dan paling penting dalam sinyal suara.
Energi memiliki peran penting dalam kinerja pengenalan emosi
berbasis model akustik. Energi pada sinyal suara berasal dari udara
yang ditimbulkan pada paru-paru diteruskan melewati kerongkongan.
Aliran udara ini akan terdorong masuk ke suatu bagian dari saluran
vokal yang disebut pita suara.
Kecepatan aliran udara dan perlakuan pita suara akan
menentukan jenis suara yang dihasilkan, bila kecepatan aliran udara
dari kerongkongan tidak terlalu besar dan tegangan pita suara diatur
sedemikian rupa sehingga bergetar bebas, maka yang tercipta adalah
suara yang voiced. Suara yang unvoiced terjadi bila kecepatan aliran
udara yang terjadi dari kerongkongan cukup besar sehingga terjadi
turbulensi aliran udara, pita suara tidak bergetar secara periodik
(Abhang et al., 2016:53–55).
15
UIN Syarif Hidayatullah Jakarta
Kepadatan spektral energi menggambarkan distribusi kekuatan
sinyal bicara dengan frekuensi dan juga menunjukkan kekuatan
(energi sinyal kuat atau lemah pada frekuensi berbeda) dari sinyal
sebagai fungsi frekuensi. Energi dalam sinyal ucapan x(n) dihitung
sebagai (Konar & Chakraborty, 2015:7):
𝐸𝑥 = ∑ 𝑥(𝑛)2𝑁−1𝑛=0
di mana N merupakan jumlah sampel dalam satu frame.
2.5.3. Pitch
Pitch adalah frekuensi fundamental dari sinyal audio (Anne et
al., 2015:12). Nilai pitch berisi informasi khusus pembicaranya.
Variasi pitch membawa sinyal intonasi yang terkait dengan ritme
bicara, cara bicara, emosi, dan aksen. Gender adalah salah satu faktor
yang menyampaikan bagian dari karakterisasi saluran vokal: nada
rata-rata untuk wanita adalah sekitar 200 Hz, dan untuk pria adalah
sekitar 110 Hz. Dalam variasai pitch, sinyal emosi dalam suara adalah
salah satu indikator, misalnya, suara seperti kegembiraan, stres dapat
dengan mudah dibenarkan. Variasi pitch seringkali berkorelasi
dengan kenyaringan dalam berbicara; bahagia, ketakutan, dan banyak
emosi lainnya ditandai oleh fluktuasi nada suara (Abhang et al.,
2016:57). Menurut (Anne et al., 2015:12-13), pitch dapat
didefinisikan sebagai laju pengulangan dari sinyal yang kompleks,
yaitu laju di mana puncak dalam fungsi autokorelasi terjadi. Fungsi
autokorelasi untuk ukuran durasi tertentu pada sinyal wicara
menunjukkan bagaimana sinyal itu berkolerasi dengan dirinya sendiri
pada suatu rentang waktu delay berbeda. Fungsi autokorelasi
digunakan untuk memperkirakan pitch, langsung dari bentuk
gelombang. Fungsi xcorr digunakan untuk memperkirakan urutan
korelasi silang statistik dari proses acak dengan rumus sebagai
berikut:
16
UIN Syarif Hidayatullah Jakarta
𝑅(𝑚) = 𝐸(𝑥(𝑛 + 𝑚). 𝑥(𝑛)) = 𝐸(𝑥(𝑛). 𝑥(𝑛 − 𝑚))
Gambar 2.5. Bentuk gelombang dan fungsi autokorelasi pada estimasi
pitch
Sumber: (Anne et al., 2015:14)
2.5.4. Formant
Pada saat aliran udara masuk pada saluran vokal, aliran udara
mengalami suatu penapisan. Dalam hal ini seolah-olah terjadi
resonansi seperti pada pipa organa. Frekuensi resonansi yang terjadi
ditentukan oleh bentuk dan panjang saluran vokal. Frekuensi
resonansi ini yang biasa disebut dengan frekuensi formant.
Seperti resonansi pada pipa organa, di mana frekuensi resonansi
yang terjadi merupakan kelipatan dari panjang pipa organa tersebut,
maka formant-formant yang terjadi akibat penapisan pada saluran
vokal juga mendekati kelipatan panjang saluran vokal, selain
dipengaruhi oleh bentuknya. Dengan kata lain, frekuensi-frekuensi
17
UIN Syarif Hidayatullah Jakarta
formant yang timbul merupakan fungsi dari bentuk dan panjang
saluran vokal formant pertama (F1) yang merupakan frekuensi dasar.
F2 merupakan frekuensi resonansi kedua dan seterusnya.
Estimasi pada nilai frekuensi formant secara umum lebih sulit
dibanding estimasi frekuensi fundamental. Masalahnya adalah bahwa
frekuensi formant merupakan sifat dari sistem saluran vokal dan harus
diperoleh dari ekstraksi sinyal suara. bentuk spektral pada saluran
vokal secara kuat berkaitan dengan pengamatan spektral envelope
(selubung spektral), yang mana kita tidak akan mampu menjamin
bahwa semua saluran suara yang beresonansi akan ditemukan
puncakpuncak di dalam selubung spektral yang kita amati, tetapi bisa
juga terjadi sebaliknya di mana semua puncak-puncak yang muncul
pada selubung spektral disebabkan oleh resonansi saluran vokal
resonances.
Salah satu cara untuk mendapatkan frekuensi formant adalah
dengan menghitung akar polinomial urutan ke-p. Akar kompleks
polinomial dengan koefisien nyata dihitung dengan menggunakan
beberapa algoritma standar. Salah satunya adalah dengan menemukan
puncak spektrum yang dihaluskan yang diperoleh melalui analisis
LPC. Keuntungan metode ini adalah kita selalu dapat menghitung
puncak dan lebih efisien daripada mengekstraksi akar kompleks dari
polinomial. Prinsip dasar dari pemodelan sinyal dengan menggunakan
LPC adalah bahwa contoh sinyal ucapan s(n) pada waktu ke-n dapat
diperkirakan sebagai kombinasi linier dari p sampel sinyal ucapan
sebelumnya yaitu (Anne et al., 2015:24-25):
𝑠(𝑛) ≈ 𝑎1𝑠(𝑛 − 1) + 𝑎2𝑠(𝑛 − 2) + ⋯ + 𝑎𝑝𝑠(𝑛 − 𝑝)
Dengan koefisien a1, a2, ...., ap diasumsikan bernilai konstan selama
frame analisis ucapan .
18
UIN Syarif Hidayatullah Jakarta
2.6. Jaringan Syaraf Tiruan
Jaringan syaraf tiruan (JST) adalah salah satu representasi buatan dari
otak manusia yang selalu mencoba untuk mensimulasikan proses
pembelajaran pada otak manusia tersebut. Istilah buatan ini digunakan karena
jaringan syaraf diimplementasikan dengan menggunakan komputer yang
mampu menyelesaikan sejumlah proses perhitungan selama proses
pembelajaran(Kusumadewi, 2003: 207). Menurut Siang (2009:2-3), JST
dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi,
dengan asumsi bahwa:
• Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).
• Sinyal dikirimkan diantara neuron-neuron melalui
penghubungpenghubung.
• Penghubung antar neuron memiliki bobot yang akan memperkuat atau
memperlemah sinyal.
• Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi
(biasanya bukan fungsi linier) yang dikenakan pada jumlah input yang
diterima. Besarnya output ini selanjutnya dibandingkan dengan suatu
batas ambang.
Sedangkan JST ditentukan oleh 3 hal:
• Pola hubungan antar neuron (disebut arsitektur jaringan).
• Metode untuk menentukan bobot penghubung (disebut metode
training/learning/algoritma).
• Fungi aktivasi.
2.6.1. Komponen Jaringan Syaraf Tiruan
Ada beberapa tipe jaringan syaraf tiruan, namun demikian,
hampir semuanya memiliki komponen-komponen yang sama. Seperti
halnya otak manusia, jaringan syaraf tiruan juga terdiri dari beberapa
neuron dan terdapat hubungan antar neuron tersebut. Neuron-neuron
19
UIN Syarif Hidayatullah Jakarta
tersebut akan mentransformasikan informasi yang diterima melalui
sambungan keluarnya menuju ke neuron-neuron yang lain. Pada
jaringan syaraf tiruan, hubungan ini dikenal dengan bobot. Informasi
tersebut disimpan pada suatu nilai tertentu pada bobot tersebut.
Gambar 2.5 menunjukkan struktur neuron pada jaringan syaraf.
Gambar 2.6. Susunan Neuron Jaringan Syaraf Tiruan
Sumber: (Kusumadewi, 2003:210)
Jika dilihat, neuron buatan ini sebenarnya mirip dengan sel
neuron biologis. Neuron-neuron buatan tersebut bekerja dengan cara
yang sama pula dengan neuron-neuron biologis. Informasi (disebut
dengan: input) akan dikirim ke neuron dengan bobot kedatangan
tertentu. Input ini akan diproses oleh suatu fungsi perambatan yang
akan menjumlahkan nilai-nilai semua bobot yang datang. Hasil
penjumlahan ini kemudian akan dibandingkan dengan suatu nilai
ambang (threshold) tertentu melalui fungsi aktivasi setiap neuron.
Apabila input tersebut melewati suatu nilai ambang tertentu, maka
neuron tersebut akan diaktifkan, tapi kalau tidak, maka neuron
tersebut tidak akan diaktifkan. Apabila neuron tersebut diaktifkan,
maka neuron tersebut akan mengirimkan output melalui bobot-bobot
outputnya ke semua neuron yang berhubungan. Demikian seterusnya.
Pada jaringan syaraf, neuron-neuron akan dikumpulkan dalam
lapisan-lapisan (layer) yang disebut dengan lapisan neuron (neuron
layers). Biasanya neuron-neuron pada satu lapisan akan dihubungkan
dengan lapisan-lapisan, mulai dari lapisan input sampai ke lapisan
20
UIN Syarif Hidayatullah Jakarta
tersembunyi (hidden layer). Tergantung pada algoritma
pembelajarannya, bisa jadi informasi tersebut akan dirambatkan
mundur pada jaringan. Gambar 2.6 menunjukkan jaringan syaraf
dengan 3 lapisan.
Gambar 2.7. Jaringan Syaraf dengan 3 lapisan
Sumber: (Kusumadewi, 2003:211)
Gambar 2.7 bukanlah struktur umum jaringan syaraf. Beberapa
jaringan syaraf ada juga yang tidak memiliki lapisan tersembunyi, dan
ada juga jaringan dimana neuron-neuronnya disusun dalam bentuk
matriks (Kusumadewi, 2003:210-211).
Menurut Siang (2009:29-30), hingga kini terdapat lebih dari 20
model jaringan syaraf tiruan. Masing-masing model menggunakan
arsitektur, fungsi aktivasi, dan perhitungan yang berbeda-beda dalam
prosesnya. Berdasarkan strategi pelatihan, model jaringan dibagi
menjadi:
21
UIN Syarif Hidayatullah Jakarta
1. Pelatihan dengan supervisi
Contoh model yang masuk kategori ini antara lain model
Hebbian, Perceptron, ADALINE, Boltzman, Hopfield,
Backpropagation, dll.
2. Pelatihan tanpa supervisi
Contoh model yang masuk dalam kategori ini antara lain model
Competitive, Hebbian, Kohonen, LVQ (Learning Vector
Quantization), Neocognitron, dll.
2.6.2. Fungsi Aktivasi
Dalam jaringan syaraf tiruan, fungsi aktivasi dipakai untuk
menentukan keluaran suatu neuron. Argumen fungsi aktivasi adalah
net masukan (kombinasi linier masukan dan bobotnya). Jika
𝑛et = ∑𝑥𝑖𝑤𝑖, maka fungsi aktivasinya 𝑓(𝑛et) = 𝑓( ∑𝑥𝑖𝑤𝑖) (Siang,
2009: 26).
Beberapa fungsi aktivasi yang sering dipakai adalah sebagai
berikut:
1. Fungsi threshold (batas ambang)
𝑓(𝑥) = {1 𝑗𝑖𝑘𝑎 𝑥 ≥ 𝑎0 𝑗𝑖𝑘𝑎 𝑥 < 𝑎
Untuk beberapa kasus, fungsi threshold yang dibawa, tidak
berharga 0 atau 1, tapi berharga -1 atau 1 (sering disebut threshold
bipolar). Jadi,
𝑓(𝑥) = {1 𝑗𝑖𝑘𝑎 𝑥 ≥ 𝑎−1 𝑗𝑖𝑘𝑎 𝑥 < 𝑎
2. Fungsi sigmoid
𝑓(𝑥) =1
1+𝑒−𝑥
Fungsi sigmoid sering dipakai karena nilai fungsinya yang
terletak antara 0 dan 1 dapat diturunkan dengan mudah.
𝑓′(𝑥) = 𝑓(𝑥)(1 − 𝑓(𝑥))
3. Fugsi identitas
𝑓(𝑥) = 𝑥
22
UIN Syarif Hidayatullah Jakarta
Fungsi identitas sering dipakai apabila kita menginginkan
keluaran jaringan berupa sembarang bilangan riil (bukan hanya
pada range [0,1] atau [-1,1].
(Siang, 2009:26)
2.7. Algoritma Backpropagation
Backpropagation merupakan metode pembelajaran yang terawasi dan
biasanya digunakan oleh perceptron dengan banyak lapisan untuk mengubah
bobot-bobot yang terhubung dengan neuron-neuron yang ada pada lapisan
tersembunyinya. Metode backpropagation menggunakan error output untuk
mengubah nilai bobot-bobotnya dalam arah mundur (backward). Untuk
mendapatkan eror ini, tahap perambatan maju (forward propagation) harus
dikerjakan terlebih dahulu (Kusumadewi, 2003:236).
2.7.1. Arsitektur Backpropagation
Menurut (Siang, 2009:98), backpropagation memiliki beberapa
unit yang ada dalam satu atau lebih hidden layer. Gambar 2.8 adalah
arsitektur backpropagation dengan n buah masukan (ditambah sebuah
bias), sebuah hidden layer yang terdiri p unit (ditambah sebuah bias),
serta m buah keluaran.
vij merupakan bobot garis dari unit masukan xi ke unit hidden
layer zj (vj0 merupakan bobot garis yang menghubungkan bias di unit
masukan ke unit hidden layer zj). wk j merupakan bobot dari unit
hidden layer zj ke unit keluaran yk (wk0 merupakan bobot dari bias di
hidden layer ke unit keluaran zk).
23
UIN Syarif Hidayatullah Jakarta
Gambar 2.8. Arsitektur Backpropagation dengan n buah masukan
Sumber: (Siang, 2009:98)
2.7.2. Fungsi Aktivasi
Dalam backpropagation, fungsi aktivasi yang dipakai harus
memenuhi beberapa syarat yaitu: kontinu, terdiferensial dengan
mudah dan merupakan fungsi yang tidak turun. Salah satu fungsi yang
memenuhi ketiga syarat tersebut sehingga sering dipakai adalah
fungsi sigmoid biner yang memiliki range (0,1) (Siang, 2009: 99-100).
𝑓(𝑥) =1
1+𝑒−𝑥 dengan turunan 𝑓′(𝑥) = 𝑓(𝑥)(1 − 𝑓(𝑥))
Grafik fungsinya tampak pada gambar 2.8.
24
UIN Syarif Hidayatullah Jakarta
Gambar 2.9. Grafik fungsi sigmoid biner
Sumber: (Siang, 2009:99)
Fungsi lain yang sering dipakai adalah fungsi sigmoid bipolar
yang bentuk fungsinya miri dengan fungsi sigmoid biner, tapi dengan
range (-1,1).
𝑓(𝑥) =1
1+𝑒−𝑥 − 1 dengan turunan 𝑓′(𝑥) =(1+𝑓(𝑥))(1−𝑓(𝑥))
2
Grafik fungsinya tampak pada gambar 2.9.
Gambar 2.10. Grafik fungsi sigmoid bipolar
Sumber: (Siang, 2009:100)
Fungsi sigmoid memiliki nilai maksimum = 1. Maka untuk pola
yang targetnya > 1, pola masukan dan keluaran harus terlebih dahulu
ditransformasi sehingga semua polanya memiliki range yang sama
seperti fungsi sigmoid yang dipakai. Alternatif lain adalah
25
UIN Syarif Hidayatullah Jakarta
menggunakan fungsi aktivasi sigmoid hanya pada layar yang bukan
layar keluaran. Pada layar keluaran, fungsi aktivasi yang dipakai
adalah fungsi identitas: f(x) = x.
2.7.3. Pelatihan Backpropagation
Pelatihan backpropagation meliputi 3 fase. Fase pertama adalah
fase maju. Pola masukan dihitung maju mulai dari layar masukan
hingga layar keluaran menggunakan fungsi aktivasi yang ditentukan.
Fase kedua adala fase mundur. Selisih antara keluaran jaringan dengan
target yang diinginkan merupakan kesalahan yang terjadi. Kesalahan
tersebut dipropagasikan mundur, dimulai dari garis yang berhubungan
langsung dengan unit-unit di layar keluaran. Fase ketiga adalah
modifikasi bobot untuk menurunkan kesalahan yang terjadi (Siang,
2009:100).
Algoritma pelatihan untuk jaringan dengan satu layar
tersembunyi (dengan fungsi aktivasi sigmoid biner) adalah sebagai
berikut:
Langkah 0: Inisialisasi semua bobot dengan bilangan acak kecil
Langkah 1: Jika kondisi penghentian belum terpenuhi, lakukan
langkah 2-9
Langkah 2: Untuk setiap pasang data pelatihan, lakukan langkah 3-8.
Fase I : Propagasi Maju
Langkah 3: Tiap unit masukan menerima sinyal dan meneruskannya
ke unit tersembunyi di atasnya.
Langkah 4: Hitung semua keluaran di unit tersembunyi zj (j = 1,
2,..,p).
𝑧_𝑛𝑒𝑡𝑗 = 𝑣𝑗0 + ∑ 𝑥𝑖𝑣𝑗𝑖𝑛𝑖=1
𝑧𝑗 = 𝑓(𝑧_𝑛𝑒𝑡𝑗) =1
1+𝑒−𝑦_𝑛𝑒𝑡𝑗
26
UIN Syarif Hidayatullah Jakarta
Langkah 5: Hitung semua keluaran jaringan di unit yk (k = 1, 2,...,m).
𝑧_𝑛𝑒𝑡𝑘 = 𝑤𝑘0 + ∑ 𝑧𝑗𝑤𝑘𝑗𝑝𝑗=1
𝑧𝑗 = 𝑓(𝑧_𝑛𝑒𝑡𝑗) =1
1+𝑒−𝑦_𝑛𝑒𝑡𝑘
Fase II : Propagasi Mundur
Langkah 6: Hitung faktor δ unit keluaran berdasarkan kesalahan
setiap unit keluaran yk (k = 1,2,...,m).
𝛿𝑘 = (𝑡𝑘 − 𝑦𝑘)𝑓′(𝑦_𝑛𝑒𝑡𝑘) = (𝑡𝑘 − 𝑦𝑘)𝑦𝑘(1 − 𝑦𝑘)
δk merupakan unit kesalahan yang akan dipakai dalam perubahan
bobot layar di bawahnya (langkah 7).
Hitung suku perubahan bobot wkj (yang akan dipakai nanti untuk
merubah bobot wkj) dengan laju percepatan α.
∆𝑤𝑗𝑘 = 𝛼𝛿𝑘𝑧𝑗; 𝑘 = 1,2, … . , 𝑚; 𝑗 = 0,1, … , 𝑝
Langkah 7: Hitung faktor δ unit tersembunyi berdasarkan kesalahan
di setiap unit tersembunyi zj (j = 1, 2,...,p).
𝛿_𝑛𝑒𝑡𝑗 = ∑ 𝛿𝑘𝑤𝑘𝑗𝑚𝑘=1
Faktor δ unit tersembunyi :
𝛿𝑗 = 𝛿_𝑛𝑒𝑡𝑗𝑓′(𝑧_𝑛𝑒𝑡𝑗) = 𝛿_𝑛𝑒𝑡𝑗𝑧𝑗(1 − 𝑧𝑗)
Hitung suku perubahan bobot vji (yang akan dipakai nanti untuk
merubah bobot vji ).
∆𝑣𝑗𝑖 = 𝛼𝛿𝑗𝑥𝑖; 𝑗 = 1,2, … . , 𝑝; 𝑖 = 0,1, … , 𝑛
Fase III : Perubahan Bobot
Langkah 8: Hitung semua perubahan bobot
Perubahan bobot garis yang menuju ke unit keluaran:
𝑤𝑘𝑗 = 𝑤𝑘𝑗(𝑙𝑎𝑚𝑎) + ∆𝑤𝑘𝑗 (𝑘 = 1,2, … . , 𝑚; 𝑗 = 0,1, … , 𝑝)
Perubahan bobot garis yang menuju ke unit tersembunyi:
𝑣𝑗𝑖 = 𝑣𝑗𝑖(𝑙𝑎𝑚𝑎) + ∆𝑣𝑗𝑖 (𝑗 = 1,2, … . , 𝑝; 𝑖 = 0,1, … , 𝑛)
Setelah pelatihan selesai dilakukan, jaringan dapat dipakai
untuk pengenalan pola. Dalam hal ini, hanya propagasi maju (langkah
27
UIN Syarif Hidayatullah Jakarta
4 dan 5) saja yang dipakai untuk menentukan keluaran jaringan.
Apabila fungsi aktivasi yang dipakai bukan sigmoid biner, maka
langkah 4 dan 5 harus disesuaikan. Demikian juga dengan turunannya
pada langkah 6 dan 7 (Siang, 2009:102-104).
2.8. Metode Prototipe
Prototipe adalah bagian dari produk yang mengekspresikan logika
maupun fisik antarmuka eksternal yang ditampilkan. Konsumen potensial
menggunakan prototipe dan menyediakan masukan untuk tim pengembang
sebelum pengembang skala besar dimulai. Melihat dan mempercayai menjadi
hal diharapkan untuk dicapai dalam prototipe. Dengan menggunakan
pendekatan ini, konsumen dan tim pengembang dapat mengklarifikasi
kebutuhan dan interpretasi mereka (Simarmata, 2010:62).
Gambar 2.11. Pendekatan Prototipe
Sumber: (Pressman & Maxim, 2015: 46)
Gambar di atas menunjukkan pendekatan prototipe pada umumnya
melibatkan beberapa langkah berikut:
1. Mengumpulkan dan menganalisis kebutuhan,
2. melakukan perancangan cepat,
28
UIN Syarif Hidayatullah Jakarta
3. membangun sebuah prototipe,
4. evaluasi dilakukan oleh konsumen atas prototipe,
5. perubahan rancangan dan prototipe,
6. apabila pelanggan kecewa dengan prototipe yang telah dibangun, ulangi
langkah ke-5,
7. apabila pelanggan puas terhadap prototipe yang telah dibangun,
pengembangan produk berskala besar dapat dimulai (Simarmata,
2010:62).
Prototipe cocok digunakan untuk menjabarkan kebutuhan konsumen
secara lebih detail karena konsumen sering kali kesulitan menyampaikan
kebutuhannya secara detail tanpa melihat gambaran yang jelas (S. &
Shalahuddin, 2011:31)
2.9. Matlab
Matlab merupakan perangkat lunak yang cocok dipakai sebagai alat
komputasi yang melibatkan penggunaan matriks dan vektor. Fungsi-fungsi
dalam toolbox Matlab dibuat untuk memudahkan perhitungan tersebut.
Sebagai contoh, matlab dapat dengan mudah dipakai untuk menyelesaikan
permasalahan linier, program linier yang simpleks, hingga sistem yang
kompleks seperti peramalan runtun waktu (time series), pengolahan citra, dll
(Siang, 2009:151).
2.10. Teknik Sampling
Dalam penelitian, populasi digunakan untuk menyebutkan seluruh
elemen atau anggota dari suatu wilayah yang menjadi sasaran penelitian atau
merupakan keseluruhan (universum) dari objek penelitian ((Noor, 2016:147).
Menurut Noor (2016:148), pengambilan sampel (sampling) adalah
proses memilih sejumlah elemen secukupnya dari populasi, sehingga
penelitian terhadap sampel dan pemahaman tentang sifat atau
karakteristiknya merupakan ideal yang akan digeneralisasi oleh peneliti.
29
UIN Syarif Hidayatullah Jakarta
Jumlah sampel data yang diambil pada penelitian ini menggunakan rumus
Slovin, yaitu sebagai berikut:
𝑛 =𝑁
1+𝑁𝑒2
Keterangan:
n = ukuran sampel
N = ukuran populasi
e = kelonggaran ketelitian karena kesalaan pengambilan yang ditolerir,
misalnya 1%, 2%, 5%, 10%, ... (catatan: batas kesalahan ditentukan
oleh peneliti)
Dalam teknik sampling untuk menentukan jumlah sampel di tiap kelas
atau strata digunakan rumus dari Proportionate Stratified Random Sampling,
yaitu sebagai berikut (Noor, 2016:152):
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑎𝑚𝑝𝑒𝑙 𝑡𝑖𝑎𝑝 𝑘𝑒𝑙𝑎𝑠 =𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 𝑘𝑒𝑙𝑎𝑠
𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 𝑡𝑜𝑡𝑎𝑙× 𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑎𝑚𝑝𝑒𝑙
30
UIN Syarif Hidayatullah Jakarta
2.11. Studi Literatur Sejenis
Tabel 2.1. Studi Literatur Sejenis
No Judul Variabel Metode Hasil
1 Pengenalan Emosi Berdasarkan
Suara Menggunakan Algoritma
HMM (Prasetio et al., 2017)
Data yang dilatih merupakan data
suara emosi marah, bahagia, dan
netral.
Ciri yang diekstraksi:
- Pitch
- Energi
- Formant
Hidden Markov Model Sistem yang dibuat memiliki
tingkat keberhasilan sebesar
86,66%
2 Pengenalan Pola Sinyal Suara
Manusia Menggunakan Metode
Back Propagation Neural Network
(Faradiba, 2017)
Data yang dilatih merupakan data
untuk mengenali ‘siapa’ yang
berbicara
Ciri yang diekstraksi: LPC
Backpropagation Sistem yang dibuat
memiliki tingkat
keberhasilan 74%.
3 Human Emotion Recognition
Based On Speech Using Back
Propagation Algorithm (Putra et al.,
2019)
Data yang dilatih merupakan data
suara emosi marah, sedih, netral,
tenang, jijik, takut, senang, dan
terkejut
Ciri yang diekstraksi: MFCC
Backpropagation Sistem yang dibuat
memiliki tingkat
keberhasilan rata-rata 89%.
30
UIN
Syarif H
ida
yatu
llah J
akarta
31
UIN Syarif Hidayatullah Jakarta
No Judul Variabel Metode Hasil
4 Speech Emotion Recognition Based
On HMM and SVM (Lin
& Wei, 2005)
Data suara yang dilatih merupakan
data suara emosi marah, sedih,
senang, dan netral.
Ciri yang diekstraksi: MFCC
HMM, SVM Sistem yang dibuat
memiliki tingkat
keberhasilan rata-rata 99%
menggunakan klasifikasi
HMM, dan 90%
menggunakan klasifikasi
SVM
5 Simulasi dan Analisis Deteksi
Emosi Manusia Dari Suara
Percakapan Berbasis Discrete
Wavelet Transform dan Linear
Predictive Coding (Magdalena &
Novamizanti, 2014)
Data suara yang dilatih merupakan
data suara emosi marah, sedih,
senang, dan netral.
Ciri yang diekstraksi: LPC
KNN Sistem memiliki akurasi
tertinggi sebesar 95%.
31
UIN
Syarif H
ida
yatu
llah J
akarta
32
BAB III
METODOLOGI PENELITIAN
Pada bab ini, peneliti akan menjelaskan mengenai metodologi penelitian
yang digunakan beserta tahap-tahap yang akan dilakukan dalam penelitian.
3.1. Metode Pengumpulan Data
Pengumpulan data merupakan langkah yang penting dalam sebuah
penelitian ilmiah, karena pada umumnya data yang dikumpulkan digunakan
untuk menguji hipotesis yang telah dirumuskan. Teknik pengumpulan data
yang sering digunakan antara lain:
3.1.1. Studi Pustaka
Studi pustaka yang dilakukan oleh penulis adalah dengan
mencari dan mempelajari teori-teori yang memiliki keterkaitan
dengan penelitian ini, serta dapat dijadikan sebagai landasan atau
kerangka berpikir bagi penelitian yang akan dilakukan sehingga
dalam proses penyusunannya lebih terarah.
Sumber-sumber data dan informasi yang penulis gunakan
sebagai studi pustaka dalam penelitian ini ialah sebanyak 21 sumber,
yang merupakan 15 buku dan e-book, 5 jurnal, dan 1 website. Daftar
lengkap untuk studi pustaka yang digunakan dalam penelitian ini
dapat dilihat pada daftar pustaka.
3.1.2. Studi Literatur
Selain studi pustaka, penulis juga mencari penelitian-penilitian
yang berkaitan dengan pengenalan emosi berdasarkan suara yang
sebelumnya telah dilakukan oleh peneliti lain. Studi literatur yang
penulis gunakan telah dijelaskan pada bab sebelumnya.
UIN Syarif Hidayatullah Jakarta
33
UIN Syarif Hidayatullah Jakarta
3.2. Metode Pengembangan Sistem
Pada metode pengembagan sistem ini, penulis menggunakan metode
prototipe. Adapun alasan penulis menggunakan metode pengembangan
prototipe ini, yaitu sebagai berikut:
a. Sistem yang dibuat bukan berupa aplikasi, namun masih berupa prototipe
sistem untuk menganalisis penggunaan metode backpropagation dalam
pengenalan emosi berdasarkan suara manusia.
b. Adanya tekanan untuk mengimplementasikan secepatnya, karena penulis
menginginkan sistem ini dapat dijalankan secepatnya sehingga tidak
menghabiskan banyak waktu dan dana.
Adapun langkah-langkah yang digunakan dalam pengembangan prototipe,
yaitu sebagai berikut:
3.2.1. Komunikasi
Pengembangan prototipe diawali dengan tahap komunikasi.
Pada tahap ini, penulis melakukan analisis kebutuhan yang
menghasilkan tujuan perancangan dan usulan solusi yang dapat
diterima. Tahapannya adalah sebagai berikut:
3.2.1.1. Analisa Masalah
Pada tahap ini, penulis akan membahas mengenai
analisa masalah pada pengenalan emosi berdasarkan suara
manusia.
3.2.1.2. Identifikasi Masalah
Pada tahap identifikasi masalah, penulis menjelaskan
masalah yang terjadi pada sistem.
3.2.1.3. Usulan Penyelesaian Masalah
Pada tahapan ini, penulis menjelaskan mengenai
usulan penggunaan metode backpropagation untuk
mengidentifikasi atau mengenali emosi berdasarkan suara
manusia.
34
UIN Syarif Hidayatullah Jakarta
3.2.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak
Pada tahap ini, penulis membuat spesifikasi
penggunaan aplikasi baik perangkat keras maupun perangkat
lunak. Pembuatan spesifikasi ini bertujuan untuk
memudahkan penulis dalam menganalisa kemampuan yang
sesuai dengan kebutuhan.
3.2.2. Perancangan Cepat
Pada tahap ini, dilakukan perancangan sementara yang berupa
format masukan dan keluaran. Penulis akan menjelaskan proses
pengenalan suara (speech recognition) yang diterapkan dalam
pengenalan emosi berdasarkan suara manusia dengan menggunakan
algoritma backpropagation. Berikut tahap yang akan penulis lakukan:
3.2.2.1. Preprocessing
Pada proses preprocessing ini, penulis akan
menjelaskan pengolahan sinyal suara sehingga memperoleh
data dalam bentuk sinyal yang dibutuhkan dalam proses
pengenalan emosi berdasarkan suara manusia.
3.2.2.2. Ekstraksi Ciri
Pada proses ekstraksi ciri, penulis akan menjelaskan
proses dalam mendapatkan ciri-ciri khusus pada sinyal suara
yang nantinya akan diolah dalam tahap identifikasi.
3.2.2.3. Identifikasi
Dalam proses identifikasi ini terbagi menjadi dua
proses, yaitu proses pelatihan dan proses pengujian. Penulis
akan menjelaskan proses-proses tersebut menggunakan
algoritma backpropagation.
35
UIN Syarif Hidayatullah Jakarta
3.2.3. Pemodelan Desain Cepat
Pada tahap ini, dilakukan pemodelan desain antar muka
menggunakan tools Matlab GUI.
3.2.4. Konstruksi Prototipe
Pada tahap ini, semua rancangan yang telah penulis rancang di
atas akan dikodekan kedalam program menggunakan tools dari
Matlab 2013.
3.2.5. Deployment Delivery and Feedback
Pada tahapan ini, dilakukan tiga proses yaitu proses pengujian
sistem, dokumentasi, dan analisis hasil pengujian. Pengujian sistem
bertujuan untuk melihat hasil dari sistem yang telah dibuat apakah
berjalan dengan baik atau tidak.
3.3. Data yang Digunakan
Dalam melakukan pengujian terhadap sistem ini, dibutuhkan data yang
berupa rekaman suara yang dapat mewakilkan beberapa jenis emosi. Data
suara ini didapatkan dari Berlin Database of Emotional Speech yang
dikembangkan oleh Burkhardt et al. (2005). Menurut Anne et al. (2015: 34),
database ini telah menjadi salah satu database paling populer yang digunakan
oleh para peneliti tentang pengenalan emosi suara, sehingga memfasilitasi
perbandingan kinerja dengan penelitian lain. Database ini terdiri dari 5 aktor
pria dan 5 aktor wanita yang mengucapkan 10 kalimat yang direkam dengan
7 jenis emosi, yaitu marah, bosan, jijik, takut, senang, sedih, dan netral. Data
tersebut disimpan dalam bentuk waveform (.wav) dengan frekuensi sampling
16 KHz.
Dari database ini, penulis hanya menggunakan data dari rekaman suara
aktor pria dengan jenis emosi marah, netral, sedih, dan senang yang berjumlah
141 data rekaman suara. Data suara tersebut dibagi menjadi dua, yaitu data
latih dan data uji.
36
UIN Syarif Hidayatullah Jakarta
Jumlah data latih yang akan digunakan pada penelitian ini diambil
dengan menggunakan teknik sampling, yaitu Proportionate Stratified
Random Sampling dikarenakan populasi yang ada memiliki strata (tingkatan),
juga agar penulis mendapat sampe yang proporsional tiap tingkatan.
Sedangkan perhitungan sampel data latih menggunakan rumus slovin.
Populasi dalam penelitian ini adalah jumlah seluruh data yang
digunakan yang dibagi menjadi empat jenis emosi (empat strata), yaitu marah,
netral, sedih, dan senang. Tiap jenis emosi memiliki jumlah yang berbeda-
beda.
Penulis menentukan nilai tingkat kesalahan e = 10%, jumlah populasi
N = 141 data suara, maka didapatkan jumlah sampel data latih adalah
sebanyak:
𝑛 =𝑁
1 + 𝑁𝑒2=
141
1 + 141 × 0,12=
141
2,41= 58,506 ≅ 59
Dari perhitungan di atas didapat jumlah sampel dari populasi yang
diperlukan adalah sebanyak 59 data suara. Setelah didapat jumlah sampel,
kemudian dihitung jumlah data latih tiap strata (jenis emosi) menggunakan
Proportionate Stratified Random Sampling.
Tabel 3.1. Perhitungan Jumlah Data Latih Tiap Jenis Emosi
No Jenis Emosi Perhitungan Hasil
1. Marah 50
141× 59 21
2. Netral 39
141× 59 16
3. Sedih 25
141× 59 11
4. Senang 27
141× 59 11
Total Jumlah Sampel Data Latih 59
37
UIN Syarif Hidayatullah Jakarta
Sedangkan data uji yang digunakan dalam penelitian ini merupakan
data yang tidak digunakan sebagai data latih, yaitu 82 data yang masing-
masing terdiri dari 38 data emosi marah, 23 data emosi netral, 14 data emosi
sedih, dan 16 data emosi senang.
38
UIN Syarif Hidayatullah Jakarta
3.4. Alur Penelitian
Gambar 3.1. Alur Penelitian
39
BAB IV
PERANCANGAN SISTEM DAN IMPLEMENTASI
Pada perancangan sistem ini, penulis melakukan perancangan dengan
menggunakan metode pengembangan prototipe. Metode prototipe merupakan
metode pembuatan model sederhana dari sebuah sistem yang mengijinkan
pengembangnya memiliki gambaran dasar mengenai sistem serta melakukan
pengujian. Berikut tahap – tahap yang penulis lakukan dalam perancangan sistem
menggunakan metode prototipe:
4.1. Komunikasi
Pada tahap komunikasi ini, dilakukan pengumpulan kebutuhan-
kebutuhan sistem dan analisa permasalahan. Proses-proses yang penulis
lakukan pada tahap ini, yaitu:
4.1.1. Analisa Masalah
Pengenalan suara manusia merupakan salah satu komponen
terpenting dalam perkembangan teknologi interaksi manusia dan
komputer. Salah satu yang dapat dikenali dalam suara manusia adalah
kondisi emosionalnya. Berdasarkan studi literatur pada tabel 2.1 dapat
dilihat bahwa untuk melakukan penelitian terkait pengenalan emosi
berdasarkan suara manusia bisa dilakukan dengan beberapa metode.
Metode-metode tersebut digunakan untuk mengambil informasi atau
ciri-ciri penting yang terkandung dalam suara manusia, seperti
frekuensi, energi, pitch, dan formant. Selain itu juga ada beberapa
metode yang digunakan untuk mengidentifikasikan berbagai macam
emosi berdasarkan informasi-informasi yang diambil, salah satunya
adalah dengan menggunakan metode Jaringan Syaraf Tiruan dengan
algoritma Backpropagation.
UIN Syarif Hidayatullah Jakarta
40
UIN Syarif Hidayatullah Jakarta
4.1.2. Identifikasi Masalah
Setelah melakukan analisa masalah, penulis dapat
mengidentifikasi masalah yaitu bagaimana implementasi algoritma
backpropagation pada pengenalan emosi berdasarkan suara manusia?.
4.1.3. Usulan Penyelesaian Masalah
Penyelesaian masalah yang penulis usulkan dalam penelitian ini
adalah dengan mengembangkan sebuah sistem dengan
mengimplementasikan algoritma backpropagation untuk mengenali
emosi manusia berdasarkan suara dengan cara mengekstraksi
beberapa informasi atau ciri penting yang terkandung dalam suara
tersebut. Ciri-ciri yang diekstraksi tersebut adalah frekuensi, energi,
pitch, dan formant.
4.1.4. Kebutuhan Perangkat Keras dan Perangkat Lunak
Perangkat keras yang digunakan untuk membangun prototipe
sistem ini adalah sebagai berikut:
1. Laptop Acer Aspire E5-473G
2. Intel Core i7 – 4510U 2.0 GHz
3. RAM 8 GB
4. NVIDIA GeForce 920M
5. Mouse dan Keyboard sebagai alat input
Kebutuhan untuk perangkat lunak yang penulis gunakan adalah
sebagai berikut:
Tabel 4.1. Perangkat Lunak Yang Digunakan
Perangkat Lunak Fungsi
Sistem Operasi
Windows 10 Pro 64 bit
Sebagai antar muka antara pengguna
dengan komputer
41
UIN Syarif Hidayatullah Jakarta
Matlab R2013b Sebagai tools untuk membuat serta
menjalankan prototipe sistem yang
dibuat
Cool Edit Pro 2.1 Sebagai tools untuk mengubah
frekuensi sampling data suara yang
digunakan
4.2. Perancangan Cepat
Pada tahap ini, dilakukan perancangan cepat untuk proses speech
recognition yang dibutuhkan untuk mengenali emosi manusia berdasarkan
suara. Berikut ini langkah – langkah yang penulis lakukan beserta penjelasan
untuk mempermudah dalam membangun prototipe sistem yang akan dibuat:
Gambar 4.1. Blok Diagram Sistem Pengenalan Emosi
4.2.1. Sinyal Suara
Pada proses ini dilakukan pemilihan data yang akan digunakan
sebagai data masukan yang berupa file berekstensi waveform (.wav).
Data tersebut didapatkan dari Berlin Database of Emotional Speech
(Burkhardt et al., 2005). Data diambil berdasarkan teknik sampling
data, yaitu teknik slovin untuk menentukan jumlah data sampel dan
propotionate stratified random sampling untuk menentukan jumlah
data sampel tiap strata. Dari hasil perhitungan pada sub bab 3.3,
dihasilkan sampel berjumlah 141 data yang terdiri dari 59 data latih
dan 82 data uji. Dari jumlah data latih tersebut, masing-masing terdiri
dari 21 data emosi marah, 16 data emosi netral, 11 data emosi sedih,
dan 11 data emosi senang.
Berikut adalah contoh gambar sinyal dari data suara yang telah
diambil yang merepresentasikan masing-masing emosi manusia:
42
UIN Syarif Hidayatullah Jakarta
Gambar 4.2. Contoh Sinyal Suara Manusia dalam Emosi Marah
Gambar 4.3. Contoh Sinyal Suara Manusia dalam Emosi Netral
43
UIN Syarif Hidayatullah Jakarta
Gambar 4.4. Contoh Sinyal Suara Manusia dalam Emosi Sedih
Gambar 4.5. Contoh Sinyal Suara Manusia dalam Emosi Senang
4.2.2. Preprocessing
Preprocessing merupakan proses awal pengolahan sinyal suara.
Tahap ini bertujuan untuk memperbaiki kualitas data masukan
sebelum dilakukan proses ekstraksi ciri. Dalam preprocessing ini
terdapat 2 proses yang akan dilakukan, yaitu:
4.2.2.1. Sampling
Setelah mendapatkan data masukan, lalu dilakukan
proses sampling untuk mengubah jumlah frekuensi sampling
44
UIN Syarif Hidayatullah Jakarta
dari 16 KHz menjadi 8 KHz menggunakan aplikasi Cool Edit
Pro 2.1. Proses ini bertujuan agar sinyal suara tidak terlalu
besar yang dapat memakan waktu yang lama dalam
pemrosesan selanjutnya dan juga tidak terlalu kecil yang
dapat mengakibatkan hilangnya informasi yang terkandung
dalam suara tersebut. Hal ini juga sesuai dengan teori
sampling Nyquist dimana frekuensi sampling ini paling
sedikit adalah dua kali frekuensi sinyal yang akan di
sampling. Selain itu menurut Eyben (2016:18), dalam speech
rentang frekuensi yang relevan yaitu dari 50 Hz hingga 6
KHz. Dengan demikian, frekuensi sampling 8 KHz cukup
untuk analisis sebagian besar sinyal suara.
4.2.2.2. Normalisasi
Sinyal suara manusia merupakan sinyal analog yang
tidak terbatas oleh waktu. Sinyal suara tersebut juga memiliki
amplitudo yang berbeda-beda untuk masing-masing karakter
suara manusia. Oleh karena itu, sebelum diproses lebih jauh,
sinyal tersebut dinormalisasi terlebih dahulu. Dalam
normalisasi, nilai masing-masing amplitudo dibagi dengan
nilai amplitudo maksimumnya. Hal ini dilakukan agar
rentang dari semua amplitudonya menjadi sama, yaitu antara
-1 sampai dengan 1, sehingga dalam proses selanjutnya tidak
dipengaruhi oleh nilai amplitudo yang sangat besar atau
sangat kecil.
Secara perhitungan, misalkan diambil 5 nilai pertama
dari amplitudo sinyal pada file “Sedih (1).wav” yang
digunakan:
y = [0,00055; 0,00080;0;00149;0,00209;0,00184]
45
UIN Syarif Hidayatullah Jakarta
Dari 5 sampel tersebut lalu dibagi dengan nilai
amplitudo maksimumnya. Pada file “Sedih (1).wav”,
memiliki nilai maksimal amplitudo = 0,6136. Sehingga
mendapatkan nilai amplitudo baru, yaitu:
y = [0,00034; 0,00049;0;0092;0,00128;0,0031]
Berikut adalah contoh hasil dari tahap preprocessing:
Gambar 4.6. Contoh Hasil Preprocessing
4.2.3. Ekstraksi Ciri
Setelah tahap preprocessing selesai dilakukan, maka proses
selanjutnya dilakukan ekstraksi ciri. Pada proses ekstraksi ciri,
terdapat beberapa langkah yang harus dilakukan. Adapun langkah-
langkahnya dapat dilihat dari blok diagram berikut (gambar 4.7):
46
UIN Syarif Hidayatullah Jakarta
Gambar 4.7. Proses Ekstraksi Ciri
Ciri yang diekstraksi pada penelitian ini ada empat, antara lain
frekuensi, energi, pitch, dan formant. Setelah diekstraksi, ciri-ciri
tersebut disatukan dalam satu matriks yang nantinya akan dijadikan
sebagai masukan pada proses klasifikasi.
4.2.3.1. Frekuensi
Frekuensi merupakan ekstraksi ciri pertama yang akan
menjadi masukan dari tahap klasifikasi. Pada sistem ini,
amplitudo dari suatu sinyal diolah menggunakan metode
Fast Fourier Transform (FFT) sehingga mendapatkan nilai-
nilai frekuensinya. Frekuensi untuk satu sample sinyal suara
menghasilkan matriks berukuran 1 x 47961. Dari data
frekuensi tersebut kemudian diambil nilai frekuensi atas (fu),
frekuensi bawah (f1), dan frekuensi tengah (f0) dan dijadikan
data masukan dari tahap klasifikasi. Berikut adalah contoh
nilai frekuensi yang akan dijadikan sebagai masukan tahap
klasifikasi berdasarkan hasil perhitungan FFT:
47
UIN Syarif Hidayatullah Jakarta
Tabel 4.2. Nilai-nilai frekuensi tiap label emosi
Nilai
(dB) Marah (1).wav Netral (1).wav Sedih (1).wav Senang(1).wav
fu 42,02072 110,2093 379,7561 65,9933
f1 0,000297 0,001553 0,006018 0,001793
f0 0,174705 0,413754 1,511735 0,343974
Gambar 4.8. Contoh Representasi Sinyal pada Domain
Frekuensi
4.2.3.2. Energi
Ciri yang menjadi masukan dari tahap klasifikasi
selanjutnya adalah energi. Pada sistem ini, energi yang
dihasilkan oleh suatu sinyal suara dalam suatu frame
merupakan hasil logaritmik dari proses autokorelasi
amplitudo suatu sampel suara. Energi untuk satu sampel
sinyal suara pada sistem ini menghasilkan matriks berukuran
1x47961. Karena ukuran matriks energi yang terlalu besar,
dilakukan proses downsampling untuk mengurangi ukuran
48
UIN Syarif Hidayatullah Jakarta
data. Faktor downsampling (biasanya dinotasikan dengan M)
biasanya berupa sebuah integer atau pecahan rasional lebih
besar dari satu. Faktor ini mengalikan waktu sampling atau
bersama-bersama membagi sampling rate.
Untuk menentukan besarnya nilai downsampling
diperlukan nilai perkiraan yang tepat agar proses
downsampling diperoleh data yang akurat dan tidak
mengakibatkan nilai-nilai penting dari suatu ciri hilang
akibat proses downsampling ini. Pada sistem ini, data energi
sinyal dilakukan downsampling dengan faktor M = 1000.
Dari hasil perhitungannya, dihasilkan energi dengan matriks
1 x 96.
Sebagai contoh diambil 5 nilai pertama yang telah
dilakukan proses FFT pada file “Sedih (1).wav”:
y = [0.38155; 0.37538; 0.35542; 0.38026; 2.60161]
Didapatkan hasil autokorelasi sebagai berikut:
AK = [0.99263; 1.12168; 1.20303; 1.40109; 7.32580;
1.40109; 1.20303; 1.12168; 0.99263]
Dari hasil penjumlahan matriks di atas, maka didapatkan
nilai total energi = 16,76265 dan nilai rata-rata energi =
1.86252.
Berikut adalah contoh representasi energi terhadap
sinyal asli:
49
UIN Syarif Hidayatullah Jakarta
Gambar 4.9. Contoh Representasi Energi Terhadap
Sinyal Asli
4.2.3.3. Pitch
Ekstraksi ciri selanjutnya adalah frekuensi
fundamental atau lebih dikenal dengan pitch. Ciri ini
merepresentasikan frekuensi dari sinyal suara yang
digunakan. Pitch dihasilkan dari pengaruh tekanan udara
yang melewati pita suara setiap mengekspresikan atau
mengucapkan sebuah kata. Untuk mencari nilai pitch dapat
menggunakan beberapa metode, salah satunya adalah
autokorelasi. Autokorelasi merupakan proses mencari
korelasi dari sinyal kepada sinyal itu sendiri. Untuk
mendeteksi pitch pada sinyal suara, diperlukan suatu nilai
autokorelasi. Nilai autokorelasi suatu sinyal suara akan
menunjukkan bagaimana bentuk gelombang itu membentuk
korelasi dengan diri sendiri sebagai fungsi perubahan waktu.
Setelah sinyal telah terkolerasi satu sama lain, lalu dilakukan
pencarian nilai puncak menggunakan fungsi findpeaks.
50
UIN Syarif Hidayatullah Jakarta
Fungsi ini dapat menampung nilai puncak dan juga
lokasinya. Nilai puncak inilah yang merupakan nilai dari
pitch. Sebagai contoh diambil 5 nilai pertama yang telah
dilakukan proses FFT pada file “Sedih (1).wav”:
y = [0.38155; 0.37538; 0.35542; 0.38026; 2.60161]
Didapatkan hasil autokorelasi sebagai berikut:
AK = [0.99263; 1.12168; 1.20303; 1.40109; 7.32580;
1.40109; 1.20303; 1.12168; 0.99263]
Dari matriks tersebut di atas dicari nilai puncaknya
yaitu dengan membandingkan nilai tersebut ke masing-
masing tetangganya, maka didapatkan nilai puncak =
7.32580. Nilai inilah yang nantinya akan dijadikan nilai dari
pitch.
Berikut adalah hasil persebaran pitch pada data yang
akan dilatih:
Gambar 4.10. Persebaran Nilai Pitch pada Data Latih
0
200
400
600
800
1000
1200
1400
1600
1800
0 20 40 60 80
Frek
uen
si
Data
Marah
Netral
Sedih
Senang
51
UIN Syarif Hidayatullah Jakarta
4.2.3.4. Formant
Ekstraksi ciri terakhir yang menjadi masukan dari
proses klasifikasi adalah frekuensi formant. Frekuensi
formant merupakan frekuensi resonansi pada saluran suara
(vocal tract) yang terjadi ketika seseorang mengucapkan
suara vokal. Untuk mencari nilai frekuensi formant dari suara
vokal dilakukan dengan menggunakan metode Linear
Predictive Coding (LPC). LPC melakukan analisis dengan
cara memperkirakan formant, memisahkan formant dari
sinyal, lalu mengestimasi intensitas dan frekuensi dari sinyal
suara yang tersisa, yang disebut residu. Dari hasil
perhitungan polinomial menggunakan metode LPC,
didapatkan 5 formant. Berikut contoh nilai formant pada file
“Sedih (1).wav”:
Formant 1 = 110.338
Formant 2 = 618.710
Formant 3 = 1459.020
Formant 4 = 2595.652
Formant 5 = 3062.789
4.2.4. Klasifikasi Backpropagation
Tahap klasifikasi pada penelitian ini penulis menggunakan
algoritma Jaringan Syaraf Tiruan Backpropagation. Algoritma
backpropagation ini digunakan untuk mempelajari dan mengenali ciri
dari suatu suara masukan dan mengklasifikasikan ciri tersebut
berdasarkan target yang telah ditentukan sebelumnya. Dalam tahap ini
terjadi dua proses yang berbeda, yaitu proses pelatihan dan proses
pengujian. Pada proses pelatihan, digunakan 59 data suara pria.
52
UIN Syarif Hidayatullah Jakarta
Sedangkan pada proses uji, data suara disediakan 141 data suara yang
terdiri 59 data suara yang sama dengan data dalam proses pelatihan
dan 82 data suara yang berbeda. Kedua proses ini menerapkan
supervised training, yaitu menentukan pola target setiap data
masukan.
Adapun beberapa parameter yang harus diperhatikan dalam
merancang arsitektur klasifikasi menggunakan algoritma
backpropagation, antara lain:
1. Jumlah hidden layer
Jumlah hidden layer dapat mempengaruhi nilai error pada
backpropagation. Pada umumnya, dengan menggunakan lebih
dari satu hidden layer dapat menurunkan nilai error pada
program. Tetapi dengan satu hidden layer saja sudah cukup
untuk melakukan proses klasifikasi. Pada proses ini, hidden
layer yang digunakan sebanyak satu hidden layer.
2. Mean Square Error (MSE)
Pemilihan nilai MSE dapat mempengaruhi jumlah iterasi waktu
pelatihan. Semakin kecil MSE, maka waktu pelatihan yang
dibutuhkan semakin lama. Pada proses ini, MSE yang
digunakan sebesar 10-5.
3. Learning Rate
Learning rate merupakan parameter yang dapat mempengarui
kecepatan dan efektivitas proses pembelajaranlearning sistem.
Pada proses ini, nilai learning rate adalah 0.05.
4. Epoch
Penentuan nilai epoch bertujuan untuk menentukan jumlah
iterasi maksimal untuk perubahan bobot pada jaringan. Semakin
kecil nilai MSE, maka semakin banyak pula nilai iterasi yang
53
UIN Syarif Hidayatullah Jakarta
dibutuhkan untuk mencapai nilai MSE tersebut. Pada proses ini,
nilai epoch yang digunakan sebanyak 1500 iterasi.
4.2.4.1. Pelatihan Backpropagation
Proses pelatihan backpropagation digunakan untuk
mencari bobot tiap sinapsis dengan nilai error terkecil. Yang
menjadi data masukan dalam proses ini adalah ciri data yang
telah diekstraksi pada tahap sebelumnya. Dalam proses
pelatihannya dilakukan inisialisasi jumlah target, hidden
layer, fungsi aktivasi, algoritma pelatihan, dan jumlah epoch.
Untuk algoritma pelatihan backpropagation dilakukan
proses feedforward dan backward. Berikut diagram alur
proses pelatihan menggunakan backpropagation.
Gambar 4.11. Diagram Alir Proses Pelatihan Backpropagation
54
UIN Syarif Hidayatullah Jakarta
Langkah-langkah yang pada proses pelatihan
backpropagation adalah sebagai berikut:
1. Inisialisasi masukan, target, dan bobot
Nilai masukan didapatkan dari matriks ekstraksi ciri
terhadap data latih. Nilai target didapatkan dari kelas-
kelas tiap jenis emosi. Sedangkan nilai bobot didapatkan
secara acak.
2. Inisialisasi jumlah hidden layer, hidden neuron, dan
fungsi aktivasi sigmoid.
3. Inisialisasi jumlah maksimal iterasi, learning rate, dan
MSE.
4. Menentukan nilai MSE atau nilai eror terkecil, learning
rate, dan epoch maksimal.
5. Lakukan pelatihan feedforward, backpropagation, dan
perubahan bobot.
Tiap unit keluaran menjumlahkan nilai keluaran dari unit
hidden layer yang dikali dengan bobot, dijumlah bias
bagian hidden layer, dan dihitung menggunakan fungsi
aktivasi. Tiap nilai keluaran yang telah dihasilkan
kemudian dibandingkan dengan target yang diinginkan
6. Tiap unit keluaran menerima pola target sesuai dengan
masukan saat pelatihan, lalu dihitung nilai erornya dan
diperbaiki bobotnya.
7. Proses pelatihan akan berhenti apabila nilai MSE telah
terpenuhi atau telah mencapai jumlah maksimum
iterasinya.
8. Hasil pelatihan disimpan untuk proses pengujian.
55
UIN Syarif Hidayatullah Jakarta
4.2.4.2. Pengujian Backpropagation
Untuk proses pengujian, proses backpropagation
dilakukan dengan menggunakan bobot yang telah dilatih
sebelumnya. Proses yang dilakukan hanyalah proses
feedforward. Proses pengujian dapat dijelaskan dengan
diagram alur dibawah ini:
Gambar 4.12. Diagram Alir Proses Pengujian
Backpropagation
Langkah-langkah yang pada proses pengujian
backpropagation adalah sebagai berikut:
1. Inisialisasi masukan yang berupa matriks ekstraksi ciri
dari data uji.
2. Inisialisasi bobot hasil pelatihan.
3. Lakukan pengujian feed forward.
56
UIN Syarif Hidayatullah Jakarta
Tiap unit masukan menerima sinyal masukan, lalu
sinyal tersebut dikirimkan ke seluruh unit hidden layer.
Tiap unit hidden layer ditambah dengan masukan yang
dikali dengan bobot yang diperoleh dari proses
pelatihan, lalu dijumlahkan dengan bias bagian
masukan.
Tiap unit keluaran ditambah dengan nilai keluaran
hidden layer yang dikali bobot yang diperoleh dari
proses pelatihan dan dijumlahkan dengan bias bagian
hidden layer. Hitung menggunakan fungsi aktivasi
sigmoid biner.
4. Bobot hasil pelatihan dibandingkan dengan bobot
keluaran yang diperoleh ketika pengujian.
4.3. Pemodelan Desain Cepat
Pada tahap ini, dilakukan pemodelan desain yang telah dirancang
sebelumnya menggunakan tools Matlab GUI. Berikut hasil desain antar
muka yang telah penulis buat:
57
UIN Syarif Hidayatullah Jakarta
Gambar 4.13. Desain antar muka pengguna
Desain prototipe sistem ini memiliki tiga fungsi utama, yaitu fungsi
ekstraksi ciri, fungsi pelatihan, dan fungsi pengujian. Selain itu, terdapat
empat keluaran yang akan menampilkan jumlah total suara pelatihan,
direktori dari data pelatihan, direktori dari data pengujian, dan juga
keterangan dari hasil fungsi-fungsi utama prototipe ini.
4.4. Konstruksi Prototipe
Pada tahap konstruksi prototipe, penulis melakukan pengkodean
terhadap fungsi-fungsi yang telah penulis desain sebelumnya. Penulis
menggunakan tools dari Matlab dalam proses pengkodeannya. Berikut proses
pengkodean fungsi utama prototipe sistem ini:
4.3.1. Ekstraksi Ciri
Fungsi ini dilakukan tahap preprocessing dan ekstraksi ciri pada
data pelatihan. Pada tahap preprocessing dilakukan resampling, zero
padding, dan normalisasi. Berikut ini adalah kode Matlab untuk tahap
preprocessing:
58
UIN Syarif Hidayatullah Jakarta
Gambar 4.14. Screenshot pengkodean tahap preprocessing
Setelah tahap preprocessing selesai, dilakukan tahap ekstraksi
ciri. Terdapat lima ciri yang akan diekstraksi pada sistem ini, yaitu
amplitudo, frekuensi, energi, pitch, dan formant. Setelah mendapatkan
nilai masing-masing ciri, lalu disimpan dalam satu file berekstensi .xls
(excel). File inilah yang nantinya menjadi masukan pada tahap
pelatihan. Berikut kode Matlab pada tahap ekstraksi ciri:
59
UIN Syarif Hidayatullah Jakarta
Gambar 4.15. Screeshot pengkodean tahap ekstraksi ciri
Setelah itu, nilai-nilai ekstraksi ciri data pelatihan disimpan
dalam satu file berekstensi .xls (excel) yang nantinya akan dijadikan
masukan pada tahap pelatihan.
60
UIN Syarif Hidayatullah Jakarta
4.3.2. Pelatihan Backpropagation
Fungsi ini dilakukan tahap pelatihan JST Backpropagation
terhadap data yang telah diekstraksi cirinya. Tahap ini berfungsi untuk
mengidentifikasikan masing-masing data berdasarkan jenis emosinya.
Berikut kode Matlab pada tahap pelatihan JST Backpropagation:
Gambar 4.16. Screeshot pengkodean tahap pelatihan backpropagation
4.3.3. Pengujian Backpropagation
Fungsi ini dilakukan proses preprocessing dan ekstraksi
ciri terhadap data uji. Nilai ekstraksi ciri data uji ini kemudian
akan menjadi masukan pada proses pengujian JST
Backpropagation. Dalam proses pengujian JST
Backpropagation dilakukan pengujian nilai ekstraksi cirinya
terhadap jaringan yang telah dibentuk pada proses pelatihan
JST Backpropagation. Berikut kode Matlab pada tahap
pelatihan JST Backpropagation:
61
UIN Syarif Hidayatullah Jakarta
Gambar 4.17. Screeshot pengkodean tahap pengujian backpropagation
62
BAB V
ANALISIS DAN PENGUJIAN SISTEM
Setelah dilakukan perancangan dan implementasi sistem pengenalan emosi
berdasarkan suara manusia, maka selanjutnya dilakukan tahap deployment delivery
and feedback. Pada tahap ini dilakukan proses pengujian terhadap fungsi-fungsi
yang ada pada sistem yang telah dibuat.
5.1. Analisis Masukan dan Keluaran
Masukan pada sistem ini berjumlah 141 data suara yang terdiri dari 59
data latih dan 82 data uji yang didapatkan dari Berlin Database of Emotional
Speech. Data tersebut dilakukan sampling dengan mereduksi jumlah
frekuensi sampling dari 16 KHz menjadi 8 KHz. Sedangkan keluaran dari
sistem ini berupa klasifikasi jenis emosi, baik dari data latih maupun data uji.
5.2. Tujuan Pengujian Sistem
Pengujian sistem ini dilakukan untuk mengetahui bagaimana kinerja
dari sistem yang dibangun. Tujuan pengujian sistem ini adalah sebagai
berikut:
1. Menganalisa akurasi dari sistem dengan menganalisa hasil keluaran dari
sinyal masukan
2. Menganalisa akurasi dari sistem dengan terhadap data suara.
3. Menganalisa kesalahan pengenalan pada sistem yang disebabkan oleh
nilai ekstraksi ciri.
5.3. Skenario Pengujian
Adapun skenario pengujian yang dilakukan untuk mengukur
performansi dari sistem berdasarkan pengaruhnya terhadap parameter-
parameter yang ada sebagai berikut:
UIN Syarif Hidayatullah Jakarta
63
UIN Syarif Hidayatullah Jakarta
1. Pengujian terhadap pengaruh jumlah hidden layer dan hidden neuron
dari algoritma backpropagation.
2. Pengujian terhadap data latih dan data uji.
3. Pengujian terhadap pengaruh nilai masing-masing ciri dari sinyal
masukan.
5.3.1. Skenario Pertama
Pada skenario pertama ini, pengujian dan analisis dilakukan
dengan mengamati pengaruh jumlah hidden layer dan hidden neuron
terhadap akurasi sistem. Spesifikasi dalam pengujian ini adalah
sebagai berikut:
1. Data latih berjumlah 59 data yang terdiri dari 21 data marah, 16
data netral, 11 data sedih, dan 11 data senang.
2. Data uji berjumlah 82 data yang terdiri dari 29 data marah, 23
data netral, 14 data sedih, dan 16 data senang.
3. Parameter klasifikasi yang digunakan adalah
Learning rate = 0.05.
Hidden layer yang diuji yaitu 1, 2, 3.
Hidden neuron yang diuji yaitu 10, 15, 20, 25, 50.
Batas toleransi eror (MSE) = 10-5.
Jumlah iterasi maksimal = 1500 (Faradiba, 2017:10).
4. Total data yang uji adalah 141 data yang terdiri dari 59 data latih
dan 82 data uji.
Dari hasil pengujian skenario pertama dengan spesifikasi di atas
diperoleh hasil seperti pada tabel 5.1. di bawah ini.
64
UIN Syarif Hidayatullah Jakarta
Tabel 5.1. Pengaruh jumlah Hidden Layer dan Hidden Neuron
terhadap parameter lainnya
Hidden
Layer
Hidden
Neuron
Akurasi (%)
MSE Iterasi
ke- Data
Latih Data Uji
1 10 88,83 54,90 1,00 x 10-5 7
15 88,14 48,80 1,9 x 10-6 8
20 86,44 57,31 8,82 x 10-6 6
25 88,14 59,76 1,57 x 10-6 9
50 86,44 54,89 7,09 x 10-6 8
2 10,10 76,27 63,63 1,94 x 10-6 8
10,20 86,27 43,2 8,25 x 10-6 12
10,25 64,41 46,34 0,7 x 10-6 9
10,50 68,98 17,1 9,53 x 10-6 50
15,10 88,1 35,4 0,115 1500
15,20 96,6 22 0,0295 1500
15,50 94,9 22 0,082 1500
20,10 100 36,8 7,45 x 10-6 61
20,20 94,92 58,54 8,34 x 10-6 10
3 20,10,10 100 19,5 2,7 x 10-7 79
25,10,10 57,8 10,2 1,98 1500
Jumlah hidden layer dan hidden neuron sangat berpengaruh
terhadap hasil pelatihan backpropagation. Pengujian yang telah
dilakukan mendapatkan hasil paling optimal dengan menggunakan 2
hidden layer yang masing-masing hidden neuron berjumlah 20 dan
20. Akurasi yang didapatkan dengan menggunakan parameter tersebut
yaitu 94,922% untuk data latih, 58,54% untuk data uji, dan 73,05%
untuk keseluruhan data.
65
UIN Syarif Hidayatullah Jakarta
5.3.2. Skenario Kedua
Pada pengujian skenario kedua ini, akan dilakukan pengujian
terhadap data latih dan data uji. Spesifikasi dalam pengujian ini adalah
sebagai berikut::
1. Jumlah data latih sebanyak 59 data yang terdiri dari 21 data
marah, 16 data netral, 11 data sedih, dan 11 data senang.
2. Data uji berjumlah 82 data yang terdiri dari 29 data marah, 23
data netral, 14 data sedih, dan 16 data senang.
3. Parameter klasifikasi yang digunakan adalah
Learning rate = 0.05
Jumlah Hidden Layer = 2
Jumlah Hidden Neuron = 20,10
Batas toleransi eror (MSE) = 10-5
Jumlah iterasi maksimal = 1500
4. Total data yang uji adalah 141 data yang terdiri dari 59 data latih
dan 82 data uji.
Dari hasil pengujian skenario kedua dengan spesifikasi di atas
diperoleh hasil seperti pada tabel 5.2. di bawah ini:
Tabel 5.2. Akurasi Rata-rata Hasil Pengujian
Label Akurasi (%)
Data Latih Data Uji
Marah 100 86,21
Netral 93,75 43,48
Sedih 90,91 85,71
Senang 90,91 6,25
66
UIN Syarif Hidayatullah Jakarta
Gambar 5.1. Akurasi Rata-Rata Hasil Pengujian
5.3.3. Skenario Ketiga
Pada skenario ketiga ini, dilakukan analisa data yang tidak dapat
dikenali dengan benar berdasarkan nilai dari ekstraksi cirinya. Berikut
adalah rentang nilai ekstraksi ciri dari data latih:
Tabel 5.3. Rentang nilai ekstraksi ciri dari masing-masing label emosi
0
20
40
60
80
100
120
Marah Netral Sedih Senang
Aku
rasi
(%
)
Akurasi Hasil Pengujian
Data Latih
Data Uji
Ciri Marah Netral Sedih Senang
Min Max Min Max Min Max Min Max
Frek. atas 42,02072 168,4643 94,28428 462,6743 278,6125 1225,745 65,9933 163,5348
Frek. bawah 0,000297 0,010459 0,00018 0,005203 0,000188 0,009545 0,000248 0,007956
Frek. tengah 0,174705 1,052486 0,195283 1,551544 0,281861 3,191642 0,173222 0,850041
Energi mean -103,406 3338,178 569,3397 6741,598 -6,33572 4021,138 -65,1856 2683,585
Pitch 500 1600 320 888,8889 105,2632 727,2727 533,3333 1333,333
Formant 1 147,3832 664,0584 0 398,8524 0 242,8658 0 548,094
Formant 2 900,8974 1253,152 352,4466 967,8303 215,448 721,6007 401,9858 1120,335
Formant 3 1298,916 1707,475 1188,851 1611,3 1174,121 1583,417 971,8684 1569,756
Formant 4 2220,807 2561,129 2346,612 2737,354 2388,866 2595,652 1620,763 2481,498
Formant 5 2816,234 3128,919 2893,395 3151,268 2897,73 3277,186 2629,011 3107,775
67
UIN Syarif Hidayatullah Jakarta
Dari nilai ekstraksi ciri pada tabel 5.3 di atas, dapat dilakukan
analisa kesalahan yang terjadi pada proses pengenalan data uji.
Berikut beberapa contoh kesalahan dalam pengenalan data uji:
1. Data uji marah
Nama file: “Marah (37).wav”
Dikenali sebagai: Netral
Tabel 5.4. Pengenalan data uji “Marah (37).wav”
Ciri Nilai Terdapat pada rentang
Frek. atas 177,5267 2
Frek. bawah 0,001857 1,2,3,4
Frek. tengah 0,467149 1,2,3,4
Energi mean 1933,889 1,2,3,4
Pitch 888,8889 1,2,4
Formant 1 515,6369 1,4
Formant 2 1026,181 1,4
Formant 3 1540,937 1,2,3,4
Formant 4 2594,007 2,3
Formant 5 3135,786 2,3
Keterangan:
1 = Marah
2 = Netral
3 = Sedih
4 = Senang
Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri
paling banyak dikenali sebagai emosi Netral (rentang no. 2)
dengan jumlah 8 ciri yang berada diantara rentang data netral.
Sedangkan pada label emosi marah hanya dikenali 7 ciri saja.
68
UIN Syarif Hidayatullah Jakarta
2. Data uji netral
Nama file: “Netral (30).wav”
Dikenali sebagai: Senang
Tabel 5.5. Pengenalan data uji “Netral (30).wav”
Ciri Nilai Terdapat pada rentang
Frek. atas 100,853227 1,2,4
Frek. bawah 0,001139391 1,2,3,4
Frek. tengah 0,338985626 1,2,3,4
Energi mean 2656,315185 1,2,3,4
Pitch 1333,333333 1,4
Formant 1 431,8095223 1,4
Formant 2 764,0821669 2,4
Formant 3 1371,619885 1,2,3,4
Formant 4 2517,149112 1,2,3,4
Formant 5 2906,246624 1,2,3,4
Keterangan:
1 = Marah
2 = Netral
3 = Sedih
4 = Senang
Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri
paling banyak dikenali sebagai emosi senang (rentang no. 4)
dengan jumlah 10 ciri yang berada diantara rentang data senang.
Sedangkan pada label emosi netral hanya dikenali 8 ciri saja.
69
UIN Syarif Hidayatullah Jakarta
3. Data uji sedih
Nama file: “Sedih (24).wav”
Dikenali sebagai: Marah
Tabel 5.6. Pengenalan data uji “Sedih (24).wav”
Ciri Nilai Terdapat pada rentang
Frek. atas 100,853227 1,2,4
Frek. bawah 0,001139391 1,2,3,4
Frek. tengah 0,338985626 1,2,3,4
Energi mean 2656,315185 1,2,3,4
Pitch 1333,333333 1,4
Formant 1 431,8095223 1,4
Formant 2 764,0821669 1,2,4
Formant 3 1371,619885 1,2,3,4
Formant 4 2517,149112 1,2,3
Formant 5 2906,246624 1,2,3,4
Keterangan:
1 = Marah
2 = Netral
3 = Sedih
4 = Senang
Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri
paling banyak dikenali sebagai emosi marah (rentang no. 1)
dengan jumlah 10 ciri yang berada diantara rentang data senang.
Sedangkan pada label emosi sedih hanya dikenali 6 ciri saja.
70
UIN Syarif Hidayatullah Jakarta
4. Data uji senang
Nama file: “Senang (27).wav”
Dikenali sebagai: Marah
Tabel 5.7. Pengenalan data uji “Senang (27).wav”
Ciri Nilai Terdapat pada rentang
Frek. atas 156,4176 1,2,4
Frek. bawah 0,001318 1,2,3,4
Frek. tengah 0,454102 1,2,3,4
Energi mean 1271,732 1,2,3,4
Pitch 363,6364 2,3
Formant 1 394,0296 1,2,4
Formant 2 863,7867 2,4
Formant 3 1434,844 1,2,3,4
Formant 4 2538,294 1,2,3
Formant 5 2931,961 1,2,3,4
Keterangan:
1 = Marah
2 = Netral
3 = Sedih
4 = Senang
Dari hasil pengenalan pada tabel 5.4, dapat dilihat bahwa ciri-ciri
paling banyak dikenali sebagai emosi netral (rentang no. 2)
dengan jumlah 10 ciri yang berada diantara rentang data senang.
Sedangkan pada label emosi senang hanya dikenali 8 ciri saja.
71
BAB VI
PENUTUP
6.1. Kesimpulan
Dari penelitian yang sudah dilakukan penulis tentang implementasi
algoritma backpropagation pada pengenalan emosi berdasarkan suara
manusia, dapat ditarik beberapa kesimpulan sebagai berikut:
1. Sistem dapat mengenali emosi marah, netral, sedih, dan bahagia.
2. Ciri yang digunakan dalam sistem ini adalah frekuensi, energi, pitch,
dan formant.
3. Sistem memiliki tingkat keberhasilan rata-rata sebesar 73,05 %
6.2. Saran
Setelah melakukan penelitian, penulis memiliki saran untuk pembaca
dan pengembang berikutnya guna membantu dalam pengembangan
selanjutnya. Adapun saran penulis antara lain:
1. Mengembangkan penelitian ini dengan kasus real time, dimana data
suaranya didapatkan langsung dari proses perekaman.
2. Penggunaan ekstraksi ciri yang lebih optimal dan dapat digunakan
dalam kasus real time.
UIN Syarif Hidayatullah Jakarta
72
DAFTAR PUSTAKA
Abhang, P. A., Gawali, B. W., & Mehrotra, S. C. (2016). INTRODUCTION TO
EEG- AND EMOTION RECOGNITION. Cambridge: Academic Press.
Anne, K. R., Kuchibhotla, S., & Vankayalapati, H. D. (2015). Acoustic Modeling
of Emotion Recognition. New Jersey: Springer International Publishing.
Burkhardt, F., Paeschke, A., Rolfes, M., Sendlmeier, W., & Weiss, B. (2005).
Berlin Database of Emotional Speech. Retrieved January 14, 2019, from
http://www.emodb.bilderbar.info/
Chakraborty, R., Pandharipande, M., & Kopparapu, S. K. (2017). Analyzing
Emotion in Spontaneous Speech. Singapore: Springer Nature Singapore.
Eyben, F. (2016). Real-time Speech and Music Classification by Large Audio
Feature Space Extraction. Switzerland: Springer International Publishing.
Fadlisyah, Bustami, & Ikhwanus, M. (2013). Pengolahan Suara. Yogyakarta:
Graha Ilmu.
Faradiba. (2017). Pengenalan Pola Sinyal Suara Manusia Menggunakan Metode
Back Propagation Neural Network. EduMatSains, 2.
Konar, A., & Chakraborty, A. (2015). Emotion Recognition: A Pattern Analysis
Approach. New Jersey: Wiley.
Krothapalli, S. R., & Koolagudi, S. G. (2013). Emotion Recognition using Speech
Features. New York: Springer International Publishing.
Kusumadewi, S. (2003). Artificial Intelligence (Teknik dan Aplikasinya).
Yogyakarta: Graha Ilmu.
Mary, L. (2019). Extraction of Prosody for Automatic Speaker , Language ,
Emotion and Speech Recognition. Switzerland: Springer International
Publishing.
Noor, J. (2016). Metodologi Penelitian: Skripsi, Tesis, Disertasi & Karya Ilmiah.
UIN Syarif Hidayatullah Jakarta
73
UIN Syarif Hidayatullah Jakarta
Jakarta: Prenada Media.
Owens, F. J. (1993). Signal Processing of Speech. London: The Macmillan Press.
Pan, Y., Shen, P., & Shen, L. (2012). Speech Emotion Recognition Using Support
Vector Machine. International Journal of Smart Home, 6(2), 101–108.
Prasetio, B. H., Kurniawan, W., & Ichsan, M. H. H. (2017). Pengenalan Emosi
Berdasarkan Suara Menggunakan Algoritma HMM. Jurnal Teknologi
Informasi Dan Ilmu Komputer, 4(3), 168–172.
https://doi.org/10.25126/jtiik.201743339
Pressman, R. S. ., & Maxim, B. R. (2015). Software Engineering. New York:
McGraw-Hill Education.
Putra, M. I. G., Osmond, A. B., & Setianingsih, C. (2019). Human Emotion
Recognition Based On Speech Using Back Propagation Algorithm. TELKOM.
Rabiner, L., & Juang, B.-H. (1993). Fundamentals Of Speech Recognition. New
Jersey: PTR Prentice-Hall, Inc.
S., R. A., & Shalahuddin, M. (2011). Modul Pembelajaran Rekayasa Perangkat
Lunak (Terstruktur dan Berorientasi Objek). Bandung: Modula.
Siang, J. J. (2009). Jaringan Syaraf Tiruan Menggunakan MATLAB. Yogyakarta:
Penerbit ANDI.
Simarmata, J. (2010). Rekayasa Perangkat Lunak. Yogyakarta: Penerbit ANDI.
74
LAMPIRAN
Lampiran 1: Hasil Ekstraksi Ciri
1. Data Latih Marah
frek atas frek
bawah
frek
tengah
energi
sum
energi
mean pitch f1 f2 f3 f4 f5
1 42,02072 0,000297 0,174705 -9926,99 582,0201 1333,333 519,6482 1081,358 1568,705 2509,206 2932,794
2 42,38629 0,000477 0,207463 -9074,08 3319,477 1600 478,1018 916,4687 1532,966 2500,617 3081,06
3 56,98783 0,000656 0,218075 -8921,66 -92,9339 1600 553,533 924,406 1511,954 2453,902 2957,17
4 58,34131 0,000738 0,224138 -4217,93 -103,406 1333,333 337,0196 1114,524 1607,56 2374,8 3128,919
5 67,38091 0,000758 0,329825 55873,93 2633,249 1142,857 372,6102 1102,142 1597,304 2418,766 3123,342
6 69,21029 0,001023 0,340137 56632,66 2652,03 1333,333 341,2594 1192,533 1596,818 2463,533 3039,738
7 72,50865 0,001891 0,404155 57322,36 2627,436 1333,333 664,0584 1081,079 1453,958 2401,5 2967,418
8 76,67519 0,00236 0,40609 59151,66 617,4106 1333,333 446,3944 1253,152 1438,519 2438,988 2980,979
9 88,7955 0,002392 0,412138 59271,42 1940,309 1333,333 147,3832 981,1058 1546,51 2220,807 2867,912
10 89,26791 0,002739 0,428252 120787,5 597,1079 1142,857 516,634 1033,495 1446,908 2467,684 3059,331
11 95,50703 0,002892 0,449892 121015,7 -43,9378 1333,333 449,5768 1157,693 1645,464 2477,805 2816,234
12 102,8672 0,003147 0,493169 185535,5 616,1631 500 469,3128 900,8974 1547,001 2561,129 3012,349
13 105,303 0,003924 0,533945 186269,7 1975,644 1333,333 466,0223 1119,252 1673,759 2482,901 2913,542
14 105,9158 0,004007 0,559472 188780,4 589,9235 1333,333 485,0926 1163,398 1298,916 2509,433 2922,317
15 106,3355 0,00438 0,625273 189661,8 3319,714 1333,333 386,0443 1081,586 1600,829 2520,495 2904,372
16 107,0087 0,005003 0,660642 252233,8 1932,662 1333,333 516,1411 1128,496 1652,323 2468,247 3106,263
17 108,2269 0,005386 0,768326 252791,9 1260,58 1333,333 514,3257 1214,856 1517,025 2478,836 2926,766
UIN
Syarif H
ida
yatu
llah J
akarta
74
75
18 108,8932 0,005954 0,805175 254594,9 3338,178 888,8889 458,5734 962,8507 1601,561 2450,047 2962,606
19 138,6873 0,006181 0,835218 318669,8 1258,203 800 552,0433 1003,913 1707,475 2383,568 3005,392
20 152,6625 0,010353 0,952583 318692,6 -94,5216 888,8889 596,547 953,549 1519,735 2470,592 2921,93
21 168,4643 0,010459 1,052486 320465,1 1966,463 1142,857 577,5797 1173,408 1608,055 2257,822 2848,689
2. Data Latih Netral
frek atas frek
bawah
frek
tengah
energi
sum
energi
mean pitch f1 f2 f3 f4 f5
1 110,2093 0,001553 0,413754 54656,61 569,3397 615,3846 398,8524 620,7619 1387,606 2497,219 3016,376
2 462,6743 0,005203 1,551544 647193,4 6741,598 888,8889 0 491,9554 1499,513 2518,893 3055,166
3 212,368 0,00018 0,195283 251848,1 2623,418 444,4444 0 428,7446 1514,159 2620,406 3000,137
4 280,8298 0,003816 1,035172 319143,8 3324,415 615,3846 0 583,4001 1439,392 2737,354 2893,395
5 388,2683 0,004064 1,256142 123820,4 1289,796 444,4444 0 414,5055 1259,897 2497,484 3100,154
6 204,1701 0,001533 0,559431 383102 3990,646 444,4444 392,9569 555,6757 1601,414 2447,789 3095,878
7 100,787 0,000858 0,294123 383046,1 3990,063 666,6667 256,8377 599,3386 1530,266 2488,922 3054,512
8 110,4729 0,001205 0,364816 120416 1254,333 666,6667 197,3566 647,3347 1462,196 2520,588 3151,268
9 94,28428 0,001503 0,376481 448373,6 4670,558 571,4286 0 411,6552 1188,851 2507,532 3055,982
10 207,9965 0,001195 0,498572 252164,4 2626,713 727,2727 186,2738 696,4549 1358,826 2571,136 3133,237
11 316,1108 0,002826 0,945098 256580,2 2672,711 444,4444 201,7243 434,3436 1377,799 2470,407 3070,132
12 172,5914 0,003354 0,760788 387297,4 4034,348 320 377,9017 552,5492 1452,238 2526,838 3031,638
13 331,5392 0,002979 0,993856 516827 5383,614 400 267,5209 352,4466 1611,3 2451,77 3119,936
14 156,0037 0,000962 0,387424 320177,5 3335,182 666,6667 0 467,2135 1264,828 2413,584 3014,882
15 213,6212 0,003338 0,844462 125412,3 1306,378 533,3333 268,7963 967,8303 1221,705 2346,612 3066,227
16 271,1816 0,001213 0,57345 254335,9 2649,333 470,5882 0 376,6987 1397,541 2365,81 3040,821
UIN
Syarif H
ida
yatu
llah J
akarta
75
76
3. Data Latih Sedih
frek atas frek
bawah
frek
tengah
energi
sum
energi
mean pitch f1 f2 f3 f4 f5
1 379,7561 0,006018 1,511735 253617,9 2641,853 727,2727 110,3383 618,7101 1459,02 2595,652 3062,79
2 278,6125 0,002326 0,805063 186751,9 1945,332 363,6364 242,8658 586,1227 1583,417 2533,752 3130,283
3 1067,257 0,009545 3,191642 324539,4 3380,618 105,2632 0 272,6341 1474,841 2494,778 3187,749
4 524,5336 0,00309 1,273136 122455 1275,573 106,6667 0 215,448 1174,121 2388,866 3228,537
5 301,6003 0,00372 1,059182 -608,229 -6,33572 615,3846 0 405,9053 1215,725 2450,056 3142,926
6 1225,745 0,004565 2,365371 386029,2 4021,138 105,2632 0 237,8955 1403,388 2444,618 3109,04
7 422,271 0,000188 0,281861 191652,8 1996,383 210,5263 164,4811 646,9008 1358,787 2563,787 3277,186
8 397,0322 0,007717 1,750372 240,7672 2,507992 216,2162 139,9706 278,6171 1406,826 2445,709 2897,73
9 706,7384 0,005604 1,990113 63781,43 664,3899 108,1081 0 349,4728 1507,427 2517,208 3044,434
10 544,7174 0,004109 1,496065 127326,1 1326,314 235,2941 203,2752 526,775 1408,739 2457,479 3099,566
11 666,3047 0,004178 1,668433 188948 1968,208 108,1081 172,8082 721,6007 1546,244 2493,194 3116,343
4. Data Latih Senang
frek atas frek
bawah
frek
tengah
energi
sum
energi
mean pitch f1 f2 f3 f4 f5
1 90,82149 0,007956 0,850041 54716,64 569,965 1333,333 519,1117 952,8971 1442,347 2390,311 3017,943
2 151,3123 0,000414 0,250138 252863,3 2633,992 571,4286 0 401,9858 971,8684 1620,763 2629,011
3 65,9933 0,001793 0,343974 186587,8 1943,623 727,2727 370,916 783,9582 1564,77 2447,875 2998,741
4 129,1395 0,000248 0,179093 255360,1 2660,001 666,6667 376,971 745,5615 1529,815 2356,944 2861,925
5 106,0052 0,000771 0,285963 186414,1 1941,813 666,6667 424,5933 780,4339 1512,542 2481,498 2879,138
6 0,000395 0,173222 252204,4 2627,129 1333,333 548,094 1120,335 1431,473 2466,648 2816,012
76
UIN
Syarif H
ida
yatu
llah J
akarta
77
7 121,359 0,000778 0,307276 -6257,82 -65,1856 615,3846 434,096 825,7249 1421,465 2438,953 3040,109
8 137,094 0,002299 0,561362 257624,1 2683,585 666,6667 511,4306 791,4471 1481,714 2456,314 2851,501
9 107,8192 0,001812 0,442031 57024,08 594,0008 533,3333 378,9966 790,6747 1523,441 2402,553 3107,775
10 163,5348 0,002087 0,584241 58590,64 610,3192 800 380,4651 928,9974 1569,756 2414,478 2837,678
11 154,0707 0,000762 0,342701 60221,76 627,3099 800 0 790,6709 1474,022 2319,446 2843,431
UIN
Syarif H
ida
yatu
llah J
akarta
77
78
UIN Syarif Hidayatullah Jakarta
LAMPIRAN 2: DAFTAR PENGUJIAN DATA LATIH
No Data Pengujian Dikenali sebagai
Marah Netral Sedih Senang
1 Marah 1 √
2 Marah 2 √
3 Marah 3 √
4 Marah 4 √
5 Marah 5 √
6 Marah 6 √
7 Marah 7 √
8 Marah 8 √
9 Marah 9 √
10 Marah 10 √
11 Marah 11 √
12 Marah 12 √
13 Marah 13 √
14 Marah 14 √
15 Marah 15 √
16 Marah 16 √
17 Marah 17 √
18 Marah 18 √
19 Marah 19 √
20 Marah 20 √
21 Marah 21 √
22 Netral 1 √
23 Netral 2 √
24 Netral 3 √
25 Netral 4 √
26 Netral 5 √
27 Netral 6 √
28 Netral 7 √
29 Netral 8 √
30 Netral 9 √
31 Netral 10 √
32 Netral 11 √
33 Netral 12 √
34 Netral 13 √
35 Netral 14 √
36 Netral 15 √
37 Netral 16 √
38 Sedih 1 √
79
UIN Syarif Hidayatullah Jakarta
39 Sedih 2 √
40 Sedih 3 √
41 Sedih 4 √
42 Sedih 5 √
43 Sedih 6 √
44 Sedih 7 √
45 Sedih 8 √
46 Sedih 9 √
47 Sedih 10 √
48 Sedih 11 √
49 Senang 1 √
50 Senang 2 √
51 Senang 3 √
52 Senang 4 √
53 Senang 5 √
54 Senang 6 √
55 Senang 7 √
56 Senang 8 √
57 Senang 9 √
58 Senang 10 √
59 Senang 11 √
80
UIN Syarif Hidayatullah Jakarta
LAMPIRAN 3: DAFTAR PENGUJIAN DATA UJI
No Data Pengujian Dikenali sebagai
Marah Netral Sedih Senang
1 Marah 22 √
2 Marah 23 √
3 Marah 24 √
4 Marah 25 √
5 Marah 26 √
6 Marah 27 √
7 Marah 28 √
8 Marah 29 √
9 Marah 30 √
10 Marah 31 √
11 Marah 32 √
12 Marah 33 √
13 Marah 34 √
14 Marah 35 √
15 Marah 36 √
16 Marah 37 √
17 Marah 38 √
18 Marah 39 √
19 Marah 40 √
20 Marah 41 √
21 Marah 42 √
22 Marah 43 √
23 Marah 44 √
24 Marah 45 √
25 Marah 46 √
26 Marah 47 √
27 Marah 48 √
28 Marah 49 √
29 Marah 50 √
30 Netral 17 √
31 Netral 18 √
32 Netral 19 √
33 Netral 20 √
34 Netral 21 √
35 Netral 22 √
36 Netral 23 √
81
UIN Syarif Hidayatullah Jakarta
37 Netral 24 √
38 Netral 25 √
39 Netral 26 √
40 Netral 27 √
41 Netral 28 √
42 Netral 29 √
43 Netral 30 √
44 Netral 31 √
45 Netral 32 √
46 Netral 33 √
47 Netral 34 √
48 Netral 35 √
49 Netral 36 √
50 Netral 37 √
51 Netral 38 √
52 Netral 39 √
53 Sedih 12 √
54 Sedih 13 √
55 Sedih 14 √
56 Sedih 15 √
57 Sedih 16 √
58 Sedih 17 √
59 Sedih 18 √
60 Sedih 19 √
61 Sedih 20 √
62 Sedih 21 √
63 Sedih 22 √
64 Sedih 23 √
65 Sedih 24 √
66 Sedih 25 √
67 Senang 12 √
68 Senang 13 √
69 Senang 14 √
70 Senang 15 √
71 Senang 16 √
72 Senang 17 √
73 Senang 18 √
74 Senang 19 √
75 Senang 20 √
82
UIN Syarif Hidayatullah Jakarta
76 Senang 21 √
77 Senang 22 √
78 Senang 23 √
79 Senang 24 √
80 Senang 25 √
81 Senang 26 √
82 Senang 27 √
83
UIN Syarif Hidayatullah Jakarta
Lampiran 4: Surat Bimbingan Skripsi
top related