prediksi laju inflasi indonesia menggunakan...
TRANSCRIPT
i
PREDIKSI LAJU INFLASI INDONESIA MENGGUNAKAN
METODE SUPPORT VECTOR REGRESSION DENGAN
KERNEL RADIAL BASIS FUNCTION
SKRIPSI
Aulia Asyiva
11150940000030
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA
2019 M / 1440 H
ii
PREDIKSI LAJU INFLASI INDONESIA MENGGUNAKAN
METODE SUPPORT VECTOR REGRESSION DENGAN
KERNEL RADIAL BASIS FUNCTION
Skripsi
Diajukan kepada
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Fakultas Sains dan Teknologi
Untuk Memenuhi Salah Satu Persyaratan Dalam
Memperoleh Gelar Sarjana Matematika (S.Mat)
Oleh :
Aulia Asyiva
11150940000030
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA
2019 M / 1440 H
iii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR
HASIL KARYA SAYA SENDIRI YANG BELUM PERNAH DIAJUKAN
SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI
ATAU LEMBAGA MANAPUN.
Ciputat, 11 Agustus 2019
Aulia Asyiva
NIM. 11150940000030
iv
v
PERSEMBAHAN
Kepada Allah Swt Sang Pencipta Langit dan Bumi
Yang selalu memberikan rahmat, karunia, serta selalu setia mendengar
danmengabulkan doa-doa penulis.
Kepada Kedua Orangtua
Terima kasih kepada Papa dan Mama untuk kasih sayang, doa, dan semua hal
yang sudah diberikan. Maafkan Ananda jikalau selama ini Ananda belum bisa
membuat bangga Papa dan Mama.
vi
KATA PENGANTAR
Assalamualaikum Wr. Wb.
Alhamdulillah, puji beserta syukur kehadirat Allah Yang Maha Esa atas segala
rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi yang
berjudul “Prediksi Laju Inflasi Indonesia Menggunakan Support Vector
Regression Dengan Kernel Radial Basis Function”.
Skripsi ini merupakan persyaratan bagi penulis untuk bisa memperoleh gelar
sarjana. Dalam penulisan skripsi ini penulis memperoleh pembelajaran berharga
seperti kerja keras, pantang menyerah, belajar sopan santun dan melatih kesabaran.
Dalam penyusunan skripsi ini, penulis memperoleh banyak motivasi,
bimbingan, beserta do’a, dari berbagai pihak sehingga skripsi ini dapat
terselesaikan dengan baik. Oleh karena itu, penulis ingin menyampaikan rasa terima
kasih penulis kepada :
1. Ibu Prof. Dr. Lily Surayya Eka Putri, M.Env.Stud, selaku Dekan Fakultas
Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.
2. Ibu Dr. Suma’inna, M.Si, selaku Ketua Program Studi Matematika Fakultas
Sains dan Teknologi UIN Jakarta beserta Ibu Irma Fauziah, M.Sc, selaku
Sekretaris Program Studi Matematika Fakultas Sains dan Teknologi UIN
Jakarta.
3. Bapak Mahmudi, M.Si, sebagai pembimbing I dan Ibu Nurmaleni, M.Si
sebagai pembimbing II yang telah memberikan penulis banyak bantuan,
saran, dan motivasi selama proses pembuatan skripsi ini.
4. Ibu Dr. Nur Inayah, M.Si sebagai penguji I dan Ibu Madona Yunita Wijaya,
M.Sc, sebagai penguji II yang telah memberikan masukan kepada penulis
dalam menyelesaikan skripsi ini.
5. Kedua orang tua, Bapak Drs. Sofyan dan Ibu Dra. Anggia Dermi, M.Pd
tersayang, yang tidak pernah berhenti memberikan doa, kasih sayang,
vii
semangat, dukungan moril serta materil sehingga penulis dapat menjalani
kuliah dan dapat menyelesaikan skripsi ini.
6. Uncu dan Pak Etek, Ibu Dr. Ratna Sari Dewi M.Pd dan Bapak Dr.
Fahrurrozi M.Pd, yang telah memberikan penulis kasih sayang, semangat
dan motivasi selama kuliah.
7. Kakak saya Annisa Maula Zakiya S.Si yang selalu membawa penulis jalan
jalan dan selalu mendengarkan keluh kesah penulis.
8. Teman seperjuangan Dino dan Tanjung yang selalu memberikan masukan
dan motivasi untuk tetap semangat, serta sahabat seperjuangan dari awal
masuk kuliah Ery, Ayu, Shinta, Fitria, Khusnul, Intan, Hamid, Vika dan
Aldo (X-Family) yang selalu ada untuk penulis.
9. Seluruh teman-teman Matematika 2015 yang tidak bias penulis sebutkan
satu persatu.
Penulis menyadari bahwa dalam penyusunan skripsi ini masih terdapat banyak
kekurangan. Penulis mengharapkan kritik dan saran yang membangun dari
pembaca untuk perbaikan di masa yang akan datang. Terakhir, semoga skripsi ini
bermanfaat bagi penulis dan pembaca sekalian.
Ciputat, 11 Agustus 2019
Penulis
viii
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini:
Nama : Aulia Asyiva
NIM : 11150940000044
Program Studi : Matematika Fakultas Sains dan Teknologi
Demi pengembagan ilmu pengetahuan, saya menyetujui untuk memberikan Hak
Bebas Royalti Non-Esklusif (Non-Exclusive-Free Right) kepada Program Studi
Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta atas
karya ilmiah saya yang berjudul :
“PREDIKSI LAJU INFLASI INDONESIA MENGGUNAKAN METODE
SUPPORT VECTOR REGRESSION DENGAN KERNEL RADIAL BASIS
FUNCTION”
Beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti Non-
Eksklusif ini, Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif
Hidayatullah Jakarta berhak menyimpan, mengalihmedia/formatkan, mengelolanya
dalam bentuk pangkalan data (database), mendistribusikannya, dan
menampilkan/mempublikasikannya di internet dan media lain untuk kepentingan
akademis tanpa perlu meminta izin dari saya selama tetap mencantumkan nama
saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Segala bentuk
tuntutan hukum yang timbul atas pelanggaran Hak Cipta karya ilmiah ini menjadi
tanggung jawab saya sebagai penulis.
Demikian pernyataan ini yang saya buat dengan sebenarnya.
Dibuat di Tangerang Selatan
Pada tanggal: 11 Agustus 2019
Yang membuat pernyataan
(Aulia Asyiva)
ix
ABSTRAK
Aulia Asyiva, Prediksi Laju Inflasi Indonesia Menggunakan Support Vector
Regression Dengan Kernel Radial Basis Function di bawah bimbingan Mahmudi,
M.Si dan Nurmaleni, M.Si.
Inflasi merupakan salah satu indikator yang mempengaruhi pertumbuhan
perekonomi suatu negara. Ketidak stabilan nilai inflasi dapat menimbulkan ketidak
pastian mengenai keadaan ekonomi dimasa yang akan datang. Prediksi laju inflasi
perlu dilakukan agar dapat membantu pemerintah merencanakan strategi ekonomi
agar perekonomian negara tetap berada pada nilai kestabilan. Dikehidupan sehari-
hari terkadang data tidak selalu bersifat linear, salah satunya pada data inflasi
Indonesia. Metode Support Vector Regression merupakan salah satu perkembangan
dari metode Support Vector Machine yang digunakan untuk kasus regresi yang
dapat menanggulangi kasus data non-linear. Permasalahan yang sering terjadi
ketika menggunakan metode Support Vector Regression adalah pada saat
menentukan parameter model yang optimal. Salah satu cara untuk menentukan
parameter terbaik pada metode Support Vector Regression adalah menggunakan
Grid Search Optimization. Tahapan metode SVR yang dilakukan meliputi
normalisasi data menggunakan Z-Score, penggunaan kernel Radial Basis Function,
memilih parameter terbaik menggunakan Grid Search Optimization, melakukan
peramalan dan melakukan evaluasi hasil prediksi dengan metode perhitungan Root
Mean Squared Error. Hasil pengujian menunjukkan nilai RMES yang diperoleh
sebesar 0.00000177 dengan nilai parameter sebesar 𝜀 = 0, Cost = 8 dan 𝛾 = 64
dengan jumlah data train 72 dan 36 untuk data test.
Kata kunci: Grid Search Optimization, Inflasi Indonesia, Radial Basis Function
(RBF), Root Mean Squared Error (RMSE), Support Vector Regression (SVR).
x
ABSTRAK
Aulia Asyiva, Prediction of Indonesia's Inflation Rate Using Support Vector
Regression with Radial Basis Function, under the guidance of Mahmudi, M.Si and
Nurmaleni, M.Sc.
Inflation is one of many indicators which increases a country's economic growth.
Instability of inflation values is likely leading to uncertainty about future economic
conditions. Estimates of the rate of growth must be made in order to assist the
government in determining economic strategies to maintain the value of stability in
a country. In daily life, the data is not always linear, one of the examples is data of
inflation in Indonesia. The Support Vector Regression method is one of the
developments from the Support Vector Machine method which is used for
regression cases that can overcome cases of non-linear data. Problems that often
occur while using the Support Vector Regression method is determining the
optimum parameter model. One way to determine the best parameters in the
Support Vector Regression method is to use grid search optimization. The stages of
the Support Vector Regression method covering data normalization using Z-Score,
using the Radial Base Function kernel, selecting the best parameters using Grid
Search Optimization, forecasting and evaluating the test results using the Sum
Square Error calculation method. The experiment results show the RMSE value
obtained are 0.00000177 with the parameter value of ε = 0, Cost = 8 and 𝛾 = 64
with a total data training of 72 and 36 for the data testing.
Keywords: Grid Search Optimization, Indonesian Inflation, Radial Basis Function
(RBF), Root Mean Squared Error (RMSE), Support Vector Regression (SVR).
xi
DAFTAR ISI
HALAMAN AWAL ............................................................................................... i
PERNYATAAN .................................................................................................... iii
LEMBAR PENGESAHAN ..................................... Error! Bookmark not defined.
PERSEMBAHAN .................................................................................................. v
KATA PENGANTAR .......................................................................................... vi
LEMBAR PERNYATAAN PERSETUJUAN ................................................. viii
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS .. viii
ABSTRAK ............................................................................................................ ix
ABSTRAK ............................................................................................................. x
DAFTAR ISI ......................................................................................................... xi
DAFTAR TABEL .............................................................................................. xiii
DAFTAR GAMBAR .......................................................................................... xiv
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang Masalah .......................................................................................... 1
1.2 Perumusan Masalah ................................................................................................. 2
1.3 Pembatasan Masalah ................................................................................................ 3
1.4 Tujuan Penelitian ..................................................................................................... 3
1.5 Manfaat Penelitian ................................................................................................... 3
BAB II LANDASAN TEORI ............................................................................... 4
2.1 Inflasi ....................................................................................................................... 4
2.2 Data Runtun Waktu (Time Series) ........................................................................... 4
2.3 Normalisasi Data ...................................................................................................... 5
2.4 Metode Support Vector Regression ......................................................................... 5
2.5 Fungsi Kernel ........................................................................................................... 9
xii
2.6 Grid Search Optimization ...................................................................................... 10
2.7 Evaluasi Hasil Prediksi Menggunakan Root Mean Squared Error ........................ 11
BAB III METODOLOGI PENELITIAN ......................................................... 13
3.1 Sumber Data........................................................................................................... 13
3.2 Metode Pengolahan Data ....................................................................................... 13
3.3 Alur Penelitian ....................................................................................................... 14
BAB IV PEMBAHASAN .................................................................................... 15
4.1 Statistik Deskriptif ................................................................................................. 15
4.2 Penerapan Metode Support Vector Regression...................................................... 16
4.2.1 Membangun Model Support Vector Regression .............................................. 16
4.2.2 Implementasi pada Data Test .......................................................................... 21
4.3 Hasil Prediksi Inflasi Indonesia ............................................................................. 23
BAB V KESIMPULAN DAN SARAN .............................................................. 25
5.1 Kesimpulan ............................................................................................................ 25
5.2 Saran ...................................................................................................................... 26
REFERENSI ........................................................................................................ 27
LAMPIRAN ......................................................................................................... 29
xiii
DAFTAR TABEL
Tabel 2.1. : Fungsi Kernel ………………………………………...…….……… 10
Tabel 4.1. : Statistik Deskriptif IHK Indonesia ...……………………….……...15
Tabel 4.2. : Nilai Koefisien Lagrange……………………………………….….18
Tabel 4.3. : Hasil RMSE.……………………………………………….……… 21
Tabel 4.4. : Hasil Prediksi dan Nilai Aktual Pada Data Test …………………...22
Tabel 4.5. : Hasil Prakiraan Inflasi Indonesia …………………………………. 23
Tabel 5.1. : Hasil Nilai Prediksi Inflasi Dengan Nilai Aktualnya .………….......25
xiv
DAFTAR GAMBAR
Gambar 2.1. : Ilustrasi Konsep SVR …………………………………………… 6
Gambar 2.2. : Ilustrasi Penggunakan 10-Fold Cross Validation ………………. 11
Gambar 2.3. : Plot Data IHK Indonesia …………………………………….…...14
Gambar 4.2. : Prediksi SVR Tanpa Menggunakan Kernel ……………………. 15
Gambar 4.3. : Grafik Error Ketika 𝜀 = 1 dan Cost = 2−5, 23, 215 Pada Gamma 17
Gambar 4.4. : Hasil Plot Nilai Prakiraan Data Train ………………………...… 18
Gambar 4.5. : Hasil Plot Nilai Prakiraan Data Train …………...……………... 21
Gambar 4.6. : Plot data Aktual dan Prediksi …………………………..…….…. 23
1
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Pada zaman sekarang ini, masyarakat golongan menengah keatas lebih sering
mengkonsumsi barang dan jasa. Hal ini berkaitan dengan besarnya pendapatan yang
diperoleh dan kebutuhan yang harus dipenuhi. Mengkonsumsi barang dan jasa
secara berlebihan merupakan salah satu indikator naiknya laju inflasi suatu negara.
Sesungguhnya Allah SWT telah menganjurkan agar manusia tidak berlebih-lebihan
dalam hal apapun, seperti dalam surat Al-Isro’ ayat 27, yaitu :
رين كانوا إخوان الشياطين وكان الشيطان لرب ه كفورا إن المبذ
“Dan janganlah kamu menghambur-hamburkan (hartamu) secara boros.
Sesungguhnya pemboros-pemboros itu adalah saudara-saudara syaitan.”
Secara sederhana inflasi diartikan sebagai kenaikan harga secara umum dan
terus menerus dalam jangka waktu tertentu. Indikator yang sering digunakan untuk
mengukur tingkat inflasi adalah Indeks Harga Konsumen (IHK). Perubahan IHK
dari waktu ke waktu menunjukkan pergerakan harga dari paket barang dan jasa
yang dikonsumsi masyarakat. Penentuan barang dan jasa dalam perhitungan IHK
dilakukan atas dasar Survei Biaya Hidup (SBH) yang dilaksanakan oleh Badan
Pusat Statistik (BPS) secara berkala [1].
Inflasi merupakan salah satu indikator yang mempengaruhi pertumbuhan
perekonomi suatu negara. Tidak stabilnya laju inflasi dapat menimbulkan ketidak
pastian mengenai keadaan ekonomi dimasa yang akan datang. Prediksi laju inflasi
perlu dilakukan agar dapat membantu pemerintah merencanakan strategi ekonomi
agar perekonomian negara tetap berada pada nilai kestabilan. Begitupun untuk para
investor maupun perusahaan mereka dapat menggunakan data prediksi ini untuk
mengambil ketetapan dalam pengambilan sebuah keputusan.
2
Penelitian terdahulu yang berhubungan dengan pengukuran prediksi laju inflasi
dengan menggunakan metode Statistic Econometric, yaitu Penggunaan Metode
ARIMA dalam Pergerakan Inflasi [2]. Tetapi metode Statistic Econometric ini
hanya dapat mengatasi dengan baik untuk data linear saja. Dikehidupan sehari-hari
terkadang data tidak selalu bersifat linear, salah satunya pada data inflasi Indonesia.
Untuk menanggulangi data nonlinear kita dapat menggunakan metode Support
Vector Regression, dimana metode ini merupakan salah satu perkembangan dari
metode Support Vector Machine yang digunakan untuk kasus regresi [3]. Konsep
dari SVR adalah memaksimalkan hyperplane sehingga dapat memperkecil error.
Untuk membantu mengatasi permasalahan non-linear pada model Support Vector
Regression digunakan bantuan Kernel, dimana pada penelitian ini akan digunakan
bantuan kernel Radial Basis Function.
Permasalahan yang sering terjadi ketika menggunakan metode Support Vector
Regression adalah pada saat menentukan parameter model yang optimal. Salah satu
cara untuk menentukan parameter terbaik pada metode Support Vector Regression
adalah menggunakan Grid Search Optimization. Grid search optimization ini akan
membagi jangkauan parameter yang akan dioptimalkan kedalam grid dan melintasi
semua titik untuk mendapatkan parameter yang optimal [4].
Berdasarkan latar belakang di atas, maka peneliti tertarik untuk mengambil
penelitian yang berjudul “Prediksi Laju Inflasi Indonesia Menggunakan Support
Vector Regression Dengan Kernel Radial Basis Function”
1.2 Perumusan Masalah
1. Bagaimana menentukan parameter terbaik pada model SVR dengan kernel
Radial Basis Function menggunakan Grid Search Optimization?
2. Bagaimanakah akurasi hasil prediksi inflasi Indonesia menggunakan
metode SVR?
3. Bagaimanakah hasil prediksi inflasi Indonesia satu tahun kedepan?
3
1.3 Pembatasan Masalah
1. Penelitian ini menggunakan data sekunder yaitu data bulanan Indeks Harga
Konsumen Indonesia dari tahun 2010 – 2018 yang diambil melalui website
Bank Indonesia.
2. Metode yang digunakan dalam penelitian ini adalah Support Vector
Regression dengan kernel Radial Basis Function dengan menggunakan
Grid Search Optimization sebagai penentu parameter terbaik.
1.4 Tujuan Penelitian
1. Menentukan parameter terbaik pada model Support Vector Regression
menggunakan kernel Radial Basis Function dengan Grid Search
Optimization.
2. Mengetahui akurasi hasil prediksi inflasi Indonesia menggunakan metode
Support Vector Regression.
3. Mengetahui hasil prediksi nflasi Indonesia menggunakan metode Support
Vector Regression.
1.5 Manfaat Penelitian
1. Memberikan informasi serta dapat menjadi acuan dalam pengambilan
kebijakan moneter Bank Indonesia.
2. Memberikan informasi untuk pemerintah khususnya pada bidang ekonomi
serta para pelaku ekonomi untuk mengambil keputusan.
4
BAB II
LANDASAN TEORI
2.1 Inflasi
Inflasi adalah kecenderungan naiknya harga barang dan jasa yang secara umum
terjadi secara terus menerus. Inflasi terjadi ketika harga barang dan jasa di dalam
negeri mengalami peningkatan. Naiknya harga barang dan jasa tersebut
menyebabkan turunnya nilai mata uang. Dengan demikian, inflasi dapat juga
diartikan sebagai penurunan nilai mata uang terhadap nilai barang dan jasa secara
umum [5].
Indeks yang menghitung rata-rata perubahan harga barang dan jasa yang
dikonsumsi oleh rumah tangga dalam kurun waktu tertentu adalah Indeks Harga
Konsumen (IHK). Indeks Harga Konsumen merupakan indikator yang sering
digunakan untuk mengukur tingkat inflasi. Perubahan Indeks Harga Konsumen dari
waktu ke waktu dapat menggambarkan tingkat kenaikan (inflasi) atau tingkat
penurunan (deflasi). Indeks Harga Konsumen. Penentuan barang dan jasa dalam
perhitungan IHK dilakukan atas dasar Survei Biaya Hidup (SBH) yang
dilaksanakan oleh Badan Pusat Statistik (BPS) [5].
2.2 Data Runtun Waktu (Time Series)
Data runtun waktu (time series) merupakan data yang disusun dan
dikumpulkan, sepanjang waktu secara berurutan. Periode waktunya dapat berupa
tahunan, kuartal, bulanan, mingguan dan harian maupun perjam. Model runtun
waktu berusaha untuk memprediksi masa depan mengunakan data historis, dengan
kata lain model runtun waktu mencoba melihat apa yang terjadi pada suatu kurun
waktu tertentu dan menggunakan data masa lalu untuk memprediksi masa yang
akan datang [6].
5
2.3 Normalisasi Data
Normalisasi data merupakan proses pengolahan data yang bertujuan untuk
menstandarkan data agar berada pada jarak tertentu [7]. Salah satu metode
normalisasi data yaitu min-max normalization, dengan rumus :
𝑁 =𝑦 − min (𝑦)
max(𝑦) − min (𝑦)
keterangan :
N = Nilai hasil normalisasi
𝑦 = Nilai IHK
min (𝑦) = Nilai minimum IHK
max(𝑦) = Nilai maksimum IHK
2.4 Metode Support Vector Regression
Metode Support Vector Regression (SVR) merupakan hasil modifikasi dari
Support Vector Machine (SVM) yang diperkenalkan oleh Vapnik (1999) untuk
menyelesaikan permasalahan regresi, sehingga output dari SVR berupa bilangan
rill dan kontinu [3]. Seperti konsep SVM, metode SVR juga mencari hyperplane
terbaik berupa fungsi regresi dengan membuat error sekecil mungkin dengan
memaksimalkan margin.
Ide dasarnya pada metode SVR ini adalah misalkan terdapat data training
{(𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑙, 𝑦𝑙)} dengan 𝑥𝑖 ∈ ℝ𝑑 adalah vector input dari data ke-l
dimana 𝑖 = 1,2, . . , 𝑛, d adalah dimensi dan 𝑦𝑖 adalah nilai target. Pada metode
SVR persamaan fungsi regresi secara umum dapat ditulis sebagai berikut [8]:
𝑓(𝑥) = ⟨𝑤. 𝑥⟩ + 𝑏 (1)
Persamaan (1) merupakan fungsi linear secara umum, dimana ⟨ . ⟩ merupakan
hasil kali (dot product) di ꭓ. Agar mendapatkan generalisasi yang baik untuk fungsi
regresi 𝑓(𝑥) dapat dilakukan dengan meminimalkan 𝑤 dengan penyelesaian
masalah optimasi:
6
1
2||𝑤||2 (2)
dengan syarat:
𝑦𝑖 − ⟨𝑤. 𝑥⟩ − 𝑏 ≤ 𝜀
⟨𝑤. 𝑥⟩ + 𝑏 − 𝑦𝑖 ≤ 𝜀
Pada persamaan (2) diasumsikan semua titik berada pada dan dalam rentang
𝑓(𝑥) ± 𝜀. Ada kondisi dimana nilai kesalahan diperbolehkan melebihi ambang nilai
𝜀, yang diakibatkan oleh titik-titik yang mungkin keluar dari rentang 𝑓(𝑥) ± 𝜀.
Pada kondisi ini dibutuhkan soft margin atau yang biasa disebut dengan variable
slack (𝜉𝑖 + 𝜉𝑖∗) sehingga persamaanya berubah menjadi:
1
2||𝑤||2 + 𝐶 ∑ (𝑙
𝑖=1 𝜉𝑖 + 𝜉𝑖∗) (3)
dengan syarat:
𝑦𝑖 − ⟨𝑤. 𝑥⟩ − 𝑏 ≤ 𝜀+𝜉𝑖
⟨𝑤. 𝑥⟩ + 𝑏 − 𝑦𝑖 ≤ 𝜀 + 𝜉𝑖∗
𝜉𝑖, 𝜉𝑖∗ ≥ 0
Konstanta 𝐶 > 0 merupakan nilai pinalti akibat pelanggaran toleransi terhadap
fungsi 𝑓(𝑥) dan seberapa besar tingkat deviasi kesalahan dari batas 𝜀 yang dapat
ditoleransi. Semua nilai yang lebih besar dari 𝜀 akan dikenakan pinalti sebesar C.
Formulasi (4) disebut 𝜀-intensitive loss function |𝜉𝑖|𝜀 yaitu:
|𝜉𝑖|𝜀 ∶= {0 𝑖𝑓 |𝜉𝑖| ≤ 𝜀|𝜉𝑖| − 𝜀 lainnya
(4)
7
Gambar 2.1. Ilustrasi Konsep SVR.
Nilai 𝜀 yang kecil berkaitan dengan nilai yang tinggi pada variable slack dan
akurasi aproksimasi yang tinggi. Sebaliknya, nilai yang tinggi untuk 𝜀 berkaitan
dengan nilai variable slack yang kecil dan membuat akurasi menjadi rendah. Nilai
slack yang tinggi dapat mengakibatkan kesalahan empiris pada perhitungan.
Penentuan nilai parameter w dan b menjadi masalah pemograman kuadratik
(quadratic programming), yaitu meminimumkan suatu fungsi kuadrat dengan
syarat suatu pertidaksamaan linear. Persoalan ini akan lebih mudah diselesaikan
jika diselesaikan menggunakan Lagrange Multiplier. Solusi optimal untuk
persamaan (3) dengan pembatas pada persamaan (4) dapat dipecahkan dengan
persamaan Lagrange Multiplier [8], seperti:
𝐿 = (1
2||𝑤||2 + 𝐶 ∑ (𝑙
𝑖=1 𝜉𝑖 + 𝜉𝑖∗)) − (∑ 𝛼𝑖(𝜀 +𝑙
𝑖=1 𝜉𝑖 − 𝑦𝑖 + ⟨𝑤.𝑥⟩ + 𝑏)) −
(∑ 𝛼𝑖∗(𝜀 +𝑙
𝑖=1 𝜉𝑖∗ + 𝑦𝑖 − ⟨𝑤.𝑥⟩ − 𝑏)) − (∑ (𝜂𝑖
𝑙𝑖=1 𝜉𝑖 + 𝜂𝑖
∗𝜉𝑖∗)) (5)
Dimana Untuk mendapatkan solusi yang optimal, maka dilakukan turunan
parsial dari L terhadap 𝑤, 𝑏, 𝜉𝑖, 𝜉𝑖∗.
𝜕𝐿
𝜕𝑤= 𝑤 − ∑ (𝑙
𝑖=1 𝛼𝑖 − 𝛼𝑖∗)𝑥𝑖 = 0 (6)
𝜕𝐿
𝜕𝑏= ∑ (𝑙
𝑖=1 𝛼𝑖 − 𝛼𝑖∗) = 0 (7)
𝜕𝐿
𝜕𝜉𝑖= 𝐶 − 𝛼𝑖 − 𝜂𝑖 = 0 (8)
𝜕𝐿
𝜕𝜉𝑖∗ = 𝐶 − 𝛼𝑖
∗ − 𝜂𝑖∗ = 0 (9)
8
Dengan mensubstitusi persamaan (6), (7), (8), dan (9), ke persamaan (5) maka
diperoleh:
−1
2∑ ∑ (𝛼𝑖 − 𝛼𝑖
∗)(𝛼𝑗 − (𝛼𝑗∗)⟨𝑥𝑖 . 𝑥𝑗⟩ − 𝜀𝑙
𝑖=1𝑙𝑖=1 ∑ (𝛼𝑖 + 𝛼𝑖
∗) + ∑ 𝑦𝑖(𝛼𝑖 − 𝛼𝑖∗)𝑙
𝑖=1𝑙𝑖=1 (10)
dengan syarat:
∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗) = 0,
0 ≤ 𝛼𝑖 ≤ 𝐶 ∀𝑖 = 1,2, … ,𝑁
0 ≤ 𝛼𝑖∗ ≤ 𝐶 ∀𝑖 = 1,2, … ,𝑁
Dari proses penurunan rumus pada persamaan (10) didapatkan variable utama
yaitu 𝛼𝑖∗ dan 𝛼𝑖. Solusi permasalahan ini diturunkan dari vektor w kemudian
disubstitusikan kedalam fungsi 𝑓(𝑥).
𝑤 = ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗). 𝑥𝑖 (11)
Selanjutnya kita dapat memaksimalkan nilai b dari kondisi:
𝛼𝑖(𝜀+𝜉𝑖 + 𝑦𝑖 − ⟨𝑤. 𝑥⟩ − 𝑏) = 0 (12)
𝛼𝑖∗(𝜀+𝜉𝑖
∗ − 𝑦𝑖 + ⟨𝑤. 𝑥⟩ + 𝑏) = 0
(𝐶 − 𝛼𝑖)𝜉𝑖 = 0 (13)
(𝐶 − 𝛼𝑖∗)𝜉𝑖
∗ = 0
Sehingga,
𝑏 = 𝑦𝑖 − ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗). ⟨𝑥𝑖. 𝑥𝑗⟩ + 𝜀 dan 𝑏∗ = 𝑦𝑖 − ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗). ⟨𝑥𝑖 . 𝑥𝑗⟩ − 𝜀
Dari persamaan (13) didapatkan 𝐶 = 𝛼𝑖, maka mengakibatkan nilai w dihitung
bergantung dengan nilai Support Vectornya. Setelah mendapatkan nilai 𝑤 dan 𝑏
selanjutnya substitusikan persamaan (1) dan persamaan (11) maka akan didapat
persamaan baru, yaitu:
𝑓(𝑥) = ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗). ⟨𝑥𝑖 . 𝑥𝑗⟩ + 𝑏 (14)
9
Persamaan (13) adalah persamaan yang digunakan untuk menghitung
persamaan linear. Sedangkan permasalahan untuk non-linear nilai 𝑥𝑖 dan 𝑥𝑗 terlebih
dahulu ditransformasikan ke dalam feature space dengan cara memetakan vector 𝑥𝑖
dan 𝑥𝑗 ke dalam fungsi Φ, yaitu Φ ∶ R → 𝑅𝑧 menghasilkan persamaan:
𝑤 = ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗)𝜙(𝑥𝑖) (15)
Sehingga persamaan akhir didapatkan,
𝑓(𝑥) = ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗)Φ(𝑥𝑖)Φ(𝑥𝑗) + 𝑏 (16)
Karena input vector 𝑥𝑖 dan 𝑥𝑗 sudah ditransformasikan oleh fungsi Φ dan
berada didalam feature space, maka fungsi transformasi Φ dapat direpresentasikan
dengan fungsi kernel 𝐾 sebagai berikut:
K(𝑥𝑖, 𝑥𝑗) = Φ(𝑥𝑖)Φ(𝑥𝑗)
Sehingga mendapatkan persamaan akhir yaitu:
𝑓(𝑥) = ∑ (𝑙𝑖=1 𝛼𝑖 − 𝛼𝑖
∗)K(𝑥𝑖, 𝑥𝑗) + 𝑏 (17)
Fungsi K(𝑥𝑖, 𝑥𝑗) merupakan kernel trick yang sering digunakan dalam metode
SVM maupun SVR.
2.5 Fungsi Kernel
Untuk membantu mengatasi permasalahan non-linear pada dimensi tinggi yang
harus dilakukan yaitu mengganti inner product (𝑥𝑖 𝑑𝑎𝑛 𝑥𝑗) dengan fungsi kernel
yang telah dipilih [9]. Karena kinerja dari metode SVR ditentukan oleh jenis fungsi
kernel dan parameter yang akan digunakan [10]. Fungsi kernel yang biasa
digunakan pada SVR adalah sebagai berikut:
10
Tabel 2.1. Fungsi Kernel
No Tipe Kernel Formula
1. Linear 𝐾(𝑥𝑖 . 𝑥𝑗) = (𝑥𝑖𝑇 − 𝑥)
2. Polynomial 𝐾(𝑥𝑖 . 𝑥𝑗) = (𝑥𝑖 . 𝑥𝑗 + 1)𝑝
3. Fungsi Radial Basis 𝐾(𝑥𝑖 . 𝑥𝑗) = exp (−𝛾(𝑥𝑖 − 𝑥𝑗)2)
Pada penelitian ini akan digunakan kernel Radial Basis Function, karena RBF
merupakan fungsi kernel yang biasa digunakan dalam analisis ketika data tidak
terpisah secara linear, serta penelitian pada umumnya kernel RBF telah terbukti
mengungguli dari kernel lainnya [11] Kernel RBF memiliki parameter Gamma
yang digunakan untuk menentukan seberapa jauh pengaruh dari satu sampel dalam
data training.
2.6 Grid Search Optimization
Salah satu langkah untuk menentukan parameter optimal dari model SVR
adalah menggunakan Grid Search Optimization. Grid Search Optimization ini
membagi jangkauan parameter yang akan dioptimalkan kedalam grid dan melintasi
semua titik untuk mendapatkan parameter yang optimal [4]. Pada penelitian ini
range yang digunakan adalah 𝜀 = (0, 0.1, 0.2, … 1), 𝐶 = (2−5, 2−4, … , 215) dan
untuk 𝛾 = ( 2−3, 2−4, … , 215) dimana 𝐶 dan 𝛾 merupakan barisan eksponensial.
Grid Search akan melatih beberapa pasang model dan akhirnya akan memilih
pasangan dengan rata-rata error terkecil.
Dalam aplikasinya, Grid Search Optimization biasanya diukur dengan cross
validation pada data training. Oleh karena itu disarankan untuk mencoba beberapa
variasi pasangan parameter pada hyperplane SVR [12]. Cross validation adalah
pengujian standar yang dilakukan untuk memprediksi error rate. Data Training
dibagi secara random kedalam beberapa bagian dengan perbandingan yang sama
kemudian error rate dihitung bagian demi bagian, selanjutnya hitung rata-rata
seluruh error rate untuk mendapatkan error rate secara keseluruhan [13].
11
Salah satu metode teknik cros validation yang umum digunakan adalah k-fold
cross validation. Berikut prosedur k-fold cross validation [14]:
1. Membagi data menjadi k bagian dengan ukuran yang sama
2. k-1 bagian dijadikan data latih dan satu bagian dijadikan data uji
3. proses ini dilakukan sebanyak k pengulangan pada setiap kombinasi data uji
dan data latih.
Nilai akurasi dari setiap iterasi dirata-ratakan untuk mendapatkan estimasi nilai
akurasi akhir. Sebagai contoh, sebuah data menggunakan 10-fold cross validation.
Hal ini berarti data tersebut dibagi menjadi 10 bagian, dimana 1 bagian menjadi
data uji dan 9 bagian sisanya menjadi data latih. Proses ini dilakukan sebanyak 10
kali sedemikian sehingga untuk setiap data pernah menjadi data uji dan data latih.
Gambar 2.2. Ilustrasi Penggunakan 10-Fold Cross Validation
2.7 Evaluasi Hasil Prediksi Menggunakan Root Mean Squared Error
Salah satu metode untuk menghitung hasil evaluasi suatu model kita dapat
menggunakan perhitungan Root Mean Squared Error [15].
12
𝑅𝑀𝑆𝐸 = √1
𝑛∑(𝑦𝑖 − 𝑦��)2
𝑛
𝑖=1
keterangan :
𝑦𝑖 = Data aktual periode t
𝑦�� = Data prediksi periode t
n = Jumlah data
13
BAB III
METODOLOGI PENELITIAN
3.1 Sumber Data
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh
dari website resmi Bank Indonesia, yaitu data Inflasi yang berdasarkan nilai Indeks
Harga Konsumen setiap bulannya dari Januari 2010 sampai dengan Desember
2018.
3.2 Metode Pengolahan Data
Langkah – langkah pemodelan dengan menggunakan Support Vector
Regression adalah sebagai berikut:
1. Penentuan Input dan Output. Data input dan output yang digunakan pada
penelitian ini adalah data runtun waktu (time series), yaitu data Indeks Harga
Konsumen setiap bulannya dari Januari 2010 sampai dengan Desember 2018
yang diambil melalui website Bank Indonesia.
2. Menormalisasikan data menggunakan metode Z-score.
3. Menentukan data training dan data testing. Dalam penelitian ini jumlah data
training sebanyak 76 data, dan 32 data sebagai data test.
4. Pemodelan dengan Support Vector Regression pada data Training.
5. Penentuan nilai parameter pada adata training. Penentuan nilai parameter C
(cost), 𝜀 (Epsilon), dan 𝛾 (Gamma) dilakukan dengan menerapkan Grid Search
Optimization.
6. Penentuan model terbaik dengan melakukan evaluasi hasil nilai akurasi terbaik.
Pada penelitian ini untuk menentukan hasil prediksi terbaik menggunakan nilai
RMSE.
7. Melakukan prediksi satu tahun kedepan.
14
3.3 Alur Penelitian
Mulai
Pengumpulan Data
Normalisasi Data
Membangun Model Data Train Persamaan 13
Penentuan Nilai Parameter
𝜀, C dan 𝛾 dengan Grid
Search Optimization
Mendapatkan Model Terbaik Persamaan 15
Melakukan Pengujian
pada data test
Selesai
Melakukan
Prediksi
Evaluasi Hasil dengan
Melihat Nilai RMSE
15
BAB IV
PEMBAHASAN
4.1 Statistik Deskriptif
Data yang digunakan pada penelitian ini adalah data Indeks Harga Konsumen
Indonesia dari Januari 2010 sampai dengan Desember 2018 yang diambil melalui
website Bank Indonesia. Berikut plot data Indeks Harga Konsumen Indonesia :
Gambar 4.1. Data IHK Indonesia
Terlihat pada Gambar 4.1 plot untuk data indeks harga konsumen naik turun
dan tidak membentuk garis lurus. Maka demikian data Indeks Harga Konsumen
merupakan data non linear.
Tabel 4.1. Statistik Deskriptif IHK Indonesia
IHK Keterangan (Dalam Persen)
Min 2.79
Max 8.79
Median 4.515
Mean 5.01
Std. Dev 1.65
16
Pada Tabel 4.1 diperoleh nilai minimum dari data Indeks Harga Konsumen
Indonesia sebesar 2.79% dan nilai maximum sebesar 8.79%. Jarak antara data
terhadap nilai rata-ratanya (standar deviasi) sebesar 1.65%. Median dari data
diperoleh sebesar 4.515% dan rata-rata Indeks Harga Konsumen Indonesia sebesar
1.65%.
Langkah selanjutnya yaitu menormalisasikan data menggunakan metode
perhitungan normalisasi min-max. Data yang sudah dinormalisasi dapat dilihat
pada Lampiran 4.2. Setelah dilakukannya normalisasi data, dilanjutkan dengan
membagi data menjadi data train dan data test yang dapat dilihat pada Lampiran
4.3.
4.2 Penerapan Metode Support Vector Regression
4.2.1 Membangun Model Support Vector Regression
Untuk membangun model SVR pada aplikasi R dibutuhkan package
tambahan yaitu e1071. Dengan menggunakan package e1071 selanjutnya
dilakukan prediksi yang dibuat oleh model berdasarkan data train yang dapat
dilihat pada Gambar 4.1.
Gambar 4.2. Prediksi SVR Tanpa Menggunakan Kernel
17
Titik berwarna merah pada Gambar 4.1 merupakan hasil prediksi secara
default oleh sistem dengan parameter 𝜀 = 0.1, C = 1 dan 𝛾 = 1, sedangkan titik
hitam merukapan data train. Untuk mendapatkan hasil yang maksimal maka
perlu dilakukan pengoptimalan model menggunakan Grid Search Optimization
dengan pemilihan tipe kernel Radial Basis Function.
Dengan menggunakan Grid Search Optimization pada kernel Radial
Basis Function didapatkan parameter sebesar 𝜀 = 0, C = 8 dan 𝛾 = 64 yang
menghasilkan error sebesar 0.00463245. untuk lebih jelas dapat dilihat pada
Gambar 4.3, 4.4 dan 4.5.
Gambar 4.3. Grafik Error Ketika 𝜀 = 1 dan Cost = 2−5, 23, 215 Pada Gamma
Pada Gambar 4.3 grafik error ketika 𝜀 = 0 terlihat nilai error terkecil
pada saat C = 23 dan 𝛾 = 26 sebesar 0.0046, selanjutnya grafik error ketika
𝜀 = 0.5 terlihat bahwa nilai error terkecil pada saat, C = 215 dan 𝛾 = 8 sebesar
0.013, dan grafik error ketika 𝜀 = 1 terlihat bahwa nilai error terkecil pada saat
C = 215 dan 𝛾 = 2 sebesar 0.0333. Maka parameter yang akan digunakan pada
model adalah ketika 𝜀 = 0, C = 23 dan 𝛾 = 26 yang menghasilkan error
terkecil.
Parameter yang telah didapatkan sebelumnya digunakan untuk
memprediksi data train, dan menghasilkan prediksi seperti pada Gambar 4.2.
18
Gambar 4.4. Hasil Plot Nilai Prediksi Data Train
Gambar 4.2 terlihat hasil prediksi pada data train setelah menggunakan
parameter terbaik yang sudah didapatkan sebelumnya. Hasil prediksi
ditunjukkan dengan titik berwarna hijau, dan data train ditunjukkan dengan
titik berwarna hitam. Dengan melihat Gambar 4.2 terlihat bahwa data prediksi
hampir mendekati data aktual.
Karena data non-linear makan digunakan suatu fungsi kernel untuk
mengatasinya. Pertama akan dihitung matriks kernel K. pada kasus ini
digunakan fungsi kernel Radial Basis Function, sehingga didapatkan matrix
dengan ukuran 76 × 76 sebagai berikut :
𝐾(𝑥𝑖 . 𝑥𝑗) =
[
1 1.58𝑒 − 28 3.8𝑒 − 1241.58𝑒 − 28 1 1.24𝑒285.69𝑒 − 112 1.24𝑒 − 28 1
6,58𝑒 − 251 … 05.64𝑒 − 251 … 01.064𝑒 − 28 … 0
6.58𝑒 − 251 6.49𝑒 − 112 1.06𝑒 − 28… … …0 0 0
1 … 0 … … … 0 … 1]
Matriks lengkapnya dapat dilihat pada lampiran 4. Selanjutnya,
melakukan analisis pada model Support Vector Regression. Untuk
19
mendapatkan nilai w terlebih dahulu mencari nilai koefisien Lagrgange.
Dengan menggunakan bantuan R didapatkan nilai koefisien Lagrange pada
Tabel 4.2 yaitu:
Tabel 4.2. Nilai Koefisien Lagrange
No. 𝜶𝒊 − 𝜶𝒊∗
No. 𝜶𝒊 − 𝜶𝒊
∗
1 −𝟑, 𝟎𝟏𝟒
17 𝟐, 𝟏𝟎𝟔
2 𝟓, 𝟓𝟒𝟖
18 𝟓, 𝟏𝟑
3 −𝟖
19 −𝟖
4 𝟔, 𝟐𝟖𝟖
20 𝟓, 𝟐𝟐𝟒
5 −𝟎, 𝟎𝟑𝟐
21 −𝟎, 𝟗𝟓
6 −𝟖
22 −𝟑, 𝟏𝟑𝟐
7 𝟓, 𝟐𝟓𝟔
23 𝟓, 𝟔𝟒𝟐
8 𝟓, 𝟗𝟒𝟒
24 −𝟖
9 −𝟖
25 𝟖
10 𝟐, 𝟏𝟒𝟔
26 −𝟓, 𝟔𝟖𝟐
11 −𝟐, 𝟑𝟑𝟐
27 −𝟐, 𝟐𝟒𝟗
12 𝟖
28 𝟖
13 −𝟔, 𝟖𝟐𝟖
29 −𝟖
14 −𝟎, 𝟒𝟗𝟓
30 𝟒, 𝟓𝟕𝟗
15 𝟖
31 −𝟒, 𝟎𝟎𝟗
16 −𝟖
32 𝟓, 𝟕𝟖𝟗
33 −𝟖
55 −𝟖
34 𝟖
56 −𝟐, 𝟎𝟐𝟑
35 −𝟖
57 𝟖
36 𝟕, 𝟔𝟐𝟓
58 −𝟔, 𝟔𝟏𝟕
37 −𝟓, 𝟎𝟕𝟒
59 −𝟐, 𝟓𝟑𝟏
38 −𝟑, 𝟎𝟓𝟓
60 𝟖
39 𝟖
61 −𝟎, 𝟎𝟖
20
40 −𝟒, 𝟏𝟓𝟖
62 −𝟖
41 𝟐, 𝟐𝟏𝟗
63 𝟖
42 −𝟖
64 −𝟒, 𝟖𝟏𝟏
43 𝟖
65 𝟒, 𝟔𝟕𝟐
44 𝟑, 𝟓𝟑
66 −𝟑, 𝟗𝟖𝟕
45 −𝟖
67 𝟏, 𝟖𝟑𝟓
46 𝟑, 𝟒𝟑𝟔
68 𝟑, 𝟖𝟐𝟔
47 𝟓, 𝟏𝟔𝟔
69 −𝟖
48 −𝟖
70 𝟖
49 𝟖
71 −𝟎, 𝟏𝟖
50 −𝟓, 𝟒𝟐𝟖
72 −𝟖
51 𝟔, 𝟗𝟔𝟐
73 𝟖
52 −𝟖
74 −𝟕, 𝟓𝟏𝟓
53 𝟐, 𝟔𝟐𝟐
75 𝟖
54 𝟖
76 −𝟓, 𝟑𝟔𝟗
Setelah mendapatkan nilai koefisien Lagrange kita dapat menentukan
nilai 𝑤 dengan mengalikan nilai koefisien Lagrange dengan nilai 𝜙(𝑥𝑖)
menggunakan persamaan (15) yaitu :
𝑤 = ∑(
𝑙
𝑖=1
𝛼𝑖 − 𝛼𝑖∗)𝜙(𝑥𝑖)
𝑤 = 3,006687
Setelah mendapatkan nilai 𝑤 selanjutnya dapat menentukan nilai 𝑏 dari
persamaan 12. Dengan bantuan R didapatkan 𝑏 sebesar 0,091. Dari nilai 𝑤 dan
𝑏 yang sudah didapatkan, maka fungsi untuk model Support Vector Regression
adalah :
𝑦(𝑥) = ∑3,006687. 𝐾 ⟨𝑥𝑖, 𝑥𝑗⟩ + 0,091
21
4.2.2 Implementasi pada Data Test
Setelah mendapatkan model terbaik pada langkah sebelumnya,
selanjutnya memasukkan model terbaik beserta parameternya pada data test.
Hasil prediksi model terbaik beserta parameternya ini dapat dilihat pada
Gambar 4.3.
Gambar 4.5. Hasil Plot Nilai Prediksi Data Test
Pada Gambar 4.3 terlihat hasil prediksi pada data test. Hasil prediksi
ditunjukkan dengan titik berwarna hijau dan data test ditunjukkan dengan titik
berwarna hitam. Dengan melihat Gambar 4.3 terlihat bahwa data prediksi
mendekati data aktual.
Ketepatan hasil prediksi juga dapat dilihat dari perhitungan nilai Sum
Square Error yang dapat dilihat pada Tabel 4.2.
Tabel 4.3. Hasil RMSE
Data Set RMSE
Data Test 0.00000177
22
Dari Tabel 4.2 terlihat nilai RMSE yang dihasilkan yaitu sebesar
0.00000177 yang artinya kemampuan model dapat mengikuti pola data adalah
sangat baik. Berikut perbandingan nilai hasil prediksi dan nilai aktual pada data
test :
Tabel 4.4. Hasil Prediksi dan Nilai Aktual Pada Data Test
Bulan Data
Aktual
Data
Prediksi
Bulan Data
Aktual
Data
Prediksi
77 3,33 3,32992
93 3,72 3,72011
78 3,45 3,44983
94 3,58 3,57981
79 3,21 3,20992
95 3,3 3,30002
80 2,79 2,78992
96 3,61 3,61002
81 3,07 3,0699
97 3,25 3,25013
82 3,31 3,31011
98 3,18 3,17985
83 3,58 3,57999
99 3,4 3,40017
84 3,02 3,02016
100 3,41 3,40998
85 3,49 3,48986
101 3,23 3,23011
86 3,83 3,83011
102 3,12 3,11993
87 3,61 3,61003
103 3,18 3,18014
88 4,17 4,17003
104 3,2 3,19979
89 4,33 4,33007
105 2,88 2,88003
90 4,37 4,36992
106 3,16 3,15996
91 3,88 3,88
107 3,23 3,2301
92 3,82 3,8199
108 3,13 3,12996
Dari Table 4.3 terlihat hasil prediksi mendekati nilai aktualnya, sehingga
dapat dikatakan model dengan parameter yang digunakan cocok dengan data
inflasi Indonesia.
23
Gambar 4.6. Plot Data Aktual dan Prediksi
Pada Gambar 4.4 juga dapat dilihat bahwa data prediksi dengan model
menghasilkan data prediksi yang dapat mengikuti d ata aktual dengan baik.
4.3 Hasil Prediksi Inflasi Indonesia
Hasil prediksi inflasi Indonesia periode Januari 2019 sampai Desember 2019
dengan model terbaik yang telah didapatkan, dapat dilihat pada Table 4.4.
Tabel 4.5. Hasil Prediksi Inflasi Indonesia
Waktu Prediksi
Januari 2019 2.82
Februari 2019 2.54
Maret 2019 2.51
April 2019 2.70
Mei 2019 2.95
24
Juni 2019 3.12
Juli 2019 3.22
Agustus 2019 3.25
September 2019 3.26
Oktober 2019 3.26
November 2019 3.26
Desember 2019 3.26
Berdasarkan Tabel 4.4 terlihat nilai inflasi pada bulan Januari sampai dengan
Desember 2018 mengalami fase naik turun namun tidak drastis.
25
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Prediksi laju inflasi Indonesia menggunakan metode Support Vector
Regression dengan Grid Search Optimization didapatkan parameter sebesar 𝜀 = 0,
C = 8 dan 𝛾 = 64. Parameter yang didapatkan digunakan sebagai parameter model
terbaik untuk melakuan prediksi laju inflasi Indonesia satu tahun kedepan.
Akurasi hasil prediksi inflasi Indonesia menggunakan metode Support Vector
Regression dengan melihat nilai Root Mean Squared Error sebesar 0.00000177.
Hasil prediksi inflasi Indonesia satu tahun kedepan dari Januari 2019 sampai
dengan Desember 2019 dapat dilihat pada Tabel 5.1. Terlihat laju inflasi mengalami
fase naik turun namun tidak drastis. Berikut diberikan perbandingan tabel prediksi
laju inflasi Indonesia dengan nilai aktual inflasi Indonesia.
Tabel 5.1 Hasil Nilai Prediksi Inflasi Dengan Nilai Aktualnya
Waktu Prediksi Inflasi Aktual Inflasi
Januari 2.82 2.82
Februari 2.54 2.57
Maret 2.51 2.48
April 2.70 2.83
Mei 2.95 3.32
Juni 3.12 3.28
Juli 3.22 3.32
26
5.2 Saran
Untuk penelitian selanjutnya peneliti dapat melakukan perbandingan hasil
dengan pemilihan kernel yang berbeda seperti kernel polinomial. Penelitian
selanjutnya juga dapat membandingkan dengan metode normalisasi lainnya, seperti
Z-Score atau normalization by decimal scaling.
27
REFERENSI
[1] January 2019. [Online]. Available:
https://www.bi.go.id/id/moneter/inflasi/data/Default.aspx. [Accessed 12 Juni
2019].
[2] Hartati, “Penggunaan Metode ARIMA dalam Meramalkan Inflasi,” Jurnal
Matematika, Sains, dan Teknologi, vol. 18, no. 1, pp. 1-10, 2017.
[3] M. D. Moura, Z. Enrico, L. D. Isis dan D. Enrique, “Failure and reliability
prediction by support vector machines regression of time series data,”
Reliability Engineering and System Safety, vol. XCVI, no. 11, pp. 1527-1534,
2011.
[4] H. Yasin, A. Prahutama dan T. W. Utami, “Prediksi Harga Saham
Menggunakan Support Vector Regression dengan Algoritma Grid Search,”
Media Statistika, vol. VII, no. 1, pp. 29-35, 2014.
[5] "Badan Pusat Statistik," Badan Pusat Statistik, [Online]. Available:
https://www.bps.go.id/subject/3/inflasi.html#subjekViewTab1. [Accessed 25
April 2019].
[6] M. Spyross, W. C. Steven dan M. E. Victor, Metode dan Aplikasi Peramalan,
Jakarta: Erlangga, 1999.
[7] E. M. Apriliani, A. T. Putra dan M. A. Muslim, "Forecasting Inflation Rate
Using Support Vector Regression (SVR) Based Weight Attribute Particle
Swarm Optimization (WAPSO)," Scientific Journal of Informatics, vol. V,
no. 2, 2018.
[8] A. J. Smola dan B. Scholkopf, “A tutorial On Support Vector Regression,”
Statistics and Computing, vol. 14, p. 199–222, 2004.
28
[9] R. P. Furi, Jondri dan D. Saepudin, "Prediksi Financial Time Series
Menggunakan Independent," vol. II, no. 2, p. 3608, 2015.
[10] L. Mengshi, J. L. Wu, T. Y. Ji dan Q. Wu, “Short-Term Load Forecasting
Using Support Vector,” Power & Energy Society General Meeting, 2015.
[11] T. Joachims, “Text Categorization With Support Vector Machines: Learning
With Many Relevant Features,” no. 1398, pp. 137-142, 1998.
[12] C. W. Hsu, C. C. Chang dan C. J. Lin, “A Practical Guide to Support Vektor
Classification, Department of Computer Science and Information
Engineering,” 2004.
[13] B. Santosa, Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis,
Yogyakarta: Graha Ilmu, 2007.
[14] H. Jiawei, K. Micheline dan P. Jian, Data Mining Concepts and Techniques,
San Francisco: Morgan Kaufmann, 2011.
[15] L. Zhang dan L. Jinchang, “Inflation Forecasting Using Support Vector
Regression,” dalam 2012 Fourth International Symposium on Information
Science and Engineering, Shanghai, 2012.
29
LAMPIRAN
LAMPIRAN I
Data Inflasi Indonesia berdasarkan Indeks Harga Konsumen Indonesia dari
Januari2010 sampai dengan Desember 2018
X Y X Y X Y X Y
1 3,72 31 4,56
61 6,96 91 3,88
2 3,81 32 4,58
62 6,29 92 3,82
3 3,43 33 4,31
63 6,38 93 3,72
4 3,91 34 4,61
64 6,79 94 3,58
5 4,16 35 4,32
65 7,15 95 3,3
6 5,05 36 4,3
66 7,26 96 3,61
7 6,22 37 4,57
67 7,26 97 3,25
8 6,44 38 5,31
68 7,18 98 3,18
9 5,8 39 5,9
69 6,83 99 3,4
10 5,67 40 5,57
70 6,25 100 3,41
11 6,33 41 5,47
71 4,89 101 3,23
12 6,96 42 5,9
72 3,35 102 3,12
13 7,02 43 8,61
73 4,14 103 3,18
14 6,84 44 8,79
74 4,42 104 3,2
15 6,65 45 8,4
75 4,45 105 2,88
16 6,16 46 8,32
76 3,6 106 3,16
17 5,98 47 8,37
77 3,33 107 3,23
18 5,54 48 8,38
78 3,45 108 3,13
19 4,61 49 8,22
79 3,21
20 4,79 50 7,75
80 2,79
21 4,61 51 7,32
81 3,07
22 4,42 52 7,25
82 3,31
23 4,15 53 7,32
83 3,58
24 3,79 54 6,7
84 3,02
25 3,65 55 4,53
85 3,49
26 3,56 56 3,99
86 3,83
27 3,97 57 4,53
87 3,61
28 4,5 58 4,83
88 4,17
29 4,45 59 6,23
89 4,33
30 4,53 60 8,36
90 4,37
30
LAMPIRAN II
Data yang sudah di normalisasi dengan Min-Max Normalization
X N X N X N X N
1 0,155 31 0,295 61 0,695 91 0,181667
2 0,17 32 0,298333 62 0,583333 92 0,171667
3 0,106667 33 0,253333 63 0,598333 93 0,155
4 0,186667 34 0,303333 64 0,666667 94 0,131667
5 0,228333 35 0,255 65 0,726667 95 0,085
6 0,376667 36 0,251667 66 0,745 96 0,136667
7 0,571667 37 0,296667 67 0,745 97 0,076667
8 0,608333 38 0,42 68 0,731667 98 0,065
9 0,501667 39 0,518333 69 0,673333 99 0,101667
10 0,48 40 0,463333 70 0,576667 100 0,103333
11 0,59 41 0,446667 71 0,35 101 0,073333
12 0,695 42 0,518333 72 0,093333 102 0,055
13 0,705 43 0,97 73 0,225 103 0,065
14 0,675 44 1 74 0,271667 104 0,068333
15 0,643333 45 0,935 75 0,276667 105 0,015
16 0,561667 46 0,921667 76 0,135 106 0,061667
17 0,531667 47 0,93 77 0,09 107 0,073333
18 0,458333 48 0,931667 78 0,11 108 0,056667
19 0,303333 49 0,905 79 0,07
20 0,333333 50 0,826667 80 0
21 0,303333 51 0,755 81 0,046667
22 0,271667 52 0,743333 82 0,086667
23 0,226667 53 0,755 83 0,131667
24 0,166667 54 0,651667 84 0,038333
25 0,143333 55 0,29 85 0,116667
26 0,128333 56 0,2 86 0,173333
27 0,196667 57 0,29 87 0,136667
28 0,285 58 0,34 88 0,23
29 0,276667 59 0,573333 89 0,256667
30 0,29 60 0,928333 90 0,263333
31
LAMPIRAN III
Data Train
X N X N X N X N
1 0,155 20 0,333333 39 0,518333 58 0,34
2 0,17 21 0,303333 40 0,463333 59 0,573333
3 0,106667 22 0,271667 41 0,446667 60 0,928333
4 0,186667 23 0,226667 42 0,518333 61 0,695
5 0,228333 24 0,166667 43 0,97 62 0,583333
6 0,376667 25 0,143333 44 1 63 0,598333
7 0,571667 26 0,128333 45 0,935 64 0,666667
8 0,608333 27 0,196667 46 0,921667 65 0,726667
9 0,501667 28 0,285 47 0,93 66 0,745
10 0,48 29 0,276667 48 0,931667 67 0,745
11 0,59 30 0,29 49 0,905 68 0,731667
12 0,695 31 0,295 50 0,826667 69 0,673333
13 0,705 32 0,298333 51 0,755 70 0,576667
14 0,675 33 0,253333 52 0,743333 71 0,35
15 0,643333 34 0,303333 53 0,755 72 0,093333
16 0,561667 35 0,255 54 0,651667 73 0,225
17 0,531667 36 0,251667 55 0,29 74 0,271667
18 0,458333 37 0,296667 56 0,2 75 0,276667
19 0,303333 38 0,42 57 0,29 76 0,135
Data Test
X N X N X N X N
1 0,09 9 0,116667 17 0,155 25 0,073333
2 0,11 10 0,173333 18 0,131667 26 0,055
3 0,07 11 0,136667 19 0,085 27 0,065
4 0 12 0,23 20 0,136667 28 0,068333
5 0,046667 13 0,256667 21 0,076667 29 0,015
6 0,086667 14 0,263333 22 0,065 30 0,061667
7 0,131667 15 0,181667 23 0,101667 31 0,073333
8 0,038333 16 0,171667 24 0,103333 32 0,056667