prediksi numerik
TRANSCRIPT
![Page 1: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/1.jpg)
PREDIKSI Metode Data Mining
1 Data Warehouse & Data Mining
oleh
Aty Rachmawati
Aini Hanifa
Ridwan Effendi
![Page 2: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/2.jpg)
Outline
Metode Prediksi
◦ Analisis Regresi
◦ CART
Penerapan di BI
Implementasi Tools
2 Data Warehouse & Data Mining
![Page 3: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/3.jpg)
Klasifikasi vs Prediksi
KLASIFIKASI PREDIKSI
Memprediksi label
kategorik (diskrit & tak
terurut)
Prediksi Kategorik
Memprediksi label
numerik (kontinu &
terurut)
Prediksi Numerik
3 Data Warehouse & Data Mining
Baik/Buruk
Tipe A/B/C
Aman/Berisiko
Seberapa aman?
Seberapa berisiko?
Berapa jumlah
pendapatan?
![Page 4: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/4.jpg)
Prediksi Numerik
Prediksikan
berapa besar
penghasilan yang akan
diterima karyawan
dengan masa kerja 15
tahun
Data Warehouse & Data Mining 4
Contoh:
Diberikan data berikut
![Page 5: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/5.jpg)
Regresi Linear
Regresi Nonlinear
Model berbasis regresi lainnya
◦ CART (Classification and Regression Tree)
Metode Prediksi Numerik
5 Data Warehouse & Data Mining
Regresi Linear
Regresi Nonlinear
Model berbasis regresi lainnya
• CART(Classification and Regression Tree)
![Page 6: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/6.jpg)
Analisis Regresi
Memodelkan hubungan antara satu atau
lebih variabel prediktor (independent var.)
dan sebuah variabel respons (dependent
var.)
• Regresi Linear Sederhana
• Regresi Linear Multivariabel
• Regresi Nonlinear
6 Data Warehouse & Data Mining
![Page 7: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/7.jpg)
Contoh Regresi Linear
Data Warehouse & Data Mining 7
Tujuan: mencari persamaan linier (garis lurus) terbaik yang
menggambarkan data di atas.
![Page 8: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/8.jpg)
Metode Least Square
Data Warehouse & Data Mining 8
}𝒆𝒏
} 𝒆𝟒 } 𝒆𝟑 } 𝒆𝟐
} 𝒆𝟏
𝑦 = 𝑤1𝑥 + 𝑤0 Metode untuk
meminimalkan
error titik data
terhadap model
regresi
Luaran:
Koefisien
regresi
![Page 9: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/9.jpg)
Regresi Nonlinear
Menerapkan transformasi pada variabel-
variabel menjadi model regresi linear
Contoh:
𝑌 = 𝑒𝑤1𝑥+𝑤0
ln(𝑌) = 𝑤1𝑥 + 𝑤0
9 Data Warehouse & Data Mining
![Page 10: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/10.jpg)
CART
Classification Tree Regression Tree
Data Warehouse & Data Mining 10
![Page 11: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/11.jpg)
Penerapan di BI (lanj)
Memprediksi gaji lulusan perguruan tinggi
dengan x tahun pengalaman kerja
11 Data Warehouse & Data Mining
![Page 12: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/12.jpg)
Penerapan di BI (lanj)
12
Memprediksi berapa lama waktu yang
diperlukan untuk mengantarkan pesanan
berikutnya dengan jarak sekian kilometer
Jarak
(km)
Waktu
(menit)
0,5 9,95
1,1 24,45
1,2 31,75
5,5 35
2,95 25,02
2 16,86
3,75 14,38Data Warehouse & Data Mining
![Page 13: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/13.jpg)
Penerapan di BI (lanj)
Memprediksi kemajuan syaraf motorik
dan skor total dari orang yang mengalami
penyakit parkinson stadium awal dengan
pengukuran suara biomedis
13 Data Warehouse & Data Mining
![Page 14: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/14.jpg)
Deskripsi Data
Data kriminalitas US 1995 (FBI)
Variabel Respon :total number of violent crimes per 100K popuation
Data Warehouse & Data Mining 14
![Page 15: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/15.jpg)
Model Prediksi
Why?
CART dapat melakukan model prediksi
yang memiliki variable respon kontinu
Sederhana, mudah dipahami
Variable prediktor kategorik dan kontinu
Data Warehouse & Data Mining 15
![Page 16: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/16.jpg)
Pra Prosesing Data
Seleksi atribut
Missing value
Data Warehouse & Data Mining 16
![Page 17: Prediksi numerik](https://reader034.vdocuments.net/reader034/viewer/2022042507/55bff158bb61eb8c768b45ab/html5/thumbnails/17.jpg)
Hasil Prediksi
Root Mean Square Error=
480.706823727564
Mean Absolute Error= 315.266224317104
Relative Absolute Error=
0.796029235366585
Data Warehouse & Data Mining 17