pembahasan
TRANSCRIPT
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 1/11
Regresi Logistik
1
BAB I
PENDAHULUAN
1.1 Latar belakang
Metode regresi logistik merupakan sebuah metode yang dapat dipakai
untuk memodelkan data dengan respon/variabel dependen dikotomus atau
politomus.
Seringkali di dalam penelitian, seseorang ingin memodelkan hubungan antara
variabel X (prediktor; bebas) dan Y (respon; terikat). Metode yang paling sering
dipakai dalam kasus seperti itu adalah regresi linier, baik sederhana maupun
berganda.
Namun, adakalanya regresi linier dengan metode OLS (Ordinary Least Square)
yang sering dipakai tersebut kurang sesuai untuk digunakan. Dikatakan kurang sesuai
karena jika regresi linier biasa digunakan akan terjadi pelanggaran asumsi Gauss-
Markov. Misalnya pada kasus dimana variabel respon (Y) bertipe data nominal,
sedangkan variabel bebas/prediktornya (X) bertipe data interval atau rasio.
Contoh kasus (diambil dari rencana skripsi Choirul Maqsudi):
Ingin diketahui apakah konsumen akan membeli makanan di rumah makan
berdasarkan penilaian konsumen terhadap lokasi, pelayanan, pendapatan,
kebersihan, selera dan harga. Dalam kasus ini hanya ada 2 kemungkinan respon
konsumen, yaitu konsumen membeli dan tidak membeli.
Dari contoh kasus di atas, dapat diketahui bahwa tipe data variabel respon (Y)
adalah nominal, yaitu kategorisasi keputusan konsumen apakah membeli atau tidak
(misal membeli dilambangkan angka 1, sedangkan tidak membeli dengan angka 0),
sedangkan tipe data untuk variabel bebas (X) setidak-tidaknya interval (skala likert).
Bila metode regresi linier biasa diterapkan pada kasus semacam ini, menurut Kutner,
dkk.(2004), akan terdapat 2 pelanggaran asumsi Gauss-Markov dan 1 buah
pelanggaran terhadap batasan dari nilai duga ( fitted value) dari variabel respon (Y),
yaitu:
1. Error dari model regresi yang didapat tidak menyebar normal.
2. Ragam (variance) dari error tidak homogen (terjadi heteroskedastisitas
pada ragam error).
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 2/11
Regresi Logistik
2
3. Sedangkan, pelanggaran bagi batasan nilai duga Y ( fitted value) adalah
bahwa nilai duga yang dihasilkan dari model regresi linier biasa melebihi
rentang antara 0 s.d. 1. Hal ini jelas tidak masuk akal , karena batasan nilai
pada variabel Y (dalam kasus ini adalah membeli=1 dan tidak membeli=0). Untuk mengatasi masalah ini, diperkenalkan metode Regresi
Logistik.
1.2 Tujuan
Adapun tujuan dari makalah ini adalah :
a. Untuk mengetahui apa itu regresi logistik.
b. Untuk mengetahui bagaimana perhitungan dari regresi logistik.
c.
Untuk mengetahui penerapan dari regresi logostik.1.3 Rumusan masalah
Adapun rumusan masalah dari makalah ini adalah :
a. Apa yang dimaksud dengan regresi logistik ?
b. Bagaimana perhitungan dari regresi logistik ?
c. Bagaimana penerapan dari regresi logostik ?
1.4 Sistematika penulisan
Adapun sistematika penulisan makalah ini adalah :
Kata pengantar
Daftar isi
Bab I Pendahuluan
1.1 Latar belakang
1.2 Tujuan dan manfaat
1.3 Rumusan masalah
1.4 Sistematika penulisan
Bab II Pembahasan
2.1 Definisi Regresi Logistik.
2.2 Perhitungan Regresi Logistik.
2.3 Penerapan Regresi Logistik.
Bab III Penutup
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 3/11
Regresi Logistik
3
3.1. Kesimpulan
3.2. saran
Daftar Pustaka
Lampiran
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 4/11
Regresi Logistik
4
BAB II
PEMBAHASAN
2.1 Definisi Regresi Logistik.
Regresi logistik (kadang disebut model logistik atau model logit), dalam
statistika digunakan untuk prediksi probabilitas kejadian suatu peristiwa. Metode ini
merupakan model linier umum yang digunakan untuk regresi binomial. Seperti
analisis regresi pada umumnya, metode ini menggunakan beberapa variabel prediktor,
baik numerik maupun kategori. Misalnya, probabilitas bahwa orang yang menderita
serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia, jenis
kelamin, dan indeks massa tubuh. Regresi logistik juga digunakan secara luas pada
bidang kedokteran dan ilmu sosial, maupun pemasaran seperti prediksi
kecenderungan pelanggan untuk membeli suatu produk atau berhenti berlangganan.
Regresi logistik berguna untuk situasi di mana Anda ingin dapat meramalkan
ada atau tidaknya karakteristik berdasarkan prediksi seperangkat prediktor. Koefisien
regresi logistik dapat digunakan untuk memperkirakan odds ratio untuk setiap
variabel independen dalam model. Odd ratio adalah adalah ukuran dari peningkatan
kemungkinan untuk satu kategori dibandingkan dengan yang lain. Melalui odd ratio
kita akan tahu berapa peningkatan skor variabel dependen yang ditinjau oleh prediktor
tertentu ketika prediktor lainnya adalah konstan.
Regresi logistik digunakan untuk memprediksi variabel yang bersifat kategoris
oleh seperangkat variabel prediksi. Regresi logistik dipilih jika prediktor memuat
campuran variabel kontinu dan kategoris atau prediktor tersebut tidak terdistribusi
yang baik.
Selain itu, regresi logistik telah sangat populer untuk riset medis misalnya
apakah pasien memiliki gejala penyakit tertentu. Pada regresi logistik, variabel
dependen yang diprediksi adalah fungsi dari probabilitas bahwa suatu subjek tertentu
akan berada dalam salah satu kategori.
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 5/11
Regresi Logistik
5
Jadi secara umum, regresi logistik dapat diartikan sebagai teknik statistik yang
digunakan untuk mengetahui pengaruh satu variable independen atau lebih (X)
terhadap satu variable dependen (Y), dengan syarat:
1. Variabel dependent harus merupakan variable dummy yang hanya
punya dua alternatif. Misalnya Puas atau tidak puas, dimana jika
responden menjawab puas maka kita beri skor 1 dan jika menjawab
tidak puas kita beri skor 0.
2. Variabel independent mempunyai skala data interval atau rasio.
Regresi logistik dapat dibedakan menjadi 2, yaitu: Binary Logistic Regression
(Regresi Logistik Biner) dan Multinomial Logistic Regression (Regresi Logistik
Multinomial). Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan
variabel respon (Y), misal membeli dan tidak membeli. Sedangkan Regresi Logistik
Multinomial digunakan ketika pada variabel respon (Y) terdapat lebih dari 2
kategorisasi.
2.2 Perhitungan Regresi Logistik.
Penyelesaian regresi logistik menggunakan pendekatan persamaan
non linear yaitu model logistik dengan persamaan regresi logistik sebagai berikut:
Kurva logistik digambarkan Kurva logistik digambarkan dalam
bentuk S sigmoid dengan nilai berkisar antara ∞ sampai dengan ∞ dan nilai
bergerak dari 0 sampai 1. Kurva logistik dapat dilihat pada Gambar 1. Nilai
merupakan jumlah dari persamaan linear atau
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 6/11
Regresi Logistik
6
Kurva pada Gambar 1 menunjukkan ketika nilai mendekati ∞ maka nilai
bergerak mendekati nilai 0, dan jika nilai mendekati ∞ maka nilai bergerak
mendekati nilai 1. Fungsi logistik, seperti uraian di atas merupakan fungsi probabilitas
sehingga fungsi regresi logistik lebih tepat untuk dinotasikan sebagai P(D=1| , ,… )
yang berarti bahwa probabilitas D=1 untuk nilai tertentu dari sampai
dengan Penyelesaian persamaan tersebut dengan mengestimasi parameter yang
belum diketahui yaitu . Untuk mengestimasi parameter tersebut maka fungsi
harus diubah menjadi bentuk linear menjadi bentuk odds yaitu probabilitas
sebuah kejadian dibandingkan dengan probabilitas kejadian tersebut tidak terjadi.
Persamaan tersebut menjadi persamaan linear :
Berdasarkan rumus lainnya:
()
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 7/11
Regresi Logistik
7
∑ ∑
∑ ∑
∑ ∑
2.3 Penerapan Regresi Logistik.
a) Contoh dalam kehidupan sehari-hari.
Misalkan kita tertarik pada faktor-faktor yang mempengaruhi apakah
seorang kandidat politik akan memenangkan pemilihan atau tidak.
Hasil (respon) variabel dikotomi (0 dan 1); menang atau kalah.
Prediktor yang dipakai adalah: jumlah uang yang dihabiskan untuk
kampanye, jumlah waktu yang digunakan untuk kampanye negatif dan
apakah atau tidak calon adalah sebuah kewajiban. Karena variabel
respon biner kita harus menggunakan sebuah model yang menangani 0
/ 1 variabel dengan benar.
Peneliti hendak mengidentifikasi pengaruh usia, jenis kelamin dan
aktivitas olahraga kemunculan serangan jantung. Variabel respon
kemunculan serangan jantung berbentuk data dikotomi (0 dan 1) yaitu
muncul dan tidaknya serangan jantung.
Peneliti hendak mengindentifikasi GRE (Graduate Record Exam skor),
IPK (Indeks Prestasi Kumulatif), dan prestise program sarjana untuk
mendaftarkan diri pada program pascasarjana. Skor pada variabel
dependennya berbentuk dikotomi (0 dan 1) yaitu mendaftar program
pascasarjana atau tidak.
b) Contoh kasus dengan menggunakan penyelesaian perhitungan.
1. Seorang peneliti ingin mengetahui bagaimana pengaruh kualitas
pelayanan publik terhadap kepuasan pengguna ( masyarakat ). Kualitas
pelayanan publik diteliti melalui variabel Daya Tanggap (X1) dan
empati (X2). Kepuasan pengguna layanan (Y) sebagai variabel
dependent. Jika responden menjawab puas maka kita beri skor 1 dan
jika menjawab tidak puas kita beri skor 0.
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 8/11
Regresi Logistik
8
Penyelesaian :
Dengan menggunakan aplikasi SPSS :
Input data di bawah ini!
Karakteristik masing-masing variabel adalah sebagai berikut.
X1 Daya tanggap
X2 Empati
Y kepuasan pengguna
Value Label : 0 tidak puas
1 puas
Langkah Regresi Logistik:
a. Klik Analyze Regression Binary Logistic.
b. Masukkan variable Y sebagai Dependent dan variable X1 dan X2
sebagai covariates.
c. Klik OK.
Output dan Interpretasi Regresi Logistik
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 9/11
Regresi Logistik
9
Korelasi bersama x1 dan x2 Y (Korelasi majemuk) dengan teknik
Chi-Square didapat nilai Chi-Square 23.181 dengan Nilai Sig 0.000 < 0.05,
berarti secara bersama-sama Daya Tanggap (X1) dan Empati (X2)
berhubungan dengan Kepuasan pengguna (Y).
Tabel diatas menunjukan koefisien detreminan regresi logistik, yakni
0.497. Sehingga dapat dikatakan kontribusi variabel X1 dan X2 terhadap Y
adalah sebesar 50%.
a. The cut value is .500
Tabel di atas memperlihatkan bawa ketepatan prediksi dalam
penelitian ini adalah sebesar 82%.
a.Variable(s) entered on step 1: X1, X2.
Pengujian secara sendiri-sendiri ternyata hanya X2 yang signifikan
karena nilai Sig 0.018 < 0.05. Sedangkan X2 Sig 0.543 > 0.05 artinya secara
sendirian X1 tidak punya pengaruh yang signifikan terhadap Y.
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 10/11
Regresi Logistik
10
BAB III
PENUTUP
3.1 Kesimpulan
Regresi logistik adalah sebuah pendekatan model matematik
yang dapat digunakan untuk menggambarkan hubungan beberapa
variabel X dengan variabel dependen yang dikotomus/politomus
(Kleinbaum & Klein, 2002). Model ini digunakan untuk menyelesaikan permasalahan
hubungan antara variabel dependen yang berupa variabel dichotomous maupun
polytomous dengan variabel independen yang dapat berupa variabel ordinal,
nominal maupun rasio.
persamaan regresi logistik sebagai berikut:
Regresi logistik berguna untuk situasi di mana Anda ingin dapat meramalkan
ada atau tidaknya karakteristik berdasarkan prediksi seperangkat prediktor. Koefisien
regresi logistik dapat digunakan untuk memperkirakan odds ratio untuk setiap
variabel independen dalam model.
5/12/2018 Pembahasan - slidepdf.com
http://slidepdf.com/reader/full/pembahasan-55a35abfca796 11/11
Regresi Logistik
11