regresi linear logistik 2015
Post on 05-Jan-2016
34 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
REGRESI LINEAR DAN LOGISTIK
Z U L A E L A
PRODI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
CLINICAL EPIDEMIOLOGY & BIOSTATISTICS UNIT (CE&BU), FAK. KEDOKTERAN
UNIVERSITAS GADJAH MADA
-
ANALISIS REGRESI
Analisis Regresi Linear
Analisis regresi merupakan metode analisis data yang memanfaatkan
hubungan antara dua variabel atau lebih (Berat Badan dengan Umur; FEV1
dengan Tinggi Badan; Berat Badan dengan Umur dan Asupan Gizi).
Y=variabel dependen, tak bebas, tergantung, respon, outcome.
X=variabel independen, bebas, tak tergantung, prediktor.
Tujuan:
Menyelidiki bentuk/pola hubungan antara Y dengan X.
Mengestimasi/menduga mean atau rata-rata dari Y populasi berdasarkan
X yang diberikan.
-
Case Summariesa
15.00 20.00
13.00 16.00
9.00 12.00
6.00 6.00
6.00 10.00
18.00 34.00
16.00 25.00
11.00 20.00
6.00 8.00
12.00 14.00
18.00 30.00
22.00 36.00
7.00 9.00
10.00 10.00
10.00 15.00
14.00 24.00
20.00 30.00
17 17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
NTotal
berat badan umur
Limited to f irst 100 cases.a.
Scatter Plot
-
Coefficientsa
3.025 .838 3.608 .003
.507 .040 12.652 .000
(Constant)
umur
Model
1
B Std. Error
Unstandardized
Coeff icients
t Sig.
Dependent Variable: berat badana.
Berat Badan = 3.025 + 0.507 Umur
Untuk seorang anak yang berumur 18 bulan, maka berat anak tersebut
dapat diprediksi sebesar 12.151 kg
-
Analisis Korelasi
Analisis korelasi merupakan metode analisis data yang
mengukur derajat hubungan antara dua variabel random X dan Y
melalui sebuah bilangan yang disebut koefisien korelasi r.
])(][)([ 2222 yynxxn
yxxynr
Kuadrat dari koefisien korelasi disebut koefisien determinasi yang
merepresentasikan besarnya proporsi variasi dalam variabel y yang
dijelaskan oleh variabel x dalam model. Dengan menggunakan pasangan
data berat badan dan umur anak balita, diperoleh nilai koefisien korelasi
sebesar 0.956 dan koefisien determinasi sebesar 0.914
-
Estimasi model regresi linear ganda dengan p variabel
independen ditunjukkan dengan persamaan:
Y = b0 + b1X1 + b2X2 + ..... + bpXp
variabel dependen Y kontinu, sedangkan variabel-variabel
independen X dapat kontinu atau kategorik.
Model Regresi Linear Ganda
-
Seorang peneliti ingin mengetahui seberapa baik dia dapat
memprediksi length of stay seorang pasien apabila diketahui
variabel independennya number of previous admissions, age
dan sex. Untuk itu telah dikumpulkan data untuk 15 pasien
sbb:
-
ANOVAb
2653.792 3 884.597 33.653 .000a
289.141 11 26.286
2942.933 14
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Signif icance
Predic tors: (constant) Sex, Number of Prev ious Admissions, Age...a.
Dependent Variable: Length of stayb.
-
Coefficientsa
16.186 7.175 2.256 .045
-.859 1.435 -.083 -.598 .562
.815 .164 .711 4.977 .000
-10.360 4.421 -.362 -2.343 .039
(Constant)
Number of Prev ious
Admissions
Age
Sex
Model
1
B Std. Error
Unstandardized
Coeff icients
Beta
Standardized
Coeff icients
t Signif icance
Dependent Variable: Length of staya.
-
Model Summary
.950a .902 .875 5.12694
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predic tors : (constant) Sex, Number of Prev ious
Admissions, Age.. .
a.
-
Regresi logistik digunakan untuk analisis dalam keadaan di
mana variabel dependen Y terdiri atas dua hasil yang mungkin:
dead/alive, disease/not disease, breast cancer/not breast
cancer, immunized/not immunized.
Regresi Logistik Ganda
-
Model regresi logistik ganda dengan p variabel independen dinyatakan
dengan persamaan:
atau Transformasi logit dinyatakan sebagai:
yang merupakan fungsi linier.
pp
pp
XXX
XXX
e
eYP
......
......
22110
22110
1)1(
)......( 221101
1)1(
ppXXXeYP
ppXXXYP
YP
.....]
)1(1
)1(ln[ 22110
-
Untuk variabel independen yang dikotomus, OR dinyatakan dengan:
dengan interval konfidensi 95% nya adalah:
Untuk variabel independen yang kontinu, OR dinyatakan:
dengan interval konfidensi 95% untuk perubahan unit dari variabel
independen adalah:
)exp( iOR
)]___tan.(96.1exp[ ii oferrordards
).exp( iOR
)]___tan.(.96.1.exp[ ii oferrordards
-
Sebagai ilustrasi analisis regresi logistik ganda digunakan sebagian
variabel dari data studi tentang low birth weight (berat badan lahir
rendah). Tujuan dari studi ini adalah untuk mengidentifikasi faktor
resiko yang berhubungan dengan kelahiran bayi yang low birth
weight (berat < 2500 gram). Seratus delapan puluh sembilan ibu
yang ikut penelitian, 130 melahirkan bayi normal, sedangkan 59
melahirkan bayi dengan low birth weight.
Empat faktor resiko yang diduga berpengaruh terhadap kelahiran
bayi dengan low birth weight adalah:
AGE: Age of the Mother in Years.
LWT: Weight in Pounds at the Last Mentrual Period.
RACE: Race (1 = White, 2 = Black, 3 = Other).
FTV: Number of Physician Visits During the First Trimester.
-
Output Regresi Logistik Ganda: BBLR vs AGE, LWT, RACE & FTV
-
Dengan menggunakan koefisien regresi (dari tabel di atas),
probabilitas akan terjadinya kelahiran bayi dengan low birth weight
adalah
Jika seorang ibu dengan karakteristik: AGE=30, LWT =140,
RACE(1)=1, RACE(2)=0 & FTV (2), maka resiko akan melahirkan
bayi dengan low birth weight sebesar P(Y=1)=0.3825=38.25%.
Jika terdapat 10000 ibu dengan karakteristik seperti itu, maka
3825 diantaranya akan melahirkan bayi dengan low birth weight.
)049.)2(433.)1(004.1014.024.295.1(1
1)1(
FTVRACERACELWTAGEeYP
-
OR untuk RACE(1) = 2.729 (tabel output regresi logistik
dengan 4 faktor resiko) menunjukkan bahwa race ibu yang
black mempunyai resiko akan melahirkan bayi yang low birth
weight 2.729 kali dibanding dengan race ibu yang white
setelah mengontrol variabel AGE, LWT dan FTV dalam model.
Interval konfidensi 95% untuk OR dari RACE(1) tidak memuat
angka 1, hal ini menunjukkan bahwa RACE(1) itu
berpengaruh terhadap resiko terjadinya kelahiran bayi yang
low birth weight, di samping Weight in Pounds at the Last
Mentrual Period.
top related