pemilihn jenis uji statistik (3)
TRANSCRIPT
STATISTIK TERAPANOleh : Dr. dr. Buraerah. H. Abd. Hakim, MSc( Jurusan : Biostatistik / KKB FKM UH )
PROGRAM PASCASARJANA UNIVERSITAS HASANUDDIN
Program Magister Epidemiologi Non Reguler
PENGERTIANIalah penerapan konsep dan prinsipprinsip statistik dalam proses Penentuan populasi dan smpel, Pengumpulan data, Pengolahan data, Analisis data serta Penyajian hasil penelitian, dalam rangka menjawab tujuan penelitian yang akan dicapai peneliti.
PEMILIHAN JENIS UJI DITENTUKAN OLEH TUJUAN KHUSUS PENELITIAN, DAN SKALA PENGUKURAN VARIABEL YANG DIGUNAKAN SEBAGAI BERIKUT :
PETUNJUK PEMILIHAN UJI STATISTIKJENIS VARIBELINDEP Nominal DEPEND Nominal Skala pengukuran VarJENIS/ SIFAT PENGUKURAN PILIHAN JENIS UJI STATISTIK BESAR SAMPEL
o Arah hubungan o Magnitude/
o Pearson Chi-Square
o Fisher Excat testo Mc Nemar test o Phi () Somers, D
signif. perubhn o Besar hub. Ordinal Ordinal Arah hubungan
30 sampel (utk. Analis ) Rumus sampel utk. Kesimpulan Populasi sda
Hubungan
Kendall Thau- a,b,c Sign test Rangk. bertanda Wilcox.
Besar hubungan Perbedaan
Spearman Correlation Median sampel
Mann Withney U (alt.uji t) Jlh Peringkt Wilcoxon
Interval
Interval
Arah Hubungan Besar
o Regressisedrhn/Ganda o Regressi linier ganda
Sda
Hubungan Perbedaan
logistic o Correlation Sdrhn/Ganda
PETUNJUK PEMILIHAN UJI STATISTIKJENIS VARIBELINDEP DEPEND. Skala pengukuran variabel Ordinal Interval Interval Nominal Nominal Ordinal Hubungan EthaJENIS/ SIFAT PENGUKURAN PILIHAN JENIS UJI STATISTIK BESAR SAMPEL
KONSEP PENGUKURAN VARIABEL(Instrumentasi)
UJI CHI-SQUARE Prinsip
Distribusi Frekuensi Observasi ( O )
Distribusi Frekuensi Harapan ( E )
Sumbu ( X )
- 1SD Mean
+ 1SD
- 1SD Mean + 1SD
UJI CHI-SQUARE PenggunaanContoh tabel 2 x 2
Baris (skala nominal)
1 1 2
2
Kolom (skala nominal)
UJI CHI-SQUARERUMUS UNTUK SATU SAMPEL
Yates Correction
( O E ) X = -------------EDimana :
( |O E - 0,5| ) X = ---------------------E
O = Frekuensi Observasi (observe)E = Frekuensi Harapan (expected) = Sigma = jumlah DF = (C-1)(R-1)
RUMUS UMUM FISHER EXCAT TEST
(A+B)! (C+D)! (A+C)! (B+D)! p = ----------------------------------------------N! A! B! C! D!
RUMUS UNTUK DUA SAMPEL INDEPENDENDUA POPULASI POPULASI (A) POPULASI (B) N = n1 + n2
n1SATU POPULASI (KEL X)
n2
Tanpa Intervensi
RW (A)
RW (B)
Dengan Intervensi
n1
n2
N = n1 + n2
MODEL DESAIN TABELBERAT BADANPMT Total
BAIK
KURANG persen%
Jumlah Persen jumlah persen jumlahINTENSIF a % b % a+b
TIDAK INTENSIF JUMLAH
c a+c
% %
d b+d
% %
c+d N
% %
RUMUS UMUMn ( | ad bc | - n ) x = ---------------------------------------(a+b) (a+c) (b+d) (c+d)
2. Analisis Persentase variabelPada tahap ini dilakukan analisis persentase kejadian karies gigi menurut berbagai variabel sesuai dengan tujuan khusus penelitian yakni : Kebiasaan makan dan minum kariogenik, ketepatan waktu menggosok gigi, cara mengosok gigi, dan keteraturan memerikskan gigi. Analisis ini menggunakan persentase baris yang dimaksudkan untuk membandingkan persentase variabel dependen menurut variabel independennya sebagai berikut : Tabel 8 Sebaran persentase kejadian karies gigi menurut kebiasaan makan dan minum kariogenik pada murid kelas vi SD sudirman tahun 2005
KEBIASAAN MAKAN DAN MINUM KARIOGENIK Kurang baik Baik JUMLAH Sumber : Data primer
KEJADIAN KARIES GIGI Ada karies 81: (73,6) 31: (36,0) 112: (57,1) Tidak ada karies 29: (26,4) 55: (64,0) 84: (42,9) TOTAL 110: (100,0) 86: (100,0) 196: (100,0)
2. Analisis Persentase variabelPada tahap ini dilakukan analisis persentase kejadian karies gigi menurut berbagai variabel sesuai dengan tujuan khusus penelitian yakni : Kebiasaan makan dan minum kariogenik, ketepatan waktu menggosok gigi, cara mengosok gigi, dan keteraturan memerikskan gigi. Analisis ini menggunakan persentase baris yang dimaksudkan untuk membandingkan persentase variabel dependen menurut variabel independennya sebagai berikut : Tabel 9 Sebaran persentase kejadian karies gigi menurut kebiasaan makan dan minum kariogenik pada murid kelas vi SD sudirman tahun 2005
KEBIASAAN MAKAN DAN MINUM KARIOGENIK Kurang baik Baik JUMLAH Sumber : Data primer
KEJADIAN KARIES GIGI Ada karies 81: (73,6) 31: (36,0) 112: (57,1) Tidak ada karies 29: (26,4) 55: (64,0) 84: (42,9) TOTAL 110: (100,0) 86: (100,0) 196: (100,0)
3. Analisis Hubungan variabelPada tahap ini dilakukan analisis hubungan variabel kejadian karies gigi dengan variabel independennya sesuai dengan tujuan khusus penelitian yakni : Kebiasaan makan dan minum kariogenik, ketepatan waktu menggosok gigi, cara mengosok gigi, dan keteraturan memerikskan gigi. Penilaian adanya hubungan didasarkan atas hasil uji Chi-square dengan rumus satu satu sampel, sedangkan penilaian kemaknaan hubungan dinilai melalui nilai p value . Besarnya kontribusi variabel independen terhadap variabel dependen dinilai melalui uji Phi ( ) sebagai berikut : Tabel 10 Hubungan kejadian karies gigi dengan kebiasaan makan dan minum kariogenik pada murid kelas vi SD sudirman tahun 2005
KEBIASAAN MAKAN DAN MINUM KARIOGENIK
KEJADIAN KARIES GIGI Ada karies Tidak ada karies TOTAL Hasil Uji Chi-square P value
Kurang baik BaikJUMLAH Sumber : Data primer
81 31112
29 5584
110 86196
X2 = 27,848 Phi= 0,377
0,000 0,000
Status pekerj aan * Keteraturan berobat Crosstabulation Keteraturan berobat Teratur Tidak teratur 88 14 86,3% 13,7% 79,3% 50,6% 23 31,9% 20,7% 13,2% 111 63,8% 100,0% 63,8% 22,2% 8,0% 49 68,1% 77,8% 28,2% 63 36,2% 100,0% 36,2%
Status pekerjaan
Bekerja
Tidak bekerja
Total
Count % within Status pekerjaan % within Keteraturan berobat % of Total Count % within Status pekerjaan % within Keteraturan berobat % of Total Count % within Status pekerjaan % within Keteraturan berobat % of Total
Total 102 100,0% 58,6% 58,6% 72 100,0% 41,4% 41,4% 174 100,0% 100,0% 100,0%
Chi-Square Tests Value 53,938b 51,612 56,002 174 df 1 1 1 Asymp. Sig. (2-sided) ,000 ,000 ,000 Exact Sig. (2-sided) Exact Sig. (1-sided)
Pearson Chi-Square a Continuity Correction Likelihood Ratio Fisher's Exact Test N of Valid Cases
,000
,000
a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 26,07.
Symmetric Measures Value ,557 ,557 ,553 174 Asymp. a Std. Error Approx. Tb
Nominal by Nominal
Phi Cramer's V Measure of Agreement Kappa N of Valid Cases a. Not assuming the null hypothesis.
,064
7,344
Approx. Sig. ,000 ,000 ,000
b. Using the asymptotic standard error assuming the null hypothesis.
Risk Estimate 95% Confidence Interval Lower Upper 6,322 1,911 ,121 28,368 3,817 ,336
Value Odds Ratio for Status pekerjaan (Bekerja / Tidak bekerja) For cohort Keteraturan berobat = Teratur For cohort Keteraturan berobat = Tidak teratur N of Valid Cases 13,391 2,701 ,202 174
Mc NEMAR TESTTabel analisis untuk menguji signifikansi perubahan (MC Nemar Test)
Sebelum intervensi + Jumlah
Sesudah intervensi A C A+C + B D B+D
Total
A+B C+D A+B+C+D
Intervensi dengan pemb. PMT 6bln
Mc NEMAR TESTCatatan : pada keadaan ini distribusi sampling x diasumsikan berdistribusi Chi-Square dengan DF = 1
Bila disederhanakan bentuknya diperoleh bentuk rumus sebagai berikut : ( A D ) x = ----------------A + D
dengan DF = 1
Mc NEMAR TEST Koreksi kontinyuitasMenggunakan prinsip koreksi (Yates) dengan rumus :(| A D | - 1) x = ----------------------------A + D
dengan DF = 1
DESAIN TABEL UNTUK UJI ORDINAL
SKALA ORDINALVARIABEL ASKALA ORDINAL
JUMLAH B C
A B C
JUMLAH
PRINSIP UJI ORDINAL Variabel yang akan diuji bersumber dari sampel dan untuk selanjutnya karakteristik yang ada didalam sampel dilihat hubungannya. Antara satu variabel dan variabel lainnya. Pengelompokan / pengkategorian variabel dilakukan menurut skala ordinal. Metode Statistika yang digunakan adalah uji Kendalls atau yang terdiri dari : Kendalls taua Kendalls taub Kendalls tauc Spearman rank correlation
PRINSIP UJI Dikemukakan oleh Kendall pada tahun 1983 dan dikenal sebagai Kendall tau_a atau taua.
Rumus umum yang digunakan adalah :KD Taua = -------------------n(n1)/2
Keterangan :K = Jumlah pasangan Konkordans D = Jumlah pasangan Diskonkordans n = Banyaknya pasangan yang mungkin dibentuk. Konkordans ( sesuai ) berarti susunan observasi berada didalam urutan yang wajar dinilai ( + ). Diskonkordans berarti urutan tidak wajar dinilai ( - ).
PRINSIP UJIPerhitungan konkordans dan diskonkordans dilakukan dengan menggunakan rumus berikut :
KD tau-a = ---------------------n(n1)/2K D diperoleh dari rumus : N = 4 Ci n ( n -1 ) = 4 ( 59 ) 15 ( 14 ) 236 210 = 26 26 tau-a = ---------------------- = 0,124 15 ( 14 )
PRINSIP UJIRumus untuk Kendall tau - bDigunakan apabila terdapat nilai pasangan observasi yang bersamaan, sedangkan rumus yang digunakan ialah :
KD tau-b = --------------------------------------------------------------------------------------------------------------- [ { n ( n 1 ) / 2 T1 } { n ( n 1 ) / 2 T2 ]
Keterangan : T = Jumlah pasangan yang bersamaan.
PRINSIP UJIKendall tau-cRumus umum yang digunakan ialah :
2m ( K D ) tau-c = -------------------------
n(m1)Keterangan : m = adalah bilangan terkecil diantara kategori dari variabel ordinal X dan Y. Yang digunakan untuk menghitung index korelasi ialah kendall taub dan c, dimana nilainya hampir mencapai nilai ( + 1 ) dan ( - 1 ).
CONTOH HASIL UJI ORDINAL
Variabel KredibilitasKREDIBX * MAMPUX Crosstabulation MAMPUX 2,00 3,00 41 2 74,5% 3,6% 60 32 61,2% 32,7% 4 14 21,1% 73,7% 0 1 ,0% 100,0% 0 0 ,0% ,0% 105 49 60,3% 28,2%
Sangat percaya4,00 0 ,0% 0 ,0% 1 5,3% 0 ,0% 1 100,0% 2 1,1% Total 55 100,0% 98 100,0% 19 100,0% 1 100,0% 1 100,0% 174 100,0%
(SP =5) 1(P = 4) 2 (KP =3) 3 (TP =2) 4
1,00 KREDIBX 1,00 2,00 3,00 4,00 5,00 Total Count % within KREDIBX Count % within KREDIBX Count % within KREDIBX Count % within KREDIBX Count % within KREDIBX Count % within KREDIBX 12 21,8% 6 6,1% 0 ,0% 0 ,0% 0 ,0% 18 10,3%
Percaya Kurang percaya Tidak percaya
Sangat tdk percaya (STP=1) 5
Variabel KemampuanSangat mampu Mampu Kurang mampu Tidak mampu (SP =5) 1 ( P = 4) 2 (KP =3) 3 (TP =2) 4
Sangat tdk mampu (STP=1) 5
HASIL UJI SOMERS D
Directional Measures Value ,484 ,495 ,473 Asymp. a b Std. Error Approx. T Approx. Sig. ,049 8,103 ,000 ,053 8,103 ,000 ,050 8,103 ,000
Ordinal by Ordinal Somers' d
Symmetric KREDIBX Dependent MAMPUX Dependent
a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis.
HASIL UJI KENDALL THAU, DAN SPEARMAN CORRELATION
Symmetric Measures Value ,484 ,360 ,799 ,516 ,541 .d 174 Asymp. a Std. Error ,049 ,044 ,060 ,052 ,054 Approx. T 8,103 8,103 8,103 7,898 8,430b
Ordinal by Ordinal
Kendall's tau-b Kendall's tau-c Gamma Spearman Correlation Interval by Interval Pearson's R Measure of Agreement Kappa N of Valid Cases a. Not assuming the null hypothesis.
Approx. Sig. ,000 ,000 ,000 ,000 c ,000 c
b. Using the asymptotic standard error assuming the null hypothesis. c. Based on normal approximation. d. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values of the first variable match the values of the second variable.
Tabel . 5
Perhitungan skor interval kelas masing-masing variabel perindividu dan kelompok pasien tbc paru yang berobat di rumah sakit umum daerah labuang baji kota makassar tahun 2007
PERHITUNGAN SKOR DAN INTERVAL No 1 2 3 Indivivu 5 x 5 =25 5 x 4 =20 5 x 3 =15 Interval 21 25 16 20 11 15 Kelompok Interval GRADE Sangat sepakat Sepakat Kurang sepakat 5 x 5 x 174 3481 4350 5 x 4 x 174 2611 3480 5 x 3 x 174 1741 2610
45
5 x 2 =105 x 1 =5
6 1005
5 x 2 x 1745 x 1 x 174
871 17400 870
Tidak sepakatSangat tidak sepakat
Sumber : Data primer
c. Analisis hubungan variabel.Pada tahap ini dilakukan analisis hubungan antara variable independent dengan variable dependen, dengan menggunakan uji Kendall thau-c. Penggunaan uji Kendall thau-c untuk besar sampel lebih dari 30, maka distribusinya mendekati distribusi normal sehingga parameter yang digunakan ialah nilai z standar, dimana untuk = 0,05 nilainya 1,96. Penilaian signifikansi hubungan antar variabel dinilai melalui nilai p ( 0,05 ), sedangkan besarnya korelasi antara variabel independen dengan variabel dependennya dinilai melalui uji Spearman correlation, dengan indeks korelasi = ( ) yang memberi makna besarnya korelasi ordinal / kontribusi variabel independen terhadap variable dependennya. Analisis hubungan dilakukan sesuai dengan kerangka konsep penelitian sebagai berikut :
Tabel.15 Hubungan media yang digunakan dengan Kredibilitas petugas pada penyampaian informasi terhadap pasien tbc paru yang berobat di rumah sakit umum daerah labuang baji kota makassar tahun 2007Kredibilitas petugas kesehatan (credibility) Media (channels) Sangat percaya n Sangat sesuai Sesuai Kurang sesuai Tidak sesuai Sngt tdk sesuai JUMLAH 19 35 1 0 0 55 % 61,3 31,0 3,8 0,0 0,0 31,6 Percaya n 12 68 16 2 0 98 % 38,7 60,2 61,5 66,7 0,0 56,3 Kurang percaya n 0 9 9 1 0 19 % 0,0 8,0 34,6 33,3 0,0 10,9 Tidak percaya n 0 1 0 0 0 1 % 0,0 0,9 0,0 0,0 0,0 0,6 Sngt tdk percaya n 0 0 0 0 1 1 % 0,0 0,0 0,0 0,0 100 0,6 n 31 113 26 3 1 174 Total
% 100.0 100.0 100.0 100.0 100.0 100.0
Sumber : data primer
KOEFISIEN KORELASI RANK SPEARMAN Prinsip :Adalah ukuran assosiasi dimana kedua variabel diukur dengan skala ordinal. sehingga obyek yg dipelajari dapat dirangking dalam bentuk urutan.
Rumus umum yg digunakan adalah :6 bi
= 1 - -----------------n (n - 1) = rho = rs bi = Perbedaan nilai var 1 dan 2
KOEFISIEN KORELASI RANK SPEARMANContoh kasus Dua orang dosen FKM Unhas membreikan penilaian terhadap skripsi 8 orang mahasiswanya yg terdiri dari mahasiswa A, B, C, D, E, F, G, H. Dengan nilai sebagai berikut :Hasil penilaian skripsi mahasiswa oleh dosen Nama mahasiswaA B C D E F G H
Dosen I (variabel ke 1)70 85 65 50 90 80 75 60
Dosen II (variabel ke 2)80 75 55 60 85 70 90 65
PENYELESAIANBuat daftar dari kedua variabel yang diobservasi (variabel 1 = x) dan (variabel ke 2 = Y) Buat rangking masing-masing variabel X dan Y. Tentukan perbedaan harga dari masing-masing variabel X dan Y. dan beri kode dengan bi Kuadratkan harga bi. Jumlahkan kuadrat bi untuk memperoleh Hasilnya dimasukkan dalam rumus umum.
1.
2.3. 4. 5. 6.
PENYELESAIANPeringkat dari dua dosenNama mahasiswa A B C D E F G H Jumlah Dosen I Dosen II Peringkat dosen I 70 85 65 50 90 80 75 60 80 75 55 60 85 70 90 65 5 2 6 8 1 3 4 7 Peringkat dosen II 3 4 8 7 2 5 1 6 Beda (bi) 2 -2 -2 1 -1 -2 3 1 bi 4 4 4 1 1 4 9 1 28
PENYELESAIAN Hasil perhitunganDari hasil perhitungan tabel, selanjutnya dimasukkan didalam rumus umum sebagai berikut : 6 (28) rs = 1 - ------------------ = 0,6667 8 (64-1)
Interpretasi :r = +1 terdapat penyesuaian sempurna r = -1 tidak ada kesesuaian
KORELASI DAN REGRESSI LINIER
TUJUANMenguji hubungan antara satu variabel Dependen (var. respon) dengan satu atau beberapa var. Independen (var. predictor).1.
2.
Jika variabel dependen dihubungkan dengan hanya satu variabel independen maka persamaan regresi yang dihasilkan ialah regresi linier sederhana Jika variabel independennya lebih dari satu menghasilkan regresi linier berganda (multiple linier regression ).
RUMUS UMUMY = a + bxKeterangan : a = (o) Interceptialah estimasi atau perkiraan teoritis variabel dependen (var.Y) bilamana variabel independen (var. x) = 0
b = (1) Slopeialah koefisien arah yang merupakan perubahan dalam variabel dependen yang dicocokkan untuk sebuah perubahan dalam variabel x
PERSAMAAN GARIS REGRESSIY = a + bxVar. Y
b aIntercept
Slope
Var. X
RUMUS UMUMY = a + bxIalah persamaan regressi untuk data hasil observasi ( sampel ).
Y = o + 1xi + eIalah persamaan garis regressi untuk data populasi.
RUMUS UMUMKeterangan :ei = ErrorIalah random error yang terjadi disekitar garis regressi atau perbedaan antara harga observasi Yi dan mean sub populasi (sampel) pada titik xi Diasumsikan berdistribusi normal independen variabel-variabel random dengan mean = 0 dan varians =
NOTASI / TERMINOLOGIY Estimator (penaksir) ialah garis regressi yang diperoleh dari hasil perhitungan sampel ( data observasi ). Estimate (Yang ditaksir) ialah garis regressi pada populasi yang dimaksudkan untuk ditaksir nilainya berdasarkan hasil perhitungan sampel. 0 Intercept Populasi ialah nilai variabel dependen pada populasi (var. Y) bilamana variabel independen (var. X) = 0 ( tidak diketahui ) 1 Slope Populasi ialah kofisien arah yang merupakan perubahan dalam variabel dependen yang dicocokkan untuk sebuah perubahan dalam variabel X dalam populasi ( tidak diketahui ).
SCATTER DIAGRAMGaji sekarang
60000 50000
4000030000 20000 10000 0 10000 20000 30000 40000
Gaji awal
MEMILIH GARIS REGRESSIDalam kenyataan hasil perpotongan antara variabel Y dan variabel X berdasarkan data hasil observasi tidak semuanya tepat jatuh pada garis regressi tetapi hanya sebagian saja. Konsekuensinya adalah terjadi penyimpangan hasil observasi dari persamaan garis yang diduga yang dikenal dengan random errror disekitar garis regressi. Yang ditunjukkan pada scatter diagram berikut :
RANDOM ERRORScatter Diagramnya gaji awal dan gaji sekarang adalah :
60000 Gaji sekarang 50000 40000 30000 20000 10000 0
10000
20000
30000
40000
Gaji awal
MENGHILANGKAN RANDOM ERRORUntuk menghilangkan error tersebut digunakan metode kuadrat terkecil (Least Square) (Least Square) ialah suatu persamaan garis dimana jumlah kuadrat dari jarak vertikal tiap-tiap titik pengamatan terhadap garis tersebut minimum. (dianggap = 0)
INTERCEP DAN SLOPEPerhitungan parameter intercep dan slope dilakukan sebagai berikut :
a
=
(Yi) (Xi) - (Xi) (X Y ) ---------------------------------n Xi (X )i i i
b
=
X Y - (Yi) (X ) ---------------------------n Xi (X )ni i i i
a = - bX
INTERCEP DAN SLOPEPerhitungan parameter intercep dan slope dilakukan sebagai berikut :
c
=
(Yi) (Xi) - (Xi) (X Y ) ---------------------------------n Yi (Y )i i i
d
=
X Y - (Yi) (X ) ---------------------------n Xi (Y )ni i i i
BENTUK PERSAMAAN GARIS REGRESSI1.
Regressi Linier = a + bx Parabola Kuadratik = a + bx + cx Parabola Kubik = a + bx + cx + dx Eksponen = ab
2.
3.
4.
BENTUK PERSAMAAN GARIS REGRESSI5.
Geometrik b = axbx Gompertz = pq
6.
7.
Logistik1 = -------------- ab + c Hiperbola 1 = --------------a+b
8.
CONTOH PENGGUNAAN REGRESSI
Seorang peneliti ingin mengetahui pengaruh tingkat intelegensi (IQ) mahasiswa STIKES-NH, terhadap nilai statistik yang dicapainya. Untuk keperluan tersebut ditarik sampel sebesar 12 mahasiswa, kemudian dilakukan test (IQ), selanjutnya para mahasiswa tersebut diberi test statistik dengan hasil seperti yang tercantung pada tabel berikut :
CONTOH PENGGUNAAN REGRESSINomor Mah.1 2 3 4 5 6 7 8 9 10 11 12 n = 12
Skor test IQ (xi)65 50 55 65 55 70 65 70 55 70 50 55
Nilai statistik ( Yi)85 74 76 90 85 87 94 98 81 91 76 74
Xi24225 2500 3025 4225 3025 4900 4225 4900 3025 4900 2500 3025
xiYi5525 3700 4180 5850 4675 6090 6110 6860 4455 6370 3800 4070
xi = 725
Yi = 1011
xi2 = 44475
xiYi = 61685
PENYELESAIAN(Yi) (Xi) - (Xi) (XiYi) (1011)(44475) (725)(61685) a = ------------------------------------ = -----------------------------------------n Xi (Xi) 12(44475) ( 725)2 = 0,5043
n XiYi - (Yi) (Xi) (12)(61685) (1011)(725) b = ---------------------------- = -------------------------------------- = 0,8972 n Xi (Xi) (12)(44475) (725)2
Y = 0,5043 + 0,8972(X)
CONTOH PENGGUNAAN REGRESSINomor Mah.1 2 3 4 5 6 7 8 9 10 11 12
Skor test IQ (xi)65 50 55 65 55 70 65 70 55 70 50 55
Y = a + bx 0,5043 + 0,8972 x 65 0,5043 + 0,8972 x 50 0,5043 + 0,8972 x 55 0,5043 + 0,8972 x 65 0,5043 + 0,8972 x 55 0,5043 + 0,8972 x 70 0,5043 + 0,8972 x 70 0,5043 + 0,8972 x 65 0,5043 + 0,8972 x 55 0,5043 + 0,8972 x 70 0,5043 + 0,8972 x 50 0,5043 + 0,8972 x 55
^ Y58,82 45,36 59,85 58,82 59,85 63,31 58,82 63,31 59,85 63,31 45,36 59,85
Nilai Yi asli85 74 76 90 85 87 94 98 81 91 76 74
MODEL GARIS REGRESSI1.00
.75
Nilai statistik
.50
.25
0.00 0.00 .25 .50 .75 1.00
Nilai IQ
ANALISIS KORELASIGaris regressi dianggap parameter terbaik untuk untuk sekumpulan data berbentuk linier.Besarnya derajat hubungan antara variabel x dan Y (korelasi antara x dan Y) dinyatakan dengan r yang dikenal dengan istilah Koefisien korelasi. biasa juga diberi simbol dengan R
ANALISIS KORELASIBENTUK RUMUS UMUMNYA ADALAH : (Yi (Yi Yi) 2 r2 = ----------------------------------------( Yi Y )2 Y)2r2 disebut Koefisien Determinasi atau Koefisien Penentu. sering disebut dengan R Square = (R2)^
ANALISIS KORELASIUntuk Menghitung Nilai Korelasi r atau R digunakan rumus sebagai berikut :
r =
n Xi Y - ( Xi) ( Yi ) ----------------------------------------------------------
{ n Xi2 ( Xi )2} { n Yi2 ( Yi )2 }Bentuk Lain :
r =
1 - S2y.x / S2y
ANALISIS KORELASIApabila telah diketahui nilai b maka koefisien determinasi r2 dapat dihitung sebagai berikut :
r2
=
n Xi Y - ( Xi) ( Yi ) -------------------------------------n Yi2 ( Yi )2
Sedangkan rumus korelasi r adalah sebagai berikut :
r =
bSx / Sy
HASIL ANALISIS KORELASIb Model Summary
Model 1
R R Square .626 a .392
Adjusted R Square .331
Std. Error of the Estimate 5.322055
a. Predictors: (Constant), VAR X b. Dependent Variable: VARY
HASIL ANALISIS KORELASIHasil perhitungan dengan teknik komputerisasi adalah sebagai berikut :
R (Korelasi) = r R Square (Pengaruh)= r2
= 0,626 = 0,392
Adjusted R Square (Perkiraan) = 0,331 Standard error of the estimate = 5,322055
Terminologi Hasil Print Out Analisis RegressiHasil Print Out Analisis Regressi ------------------Variabel in Equation-------------------------VariabelSALBEG (Constant)
B1.909450 771.282303
SE B0.047410 955.471941
Beta0.880117
T40.276 2.170
Sig.T0.0000 0.0305
-----------------------------------------------------------------------Kofisien [ B ] Ialah intercept a (constan) dan slope b (salbeg) dari hasil analisis regressi.
Terminologi Hasil Print Out Analisis RegressiKoefisien Regressi Terstandarisasi. [Beta] ialah koefisien regressi 1 apabila variabel x dan y diekspresikan sebagai skor standar (Z score) Diperoleh dengan menggunakan rumus : Sx Beta = 1 -------Sy Ket :Sx : ialah standar deviasi dari variabel X Sy : ialah standar deviasi dari variabel Y
Estimasi standar Error [SE B] ialah estimasi standar error dari 10 untuk populasi
Terminologi Hasil Print Out Analisis Regressi
Uji Hipotesis [ T dan Sig. T ]ialah uji hipotesis mengenai ada atau tidaknya hubungan linier antara variabel X dan variabel Y. atau slope dari regressi populasi (1) = 0
Rumus yang digunakan : 1 t = ----------
S 1
Terminologi Hasil Print Out Analisis Regressi
Apabila tidak ada hubungan linier antara variabel X dan varibel Y maka data dari sampel akan berdistribusi students t, dengan derajat kebebasan N 2 . Uji statistik yang digunakan untuk menguji bahwa intercept (0) = 0 ialah :0t = ----------
S
0
Generalisasi Sampel Terhadap PopulasiUntuk melakukan generalisasi hasil sampel terhadap parameter populasi, maka digunakan prinsip LINE. Linearity, Independency, Normality, Equality variance.Linearity ialah nilai-nilai mean seluruhnya terletak pada garis lurus yang merupakan garis regressi populasi
Yi = 0 + 1Xi + ei dimana ei diasumsikan berdistribusi normal independen dengan mean = 0 dan varians =
Generalisasi Sampel Terhadap PopulasiIndenpendency secara statistik maka variabel Y harus independen antara satu dengan lainnya. Normality dan Equality variance ialah untuk setiap nilai variabel independen X maka variabel dependen Y akan berdistribusi normal dengan mean = y/x dan variance konstan = Artinya tidak setiap perubahan variabel independen X diikuti oleh perubahan yang sama oleh variabel dependen Y.
Generalisasi Sampel Terhadap PopulasiAsumsi regressiy
0+1X
eiY1 x
X1
X2
X3
X4
Goodness Of FitIalah salah satu prosedur statistik yang digunakan untuk menentukan / menetapkan seberapa baik suatu model yang dipilih berdasarkan data sampel dan memang sesuai dengan keadaan nyata ( populasi ) dilapangan. dikenal dengan istilah Goodness Of Fit.
Goodness Of FitKoefisien Determinasi [ R Square = R ] Ialah ukuran goodness of fit yang digunakan
untuk menentukan model linier untuk satu persamaan garis lurus. Niali dari R ini berada diantara 0 sampai dengan 1. 0 berarti nilai observasi tidak ada / sebagian
kecil saja jatuh pada garis regressi. 1 berarti seluruh nilai observasi terletak pada garis regressi.
Goodness Of Fit Multiple R
Ialah banyaknya persentase (%) variabilitas variabel dependen Y yang dapat diterangkan oleh variabel independen X. Adjusted R Square.
ialah koreksi dari R sehingga gambarannya lebih mendekati model dalam populasi.
Goodness Of Fit Print Out Hasil analisis
-------------------------------------------------------------Multiple R 0.88012 R Square 0.77461 Adjusted R Square 0.77413 Standar error 3246.14226 --------------------------------------------------------------
REGRESSI LINIER BERGANDA LOGISTIK
REGRESSI LINIER BERGANDA LOGISTICMODEL UMUM p = a + b1x1 + b2x2 + . .. bn xn Model tersebut baru dapat dipakai apabila p ditransformasikan dalam bentuk logodds Logodds = logit ialah logaritme natural dari odds. Odds sendiri adalah rasio antara probabilitas suatu peristiwa untuk terjadi (sukses) dan probabilitas peristiwa untuk tidak terjadi (gagal).
Apabila probabilitas suatu peristiwa untuk terjadi disebut ( p ) maka dengan sendirinya probabilitas suatu peristiwa untuk tidak terjadi adalah (1 p ) Dengan demikian log odds untuk (p) adalah sebagai berikut : p Log odds (p) = -----------(1- p) Dengen demikian rumus umum dari regressi
berganda logistik adalah :
p Ln ( -------- ) = a + b1x1 + b2x2 + bn xn 1- p
Keterangan : a = konstanta (interceps) b1, b2 = koefisien korelasi variabel prediktor atau idependen) yang dikenal dengan slope .(koefisien korelasi variabel indep)
x1, x2, .xk = variabel prediktor yang akan dilihat pengaruhnya.p = probabilitas untuk terjadinya peristiwa dari variabel respons ( dependen) Y yang berskala biner (binary) dan berdistribusi normal
PERSAMAAN GARIS REGRESSIY = a + bxVar. Y
b aIntercept
Slope
Var. X
SCATTER DIAGRAMGaji sekarang
60000 50000
4000030000 20000 10000 0 10000 20000 30000 40000
Gaji awal
RANDOM ERRORScatter Diagramnya gaji awal dan gaji sekarang adalah :
60000 Gaji sekarang 50000 40000 30000 20000 10000 0
10000
20000
30000
40000
Gaji awal
Keistimewaan :Mampu mengkomversi koefisien regressi (bi) menjadi Rasio odds sebagai berikut : OR = Exp (bi) dengan : Keterangan : OR = Rasio Odds variabel prediktor (xi) atau (independen) terhadap variabel dependennya
bi
= Koefisien regressi variabel prediktor (independen) xi
Exp = Exponensial, atau inversi dari logaritma natural ( ln).
NOTASI HASIL UJIB = Koefisien, yang mirip dengan regresi biasa, namun disini berarti ln rasio odds. Artinya setiap kenaikan 1, maka ln rasio odds akan bertambah ..Exp(B) atau eB. adalah rasio odds dari variabel tersebut setelah dikontrol dengan variabel lainnya artinya setiap kenaikan 1 unit variabel independen maka rasio odds nya akan bertambah .. Kali. Wald = adalah kuadrat dari (B) dibagi dengan standar errornya. penilaiannya didasarkan atas Degree of Freedom, dan memberi arti apakan variabel independen berakna atau tidak ( acuan ini sifatnya tidak mutlak). R = Besarnya kontribusi variabel variabel independen bila dimasukkan kedalam model. Mirip dengan korelasi partiel dari regressi liner berganda.
HASIL UJI REGRESSI LINIER BERGANDA LOGISTIK
Case Processing Summary Unweighted Cases Selected Cases Included in Analysis Missing Cases Total Unselected Cases Totala
N 174 0 174 0 174
Percent 100,0 ,0 100,0 ,0 100,0
a. If weight is in effect, see classification table for the total number of cases.
Block 0: Beginning Blocka,b,c Iteration History
Iteration Step 1 0 2
-2 Log likelihood 240,847 240,847
Coefficients Constant ,092 ,092
a. Constant is included in the model. b. Initial -2 Log Likelihood: 240,847 c. Estimation terminated at iteration number 2 because parameter estimates changed by less than ,001.
Classification Tablea,b Predicted MAMPUY ,00 1,00 0 83 0 91 Percentage Correct ,0 100,0 52,3
Observed Step 0 MAMPUY Overall Percentage
,00 1,00
a. Constant is included in the model. b. The cut value is ,500
Variables in the Equation Step 0 Constant B ,092 S.E. ,152 Wald ,368 df 1 Sig. ,544 Exp(B) 1,096
a Variables not in the Equation
Step 0
Variables
KREDIBY KREDIY MANFAY CONTEY CLARIY KONTINUY CHANELY
Score 74,768 74,768 83,581 93,030 110,026 91,141 101,877
df 1 1 1 1 1 1 1
Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000
a. Residual Chi-Squares are not computed because of redundancies.
Block 1: Method = Forward Stepwise (Likelihood Ratio)
Omnibus Tests of Model Coefficients Step 1 Step Block Model Step Block Model Step Block Model Chi-square 127,110 127,110 127,110 22,586 149,696 149,696 3,522 153,219 153,219 df 1 1 1 1 2 2 1 3 3 Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,061 ,000 ,000
Step 2
Step 3
Model Summary Step 1 2 3 -2 Log likelihood 113,737 91,151 87,629 Cox & Snell R Square ,518 ,577 ,585 Nagelkerke R Square ,692 ,770 ,781
Variables in the Equation Step a 1 Step b 2 CLARIY Constant CLARIY CHANELY Constant CLARIY KONTINUY CHANELY Constant B 4,528 -2,639 3,266 3,006 -3,901 2,990 1,296 2,359 -4,090 S.E. ,550 ,463 ,612 ,663 ,683 ,633 ,667 ,750 ,731 Wald 67,716 32,502 28,462 20,551 32,602 22,292 3,775 9,889 31,288 df 1 1 1 1 1 1 1 1 1 Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,052 ,002 ,000 Exp(B) 92,615 ,071 26,210 20,208 ,020 19,894 3,656 10,578 ,017
Step c 3
a. Variable(s) entered on step 1: CLARIY. b. Variable(s) entered on step 2: CHANELY. c. Variable(s) entered on step 3: KONTINUY.
Correlation Matrix Step 1 Step 2 Constant CLARIY Constant CLARIY CHANELY Constant CLARIY KONTINUY CHANELY Constant 1,000 -,841 1,000 -,538 -,669 1,000 -,494 -,220 -,518 CLARIY -,841 1,000 -,538 1,000 -,116 -,494 1,000 -,117 -,058 CHANELY KONTINUY
-,669 -,116 1,000 -,518 -,058 -,399 1,000 -,220 -,117 1,000 -,399
Step 3
Model if Term Remov ed Model Log Likelihood -120,424 -61,650 -56,868 -55,807 -45,575 -48,862 Change in -2 Log Likelihood 127,110 32,150 22,586 23,986 3,522 10,096 Sig. of the Change ,000 ,000 ,000 ,000 ,061 ,001
Variable Step 1 CLARIY Step 2 CLARIY CHANELY Step 3 CLARIY KONTINUY CHANELY
df 1 1 1 1 1 1
a Variables not in the Equation
Step 1
Variables
Step 2
Variables
Step 3
Variables
KREDIBY KREDIY M ANFAY CONTEY KONTINUY CHANELY KREDIBY KREDIY M ANFAY CONTEY KONTINUY KREDIBY KREDIY M ANFAY CONTEY
Score 12,738 12,738 9,513 19,272 22,081 33,278 2,935 2,935 ,478 1,551 3,915 3,256 3,256 ,138 1,553
df 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Sig. ,000 ,000 ,002 ,000 ,000 ,000 ,087 ,087 ,489 ,213 ,048 ,071 ,071 ,710 ,213
a. Residual Chi-Squares are not com puted because of redundancies.
Terima kasih Wassalamu Alaikum Wr Wb