harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/publications/files/... · pria...
TRANSCRIPT
ANALISISANALISISANALISISANALISIS
DATA EPIDEMIOLOGIDATA EPIDEMIOLOGIDATA EPIDEMIOLOGIDATA EPIDEMIOLOGI
Johan HarlanJohan HarlanJohan HarlanJohan Harlan
AAAAnalisisnalisisnalisisnalisis Data EpidemiologiData EpidemiologiData EpidemiologiData Epidemiologi
Penulis : Johan Harlan
Cetakan Pertama, September 2019
Disain cover : Joko Slameto
Diterbitkan pertama kali oleh Gunadarma
Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : [email protected]
Hak Cipta dilindungi undang-undang. Dilarang mengutip atau
memperbanyak dalam bentuk apapun sebagian atau seluruh isi
buku tanpa ijin tertulis dari penerbit.
v
KATA PENGANTAR
Buku ini memuat pembahasan tentang analisis data epidemiologi
analitik, yaitu analisis yang ditujukan untuk mengkaji kaitan antara
pajanan dengan penyakit. Kekhususan utama data epidemiologi
analitik antara lain yaitu baik pajanan, penyakit, ataupun kovariat
dan/atau konfaunder seringkali dinyatakan sebagai variabel biner, yaitu
ada atau tidak ada. Rancangan studi epidemiologi tidak dibahas dalam
teks utama, dengan asumsi pembaca telah cukup mengenalinya.
Pengulangan secara singkat mengenai ketiga rancangan dasar studi
epidemilogi terdapat pada lampiran buku ini.
Perangkat komputer statistik yang digunakan untuk analisis dan
pengolahan data dalam buku ini adalah Stata 16, yang cukup lazim
dikenal dan digunakan dalam analisis dan pengolahan data
epidemiologi. Pembaca juga diharapkan telah memiliki pemahaman
cukup mengenai Statistika Inferensi, uji hipotesis, dan metode regresi.
Beberapa buku penulis yang dapat digunakan sebagai sumber referensi
untuk prasyarat mempelajari analisis data epidemiologi ini antara lain
yaitu Biostatistika Dasar, Metode Statistika I dan II, Epidemiologi
Kebidanan, dan Pengenalan Stata.
Penulis menyampaikan terima kasih kepada semua pihak yang
telah membantu penerbitan buku ini. Saran dan kritik dari pembaca
diharapkan demi perbaikan selanjutnya.
Jakarta, September 2019
Seluruh dataset yang dipergunakan dalam buku ini dapat diunduh dari
http://[email protected].
vi
DAFTAR ISI
Kata Pengantar v
Daftar Isi vi
Bab 1 Risk dan Rate 1
Incidence Risk 1
Incidence Rate 5
Prevalensi 8
O d d s 9
Latihan 1 11
Bab 2 Ukuran Rasio 15
Risk Ratio 15
Odds Ratio 20
Rate Ratio 25
Latihan 2 30
Bab 3 Bias dan Konfaunding 33
B i a s 33
Konfaunding 35
Latihan 3 48
Bab 4 Sensitivitas dan Spesifisitas 51
Pengertian Sensitivitas dan Spesifisitas 51
Kurva ROC 54
Nilai Prediktif 55
Rasio Likelihood 57
vii
Latihan 4 62
Bab 5 Analisis Sederhana dan Analisis Stratifikasi 65
Analisis Sederhana 65
Analisis Stratifikasi 72
Latihan 5 81
Bab 6 Studi Matching 85
Rancangan Studi Matched 85
Analisis Data Matching 86
Triplet-Matching 91
Latihan 6 95
Bab 7 Mediasi, Interaksi, dan Moderasi 99
Mediasi 99
Interaksi & Moderasi 106
Latihan 7 110
Bab 8 Analisis Regresi Logistik 113
Regresi Logistik Sederhana 113
Regresi Logistik Ganda 117
Latihan 8 121
Kepustakaan 125
Lampiran Rancangan Studi Epidemiologi 127
1
BAB 1
RISK DAN RATE
� Incidence Risk
Incidence risk (cumulative incidence; CI) atau secara singkat diacu
sebagai risk (risiko) saja, adalah jumlah subjek yang terkena suatu penyakit
tertentu X (= kasus baru) dalam suatu periode tertentu ∆t dibagi jumlah
anggota populasi yang pada awal periode pengamatan dalam keadaan sehat
(= N). Populasi yang pada awal pengamatan seluruhnya dalam keadaan sehat
tersebut dinamakan populasi berisiko (population at risk).
Dalam acuan probabilitas, risk adalah peluang salah seorang subjek
yang tidak sakit untuk mendapatkan suatu penyakit tertentu X dalam periode
pengamatan ∆t, dengan syarat ia tidak meninggal karena penyakit lain
selama periode tersebut.
Jumlah subjek yang mendapatkan penyakit tersebut dalam periode
tertentu ∆t adalah kasus baru yang disebut sebagai kasus insidens.
Estimasi risk adalah:
ˆtRisk∆ = ˆ
tCI∆ = 0
tI
N
∆�
(1.1)
dengan 0 < Risk < 1.
ˆtCI∆ : Risk (incidence risk; cumulative incidence) selama periode ∆t
tI∆
: Jumlah kasus insidens (kasus baru) X dalam periode ∆t
∆t : Periode pengamatan
0N� : Jumlah anggota populasi yang sehat pada awal periode ∆t; populasi
berisiko (population at risk)
2
Jika periode pengamatan cukup lama, umumnya akan didapatkan
kasus withdrawal (drop-out) di antara populasi berisiko yang diikuti. Jika
ada withdrawal, perhitungan estimasi risk dilakukan dengan metode aktuaria
dengan asumsi seluruh peristiwa withdrawal terjadi pada pertengahan ∆t.
Estimasinya adalah:
ˆtRisk∆ = ˆ
tCI∆ = ( )0 2
tI
N w
∆
−� (1.1.a)
ˆtCI∆ : Risk (incidence risk) selama periode ∆t
tI∆ : Jumlah kasus insidens (kasus baru) dalam periode ∆t
0N� : Jumlah anggota populasi yang sehat pada awal periode ∆t;
populasi berisiko (population at risk)
w : Jumlah kasus withdrawal
Jika periode pengamatan relatif panjang, umumnya estimasi nilai risk
akan berubah dari waktu ke waktu. Misalkan periode pengamatan ∆t dibagi
menjadi J interval pengamatan, ∆ 1t , ∆
2t , . . . , ∆ Jt ; sedemikian hingga ∆t =
1
J
jj
t=∑ ; risk pada masing-masing interval adalah 1
ˆCI , 2ˆCI , . . . , ˆ
JCI , maka:
ˆtRisk∆ = ˆ
tCI∆ = ( )1
ˆ1 1J
jj
CI=
− −∏ (1.1.b)
Secara statistik, risk merupakan data proporsi, sehingga interval
konfidensi 100 ( )1 %α− untuk estimasi risk dengan asumsi tanpa
withdrawal pada periode pengamatan ∆t yang relatif pendek yaitu:
ˆtCI∆ + 2Zα
( )0
ˆ ˆ1t t
CI CI
N
∆ ∆−
�
Contoh 1.1
Misalnya hendak diestimasi risk PJK (penyakit jantung koroner) pada
populasi pria lansia 60 tahun ke atas. Perhitungan dilakukan untuk periode 1
3
Januari 2017 s.d. 31 Desember 2017 di kota hipotetis M. Jumlah penduduk
pria lansia 60 tahun ke atas kota M pada 1 Januari 2017 adalah 50,000 orang,
200 orang di antaranya adalah penderita PJK. Selama tahun 2017 didapatkan
80 kasus baru PJK pada pria lansia 60 tahun ke atas.
Dengan asumsi jumlah penduduk pria lansia kota M stasioner dan
tidak ada atrisi, estimasi risk adalah:
ˆtRisk∆ =
0
tI
N
∆�
t
I∆ = 80 0N� = 50,000 ‒ 200 = 49,800
ˆtRisk∆ =
80
49,800 = 0.0016064. . . ≈ 0.0016
Jika selama tahun 2017 terdapat 2,000 kasus withdrawal, estimasi
risk adalah:
ˆtRisk∆ =
( )0 2
tI
N w
∆
−�
w = 2,000
ˆtRisk∆ =
( )80
49,800 2,000 2− = 0.0016393. . . ≈ 0.0016
Contoh 1.2
Dimiliki data follow up selama 5 tahun berikut tentang jumlah
kematian pada sekelompok pasien kanker (Kuzma, 1984):
∆t 0N
tI∆
tw∆
0t →
1t 356 60 0
1t →
2t 296 47 1
2t →
3t 248 29 5
3t →
4t 214 24 45
4t →
5t 145 11 63
4
Misalnya, pada awal tahun pertama didapatkan 356 pasien kanker.
Selama tahun pertama didapatkan 60 kematian dan tidak ada withdrawal,
sehingga sisa pasien pada awal tahun kedua menjadi (356 ‒ 60) = 296 orang.
Selama tahun kedua didapatkan 47 kematian dan 1 kasus withdrawal,
sehingga sisa pasien pada awal tahun ketiga menjadi (296 ‒ 47 ‒ 1) = 248
orang, dan seterusnya.
Maka risk per tahun dan risk kumulatif menjadi:
∆t 0N
tI∆
tw∆ ( )ˆ
iRisk t ( )0ˆ
iRisk t t→
0t → 1t 356 60 0 0.1685 0.1685
1t → 2t 296 47 1 0.1591 0.3008
2t → 3t 248 29 5 0.1181 0.3834
3t → 4t 214 24 45 0.1253 0.4607
4t → 5t 145 11 63 0.0969 0.5129
Tampak bahwa:
( )1ˆRisk t =
60
356 = 0.1685
( )2ˆRisk t =
( )47
286 0.5 1− = 0.1591
( )3ˆRisk t =
( )29
248 0.5 5− = 0.1181
dst.
Selanjutnya:
( )0 1ˆRisk t t→ = 1 ‒ (1 ‒ 0.1685) = 0.1685
( )0 2ˆRisk t t→ = 1 ‒ (1 ‒ 0.1685)(1 ‒ 0.1591) = 0.3008
( )0 3ˆRisk t t→ = 1 ‒ (1 ‒ 0.1685)(1 ‒ 0.1591)(1 ‒ 0.1181)
= 0.3834
dst.
Sehingga risk kumulatif selama 5 tahun adalah:
( )50ˆRisk t t→ = 0.5129
5
� Incidence Rate
Incidence rate (incidence density; ID) atau secara singkat diacu
sebagai rate saja, adalah kelajuan sesaat perubahan status kesehatan anggota
populasi tertentu (dari sehat menjadi sakit / menderita penyakit tertentu X).
Dalam Epidemiologi diasumsikan, jika diamati cukup lama, seluruh anggota
suatu populasi yang sehat (= N� ) akan mengalami perubahan status
kesehatan menjadi penderita penyakit tertentu X, dengan syarat ia tidak
terlebih dahulu meninggal karena penyebab lain (competing risk).
Rate (incidence rate) adalah:
tID = 0
limt
N
t∆ →
∆
∆
�
= dN
dt
�
(1.2)
tID : Rate (incidence rate; incidence density) sesaat pada titik waktu t
N∆ � : Jumlah anggota populasi yang mengalami perubahan status
kesehatan menjadi penderita penyakit X dalam periode pengamatan
sesaat ∆t
∆t : Periode pengamatan sesaat
Dengan pendekatan, estimasi rate adalah:
ˆtID∆ = t
I
PT
∆ (1.3)
ˆtID∆ : Estimasi rate (incidence rate) pada periode waktu ∆t
tI∆ : Jumlah subjek yang mengalami perubahan status kesehatan (=
jumlah kasus insidens) dalam periode ∆t
PT : Person-time
Person-time adalah jumlah waktu pengamatan terhadap seluruh
anggota sampel. Jika ukuran sampel n kecil dan lama (durasi) pengamatan
terhadap masing-masing anggota adalah 1t ,
2t , . . . , nt , maka:
PT = 1t +
2t + . . . + nt
6
PT = 1
n
ii
t=∑ (1.4.a)
Jika jumlah subjek yang diamati berukuran besar, pendekatan person-
time adalah:
PT = 2tN .∆t (1.4.b)
2tN : Jumlah subjek yang diamati pada pertengahan periode pengamatan
∆t. Jika data ini tak dimiliki, digunakan estimasinya
2ˆ
tN = ( )0 2tN N+ (1.5)
0N dan tN masing-masing menyatakan jumlah subjek yang
diamati pada awal dan akhir periode pengamatan.
Maka untuk sampel kecil diperoleh:
ID =
1
n
ii
I
t=∑
(1.6)
sedangkan untuk kelompok berukuran besar:
ID = 2.t
I
N t∆ (1.7)
ataupun pendekatannya:
ID = ( ) 0 .2t
I
N N t ∆+ (1.8)
Contoh 1.3
Misalkan dimiliki sampel 10 orang wanita penderita Ca Cervix di
sebuah rumah sakit. Hasil akhir yang akan diamati adalah peristiwa kematian
penderita karena Ca Cervix. Penelitian dilakukan selama 7 tahun, tetapi tidak
7
semua penderita mulai diamati sejak awal penelitian, karena sebagian
anggota sampel baru mulai diamati sejak tahun kedua, atau bahkan tahun
ketiga. Diperoleh hasil sebagai berikut:
1 †
2 †
3 ††
4 ?
5 †
6 ?
7
8 †
9 ††
10
† : Kematian karena Ca Cervix (kasus insidens)
†† : Kematian karena sebab lain (bukan kasus insidens)
? : Penderita mengundurkan diri dari penelitian atau hilang dari
pengamatan (drop-out atau withdrawal)
Penderita no. 7 dan 10 masih hidup sampai penelitian berakhir (akhir
tahun ketujuh).
Person-time (jumlah tahun pengamatan) adalah:
PT = 1
10
ii
t=∑ = 1t + 2t + . . . 10t
= 1 + 3 + 3 + . . . + 5 = 33
Jumlah kematian karena Ca Cervix adalah:
I = 4 (kasus no. 1, 2, 5, dan 8)
Estimasi rate kematian Ca Cervix adalah:
ID = I
PT =
4
33tahun
‒1 ≈ 0.121 tahun
‒1
8
Contoh 1.4
Lihat kembali data pada Contoh 1.1. Jika diketahui jumlah penduduk
pria lansia 60 tahun ke atas kota M pada 31 Desember 2017 adalah 52,000
orang, maka estimasi incidence rate PJK pada populasi pria lansia 60 tahun
ke atas adalah:
ID = ( ) 0 .2t
I
N N t ∆+
= ( )
80
50,000 52, 100 2 .0+ tahun
‒1 = 0.00157 tahun
‒1
� Prevalensi
Prevalensi adalah jumlah anggota suatu populasi tertentu yang
sedang menderita penyakit tertentu X (= kasus prevalen; kasus lama) pada
suatu titik waktu tertentu t dibagi jumlah seluruh anggota populasi tertentu
tersebut (sehat maupun sakit) pada titik waktu yang sama.
Dalam acuan probabilitas, prevalensi adalah proporsi anggota suatu
populasi tertentu pada titik waktu tertentu t, yang sedang menderita penyakit
tertentu X.
Estimasi prevalensi adalah:
ˆtPr = t
t
C
N (1.9)
ˆtPr : Prevalensi penyakit X pada titik waktu t
tC : Jumlah kasus lama (kasus prevalen) pada titik waktu t
tN : Jumlah anggota populasi pada titik waktu t
Prevalensi secara statistik juga merupakan data proporsi, sehingga
interval konfidensi 100 ( )1 %α− untuk estimasi prevalensi adalah:
9
ˆtPr + 2Zα
( )
ˆ ˆ1t t
t
Pr Pr
N
− (1.10)
Contoh 1.5
Lihat kembali data pada Contoh 1.1. Pada 1 Januari 2017 jumlah
penduduk pria lansia 60 tahun ke atas di kota M adalah 50,000 orang, 200
orang di antaranya menderita PJK.
Estimasi prevalensi kejadian PJK pada 1 Januari 2017 adalah:
ˆtPr = t
t
C
N
= 200
50,000 = 0.4% = 4‰
� Odds
Odds adalah peluang bersyarat seorang subjek untuk mendapatkan
suatu penyakit tertentu X dibagi peluang bersyarat ia tidak mendapatkan
penyakit tertentu X tersebut.
ˆXO =
( )( )1
P X
P X− (1.11)
dengan 0 < Odds < ∞ .
ˆXO : Odds penyakit X
P (X) : Probabilitas subjek untuk mendapatkan penyakit X
Untuk penyakit yang jarang ditemukan dengan P (X) << [1 ‒ P (X)],
odds merupakan aproksimasi yang baik untuk risk:
ˆXO ≈ ˆ
XRisk (1.11)
10
Untuk penyakit yang banyak ditemukan, nilai odds sangat berbeda
dengan risk, walaupun demikian odds tetap merupakan salah satu ukuran
penyakit yang penting dalam Epidemiologi.
Contoh 1.6
Lihat kembali data pada Contoh 1.1 dan 1.5. Pada 1 Januari 2017
jumlah penduduk pria lansia 60 tahun ke atas di kota M adalah 50,000 orang,
200 orang di antaranya menderita PJK.
Dengan asumsi P (X) ≈ 200 50,000 = 0.004, maka estimasi odds
kejadian PJK pada 1 Januari 2017 adalah:
ˆXO =
( )( )1
P X
P X−
= 0.004
1 0.004− ≈ 4.016‰
Tampak bahwa untuk penyakit jarang (rare disease), odds merupakan
aproksimasi yang baik untuk probabilitas.
11
LATIHAN 1
Pilihlah jawaban yang paling benar!
1. Risk adalah:
A. Proporsi anggota populasi yang sakit pada akhir suatu periode.
B. Peluang subjek untuk mendapatkan penyakit selama suatu
periode.
C. Peluang bersyarat subjek untuk mendapatkan penyakit selama
suatu periode, dengan syarat subjek tidak lebih dahulu meninggal
karena penyakit lain.
D. Semuanya salah.
2. Incidence risk adalah:
A. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek pada awal periode.
B. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek sehat pada awal periode.
C. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek pada pertengahan periode.
D. Semuanya salah.
3. Pilihlah yang benar:
A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.
4. Asumsi metode aktuaria pada estimasi risk ialah:
A. Seluruh kasus drop-out terjadi pada pertengahan periode
pengamatan.
B. Seluruh kasus baru terjadi pada pertengahan periode pengamatan.
C. Seluruh kasus lama dihitung pada pertengahan periode
pengamatan.
D. Semuanya salah.
12
5. Incidence rate adalah:
A. Kecepatan rata-rata perubahan status kesehatan suatu populasi.
B. Kecepatan sesaat perubahan status kesehatan suatu populasi.
C. Kelajuan rata-rata perubahan status kesehatan suatu populasi.
D. Kelajuan sesaat perubahan status kesehatan suatu populasi.
6. Person-time adalah:
A. Jumlah subjek diamati pada awal periode pengamatan dikali lama
pengamatan.
B. Jumlah subjek diamati pada pertengahan periode pengamatan
dikali lama pengamatan.
C. Jumlah subjek diamati pada akhir periode pengamatan dikali lama
pengamatan.
D. Semuanya salah.
7. Prevalensi adalah:
A. Jumlah penderita penyakit pada satu titik waktu.
B. Jumlah penderita penyakit pada satu titik waktu dibagi jumlah
anggota populasi pada titik waktu yang sama.
C. Jumlah penderita penyakit pada satu titik waktu dibagi jumlah
anggota populasi sehat pada titik waktu yang sama.
D. Semuanya salah.
Untuk soal No. 8 s.d. 12:
Dari Dinas Kesehatan kota B diperoleh data berikut:
Tanggal Jumlah penduduk
(N)
Kasus lama penyakit X
( xC )
1-1-2018 20,000 374
1-1-2019 20,500 328
Selama tahun 2018 tercatat 72 kasus baru penyakit X.
8. Estimasi prevalensi penyakit X pada 1 Januari 2018 adalah:
A. 0.0160 C. 0.0035
B. 0.0187 D. 0.0036
13
9. Interval konfidensi 95% prevalensi penyakit X pada 1 Januari 2018
adalah:
A. [0.0135 ; 0.0185] C. [0.0152 ; 0.0222]
B. [0.0141 ; 0.0179] D. [0.0168 ; 0.0206]
10. Estimasi risk penyakit X tahun 2018 adalah:
A. 0.0037 C. 0.0035
B. 0.0036 D. 0.0034
11. Interval konfidensi 95% risk penyakit X tahun 2018 adalah:
A. [0.0026 ; 0.0048] C. [0.0028 ; 0.0045]
B. [0.0025 ; 0.0047] D. [0.0027 ; 0.0043]
12. Estimasi rate penyakit X tahun 2018 adalah:
A. 0.0034 tahun-1
C. 0.0036 tahun-1
B. 0.0035 tahun-1
D. 0.0037 tahun-1
Untuk soal No. 13 s.d. 15:
Dimiliki sampel 78 orang manula. Pada awal 2017, 33 orang di
antaranya telah menderita arthritis. Selama tahun 2017 didapatkan 9 orang
penderita baru arthritis. Jika selama tahun 2017 tidak ada subjek yang
meninggal dan tidak ada drop-out, maka:
13. Estimasi risk arthritis selama tahun 2017 adalah:
A. 0.200 C. 0.487
B. 0.222 D. 0.538
14. Estimasi rate arthritis pada tahun 2017 adalah:
A. 0.200 tahun-1
C. 0.487 tahun-1
B. 0.222 tahun-1
D. 0.538 tahun-1
15. Estimasi prevalensi arthritis pada akhir tahun 2017 adalah:
A. 0.200 C. 0.487
B. 0.222 D. 0.538
15
BAB 2
UKURAN RASIO
Rasio dalam Epidemologi adalah perbandingan (pembagian) antara
dua ukuran Epidemiologi dengan satuan pengukuran yang sama. Dalam
konteks studi Epidemiologi, perbandingan tersebut adalah antara ukuran
Epidemiologi pada kelompok studi (kelompok yang dipelajari) dengan
ukuran Epidemiologi serupa pada kelompok kontrol.
� Risk Ratio
Risk ratio untuk populasi umumnya didapatkan dari studi
observasional kohort, sedangkan risk ratio untuk kelompok kecil biasanya
diperoleh sebagai hasil studi eksperimental uji klinik (randomized
controlled trial). Untuk studi kohort, lay-out data adalah sebagai berikut:
Pajanan Penyakit
Jumlah D D
E a b 1n
E c d 2n
Jumlah 1m
2m n
E : Kelompok terpajan ( E = exposed)
E : Kelompok tak-terpajan ( E = non-exposed)
D : Kelompok sakit ( D = diseased)
D : Kelompok tidak sakit ( D = non-diseased)
Untuk kelompok terpajan (exposed), estimasi risk adalah:
1
ˆCI = 1
a
n (2.1.a)
16
1ˆCI : Estimasi risk (cumulative incidence) pada kelompok terpajan
a : Jumlah kasus baru di antara kelompok terpajan selama periode
pengamatan
1n : Jumlah subjek sehat pada awal pengamatan (population-at-risk)
untuk kelompok terpajan
Untuk kelompok tak-terpajan (non-exposed), estimasi risk adalah:
2
ˆCI = 2
c
n (2.1.b)
2ˆCI : Estimasi risk (cumulative incidence) pada kelompok tak-terpajan
c : Jumlah kasus baru di antara kelompok tak-terpajan selama
periode pengamatan
2n : Jumlah subjek sehat pada awal pengamatan (population-at-risk)
untuk kelompok tak-terpajan
Estimasi risk ratio adalah:
ˆCIR =
1
2
ˆ
ˆ
CI
CI =
1
2
a n
c n (2.2)
ˆCIR : Estimasi risk ratio (cumulative incidence ratio)
ˆCIR diasumsikan berdistribusi log-normal dengan estimasi variansi
ln-nya adalah:
( )ˆˆ lnVar CIR =
1 2
1 1 1 1
a n c n− + − (2.3)
sehingga interval konfidensi 100 ( )1 %α− untuk estimasi ˆln CIR adalah:
ˆln CIR + 2Zα
1 2
1 1 1 1
a n c n− + − (2.3.a)
dan interval konfidensi 100(1 – α)% untuk estimasi ˆCIR (interval
konfidensi berbasiskan deret Taylor) adalah:
17
ˆCIR
2
1 2
1 1 1 1exp Z
a n c nα
± − + −
(2.4)
Contoh 2.1
Misalkan dimiliki data fiktif untuk 10,000 akseptor KB dengan
kontrasepsi oral sebagai kelompok terpajan dan 10,000 wanita usia-subur
yang tidak menggunakan kontrasepsi oral sebagai kelompok tak-terpajan.
Pengamatan selama 4 tahun menunjukkan terjadinya 28 kasus thrombo-
embolisme di antara anggota kelompok terpajan, sedangkan pada kelompok
tak-terpajan, hanya didapatkan 15 kasus thrombo-embolisme. Paparan data
adalah sebagai berikut:
Pajanan Penyakit
Jumlah TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna
OC 15 9,985 10,000
Jumlah 43 19,957 20,000
OC : Oral contraceptive
TE : Thrombo-embolism
Estimasi risk pada pengguna OC adalah:
1
ˆCI = 1
a
n =
28
10,000 = 0.0028
Estimasi risk pada non-pengguna OC adalah:
2
ˆCI = 2
c
n =
15
10,000 = 0.0015
Estimasi risk ratio adalah:
ˆCIR =
1
2
ˆ
ˆ
CI
CI =
0.0028
0.0015 = 1.8666 . . . ≈ 1.867
18
ˆVar [ln ˆCIR ] =
1 2
1 1 1 1
a n c n− + −
=
1 1 1 1
28 10000 15 10000− + − = 0.102
Interval konfidensi 95% untuk ˆCIR (berbasiskan deret Taylor) adalah:
ˆCIR
2
1 2
1 1 1 1exp Z
a n c nα
± − + −
atau: 1.867 * exp [+ 1.96 * 1 1 1 1
28 10000 15 10000− + −
yaitu: [0.998 ; 3.493]
Contoh 2.2
Digunakan file data Stata csxmpl.dta, yang memuat data tabel
2×2 hasil studi kohort untuk 30 subjek.
. use “D:\Epidemiologi\Data\csxmpl.dta”, clear
. list
+------------------+
| case exp pop |
|------------------|
1. | 1 1 7 |
2. | 1 0 12 |
3. | 0 1 9 |
4. | 0 0 2 |
+------------------+
. cs case exp [fw=pop]
19
| exp |
| Exposed Unexposed | Total
------------+------------------------+------------
Cases | 7 12 | 19
Noncases | 9 2 | 11
------------+------------------------+------------
Total | 16 14 | 30
| |
Risk | .4375 .8571429 | .6333333
| Point estimate | [95% Conf. Interval]
|-----------------+------------------------
Risk difference | -.4196429 | -.7240828 -.1152029
Risk ratio | .5104167 | .2814332 .9257086
Prev. frac. ex. | .4895833 | .0742914 .7185668
Prev. frac. pop | .2611111 |
+------------------------------------------
chi2(1) = 5.66 Pr>chi2 = 0.0173
Estimasi risk ratio adalah 0.510 dengan interval konfidensi 95%
[0.281 ; 0.926]. Perhitungan estimasi interval risk ratio pada Stata
dilakukan dengan metode berbasiskan deret Taylor.
Contoh 2.3
Lihat kembali data pada Contoh 2.1:
Pajanan Penyakit
Jumlah TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna OC 15 9,985 10,000
Jumlah 43 19,957 20,000
Dengan Stata diperoleh:
. csi 28 15 9972 9985
20
| Exposed Unexposed | Total
-----------+------------------------+--------
Cases | 28 15 | 43
Noncases | 9972 9985 | 19957
-----------+------------------------+--------
Total | 10000 10000 | 20000
Risk | .0028 .0015 | .00215
| Point estimate | [95% Conf. Interval]
|-----------------+---------------------
Risk difference | .0013 | .0000163 .0025837
Risk ratio | 1.866667 | .9976398 3.492688
Attr. frac. ex. | .4642857 | -.0023658 .7136876
Attr. frac. pop | .3023256 |
+---------------------------------------
chi2(1) = 3.94 Pr>chi2 = 0.0472
� Odds Ratio
Odds ratio biasanya digunakan untuk data studi kasus-kontrol,
tetapi adakalanya karena penggunaan analisis statistik tertentu, dipakai juga
untuk data studi kohort ataupun data uji klinik. Untuk penyakit yang jarang
ditemukan (rare disease), odds ratio merupakan aproksimasi yang baik
untuk risk ratio. Lay-out data untuk studi kasus-kontrol dalam sampel
adalah sebagai berikut:
Pajanan Penyakit
C C
E a b
E c d
Jumlah 1m
2m
E : Kelompok terpajan ( E = exposed)
E : Kelompok tak-terpajan ( E = non-exposed)
C : Kelompok kasus ( C = cases)
C : Kelompok kontrol (C = controls)
21
sedangkan dalam populasi didapatkan:
Pajanan Penyakit
C C
E A B
E C D
Jumlah 1M
2M
Odds sakit dalam populasi untuk kelompok terpajan (exposed)
adalah:
1O =
A
B (2.5.a)
1O : Odds sakit (odds disease) pada kelompok terpajan
A : Jumlah kasus (lama) yang terpajan
B : Jumlah kontrol (subjek sehat) yang terpajan
Odds sakit dalam populasi untuk kelompok tak-terpajan (non-
exposed) adalah:
2O =
C
D (2.5.b)
2O : Odds sakit (odds disease) pada kelompok tak-terpajan
C : Jumlah kasus (lama) yang tak-terpajan
D : Jumlah kontrol (subjek sehat) yang tak-terpajan
Odds ratio populasi adalah:
OR =
1
2
O
O =
A B
C D =
AD
BC (2.6)
Estimasinya pada sampel adalah:
OR =
1
2
ˆ
ˆ
O
O =
ad
bc (2.6.a)
OR : Estimasi odds ratio
22
OR juga diasumsikan berdistribusi log-normal dengan estimasi
variansi ln-nya adalah:
( )ˆˆ lnVar OR =
1 1 1 1
a b c d+ + + (2.7)
sehingga interval konfidensi 100 ( )1 %α− untuk estimasi ˆln OR adalah:
ˆln OR + 2Zα
1 1 1 1
a b c d+ + + (2.7a)
dan interval konfidensi 100(1 – α)% untuk estimasi OR (interval
konfidensi berbasiskan deret Taylor) adalah:
OR 2
1 1 1 1exp Z
a b c dα
± + + +
(2.8)
Contoh 2.4
Lihat kembali data pada Contoh 2.1. Thrombo-embolisme
merupakan kasus yang jarang, sehingga untuk data Contoh 2.1, odds ratio
merupakan aproksimasi yang baik untuk risk ratio.
Estimasi odds ratio adalah:
OR = ad
bc =
( )( )
( ) ( )
28 9,985
9,972 15 = 1.86910 . . . ≈ 1.869
Tampak bahwa nilai odds ratio di sini hampir sama dengan nilai
risk ratio yang diperoleh pada Contoh 2.1 (berlaku untuk penyakit jarang).
ˆVar [ln OR ] =
1 1 1 1
a b c d+ + +
=
1 1 1 1
28 9972 15 9985+ + + = 0.103
23
Interval konfidensi 95% untuk OR (berbasiskan deret Taylor) adalah:
OR 2
1 1 1 1exp Z
a b c dα
± + + +
atau: 1.869 * exp [+ 1.96 1 1 1 1
28 9972 15 9985+ + +
yaitu: [0.998 ; 3.502]
Contoh 2.5
Dimiliki file data ccxmpl.dta hasil uji kasus-kontrol dalam bentuk
tabel 2×2.
. use "D:\Epidemiologi\ccxmpl.dta"
. list
+-----------------------+
| case exposed pop |
|-----------------------|
1. | 1 1 4 |
2. | 1 0 386 |
3. | 0 1 4 |
4. | 0 0 1250 |
+-----------------------+
. cc case exposed [fw=pop]
Proportion
| Exposed Unexposed | Total Exposed
--------------+------------------------+-------------------
Cases | 4 386 | 390 0.0103
Controls | 4 1250 | 1254 0.0032
--------------+------------------------+-------------------
Total | 8 1636 | 1644 0.0049
24
| Point estimate | [95% Conf. Interval]
|----------------+---------------------
Odds ratio | 3.238342 | .5997233 17.45614 (exact)
Attr. frac. ex. | .6912 | -.6674356 .9427136 (exact)
Attr. frac. pop | .0070892 |
+--------------------------------------
chi2(1) = 3.07 Pr>chi2 = 0.0799
Estimasi odds ratio adalah 3.238 dengan interval konfidensi 95%
[0.600 ; 17.456]. Estimasi interval odds ratio pada Stata dilakukan dengan
metode eksak.
Contoh 2.6
Lihat kembali data pada Contoh 2.1 dan 2.4:
Pajanan Penyakit
Jumlah TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna OC 15 9,985 10,000
Jumlah 43 19,957 20,000
Analisis data dengan Stata menghasilkan:
. cci 28 15 9972 9985
Proportion
| Exposed Unexposed | Total Exposed
---------+----------------------+-------------------
Cases | 28 15 | 43 0.6512
Controls | 9972 9985 | 19957 0.4997
---------+----------------------+-------------------
Total | 10000 10000 | 20000 0.5000
25
| Point estimate | [95% Conf. Interval]
|------------------+---------------------
Odds ratio | 1.8691 | .9638846 3.767324 (exact)
Attr. frac. ex. | .4649832 | -.0374686 .7345596 (exact)
Attr. frac. pop | .3027798 |
+----------------------------------------
chi2(1) = 3.94 Pr>chi2 = 0.0472
� Rate Ratio
Rate ratio diperoleh pada studi densitas, yaitu studi follow-up
dengan person-time.
Lay-out data untuk perhitungan rate ratio adalah sebagai berikut:
Pajanan I PT
E a 1L
E b 2L
Jumlah 1m L
E : Kelompok terpajan ( E = exposed)
E : Kelompok tak-terpajan ( E = non-exposed)
I : Jumlah kasus insidens dalam periode pengamatan
PT : Person-time
Estimasi rate pada kelompok terpajan adalah:
1ID =
1
a
L (2.9.a)
1ID : Estimasi rate (incidence density) pada kelompok terpajan
a : Jumlah kasus insidens dalam periode pengamatan pada kelompok
terpajan
1L : Person-time untuk kelompok terpajan
26
Estimasi rate pada kelompok tak-terpajan adalah:
2ID =
2
b
L (2.9.b)
2ID : Estimasi rate (incidence density) pada kelompok tak-terpajan
b : Jumlah kasus insidens dalam periode pengamatan pada kelompok
tak-terpajan
2L : Person-time untuk kelompok tak-terpajan
Estimasi rate ratio adalah:
IDR =
1
2
ˆ
ˆ
ID
ID =
1
2
a L
b L (2.10)
IDR : Estimasi rate ratio (incidence density ratio)
IDR diasumsikan berdistribusi log-normal dengan estimasi variansi
ln-nya adalah:
( )ˆˆ lnVar IDR =
1 1
a b+ (2.11)
sehingga interval konfidensi 100 ( )1 %α− untuk estimasi ˆln IDR adalah:
ˆln IDR + 2Zα
1 1
a b+ (2.11.a)
dan interval konfidensi 100(1 – α)% untuk estimasi IDR (interval
konfidensi berbasiskan deret Taylor) adalah:
IDR 2
1 1exp Z
a bα
± +
(2.12)
Contoh 2.7
Dimiliki data densitas hasil uji klinik berikut. Tiga puluh subjek
diikutsertakan dalam penelitian 15 subjek dalam kelompok perlakuan
27
(treatment), yaitu asupan vitamin C harian, dan 15 subjek lainnya diberikan
plasebo. Pengamatan dilakukan selama 6 bulan.
Perlakuan
Penyakit
Common
cold PT
Vit C 5 79
Plasebo 7 69
Jumlah 148
Estimasi rate pada kelompok perlakuan adalah:
1ID =
1
a
L =
5
79 ≈ 0.063
Estimasi rate pada kelompok kontrol adalah:
2ID =
2
b
L =
7
69 ≈ 0.101
Estimasi rasio risiko adalah:
IDR =
1
2
ˆ
ˆ
ID
ID =
0.063
0.101 ≈ 0.624
ˆVar [ln IDR ] =
1 1
a b+
=
1 1
5 7+ = 0.343
Interval konfidensi 95% untuk IDR (berbasiskan deret Taylor) adalah:
IDR 2
1 1exp Z
a bα
± +
atau: 0.624*exp [+1.96*1 1
5 7+
yaitu: [0.198 ; 1.966]
28
Contoh 2.8
File data irxmpl.dta berikut memuat data hasil studi kohort dengan
data densitas.
. use "D:\Epidemiologi\Data\irxmpl.dta"
. list
+-------------------------+
| cases exposed time |
|-------------------------|
1. | 41 0 28010 |
2. | 15 1 19017 |
+-------------------------+
. ir cases exposed time
| exposed |
| Exposed Unexposed | Total
---------------+----------------------+---------
cases | 15 41 | 56
time | 19017 28010 | 47027
---------------+----------------------+---------
| |
Incidence rate | .0007888 .0014638 | .0011908
| Point estimate | [95% Conf. Interval]
|----------------+---------------------
Inc. rate diff. | -.000675 | -.0012751 -.0000749
Inc. rate ratio | .5388632 | .277062 .9943481 (exact)
Prev. frac. ex. | .4611368 | .0056519 .722938 (exact)
Prev. frac. pop | .1864767 |
+--------------------------------------
(midp) Pr(k<=15) = 0.0177 (exact)
(midp) 2*Pr(k<=15) = 0.0355 (exact)
Estimasi rate ratio adalah 0.539 dengan interval konfidensi 95%
[0.277 ; 0.994].
29
Contoh 2.9
Lihat kembali data pada Contoh 2.7:
Perlakuan
Penyakit
Common
cold PT
Vit C 5 79
Plasebo 7 69
Jumlah 148
Analisis data dengan Stata adalah sebagai berikut:
. iri 5 7 79 69
| Exposed Unexposed | Total
---------------+----------------------+---------
Cases | 5 7 | 12
Person-time | 79 69 | 148
---------------+----------------------+---------
| |
Incidence rate | .0632911 .1014493 | .0810811
| Point estimate | [95% Conf. Interval]
|----------------+---------------------
Inc. rate diff. | -.0381581 | -.1315691 .0552529
Inc. rate ratio | .6238698 | .1561338 2.283479 (exact)
Prev. frac. ex. | .3761302 | -1.283479 .8438662 (exact)
Prev. frac. pop | .2007722 |
+--------------------------------------
(midp) Pr(k<=5) = 0.2173 (exact)
(midp) 2*Pr(k<=5) = 0.4347 (exact)
Estimasi rate ratio adalah 0.624. Dengan metode eksak, diperoleh
interval konfidensi 95% untuk rate ratio yaitu [0.156 ; 2.283].
30
LATIHAN 2
Pilihlah jawaban yang paling benar!
1. Untuk mempelajari pengaruh faktor usia terhadap tekanan darah
sistolik, rancangan studi yang terbaik adalah:
A. Studi kohort.
B. Studi kasus-kontrol.
C. Studi potong-lintang
D. Studi eksperimental
Untuk soal No. 2 dan 3:
Dimiliki paparan hasil studi kohort dalam bentuk tabel 2×2 berikut:
D D
E a b 1n
E c d 2n
1m
2m n
2. Fraksi 2c n menyatakan:
A. Proporsi subjek yang sakit pada kelompok terpajan.
B. Proporsi subjek yang sakit pada kelompok tak-terpajan.
C. Proporsi subjek yang tidak sakit pada kelompok tak-terpajan.
D. Proporsi subjek terpajan pada kelompok yang sakit.
3. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor
risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. 1a n > 2c n C. a b > c d
B. 1a m >
2b m D. Semuanya salah.
31
4. Pilihlah yang benar:
A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.
Untuk soal No. 5 s.d. 7:
Dilakukan studi kasus-kontrol dengan pemeriksaan post-mortem 50
pengemudi yang meninggal pada kecelakaan lalu-lintas dan sebagai kontrol,
50 pengemudi yang mengalami kecelakaan tetapi tidak meninggal. Dari 50
pengemudi yang tidak meninggal, 12 orang memakai sabuk pengaman,
sedang dari kelompok yang meninggal, hanya 6 orang yang memakainya.
5. Estimasi rasio odds adalah:
A. 0.432 C. 0.579
B. 0.500 D. 0.621
6. Dengan asumsi rasio odds berdistribusi log-normal, interval konfidensi
95% rasio odds adalah:
A. [0.074 ; 0.744] C. [0.295 ; 1.408]
B. [0.195 ; 0.865] D. [0.148 ; 1.261]
7. Dengan tingkat signifikansi 0.05, kesimpulan yang diperoleh yaitu:
A. Ditemukan hubungan antara penggunaan sabuk pengaman dengan
kematian pengemudi.
B. Tidak ditemukan hubungan antara penggunaan sabuk pengaman
dengan kematian pengemudi.
C. Belum diperoleh kesimpulan tentang hubungan antara
penggunaan sabuk pengaman dengan kematian pengemudi.
D. Semuanya salah.
32
Untuk soal No. 8 dan 9:
Selain data untuk soal No. 5 s.d. 7 di atas, diperoleh pula hasil survei
tambahan bahwa estimasi proporsi pengguna sabuk pengaman pada populasi
pengemudi yang mengalami kecelakaan lalu lintas adalah 0.2.
8. Estimasi risk pada kelompok pengguna sabuk pengaman adalah:
A. 0.120 C. 0.333
B. 0.200 D. 0.367
9. Estimasi rasio risk antar kedua kelompok adalah:
A. 0.433 C. 0.644
B. 0.456 D. 0.725
Untuk soal No. 10 s.d. 12:
Dilakukan studi densitas tentang stadium penyakit X saat diagnosis
dibuat dengan durasi survivalnya. Hasilnya yaitu:
Kematian dan durasi survivalnya
Stadium III Stadium II Stadium I
Kematian 12 7 5
PT (dalam bulan) 107 95 103
10. Estimasi rate penderita stadium I adalah:
A. 0.016 C. 0.049
B. 0.039 D. 0.112
11. Estimasi rasio rate penderita stadium II terhadap penderita stadium I
adalah:
A. 0.533 C. 1.522
B. 1.518 D. 2.310
12. Estimasi rasio rate penderita stadium III terhadap penderita stadium I
adalah:
A. 0.533 C. 1.522
B. 1.518 D. 2.310
33
BAB 3
BIAS DAN KONFAUNDING
� Bias
Bias adalah deviasi sistematik hasil estimasi suatu parameter dengan
nilai parameter sebenarnya (gambar 3.1). Bias dapat menyebabkan estimasi
hubungan antara pajanan dengan respons menjadi lebih besar daripada
sesungguhnya (overestimated association), atau sebaliknya menjadi lebih
kecil daripada hubungan sesungguhnya (underestimated association), atau
bahkan sampai pembalikan hubungan (faktor risiko menjadi preventif, atau
sebaliknya). Tiga tipe bias yang lazim ditemukan adalah bias seleksi, bias
informasi, dan konfaunding.
Gambar 3.1 Bias dan galat sistematik
� Bias Seleksi
Bias seleksi adalah deviasi hasil estimasi suatu parameter yang
disebabkan cara seleksi subjek penelitian untuk menjadi anggota sampel.
Cara seleksi yang dipilih mengakibatkan distorsi hubungan antara pajanan
dan respons pada kelompok anggota sampel terpilih, dibandingkan dengan
hubungan antara pajanan dan respons pada kelompok anggota sampel yang
“seharusnya” terpilih.
34
Contoh 3.1
Pada studi hubungan antara radiasi nuklir dengan kejadian leukemia
(Caldwell, 1980), dilakukan pelacakan terhadap mantan petugas percobaan
nuklir di gurun Nevada, Amerika Serikat untuk mendapatkan anggota sampel
penelitian. Dari anggota sampel yang diperoleh, 82% adalah hasil pelacakan
petugas penelitian, sedangkan 18% sisanya terdiri atas mantan petugas
percobaan nuklir yang menghubungi peneliti atas inisiatif mereka sendiri
(self selection).
Di antara 82% anggota sampel hasil pelacakan petugas penelitian,
ditemukan 4 kasus leukemia, tetapi di antara 18% anggota sampel yang
menghubungi peneliti atas inisiatif sendiri juga didapatkan 4 kasus leukemia.
Prevalensi leukemia yang jauh lebih tinggi di antara anggota sampel yang
datang sendiri menghubungi peneliti adalah fenomena self selection bias,
yang merupakan salah satu bentuk bias seleksi.
� Bias Informasi
Bias informasi adalah deviasi hasil estimasi suatu parameter yang
disebabkan ketidaktepatan pengukuran tingkat pajanan ataupun responsnya
secara sistematik. Bias informasi terjadi karena alat ukur atau prosedur
pengukuran yang digunakan tidak valid, atau informasi yang diperoleh tidak
lengkap (data kosong; missing data).
Contoh 3.2
Salah satu bentuk bias informasi ialah recall bias, yang banyak
ditemukan pada studi kasus-kontrol. Pada studi efek teratogenik obat tertentu
pada ibu hamil terhadap kejadian cacat lahir bayi, data riwayat penggunaan
obat selama kehamilan seringkali harus diperoleh melalui anamnesis, yang
sangat tergantung pada daya ingatan ibu.
Seringkali pula ditemukan, bahwa ibu yang melahirkan bayi cacat
lebih mudah mengingat obat-obat yang dikonsumsi selama kehamilan (recall
35
bias), dibandingkan dengan ibu yang melahirkan bayi normal. Recall bias
adalah salah satu bentuk bias informasi.
Bias seleksi dan bias informasi umumnya hanya dapat dikendalikan
pada tahap perancangan, yang tidak akan dibahas secara rinci dalam buku
ini. Bias seleksi diharapkan dapat dikendalikan dengan pengambilan sampel
secara acak (random sampling), sedangkan bias informasi diatasi dengan
menggunakan devais medik ataupun kuesioner penelitian yang teruji valid
dan reliabel.
� Konfaunding
Konfaunding adalah distorsi estimasi efek suatu pajanan terhadap
respons karena asosiasi pajanan dengan faktor lain (konfaunder) yang juga
berpengaruh terhadap respons tersebut. Konfaunding terjadi jika
pengestimasian efek pajanan terhadap respons dilakukan tanpa
memperhitungkan keberadaan konfaunder. Karena keberadaan konfaunder
umumnya tak diketahui, konfaunding praktis hanya dapat dikendalikan
dalam tahap perancangan pada studi eksperimental, yaitu dengan
randomisasi perlakuan. Dalam studi observasional, konfaunder umumnya
harus dikendalikan dalam tahap analisis data.
Hasil estimasi efek pajanan terhadap respons tanpa
memperhitungkan keberadaan konfaunder dinamakan estimasi kasar (crude
estimate), sedangkan hasil estimasi pajanan terhadap respons dengan
memperhitungkan keberadaan konfaunder dinamakan estimasi suaian
(adjusted estimate). Untuk konfaunder kategorik, penyesuaian dilakukan
dengan melakukan estimasi secara terpisah pada tiap kategori konfaunder,
lalu dihitung nilai summary-nya. Keberadaan konfaunder tidak ditentukan
oleh hasil uji statistik, namun semata-mata ditentukan oleh nilai estimasi
suaian yang jelas berbeda dengan nilai estimasi kasar.
Fenomena lain yang mungkin didapatkan menyertai konfaunding
adalah interaksi. Interaksi tidak selalu ada menyertai konfaunding, dan
interaksi bukan merupakan salah satu bentuk bias. Interaksi dinyatakan ada
jika pada penyesuaian dengan konfaunder K seperti pada contoh di atas,
36
didapatkan nilai rasio odds stratum-spesifik yang jelas berbeda antar stratum.
Keberadaan interaksi harus dibuktikan dengan uji statistik dan akan dibahas
lebih lanjut kemudian.
Uji statistik terhadap interaksi harus dilakukan terlebih dahulu
sebelum penilaian konfaunding. Seandainya didapatkan interaksi yang kuat,
estimasi efek harus dilaporkan secara spesifik untuk tiap stratum konfaunder
dan tidak boleh dilakukan perhitungan nilai summary-nya. Dalam hal ini,
konfaunding dianggap tidak mungkin dinilai keberadaannya dan dianggap
tidak ada.
� Studi Kasus-Kontrol
Misalkan pada studi efek pajanan E terhadap penyakit C dalam
rancangan studi kasus-kontrol, diperoleh rasio odds kasar (crude odds ratio)
ˆcOR . Selanjutnya pada penyesuaian dengan konfaunder F yang memiliki 2
kategori, pada stratum 1 F didapatkan rasio odds spesifik-stratum 1OR dan
pada stratum 2 F didapatkan rasio odds spesifik-stratum 2OR . Maka dapat
diimplikasikan bahwa nilai summary keduanya, yaitu nilai rasio odds suaian
(adjusted odds ratio) ˆaOR berkisar antara 1OR dan
2OR dengan:
1OR < ˆaOR <
2OR
Konfaunding dinyatakan ada jika:
ˆaOR ≠ ˆcOR
37
Lay-out data untuk contoh di atas adalah sebagai berikut:
Gabungan
Pajanan Penyakit
Jumlah C C
E a b
E c d
Jumlah n
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah C C C C
E 1a
1b E 2a
2b
E 1c
1d E 2c
2d
Jumlah
n1 Jumlah
n 2
dengan:
ˆcOR = ad
bc (3.1)
dan: 1OR =
1 1
1 1
a d
b c (3.2.a)
2OR =
2 2
2 2
a d
b c (3.2.b)
Jika tidak ditemukan interaksi, estimasi rasio odds suaian dapat
dihitung dengan estimator Mantel-Haenszel:
ˆaORMH =
2
1
2
1
i i
i i
i i
i i
a d
n
b c
n
=
=
∑
∑
(3.3)
38
Contoh 3.3
Misalkan dimiliki data hipotetis studi kasus-kontrol pada tabel 2×2
berikut dan stratifikasinya menurut taraf biner konfaunder F.
Gabungan
Pajanan Penyakit
Jumlah C C
E 550 400
E 450 600
Jumlah 2000
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah C C C C
E 520 180 E 30 220
E 300 100 E 150 500
Jumlah 1100 Jumlah 900
Estimasi rasio odds kasar adalah:
ˆcOR = ad
bc
= ( ) ( )
( ) ( )
550 600
400 450 ≈ 1.83
Dengan stratifikasi diperoleh:
1OR =
1 1
1 1
a d
b c
= ( )( )
( )( )
520 100
180 300 ≈ 0.96
2OR =
2 2
2 2
a d
b c
= ( )( )
( ) ( )
30 500
220 150 ≈ 0.45
39
Dengan metode Mantel-Haenszel diperoleh estimator suaian:
ˆaORMH =
2
1
2
1
i i
i i
i i
i i
a d
n
b c
n
=
=
∑
∑
=
( )( ) ( )( )
( ) ( ) ( )( )
520 100 30 500
1100 900180 300 220 150
1100 900
+
+
≈ 0.75
Tampak bahwa 2OR < ˆaOR <
1OR
atau: 0.45 < ˆaOR < 0.96 dan ˆaOR ≠ ˆcOR
Contoh 3.4
File data downs.dta memuat variabel pajanan exposed, penyakit
case, dan konfaunder age.
. use "D:\Epidemiologi\downs.dta"
. list
+-----------------------------+
| case exposed pop age |
|-----------------------------|
1. | 1 1 3 <35 |
2. | 1 0 9 <35 |
3. | 0 1 104 <35 |
4. | 0 0 1059 <35 |
5. | 1 1 1 35+ |
|-----------------------------|
6. | 1 0 3 35+ |
7. | 0 1 5 35+ |
8. | 0 0 86 35+ |
+-----------------------------+
40
. cc case exposed [fw=pop], by(age)
Maternal age | OR [95% Conf. Interval] M-H Weight
-------------+-------------------------------------------
<35 | 3.394231 .5812415 13.87412 .7965957 (exact)
35+ | 5.733333 .0911619 85.89602 .1578947 (exact)
-------------+-------------------------------------------
Crude | 3.501529 .8080857 11.78958 (exact)
M-H combined | 3.781172 1.18734 12.04142
----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.14 Pr>chi2 = 0.7105
Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 5.81
Pr>chi2 = 0.0159
ˆcOR = 3.502
1OR = 3.394
2OR = 5.733
ˆaORMH = 3.781
� Studi Kohort
Untuk studi kohort, lay-out data adalah sebagai berikut:
Gabungan
Pajanan Penyakit
Jumlah D D
E a b 1n
E c d 2n
Jumlah n
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D D D
E 1a
1b 1n1 E
2a 2b
1n 2
E 1c
1d 2n1 E
2c 2d
2n2
Jumlah
n1 Jumlah
n 2
41
dengan:
ˆcCIR =
1
2
a n
c n (3.4)
dan: 1
ˆCIR =
1 1
1 2
a n
c n
1
1
(3.5.a)
2
ˆCIR =
2 1
2 2
a n
c n
2
2
(3.5.b)
Jika tidak ditemukan interaksi, estimasi rasio risiko suaian dapat
dihitung dengan estimator Mantel-Haenszel:
ˆaCIRMH =
2
1
2
1
i i
i i
i i
i i
a n
n
c n
n
=
=
∑
∑
2
1
(3.6)
Contoh 3.5
Misalkan dimiliki data hipotetis studi kohort pada tabel 2×2 berikut
dan stratifikasinya menurut taraf biner konfaunder F.
Gabungan
Pajanan Penyakit
Jumlah D D
E 200 800 1000
E 50 950 1000
Jumlah 2000
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D D D
E 194 706 900 E 6 94 100
E 21 79 100 E 29 871 900
Jumlah 1000 Jumlah 1000
42
Estimasi rasio risiko kasar adalah:
ˆcCIR =
1
2
a n
c n
= 200 1000
50 1000 = 4.0
Estimasi rasio risiko spesifik stratum masing-masing adalah:
1
ˆCIR =
1 1
1 2
a n
c n
1
1
= 194 900
21 100 ≈ 1.03
2
ˆCIR =
2 1
2 2
a n
c n
2
2
= 6 100
29 900 ≈ 1.86
Dengan asumsi tidak ada interaksi, estimasi rasio risiko suaian
Mantel-Haenszel adalah:
ˆaCIRMH =
2
1
2
1
i i
i i
i i
i i
a n
n
c n
n
=
=
∑
∑
2
1
=
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
194 100 6 900
1000 100021 900 29 100
1000 1000
+
+
≈ 1.14
Contoh 3.6
File ugdp.dta berikut, memuat data hasil studi kohort dengan
variabel exposed sebagai pajanan, case sebagai penyakit, dan age sebagai
konfaunder.
43
. use "D:\Epidemiologi\Data\ugdp.dta"
. list
+----------------------------+
| age case exposed pop |
|----------------------------|
1. | <55 0 0 115 |
2. | <55 0 1 98 |
3. | <55 1 0 5 |
4. | <55 1 1 8 |
5. | 55+ 0 0 69 |
|----------------------------|
6. | 55+ 0 1 76 |
7. | 55+ 1 0 16 |
8. | 55+ 1 1 22 |
+----------------------------+
. cs case exposed [fw=pop], by(age)
Age category | RR [95% Conf. Interval] M-H Weight
-------------+---------------------------------------------
<55 | 1.811321 .6112044 5.367898 2.345133
55+ | 1.192602 .6712664 2.11883 8.568306
-------------+---------------------------------------------
Crude | 1.435574 .8510221 2.421645
M-H combined | 1.325555 .797907 2.202132
-----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.447 Pr>chi2 = 0.5037
ˆcCIR = 1.436
1
ˆCIR = 1.811 2
ˆCIR = 1.193
ˆaCIRMH = 1.326
44
� Studi Densitas
Untuk studi densitas, lay-out data adalah sebagai berikut:
Gabungan
Pajanan Penyakit
I PT
E a 1L
E b 2L
Jumlah L
Stratum 1 Stratum 2
Pajanan Penyakit
Pajanan Penyakit
I PT I PT
E 1a
1L1 E 2a
1L2
E 1b
2L1 E 2b
2L2
Jumlah
L1 Jumlah
L2
dengan:
ˆcIDR =
1
2
a L
b L (3.7)
dan: 1IDR =
1 1
1 2
a L
b L
1
1
(3.8.a)
2IDR =
2 1
2 2
a L
b L
2
2
(3.8.b)
Jika tidak ditemukan interaksi, estimasi rasio risiko suaian dapat
dihitung dengan estimator Mantel-Haenszel:
ˆaIDRMH =
22
1
21
1
i i
i i
i i
i i
a L
L
b L
L
=
=
∑
∑
(3.9)
45
Contoh 3.7
Dimiliki data hipotetis studi densitas pada tabel 2×2 berikut dan
stratifikasinya menurut taraf biner konfaunder F.
Gabungan
Pajanan Penyakit
I PT
E 30 699
E 36 1,399
Jumlah 2,098
Stratum 1 Stratum 2
Pajanan Penyakit
Pajanan Penyakit
I PT I PT
E 18 499 E 12 200
E 20 989 E 16 410
Jumlah 1,488 Jumlah 610
Estimasi rasio rate kasar adalah:
ˆcIDR =
1
2
a L
b L =
30 699
36 1,399 ≈ 1,67
Estimasi rasio rate spesifik-stratum masing-masing adalah:
1IDR =
1 1
1 2
a L
b L
1
1
= 18 499
20 989 ≈ 1,78
2IDR =
2 1
2 2
a L
b L
2
2
= 12 200
16 410 ≈ 1.54
Tampak bahwa 2IDR < ˆcIDR <
1IDR , sehingga penyesuaian
estimasi rasio rate dengan F tidak diperlukan. Walaupun demikian, sebagai
latihan akan tetap dihitung estimator rasio rate suaian Mantel-Haenszel,
46
sekaligus untuk memperlihatkan bahwa nilainya tidak berbeda jauh dengan
estimator rasio rate kasar.
ˆaIDRMH =
22
1
21
1
i i
i i
i i
i i
a L
L
b L
L
=
=
∑
∑
=
( ) ( ) ( ) ( )
( )( ) ( )( )
18 989 12 410
1,488 610
20 499 16 200
1,488 610
+
+
≈ 1.68
Tampak bahwa nilai estimator rasio rate suaian Mantel-Haenszel
ˆaIDRMH ≈ 1.68 praktis hampir sama dengan nilai estimator rasio rate kasar
ˆcIDR ≈ 1.67.
Contoh 3.8
File berikut memperlihatkan jumlah kematian deaths (penyakit)
menurut jenis kelamin male (pajanan) dengan konfaunder usia age.
. use "D:\Epidemiologi\rm.dta"
(Rothman and Monson 1973 data)
. list
+------------------------------+
| age male deaths pyears |
|------------------------------|
1. | <65 1 14 1516 |
2. | <65 0 10 1701 |
3. | 65+ 1 76 949 |
4. | 65+ 0 121 2245 |
+------------------------------+
47
. ir deaths male pyears, by(age)
Age category | IRR [95% Conf. Interval] M-H Weight
-------------+-------------------------------------------
<65 | 1.570844 .6489373 3.952809 4.712465 (exact)
65+ | 1.485862 1.100305 1.99584 35.95147 (exact)
-------------+-------------------------------------------
Crude | 1.099794 .831437 1.449306 (exact)
M-H combined | 1.49571 1.141183 1.960377
----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.02 Pr>chi2 = 0.8992
ˆcIDR = 1.100
1IDR = 1.571
2IDR = 1.486
ˆaIDRMH = 1.496
48
LATIHAN 3
Pilihlah jawaban yang paling benar!
1. Bias adalah:
A. Deviasi acak nilai estimasi parameter terhadap nilai sebenarnya.
B. Deviasi sistematik nilai estimasi parameter terhadap nilai
sebenarnya.
C. A) dan B) benar.
D. A) dan B) salah.
2. Efek bias yaitu:
A. Selalu mengakibatkan nilai estimasi parameter lebih besar
daripada nilai sebenarnya.
B. Kadang-kadang mengakibatkan nilai estimasi parameter lebih
besar daripada nilai sebenarnya.
C. Tidak pernah mengakibatkan nilai estimasi parameter lebih besar
daripada nilai sebenarnya.
D. Semuanya salah.
3. Tipe bias yang lazim ditemukan pada studi observasional:
A. Performance bias, recall bias, dan susceptibility bias.
B. Bias deteksi, bias transfer, dan distorsi penghimpunan
C. Bias seleksi, bias informasi, dan konfaunding.
D. Semuanya salah.
4. Recall bias merupakan salah satu bentuk:
A. Bias seleksi. C. Konfaunding.
B. Bias informasi. D. Semuanya salah.
5. Stratifikasi merupakan salah satu metode pengendalian:
A. Bias seleksi. C. Konfaunding.
B. Bias informasi. D. Semuanya benar.
49
6. Pilihlah yang benar:
A. Konfaunding tidak perlu dikendalikan.
B. Interaksi selalu harus dikendalikan.
C. A) dan B) benar.
D. A) dan B) salah.
7. Konfaunding dapat dikendalikan pada:
A. Tahap pengumpulan data.
B. Tahap analisis data.
C. A) dan B) benar.
D. A) dan B) salah.
Untuk soal No. 8 s.d. 12:
Dimiliki data hipotetis hasil studi kasus-kontrol sebagai berikut:
F F
C C C C
E 280 120 320 280
E 70 30 230 670
8. Estimasi rasio odds kasar adalah adalah:
A. 1.00 C. 3.50
B. 3.33 D. 4.33
9. Pernyataan yang benar mengenai estimasi rasio odds suaian yaitu:
A. ˆaOR < 1.00 C. ˆaOR > 3.33
B. 1.00 < ˆaOR < 3.33 D. Tidak dapat dihitung.
10. Estimasi rasio odds kovariabel F terhadap penyakit C pada kelompok
tak terpajan adalah:
A. 2.04 C. 6.80
B. 4.93 D. 8.84
50
11. Estimasi rasio odds kovariabel F terhadap pajanan E pada kelompok
kontrol adalah:
A. 2.88 C. 9.57
B. 4.50 D. 12.45
12. Pada hasil studi kasus-kontrol di atas didapatlan:
A. Interaksi.
B. Konfaunding.
C. A) dan B) benar.
D. A) dan B) salah.
51
BAB 4
SENSITIVITAS DAN SPESIFISITAS
� Pengertian Sensitivitas dan Spesifisitas
Sensitivitas dan spesifisitas adalah ukuran akurasi suatu uji
diagnostik, yaitu pemeriksaan yang dilakukan terhadap anggota populasi
yang dianggap bebas-penyakit ataupun tersangka penderita penyakit tertentu
untuk menilai status kesehatan mereka. Tidak ada uji diagnostik yang
sempurna akurasinya.
Secara sederhana, hasil suatu pemeriksaan dapat dinyatakan positif
(tak normal) ataupun negatif (normal). Jika hasilnya positif dan penyakit
benar ada, keadaan ini dinamakan positif benar (true positive) dan jika
hasilnya positif tetapi penyakit tidak ada, keadaan ini dinamakan positif
palsu (false positive).
Jika hasil pemeriksaan negatif dan penyakit benar tidak ada, keadaan
ini dinamakan negatif benar (true negative) dan jika hasilnya negatif tetapi
penyakit ada, keadaan ini dinamakan negatif palsu (false negative). Secara
skematis keempat keadaan ini dapat digambarkan pada tabel 4.1 di bawah
ini.
Tabel 4.1 Hasil uji diagnostik dan status penyakit
Hasil uji
diagnostik
Status penyakit
Ada Tidak ada
Positif True positive False positive
Negatif False negative True negative
Status penyakit sebenarnya diperoleh melalui pemeriksaan yang
memastikan diagnosis, yang disebut sebagai gold standard. Dalam praktik
pemeriksaan gold standard tidak rutin dilaksanakan, karena mungkin
52
membutuhkan biaya besar, waktu yang lama untuk mendapatkan hasil, tidak
tersedia di kebanyakan laboratorium, dan sebagainya.
Untuk perhitungan sensitivitas dan spesifisitas, jumlah hasil
pemeriksaan true positive, false positive, false negative, dan true negative
masing-masing dinyatakan dengan lambang a, b, c, dan d seperti terlihat
pada Tabel 4.2 berikut:
Tabel 4.2 Sensitivitas dan spesifisitas
Hasil uji
diagnostik
Status penyakit
Ada Tidak ada
Positif True positive False positive
a b
Negatif
c d
False negative True negative
Sensitivitas adalah proporsi true positive di antara yang sakit:
Se = a
a c+ (4.1)
atau: Se = Jumlah hasil
Jumlah subjek sakit
true positive
Spesifisitas adalah proporsi true negative di antara yang tidak sakit:
Sp = d
b d+ (4.2)
atau: Sp = Jumlah hasil
Jumlah subjek tidak sakit
true negative
Jika hasil uji diagnostik berskala kontinu, untuk menentukan hasil
positif atau negatif harus ditetapkan satu titik-pemisah (cut-off point). Pilihan
cut-off point ini akan sangat menentukan sensitivitas dan spesifisitas uji
diagnostik, seperti terlihat pada contoh berikut.
53
Contoh 4.1
Kadar PSA (Prostatic Specific Antigen) dalam serum digunakan
sebagai marka tumor (tumor marker) untuk mengases peluang adanya Ca
prostat pada seorang subjek. Tabel 4.3 memperlihatkan sensitivitas dan
spesifisitas PSA serum sebagai uji diagnostik untuk Ca prostat.
Tampak bahwa semakin rendah cut-off point, sensitivitas akan
menjadi lebih tinggi, sebaliknya spesifisitas menjadi lebih rendah.
Sebaliknya, semakin tinggi cut-off point, spesifisitas akan menjadi lebih
tinggi, tetapi sensitivitas akan menjadi lebih rendah.
Tabel 4.3
Sensitivitas dan spesifisitas kadar PSA serum dalam pendeteksian
Ca prostat pada pria kulit hitam usia 70-79 tahun
Kadar PSA
(ng/ml) Se Sp
Kadar PSA
(ng/ml) Se Sp
1.0 100 21 9.0 68 90
2.0 100 48 10.0 54 93
3.0 100 60 11.0 47 94
4.0 99 73 12.0 30 95
5.0 96 76 13.0 23 96
6.0 94 79 14.0 17 97
7.0 90 83 15.0 11 97
8.0 90 88
Sumber: Morgan et al, 1996
Cut-off point yang dipilih, yaitu 5.5 ng/ml, menghasilkan sensitivitas
95% dan spesifisitas 78%. Akurasi (accuracy) adalah persentase ketepatan
hasil uji diagnostik (true positive maupun true negative) terhadap
sekelompok subjek.
54
Contoh 4.2
Dilakukan pemeriksaan kadar PSA serum pada 4000 orang pria lansia
hipotetis dengan hasil sebagai berikut:
Hasil uji Status kesehatan
Jumlah Ca prostat Normal
Positif 95 858 953
Negatif 5 3042 3047
Jumlah 100 3900 4000
Diperoleh:
Se = 95
100 = 95% Sp =
3042
3900 = 78%
Prevalensi = 100
4000 = 2.5%
Akurasi = 95 3042
4000
+ ≈ 78.4%
� Kurva ROC
Kurva ROC (Receiver Operating Characteristic) adalah kurva yang
memplot nilai-nilai sensitivitas terhadap (1 ‒ spesifisitas) dalam rentang
tertentu nilai-nilai cut-off point.
Contoh 4.3
Pada Gambar 4.1 diperlihatkan kurva ROC untuk kadar PSA serum
sebagai uji diagnostik untuk Ca Prostat (data Tabel 4.1).
55
Gambar 4.1 Kurve ROC kadar PSA serum sebagai uji diagnostik
untuk Ca Prostat (Morgan et al, 1996)
Besar utilitas uji diagnostik ditentukan oleh luas area di bawah kurve
ROC. Semakin besar luas area tersebut, semakin baik uji diagnostik. Jika
kurve ROC berupa garis lurus dari (0 ; 0) ke (100 ; 100) yang membentuk
sudut 45o dengan sumbu horizontal, uji tidak bermanfaat dan hasilnya
sepenuhnya diperoleh secara kebetulan (by chance).
� Nilai Prediktif
Lihat kembali Tabel 4.2. Nilai sensitivitas dan spesifisitas bermanfaat
dalam memutuskan apakah suatu uji diagnostik layak digunakan atau tidak.
56
Dalam praktik, yang lebih ingin diketahui klinisi adalah peluang ada atau
tidak adanya penyakit setelah memperoleh hasil tes positif atau negatif.
Nilai prediktif positif (positive predictive value) adalah proporsi true
positive di antara yang hasil pemeriksaannya positif:
PV+ = a
a b+ (4.3)
atau: PV+ = Jumlah subjek sakit
Jumlah hasil positif
Nilai prediktif negatif (negative predictive value) adalah proporsi true
negative di antara yang hasil pemeriksaannya negatif:
PV‒ = d
c d+ (4.4)
atau: PV‒ = Jumlah subjek tidak sakit
Jumlah hasil negatif
Sensitivitas dan spesifisitas relatif stabil, kecuali jika gold standard
diganti atau karakteristik populasinya sangat berbeda. Nilai prediktif positif
dan negatif dapat berbeda di berbagai tempat, tergantung pada prevalensi
penyakit. Penyebabnya yaitu sensitivitas dan spesifisitas masing-masing
diperoleh dari 1 populasi (sensitivitas dari populasi sakit dan spesifisitas dari
populasi tidak sakit), sedangkan nilai prediktif positif maupun negatif
dihitung dari 2 populasi (sakit dan tidak sakit).
Contoh 4.4
Dilakukan pemeriksaan kadar PSA serum di beberapa lokasi
hipotetis, yang prevalensi Ca prostatnya bervariasi, dengan jumlah
pemeriksaan 50,000 di setiap lokasi. Sensitivitas adalah 95% dan spesifisitas
78%, tetapi nilai prediktif positif dan negatif berlainan di tiap lokasi.
57
Prev a b c d PV+ PV‒
1% 95 2178 5 7722 4.2% 99.9%
5% 475 2090 25 7410 18.5% 99.7%
10% 950 1980 50 7020 32.4% 99.3%
25% 2375 1650 125 5850 59.0% 97.9%
50% 4750 1100 250 3900 81.2% 94.0%
Walaupun nilai sensitivitas sama 95% dan spesifisitas juga sama
78%, nilai prediktif positif dapat berkisar antara 4.2 s.d. 81.2%, tergantung
pada prevalensi, sedangkan nilai prediktif negatif tidak terlalu banyak
mengalami perubahan.
� Rasio Likelihood
Rasio likelihood positif adalah:
LR+ = a b
a c b d+ + (4.5.a)
LR+ = 1
Se
Sp− (4.5.b)
Rasio likelihood negatif adalah:
LR‒ = c d
c d c d+ + (4.6.a)
LR‒ = 1 Se
Sp
− (4.6.b)
Rasio likelihood digunakan bersama odds. Dengan teorema Bayes
diperoleh:
Odds pre-tes × rasio likelihood = Odds post-tes (4.7)
58
Contoh 4.5
Lihat kembali data pada Tabel 4.3. Nilai-nilai LR+ dan LR‒ untuk
kadar PSA serum 4.0 s.d. 8.0 diperlihatkan pada Tabel 4.4 berikut.
Tabel 4.4
Rasio likelihood uji diagnostik Ca prostat untuk
kadar PSA serum 4.0 s.d. 8.0 ng/ml
Kadar PSA
(ng/ml) Se Sp LR+ LR‒
4.0 99 73 3.67 0.01
5.0 96 76 4.00 0.05
6.0 94 79 4.48 0.08
7.0 90 83 5.29 0.12
8.0 90 88 7.50 0.11
Misalkan di Klinik Onkologi RS D diketahui prevalensi Ca prostat di
antara pengunjung dengan keluhan b.a.k. adalah 20%. Diperoleh:
P [Ca prostat] = 0.20
Odds pre-tes = [ ]
[ ]
Ca prostat
1 Ca prostat
P
P−
= 0.20
1 0.20− = 0.25
Hasil pemeriksaan marka tumor PSA positif dengan kadar PSA
serum 8 ng/ml. Dari Tabel 4.4 diperoleh LR+ untuk kadar PSA serum 8
ng/ml adalah 7.50.
Odds post-tes = Odds pre-tes × rasio likelihood
= 0.25 × 7.50 = 1.875
(peluang ada Ca prostat berbanding peluang tidak ada Ca prostat adalah 15
berbanding 8)
59
atau: P [Ca prostat] = 1
Odds
Odds+ =
1.875
1 1.875+ ≈ 65%
Tampak bahwa hasil tes positif meningkatkan odds Ca prostat dari
0.25 menjadi 1.875 atau peluangnya dari 20% menjadi 65%.
Contoh 4.6
Analisis sensitivitas, spesifisitas, dan kurve ROC dengan Stata
dilakukan sebagai pemeriksaan lanjutan dengan perintah estat
classification terhadap hasil pemodelan regresi logistik. Karena regresi
logistik baru akan dibahas pada Bab 8, hasil pemodelan tidak akan dibahas di
sini. Yang akan dibahas hanya pemeriksaan lanjutan yang terkait dengan
sensitivitas, spesifisitas, dan kurve ROC.
File data yang digunakan adalah lbw.dta, yang memuat data biner
keberadaan hipertensi ht pada ibu sebagai pajanan dengan kejadian BBLR
(berat badan lahir rendah) low pada persalinan189 orang ibu. Klasifikasi ada
tidaknya BBLR berdasarkan model menjadi hasil uji diagnostik, sedangkan
pemeriksaan standar adalah hasil pengukuran berat badan lahir bayi, BBLR
ada jika berat badan lahir bayi kurang daripada 2500 g.
. use "D:\Epidemiologi\Data\lbw.dta"
(Hosmer & Lemeshow data)
. quitely logit low lwt race smoke ht
. estat classification
Logistic model for low
-------- True --------
Classified | D ~D | Total
-----------+--------------------------+-----------
+ | 14 8 | 22
- | 45 122 | 167
-----------+--------------------------+-----------
Total | 59 130 | 189
60
Classified + if predicted Pr(D) >= .5
True D defined as low != 0
--------------------------------------------------
Sensitivity Pr( +| D) 23.73%
Specificity Pr( -|~D) 93.85%
Positive predictive value Pr( D| +) 63.64%
Negative predictive value Pr(~D| -) 73.05%
--------------------------------------------------
False + rate for true ~D Pr( +|~D) 6.15%
False - rate for true D Pr( -| D) 76.27%
False + rate for classified + Pr(~D| +) 36.36%
False - rate for classified - Pr( D| -) 26.95%
--------------------------------------------------
Correctly classified 71.96%
--------------------------------------------------
Tampak bahwa sensitivitas adalah 23.7%, spesifisitas 93.9%, nilai
prediksi positif 63.6%, nilai prediksi negatif 73.1%, dan akurasi adalah
72.0%.
. lsens
61
Grafik ini menunjukkan nilai sensitivitas dan spesifisitas untuk
berbagai titik potong (cutoff point) P [Y = 1]. Hasil pemodelan regresi
logistik adalah probabilitas P [Y = 1], yaitu peluang adanya BBLR. Untuk
nilai default, BBLR dinyatakan ada jika P [Y = 1] > 0.5, tetapi setiap nilai P
[Y = 1] dapat digunakan sebagai cutoff point sebagaimana terlihat pada grafik
di atas.
. lroc
Logistic model for low
number of observations = 189
area under ROC curve = 0.7118
Tampak bahwa luas area di bawah kurve ROC adalah 71.2%.
62
LATIHAN 4
Pilihlah jawaban yang paling benar!
Untuk soal No. 1 s.d. 4:
Untuk mendeteksi Diabetes Mellitus, pemeriksaan kadar gula darah
puasa dianggap sebagai pemeriksaan standar, sedang untuk uji diagnostik
harian digunakan pemeriksaan reduksi urine. Lima puluh tersangka penderita
DM dari sebuah desa dikirimkan ke laboratorium untuk pemeriksaan gula
darah puasa dan reduksi urine. Tiga puluh enam orang pemeriksaan gula
darahnya positif, dengan 28 di antaranya reduksi urinenya juga positif. Dua
puluh orang hasil reduksi urine negatif.
1. Sensitivitas pemeriksaan reduksi urine adalah:
A. 0.600 C, 0.857
B. 0.778 D. 0.933
2. Spesifisitas pemeriksaan reduksi urine adalah:
A. 0.600 C, 0.857
B. 0.778 D. 0.933
3. Nilai prediksi positif adalah:
A. 0.600 C, 0.857
B. 0.778 D. 0.933
4. Nilai prediksi negatif adalah:
A. 0.600 C, 0.857
B. 0.778 D. 0.933
5. Akurasi uji diagnostik adalah:
A. 0.533 C, 0.800
B. 0.635 D. 0.818
63
Untuk soal No. 6 s.d. 10:
Dengan asumsi sensitivitas dan spesifisitas konstan, pemeriksaan
reduksi urine di atas digunakan sebagai uji diagnostik pada skrining terhadap
256 orang penduduk desa tersebut. Hasilnya yaitu 45 orang pemeriksaan
reduksi urinenya positif.
6. Dari 45 orang yang reduksi urinenya positif, yang sesungguhnya
menderita DM adalah:
A. 3 orang C. 35 orang
B. 10 orang D. 208 orang
7. Jumlah orang yang reduksi utinya negatif dan benar tidak menderita
DM adalah:
A, 3 orang C. 35 orang
B. 10 orang D. 208 orang
8. Nilai prediksi positif pada pemeriksaan di desa itu adalah:
A. 0.22 C. 0.93
B. 0.60 D. 0.99
9. Nilai prediksi negatif adalah:
A. 0.22 C. 0.93
B. 0.60 D. 0.99
10. Seandainya 256 orang tersebut merupakan sampel representatif bagi
penduduk desa tersebut, maka estimasi prevalensi DM pada penduduk
desa tersebut adalah:
A. 3.9% C. 10.5%
B. 5.1% D. 17.6%
65
BAB 5
ANALISIS SEDERHANA DAN
ANALISIS STRATIFIKASI
� Analisis Sederhana
Analisis sederhana adalah analisis hubungan antara 1 pajanan dengan
penyakit tanpa memperhitungkan keberadaan konfaunder.
� Studi Kohort dan Studi Kasus-kontrol
Pada studi kohort (tabel kiri bawah), dengan ˆCIR =
1
2
a n
c n, hipotesis
nol adalah 0H : ˆCIR = 1, sedangkan pada studi kasus kontrol (tabel kanan
bawah), dengan OR = ad
bc, hipotesis nol adalah 0H : OR = 1.
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D C C
E a b 1n E a b
1n
E c d 2n E c d
2n
Jumlah 1m
2m n Jumlah 1m
2m n
Atas dasar asumsi hipergeometrik, diperoleh statistik penguji Mantel-
Haenszel (terkoreksi) untuk keduanya, yaitu:
2χMH
= ( )( )
2
1 2 1 2
1n ad bc
n n m m
− − (5.1)
yang berdistribusi khi-kuadrat dengan derajat bebas 1. Untuk α = 0.05,
daerah kritisnya (daerah penolakan hipotesis nol) adalah 2χ > 3.84.
66
Jika terdapat sel dengan nilai harapan kurang daripada 5, digunakan
uji eksak Fisher.
Contoh 5.1
Misalkan dimiliki data hipotetis hubungan antara pajanan E
(Exposure) dengan penyakit D (Disease) dalam bentuk tabel 2×2 berikut:
Pajanan Penyakit
Jumlah D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600
Estimasi rasio risiko adalah:
ˆCIR =
1
2
a n
c n
= 205 307
97 293 ≈ 2.02
Selanjutnya akan diuji ada tidaknya hubungan antara pajanan dengan
penyakit. Hipotesis nol adalah 0H : ˆCIR = 1, dengan statistik penguji
Mantel-Haenszel (terkoreksi) sebagai berikut:
2χMH
= ( )( )
2
1 2 1 2
1n ad bc
n n m m
− −
= ( ) ( )( ) ( )( )
( ) ( ) ( )( )
2600 1 205 196 102 97
307 293 302 298
− − ≈ 67.87
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol 0H : ˆCIR = 1 ditolak atau ditemukan hubungan bermakna
antara pajanan E dengan penyakit D (p < 0.05).
67
Contoh 5.2
(Sampel kecil)
Misalkan dimiliki data hipotetis hubungan antara pajanan E
(Exposure) dengan penyakit D (Disease) berikut:
Pajanan Penyakit
Jumlah D D
E 5 6 11
E 1 8 9
Jumlah 6 14 20
Dengan mengasumsikan nilai-nilai a = 5, b = 6, c = 1, dan d = 8 pada
tabel 2×2 di atas sebagai salah satu nilai-nilai representasi variabel random
A, B, C, dan D, maka nilai-nilai himpunan variabel random tersebut pada
tabel di atas beserta nilai-nilai yang lebih ekstrim diperlihatkan pada tabel
berikut.
A B C D Probabilitas
5 6 1 8 6!14!11!9! / 20!5!6!1!8! = 0.1073
6 5 0 9 6!14!11!9! / 20!6!5!0!9! = 0.0119
0.1192
Tampak bahwa nilai p satu-sisi, yaitu probabilitas P [C < 1] =
[ ]1P C = + [ ]0P C = = 0.1073 + 0.0119 = 0.1192 ≈ 0.12, sehingga hipotesis
nol 0H : ˆCIR = 1 tidak ditolak atau tidak ditemukan hubungan bermakna
antara pajanan E dengan penyakit D (p > 0.05).
Dengan menggunakan nilai khi-kuadrat Mantel-Haenszel ini, dapat
dilakukan estimasi interval ukuran rasio berbasiskan uji (test-based
confidence interval), yaitu:
2
1ˆ
Z
CIRα
χ
±MH
(5.2)
68
2
1ˆ
Z
ORα
χ
±MH
(5.3)
Contoh 5.3
Lihat kembali data pada Contoh 5.1. Dari Contoh 5.1 tersebut
diperoleh:
ˆCIR = 2.02
2χMH
= 67.87 χMH
= 8.24
Interval konfidensi 95% untuk rasio risiko berbasiskan uji adalah:
2
1ˆ
Z
CIRα
χ
±MH
atau: ( ) 1 1.96 8.24ˆCIR
±
yaitu [1.71 ; 2.38]
Dengan metode berbasiskan deret Taylor interval konfidensi 95%
rasio risiko adalah:
ln ˆCIR = ln 205 307
97 293 = 2.017
ˆˆ lnVar CIR = 1 2
1 1 1 1
a n c n− + −
= 1 1 1 1
205 307 97 293− + −
ln ˆCIR + 1.96 . SE ln ˆCIR
adalah 2.017 + 1.96 0.0085
atau 2.017 + 0.181
69
yaitu [1.836 ; 2.198]
Diperoleh estimasi interval yang tidak jauh berbeda dengan metode
berbasiskan-uji.
Contoh 5.4
Pada sebuah studi kasus-kontrol hubungan antara konsumsi alkohol
oleh ibu hamil dengan kejadian berat badan lahir rendah, diperoleh data
sebagai berikut:
Konsumsi
alkohol
Kelahiran Jumlah
BBLR BBLN
Ya 74 48 122
Tidak 26 52 78
Jumlah 100 100 200
OR = ad
bc =
( ) ( )
( )( )
74 52
48 26 ≈ 3.083
Dengan 0H : OR = 1 dan tingkat signifikansi α = 0.05 akan diuji ada
tidaknya hubungan antara konsumsi alkohol oleh ibu dengan kejadian berat
badan lahir rendah. Statistik penguji adalah:
2χMH
= ( )( )
2
1 2 1 2
1n ad bc
n n m m
− −
= ( ) ( )( ) ( ) ( )
( )( )( )( )
2200 1 74 52 48 26
122 78 100 100
− − ≈ 14.14
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol 0H : OR = 1 ditolak atau ditemukan hubungan bermakna
70
antara konsumsi alkohol pada ibu hamil dengan kejadian berat badan lahir
rendah (p < 0.05).
Dengan metode berbasis-uji, interval konfidensi 95% untuk rasio
odds adalah:
2
1ˆ
Z
ORα
χ
±MH
atau 1 1.96 14.14
3.083
±
yaitu [1.714 ; 5.546]
� Studi Densitas
Pada studi densitas (lihat tabel di bawah), dengan IDR =
1
2
a L
c L,
hipotesis nol adalah 0H : IDR = 1.
Pajanan Penyakit
I PT
E a 1L
E b 2L
Jumlah 1m L
Atas dasar asumsi distribusi binomial untuk variabel random A,
statistik penguji adalah:
2χMHD
=
2
1 1
1 1 22
m La
L
m L L
L
−
(5.4)
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
71
Estimasi interval rasio rate berbasiskan uji (test-based confidence
interval) adalah:
2
1ˆ
Z
IDRα
χ
±MHD
(5.5)
Contoh 5.5
Misalkan dimiliki data hipotetis pajanan E (Exposure) beserta
insidens penyakit I dan person-time-nya:
Pajanan Penyakit
I PT
E 94 2500
E 146 3900
Jumlah 240 6400
Estimasi rasio rate adalah:
IDR =
1
2
a L
b L
= 94 2500
146 3900 ≈ 1.004
Akan diuji apakah ada perbedaan incidence rate antara kedua
kelompok perbandingan. Hipotesis nol adalah 0H : IDR = 1, dengan statistik
penguji Mantel-Haenszel sebagai berikut:
2χMHD
=
2
1 1
1 1 22
m La
L
m L L
L
−
72
=
( ) ( )
( )( )( )
2
2
240 250094
6400
240 2500 3900
6400
−
≈ 0.001
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol 0H : IDR = 1 tidak ditolak atau tidak ditemukan
perbedaan incidence rate antara kelompok terpajan dengan kelompok kontrol
(p > 0.05).
Dengan menggunakan nilai khi-kuadrat densitas Mantel-Haenszel,
estimasi interval rasio rate berbasiskan uji (test-based confidence interval)
adalah:
2
1ˆ
Z
IDRα
χ
±MHD
atau 1 1.96 0.001
1.004
±
yaitu [0.775 ; 1.302]
� Analisis Stratifikasi
Analisis stratifikasi yang dibahas di sini adalah untuk mengendalikan
konfaunder kategorik.
� Studi Kohort dan Studi Kasus-kontrol
Pada studi kohort, untuk menguji pengaruh konfaunder F terhadap
hubungan antara pajanan E dengan penyakit D, hipotesis nol adalah 0H :
ˆaCIR = 1, sedangkan pada studi kohort, untuk menguji pengaruh konfaunder
73
F terhadap hubungan antara pajanan E dengan penyakit C, hipotesis nol
adalah 0H : ˆaOR = 1.
Tabel data gabungan dan stratifikasinya masing-masing adalah
sebagai berikut:
Studi kohort:
Gabungan
Pajanan Penyakit
Jumlah D D
E a b 1n
E c d 2n
Jumlah 1m
2m n
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D D D
E 1a
1b 1n1
E 2a
2b 1n2
E 1c
1d 2n1
E 2c
2d 2n2
Jumlah 1m1
2m1
n1 Jumlah
1m2
2m2
n2
Studi kasus-kontrol:
Gabungan
Pajanan Penyakit
Jumlah C C
E a b 1n
E c d 2n
Jumlah 1m
2m n
74
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah C C C C
E 1a
1b 1n1
E 2a
2b 1n2
E 1c
1d 2n1
E 2c
2d 2n2
Jumlah 1m1
2m1
n1 Jumlah
1m2
2m2
n2
Statistik penguji untuk keduanya adalah:
2χMHS
=
( )
1
21
2
1
k
ki i i i
i i
i i i i
i i
i
a d b c
n
n n m m
n n
=
=
−
−
∑
∑ 1 2 1 2
(5.6)
Contoh 5.6
Lihat kembali data pada Contoh 5.1. Jika didapatkan variabel F yang
berskala biner sebagai konfaunder, maka dilakukan stratifikasi sebagai
berikut:
Gabungan
Pajanan Penyakit
Jumlah D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D D D
E 195 32 227 E 10 70 80
E 80 24 104 E 17 172 189
Jumlah 275 56 331 Jumlah 27 242 269
75
Untuk menguji pengaruh konfaunder F terhadap hubungan antara
pajanan E dengan penyakit D dengan hipotesis nol 0H : a ˆCIR = 1, statistik
penguji Mantel-Haenszel (terkoreksi) adalah sebagai berikut:
2χMHS
=
( )
1
21
2
1
k
ki i i i
i i
i i i i
i i
i
a d b c
n
n n m m
n n
=
=
−
−
∑
∑ 1 2 1 2
=
( ) ( ) ( )( ) ( ) ( ) ( ) ( )
( )( ) ( )( )
( ) ( )( )( ) ( ) ( )
( ) ( )2 2
2195 24 32 80 10 172 70 17
331 269
227 104 275 56 80 189 27 242
330 331 268 269
− − +
+
≈ 4.63
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol 0H : a ˆCIR = 1 ditolak atau ditemukan pengaruh
konfaunder F yang bermakna terhadap hubungan antara pajanan E dengan
penyakit D (p < 0.05).
� Studi Densitas
Pada studi densitas, untuk menguji pengaruh konfaunder F terhadap
rasio rate penyakit, hipotesis nol adalah 0H : ˆaIDR = 1. Lay-out data
gabungan dan stratifikasinya adalah sebagai berikut:
Gabungan
Pajanan Penyakit
I PT
E a 1L
E b 2L
Jumlah 1m L
76
Stratum 1 Stratum 2
Pajanan Penyakit
Pajanan Penyakit
I PT I PT
E 1a
1L1
E 2a
1L2
E 1b
2L1
E 2b
2L2
Jumlah 1m1
L1 Jumlah
1m2
L2
Statistik penguji adalah:
2χMHD
=
2
1 1
1 1
1 1 22
1
k ki i
ii
ki i i
i
i i
i
m La
L
m L L
L
= =
=
−
∑ ∑
∑ (5.7)
yang berdistribusi khi-kuadrat dengan derajat bebas 1.
Contoh 5.7
Lihat kembali data pada Contoh 5.4. Misalnya terdapat variabel F
yang diperkirakan berfungsi sebagai konfounder, maka dilakukan stratifikasi
sebagai berikut:
Gabungan
Pajanan Penyakit
I PT
E 94 2500
E 146 3900
Jumlah 240 6400
77
Stratum 1 Stratum 2
Pajanan Penyakit
Pajanan Penyakit
I PT I PT
E 21 1600 E 77 900
E 14 1700 E 128 2200
Jumlah 35 3300 Jumlah 205 3100
Untuk menguji pengaruh konfaunder F terhadap perbandingan
incidence rate antara kelompok terpajan dengan yang tidak terpajan
(kelompok kontrol) dengan hipotesis nol 0H : a IDR = 1, statistik penguji
Mantel-Haenszel (terkoreksi) adalah sebagai berikut:
2χMHD
=
2
1 1
1 1
1 1 22
1
k ki i
ii
ki i i
i
i i
i
m La
L
m L L
L
= =
=
−
∑ ∑
∑
=
( )( )( ) ( )( )
( )( )( ) ( )( )( )
2
2 2
35 1600 205 90021 77
3300 3100
35 1600 1700 205 900 2200
3300 3100
+ − +
+
≈ 9.079
Disimpulkan bahwa hipotesis nol 0H : a IDR = 1 ditolak pada α =
0.05 atau ditemukan pengaruh konfaunder F yang bermakna terhadap
hubungan antara pajanan E dengan penyakit D (p < 0.05).
Pada bab 3 telah dibahas perhitungan estimator titik untuk ukuran
rasio dengan metode Mantel-Haenszel pada data stratifikasi, yaitu:
78
ˆaCIRMHS
=
2
1
2
1
i i
i i
i i
i i
a n
n
c n
n
=
=
∑
∑
2
1
; (5.8)
ˆaORMHS
=
2
1
2
1
i i
i i
i i
i i
a d
n
b c
n
=
=
∑
∑ ; (5.9)
dan: ˆaIDRMHD
=
22
1
21
1
i i
i i
i i
i i
a L
L
b L
L
=
=
∑
∑ ; (5.10)
Estimasi intervalnya dengan metode berbasiskan-uji (test-based
confidence interval), adalah:
2
1ˆ
Z
aCIRα
χ
±MHS
MHS ; (5.11)
2
1ˆ
Z
aORα
χ
±MHS
MHS ; (5.12)
2
1ˆ
Z
aIDRα
χ
±MHD
MHD ; (5.13)
Contoh 5.8
Lihat kembali data pada Contoh 5.6.
Gabungan
Pajanan Penyakit
Jumlah D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600
79
Stratum 1 Stratum 2
Pajanan Penyakit
Jumlah
Pajanan Penyakit
Jumlah D D D D
E 195 32 227 E 10 70 80
E 80 24 104 E 17 172 189
Jumlah 275 56 331 Jumlah 27 242 269
Estimator rasio risk dengan metode Mantel-Haenszel adalah:
ˆaCIRMHS
=
2
1
2
1
i i
i i
i i
i i
a n
n
c n
n
=
=
∑
∑
2
1
=
( ) ( ) ( )( )
( )( ) ( )( )
195 104 10 189
331 26980 227 17 80
331 269
+
+
≈ 1.140
Interval konfidensi 95% untuk estimasi rasio risk dengan metode
berbasiskan-uji adalah:
2
1ˆ
Z
aCIRα
χ
±MHS
MHS =
4.631 1.961.140
±
yaitu [1.012 ; 1.284]
Contoh 5.9
Lihat kembali data pada Contoh 5.7.
Gabungan
Pajanan Penyakit
I PT
E 94 2500
E 146 3900
Jumlah 240 6400
80
Stratum 1 Stratum 2
Pajanan Penyakit
Pajanan Penyakit
I PT I PT
E 21 1600 E 77 900
E 14 1700 E 128 2200
Jumlah 35 3300 Jumlah 205 3100
Estimator rasio rate dengan metode Mantel-Haenszel adalah:
ˆaIDRMHD
=
22
1
21
1
i i
i i
i i
i i
a L
L
b L
L
=
=
∑
∑
=
( )( ) ( ) ( )
( ) ( ) ( )( )
21 1700 77 2200
3300 310014 1600 128 900
3300 3100
+
+
≈ 1.490
Interval konfidensi 95% untuk estimasi rasio rate dengan metode
berbasiskan-uji adalah:
2
1ˆ
Z
aIDRα
χ
±MHD
MHD =
9.0791 1.961.490
±
yaitu: [1.149 ; 1.930]
81
LATIHAN 5
Pilihlah jawaban yang paling benar!
Dimiliki paparan umum hasil studi kohort dalam bentuk tabel 2×2
berikut:
D D
E a b 1n
E c d 2n
1m
2m n
1. Dari studi dengan paparan data seperti tabel 2×2 di atas, dengan uji khi-
kuadrat diperoleh nilai p = 0.0001. Kesimpulannya yaitu:
A. Ada asosiasi antara pajanan E dengan penyakit D.
B. Ada asosiasi positif antara pajanan E dengan penyakit D.
C. Ada hubungan kausal antara pajanan E dengan penyakit D.
D. Pajanan E merupakan faktor risiko bagi penyakit D.
2. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor
risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. 1a n > 2c n C. a b > c d
B. 1a m >
2b m D. Semuanya salah.
3. Pilihlah yang benar:
A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.
Untuk soal No. 4 dan 5:
Dari sebuah studi kohort diketahui kelompok studi dan kelompok
pembanding masing-masing beranggotakan 100 orang, selama periode
pengamatan tidak ada kasus drop-out. Selama periode pengamatan pada
82
kelompok studi didapatkan 18 kasus baru, sedangkan pada kelompok
pembanding hanya ada 9 kasus baru.
4. Dengan asumsi distribusi hipergeometrik, maka diperoleh statistik khi-
kuadrat Mantel Haenszel yang besarnya:
A. 3.451 C. 7.892
B. 3.967 D. 11.236
5. Kesimpulan hasil uji hipotesis 0H : 1CI = 2CI yaitu:
A. 0H ditolak pada tingkat signifikansi α = 0.05.
B. 0H tidak ditolak pada tingkat signifikansi α = 0.05.
C. 0H ditolak pada tingkat signifikansi α = 0.01.
D. 0H tidak ditolak pada tingkat signifikansi α = 0.10.
Untuk soal No. 6 s.d. 9:
Dimiliki data hipotetis berikut dari suatu studi kohort:
D D
E 17 9
E 33 51
6. Estimasi rasio risk adalah:
A. 1.222 C. 1.889
B. 1.664 D. 2.919
7. Estimasi rasio odds adalah:
A. 1.222 C. 1.889
B. 1.664 D. 2.919
8. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio risk adalah:
A. [0.932 ; 3.829] C. [1.130 ; 3.157]
B. [0.957 ; 5.434] D. [1.847 ; 7.286]
83
9. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio odds adalah:
A. [0.863 ; 2.600] C. [1.229 ; 6.934]
B. [0.827 ; 3.646] D. [1.165 ; 7.318]
Untuk soal No. 10 s.d. 14:
Dimiliki data stratifikasi hipotetis berikut:
Stratum 1 ( F ) Stratum 2 ( F )
D D D D
E 5 24 E 25 75
E 25 300 E 20 135
10. Estimasi rasio odds kasar adalah:
A. 2.25 C. 2.50
B. 2.37 D. 2.93
11. Tanpa stratifikasi, statistik khi-kuadrat Mantel-Haenszel adalah:
A. 3.146 C. 9.895
B. 4.496 D. 20.218
12. Pada uji hipotesis 0H : OR = 1 dengan jawaban soal No. 11 sebagai
statistik penguji, kesimpulannya adalah:
A. 0H ditolak pada tingkat signifikansi α = 0.01.
B. 0H tidak ditolak pada tingkat signifikansi α = 0.05.
C. A) dan B) benar.
D. A) dan B) salah.
13. Statistik khi-kuadrat stratifikasi Mantel-Haenszel adalah:
A. 3.146 C. 9.895
B. 4.496 D. 20.218
84
14. Pada uji hipotesis 0H : OR = 1 dengan jawaban soal No. 13 sebagai
statistik penguji, kesimpulannya adalah:
A. 0H tidak ditolak pada tingkat signifikansi α = 0.01.
B. 0H ditolak pada tingkat signifikansi α = 0.05.
C. A) dan B) benar.
D. A) dan B) salah.
85
BAB 6
STUDI MATCHING
� Rancangan Studi Matched
Pada rancangan studi matched, tiap satu subjek dipadankan (di-
matched) dengan satu subjek lainnya, sedemikian hingga dalam sampel
didapatkan n pasangan subjek. Ukuran sampel seluruhnya adalah 2n.
Matching dapat dilakukan pada rancangan studi:
- Studi kasus-kontrol: Tiap 1 kasus dipadankan dengan 1 kontrol.
- Studi kohort: Tiap 1 subjek terpajan dipadankan dengan 1 subjek tak-
terpajan.
- Uji klinik dengan RCT (Randomized Controlled Trial): Tiap 1 subjek
dengan perlakuan dipadankan dengan 1 subjek tanpa perlakuan / subjek
dengan plasebo.
Variabel yang tersering di-matched adalah usia / kelompok usia dan
jenis kelamin. Selain dapat juga digunakan tingkat pendidikan, status sosial
ekonomi, dan sebagainya. Syarat utama pemilihan variabel yang di-matched
yaitu berkaitan dengan variabel respons. Sebaliknya, jumlah variabel yang
di-matched tidak boleh berlebihan, karena akan menyulitkan perolehan
pasangan matching dan meningkatkan biaya penelitian.
Pada bahasan di atas, tiap 1 subjek dipadankan dengan 1 subjek lain
(kontrol) dalam pasangan yang dinamakan sebagai pair-matching. Dapat
pula tiap 1 subjek dipadankan dengan 2 kontrol (triplet-matching), atau
dengan 3 kontrol (quadriplet-matching), dan seterusnya,
Selanjutnya, pembahasan akan dibatasi untuk rancangan studi kasus-
kontrol dengan matching.
86
� Analisis Data Matching
Lay-out data studi kasus-kontrol dengan pair-matching dapat
diperlihatkan sebagai berikut:
Kasus
( )C
Kontrol ( )C Jumlah
pasangan E E
E e f a
E g h b
Jumlah
pasangan c d n
e : Jumlah pasangan dengan kasus dan kontrol terpajan
f : Jumlah pasangan dengan kasus terpajan dan kontrol tidak terpajan
g : Jumlah pasangan dengan kasus tidak terpajan dan kontrol terpajan
h : Jumlah pasangan dengan kasus dan kontrol tidak terpajan
n : Jumlah pasangan anggota sampel
a : Jumlah pasangan dengan kasus terpajan
b : Jumlah pasangan dengan kasus tidak terpajan
c : Jumlah pasangan dengan kontrol terpajan
d : Jumlah pasangan dengan kontrol tidak terpajan
Estimasi rasio odds adalah:
ˆmatch
OR = f
g (6.1)
Pada uji hipotesis 0H : match
OR = 1, statistik penguji adalah:
87
2ujiχ =
( )2
f g
f g
−
+ (6.2)
yang berdistribusi khi-kuadrat dengan derajat bebas satu.
Untuk estimasi interval dengan pendekatan berbasiskan deret Taylor,
ˆlnOR diasumsikan berdistribusi log-normal. Interval konfidensi (100 – α)%
untuk rasio odds adalah:
OR 2
1 1exp Z
f gα
± +
(6.3)
Dengan metode berbasiskan uji hipotesis, interval konfidensi (100 –
α)% untuk rasio odds adalah:
2
1ˆ uji
Z
ORα
χ
±
(6.4)
Contoh 6.1
Misalkan dimiliki data hipotetis studi kasus-kontrol dengan data
matched sebagai berikut:
Kasus
( )C
Kontrol ( )C Jumlah
pasangan E E
E 18 17 35
E 12 9 21
Jumlah
pasangan 30 26 56
88
Estimasi rasio odds adalah:
ˆmatch
OR = f
g
= 17
12 ≈ 1.417
Dengan hipotesis 0H : match
OR = 1, statistik penguji adalah:
2ujiχ =
( )2
f g
f g
−
+
= ( )
217 12
17 12
−
+ ≈ 0.862
Untuk α = 0.05, daerah kritis adalah 2χ > 3.84, sehingga hipotesis 0H :
matchOR = 1 tidak ditolak; atau tidak ditemukan hubungan statistik
bermakna antara pajanan E dengan penyakit C (p > 0.05).
Dengan metode berbasiskan deret Taylor, interval konfidensi 95%
rasio odds adalah:
OR 2
1 1exp Z
f gα
± +
atau: 1.417
1 1exp 1.96
17 12
± +
yaitu [0.175 ; 2.966]
Dengan metode berbasis uji hipotesis, interval konfidensi 95% rasio
odds adalah:
2
1ˆ uji
Z
ORα
χ
±
atau: 1 1.96 0.862
1.417
±
yaitu: [0.679 ; 2.955]
89
Contoh 6.2
. use “D:\Epidemiologi\Data\mccxmpl.dta”, clear
. list
+----------------------+
| case control pop |
|----------------------|
1. | 1 1 8 |
2. | 1 0 8 |
3. | 0 1 3 |
4. | 0 0 8 |
+----------------------+
. mcc case control [fw=pop]
| Controls |
Cases | Exposed Unexposed | Total
--------------+------------------------+---------
Exposed | 8 8 | 16
Unexposed | 3 8 | 11
--------------+------------------------+---------
Total | 11 16 | 27
McNemar's chi2(1) = 2.27 Prob > chi2 = 0.1317
Exact McNemar significance probability = 0.2266
Proportion with factor
Cases .5925926
Controls .4074074 [95% Conf. Interval]
--------- --------------------
difference .1851852 -.0822542 .4526246
ratio 1.454545 .891101 2.374257
rel. diff. .3125 -.0243688 .6493688
odds ratio 2.666667 .6400364 15.6064 (exact)
90
Dengan uji McNemar diperoleh statistik penguji 2χ = 2.27 dengan
derajat bebas 1 (p = 0.1317), sehingga hipotesis 0H : match
OR = 1 tidak
ditolak. Karena ada sel dengan nilai harapan kurang daripada 5, uji hipotesis
sebaiknya dilakukan uji eksak yang menghasilkan nilai p = 0.2266 dengan
kesimpulan sama, yaitu hipotesis 0H : match
OR = 1 tidak ditolak.
Estimasi rasio odds matching adalah 2.667 dengan interval
konfidensi 95% [0.640 ; 15.606] berdasarkan metode eksak.
Contoh 6.3
Lihat kembali data pada Contoh 6.1:
Kasus
( )C
Kontrol ( )C Jumlah
pasangan E E
E 18 17 35
E 12 9 21
Jumlah
pasangan 30 26 56
Dengan Stata diperoleh:
. mcci 18 17 12 9
| Controls |
Cases | Exposed Unexposed | Total
--------------+-----------------------+---------
Exposed | 18 17 | 35
Unexposed | 12 9 | 21
--------------+-----------------------+---------
Total | 30 26 | 56
McNemar's chi2(1) = 0.86 Prob > chi2 = 0.3532
Exact McNemar significance probability = 0.4583
91
Proportion with factor
Cases .625
Controls .5357143 [95% Conf. Interval]
--------- --------------------
difference .0892857 -.1155924 .2941638
ratio 1.166667 .8423368 1.615875
rel. diff. .1923077 -.1725275 .5571429
odds ratio 1.416667 .6376336 3.250974 (exact)
Uji McNemar menghasilkan statistik penguji 2χ = 0.86 dengan
derajat bebas 1 (p = 0.3532), sehingga hipotesis 0H : match
OR = 1 tidak
ditolak. Tidak ada sel dengan nilai harapan kurang daripada 5, sehingga uji
hipotesis tidak perlu dilakukan dengan uji eksak.
Estimasi rasio odds matching adalah 2.667 dengan interval
konfidensi 95% [0.640 ; 15.606] berdasarkan metode eksak.
� Triplet-Matching
Lay-out data untuk studi kasus-kontrol dengan triplet-matching (1
kasus dipadankan dengan 2 kontrol adalah sebagai berikut:
Kasus
( )C
Kontrol ( )C Jumlah
triplet 2E 1E 0E
E 2f 1f 0f a
E 2g 1g 0g b
Jumlah
triplet 2c 1c 0c n
92
2f : Jumlah triplet dengan kasus dan 2 kontrol terpajan
1f : Jumlah triplet dengan kasus dan 1 kontrol terpajan
0f : Jumlah triplet dengan kasus dan 0 kontrol terpajan
2g : Jumlah triplet dengan kasus tidak terpajan dan 2 kontrol terpajan
1g : Jumlah triplet dengan kasus tidak terpajan dan 1 kontrol terpajan
0g : Jumlah triplet dengan kasus tidak terpajan dan 0 kontrol terpajan
n : Jumlah triplet anggota sampel
a : Jumlah triplet dengan kasus terpajan
b : Jumlah triplet dengan kasus tidak terpajan
2c : Jumlah triplet dengan 2 kontrol terpajan
1c : Jumlah triplet dengan 1 kontrol terpajan
0c : Jumlah triplet dengan 0 kontrol terpajan
Estimasi rasio odds adalah:
ˆmatch
OR = 0 1
2 1
2
2
f f
g g
+
+ (6.5)
Pada uji hipotesis 0H : match
OR = 1, statistik penguji adalah:
2ujiχ =
( )
( ) ( )
2
0 2 1 1
0 2 1 1
2 ( )
2 2
f g f g
f g f g
− + − + + +
(6.6)
yang berdistribusi khi-kuadrat dengan derajat bebas satu.
93
Untuk estimasi interval dengan metode berbasiskan uji hipotesis,
interval konfidensi (100 – α)% untuk rasio odds adalah:
2
1ˆ uji
Z
ORα
χ
±
(6.7)
Penggunaan lebih daripada 2 kontrol untuk 1 kasus akan
meningkatkan biaya penelitian, tetapi hanya sedikit meningkatkan efisiensi,
sehingga tidak dianjurkan untuk menggunakan lebih daripada 2 kontrol
untuk 1 kasus.
Contoh 6.4
Misalkan dimiliki data studi kasus-kontrol dengan triplet-matching
sebagai berikut:
Kasus
( )C
Kontrol ( )C Jumlah
triplet 2E 1E 0E
E 2 7 16 25
E 5 12 12 29
Jumlah
triplet 7 19 28 54
Estimasi rasio odds adalah:
ˆmatch
OR = 0 1
2 1
2
2
f f
g g
+
+
= ( )
( )
2 16 7
2 5 12
+
+ ≈ 1.773
94
Statistik penguji untuk uji hipotesis 0H : match
OR = 1 adalah:
2ujiχ =
( )
( ) ( )
2
0 2 1 1
0 2 1 1
2 ( )
2 2
f g f g
f g f g
− + − + + +
=( )
( ) ( )
22 16 5 (7 12)
2 16 5 2 7 12
− + − + + +
≈ 3.6125
yang berdistribusi khi-kuadrat dengan derajat bebas satu. Daerah kritis untuk
distribusi khi-kuadrat dengan derajat bebas 1 dan α = 0.05 adalah 3.84,
sehingga hipotesis 0H : match
OR = 1 tidak ditolak pada α = 0.05, berarti
tidak ditemukan hubungan yang bermakna secara statistik antara pajanan E
dengan penyakit C (p > 0.05).
Untuk estimasi interval dengan metode berbasiskan uji hipotesis,
interval konfidensi (100 – α)% untuk rasio odds adalah:
2
1ˆ uji
Z
ORα
χ
±
atau: 1 1.96 3.6125
1.773
±
yaitu: [0.9823 ; 3.1992]
95
LATIHAN 6
Pilihlah jawaban yang paling benar!
1. Yang dimaksud dengan kelompok kontrol pada studi matching antara
lain adalah:
A. Kelompok tidak sakit pada studi kohort.
B. Kelompok tidak sakit pada studi kasus-kontrol.
C. Kelompok tidak sakit pada studi potong-lintang.
D. Semuanya salah.
Untuk soal No. 2 s.d. 7:
Dimiliki data hipotetis berikut untuk studi kasus-kontrol matched:
Kasus
( )C
Kontrol ( )C
E E
E 18 17
E 12 9
2. Estimasi rasio odds adalah:
A. 0.70 C. 1.42
B. 0.79 D. 1.45
3. Jika data tersebut dianalisis secara unmatched, estimasi rasio odds
adalah:
A. 0.70 C. 1.42
B. 0.79 D. 1.45
4. Pada uji hipotesis 0H : OR = 1, besar statistik penguji adalah:
A. 0.169 C. 0.862
B. 0.411 D. 0.928
96
5. Berdasarkan hasil perhitungan soal No. 4, kesimpulannya adalah:
A. 0H ditolak pada tingkat signifikansi α = 0.05.
B. 0H tidak ditolak pada tingkat signifikansi α = 0.10.
C. A) dan B) benar.
D. A) dan B) salah.
6. Dengan metode pendekatan berbasiskan deret Taylor, standard error
OR adalah:
A. 0.141 C. 0.375
B. 0.142 D. 0.377
7. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio odds adalah:
A. [0.391 ; 1.087] C. [1.028 ; 3.257]
B. [0.677 ; 2.966] D. [1.065 ; 4.537]
8. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio risk adalah:
A. [0.932 ; 3.829] C. [1.130 ; 3.157]
B. [0.957 ; 5.434] D. [1.847 ; 7.286]
9. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio odds adalah:
A. [0.863 ; 2.600] C. [1.229 ; 6.934]
B. [0.827 ; 3.646] D. [1.165 ; 7.318]
Untuk soal No. 10 s.d. 12:
Dimiliki data hipotetis berikut untuk studi kasus-kontrol matched:
Kasus
( )C
Kontrol ( )C
2E 1E 0E
E 3 6 8
E 1 4 38
97
10. Jumlah subjek kontrol yang terpajan adalah:
A. 4 C. 18
B. 14 D. 43
11. Estimasi rasio odds adalah:
A. 2.240 C. 7.125
B. 3.667 D. 15.250
12. Pada uji hipotesis 0H : OR = 1, besar statistik penguji adalah:
A. 2.595 C. 6.737
B. 3.425 D. 11.731
99
BAB 7
MEDIASI, INTERAKSI, DAN
MODERASI
� Mediasi
Mediasi adalah keadaan jika efek kausal variabel independen X
terhadap variabel dependen Y “dijelaskan” mediator Me, dengan mediator
Me disebabkan oleh variabel independen X dan mediator Me menyebabkan
variabel dependen Y (gambar 7.1). Mediasi dapat berupa mediasi parsial
(partial mediation) dan mediasi penuh (complete mediation). Pada mediasi
parsial masih terdapat efek langsung variabel independen X terhadap variabel
dependen Y, sedangkan pada mediasi penuh efek variabel independen X
terhadap variabel dependen Y sepenuhnya terjadi melalui mediator Me.
Gambar 7.1 Mediasi
Kiri: Mediasi Parsial; kanan: Mediasi Penuh
Pengujian mediasi dapat dilakukan dengan menggunakan Model 1
dan Model 2 pada Gambar 7.2 berikut:
100
Gambar 7.2 Efek Mediasi
Kiri: Model 1; kanan: Model 2
1. Efek τ pada relasi X → Y (Model 1) bermakna secara statistik.
2. Efek α pada relasi X → Me (Model 2) bermakna secara statistik.
3. Efek β pada relasi Me → Y (Model 2) bermakna secara statistik.
4. Efek τ’ pada Model 2 lebih kecil daripada efek τ pada Model 1.
Selain cara di atas, pengujian mediasi juga dapat dilakukan dengan
uji Sobel terhadap hipotesis 0H : *α β = 0, dengan statistik penguji:
ujiZ = 2 2 2 2
*
αβ
α β
α σ β σ+ (7.1)
yang berdistribusi normal standar.
Contoh 7.1:
Dimiliki data 200 orang siswa dengan nilai-nilai ujian science, read,
dan math.
. use “D:\Stata\Data\hsbdemo”, clear (highschool and beyond (200 cases)
101
Dalam contoh ini science adalah variabel dependen, math adalah
variabel independen, dan read adalah variabel moderator.
. list science read math in 1/10
+-----------------------+
| science read math |
|-----------------------|
1. | 29 34 41 |
2. | 36 34 41 |
3. | 26 39 44 |
4. | 33 37 42 |
5. | 39 39 40 |
|-----------------------|
6. | 31 42 42 |
7. | 39 31 46 |
8. | 34 50 40 |
9. | 42 39 33 |
10. | 39 34 46 |
+-----------------------+
. regress science math
Source | SS df MS Number of obs = 200
---------+-------------------------- F(1, 198) = 130.81
Model | 7760.55791 1 7760.55791 Prob > F = 0.0000
Residual | 11746.9421 198 59.3279904 R-squared = 0.3978
---------+-------------------------- Adj R-squared = 0.3948
Total | 19507.5 199 98.0276382 Root MSE = 7.7025
--------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+-----------------------------------------------------
math | .66658 .0582822 11.44 0.000 .5516466 .7815135
_cons | 16.75789 3.116229 5.38 0.000 10.61264 22.90315
--------------------------------------------------------------
102
. regress read math
Source | SS df MS Number of obs = 200
---------+-------------------------- F(1, 198) = 154.70
Model | 9175.57065 1 9175.57065 Prob > F = 0.0000
Residual | 11743.8493 198 59.3123704 R-squared = 0.4386
---------+-------------------------- Adj R-squared = 0.4358
Total | 20919.42 199 105.122714 Root MSE = 7.7015
------------------------------------------------------------
read | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+-----------------------------------------------------
math | .724807 .0582745 12.44 0.000 .6098887 .8397253
_cons | 14.07254 3.115819 4.52 0.000 7.928087 20.21699
------------------------------------------------------------
. regress science read
Source | SS df MS Number of obs = 200
---------+-------------------------- F(1, 198) = 130.41
Model | 7746.4076 1 7746.4076 Prob > F = 0.0000
Residual | 11761.0924 198 59.3994566 R-squared = 0.3971
---------+-------------------------- Adj R-squared = 0.3941
Total | 19507.5 199 98.0276382 Root MSE = 7.7071
------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .6085207 .0532864 11.42 0.000 .503439 .7136024
_cons | 20.06696 2.836003 7.08 0.000 14.47432 25.65961
------------------------------------------------------------
. regress science read math
Source | SS df MS Number of obs = 200
---------+-------------------------- F(2, 197) = 90.27
Model | 9328.73944 2 4664.36972 Prob > F = 0.0000
Residual | 10178.7606 197 51.6688353 R-squared = 0.4782
---------+-------------------------- Adj R-squared = 0.4729
Total | 19507.5 199 98.0276382 Root MSE = 7.1881
103
------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .3654205 .0663299 5.51 0.000 .2346128 .4962283
math | .4017207 .0725922 5.53 0.000 .2585632 .5448782
_cons | 11.6155 3.054262 3.80 0.000 5.592255 17.63875
------------------------------------------------------------
Diperoleh hasil:
Tampak bahwa:
1. Ada hubungan bermakna antara math → science (variabel
independen → variabel dependen; p = 0.000).
2. Ada hubungan bermakna antara math → read (variabel independen
→.moderator; p = 0.000).
3. Ada hubungan bermakna antara read → science (moderator →
variabel dependen; p = 0.000).
4. Nilai t = 11.44 (p = 0.000) pada relasi math → science tanpa
moderator menjadi t = 5.53 (p = 0.000) pada relasi dengan moderator.
Dengan kesimpulan mediator bermakna secara statistik.
Pada uji Sobel diperoleh:
ujiZ = 2 2 2 2
*
αβ
α β
α σ β σ+
α = 0.725 β = 0.365
2ˆασ = 0.058 2ˆβσ = 0.066
ujiZ = ( )( ) ( ) ( )2 22 2
0.725 .365
0.725 .066 .365 .
*0
0 0 058+ = 5.037
104
Dengan kesimpulan yang sama, bahwa mediator bermakna secara statistik.
Contoh 7.2:
Uji Sobel-Goodman dapat dilakukan pada Stata sebagai berikut:
. use “D:\Stata\Data\hsbdemo”, clear (highschool and beyond (200 cases)
. sgmediation science, mv(read) iv(math)
Model with dv regressed on iv (path c)
Source | SS df MS Number of obs = 200
---------+-------------------------- F(1, 198) = 130.81
Model | 7760.55791 1 7760.55791 Prob > F = 0.0000
Residual | 11746.9421 198 59.3279904 R-squared = 0.3978
---------+-------------------------- Adj R-squared = 0.3948
Total | 19507.5 199 98.0276382 Root MSE = 7.7025
--------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+-----------------------------------------------------
math | .66658 .0582822 11.44 0.000 .5516466 .7815135
_cons | 16.75789 3.116229 5.38 0.000 10.61264 22.90315
--------------------------------------------------------------
Model with mediator regressed on iv (path a)
Source | SS df MS Number of obs = 200
---------+-------------------------- F(1, 198) = 154.70
Model | 9175.57065 1 9175.57065 Prob > F = 0.0000
Residual | 11743.8493 198 59.3123704 R-squared = 0.4386
---------+-------------------------- Adj R-squared = 0.4358
Total | 20919.42 199 105.122714 Root MSE = 7.7015
105
------------------------------------------------------------
read | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+-----------------------------------------------------
math | .724807 .0582745 12.44 0.000 .6098887 .8397253
_cons | 14.07254 3.115819 4.52 0.000 7.928087 20.21699
------------------------------------------------------------
Model with dv regressed on mediator and iv (paths b and c')
Source | SS df MS Number of obs = 200
---------+-------------------------- F(2, 197) = 90.27
Model | 9328.73944 2 4664.36972 Prob > F = 0.0000
Residual | 10178.7606 197 51.6688353 R-squared = 0.4782
---------+-------------------------- Adj R-squared = 0.4729
Total | 19507.5 199 98.0276382 Root MSE = 7.1881
------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .3654205 .0663299 5.51 0.000 .2346128 .4962283
math | .4017207 .0725922 5.53 0.000 .2585632 .5448782
_cons | 11.6155 3.054262 3.80 0.000 5.592255 17.63875
------------------------------------------------------------
Sobel-Goodman Mediation Tests
Coef Std Err Z P>|Z|
Sobel .26485934 .05258136 5.037 4.726e-07
Goodman-1 (Aroian) .26485934 .05272324 5.024 5.072e-07
Goodman-2 .26485934 .05243909 5.051 4.400e-07
Coef Std Err Z P>|Z|
a coefficient = .724807 .058274 12.4378 0
b coefficient = .365421 .06633 5.50914 3.6e-08
Indirect effect = .264859 .052581 5.03713 4.7e-07
Direct effect = .401721 .072592 5.53394 3.1e-08
Total effect = .66658 .058282 11.4371 0
Proportion of total effect that is mediated: .39734065
106
Ratio of indirect to direct effect: .65931219
Ratio of total to direct effect: 1.6593122
Koefisien Sobel, yaitu efek tak-langsung math terhadap science
(melalui mediator read) adalah 0.725 × 0.365 = 0.265. Pada uji hipotesis
0H : Koef Sobel = 0 diperoleh statistik penguji Z = 5.037 yang berdistribusi
normal standar dengan p < 0.05 (tepatnya adalah p = 4.726e‒7).
� Interaksi & Moderasi
Baron dan Kenny (1986) membedakan interaksi menjadi:
A. Interaksi statistik (interaksi non-efek; interaksi non-kausal; Gambar
7.2)
- “Ada efek bersama (combined effect) X dan Z terhadap Y”
- X dan Z adalah efek utama (main effect) dalam model
- Pembuktian dengan uji statistik
- Suku interaksi ditambahkan karena model aditif Y = X + Z tak
mencukupi
Gambar 7.2 Interaksi Statistik
B. Moderasi (interaksi efek; interaksi kausal; Gambar 7.3)
- “Hubungan antara X dan Y bervariasi menurut W”
- X adalah efek utama, W adalah moderator (bukan efek utama)
107
- Pengujian dengan uji statistik dan pembahasan substantif
- Moderator ditambahkan jika terbukti memodifikasi hubungan X-Y
Gambar 7.3 Moderasi
Contoh 7.3:
Misalkan dimiliki data hipotetis dalam bentuk dataset berikut.
. use “D:\Stata\Data\c10interaction”, clear
. desc
Contains data from D:\Epidemiologi\c10interaction.dta
obs: 120
vars: 4 7 Jul 2019 17:18
size: 600
-----------------------------------------------------------
storage display value
variable name type format label variable label
-----------------------------------------------------------
inc int %8.0g Income in 1000s
educ byte %8.0g Years of education
male byte %8.0g females are 1 and
males are 0
alienation byte %8.0g Alienation 0 to 10
-----------------------------------------------------------
Sorted by: male
108
. list in 1/10
+------------------------------+
| inc educ male aliena~n |
|------------------------------|
1. | 65 17 0 9 |
2. | 75 14 0 3 |
3. | 50 16 0 4 |
4. | 125 12 0 6 |
5. | 10 8 0 2 |
|------------------------------|
6. | 75 14 0 3 |
7. | 50 16 0 4 |
8. | 50 16 0 4 |
9. | 65 17 0 9 |
10. | 75 14 0 3 |
+------------------------------+
. regress inc educ male
Source | SS df MS Number of obs = 120
---------+--------------------------- F(2, 117) = 37.19
Model | 100464.105 2 50232.0527 Prob > F = 0.0000
Residual | 158015.895 117 1350.5632 R-squared = 0.3887
---------+--------------------------- Adj R-squared = 0.3782
Total | 258480 119 2172.10084 Root MSE = 36.75
-------------------------------------------------------------
inc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
educ | 8.045694 1.008586 7.98 0.000 6.048243 10.04315
male | 19.04991 6.719787 2.83 0.005 5.741726 32.3581
_cons | -42.54411 14.2919 -2.98 0.004 -70.84847 -14.23975
-------------------------------------------------------------
Prediktor educ dan male keduanya bermakna (p masing-masing
0.000 dan 0.005), tetapi koefisien determinasi R-squared (proporsi variansi
109
yang “dijelaskan” oleh prediktor hanya 38.87%). Selanjutnya dicoba
memasukkan suku interaksi antara educ dengan male.
. regress inc educ male c.educ#male
Source | SS df MS Number of obs = 120
---------+--------------------------- F(3, 116) = 34.89
Model | 122604.719 3 40868.2397 Prob > F = 0.0000
Residual | 135875.281 116 1171.33863 R-squared = 0.4743
---------+--------------------------- Adj R-squared = 0.4607
Total | 258480 119 2172.10084 Root MSE = 34.225
-------------------------------------------------------------
inc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------+-----------------------------------------------------
educ | 3.602369 1.388076 2.60 0.011 .8531092 6.351628
male | -91.88539 26.27242 -3.50 0.001 -143.9212 -39.84954
|
male# |
c.educ|
1 | 8.196446 1.885263 4.35 0.000 4.462445 11.93045
|
_cons | 16.84834 19.07279 0.88 0.379 -20.92773 54.6244
-------------------------------------------------------------
Tampak bahwa suku interaksi male*educ bermakna secara statistik
(p = 0.000), sedangkan koefisien determinasi R-squared meningkat
menjadi 47.43%.
Model estimasi adalah:
ˆinc = 16.85 + 3.60 educ ‒ 91.89 male + 8.20 male*educ
Untuk wanita, male = 1. Model estimasinya adalah:
ˆinc = -75.04 + 11.80 educ
Untuk pria, male = 0. Model estimasinya adalah:
ˆinc = 16.85 + 3.60 educ
110
LATIHAN 7
Pilihlah jawaban yang paling benar!
1. Syarat efek mediasi antara lain yaitu:
A. Tidak ada efek langsung variabel independen X terhadap variabel
dependen Y.
B. Tidak ada efek variabel independen X terhadap mediator Me.
C. Ada efek mediator me terhadap variabel dependen Y.
D. Semuanya benar.
2. Uji Sobel menguji keberadaan:
A. Mediasi.
B. Moderasi.
C. A) dan B) benar.
D. A) dan B) salah.
Untuk soal No.3 s.d. 7:
Dimiliki cuplikan hasil keluaran Stata berikut berupa 3 tabel (x =
variabel independen, y = variabel dependen, dan med = variabel mediator):
-------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
x | .1927391 .0305102 6.32 0.000 .1328676 .2526106
_cons | .4960159 .0215308 23.04 0.000 .4537651 .5382667
-------------------------------------------------------------
-------------------------------------------------------------
med | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
x | .3647129 .0642544 5.68 0.000 .2386238 .4908021
_cons | .1654007 .0453437 3.65 0.000 .0764207 .2543807
-------------------------------------------------------------
111
-------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
med | .2307162 .0131437 17.55 0.000 .2049238 .2565087
x | .1085939 .0271072 4.01 0.000 .0554002 .1617876
_cons | .4578553 .0189529 24.16 0.000 .4206632 .4950475
-------------------------------------------------------------
3. Efek langsung variabel independen X terhadap variabel dependen Y
adalah:
A. 0.109 C. 0.365 * 0.231
B. 0.193 D. Semuanya salah.
4. Efek tak langsung variabel independen X terhadap variabel dependen Y
adalah:
A. 0.109 C. 0.365 * 0.231
B. 0.193 D. Semuanya salah.
5. Efek total variabel independen X terhadap variabel dependen Y adalah:
A. [Efek langsung + efek tak langsung] variabel independen X
terhadap variabel dependen Y.
B. [Efek langsung * efek tak langsung] variabel independen X
terhadap variabel dependen Y.
C. [Efek langsung / efek tak langsung] variabel independen X
terhadap variabel dependen Y.
D. Semuanya salah.
6. Proporsi efek total yang termediasi adalah:
A. [Efek tak langsung / efek langsung] * 100%
B. [Efek langsung / efek total] * 100%
C. [Efek tak langsung / efek total] * 100%
D. Semuanya salah.
112
7. Kesimpulan dari ketiga tabel di atas yaitu:
A. Ada efek mediasi yang bermakna secara statistik.
B. Tidak ada efek mediasi yang bermakna secara statistik.
C. Belum dapat disimpulkan adanya efek mediasi yang bermakna
secara statistik.
D. Semuanya salah.
8. Pada hubungan antara X dan Y dengan moderator W:
A. Interaksi antara X dan W adalah interaksi kausal.
B. X, Y, dan W seluruhnya adalah efek utama.
C. Pengujian adanya interaksi cukup dengan uji statistik.
D. Semuanya salah.
9. Pada uji statistik terhadap efek interaksi, batas kemaknaan yang
dianjurkan adalah
A. 0.05 C. 0.25
B. 0.10 D. Semuanya salah.
10. Aturan hierarki untuk interaksi menyatakan, bahwa jika suku interaksi
X*Z bermakna secara statistik, maka:
A. Suku X dan Z selalu harus dipertahankan dalam model.
B. Suku X dan Z dipertahankan dalam model hanya jika keduanya
bermakna secara statistik.
C. Suku X dan Z harus dikeluarkan dari model.
D. Semuanya salah.
113
BAB 8
ANALISIS REGRESI LOGISTIK
Model regresi logistik dianjurkan pada analisis data epidemiologi
jika:
- Respons berskala biner.
- Konfaunder kategorik lebih daripada satu.
- Ada pajanan dan/atau konfaunder berskala kontinu tanpa rencana untuk
mengkategorisasikannya.
� Regresi Logistik Sederhana
Model regresi logistik sederhana (simple logistic regression) adalah
model regresi dengan satu variabel independen yang berskala kontinu atau
kategorik biner, dinyatakan sebagai:
logit Y = 0β +
1β X (8.1)
Logit iY adalah:
logit (Y ) = ln odds (Y ) (8.1.a)
= ln ( )
( )1
1 1
P Y
P Y
=
− =
logit (Y ) = ln ( )( )
1
0
i
i
P Y
P Y
=
= (8.1.b)
114
Jika X biner, maka X = {0, 1}, sehingga didapatkan:
untuk X = 1 → logit ( 1Y X = ) = ln odds ( 1Y X = )
= 0β +
1β . (1)
= 0β +
1β
untuk X = 0 → logit ( 0Y X = ) = ln odds ( 0Y X = )
= 0β +
1β . (0)
= 0β
Diperoleh: Odds ( 1Y X = ) = ( ) 0 1exp β β+
dan Odds ( 0Y X = ) = ( ) 0exp β
sehingga rasio odds adalah:
OR = ( )( )
1
0
Odds Y X
Odds Y X
=
=
= ( )
( )
0 1
0
exp
exp
β β
β
+
OR = ( ) 1exp β (8.2)
atau: 1β = ln OR (8.2.a)
Contoh 8.1
File lbw.dta memuat data tentang 189 kejadian berat badan lahir
rendah berikut data tentang ibu yang melahirkan. Contoh 8.1 ini memuat
analisis tentang hubungan hipertensi ibu pada ht dengan kejadian berat
badan lahir rendah lbw.
. use “D:\Epidemiologi\Data\lbw.dta”, clear
115
. tab low ht
| has history of
birthweigh | hypertension
t<2500g | 0 1 | Total
-----------+----------------------+----------
0 | 125 5 | 130
1 | 52 7 | 59
-----------+----------------------+----------
Total | 177 12 | 189
Dalam bentuk paparan yang biasa ditampilkan data di atas dapat
diperlihatkan sebagai:
Hipertensi BBLR BBL normal Jumlah
Ya 7 5 12
Tidak 52 125 177
Jumlah 59 130 189
. logit low ht
Iteration 0: log likelihood = -117.336
Iteration 1: log likelihood = -115.35188
Iteration 2: log likelihood = -115.32494
Iteration 3: log likelihood = -115.32493
Logistic regression Number of obs = 189
LR chi2(1) = 4.02
Prob > chi2 = 0.0449
Log likelihood = -115.32493 Pseudo R2 = 0.0171
116
------------------------------------------------------------
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+-----------------------------------------------------
ht | 1.213542 .6083485 1.99 0.046 .0212008 2.405883
_cons | -.87707 .1650175 -5.32 0.000 -1.200498 -.5536417
------------------------------------------------------------
Model estimasi yang diperoleh adalah:
logit low = ‒0.877 +1.214 ht
dengan: 1b = ‒0.877
dan OR = exp 1β
= exp (1.214) ≈ 3.365
Contoh 8.2
Lihat kembali data pada Contoh 8.1. Dengan Stata, estimasi OR dapat
diperoleh secara langsung sebagai berikut:
. logistic low ht
Logistic regression Number of obs = 189
LR chi2(1) = 4.02
Prob > chi2 = 0.0449
Log likelihood = -115.32493 Pseudo R2 = 0.0171
---------------------------------------------------------------
low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
ht | 3.365384 2.047326 1.99 0.046 1.021427 11.08822
_cons | .416 .0686473 -5.32 0.000 .3010442 .5748526
---------------------------------------------------------------
117
Note: _cons estimates baseline odds.
. Tampak OR = 3.365 dengan interval konfidensi 95% [1.021 ;
11.088]. Dari tabel 2×2 di atas juga diperoleh hasil yang sama:
OR = ad
bc
= ( ) ( )( ) ( )7 125
5 52 ≈ 3.365
Dari contoh di atas, tidak jelas ada kelebihan penggunaan analisis
regresi logistik sederhana daripada analisis konvensional tabel 2×2. Manfaat
analisis regresi logistik ganda akan terlihat lebih jelas dengan adanya 1 atau
lebih kovariat atau variabel konfaunder, seperti pada pembahasan berkut.
� Regresi Logistik Ganda
Model regresi logistik ganda (multiple logistic regression) adalah:
logit Y = 0β +
1β 1X + 2β 2X + . . . +
pβ pX ((8.3)
Di sini berlaku:
iβ = ln
iOR (8.4.a)
atau: iOR = exp ( )
iβ : untuk i = 1, 2, . . . , p (8.4.b)
Untuk tiap pasangan { iX ; Y},
iOR adalah rasio odds suaian yang
telah disesuaikan dengan (adjusted with) keberadaan iX lain, yaitu seluruh
kovariat dan konfaunder yang ada dalam model.
118
Contoh 8.3
Lihat kembali file lbw.dta pada Contoh 8.1.
. use “D:\Epidemiologi\Data\lbw.dta”, clear
. list low ht smoke ptl ui in 1/10
+---------------------------------+
| low ht smoke ptl ui |
|---------------------------------|
1. | 0 0 nonsmoker 0 1 |
2. | 0 0 nonsmoker 0 0 |
3. | 0 0 smoker 0 0 |
4. | 0 0 smoker 0 1 |
5. | 0 0 smoker 0 1 |
|---------------------------------|
6. | 0 0 nonsmoker 0 0 |
7. | 0 0 nonsmoker 0 0 |
8. | 0 0 nonsmoker 0 0 |
9. | 0 0 smoker 0 0 |
10. | 0 0 smoker 0 0 |
+---------------------------------+
. logit low ht smoke ptl ui
Iteration 0: log likelihood = -117.336
Iteration 1: log likelihood = -108.39533
Iteration 2: log likelihood = -108.315
Iteration 3: log likelihood = -108.31499
Iteration 4: log likelihood = -108.31499
Logistic regression Number of obs = 189
LR chi2(4) = 18.04
Prob > chi2 = 0.0012
Log likelihood = -108.31499 Pseudo R2 = 0.0769
119
--------------------------------------------------------------
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+-------------------------------------------------------
ht | 1.416685 .6221121 2.28 0.023 .1973683 2.636003
smoke | .582175 .3365041 1.73 0.084 -.0773609 1.241711
ptl | .6069344 .3356105 1.81 0.071 -.0508502 1.264719
ui | .8838349 .4428932 2.00 0.046 .0157802 1.75189
_cons | -1.417498 .2463856 -5.75 0.000 -1.900405 -.9345911
--------------------------------------------------------------
Diperoleh model estimasi:
logit low = ‒1.417 + 1.417 ht + 0.582 smoke + 0.607 ptl + 0.884 ui
Contoh 8.4
Lihat kembali data pada Contoh 8.3.
. logistic low ht smoke ptl ui
Logistic regression Number of obs = 189
LR chi2(4) = 18.04
Prob > chi2 = 0.0012
Log likelihood = -108.31499 Pseudo R2 = 0.0769
120
---------------------------------------------------------------
low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
ht | 4.123431 2.565236 2.28 0.023 1.218193 13.9573
smoke | 1.789927 .6023179 1.73 0.084 .9255558 3.461531
ptl | 1.834798 .6157775 1.81 0.071 .9504211 3.542097
ui | 2.420163 1.071874 2.00 0.046 1.015905 5.765486
_cons | .2423196 .059704 -5.75 0.000 .1495081 .3927464
---------------------------------------------------------------
Note: _cons estimates baseline odds.
Diperoleh:
- Rasio odds suaian low-ht:
1OR = 4.123
- Rasio odds suaian low-smoke:
2OR = 1.790
- Rasio odds suaian low-ptl:
3OR = 1.835
- Rasio odds suaian low-ui:
4OR = 2.420
121
LATIHAN 8
Pilihlah jawaban yang paling benar!
Dimiliki paparan hasil studi kohort dalam bentuk tabel 2×2 berikut:
D D
E a b 1n
E c d 2n
1m
2m n
1. Pemanfaatan perangkat lunak komputer statistik sangat dibutuhkan
pada:
A. Pengolahan data dengan skala besar.
B. Analisis regresi ganda dengan jumlah regresor yang banyak.
C. Perhitungan estimasi parameter dengan prosedur iteratif.
D. Semuanya benar.
2. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor
risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. 1a n > 2c n .
B. 1a m >
2b m .
C. a b > c d .
D. Semuanya salah.
3. Pada analisis regresi logistik sederhana diperoleh hasil berupa:
A. Estimasi rasio risk C. A) dan B) benar
B. Estimasi rasio odds D. A) dan B) salah
Untuk soal No. 4 dan 5:
Dimiliki file data glm-reg.dta yang memuat data tentang
penghasilan tahunan (incbinary) 500 orang karyawan (1 untuk penghasilan
tahunan 26 ribu dollar dan 0 untuk penghasilan tahunan sama atau kurang
122
daripada itu), serta lama pendidikannya (educ) dalam tahun. Pada regresi
logistik sederhana incbinary terhadap educ diperoleh hasil berikut:
Logistic regression Number of obs = 500
LR chi2(1) = 48.17
Prob > chi2 = 0.0000
Log likelihood = -322.48937 Pseudo R2 = 0.0695
---------------------------------------------------------------
incbinary | Coef. Std. Err. z P>|z| [95% Conf. Interval]
----------+----------------------------------------------------
educ | .1702216 .0266265 6.39 0.000 .1180347 .2224086
_cons | -2.245047 .3645915 -6.16 0.000 -2.959633 -1.53046
---------------------------------------------------------------
4. Estimasi rasio odds smoke adalah:
A. ln 0.170 C. e0.170
B. 0.170
D. 100.170
5. Kesimpulan analisis regresi logistik di atas yaitu:
A. Ada hubungan bermakna secara statistik antara pajanan educ
dengan respons incbinary.
B. Tidak ada hubungan bermakna secara statistik antara pajanan
educ dengan respons incbinary.
C. Belum dapat disimpulkan ada tidaknya hubungan bermakna
antara pajanan educ dengan respons incbinary.
D. Semuanya salah.
Untuk soal No. 6 s.d. 8:
Lihat kembali data yang digunakan untuk soal No. 4 dan 5 di atas.
Sekarang di sini ditampilkan hasil analisis regresi logistik ganda dengan
menambahkan variabel independen jobexp (lama tahun pengalaman kerja)
dan black (ras; 1 = black, 2 = white).
123
Logistic regression Number of obs = 500
LR chi2(4) = 208.21
Prob > chi2 = 0.0000
Log likelihood = -242.4705 Pseudo R2 = 0.3004
---------------------------------------------------------------
incbinary | Coef. Std. Err. z P>|z| [95% Conf. Interval]
----------+----------------------------------------------------
educ | .2453949 .0404171 6.07 0.000 .1661789 .3246109
jobexp | .2329718 .0262065 8.89 0.000 .1816079 .2843356
black | -1.905818 .400966 -4.75 0.000 -2.691697 -1.119939
_cons | -6.159688 .7790823 -7.91 0.000 -7.686661 -4.632714
---------------------------------------------------------------
5. Tanpa menilai kemaknaan masing-masing pajanan, model logit
incbinary = bo + b1educ + b2 jbexp + b3 black di atas:
A. Bermakna secara statistik.
B. Tak bermakna secara statistik.
C. Belum jelas kemaknaannya.
D. Semuanya salah.
6. Pajanan yang terutama berpengaruh terhadap kejadian berat badan lahir
rendah adalah:
A. Lama pendidikan.
B. Lama pengalaman kerja.
C. Ras.
D. Tak dapat ditentukan.
7. Ras Black menurunkan nilai logit incbinary sebesar:
A. ‒1.91 C. exp ‒1.91
B. ‒4.75 D. exp ‒4.75
8. Rasio odds suaian incbinary-black adalah:
A. ln ‒1.91 C. exp ‒1.91
B. ln ‒4.75 D. exp ‒4.75
125
DAFTAR PUSTAKA
Bouter LM, Zielhuis GA, & Zeegers MPA. 2018. Textbook of
Epidemiology. Houten: Bohn Stafleu van Loghum.
Fleiss JL, Levin B, & Paik MC. 2013. Statistical Methods for Rates and
Proportions, 3rd Ed. Hoboken, New Jersey: John Wiley & Sons.
Fletcher RW & Fletcher SW. 2005. Clinical Epidemiology: The Essentials,
4th Ed. Philadelphia: Lippincott William & Wilkins.
Harlan J. 2018. Analisis Regresi Logistik. Depok, Jawa Barat: Penerbit
Gunadarma.
Harlan J. 2008. Epidemiologi Kebidanan. Depok, Jawa Barat: Penerbit
Gunadarma.
Hosmer DW & Lemeshow. 2000. Applied Logistic Regression, 2nd Ed.
New York: Wiley.
Keogh RH & Cox DR. 2014. Case-Control Studies. Cambridge: Cambridge
University Press.
Kleinbaum DG, Kupper LL, & Morgenstern H. 1982. Epidemiologic
Research: Principles and Quantitative Methods. New York: Van
Nostrand Reinhold Company.
Lachin JM. 2000. Biostatistical Methods: The Assessment of Relative
Risk. New York: John Wiley & Sons, Inc.
Long JS & Freese J. 2014. Regression Models for Categorical Dependent
Variables Using Stata, 3rd Ed. College Station, Texas: Stata Press.
Rothman KJ, Greenland S, & Lash TL. 2008. Modern Epidemiology, 3rd
Ed. Philadelphia: Lippincott William & Wilkins.
StataCorp. 2019. Stata Base Reference Manual: Release 16. College
Station, Texas: Stata Press.
Szklo M & Nieto FJ. 2007. Epidemiology: Beyond the Basics, 2nd Ed.
Sudbury, MA: Jones and Bartlett Publishers.
Wang JD. 2002. Basic Principles and Practical Applications in
Epidemiological Research. New Jersey: World Scientific.
127
Lampiran
RANCANGAN STUDI EPIDEMIOLOGI1
Dikenal berbagai rancangan studi pada penelitian Epidemiologi yang
dimaksudkan untuk mempelajari hubungan antara pajanan dengan kejadian
penyakit, sesuai dengan cara pengumpulan data yang akan dan dapat dijalani
serta jenis data yang akan dikumpulkan. Di sini hanya akan diperlihatkan
tiga rancangan studi dasar yang lazim digunakan pada penelitian
observasional dalam Epidemiologi Lapangan, yaitu rancangan studi
potong-lintang (cross-sectional), rancangan studi kohort, dan rancangan
studi kasus-kontrol.
Rancangan Studi Cross-Sectional
Pada rancangan studi cross-sectional (potong-lintang), subjek yang
dipelajari berasal dari satu kelompok. Dengan pengamatan pada satu titik
waktu, subjek yang diamati dipisahkan menjadi empat subkelompok; sakit
dan terpajan, sakit dan tidak terpajan, tidak sakit dan terpajan, serta tidak
sakit dan tidak terpajan (gambar II.1). Paparan hasil studi cross-sectional
secara skematis diperlihatkan pada tabel II.1.
Tabel II.1 Paparan umum hasil studi cross-sectional
C C
E a b a + b
E c d c + d
a + c b + d n
1 Epidemilogi Kebidanan, Harlan J, Penerbit Gunadarma, 2008
Gambar II.1 Rancangan studi cross
N : populasi target
C : kasus prevalen
C : non-kasus atau survivor
E : subjek terpajan
E : subjek tak-terpajan
Populasi (
kelompok, terpajan (
Sampling (acak) probabilitas
Rancangan Studi Kohort
Subjek yang dipelajari berasal dari
terpajan dan tidak terpajan. Kedua
pengamatan yang telah ditentukan, dan pada akhir periode pengamatan
dihitung jumlah kejadian penyakit pada masing
II.2). Paparan hasil studi kohort secara skematis diperlihatkan pada tabel
128
Gambar II.1 Rancangan studi cross-sectional
(N) diklasifikasikan menjadi dua
kelompok, terpajan ( E ) dan tak-terpajan ( E )
(acak) probabilitas
Subjek yang dipelajari berasal dari dua kelompok, yaitu kelompok
. Kedua kelompok diamati selama periode
pengamatan yang telah ditentukan, dan pada akhir periode pengamatan
dihitung jumlah kejadian penyakit pada masing-masing kelompok (diagram
.2). Paparan hasil studi kohort secara skematis diperlihatkan pada tabel II.2.
Tabel II.2 Paparan umum hasil studi kohort
D
E a
E c
a + c
Gambar II.2 Rancangan studi cross
D : kasus insidens atau kematian
D : non-kasus atau survivor
Non-kasus diikuti untuk pendeteksian penyakit
atau kematian
Rancangan Studi Kasus-Kontrol
Subjek yang dipelajari juga berasal dari
kelompok penderita penyakit (kasus
penyakit yang dipelajari (kontrol
penggalian data pajanan yang ada di masa lalu, baik dengan
wawancara maupun pemeriksaan rekam
frekuensi pajanan pada masing-masing kelompok (
129
Paparan umum hasil studi kohort
D
b a + b
d c + d
b + d n
Rancangan studi cross-sectional
kasus insidens atau kematian
kasus diikuti untuk pendeteksian penyakit
atau kematian ( D )
Kontrol
Subjek yang dipelajari juga berasal dari dua kelompok, yaitu
kasus) dan kelompok yang tidak menderita
kontrol). Pada kedua kelompok dilakukan
penggalian data pajanan yang ada di masa lalu, baik dengan teknik
wawancara maupun pemeriksaan rekam-medis, sehingga dapat dihitung
masing kelompok (gambar II.3).
Tabel II.3. Paparan umum hasil studi kasus
Kasus
E a
E c
a + c
Gambar II.3 Rancangan studi kasus kontrol
aN : populasi kasus
bN : populasi kontrol
Contoh IV.1 (studi kohort):
Misalkan hendak dipelajari pengaruh kegiatan fisik dalam mencegah
terjadinya penyakit influenza. Diambil sampel 100 orang dengan kegiatan
fisik aktif dan 100 orang dengan kegiatan fisik tidak aktif, lalu seluruhnya
diamati selama periode wabah influenza. Empat orang dari kelompok
kegiatan fisik aktif dan 2 orang dari kelompok kegiatan fisik tidak aktif
mengundurkan diri selama proses pengamatan. Dari sisa anggota sampel
diperoleh hasil sebagai berikut:
130
. Paparan umum hasil studi kasus-kontrol
Non-kasus
b a + b
d c + d
b + d n
Rancangan studi kasus kontrol
pengaruh kegiatan fisik dalam mencegah
terjadinya penyakit influenza. Diambil sampel 100 orang dengan kegiatan
fisik aktif dan 100 orang dengan kegiatan fisik tidak aktif, lalu seluruhnya
diamati selama periode wabah influenza. Empat orang dari kelompok
giatan fisik aktif dan 2 orang dari kelompok kegiatan fisik tidak aktif
mengundurkan diri selama proses pengamatan. Dari sisa anggota sampel
131
Tabel II.4 Hasil studi kohort hubungan kegiatan fisik dengan kejadian
penyakit influenza
Kegiatan
fisik
Penyakit influenza Jumlah
Sakit Tidak sakit
Aktif 42 54 96
Tidak aktif 72 26 98
Jumlah 114 80 194
Incidence risk penyakit influenza pada kelompok dengan kegiatan
fisik aktif (kelompok terpajan) adalah:
1ˆCI =
42
96 ≈ 0.44
Incidence risk penyakit influenza pada kelompok dengan kegiatan
fisik tidak aktif (kelompok tidak terpajan) adalah:
2ˆCI =
72
98 ≈ 0.73
Rasio antara keduanya dinamakan incidence risk ratio (cumulative
incidence ratio), dinyatakan dengan lambang CIR:
ˆCIR = 1
2
ˆ
ˆ
CI
CI =
0.44
0.73 ≈ 0.60
Pajanan merupakan faktor risiko jika CIR secara bermakna lebih
besar daripada satu dan merupakan faktor preventif jika CIR secara
bermakna lebih kecil daripada satu.
Contoh II.2 (studi kasus-kontrol):
Untuk mempelajari kemungkinan hubungan antara kadar kolesterol
serum dengan kejadian penyakit jantung koroner (PJK), diambil sampel 100
orang penderita PJK dan 100 orang kontrolnya yang tidak menderita PJK,
lalu dicari data kolesterol serum terdahulunya.
132
Tabel II.5 Hasil studi kasus-kontrol hubungan kadar kolesterol serum
dengan kejadian penyakit jantung koroner
Kadar kolesterol
serum
Status morbiditas Jumlah
Kasus PJK Kontrol
Tinggi 53 34 87
Normal 147 166 313
Jumlah 200 200 400
Di sini ukuran incidence risk untuk masing-masing kelompok
terpajan dan kelompok tidak terpajan tak dapat dihitung, karena kelompok-
kelompok tersebut tidak ada. Yang dapat dihitung di sini adalah ukuran odds
ratio (rasio imbangan), yang dinyatakan dengan lambang OR:
OR = ( )( )
( ) ( )
53 166
147 34 ≈ 1.76
Untuk penyakit yang jarang (rare disease), yaitu penyakit dengan
prevalensi sangat rendah, odds ratio merupakan ukuran aproksimasi
(pendekatan) bagi incidence risk ratio.
Contoh II.3 (studi cross-sectional):
Data hipotetis berikut merupakan contoh data potong-lintang cross-
sectional) yang memperlihatkan pengkajian hubungan antara kebiasaan
merokok dengan kasus bronkitis kronis, yaitu data yang dikumpulkan pada
500 orang pria berusia 60 tahun atau lebih.
Tabel II.6 Hasil studi cross-sectional hubungan kebiasaan merokok
dengan kasus bronkitis kronis
Kebiasaan merokok Bronkhitis kronis
Jumlah Ada Tidak ada
Ya 40 80 120
Tidak 60 320 380
Jumlah 100 400 500
133
Ukuran yang dapat dihitung dari rancangan studi cross-sectional ini
antara lain adalah prevalensi penyakit bronkitis kronis:
ˆPrev = 100
500 = 0.20
Prevalensi pada kelompok terpajan, prevalensi pada kelompok tidak
terpajan, demikian pula rasio prevalensi dapat dihitung, walaupun demikian
ukuran-ukuran ini tidak lazim ditampilkan. Ukuran asosiasi yang dihitung
umumnya, seperti halnya pada rancangan studi kasus-kontrol, adalah rasio
imbangan (odds ratio):
OR = ( )( )
( ) ( )
40 320
60 80 ≈ 2.67
Dari penulis yang sama:
- Ilmu Penyakit Umum
- Biopsikologi
- Psikologi Faal
- Epidemiologi Kebidanan
- Biostatistika Dasar
- Metode Penelitian Kesehatan
- Informatika Kesehatan
- Akupunktur Kebidanan
- Metode Statistika 1
- Metode Statistika 2
- Pengenalan Stata
- Data Kosong dan Imputasi Ganda
- Perhitungan Ukuran Sampel, Power dan Ukuran Efek
- Analisis Variansi
- Analisis Regresi Linear
- Analisis Regresi Logistik
- Structural Equation Modeling I: Analisis Jalur
- Structural Equation Modeling II: Analisis Faktor Konfirmatorik
- Structural Equation Modeling III: Model Regresi Struktural &
Generalized Structural Equation Modeling
- Analisis Data Survei
- Analisis Data Longitudinal
- Analisis Multilevel
- Analisis Survival