b4 normlitas dan uji t
DESCRIPTION
.TRANSCRIPT
UJI NORMALITAS DATA DAN UJI T/UJI Z
Biostatistik IV
METODE MELIHAT NORMALITAS DISTRIBUSI DATA
METODE U/MENGETAHUI SUTATU SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Parameter Kriteria normal Misalnya
Hsl.observasi
Kesimp.sebaran data
KV <30% 14,5 % Normal
Rasio skewness
-2 s/d.2 4,04 Tdk normal
Rasio kurtosis -2 s/d.2 1,12 Normal
Histogram Simetris,tdk miring kiri maupun kanan, tdk terlalu tinggi/rendah
Sedikit miring ke kiri
Tidak normal
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Parameter Kriteria normal Misal:Hsl.observasi
Kesimp.sebaran data
Box plot Simetris, median tepat ditengah, tdk ada outlIer atau nilai ekstrem
Sdkt.tdk simetris, ada outlier
Tidak normal
Normal Q-Q plots
Data menyebar sekitar garis
Terdpt data yg tdk berada disekitar garis
Tdk normal
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Parameter Kriteria normal Misal:Hsl.observasi
Kesimp.sebaran data
Detrended Q-Q plots
Data menyebar sekitar garis pada nilai 0
Banyak data yg tdk berada disekitar garis
Tidak normal
Kolmogorov- Smirnov test
Atau
Saphiro Wilk (sampel kecil)
p value >0,05 P=0,0005 Tdk normal
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Descriptives
39.304 .3295
38.656
39.953
39.144
37.500
32.456
5.6970
25.0
60.0
35.0
7.5
.542 .141
.698 .281
Mean
Lower Bound
Upper Bound
95% ConfidenceInterval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
UmurStatistic Std. Error
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Umur60.050.040.030.0
Fre
qu
en
cy
80
60
40
20
0
Histogram
Mean =39.3Std. Dev. =5.697
N =299
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Observed Value6050403020
Ex
pe
cte
d N
orm
al
3
2
1
0
-1
-2
-3
Normal Q-Q Plot of Umur
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Observed Value6050403020
De
v f
ro
m N
orm
al
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
Detrended Normal Q-Q Plot of Umur
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Umur
60.0
50.0
40.0
30.0
20.0
299
297298
295
296
METODE U/MENGETAHUI ST SET DATA MEMILIKI SEBARAN NORMAL/TIDAK
Umur
60.0
50.0
40.0
30.0
20.0
299
297298
295
296
HspreadPersentil 25
Persentil 50
Persentil 75
Data 1,5 hspreadDisebut:Whisker
Nilai >1,5 hspread dinamakan:outlier (diberi tanda 0)Nilai . 3 hspread dinamakan data ekstrim (diberi tanda *)
Nilai diatas garis:Outlier atau ekstrim
Nilai dibawah garis::Outlier atau ekstrim
Uji normalitas data
• Bila sampel besar gunakan Uji Kolmogorov –Smirnov
• Bila sampel kecil gunakan Uji Saphiro Wilk• Keputusan:
– Bila p > α (misalnya 0,05): Ho diterima – Kesimpulan: Data Distribusi normal– Bila p>α, berati Ho ditolak– Kesimpulan: Data Distribusi tidak normal
UJI t/UJI Z
Tabel Uji Hipotesis
Jenis Uji Hipotesis
Skala Pengukuran
Variabel
Komparatif/Asosiatif
Korelatif2 Kelompok > 2 Kelompok
BerpasanganTidak
BerpasanganBerpasangan
Tidak Berpasangan
Nominal McNemar**
Marginal**
Homogenity**
Chi Square**
Fisher**
Kolmogorov-Smirnov**
Cochran** Chi Square**
Fisher**
Kolmogorov-Smirnov**
Coefisien Kontingensi **
Lamda**
Ordinal McNemar**
Marginal**
Homogenity**
Chi Square**
Fisher**
Kolmogorov-Smirnov**
Cochran** Chi Square**
Fisher**
Kolmogorov-Smirnov**
Somers’d **
Gamma**
Wilcoxon Mann-Whitney Friedman Kruskal-Wallis Spearman
Numerik (Interval & Ratio)
Uji t Berpasangan *
Uji t tidak berpasangan *
Anova * Anova * Pearson*
Uji dengan tanda * merupakan uji parametrikTanda panah menunjukkan uji alternatif bila syarat uji parametrik tidak terpenuhiUji hipotesis untuk variabel ordinal sama dengan uji untuk variabel nominal bila dapat dibuat dalamBentuk tabel silang (tabel Baris kali Kolom)Tanda ** menunjukkan bahwa uji tsb dapat disajikan dalam bentuk tabel silang
PENDAHULUANSatu sampel:
• Dari 12 pasien yang sedang menjalani pengobatan hypertensi. Apakah dapat disimpulkan bahwa populasi mean systolic blood pressure adalah kurang dari 165
2 sampel: • Di bidang kesehatan seringkali kesimpulan yang dibuat
ingin melihat apakah parameter dua populasi berbeda ?• Misal: apakah ada perbedaan berat badan antara
sebelum dan sesudah mengikuti program diet. Atau…Apakah ada perbedaan tekanan darah antara kelompok perlakuan dengan kontrol?
Figure 7-11 Choosing between the Normal and Student t-Distributions when Testing a Claim about a Population Mean µ
Is n > 30?
Is thedistribution ofthe population essentiallynormal ? (Use ahistogram.)
No
Yes
Yes
No
No
Is known?
Use normal distribution with
x - µx
/ nZ
(If is unknown use s instead.)
Use nonparametric methods, which don’t require a normal distribution.
Use normal distribution with
x - µx
/ nZ
(This case is rare.)
Use the Student t distributionwith x - µx
s/ nt
Start
1) Hypothesis testing: a single population mean
• Tujuan : Untuk mengetahui/mrnguji mean populasi dari satu sampel.
• Syarat/asumsi yang harus dipenuhi:– Data berdistribusi normal– Variabel berbentuk numeric
• Variance popluasi tidak diketahui
ns
Xt
/0
2) Uji Beda Dua Mean Independen
• Tujuan : Untuk mengetahui perbedaan mean dua kelompok data independen.
• Dikatakan kedua kelompok data independen bila data kelompok yang satu tidak tergantung dari data kelompok kedua. Misalnya : Membandingkan mean berat bayi lahir dari ibu yang anemia dan tidak anemia.
Contoh:
Anemia Tidak Anemia
Mean BBBayi Mean BBBayi
IBU HAMIL
Contoh kasus• Researches collected serum amylase values from
a random sample of 15 apparently health subjects. Thery want to know whether the can conclude that the mean of the population from which the sample of serum amylase determination came is different from 120.
• This suggest a two sided hypothesis test.Langkah-langkah:1. Data mean and standard deviation computed
from the sample are 96 and 35 units/100ml, respectively.
Contoh kasus
2. Assumptions The 15 constitute a random from a population of determination that is normally distributed. The population variance is unknown.
3. Test Statistic: t test4. Distribution of Test statistic. Our test statistic is
distributed as t student’s with n-1 degree of freedom if Ho is true.
5. Decision Rule Let =0.05. Since we have two-sided test, we put /2=0.025 is each tail of the distribution of our test statistic (t value=2.145)
Contoh kasus6. Reject Ho, if the computed t is either greater
than or equal to 2.145 or less than or equal to -2.1457. Calculation fo test statistic
8. Statistical Decision Reject Ho since -2,65 falls in the rejection region.
9. Conclusion Our conclusion, based on these data is that the mean of the population mean from which came is is not 120.
65.204.9
24
15/35
12096
/0
ns
Xt
UJI BEDA DUA MEAN INDEPENDEN(t test independence)
Uji Beda Dua Mean Independen
Syarat/asumsi yang harus dipenuhi:• Data berdistribusi normal• Kedua kelompok data independent• Variabel yang dihubungkan berbentuk
numeric dan kategori (dengan hanya dua kelompok)
Uji Beda Dua Mean Independen
• Prinsip pengujian dua mean adalah melihat perbedaan variasi kedua kelompok data.
• Oleh karena itu perlu diketahui terlebih dahulu apakah varian kedua kelompok yang akan diuji sama atau tidak.
• Bentuk varian kedua kelompok data akan berpengaruh pada nilai standar error yang pada akhirnya akan membedakan rumus pengujiannya.
Uji Homogenitas Varian• Tujuan adalah untuk mengetahui apakah varian
antara kelompok data satu sama dengan kelompok data kedua.
• Perhitungannya dengan menggunakan uji F :• Varian lebih besar sbg PEMBILANG, varian lebih kecil
sbg PENYEBUT.
22
21
S
SF
df1 = n1-1 dan
df2 = n2-1
• Hipotesis yang diajukan adalah :• Ho : 1
2 = 22 (Varian kedua kelompok
sample sama)Ha : 1
2 ≠ 22 (Varian kedua kelompok
sample tidak sama)
• Keputusan statistic :• F hitung < F tabel maka Ho diterima• F hitung ≥ F tabel maka Ho ditolak
Uji-t untuk Varian Sama
• Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji t.
• Uji Z dapat digunakan bila standar deviasi (simpangan baku) populasi () diketahui dan jumlah sample besar (lebih dari 30).
• Pada umumnya nilai sulit diketahui, sehingga uji beda dua mean biasanya menggunakan Uji t.
Uji t untuk Varian sama
• RUMUS
21
21
/1/1 nnSt
p
xx
2
11
21
222
2112
nn
SnSnS p
df = (n1 + n2) -2
1-2 = Mean sample kelompok 1
dan 2
SP = Simpangan baku sample
gabungan
n1 & n2 = Jumlah sample
kelompok 1 dan 2
Uji t untuk Varian berbeda
RUMUS :
2221
21
222211
21
//
)/()/(2/1' nsns
tnstnst
1
22
2121
2
2
1
1
)()('
ns
ns
tXX
Critical value=
T test =
LATIHAN• Seorang peneliti mengukur kandungan nikotin pada
dua jenis rokok, kemudian diambil secara random 10 batang rokok Jarum dan 8 batang rokok Wismilak. Hasilnya didapat; rata-rata kadar nikotin rokok Jarum 23,1 mg dg. st. deviasi 1,5 mg. Pada rokok wismilak rata-rata kadar nikotin 20,0 mg dg st. deviasi 1,7 mg. Ujilah apakah ada perbedaan kandungan nikotin pd dua jenis rokok dengan alpha 5%?
Jawab : Langkah 1 mencari kesamaan varian (F)
• Diketahui :n1 = 10 rokok jarum
n2 = 8 rokok wismilak
s1 = 1,5
s2 = 1,7 (Pembilang)
X1 = 23,1
X2 = 20,0
28,125,2
89,2
5,1
7,12
2
21
22 s
sF
Dari nilai F = 1,28 dan nilai df1 dan df2, kemudian dilihat pada tabel F
df1 = n1 – 1 = 10-1 = 9 (Penyebut)
df2 = n2 – 1 = 8 – 1 = 7 (Pembilang)
Keputusan statistic :F- hitung ≥ F-tabel maka Ho ditolak danF-hitung < F-tabel maka Ho diterimaAtaup value < 0,05 maka Ho ditolakp value > 0,05 maka Ho diterima
Hipotesis yang diajukan adalah :
Ho : 12 = 2
2 (Varian kedua kelompok sample sama)
Ha : 12 ≠ 2
2 (Varian kedua kelompok sample tidak sama)
Tabel 4Nilai Kritis Distrubusi F Pada Tingkat S Persen Dengan = 0,05Derajat bebas pembilang, V1
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
Derajat bebas penyebut V
2
123456789
10111213141516171819202122232425304060120
16118.510.17.716.615.995.595.325.124.964.844.754.674.604.544.9
4.454.414.384.354.324.304.284.264.244.174.084.003.923.84
20019.09.556.915.795.144.744.484.264.103.983.893.813.743.683.633.593.553.523.493.473.443.423.403.393.323.233.153.073.00
21610.29.286.585.414.784.354.073.863.713.593.493.413.343.293.243.203.163.133.103.073.053.033.012.992.922.842.752.682.60
22519.29.126.395.194.534.123.843.633.483.363.263.183.113.063.012.962.932.902.872.842.822.802.782.762.692.612.532.452.37
23019.39.016.285.054.393.973.693.483.333.203.113.032.962.902.852.812.772.742.712.682.662.642.622.602.532.452.372.292.21
23419.38.946.184.954.283.873.583.373.223.093.003.922.852.792.742.702.662.632.602.572.552.532.512.492.422.342.252.182.10
23719.48.896.094.884.213.793.503.293.143.012.912.832.762.712.662.612.582.542.512.492.462.442.422.402.332.252.172.092.01
23919.48.856.044.824.153.733.443.233.072.952.852.772.702.642.592.552.512.482.452.422.402.372.362.342.272.182.102.021.94
24119.48.816.004.774.103.683.393.183.022.902.802.712.652.592.542.492.462.422.392.372.342.322.302.282.212.122.041.961.88
24219.48.795.964.744.083.643.353.142.982.852.752.672.602.542.492.452.412.382.352.322.302.272.252.242.162.031.991.911.83
24419.48.745.914.684.003.573.283.072.912.792.692.602.532.482.422.382.342.312.282.252.232.202.182.162.092.001.921.831.75
24619.48.705.884.623.943.513.223.012.852.722.622.532.462.402.352.312.272.232.202.182.152.132.112.032.011.921.841.751.67
24819.48.665.804.563.873.443.152.942.772.652.542.462.392.332.282.232.192.162.122.102.072.052.032.011.931.841.751.661.57
24919.58.645.774.533.843.413.122.902.742.612.512.422.352.292.242.192.152.112.082.052.032.011.981.961.891.791.701.611.52
25019.58.625.754.503.813.383.092.862.702.572.472.382.312.252.192.152.112.072.042.011.981.961.941.921.841.741.651.551.46
25119.58.595.724.463.773.343.042.832.682.532.432.342.272.202.152.102.062.031.991.961.941.911.891.871.791.691.591.501.39
25219.58.575.694.433.743.303.012.792.622.492.382.302.222.182.112.062.021.981.951.921.891.861.841.821.741.641.531.431.32
25319.58.555.654.403.703.272.972.752.582.452.342.252.182.112.062.011.971.931.901.871.841.811.791.771.681.581.471.351.22
25419.58.535.634.373.673.232.932.712.542.402.302.212.132.072.011.961.921.881.844.811.781.761.731.711.621.511.391.251.00
F tabel =3,29
Cara Probability
Area in Numerator Degrees of Freedom (df)
Upper Tail 1 2 3 4 5 6 7 8 12 24 ~
p value 1,28
9 0,100 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,38 2,28 2,16
0,050 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71
0,025 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 3,87 3,61 3,33
0,010 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31
0,005 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,23 5,73 5,19
0,001 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 9,57 8,72 7,81
F=1,28 terletak
Sebelum 2,51
Pada F = 2,51 p value = 0,100, berarti F = 2,81 p valuenya > 0,100
Dan lebih besar lagi dari 0,05.
Oleh karena p valuenya > 0,05 berarti Ho diterima.
Keputusan cara Klasik
• Kriteri pengambilan Keputusan :– Apabila F hitung ≥ F tabel maka Ho ditolak dan– Apabila Fhitung < Ftabel maka Ho diterima
• Diketahui :– F hitung = 1,28– F tabel = 3,291,28 < 3,29, maka kesimpulannya Ho diterima,
dengan demikian varian sama.
Langkah uji t pada variance sama
Seorang peneliti mengukur csecara random 10 batang rokok Jarum dan 8 batang rokok Wismilak. Hasilnya didapat; rata-rata kadar nikotin rokok Jarum 23,1 mg dg. st. deviasi 1,5 mg. Pada rokok wismilak rata-rata kadar nikotin 20,0 mg dg st. deviasi 1,7 mg. Ujilah apakah ada perbedaan kandungan nikotin pd dua jenis rokok dengan alpha 5%?i
Langkah-langkah:1. Evaluasi Data mean and standard deviation computed
from the sample are 23,1 dan 20,0mg respectively.
Contoh kasus
2. Assumptions kedua sampel a random from a population of determination that is normally distributed. The population variance equal.
3.
4. Test Statistic: t test5. Distribution of Test statistic. Our test statistic is
distributed as t student’s with n-1 degree of freedom if Ho is true.
6. Decision Rule Let =0.05. Since we have two-sided test, we put /2=0.025 is each tail of the distribution of our test statistic (df (10+8)-2=16 t tabel=2.120.
Ho = µ1 = µ2 (Mean kadar Nikotin Jarum = Mean kadar Nikotin Wismilak).
Ha = µ1≠ µ2 (Mean kadar Nikotin Jarum beda Mean kadar Nikotin Wismilak).
Langkah 2 : Perhitungan Uji t pada variance sama
21
21
/1/1 nnSt
p
xx
2
11
21
222
2112
nn
SnSnS p
59,153,2
53,216
48,40
16
23,2025,20
2810
7,1185,1110 222
s
S p
1,4
75,0
1,3
474,059,1
1,3
59,1
201,23
81
101
xt
7.Perhitungan
df 0,10 0,05 0,025 0,01 0,005 ........
16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898
18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
4,1
T = 4,1 terletak setelah 2,921, maka nilai p-nya berada setelah 0,005 berarti p < 0,005 p < 0,05.
Contoh kasus8. Statistical Decision Reject Ho since 4,1> 2,120
falls in the rejection region.9. Conclusion; Ada beda kadar nikotin antarjenis a kedua
rokok , p< 0,05
Kasus Suatu penelitian ingin mengetahui perbedaan kadar
folat sel darah pada dua zat pembius (anestesi) yang berbeda. Data yang berhasil dikumpulkan adalah sbb:
Kel 1: 243 251 275 291 347 354 380 392 Kel 2: 206 210 226 249 255 273 285 295 309 Coba buktikan apakah ada perbedaan kadar folat sel
darah merah pada kedua kelompok tersebut dg alpha 5%.
3) UJI BEDA DUA MEAN DEPENDEN
UJI-t PASANGAN(t paired test)
UJI BEDA DUA MEAN DEPENDEN
• Tujuan : Untuk menguji perbedaan mean antara dua kelompok data dependen.
• Syarat :a. Distribusi data normalb. Kedua kelompok data dependen/pairc. Jenis variabel : numerik dan kategorik
Anak Remaja Obese
Sebelum menjalankan
diet
Sesudah menjalankan
diet
BBBB
kategori
Numerik
t = d - µdsd
n
Test Statistic for Matched Pairs of Sample Data
where degrees of freedom = n - 1
Notation for Matched Pairs
sd = standard deviasi perbedaan d untuk data
sampel berpasangan
n = Besar sampel data berpasangan.
µd = Nilai mean dari perbedaan d untuk
populasi data berpasangan
d = Nilai mean perbedaan d untuk dataa sampel berpasangan
Dua belas individu berpartisipasi dalam sebuahstudi ekperimen untuk meneliti efektifitas diet tertentu, dikombinasi dengan suatu program olahraga/aktifitas tertentu, untuk mengurangi kadar serum cholesterol. Apakah dapat dismpulkan bahwa diet+OR dptMengurangi kadar kolesterol?Tabel 11.1 kadar serum cholesterol dari 12 subjek sebelum dan sesudah program.
CONTOH KASUS 1
Subyek Serum cholesterol
Sebelum (X1) Sesudah (X2)1
2
3
4
5
6
7
8
9
10
11
12
201
231
221
260
228
237
326
235
240
267
284
201
200
236 216
233
224
216
296
195
207
247
210
209
Tabel 11.1 Kadar serum cholesterol dari 2 subjek sebelum dan sesudah program.
Subyek Serum cholesterol Perbedaan
(Sesudah dan
sebelum) di
Sebelum (X1) Sesudah (X2)
1
2
3
4
5
6
7
8
9
10
11
12
201
231
221
260
228
237
326
235
240
267
284
201
200
236
216
233
224
216
296
195
207
247
210
209
-1
+5
-5
-27
-4
-21
-30
-40
-33
-20
-74
+8
1
25
25
729
16
441
900
1600
1089
400
5476
64
-242 10766
2id
2id
Prosedur uji statistik (Daniel, W)1. Data . Data terdiri kadar serum cholesterol 12 individu,
sebelum dan sesudah program diet- olahraga.2. Asumsi. Perbedaan yg diamati berasal dari sampel random
sederhana dari sebuah populasi distrubisui normal.3. Hipotesis, Hipotesis null dan alternatif sbb:
Ho:μd ≥ 0Ha: μd < 0
4. Uji statistik: Uji t pair5.Distribusi uji statistik. Jika Ho benar, uji statistik adalah
terdistribusi sebagai Student’s t dengan degree of freedom n-1. Titik kritis (t tabel) pada α=0,05, one tailed, df=(12-1=11) lihat pada tabel t adalah= -1,796
6. Kriteria pengambilan keputusan. Tolak Ho jika t hitung> t tabel atau t hitung < - t tabel.
7. Perhitungan uji statistik
n
dd i
17,2012
242
12
)8(.....................)5()5()1(
06,535)11(12
)242()10766(12
)1(
)(
1
)( 22222
nn
ddn
n
ddS iiid
2dd SS
02,368,6
017,20
12/06,535
017,20
t
8. Keputusan statistik. Tolak Ho sebab -3,02 berada didaerah penolakan (<-2,796)
9. Kesimpulan• Kita dapat menyimpulkan bahwa program
diet-olahraga adalah efektif mengurangi kadar kolesterol, p<0.05
LATIHAN 1Seorang peneliti ingin mengetahui pengaruh Fe terhadap kenaikan kadar Hb pada ibu hamil. Sejumlah 10 ibu hamil diberikan Fe selama 3 bulan dan diukur kadar Hb darah sebelum dan sesudahnya. Hasil pengukuran didapat :
• Sebelum: 12,2 11,3 14,7 11,4 11,5 12,7 11,2 12,1 13,3 10,8
• Sesudah: 13,0 13,4 16,0 13,6 14,0 13,8 13,5 13,8 15,5 13,2Pertanyaan: apakah kadar Hb lebih tinggi sesudah
pemberian Fe? Lakukan pada Confidence level 95%
Peneliti ingin mengetahui penurunan berat badan seseorang setelah melakukan diit selama dua minggu. Berat badan (kg) dari 11 wanita setelah menjalankan diit dicatat berat badannya sebelum dan sesudah periode 2 minggu, hasilnya sbb:
Sebelum: 64,0 62,7 56,7 63,6 68,2 59,4 58,5 60,3 61,7 69,0 68,5
Sesudah: 58,5 59,9 57,4 60,2 62,3 58,7 60,0 54,9 58,1 62,1 58,8
LATIHAN 2