dasar pemilihan uji statistik - website staff...
TRANSCRIPT
01/27/10 1
DASAR PEMILIHAN UJI STATISTIK
Saptawati Bardosono
01/27/10 2
PENDAHULUAN
Pada setiap penelitian biasanya data dikumpulkan untuk sejumlah besar variabel, sehingga dapat menyulitkan pemilihan uji statistik yang sesuai dan urutan penggunaannya
Pemilihan uji statistik perlu direncanakan sejak awal penelitian, sehingga analisis data dapat memaksimalkan kualitas dan interpretasi dari temuan
Pemilihan uji statistik berdasar kepada jenis rancangan penelitian yang ingin dianalisis
01/27/10 3
PENDAHULUAN
Manfaat dari perencanaan analisis:
١) Pedoman untuk menganalisis data
٢) Membantu pada saat interpretasi dan melaporkan hasil penelitian
٣) Menghasilkan analisis yang dapat menjawab pertanyaan penelitian secara jelas dan jujur
01/27/10 4
PERENCANAAN ANALISIS UNTUK STUDI RCT
Sesuai dengan rincian pertanyaan penelitian
Perencanaannya meliputi:
١) Definisi operasional dari outcome primer dan/atau sekunder
٢) Metoda statistik yang akan digunakan
٣) Pedoman untuk penyesuaian data dasar variabel
٤) Bila perlu, analisis sub-kelompok
01/27/10 5
PERENCANAAN ANALISIS UNTUK STUDI OBSERVASIONALSeringkali tidak memungkinkan untuk menyusun
perencanaan lengkap secara spesifik, namun minimal berdasar pada hipotesis2 nya
Perencanaannya meliputi:١) Definisi operasional dari variabel outcome dan
exposure٢) Variabel pengganggu dari hubungan antara
outcome-exposure٣) Bila perlu, analisis dari effect modifier
01/27/10 6
DATA CHECKING & EDITING
Harus dilakukan sebelum melakukan analisis dataTahap 1 dengan memeriksa distribusi dari masing2
variabel:١) Untuk data kategorik, pastikan data sesuai
dengan kategori yang ada dan frekuensi dari masing2 kategori masuk akal
٢) Untuk data numerik, lakukan range check (histogram) untuk mendapatkan data yang ekstrim
01/27/10 7
DATA CHECKING & EDITING
Tahap 2 dengan melakukan consistency check untuk memeriksa konsistensi kaitan antara 2 atau lebih variabel:
١) Dengan cross-classification, contoh antara seks dan paritas;
٢) Dengan scatter plots, contoh antara BB dengan umur atau BB dengan TB
01/27/10 8
DATA CHECKING & EDITING
Tindakan yang harus dilakukan:
١) Kesalahan harus diperbaiki dengan merujuk ke data aslinya (kuesioner) atau diisi sebagai missing value
٢) Bila datanya ekstrim tapi masih mungkin terjadi, maka tidak perlu diganti
Lakukan checking untuk masing2 kelompok perlakuan
01/27/10 9
ANALISIS AWAL
Distribusi dari masing2 variabel untuk: Checking ulang bahwa kesalahan telah
diperbaiki Lebih mengenal karakteristik dari
populasi yang diteliti
Lakukan analisis awal untuk masing2 kelompok perlakuan
01/27/10 10
SPESIFIKASI VARIABEL UNTUK ANALISIS
Variabel2 dapat berperan lebih dari 1 dalam analisisPerlu dilakukan identifikasi: Variabel yang sudah diketahui sebagai
pengganggu hubungan antara outcome-exposure Variabel lain yang mungkin menjadi
pengganggu nantinya Variabel lain yang akan menjadi effect modifier
(yang dapat mengubah ukuran ataupun arah dari hubungan outcome-exposure
01/27/10 11
REDUKSI DATA
Sebelum melakukan analisis data secara formal, terkadang diperlukan untuk membuat variabel baru dengan mengelompokkan beberapa variabel asli
Untuk variabel exposure kategorik, pengelompokkan diperlukan bila kategorinya banyak, contoh: jenis pekerjaan
01/27/10 12
REDUKSI DATA
2) Untuk variabel exposure numerik, pengelompokkan diperlukan untuk:
Menggunakan metoda berdasarkan stratifikasi Menggunakan metoda grafik untuk memeriksa
bagaimana outcome yang non-numerik berubah pada setiap tingkatan exposure
Memeriksa adanya hubungan liniar antara variabel exposure numerik dengan outcome non-numerik
01/27/10 13
REDUKSI DATA
Untuk variabel exposure numerik, pengelompokkan dapat dilakukan dengan:
Misalnya quintiles, untuk pengelompokkan menjadi 5
Cut-off points berdasarkan data dari penelitian terdahulu atau standar normal
01/27/10 14
ANALISIS UNI-VARIABEL
Dilakukan crude association antara exposure dan outcome, yaitu memeriksa hubungan antara outcome dengan masing2 exposure tanpa menghiraukan variabel2 lain dengan manfaat:
Memeriksa tabel atau grafik sederhana serta hubungan yang merupakan informasi mengenai masing2 data
Dapat memberikan pemikiran awal mengenai masing2 variabel tsb yang mempunyai hubungan kuat dengan outcome
Merupakan indikator penting pada saat dilakukan analisis untuk mengontrol variabel pengganggu
01/27/10 15
ANALISIS VARIABEL PENGGANGGU
Untuk studi observasional mengontrol efek variabel pengganggu merupakan fokus utama analisis dengan:
Metoda Mantel-Haenszel berdasarkan stratifikasi
Modeling regresi
01/27/10 16
ANALISIS VARIABEL PENGGANGGU
Strategi memilih variabel pengganggu: Membuat kerangka konsep untuk hubungan antara berbagai variabel
dengan variabel outcome sebagai gambaran dari teori yang ada dan arah dari hubungan
Variabel yang sejak awal telah diketahui sebagai pengganggu harus dikontrol dalam analisis
Variabel pengganggu lainnya dapat ditemukan sebagai hasil analisis eksplorasi:a) variabel yang berhubungan dengan outcome dan exposure namun bukan sebagai penyebab antara keduanyab) berdasarkan data yang dianalisis dan pengetahuan yang ada serta setelah memperhatikan arah dari hubungannya
4) Semua variabel yang berhubungan dengan outcome diikutkan dalam regresi liniar ganda (cara stepwise), kecuali yang mempunyai hubungan sebagai penyebab
01/27/10 17
ANALISIS UNTUK INTERAKSI
Ada tiga interaksi yang harus dibedakan: Interaksi antara variabel pengganggu Interaksi antara variabel pengganggu
dengan variabel exposure yang diteliti Interaksi antara exposure2 yang diteliti
01/27/10 18
ANALISIS YANG REPRODUKTIF
1. Masukkan file data mentah ke program statistik, buat label untuk setiap variabel supaya mudah diidentifikasi, check apakah data sesuai dengan nilainya, check konsistensi antar variabel, buat variabel baru dengan recoding atau penggabungan variabel2 kemudian simpan data dalam file baru
01/27/10 19
ANALISIS YANG REPRODUKTIF
2. Gunakan data dalam file baru untuk memeriksa hubungan antara variabel outcome dengan variabel2 exposure dan variabel pengganggu yang diteliti dengan menggunakan tabel, grafik serta melakukan analisis univariabel
01/27/10 20
ANALISIS YANG REPRODUKTIF
3. Gunakan uji Mantel-Haenszel dan analisis regresi untuk mengetahui efek variabel exposure yang dikontrol oleh variabel pengganggu potensial
4. Periksa interaksi antara variabel outcome, exposure dan pengganggu
5. Buat tabel final untuk laporan penelitian
01/27/10 21
PERMASALAHAN PADA ANALISIS DAN INTERPRETASI DATA
١. Multiple comparisons, menghubungkan semua variabel yang ada di luar hipotesis = data dredging akan mengakibatkan pelaporan hasil yang tidak benar/palsu
٢. Subgroup analysis, kadang sangat menggoda untuk mengembangkan hasil yang menarik bila hipotesis tak terbukti
٣. Data-driven comparisons, sebaiknya tidak melakukan pengelompokkan pada variabel exposure untuk menghasilkan hubungan yang lebih bermakna dengan variabel outcome
01/27/10 22
APA ITU STATISTIK
Statistik merupakan kegiatan untuk: Mengumpulkan data Meringkas/menyajikan data Menganalisis data dengan metoda tertentu Menginterpretasi hasil analisis tersebut.
Ilmu statistik berguna untuk membantu dalam pengambilan keputusan atas masalah tertentu.
01/27/10 23
MANFAAT STATISTIK
Memperkirakan rata2 Mengetahui hubungan antar variabel2 Mengetahui dampak suatu intervensi Dsb
01/27/10 24
JENIS STATISTIK
Statistik deskriptif:Berkaitan dengan
bagaimana data dikumpulkan dan diringkas
Statistik inferensi:Berkaitan dengan
analisis data dan interpretasi hasil analisis tersebut
01/27/10 25
JENIS DATA
Data kualitatif:Data yang dinyatakan dalam
bentuk bukan angkaContoh: jenis pekerjaan,
status perkawinan, gender, kepuasan, dll
Harus dikuantifikasikan dengan skor atau ranking
Data kuantitatif:Data yang dinyatakan dalam
bentuk angkaContoh: usia, tinggi,
penghasilan
01/27/10 26
JENIS DATA
Data berskala nominal: data yang diperoleh dengan cara kategorisasi atau klasifikasi
Contoh: jenis pekerjaan, pegawai negeri, diberi tanda 1pegawai swasta, diberi tanda 2wiraswasta, diberi tanda 3
Cirinya: posisi setara dan tidak bisa dilakukan operasi matematika
01/27/10 27
JENIS DATAData berskala ordinal: data yang diperoleh dengan
cara kategorisasi atau klasifikasi, tetapi di antara data tsb terdapat hubungan
Contoh: kepuasan pelayanan, sangat puas, diberi tanda 1puas, diberi tanda 2cukup puas, diberi tanda 3tidak puas, diberi tanda 4sangat tidak puas, diberi tanda 5
Cirinya: posisi tidak setara dan tidak bisa dilakukan operasi matematika
01/27/10 28
JENIS DATAData berskala interval: data yang diperoleh dengan
cara pengukuran, di mana jarak dua titik pada skala sudah diketahui
Contoh: temperatur ruangan untuk air membeku dan mendidihCelcius pada 0 sampai 100, jarak 100Fahrenheit pada 32 sampai 212, jarak 180
Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika
01/27/10 29
JENIS DATAData berskala rasio: data yang diperoleh
dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui, dan mempunyai titik 0 yang absolut
Contoh: jumlah buku di perpustakaanjika 5, berarti ada 5 buku, jika 0, berarti tidak ada buku sama sekali
Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika
01/27/10 30
JENIS DATA VERSUS UJI STATISTIK
Jenis data akan mempengaruhi pemilihan prosedur statistik yang akan digunakan:
Data kuantitatif akan menggunakan prosedur statistik parametrik;
Data kualitatif cenderung mengarah pada statistik non-parametrik
01/27/10 31
Pengolahan Data Statistik
Statistik parametrik, berhubungan dengan inferensi statistik yang membahas parameter2 populasi, seperti rata2, proporsi, dll.
Cirinya: jenis data interval atau rasio, serta distribusi data (populasi) adalah normal atau mendekati normal
01/27/10 32
Pengolahan Data Statistik
Statistik non-parametrik, berhubungan dengan inferensi statistik yang tidak membahas parameter2 populasi
Cirinya: jenis data nominal atau ordinal, serta distribusi data (populasi) tidak diketahui atau bisa disebut tidak normal
01/27/10 33
Pengolahan Data Statistik
Analisis univariat, di mana hanya ada satu pengukuran (variabel) untuk n sampel(Alat analisis: uji t, uji F< ANOVA dsb)
Analisis multivariat, di mana ada dua atau lebih pengukuran untuk n sampel(Alat analisis: regresi, korelasi dsb)
01/27/10 34
Pemilihan uji statistik
Jumlah variabel
Analisis univariat Analisis multivariat
Jenis data
Interval, rasio Nominal, ordinal
Statistik Parametrik Statistik Non-Parametrik
01/27/10 35
Pengolahan data kuantitatif
Data interval/rasio
Ukuran Variasi Bentuk
Mean
Median
Modus
Range
Varians
Standar deviasi
Koefisien variasi
Skweness
Kurtosis
01/27/10 36
Menguji normal tidaknya distribusi data
BoxplotStem and LeafKolmogorov-SmirnovPlotKurtosis dan skewness
01/27/10 37
Boxplot: jika MEDIAN terletak persis di tengah boxplot, maka distribusi data adalah normal
Nilai di atas garis adalah outlier atau nilai ekstrem
Persentile (25) disebut HINGES
Persentile (50) atau MEDIAN
Persentile (75) disebut HINGES
Nilai di bawah garis ini adalah outlier atau nilai ekstrem
01/27/10 38
Stem and leaf
Frequency Stem Leaf
1,00 4 0
2,00 5 00
3,00 6 000
1,00 7 0
1,00 Extremes ≥ 10,0)
01/27/10 39
Kolmogorov-Smirnov dan Shapiro Wilk, bila nilai signifikansi < 0,05 maka distribusi adalah tidak normal
Kolmogorov-smirnov Shapiro-Wilk
Usia Statistik Df Sig. Statistik Df Sig
Belum menikah
0,176 35 0,008 0,926 35 0,033
Menikah 0,215 40 0,000 0,907 40 0,019
01/27/10 40
Plot
Normal Q-Q plot Detrended Normal Q-Q plot
Data akan tersebar di sekeliling garis
Sebagian besar data terpola dekat garis tengah yang ada
01/27/10 41
Kurtosis dan skewness
Jika rasio kurtosis (keruncingan) dan skewness (kemiringan) berada di antara –2 sampai dengan +2, maka distribusi data adalah normal
Rasio kurtosis = nilai kurtosis /SE kurtosisRasio skewness = nilai skewness / SE
skewness
01/27/10 42
Penyebaran Data
Distribusi data normal: mean dan standar deviasi
Distribusi data tidak normal: median atau mode
Persentil biasanya 10, 25, 50, 75, 90Distribusi data: skewness (kemiringan) dan
kurtosis (keruncingan)Deskripsi data: rata2, SD, varians, range
01/27/10 43
Analisis statistik (inferensi)
Digunakan untuk estimasi nilai suatu parameter populasi dan uji hipotesis statistik (Ho/Hi, signifikansi, uji satu/dua sisi, statistik tabel/uji)
01/27/10 44
Bagan statistik inferensi
Statistik Parametrik
Uji ZUji t
Satu populasi
Uji ZUji t
ANOVA/Uji F
Bebas
Uji t berpasangan
Berhubungan
Hubunganantar sample
Dua populasiatau lebih
Jumlah sampel