analisis statistika (stk511)
TRANSCRIPT
Statistika
Pertemuan IIMetode Penyajian Data
Statistika Deskripsi dan Eksplorasi
• Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.
• Penyajian data dapat dilakukan melalui:– Tabel– Gambar (histogram, plot, stem-leaf, box-plot)
• Peringkasan data dinyatakan dalam dua ukuran yaitu:– Pemusatan (Median, Modus, Kuartil, Mean, dll)– Penyebaran (Range, Interquartile Range, Ragam)
3
4
5
6
Statistika Deskripsi dan Eksplorasi
• Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami.
Tabel
Tehnik Penyajian
Grafik
Ukuran Pemusatan : Rata-rata, median, dsb.
Peringkasan Data
Ukuran Penyebaran : Ragam (variance),
jangkauan (range)7
Tipe Data
8
Penyajian Data
9
• Tabel
Data Kualitatif
Data Kuantitatif
• Gambar/Grafik
Data Kualitatif
• Pie Chart
• Bar Chart
Data Kuantitatif
• Histogram
• Diagram Dahan Daun
• Diagram Kotak Garis
• Plot Garis
• Scatter Plot
• Survival Plot
Penyajian Data dengan Tabel
1
0
• Menyajikan statistik menurut group
sesuai keperluan penelitian
• Tampilan tabel jelas dan ringkas
Kunci dalam membuat Tabel
Tabel harus memberikan informasi yang dapat
dimengerti oleh pembaca
11
Penyajian Tabel
12
Data Kualitatif
Data yang digunakan (Data 1)
No Sex Tinggi Berat Agama
1 1 167 63 Islam
2 1 172 74 Islam
3 0 161 53 Kristen
4 0 157 47 Hindu
5 1 165 58 Islam
6 0 167 60 Islam
7 1 162 52 Budha
8 0 151 45 Katholik
9 0 158 54 Kristen
10 1 162 63 Islam
11 1 176 82 Islam
12 1 167 69 Islam
13 0 163 57 Kristen
14 0 158 60 Islam
15 1 164 58 Katholik
16 0 161 50 Islam
17 1 159 61 Kristen
18 1 163 65 Islam
19 1 165 62 Islam
20 0 169 59 Islam
21 1 173 70 Islam 12
Tabel Frekuensi
14
Agama Frekuensi Persen
Islam 13 61.90
Kristen 4 19.05
Katholik 2 9.52
Hindu 1 4.76
Budha 1 4.76
• Sajikan data kualitatif (kategorik) dalam bentuk
FREKUENSI
• Jika jumlah data mencukupi tampilkan pula percentase-
nya
Rekapitulasi menurut AgamaRekapitulasi menurut Sex
Sex
Frek
.
Perse
n
Laki-laki 12 57.14
Perempuan 9 42.86
Tabel Kontingensi
15
• Digunakan untuk melihat distribusi dari dua data kategorik
atau lebih
• Bisa dalam bentuk %baris, % kolom, % total, sesuai
dengan kebutuhan
Agama
Sex Budha Hindu Islam Katholik Kristen Total
Laki-laki 1 9 1 1 12
Perempuan 1 4 1 3 9
Total 1 1 13 2 4 21
Penyajian Tabel
16
Data Kuantitatif
Tabel Sebaran Frekuensi Kelompok
17
• Digunakan untuk membuat pengelompokkan data kuantitatif
• Isi tabel terdiri dari selang kelas, frekuensi masing-masing
kelas, frekuensi relatif masing-masing kelas
• Cara membuat tabel distribusi frekuensi kelompok
Tentukan jumlah kelas (Sturges' rule ): k =3.3 log (n)+1
Tentukan lebar kelas : l = (Xmax- Xmin)/k
Tentukan batas atas dan batas bawah dari masing-
masing kelas
Tentukan tepi batas kelas
List jumlah pengamatan pada masing-masing kelas
Frekuensi Relatif : cari proporsi dari masing-masing
kelas
Ilustrasi Data- Berat Badan
18
Data 2
58 57 50 56 44 59 43 52 55 49
43 43 49 55 58 48 46 42 44 48
40 40 42
Data 3
58 57 50 56 44 59 43 52 55 49
43 43 49 55 58 48 46 42 44 48
40 40 42 69 69 79 80 75 70 68
69 70 67 65 77 69 67 76 73 65
Ilustrasi Data 2
Jumlah kelas: k = 1+ 3.3 log (23) =5.49 6
Lebar kelas: l = (59-40)/6 = 3.16 4•
Selang
kelasTengah
Kelas
Tepi Batas
kelasTurus Frekuensi
Frekuensi
RelatifPresentase
38-41 39.5 37.5 - 41.5 || 2 0.09 8.70%
42-45 43.541.5 - 45.5 |||| || 7 0.30 30.43%
46-49 47.545.5 - 49.5 |||I 5 0.22 21.74%
50-53 51.5 49.5 - 53.5 || 2 0.09 8.70%
54-57 55.553.5 - 57.5 |||| 4 0.17 17.39%
58-61 59.5
57.5 - 61.5 ||| 3 0.13
138-
41
3.04%
Total23 1 100.00%
19
Tabel Ringkasan
20
• Sajikan RINGKASAN STATISTIK jika
memungkinkan. Ringkasan statistik yang
digunakan adalah jumlah data, rataan, median,
standar deviasi, minimum, dan maksimum.
Hindarkan pemberian banyak informasi dalam
kapasitas yang terbatas
Peubah Jenis Kelamin N Rataan StDev Minimum Median Maximum
Tinggi Perempuan 9 160.56 5.43 151 161 169
Laki-laki 12 166.25 5.07 159 165 176
Berat Perempuan 9 53.89 5.62 45 54 60
Laki-laki 12 64.75 8.04 52 63 82
Penyajian Data dengan Grafik
21
• Grafik mengungkapkan banyak informasi
dibandingkan dengan seribu kata-kata
• Grafik yang disajikan harus dapat dimengerti
oleh pembaca
• Jika pembaca mempertanyakan apa
maksudnya maka grafik yang disajikan “belum
baik”
• Gunakan “nalar” dalam membuat grafik.
22
Penyajian Data dengan Grafik
23
Data Kualitatif
Pie Chart (Diagram Kue)
• Digunakan untuk menampilkan data kategorik khususnya
data nominal
• Menunjukkan distribusi data dalam group (total 100%)
• Disajikan dalam bentuk %, terkadang perlu menyajikan pula
jumlah data
9; 43%
12; 57%
Laki-
laki
Perem
puan
1; 5% 1; 5%
2; 10%
4; 19%13; 61%
Isl
am
Kris
ten
Kat
holi
k
Hin
du
B
ud
ha24
Bar Chart (Diagram Batang)• Berguna untuk menampilkan data kategorik
• Dapat pula digunakan untuk menyajikan data dari tabel
kontingensi / tabel ringkasan data
12
10
8
6
4
2
0
Ju
mla
h
Laki-laki Perempuan
Jenis Kelamin
0.00
50.00
100.00
150.00
200.00
Ra
ta-r
ata
Tinggi Berat
Laki-laki
Perempua
n
8.3%
11.1%
75.0%
44.4% 11.1%
8.3% 8.3%
33.3%
0 % 1 0 % 2 0 % 3 0 % 4 0 % 5 0 % 6 0 % 7 0 % 8 0 % 9 0 % 100%
Laki-la
ki
Per
empuan
Budha Hindu Islam Katholik Kristen
24
Cara Membuat Pie Chart dan Bar Chart
26
• Lihat : Mendenhall (Example 1.3), hal. 12
Penyajian Data dengan Grafik
27
Data Kuantitatif
Histogram
28
Sebuah grafik dari suatu sebaran frekuensi
Bisa distribusi dari frekuensi-nya atau frekuensi relatif-nya
Digunakan untuk melihat distribusi dari data:
Melihat ukuran penyebaran dan ukuran pemusatan data
Melihat adanya data outlier (pencilan)
Mendeteksi ada bimodus/tidak
Teknik Menginterpretasikan Grafik
First, check the horizontal and vertical scales, so that you
are clear about what is being measured.
Examine the location of the data distribution. Where on
the horizontal axis is the center of the distribution? If you
are comparing two distributions, are they both centered in
the same place?
Examine the shape of the distribution. Does the
distribution have one “peak,” a point that is higher than any
other? If so, this is the most frequently occurring
measurement or category. Is there more than one peak?
Are there an approximately equal number of
measurements to the left and right of the peak?
Look for any unusual measurements or outliers. That is,
are any measurements much bigger or smaller than all of
the others? These outliers may not be representative of
the other values in the set. (Lihat: Mendenhal, hal. 22)28
Fre
qu
en
cy
42-6 -4 -2 0
40
30
20
10
0
42
20
15
10
5
0
data1
-2 0
data2
Histogram of data1, data2
-6 -4
Fre
qu
en
cy
0 1 2 3 4-2 -1
25
20
15
10
5
0
20
15
10
5
0
data1
0 1 2 3 4
data3
Histogram of data1, data3
-2 -1
Ukuran Pemusatan relatif sama namun
ukuran penyebaran relatif berbeda
Ukuran Pemusatan relatif berbeda
namun ukuran penyebaran relatif sama
?
Fre
qu
en
cy
5432
C14
10-1-2
30
25
20
15
10
5
0
Histogram ofC14
30
bimodus
outlier
Bentuk (shape) Grafik
31
A distribution is symmetric if the left
and right sides of the distribution, when
divided at the middle value, form mirror
images.
A distribution is skewed to the right
(menjulur ke kanan, right tail) if a
greater proportion of the
measurements lie to the right of the
peak value. Distributions that are
skewed right contain a few unusually
large measurements.
Bentuk (shape) Grafik
32
A distribution is skewed to the left
(menjulur ke kiri, left tail) if a greater
proportion of the measurements lie to the
left of the peak value. Distributions that are
skewed left contain a few unusually small
measurements.
A distribution is unimodal if it has one peak;
a bimodal distribution has two peaks.
Bimodal distributions often represent a
mixture of two different populations in the
data set. (Lihat: Mendenhal, hal. 22)
Histogram – Mengukur bentuk sebaran
FR
EQ
UE
NC
Y
Skewed to Right
FR
EQ
UE
NC
Y
Symmetric
FR
EQ
UE
NC
Y
WEIGHT WEIGHT WEIGHT
Skewed to Left
33
Interpretasi bentuk (shape) grafik
34
• Lihat : Mendenhall (Example 1.9), hal. 23
Kembali ke Ilustrasi—Data 2
• Berdasasarkan tabel sebaran frekuensi tersebut maka
tampilan histogramnya sebagai berikut:
Sebagain besar berusia kurang dari 50 tahun, sedangkan
frekuensi paling banyak berada pada usia 44 tahun.
Bentuk sebaran tidak simetrik, terdapat dua kelompok
usia (kurag dari 50 tahun dan lebih dari 50 tahun)
bimodus
Fre
qu
en
cy
605652484440
7
6
5
4
3
2
1
0
35
Variasi berbagai bentuk histogram dari Data 2
Fre
qu
en
cy
605652484440
7
6
5
4
3
2
1
0
Fre
qu
en
cy
6055504540
7
6
5
4
3
2
1
0
Bentuk histogram tidak
unik pemilihan
tergantung informasi
yang diperlukan
Fre
qu
en
cy
6055504540
7
6
5
4
3
2
1
0
36
Frekuensi Relatif Histogram vs Pemulusan
Pe
rce
nt
3.62.41.20.0-1.2-2.4-3.6
9
8
7
6
5
4
3
2
1
0
Pe
rce
nt
3.62.41.20.0-1.2-2.4-3.6
9
8
7
6
5
4
3
2
1
0
Histogram ofC1
C1
Pe
rce
nt
3.62.41.20.0-1.2-3.6 -2.4
9
8
7
6
5
4
3
2
1
0
Histogram ofC1
37
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Histogram ofC4
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Shape 4.886
Scale 3.073
N 10000
Histogram of C4Gamma
Pe
rce
nt
56484032241680
7
6
5
4
3
2
1
0
Shape 4.886
Scale 3.073
N 10000
Histogram of C4Gamma
38
Diagram Dahan Daun (Stem and Leaf)
39
• Sebuah diagram yang menampilkan distribusi dari
data kuantitatif yang sudah terurut dari terkecil dan
terbesar
• Sesuai dengan namanya diagram dahan daun
terdiri dari bagian dahan dan bagian daun. Bagian
daun selalu terdiri dari satu digit. Bagian dahan
terletak di sebelah kiri dan bersesuaian dengan
bagian daun (jika ada) di sebelah kanan
• Secara visual,diagram dahan daun hampir sama
dengan bar chart dimana kategori-kategorinya
didefinisikan dengan struktur desimal dari bilangan
yang ada
Cara Membuat Diagram Dahan Daun
Proses pembuatan diagram dahan daun dan
interpretasinya Lihat : Mendenhal (Example
1.8), hal. 21
40
Manfaat diagram dahan daun
• Melihat distribusi dari data
Melihat ukuran penyebaran dan ukuran
pemusatan data
Melihat adanya data outlier
Mendeteksi ada bimodus/tidakStem-and-leaf of Contoh1 N = 20
Leaf Unit = 1.0
1 2 5
4 3 579
7 4 138
(4) 5 0445
9 6 5569
5 7 36
3 8 12
1 9 3
pusat
Terlihat distribusi
dari data aslinya
40
Ilustrasi
Stem-and-leaf of Contoh1 N = 20
Leaf Unit = 1.0
1
4
7
9
5
3
1
2
3
4
(4) 5
6 7 8
9
5
579
138
0445
5569
36
12
3
Informasi satuan
dari daun
satuan
Bagian daun
Bagian dahan
Frekuensi kumulatif dari
jumlah daun pada
masing-masing dahan.
Dihitung dari atas dan
bawah sampai ketemu
di posisi median
Output MINITAB
41
Buatlah diagram dahan daun untuk data berikut ini:
43
Membuat diagram dahan daun
44
• Pisahkan bagian dahan dan daun. Untuk
contoh diatas misalkan dahan berupa puluhan
dan daunnya berupa satuan
• Bagian dahan urutkan dari terkecil sampai
terbesar
2
3
4
5
6
7
8
9
• Plot daun sesuai dengan dahan yang tersedia. Sebagai
langkah awal untuk memudahkan pekerjaan identifikasi
secara berurutan dari data yang ada
2 5
3 795
4 183
5 4405
6 5569
7 63
8 21
9 3
• Urutkan bagian daun dari terkecil
sampai yang terbesar
2 5
3 579
4 138
5 0445
6 5569
7 36
8 12
9 344
Stem-and-leaf of Contoh3
Leaf Unit = 1.0
46
N = 23
1 0 3
3 0 45
5 0 77
8 0 899
(4) 1 0011
11 1 223
8 1 4455
4 1 67
2 1 8
1 2
1 2
1 2
1 2 7
0 t 3
f 45
s 77
. 899
1 * 0011
t 223
f 4455
s 67
. 8
2 *
t
fs 7
Output MINITAB
Aturan banyaknya
dahan yang
digunakan :
antara 4-12 dahan
Sesuaikan dengan
informasi yang
diperoleh berkaitan
dengan bentuk
sebaran, ukuran
pemusatan dan
penyebaran data
47
Latihan untuk Responsi/Praktikum
48
• Mendenhall (Exercise : 1.18), hlm. 30
• Mendenhall (Exercise : 1.19), hlm. 30
• Mendenhall (Exercise : 1.37), hlm. 33