1-statistika deskriptif
TRANSCRIPT
5-1
1
Pertemuan 1
Pengantar dan Pengantar dan Statistik DeskriptifStatistik Deskriptif
Oleh: Djoni HartonoOleh: Djoni Hartono
5-2
2
Penggunaan Statistik Persentil dan Kuartil Ukuran Pemusatan Ukuran Persebaran Data Grup dan Histogram Skewness dan Kurtosis Metode Menampilkan Data
Pengantar dan Statistik DeskriptifPengantar dan Statistik Deskriptif11
5-3
3
Membedakan antara data kualitatif dan kuantitatif Mendeskripsikan ukuran skala nominal, ordinal, interval, dan
rasio Mendeskripsikan perbedaan antara populasi dan sampel Menghitung dan menginterpretasikan persentil dan kuartil Menjelaskan dan menghitung ukuran pemusatan Membuat berbagai jenis grafik berbeda dalam menjelaskan
data set
Tujuan Bab ini Tujuan Bab ini 11
Setelah belajar bab ini, diharapkan Anda dapat:Setelah belajar bab ini, diharapkan Anda dapat:
5-4
DEFINISI STATISTIKA
4
• Statistika Statistika adalah ilmu yang membantu dalam mengambil keputusan dalam bisnis dan ekonomi, termasuk pula di berbagai cabang ilmu yang lain
• Statistika Statistika mengajarkan bagaimana merangkum, menganalisis, dan menarik kesimpulan yang tepat dari data yang ada, yang kemudian meningkatkan kualitas keputusan
• Keputusan tersebut pada akhirnya sangat membantu dalam menjalankan sebuah departemen, perusahan, perekonomian, dll
5-5
5
1-1 Penggunaan Statistika
Statistik Inferensi Memprediksi dan
meramal nilai dari parameter populasi
Menguji hipotesis tentang nilai parameter polusai
Mengambil keputusan
Statistik Deskriptif Mengumpulkan data Mengorganisasikan data Merangkum data Menyajikan data Menganalisis data
5-6
6
Jenis Data
Kualitatif – Kategorik atau Nominal
Contoh: Warna Gender Kebangsaan
Kuantitatif – Dapat diukur atau dihitung:
Contoh: Suhu Gaji Nilai ujian
5-7
7
Skala Pengukuran• Skala nominal – grup or kelas
Gender
• Skala ordinal – urutan berpengaruh Ranking (10 video terbaik)
• Skala interval – selisih dan jarah berpengaruh – memiliki nilai nol “buatan” Suhu (0F, 0C)
• Skala rasio – rasio berpengaruh – memiliki nilai nol alami Gaji
5-8
Sampel dan Populasi
8
• PopulasiPopulasi terdiri dari seluruh ukuran yang diminati oleh investigator
• Sampel Sampel adalah bagian dari ukuran yang diambil dari populasi
• Sensus Sensus adalah perhitungan lengkap dari seluruh anggota dalam sebuah populasi
5-9
Sampel dan Populasi
9
Populasi (N)Populasi (N) Sampel (Sampel (nn))
5-10
Mengapa Diperlukan Sampel?
10
• Sensus Sensus dari sebuah populasi terkadang::• Tidak memungkinkan
• Tidak praktis
• Terlalu mahal
5-11
11
1-2 Persentil dan Kuartil
Dari sebuah kumpulan data observasi, urutkan berdasarkan besarnya
Persentil ke-P dari data yang telah diurutkan adalah nilai observasi dimana terdapat P% (P persen) observasi yang berada di bawah nilai yang bersangkutan
Posisi Persentil ke-P diberikan dengan (n + 1)P/100, dimana n adalah jumlah observasi
5-12
Contoh 1 – 2
12
Sebuah departemen store sedang mengumpulkan data tentang penjualan yang diperoleh 20 orang salesman-nya. Besarnya penjualan setiap salesman disajikan pada slide selanjutnya.
5-13
Contoh 1 – 2 (lanjutan)
13
Penjualan Penjualan yang
diurutkan 9 6 6 9 12 1010 1213 1315 1416 1414 1514 1616 1617 1616 1724 1721 1822 1818 1919 2018 2120 2217 24
5-14
Contoh 1 – 2 (lanjutan) Persentil
14
Cari persentil ke-50, 80, dan 90 dari data tersebut Untuk mencari persentil ke-50, tentukan terlebih
dahulu letak data poin-nya:
(n + 1)P/100 = (20 + 1)(50/100) = 10.5. Dapat disimpulkan bahwa persentil ke-50 berada
pada posisi ke-10.5 Obervasi ke-10 dan ke-11 adalah 16 Persentil ke-50 berada diantara nilai observasi ke-
10 dan ke-11, yaitu 16
5-15
Contoh 1 – 2 (lanjutan) Persentil
15
Untuk mencari persentil ke-80, tentukan terlebih dahulu letak data poin-nya:
(n + 1)P/100 = (20 + 1)(80/100) = 16.8 Dapat disimpulkan bahwa persentil ke-80 berada
pada posisi ke-16.8 Obervasi ke-16 dan ke-17 masing-masing adalah
19 dan 20 Persentil ke-80 berada pada posisi 0.8 antara nilai
observasi ke-16 dan ke-17, yaitu 19.8
5-16
Contoh 1 – 2 (lanjutan) Persentil
16
Untuk mencari persentil ke-90, tentukan terlebih dahulu letak data poin-nya:
(n + 1)P/100 = (20 + 1)(90/100) = 18.9 Dapat disimpulkan bahwa persentil ke-90 berada
pada posisi ke-18.9 Obervasi ke-18 dan ke-19 masing-masing adalah
21 dan 22 Persentil ke-90 berada pada posisi 0.9 antara nilai
observasi ke-18 dan ke-19, yaitu 21.9
5-17
Kuartil
17
Kuartil adalah nilai persentase yang membagi
data yang diurutkan ke dalam empat bagian Kuartil pertama adalah persentil ke-25, yakni
titik dimana di bawahnya terdapat ¼ data terbawah
Kuartil kedua adalah persentil ke-50, yakni titik dimana di bawahnya terdapat 1/2 data terbawah. Disebut juga dengan median
Kuartil ketiga adalah persentil ke-75, yakni titik dimana di bawahnya terdapat 3/4 data terbawah
5-18
Kuartil dan Jarak Interkuartil
18
Kuartil pertama, Q1, (persentil ke-25) sering disebut dengan kuartil bawah
Kuartil kedua, Q2, (persentil ke-50) sering disebut dengan kuartil tengah
Kuartil ketiga, Q3, (persentil ke-75) sering disebut dengan kuartil atas
Jarak interkuartil selisih antara kuartil pertama dan kuartil ketiga.
5-19
Contoh 1 – 3: Menentukan Kuartil
19
Penjualan Penjualan yang diurutkan
9 6 6 9 12 10 10 12 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 24 17 21 18 22 18 18 19 19 20 18 21 20 22 17 24
Kuartil pertama
Median
Kuartil ketiga
(n+1)P/100(n+1)P/100
(20+1)25/100=5.25
(20+1)50/100=10.5
(20+1)75/100=15.75
13 + (.25)(1) = 13.25
16 + (.5)(0) = 16
18+ (.75)(1) = 18.75
KuartilKuartil
Posisi
5-20
Parameter Populasi dan Statistik Sampel
20
Ukuran Pesebaran Jarak Jarak interkuartil Varian Deviasi Standar
Ukuran Pemusatan
Median Modus Rerata
Ukuran Lainnya: Skewness Kurtosis
5-21
1 – 3 Ukuran Pemusatan
21
Median nilai tengah dari data yang telah diurutkan persentil ke-50
Modus nilai yang paling sering keluar
Rerata Nilai rerata data
5-22
Contoh – Median
22
Median
MedianPersentil ke-50
(20+1)50/100=10.5 16 + (.5)(0) = 16
Median adalah nilai tengah dari data yang telah diurutkan. Dengan kata lain, persentil ke-50
Penjualan Penjualan yang diurutkan
9 6 6 9 12 10 10 12 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 24 17 21 18 22 18 18 19 19 20 18 21 20 22 17 24
5-23
Contoh – Modus
23
Modus = 16
Modus adalah nilai yang paling sering keluar. Dengan kata lain, modus adalah nilai dengan frekuensi tertinggi.
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
. . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
5-24
Rerata
24
Population Mean Sample Mean
x
Ni
N
1 xx
ni
n
1
Rerata dari set observasi adalah jumlah seluruh nilai observasi dibagi dengan jumlah observasi
5-25
Contoh – Rerata
25
Penjualan
9 6 12 10 13 15 16 14 14 16 17 16 24 21 22 18 19 18 20 17
317
xx
ni
n
1 31720
1585.
5-26
1 – 4 Ukuran Persebaran
26
Jarak Selisih antara nilai tertinggi dengan nilai terendah
Jarak Interkuartil Selisih antara nilai kuartil atas dengan kuartil bawah
(Q3 - Q1)
Varian Rerata* dari kuadrat selisih antara nilai observasi
dengan nilai reratanya Deviasi Standar
Akar dari varian
5-27
Contoh – Jarak dan Jarak Interkuartil
27
SortedSales Sales Rank
9 6 1 6 9 212 10 310 12 413 13 515 14 616 14 714 15 814 16 916 16 1017 16 1116 17 1224 17 1321 18 1422 18 1518 19 1619 20 1718 21 1820 22 1917 24 20
Kuartil pertama
Kuartil ketiga
Q1 = 13 + (.25)(1) = 13.25
Q3 = 18+ (.75)(1) = 18.75
Minimum Jarak: Maximum - Minimum = 24 - 6 = 18
Jarak Interkuartil:
Q3 - Q1 = 18.75 - 13.25 = 5.5
Maksimum
5-28
Varian dan Deviasi Standar
28
( )
2
2
1
2
1
2
2
1
( )x
N
xN
N
i
N
i
N xi
N
Varian Populasi
sx x
n
xx
nn
s s
i
n
i
ni
n
2
2
1
2
1
2
2
1
1
1
( )
Varian Sample
( )
5-29
Menghitung Varian Sampel
29
6 -9.85 97.0225 36 9 -6.85 46.9225 8110 -5.85 34.2225 10012 -3.85 14.8225 14413 -2.85 8.1225 16914 -1.85 3.4225 196 14 -1.85 3.4225 19615 -0.85 0.7225 22516 0.15 0.0225 25616 0.15 0.0225 25616 0.15 0.0225 25617 1.15 1.3225 28917 1.15 1.3225 28918 2.15 4.6225 32418 2.15 4.6225 32419 3.15 9.9225 36120 4.15 17.2225 40021 5.15 26.5225 44122 6.15 37.8225 48424 8.15 66.4225 576
317 0 378.5500 5403
x xx ( )x x 2
x 2
sx x
n
xx
nn
s s
i
n
i
ni
n
2
2
1
2
1
2
2
2
1
378 55
20 1
378 55
1919 923684
1
5403 31720
20 1
5403100489
2019
5403 5024 45
19
378 55
1919 923684
19 923684 4 46
1
( ) .
( )
..
. ..
. .
5-30
1 – 5 Data Berkelompok dan Histogram
30
Membagi data ke dalam kelompok, kelas, atau interval
Syarat kelompok adalah: Saling Lepas (Mutually exclusive)
Tidak ada overlapping – setiap observasi hanya masuk dalam satu kelompok
Exhaustive Seluruh observasi habis terkelompokkan
Ber-interval sama (jika memungkinkan) Kelompok pertama atau terakhir dapat bersifat open-
ended
5-31
Distribusi Frekuensi
31
Merupakan tabel dengan dua kolom yang berisi: Setiap dan masing-masing kelompok, kelas, atau nilai
interval Frekuensi masing-masing kelompok berisi
Jumlah frekuensi setiap kelompok Jumlah frekuensi adalah jumlah observasi
N untuk populasi n untuk sampel
Titik tengah kelas adalah nilai tengah kelompok atau kelas
Frekuensi relatif adalah persentase total observasi masing-masing kelas Jumlah frekuensi relatif = 1
5-32
Contoh 1 – 7: Distribusi Frekuensi
32
x f(x) f(x)/n Pengeluaran ($) Frekuensi (jumlah pelanggan) frekuensi relatif
0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070
184 1.000
x f(x) f(x)/n Pengeluaran ($) Frekuensi (jumlah pelanggan) frekuensi relatif
0 to less than 100 30 0.163100 to less than 200 38 0.207200 to less than 300 50 0.272300 to less than 400 31 0.168400 to less than 500 22 0.120500 to less than 600 13 0.070
184 1.000
• Contoh frekuensi relatif : 30/184 = 0.163 • Jumlah frekuensi relatif = 1
5-33
Distribusi Frekuensi Kumulatif
33
x F(x) F(x)/nPengeluaran ($) Frekuensi Kumulatif Frekuensi Relatif Kumulatif
0 to less than 100 30 0.163100 to less than 200 68 0.370200 to less than 300 118 0.641300 to less than 400 149 0.810400 to less than 500 171 0.929500 to less than 600 184 1.000
x F(x) F(x)/nPengeluaran ($) Frekuensi Kumulatif Frekuensi Relatif Kumulatif
0 to less than 100 30 0.163100 to less than 200 68 0.370200 to less than 300 118 0.641300 to less than 400 149 0.810400 to less than 500 171 0.929500 to less than 600 184 1.000
Frekuensi kumulatif dari setiap kelompok adalah jumlah frekuensi kelompok yang bersangkutan dan seluruh kelompok sebelumnya
Frekuensi kumulatif dari setiap kelompok adalah jumlah frekuensi kelompok yang bersangkutan dan seluruh kelompok sebelumnya
5-34
Histogram
34
Histogram adalah grafik batang yang memiliki tinggi yang berbeda-beda Lebar dan lokasi batang menunjukkan lebar dan lokasi
kelompok data Tinggi batang menunjukkan frekuensi atau frekuensi relatif dari
kelompok data
5-35
Contoh Histogram
35
Histogram Frekuensi
5-36
Contoh Histogram
36
Histogram Frekuensi Relatif
5-37
1 – 6 Skewness dan Kurtosis
37
Skewness Ukuran kesimetrisan dari sebuah distribusi frekuensi
Condong ke kiri Simetri atau tidak condong sama sekali Condong ke kanan
Kurtosis Ukuran kerataan (flatness) atau keruncingan (peakedness) dari
sebuah distribusi frekuensi Platykurtic (relatif rata) Mesokurtic (normal) Leptokurtic (relatif runcing)
5-38
Skewness
38
Condong ke kiri
5-39
Skewness
39
Simetri
5-40
Skewness
40
Condong ke kanan
5-41
Kurtosis
41
Platykurtic – distribusi rata
5-42
Kurtosis
42
Platykurtic – distribusi rata
5-43
Kurtosis
43
Mesokurtic – tidak terlalu rata dan curam
5-44
Kurtosis
44
Leptokurtic – distribusi curam
5-45
1 – 8 Metode Menampilkan Data
45
Grafik Pie Kategori mencerminkan persentase terhadap total
Grafik Batang Tinggi batang mencerminkan frekuensi kelompok
Polygon Frekuensi Tinggi garis mencerminkan frekuensi
Ogiv Tinggi garis mencerminkan frekuensi kumulatif
Time Plots Mencerminkan nilai terhadap waktu
5-46
Grafik Pie
46
33.0%
23.0%
19.0%
19.0%
6.0%
Category
Happy with career
Don't like my job but it is on my career pathJob is OK, but it is not on my career path
Enjoy job, but it is not on my career pathMy job just pays the bills
Figure 1-10: Twentysomethings split on job satisfication
My job just pays the bills
Happy with career
Enjoy job, but it is not on my career path
Job OK, but it is not on my career path
Do not like my job, but it is on my career path
33.0%
23.0%
19.0%
19.0%
6.0%
Category
Happy with career
Don't like my job but it is on my career pathJob is OK, but it is not on my career path
Enjoy job, but it is not on my career pathMy job just pays the bills
Figure 1-10: Twentysomethings split on job satisfication
My job just pays the bills
Happy with career
Enjoy job, but it is not on my career path
Job OK, but it is not on my career path
Do not like my job, but it is on my career path
5-47
Grafik Batang
47
C41Q4Q3Q2Q1Q
1.5
1.2
0.9
0.6
0.3
0.0
Figure 1-11: SHIFTING GEARS
2003 2004
Quartely net income for General Motors (in billions)
C41Q4Q3Q2Q1Q
1.5
1.2
0.9
0.6
0.3
0.0
Figure 1-11: SHIFTING GEARS
2003 2004
Quartely net income for General Motors (in billions)
5-48
Polygon Frekuensi dan Ogiv
48
Polygon Frekuensi Relatif Ogive
50403020100
0.3
0.2
0.1
0.0
Re
lativ
e F
req
ue
ncy
Sales50403020100
1.0
0.5
0.0
Cu
mu
lativ
e R
ela
tive
Fre
qu
en
cy
Sales
5-49
Time Plots
49
OSAJJMAMFJDNOSAJJMAMFJDNOSAJJMAMFJ
8.5
7.5
6.5
5.5
Month
Mill
ions
of T
ons
M o nthly S te e l P ro d uc tio n