Unit 3 Pengumpulan dan Pengurusan Data | 15
UNIT PELAJARAN 3
PENGUMPULAN DAN PENGURUSAN DATA
HASIL PEMBELAJARAN
Di akhir unit ini, anda diharap dapat:
1. Mengumpul dan mengklasifikasi data mengikut jenis-jenisnya.
2. Mengurus data ke dalam jadual-jadual tertentu.
PENGENALAN
tatistik deskriptif mengandungi pelbagai kaedah, bukan sahaja untuk menguruskan data
malahan meringkaskan maklumat atau data yang diperoleh agar mudah dibaca dengan
jelas dan berkesan. Dalam Unit 3 ini, kita akan membincangkan mengenai bagaimana data S
Unit 3 Pengumpulan dan Pengurusan Data | 16
dikumpulkan dan diuruskan dengan kaedah yang bersesuaian. Sebelum itu, kita akan mengenali
dengan lebih dekat lagi apa itu pembolehubah kuantitatif dan pembolehubah kualitatif. Begitu juga
dengan data kuantitatif dan data kualitatif. Kita juga akan diperkenalkan dengan dua jenis data
kuantitatif iaitu data diskret dan data selanjar.
Setelah kita mengenali apa itu pembolehubah dan jenis-jenis data, kita akan mempelajari
pula bagaimana hendak mengumpulkan data mengikut taburan-taburan tertentu. Penerangan
berserta contoh-contoh berkaitan dengan taburan kekerapan dan taburan kekerapan relatif
disertakan untuk kita lebih memahami dan mendalami data dan taburannya.
Selain daripada itu, kita juga akan diuji dengan latihan-latihan formatif berkaitan subtajuk-
subtajuk yang dipelajari. Akhir sekali, kita akan diuji dengan latihan sumatif yang merangkumi apa
yang telah kita bincangkan dalam unit ini.
PEMBOLEHUBAH DAN DATA
Ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain dikenali sebagai
pembolehubah. Contoh-contoh pembolehubah yang melibatkan manusia termasuklah tinggi,
berat, bilangan adik-beradik, jantina, taraf perkahwinan dan warna mata. Tiga contoh pertama
yang diberikan melibatkan maklumat yang boleh dihitung ialah pembolehubah kuantitatif. Tiga
Unit 3 Pengumpulan dan Pengurusan Data | 17
contoh yang terakhir melibatkan maklumat yang tidak boleh dihitung ialah pembolehubah
kualitatif.
Terdapat dua jenis pembolehubah kuantitatif, iaitu pembolehubah diskret dan
pembolehubah selanjar. Satu pembolehubah diskret ialah nilai mungkin yang membentuk satu
set nombor terhingga (atau terbilangkan tak terhingga), kebiasaannya melibatkan nombor bulat.
Bilangan adik-beradik yang dipunyai oleh seseorang merupakan satu contoh pembolehubah
diskret. Pembolehubah selanjar ialah nilai mungkin yang membentuk julat nombor. Ketinggian
seseorang ialah satu contoh pembolehubah selanjar. Secara ringkasnya, perbincangan tentang
pembolehubah boleh disimpulkan seperti berikut dalam jadual dan rajah di bawah:
Pembolehubah : Satu ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain.
Pembole ubah kuantitatif : Satu pembolehubah nilai berangka.
Pembolehubah kualitatif : Satu pembolehubah nilai tak berangka.
Pembolehubah diskret : Satu pembolehubah kuantitatif dengan nilai mungkin membentuk satu set nombor terhingga (atau terbilangkan tak terhingga).
Pembolehubah selanjar : Satu pembolehubah kuantitatif dengan nilai mungkin yang membentuk julat nombor.
Unit 3 Pengumpulan dan Pengurusan Data | 18
Pemerhatian yang dijalankan terhadap nilai-nilai satu pembolehubah berkaitan seseorang atau
sesuatu benda dikenali sebagai data. Maka, maklumat yang dikumpulkan, diuruskan dan dianalisis
oleh pakar-pakar statistik ialah data. Terma-terma yang digunakan untuk menggambarkan satu
pembolehubah juga digunakan dalam menggambarkan data.
Data kualitatif
Data kualitatif ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah
kualitatif yang mana ia terdiri daripada angka-angka atau skor-skor yang tidak mempunyai nilai
kuantiti. Angka-angka atau skor-skor ini cuma menunjukkan kategori, nama, jenis, kelas atau
Unit 3 Pengumpulan dan Pengurusan Data | 19
pangkat bandingan. Contohnya, jantina (1 = lelaki, 2 = perempuan), jenis rumah (1 = banglo, 2 =
teres, 3 = pangsapuri), gred peperiksaan (1 = A, 2 = B, 3 = C) dan lain-lain lagi. Data kualitatif
menyukat kualiti dan bukan kuantiti.
Data kuantitatif
Data kuantitatif pula ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai
pembolehubah kuantitatif yang mana ia tediri daripada angka-angka atau skor-skor yang
mempunyaii nilai berangka. Angka-angka atau skor-skor ini menunjukkan banyak, kekuatan atau
saiz sesuatu ciri seperti berat, umur, tinggi, markah ujian dan lain-lain. Data kuantitatif terdiri
daripada data diskret dan data selanjar.
Data diskret
Data diskret ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah
diskret dengan cara membilang. Data diskret cuma boleh mengambil nilai tetap atau nilai tepat
sahaja. Contohnya, bilangan buah buku atas rak, bilangan kenderaan yang melalui plaza tol,
bilangan ahli dalam sebuah keluarga, bilangan murid dalam sebuah kelas, dan lain-lain lagi.
Unit 3 Pengumpulan dan Pengurusan Data | 20
Data selanjar
Data selanjar ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah
selanjar yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal
atau satu nilai tepat. Contohnya, tinggi orang, berat orang atau benda, halaju sebuah kapal terbang
dan lain-lain lagi.
Contoh 3.1
Manusia diklasifikasikan hanya mempunyai satu daripada empat jenis darah: A, B, AB, atau O.
Apakah jenis data yang anda terima apabila anda diberitahu jenis darah anda?
Data : Maklumat yang diperolehi melalui pemerhatian ke atas nilai-nilai satu
pembolehubah.
Data kualitatif : Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kualitatif.
Data kuantitatif : Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kuantitatif.
Data diskret : Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu
pembolehubah diskret dengan cara membilang.
Data selanjar : Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu
pembolehubah selanjar.
Unit 3 Pengumpulan dan Pengurusan Data | 21
Penyelesaian:
Jenis darah tergolong dalam data kualitatif – data diperolehi dengan memerhatikan nilai
pembolehubah “jenis darah”.
Contoh 3.2
Banci perumahan dijalankan sekali dalam tempoh 10 tahun untuk mengetahui bilangan ahli dalam
sebuah keluarga. Apakah jenis data yang diperolehi melalui bilangan ahli dalam sebuah keluarga?
Penyelesaian:
Bilangan ahli dalam sebuah keluarga tergolong dalam data kuantitatif iaitu data diskret – data
diperolehi dengan memerhatikan nilai pembolehubah “bilangan ahli dalam sebuah keluarga”.
Contoh 3.3
Di awal persekolahan, Cikgu Ali telah mengukur tinggi dan berat murid-murid kelasnya. Apakah
jenis data yang diperolehi melalui tinggi dan berat?
Penyelesaian:
Tinggi dan berat tergolong dalam data kuantitatif iaitu data selanjar – data diperolehi dengan
memerhatikan nilai pembolehubah “tinggi dan berat”.
Unit 3 Pengumpulan dan Pengurusan Data | 22
Cuba anda fikirkan tiga contoh yang berkaitan dengan data diskret, data selanjar dan
data kualitatif selain daripada contoh-contoh di atas.
Untuk soalan-soalan 1 – 2, klasifikasikan sama ada data yang diberikan ialah data kualitatif atau
data kuantitatif. Jika kuantitatif, nyatakan sama ada data tersebut ialah data diskret atau data
selanjar. Juga kenal pasti pembolehubahnya.
1. Mengikut kajian yang dijalankan oleh Sidney S. Culbert (Universiti Washington), bahasa-
bahasa utama yang digunakan dalam tahun 1993 adalah seperti berikut.
Kedudukan Bahasa Pengguna (juta)
1
2
3
4
5
6
7
Mandarin
Inggeris
Hindi
Sepanyol
Russia
Arab
Bengali
930
463
400
371
291
214
192
a. Apakah jenis data yang diberikan dalam lajur pertama jadual ini?
Latihan Formatif 3.1
Unit 3 Pengumpulan dan Pengurusan Data | 23
b. Apakah jenis data yang didapati melalui maklumat bahawa Sally Ride bercakap
dalam Bahasa Inggeris?
c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini?
2. Jadual berikut menunjukkan anggaran statistik keluasan tanah dan populasi setiap benua
dalam tahun 1992.
Benua Keluasan tanah
(1000 batu persegi)
Populasi
(Juta)
Asia
Afrika
Amerika Utara
Amerika Selatan
Eropah
Oceania
10644
11707
9360
6883
1905
3284
3207
654
436
300
511
28
a. Apakah jenis data yang diberikan oleh keluasan tanah?
b. Apakah jenis data yang didapati melalui kenyataaan, “Afrika mempunyai keluasan
tanah yang terbesar dan kedua dalam jumlah populasi penduduk”?
c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini?
d. Apakah jenis data yang didapati melalui maklumat bahawa Ronaldo dilahirkan di
Eropah?
Unit 3 Pengumpulan dan Pengurusan Data | 24
PENGUMPULAN DATA
Apabila kita berbincang berkenaan dengan jenis-jenis data sebelum ini, contoh-contoh yang
diberikan tidak mengandungi kuantiti data yang besar. Namun demikian, dalam dunia yang nyata
kadang-kadang data yang dikumpulkan boleh berkemungkinan terlalu banyak. Sebagai contohnya,
profil pelajar-pelajar universiti di Malaysia, bilangan guru-guru di Malaysia dan lain-lain lagi. Untuk
itu, kita perlu menguruskan data yang banyak ini dalam bentuk yang senang difahami. Dalam sub-
tajuk ini, kita akan membincangkan tentang pengumpulan data, iaitu meletakkan data di dalam
kumpulan-kumpulan. Pengumpulan data merupakan salah satu cara yang biasa digunakan untuk
menguruskan data.
Cuba anda nyatakan kebaikan dan kelemahan dalam pengumpulan data.
Contoh 3.4
Jadual 3.1 menunjukkan kematangan 40 pelaburan jangka pendek dalam hari.
Adalah sukar untuk memahami data jika data dipaparkan seperti dalam Jadual 3.1. Oleh itu, kita
perlu mengumpulkan data tersebut mengikut kategori-kategori tertentu atau pun kelas-kelas
tertentu untuk memudahkan kita memahami data tersebut.
Unit 3 Pengumpulan dan Pengurusan Data | 25
Langkah pertama ialah menentukan kelasnya. Paling mudah, data dikelaskan mengikut
selang atau saiz 10. Oleh kerana nilai data yang terkecil ialah 36 dan yang terbesar ialah 99,
pengumpulan data mengikut saiz 10 akan menghasilkan kelas-kelas: 30 – 39 , 40 – 49, dan
seterusnya hingga 90 – 99. Kelas-kelas ini dinyatakan dalam lajur pertama Jadual 3.2 di bawah.
Jadual 3.1 Kematangan 40 pelaburan jangka pendek dalam hari
70 64 99 55 64 89 87 65
62 38 67 70 60 69 78 39
75 56 71 51 99 68 95 86
57 53 47 50 55 81 80 98
51 36 63 66 85 79 83 70
Jadual 3.2 Kelas dan bilangan pelaburan
Hari matang Gundal Bilangan pelaburan
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99
///
/
//// ///
//// ////
//// //
//// //
////
3
1
8
10
7
7
4
40
Unit 3 Pengumpulan dan Pengurusan Data | 26
Langkah kedua dalam pengumpulan data ialah untuk menentukan berapakah bilangan
pelaburan dalam setiap kelas. Untuk itu, kita perlu rujuk kepada Jadual 3.1 dan mengira bilangan
pelaburan (data) dengan membuat tanda gundal (lajur 2) dan menulis bilangan pelaburan (lajur 3).
Sebagai contoh, pelaburan pertama yang ditunjukkan dalam Jadual 3.1 ialah pelaburan yang
matang dalam tempoh 70 hari. Oleh itu, tandakan satu garis pada lajur gundal untuk kelas 70 – 79.
Keputusan untuk tanda gundal adalah seperti yang ditunjukkan dalam Jadual 3.2. Selepas selesai
mengisi lajur gundal, kita teruskan dengan menjumlahkan bilangan gundal untuk setiap kelas dan
isikan lajur bilangan pelaburan, seperti yang telah dilakukan dalam Jadual 3.2.
Dengan merujuk Jadual 3.2, kita boleh memperolehi maklumat-maklumat yang
dikehendaki. Sebagai contoh, kita boleh mengetahui bilangan pelaburang jangka pendek yang
tertinggi melibatkan tempoh kematangan 60 – 69 hari. Jika dibuat perbandingan antara Jadual 3.1
dan 3.2, pengumpulan data memudahkan kita membaca dan memahami data yang disampaikan.
Untuk contoh 3.4, kita menggunakan pendekatan mengumpulkan data dalam kelas.
Terdapat tiga tatacara yang penting dalam melaksanakan pengumpulan data dalam kelas
iaitu:
1. Bilangan kelas seharusnya antara 5 hingga 20 yang dapat memberikan maklumat ringkas
berkaitan tentang data iaitu ciri-ciri yang relevan antara data.
Unit 3 Pengumpulan dan Pengurusan Data | 27
2. Setiap data mesti berada dalam satu kelas sahaja. Sebagai contoh, jika dalam contoh 4,
kita menggunakan kelas 30 – 40, 40 – 50, 50 – 60, dan seterusnya, untuk pelaburan yang
tempoh matangnya 50 hari, kelas yang manakah akan kita masukkan data ini? Oleh itu, kita
harus berhati-hati dalam membentuk sesuatu kelas supaya data dapat dimasukkan dalam
satu kelas sahaja.
3. Saiz untuk semua kelas mestilah sama melainkan jika ada keperluan lain. Semua kelas
dalam Jadual 3.2 mempunyai saiz yang sama iaitu 10. Kita pilih saiz kelas yang sama
sebab ini akan memudahkan kita untuk memaparkan data dalm bentuk graf.
Banyak lagi tatacara yang boleh dimasukkan, namun tiga tatacara ini sudah mencukupi sebagai
asas yang kukuh dalam perbincangan kita tentang pengumpulan data.
Cuba anda senaraikan tatacara yang boleh digunapakai dalam pengumpulan data.
KEKERAPAN DAN TABURAN RELATIF KEKERAPAN
Bilangan data yang terkumpul dalam sesuatu kelas dipanggil kekerapan kelas tersebut. Sebagai
contoh, dalam Jadual 3.2, kekerapan kelas 50 – 59 ialah lapan kerana terdapat lapan pelaburan
jangka pendek yang matang dalam tempoh 50 – 59 hari. Satu jadual yang menyenaraikan kelas-
kelas dan kekerapan-kekerapannya disebut sebagai taburan kekerapan. Lajur pertama dan ketiga
Unit 3 Pengumpulan dan Pengurusan Data | 28
dalam Jadual 3.2 membentuk satu taburan kekerapan untuk tempoh matang pelaburan jangka
pendek dalam hari.
Sebagai tambahan kepada kekerapan sesuatu kelas, kita biasanya berminat dengan
peratus sesuatu kelas. Kita boleh mendapatkan peratus yang dikehendaki dengan membahagikan
kekerapan sesuatu kelas dengan jumlah bilangan data dan mendarabkannya dengan 100. Merujuk
kembali kepada Jadual 3.2, kita dapat lihat bahawa peratus pelaburan untuk kelas 50 -59 ialah:
8 = 0.20 atau 20% 40
Maka, 20% daripada pelaburan mempunyai tempoh kematangan antara 50 hingga 59 hari.
Peratus sesuatu kelas, yang dinyatakan dalam bentuk perpuluhan, dikenali sebagai
kekerapan relatif sesuatu kelas. Untuk kelas 50 – 59, kekerapan relatifnya ialah 0.20. Jadual yang
menyenaraikan kesemua kelas dan kekerapan relatifnya dikenali sebagai taburan kekerapan
relatif. Jadual 3.3 menunjukkan satu taburan kekerapan relatif untuk tempoh kematangan
pelaburan jangka pendek dalam hari. Perhatikan bahawa jumlah kekerapan relatif keseluruhannya
ialah 1 (100%).
Cuba anda fikirkan kegunaan-kegunaan taburan kekerapan relatif.
Unit 3 Pengumpulan dan Pengurusan Data | 29
Jadual 3.3 taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek
Hari matang Kekerapan relatif
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99
0.075 (3/40)
0.025 (1/40)
0.200 (8/40)
0.250 (10/40)
0.175 (7/40)
0.175 (7/40)
0.100 (4/40)
1.000
Apabila kita membandingkan dua set data, taburan kekerapan relatif adalah lebih baik daripada
taburan kekerapan. Ini ialah kerana kekerapan relatif sentiasa dalam julat antara 0 dan 1 yang
memberikan perbandingan yang standard. Dua set data akan mempunyai taburan kekerapan yang
serupa jika taburan kekerapan relatif adalah serupa. Namun demikian, dua set data yang
mempunyai taburan kekerapan relatif yang serupa akan hanya mempunyai taburan kekerapan yang
serupa jika kedua-dua set data mengandungi jumlah bilangan data yang sama.
TERMINOLOGI DATA TERKUMPUL
Untuk memudahkan pengumpulan data dilakukan, kita mesti membiasakan diri dan memahami
terma-terma yang digunakan. Kita sudah pun membincangkan beberapa terma yang digunakan.
Unit 3 Pengumpulan dan Pengurusan Data | 30
Untuk memperkenalkan terma-terma yang lain, kita rujuk kembali kepada contoh 3.4 (data tentang
tempoh matang pelaburan jangka pendek). Pertimbangkan, kelas 50 – 59. Tempoh kematangan
pelaburan paling pendek yang boleh dimasukkan dalam kelas ini ialah 50. Nilai ini (50) dikenali
sebagai had bawah kelas kelas ini. Manakala, tempoh kematangan yang paling tinggi yang boleh
dimasukkan dalam kelas ini ialah 59. Nilai ini (59) disebut sebagai had atas kelas kelas ini.
Titik tengah kelas 50 – 59 ialah (50 + 59)/2 = 54.5. Ini dikenali sebagai tanda kelas untuk
kelas 50 – 59. Tanda kelas ialah satu nilai yang mewakili suatu kelas dan akan digunakan dalam
graf serta penghitungan berbentuk deskriptif.
Saiz kelas 50 – 59 boleh didapati melalui beza antara had bawah kelas yang sedia ada
(50) dan had bawah kelas kemudiannya (60) iaitu 10.
Untuk maklumat lebih lanjut tentang data terkumpul, boleh layari laman sesawang
berikut:
http://www.wyzant.com/Help/Math/Statistics_and_Probability/Introduction/Data.a
spx
Unit 3 Pengumpulan dan Pengurusan Data | 31
Berikut merupakan terminologi data terkumpul.
Satu jadual yang mengandungi kelas, kekerapan, kekerapan relatif dan tanda kelas untuk
satu set data dipanggil jadual data terkumpul. Jadual 3.4 menunjukkan satu jadual data terkumpul
untuk tempoh matang pelaburan jangka pendek.
Kelas : Kategori untuk data terkumpul.
Kekerapan : Bilangan data dalam satu kelas.
Taburan kekerapan : Satu jadual yang mengandungi kelas-kelas dan
kekerapan-kekerapannya.
Kekerapan relatif : Nisbah kekerapan sesuatu kelas dengan jumlah
bilangan data.
Taburan kekerapan relatif : Satu jadual yang mengandungi kelas-kelas dan
kekerapan relatifnya.
Had bawah kelas : Data yang paling kecil yang boleh dimasukkan dalam
kelas tersebut.
Had atas kelas : Data yang paling besar yang boleh dimasukkan
dalam kelas tersebut.
Tanda kelas : Titik tengah suatu kelas.
Saiz kelas : Beza antara had bawah kelas yang sedia ada dan
had bawah kelas kemudiannya.
Unit 3 Pengumpulan dan Pengurusan Data | 32
Jadual 3.4 Jadual data terkumpul untuk tempoh matang pelaburan jangka pendek
Tempoh matang Kekerapan (Bilangan pelaburan)
Kekerapan relatif Tanda kelas
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99
3
1
8
10
7
7
4
0.075
0.025
0.200
0.250
0.175
0.175
0.100
34.5
44.5
54.5
64.5
74.5
84.5
94.5
40 1.000
Contoh 3.5
Seorang doktor yang menguji tahap kolesterol para remaja telah mendapati ada di antara mereka
yang mempunyai tahap kolesterol melebihi 200 mg per 100mL. Bacaan 20 orang remaja yang
mempunyai tahap kolesterol yang tinggi ditunjukkan dalam jadual di bawah. Bina satu jadual data
terkumpul. Guna saiz kelas, 5 dan mula pada 195.
Unit 3 Pengumpulan dan Pengurusan Data | 33
210 209 212 208
217 207 210 203
208 210 210 199
215 221 213 218
202 218 200 214
Penyelesaian:
Oleh kerana kita akan menggunakan saiz kelas, 5 dan bermula pada 195, maka kelas yang
pertama ialah 195 – 199. Jadual 3.4 menunjukkan kelas dan kekerapan data untuk tahap
kolesterol.
Jadual 3.5 Kelas dan kekerapan tahap kolesterol pelajar
Tahap kolesterol Gundal Kekerapan
195 – 199
200 – 204
205 – 209
210 – 214
215 – 219
220 – 224
/
///
////
//// //
////
/
1
3
4
7
4
1
Daripada Jadual 3.5, kita boleh membina jadual data terkumpul seperti dalam Jadual 3.6.
Unit 3 Pengumpulan dan Pengurusan Data | 34
Jadual 3.6 Jadual data terkumpul untuk data tahap kolesterol
Tahap Kolesterol Kekerapan Kekerapan relatif Tanda kelas
195 – 199
200 – 204
205 – 209
210 – 214
215 – 219
220 – 224
1
3
4
7
4
1
0.05
0.15
0.20
0.35
0.20
0.05
197
202
207
212
217
222
20 1.00
Untuk mengilustrasi nilai yang didapati dalam lajur 3 dan lajur 4 dalam Jadual 3.6, kita
pertimbangkan kelas 210 – 214. Kita ada
Kekerapan relatif = 7 = 0.35 20
dan
tanda kelas = 210 + 214 = 212 2
Unit 3 Pengumpulan dan Pengurusan Data | 35
1. Satu syarikat pengusaha minuman ringan yang menjual “1 liter” botol air soda mendapati
bahawa isi kandungan air soda dalam botol-botol yang dikeluarkan adalah tidak sama. Tiga
puluh botol air soda telah dipilih secara rawak. Isi kandungan, dalam mililiter, botol-botl
tersebut adalah seperti yang ditunjukkan.
1025 977 1018 975 977
990 959 957 1031 964
986 914 1010 988 1028
989 1001 984 974 1017
1060 1030 991 999 997
996 1014 946 995 987
Bina satu jadual data terkumpul untuk data minuman ringan ini. Gunakan saiz kelas yang
sama dan mulakan dengan kelas 910 – 929.
2. Satu kajian telah dijalankan untuk mengumpul maklumat berkaitan dengan umur seseorang
dengan penyakit diabetes. Data berikut merupakan umur 35 orang yang menghidap
penyakit kencing manis.
Latihan Formatif 3.2
Unit 3 Pengumpulan dan Pengurusan Data | 36
48 41 57 83 41 55 59
61 38 48 79 75 77 7
54 23 47 56 79 68 61
64 45 53 82 68 38 70
10 60 83 76 21 65 47
Bina satu jadual data terkumpul untuk data umur tersebut. Gunakan saiz kelas yang sama
dan mulakan dengan kelas 0 – 9.
DATA TERKUMPUL UNTUK NILAI TUNGGAL
Setakat ini, perbincangan kita tertumpu kepada pengumpulan data yang menggunakan selang
kelas untuk mewakili nilai-nilai tertentu. Sebagai contoh, Jadual 3.6, setiap kelas tahap kolesterol
mewakili lima tahap kolesterol yang mungkin. Kelas yang pertama, 195 – 199 mewakili tahap-tahap
195, 196, 197, 198 dan 199; kelas yang kedua, 200 – 204 mewakili tahap-tahap 200, 201, 202, 203
dan 204; dan seterusnya.
Namun yang demikian, terdapat juga kes-kes yang mana kelas-kelas hanya diwakili oleh satu nilai
tunggal sahaja. Ini selalu terjadi kepada data diskret. Pertimbangkan Contoh 3.6.
Unit 3 Pengumpulan dan Pengurusan Data | 37
Contoh 3.6
Satu kajian telah dijalankan untuk mengumpul maklumat tentang bilangan anak dalam sesebuah
keluarga yang masih bersekolah di Bukit Bangsar. Jadual 3.7 menunjukkan bilangan anak yang
bersekolah dalam setiap keluarga daripada 30 buah keluarga yang dipilih.
Jadual 3.7 Bilangan anak yang bersekolah
a. Kumpulkan data tersebut menggunakan kelas-kelas yang mewakili nilai tunggal.
b. Kenal pasti had-had kelas dan tanda kelas.
c. Bina satu jadual data terkumpul.
Penyelesaian:
a. Dengan menggundalkan data yang terdapat dalam Jadual 3.7, kita akan dapat kekerapan
seperti dalam lajur dua Jadual 3.8. Dengan membahagikan kekerapan dengan jumlah
bilangan data, 30, kita akan dapat kekerapan relatif seperti dalam lajur tiga.
0 3 0 0 3 0
2 2 0 1 2 1
0 0 1 2 4 0
4 2 1 0 1 0
0 2 0 1 3 2
Unit 3 Pengumpulan dan Pengurusan Data | 38
b.
Jadual 3.8 Taburan kekerapan dan kekerapan relatif bilangan anak yang bersekolah
Bilangan anak yang
bersekolah
Kekerapan Kekerapan relatif
0
1
2
3
4
12
6
7
3
2
0.400
0.200
0.233
0.100
0.067
30 1.000
b. Untuk kenal pasti had-had kelas, kita pertimbangkan kelas “3” (tiga orang anak yang
bersekolah). Kita dapati bahawa:
Had bawah kelas = 3 (nilai yang terkecil yang boleh dimasukkan ke dalam
kelas)
Had atas kelas = 3 (nilai yang terbesar yang boleh dimasukkan ke dalam
kelas)
dan
Tanda kelas = 3 + 3 = 3 (titik tengah kelas) 2
Kesimpulannya, untuk kelas “3”, had bawah kelas, had atas kelas dan tanda kelas,
semuanya bersamaan dengan 3. Ini adalah benar untuk semua kelas.
Unit 3 Pengumpulan dan Pengurusan Data | 39
c. Untuk membina satu jadual data terkumpul, kita cuma perlu menambah satu lajur lagi iaitu
lajur untuk tanda kelas dalam Jadual 3.8. Namun demikian, dalam bahagian (b), kita dapati
bahawa tanda kelas untuk setiap kelas adalah bersamaan dengan kelas masing-masing.
Oleh itu, kita TIDAK perlu untuk menambahkan lajur tanda kelas kerana ia akan bersamaan
dengan lajur pertama. Dengan kata lain, Jadual 3.8 ialah jadual data terkumpul untuk
bilangan anak yang bersekolah.
Cuba fikirkan mengapa kita tidak menggunakan selang kelas untuk nilai tunggal.
1. Bancian telah dijalankan di seluruh negara untuk mengenal pasti bilangan ahli dalam
sebuah keluarga. Berikut adalah data bilangan ahli dalam sebuah keluarga untuk 40
keluarga.
2 5 2 1 1 2 3 4
1 4 4 2 1 4 3 3
7 1 2 2 3 4 2 2
6 5 2 5 1 3 2 5
2 1 3 3 2 2 3 3
Latihan Formatif 3.3
Unit 3 Pengumpulan dan Pengurusan Data | 40
Bina satu jadual data terkumpul untuk bilangan ahli dalam sebuah keluarga menggunakan
kelas-kelas nilai tunggal.
2. Seorang penjual kereta telah mencatatkan bilangan buah kereta yang dijual setiap minggu.
Bilangan buah kereta yang dijual setiap minggu pada tahun lepas adalah seperti berikut.
1 0 3 3 1 0 2 1 4 0 4 1 2
3 6 4 3 0 2 2 1 1 2 2 2 3
5 1 0 2 5 3 1 3 1 1 1 1 2
2 3 0 4 4 1 0 1 1 3 2 5 2
Bina satu jadual data terkumpul untuk bilangan buah kereta yang dijual setiap minggu
menggunakan kelas-kelas nilai tunggal.
DATA TERKUMPUL UNTUK DATA KUALITATIF
Walaupun konsep had bawah dan had atas kelas serta tanda kelas boleh diaplikasikan ke atas data
kuantitatif, namun demikian konsep ini tidak bersesuaian untuk data kualitatif. Sebagai contoh, data
yang mengkategorikan orang sebagai lelaki atau perempuan, kelas-kelas yang terlibat ialah “lelaki’
atau “perempuan”. Untuk kelas kualitatif begini, had kelas dan tanda kelas tidak membawa
sebarang makna. Apa yang boleh kita lakukan ialah mendapatkan kekerapan dan kekerapan relatif
untuk data kualitatif. Pertimbangkan contoh 3.7.
Unit 3 Pengumpulan dan Pengurusan Data | 41
Contoh 3.7
Seorang guru meminta murid-muridnya memilih sama ada rumah Biru (B), Merah (M), atau Kuning
(K) yang akan muncul johan keseluruhan untuk sukan tahunan tahun ini? Respon murid-muridnya
adalah seperti yang dipaparkan dalam jadual di bawah. Tentukan taburan kekerapan dan
kekerapan relatif untuk data tersebut.
B M K M M M M M
B K M B K K M B
B M K B M M K M
B K B B B M K B
K M B M M M M B
Penyelesaian:
Kelas-kelas untuk data terkumpul yang akan kita gunakan ialah “Biru”, “Merah” dan “Kuning”.
Taburan kekerapan dan kekerapan relatif yang akan kita peroleh ialah seperti jadual di bawah.
Rumah sukan Kekerapan Kekerapan relatif
Biru
Merah
Kuning
13
18
9
0.325
0.450
0.225
40 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 42
Dengan membahagikan setiap kekerapan dalam lajur dua dengan jumlah bilangan pelajar, kita
akan peroleh kekerapan relatif.
Cuba fikirkan apakah perbezaan taburan kekerapan nilai tunggal dan taburan
kekerapan data kualitatif.
1. Negara-negara yang menjuarai kejohanan bola sepak negara-negara Eropah sejak ia
dimulakan adalah seperti senarai berikut.
Tahun Juara
1960
1964
1968
1972
1976
1980
1984
1988
1992
1996
2000
2004
2008
2012
USSR
Sepanyol
Itali
Jerman
Czechoslovakia
Jerman
Perancis
Belanda
Denmark
Jerman
Perancis
Greece
Sepanyol
Sepanyol
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
Latihan Formatif 3.4
Unit 3 Pengumpulan dan Pengurusan Data | 43
2. Ujian darah untuk mengenalpasti jenis darah setiap murid telah dijalankan dalam sebuah
sekolah menengah. Diidapati bahawa murid-murid sekolah tersebut mempunyai darah jenis
kumpulan A, B, AB, dan O. Jadual di bawah menunjukkan kumpulan darah 30 orang murid
yang dipilh secara rawak.
A A O O AB B
B B B AB A A
O O AB AB AB AB
A B O O AB O
B A O B AB AB
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
RUMUSAN
Secara keseluruhannya, kita telah didedahkan dengan apa itu pembolehubah kuantitatif dan
kualitatif. Apa yang lebih penting, kita sudah pun mengenali dengan lebih mendalam tentang data
kuantitatif dan data kualitatif. Diharapkan penerangan dan contoh-contoh dalam unit ini telah dapat
membantu kita untuk memahami apa itu data diskret dan data selanjar. Secara ringkasnya, data
diskret ialah data yang cuma boleh mengambil nilai tetap atau nilai tepat sahaja (dalam bahasa
mudah: yang boleh dibilang dan yang ambil nilai nombor bulat). Data selanjar pula ialah data yang
hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu
Unit 3 Pengumpulan dan Pengurusan Data | 44
nilai tepat (dalam bahasa mudah: boleh ambil nilai perpuluhan). Disamping itu, kita juga ada data
kualitatif yang mana data jenis ini merupakan angka-angka atau skor-skor yang tidak mempunyai
nilai kuantiti (contohnya: jantina, warna mata, dan lain-lain).
Perbincangan kita juga menjurus kepada tatacara pengumpulan data yang melibatkan data
terkumpul untuk skor yang biasa (yang melibatkan selang kelas), nilai tunggal dan kualitatif. Kita
telah didedahkan dengan dua jenis taburan: taburan kekerapan dan taburan kekerapan relatif.
Diharapkan agar kita telah berjaya menguasai unit ini dengan jayanya. Unit yang seterusnya akan
membincangkan tentang miskonsepsi dalam pengumpulan dan pengurusan data.
KATA KUNCI
Pembolehubah kuantitatif, pembolehubah kualitatif, pembolehubah diskret, pembolehubah selanjar,
data kuantitatif, data kualitatif, data diskret, data selanjar, taburan kekerapan, taburan kekerapan
relatif.
Unit 3 Pengumpulan dan Pengurusan Data | 45
1. Berikan satu sebab mengapa mengklasifikasi data adalah penting? (Ia boleh membantu
dalam memilih kaedah statistik yang betul).
2. Berikut merupakan lima sungai yang terpanjang dalam dunia.
Kedudukan Sungai Panjang (km)
1
2
3
4
5
Nil
Amazon
Yangtze
Mississipi
Yenisei-Angara-Selanga
6650
6400
6300
6275
5539
a. Apakah jenis data yang diberikan dalam lajur pertama jadual di atas? (data kuantitatif:
data diskret, pembolehubah – kedudukan)
b. Apakah jenis data yang diperoleh daripada maklumat “Sungai Nil ialah sungai yang
terpanjang dalam dunia.”? (Data kuantitatif: data diskret, pembolehubah – kedudukan)
c. Apakah jenis data yang diberikan dalam lajur ketiga dalam jadual di atas? (Data
kuantitatif: data selanjar, pembolehubah – panjang)
Latihan Sumatif
Unit 3 Pengumpulan dan Pengurusan Data | 46
3. Satu kajian telah dijalankan ke atas pelancong-pelancong dari luar negara tentang tempoh
tinggal semasa melancong ke Malaysia. Jadual berikut menunjukkan data tempoh tinggal
36 orang pelancong yang dipilih secara rawak, dalam hari.
Bina satu jadual data terkumpul untuk data tempoh tinggal tersebut. Gunakan saiz kelas
yang sama dan mulakan dengan kelas 1 – 7.
4. Satu ujian kecerdasan telah dijalankan ke atas 50 orang kanak-kanak Tahun Satu di
sebuah sekolah. Berikut merupakan data skor yang diperoleh kanak-kanak tersebut.
41 16 6 21 1 21
5 31 20 27 17 10
3 32 2 48 8 12
21 44 1 56 5 12
3 13 15 10 18 3
1 11 14 12 64 10
100 92 96 91 81 110 70 119 94 88
104 83 115 97 73 108 93 116 86 98
89 123 78 108 127 91 114 84 101 121
95 105 63 112 102 117 106 126 94 124
92 99 76 105 90 81 109 116 96 107
Unit 3 Pengumpulan dan Pengurusan Data | 47
Bina satu jadual data terkumpul untuk data skor tersebut. Gunakan saiz kelas yang
bersesuaian.
5. 25 orang murid Tahun Lima telah diminta untuk menjawab satu kuiz yang mengandungi
lapan soalan tentang tajuk Pecahan. Bilangan soalan yang gagal dijawab dengan betul oleh
setiap murid adalah seperti yang ditunjukkan.
Bina satu jadual data terkumpul untuk bilangan soalan yang gagal dijawab oleh murid-murid
Tahun Lima menggunakan kelas-kelas nilai tunggal.
3 4 2 3 1
1 1 6 1 2
0 5 1 2 1
0 3 4 0 3
2 0 3 1 1
Unit 3 Pengumpulan dan Pengurusan Data | 48
6. Sebuah bank mempunyai 80 orang pekerja. Ketidakhadiran setiap pekerja, dalam hari yang
dicatatkan tahun lalu adalah seperti berikut.
Bina satu jadual data terkumpul untuk data ketidakhadiran pekerja, dalam hari
menggunakan kelas-kelas nilai tunggal.
7. Tiga unit beruniform telah ditubuhkan dalam sebuah sekolah rendah: Pengakap Kanak-
kanak (PK), Persatuan Bulan Sabit Merah (PBSM), Kadet Remaja Sekolah (KRS). Setiap
murid adalah diwajibkan untuk mengganggotai salah satu daripada unit beruniform
tersebut. Jadual di bawah menunjukkan keanggotaan unit beruniform 40 orang murid yang
dipilih secara rawak.
2 3 6 2 6 5 5 2 4 7 5 3 6 4 4 4
2 2 4 5 4 0 2 1 6 3 5 3 6 6 4 7
5 2 5 0 5 6 5 2 4 2 6 2 4 3 5 4
2 4 4 3 3 4 0 5 6 3 5 5 2 4 4 2
0 7 5 5 7 6 1 5 3 3 4 7 7 2 5 5
Unit 3 Pengumpulan dan Pengurusan Data | 49
PK PBSM KRS PBSM PBSM PBSM PBSM PBSM
PK KRS PBSM PK KRS KRS PBSM PK
PK PBSM KRS PK PBSM PBSM KRS PBSM
PK KRS PK PK PK PBSM KRS PK
KRS PBSM PK PBSM PBSM PBSM PBSM PK
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
8. Pada pengajian semester yang lepas, pelajar-pelajar Program Pendidikan Matematik telah
memilih untuk mengikuti salah satu daripada kursus-kursus berikut: Kalkulus Permulaan
(K), Pengenalan Statistik (S) dan Linear Algebra (A). Berikut merupakan pilihan kursus 40
orang pelajar yang dipilih secara rawak.
A K K A S A S K
S S A K A A K K
S A S A K S S K
A A A K S A A K
K A S S K K S S
Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.
Unit 3 Pengumpulan dan Pengurusan Data | 50
Rujukan
Dunn, S.D. (2001). Statistic and data analysis for the behavioral sciences. New York: McGraw-Hill.
Haylock, D. (2010). Mathematics Explained For Primary Teachers (4th Ed.). London: Sage Publications
Howitt, D., & Cramer, D. (2000). An introduction to statistics in psychology: A complete guide for
students. (2nd Ed.). Harlow, England: Prentice Hall.
Iran Herman.(2004). Statistik dan analisis data sains sosial. Alor Star: Percetakan Ustaras Sdn.Bhd.
Kennedy, L. M, & Tipps, S. (2011).Guiding Children’s Learning of Mathematics.(12th Ed.). Bermont:
Wadsworth.
Weiss, N. A. (2005). Introductory Statistics (7th Ed.). Boston: Pearson & Addison Wesley.
Utts, J. M., & Heckard, R. F.(2004). Mind on Statistics (2nd Ed.). Belmont, CA: Thomson Learning.
http://www.epcae.org/uploads/documents/Central_Tendency_pck_SEP20.pdf
Unit 3 Pengumpulan dan Pengurusan Data | 51
Jawapan
Latihan Formatif 3.1
1. (a) data kuantitatif: data diskret; pembolehubah – kedudukan
(b) data kualitatif; pembolehubah – bahasa
(c) data kuantitatif: data diskret; pembolehubah – pengguna
2. (a) data kuantitatif: data selanjar; pembolehubah – keluasan tanah
(b) data kuantitatif: data diskret; pembolehubah – pangkat/kedudukan keluasan tanah dan
populasi
(c) data kuatitaif: data diskret; pembolehubah – populasi
(d) data kualitatif; pembolehubah – benua dia dilahirkan
Latihan Formatif 3.2
1.
Kandungan Kekerapan Kekerapan relatif Tanda kelas
910 – 929
930 – 949
950 – 969
970 – 989
990 – 1009
1010 – 1029
1030 – 1049
1050 - 1069
1
1
3
9
7
6
2
1
0.033
0.033
0.100
0.300
0.233
0.200
0.067
0.033
919.5
939.5
959.5
979.5
999.5
1019.5
1039.5
1059.5
30 0.999
Unit 3 Pengumpulan dan Pengurusan Data | 52
2.
Umur Kekerapan Kekerapan relatif Tanda kelas
0 – 9
10 – 19
20 – 29
30 – 39
40 – 49
50 – 59
60 – 69
70 – 79
80 – 89
1
1
2
2
7
6
7
6
3
0.029
0.029
0.057
0.057
0.200
0.171
0.200
0.171
0.086
4.5
14.5
24.5
34.5
44.5
54.5
64.5
74.5
84.5
35 1.000
Latihan Formatif 3.3
1.
Bilangan ahli Kekerapan Kekerapan relatif
1
2
3
4
5
6
7
7
13
9
5
4
1
1
0.175
0.325
0.225
0.125
0.100
0.025
0.025
40 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 53
2.
Bilangan buah kereta Kekerapan Kekerapan relatif
0
1
2
3
4
5
6
7
15
12
9
5
3
1
0.135
0.288
0.231
0.173
0.096
0.058
0.019
52 1.000
Latihan Formatif 3.4
1.
Juara Kekerapan Kekerapan relatif
Sepanyol
Jerman
Itali
Perancis
Denmark
Belanda
Greece
USSR
Czechoslovakia
3
3
1
2
1
1
1
1
1
0.214
0.214
0.071
0.143
0.071
0.071
0.071
0.071
0.071
14 0.997
Unit 3 Pengumpulan dan Pengurusan Data | 54
2.
Kumpulan darah Kekerapan Kekerapan relatif
A
B
O
AB
6
7
8
9
0.200
0.233
0.267
0.300
30 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 55
Latihan Sumatif
1. Mengklasifikasi data adalah penting kerana ia boleh membantu dalam memilih kaedah
statistik yang betul.
2. (a) data kuantitatif: data diskret; pembolehubah – kedudukan
(b) data kuantitatif: data diskret; pembolehubah – kedudukan
(c) data kuantitatif: data selanjar; pembolehubah – panjang
3.
Tempoh tinggal
(Hari)
Kekerapan Kekerapan relatif Tanda kelas
1 – 7
8 – 14
15 – 21
22 – 28
29 – 35
36 – 42
43 – 49
50 – 56
57 – 64
10
10
8
1
2
1
2
1
1
0.278
0.278
0.222
0.028
0.056
0.028
0.056
0.028
0.028
4
11
18
25
32
39
46
53
60
36 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 56
4.
Skor Kekerapan Kekerapan relatif Tanda kelas
60 – 69
70 – 79
80 – 89
90 – 99
100 – 109
110 – 119
120 - 129
1
4
7
14
11
8
5
0.020
0.080
0.140
0.280
0.220
0.160
0.100
64.5
74.5
84.5
94.5
104.5
114.5
124.5
50 1.000
5.
Bilangan soalan yang
gagal dijawab
Kekerapan Kekerapan relatif
0
1
2
3
4
5
6
4
8
4
5
2
1
1
0.160
0.320
0.160
0.200
0.080
0.040
0.040
25 1.000
Unit 3 Pengumpulan dan Pengurusan Data | 57
6.
Ketidakhadiran bekerja (Hari) Kekerapan Kekerapan relatif
0
1
2
3
4
5
6
7
4
2
14
10
16
18
10
6
0.050
0.025
0.175
0.125
0.200
0.225
0.125
0.075
80 1.000
7.
Unit Beruniform Kekerapan Kekerapan relatif
Pengakap Kanak-kanak
Persatuan Bulan Sabit Merah
Kadet Remaja Sekolah
13
18
9
0.325
0.450
0.225
40 1.000
8.
Kursus Kekerapan Kekerapan relatif
Kalkulus Permulaan
Pengenalan Statistik
Linear Algebra
13
13
14
0.325
0.325
0.350
40 1.000