literasi asesmen
TRANSCRIPT
LITERASI ASESMEN DAN ANALISIS POKOK UJI
Makalah
Disusun untuk memenuhi tugas Mata Kuliah Evaluasi Pendidikan biologi
Dosen Pengajar: 1. Prof. Dr. Nuryani Y. Rustaman, M.Pd
2. Dr. Ana Ratna Wulan, M.Pd
Oleh
Didi Nur Jamaludin 1103321
Supriyadi 1103875
PENDIDIKAN BIOLOGI
SEKOLAH PASCASARJANA
UNIVERSITAS PENDIDIKAN INDONESIA
2012
0
A. Pendahuluan
Dalam proses pendidikan di tingkat sekolah, faktor guru memegang peran
penting dalam menciptakan pembelajaran yang bermutu dan bermakna. Terdapat tiga
tugas utama guru dalam proses pembelajaran, yaitu (1) membuat persiapan
pembelajaran, (2) melaksanakan kegiatan belajar mengajar, dan (3) melakukan
evaluasi pembelajaran dan memanfaatkan umpan balik (Rustaman, 2005:7). Ketiga
tahapan tersebut merupakan satu kesatuan, saling tergantung, saling berpengaruh, dan
memiliki tingkat kepentingan yang sama dalam mencapai tujuan pembelajaran.
Evaluasi merupakan komponen penting dari proses pembelajaran dantelah
ditetapkanstandar nasional tentang tuntutan bahwa guru harus memiliki kemampuan
dalam mengevaluasi siswa. Meskipun seorang guru telah memiliki pengetahuan dan
keterampilan mengajar, pengetahuan tentang evaluasi merupakan syarat dalam
mengindikasi pembelajaran yang efektif.Kemampuan guru dalam menilai belajar
siswa akan memiliki dampak besar pada seberapa baik siswa berhasil. Menurut Hitam
dan Wiliam (1998), penilaian kelas dilakukan secara teratur, bila dilakukan
menggunakan praktek-praktek yang sehat, memiliki hasil positif pada prestasi siswa.
NSES mendefinisikan asesmen sebagai suatu proses sistematik dan variatif
yang meliputi pengumpulan data yang berperan untuk umpan balik dalam Pendidikan.
Lebih lanjut Faichhney memberikan pengertian asesmen merupakan suatu proses yang
membantu guru untuk memahami prestasi, penampilan dan perkembangan siswa
(NRC:1996)
Evaluasi hasil belajar dalam pembelajaran IPA lebih tepat jika dimaknai
sebagai asesmen.Asesmen lebih sesuai karena sejalan dengan hakikat IPA sebagai
proses, produk, dan nilai, sehingga yang diukur tidak hanya hasil belajar tetapi juga
proses belajar.Asesmen merupakan proses penting karena hasilnya dapat digunakan
untuk merencanakan pengajaran, memandu belajar siswa, menentukan tingkat/urutan,
membuat perbedaan, menentukan untuk pendidikan lanjut, pengembangan teori
pendidikan, merumuskan kebijakan, mengalokasikan sumberdaya, dan mengevaluasi
kurikulum (NRC, 1996:76). Oleh karena itu asesmen perlu direncanakan,
dilaksanakan, dan dianalisis dengan baik sehingga berfungsi sebagaimana mestinya.
1
Keberhasilan asesmen sangat tergantung pada pengetahuan dan keterampilan guru
dalam memilih dan mengembangkan jenis asesmen dalam mengukur kompetensi
siswa, sehingga, pemahaman tentang prinsip dasar asesmen yang berkualitas harus
dipahami oleh guru agar dapat melakukan asesmen terhadap siswa secara tepat.
Dalam melakukan asesmen harus memperhatikan hal penting untuk menjamin
kualitas soal atau instrumen yang digunakan dalam menilai, yakni penggunaan analisis
pokok uji. Analisis pokok uji merupakan serangkaian proses pengujian perangkat
asesmen dengan tujuan: (a) sebagai upaya memperbaiki atau meningkatkan kualitas
tes; (b) mengidentifikasi soal yang baik, kurang baik dan jelek; (c) mendiagnostik
kemampuan siswa; (d) mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih
baik (Rustaman: 2007)
Makalah ini menyajikan uraian mengenai literasi asesmen dan analisis pokok uji
yang merupakan dasar pengetahuan dalam mengembangkan perangkat asesmen
khususnya dalam pembelajaran IPA.
B. Asesmen Formatif dan Asesmen Sumatif
Michael Scriven (1981) mengutip pendapat Bob Shake: “When the cook tastes
the soup, that’s formative; when the guests taste the soup, that’s
summative”.Asesmen tumbuh dan berkembang menjadi bagian penting dari proses
pendidikan secara keseluruhan. Asesmen sebagai bagian keseluruhan langkah proses
pendidikan, sama pentingnya dengan langkah lain dalam proses pembelajaran
(Rustaman:2012).
1. Asesmen Formatif
Hasil (20) penelitian yang direviu menunjukkan inovasi, termasuk peningkatan
pelaksanaan asesmen formatif, peningkatan hasil belajar secara substansial dan
signifikan. Typical effect sizes dari eksperimen asesmen formatif berkisar antara 0.4
dan 0,7 yang berarti asesmen formatif berpengaruh sangat besar terhadap gain hasil
belajar. Perbaikan pada asesmen formatif lebih membantu peserta didik yang
tergolong low achievers dari pada peserta didik yang biasa. Umpan balik yang
diberikan dalam proses asesmen formatif mempunyai pengaruh substansial dan
signifikan kepada peserta biasa dan peserta didik low achievers. Asesmen formatif
2
terutama dapat memperbaiki 3 bidang, yaitu: (1) belajar efektif, (2) mengurangi
akibat negatif dari belajar, (3) peran manajerial belajar.
Bila fokus belajar di sekolah dipusatkan kepada budaya rewards, maka peserta
didik akan terbiasa mengejar angka atau nilai tinggi ketimbang memperbaiki budaya
belajar. Karena itu maka dalam pembelajaran yang terpenting ialahmenanamkan
budaya berhasil (a culture of success), bukan budaya nilai tinggi. Dalam hal ini
asesmen formatif dapat menjadi alat yang efektif.Penerapan asesmen formatif untuk
meningkatkan proses, hasil dan standar pendidikan, yaitu:(1) umpan balik dalam
asesmen formatif (peserta didik, guru) (2) Swa asesmen (self assessment).
Komponen utama umpan balik antara lain: (a) mengingatkan peserta didik
akan tujuan yang ingin dicapai, (b) Kenyataan yang dicapai oleh peserta didik. Upaya
memberikan umpan balik efektif (oleh guru), dapat dilakukan dengan berbagai strategi
antara lain: (1) Dengan memfasilitasi swa asesmen setiap siswa untuk melakukan
refleksi diri; (2) mendorong terjadinya dialog antar teman, antarsiswa dan antara guru
dengan siswa; (3) memberikan gambaran kepada setiap siswa tentang kinerja yang
dianggap bermutu; (4) memperkecil kesenjangan antara kenyataan kinerja siswa
dengan kinerja yang diharapkan; (5) merespon kebutuhan siswa; (6) didasarkan pada
kriteria dan standar yang tetap, agar siswa dapat menetapkan langkah untuk
mencapainya secara konsisten pula; (7) mendorong motivasi belajar dan pembentukan
kepercayaan diri kepada tiap siswa.
Manfaat swa asesmen proses pembelajaran adalah bahwa swa asesmen
merupakan nilai interinsik proses pembelajaran. Swa asesmen juga suatu aspek
pendidikan untuk menanamkan kepribadian yang mampu melakukan self control.
Secara psikologis, pengendalian diri itu akanterbentuk bila peserta didik dapat
melakukan internal locus of control pada diri mereka. Keuntungan belajar swa
asesmen antara lain dapat membelajarkan siswa: (a) bertanggung jawab atas proses
belajarnya sendiri; (b) mampu menetapkan langkah berikutnya dalam belajar; (c)
dapat bangkit kembali, walau mengalami kegagalan; (d) menjadi pembelajar yang
percaya diri; (e) menjadi pembelajar yang aktif dalam proses pembelajaran; (f)
menjadi lebih independen dan bermotivasi tinggi.
3
Swa asesmen di lingkungan sekolah dikatakan efektif apabilaproses swa
asesmen mendapat dukungan dan tuntunan dari manajemen dan pimpinan sekolah.
Pimpinan dan manajemen sekolah harus pula memberikan dukungan yang berbeda
untuk setiap siswa sesuai dengan kebutuhan siswa (karena hakekat swa asesmen
beragam setiap siswa). Kemajuan peserta didik dalam melakukan swa asesmen
senantiasa dimonitor, sehingga secara terukur dapat dilihat adanya perbaikan dan
kemajuan.Capaian standar nasional oleh setiap individu siswa haruslah menjadi tolok
ukur bagi manajemen dan siswa sehingga secara terukur dapat dilihat capaiannya.
Pimpinan dan manajemen sekolah dapat menunjukkan suatu proses swa asesmen
yang dapat dicontoh oleh siswa. Pihak sekolah juga melibatkan pihak luar (orang tua,
masyarakat atau pimpinan dinas pendidikan di daerahnya) untuk memperkuat proses
swa asesmen siswa.
2. Asesmen sumatif.
Asesmen sumatif bentuk penilaian yang mengukur outcome belajar siswa yang
dilaksanakan setelah proses pembelajaran. Asesmen formatif memiliki kelebihan dan
kelemahan antara lain:
Tabel 1. Asesmen formatif memiliki kelebihan dan kelemahan
Kekuatan Kelemahan
Sangat dibutuhkan untuk menentukan nilai akhir siswa
Membuat ketergantungan yang berlebihan pada hasil asesmen sumatif
Dapat meningkatkan akuntabilitas guru / program / sekolah
Dapat meningkatkan berbagai upaya yang tidak benar hanya untuk mencapai hasil asesmen sumatif yang tinggi
Dapat digunakan untuk menentukan efektifitas proses pembelajaran.
Dapat mendorong guru untuk melakukan pendidikan untuk tes / pembelajaran tentang tes
Dapat memotivasi keterlibatan peserta didik dalam proses pembelajaran
Tidak banyak informasi yang dapat dipetik untuk perbaikan pembelajaran.
Dapat meningkatkan penguasaan materi pembelajaran peserta didik
Peserta menjadikan tes sebagai tujuan belajar, bukan perubahan tingkah laku untuk menghadapi masa depan.
4
Pelaksanaan asesmen sumatif dapat memberikan informasipenting antara lain:
(1) informasi tentang tingkat penguasaan (mastery) oleh siswa dalam mata pelajaran
tertentu; (2) sebagai dasar bagi membandingkan hasil belajar siswa dengan kelompok
norma atau kriteria kinerja eksternal; (3) alat untuk menentukan keefektifan proses
pembelajaran yang telah dilakukan; (4) informasi obyektif sebagai dasar memberikan
nilai akhir; (5) data komparatif untuk menentukan kedudukan siswa; (6) alat untuk
menentukan tanggung jawab guru dan sekolah tentang proses belajar siswa; (7)
informasi spesifik tentang isi pembelajaran yang dapat dipakai sebagai dasar bagi
orang tua / guru di pendidikan berikutnya; (8) informasi diagnostik tentang kekuatan
dankelemahan kinerja siswa; (9) data untuk menentukan tingkat capaian program atau
kriteria capaian standar dalam kurikulum (Rustaman:2012)
C. Literasi Asesmen
Literasi asesmen merupakan kemampuan dalam memahami prinsip-prinsip
dasar asesmen yang berkualitas, dan bertindak sesuai tujuan pembelajaran yang
dirancang dengan mengupayakan penggunaan yang seimbang berbagai asesmen
alternatif. Selanjutnya semua asesmen tersebut digunakan sebagai pemandu dalam
mengambil keputusan dan sebagai alat bantu mengajar (teaching tools) untuk
memanusiakan peserta didik (Stiggins,1994:8). Orang yang mampu melakukan
penilaian dan memahami prinsip dasar penilaian disebut assessment literates.Literasi
asesmen juga mencakuppengetahuan tetang seberapa sering asesmen dilakukan, apa
yang harus diases, dan bagaimana mempersiapkan siswa untuk diases.
Pentingnya literasi asesmen ditekankan oleh Heritage (2007:141), yang
menyatakan, "Para guru belajar bagaimana mengajar tanpa belajar banyak tentang
bagaimana menilai". Lebih lanjut, Stiggins (2004:16) menegaskan bahwa seperempat
sampai sepertiga waktu guru semestinya digunakan untuk penilaian terkait proses
pembelajaran. Oleh karena itu, guru harus mengetahui dan memahami prinsip-prinsip
penilaian.
Kemampuan untuk mengases diri sendiri dan orang lain membutuhkan
pemikiran kritis danreflektif. Menurut King dan Kitchener (1994) perbedaan antara
pemikiran kritis dan reflektif bahwa berpikir kritis berfokus pada logika induktif atau
deduktif, sedangkan berpikir reflektif berfokus pada asumsi tentang pengetahuan yang
5
berhubungan dengan situasi bermasalah. Sementara iru, Gamire dan Pearson (2006)
menyatakan bahwa kemampuan untuk mengasesmen terdiri tiga komponen.
Komponen-komponen ini adalah pengetahuan tentang asesmen, keterampilan berpikir
kritis dan asesmen reflektif, dan kemampuan dalam penggunaan pengetahuan konten
untuk memecahkan masalah praktis yakni mengases,mengevaluasi, dan meningkatkan
pembelajaran siswa.
Dalam pendidikan IPA, kemampuan dalam melakukan asesmen meliputi
pemahaman tentang fungsi, tujuan dan prinsip asesmen yang berkualitas. Asesmen
berfungsi untuk mengestimasi tingkat prestasi siswa setelah diberikan suatu pengaruh
pendidikan dan lingkungan, (Faisal dalam Rustaman,-:-). Sementara, menurut
Terrence Croocks (dalam Moss) asesmen berfungsi memandu siswa untuk : (1)
menilai apayang penting dipelajari; (2) mengetahui minat serta motivasi belajarnya;
(3) menilai kemampuan belajarnya; (4) mengembangkan strategi belajar (5) menilai
keterampilan yang dimilikinya; (6) merencanakan waktu belajarnya.
Asesmen asesmen harus diperhatikan prinsip-prinsip asesmen yang baik yakni
kondisi lingkungan asesmen yang konstruktif dan positif. Prinsip-prinsip tersebut
terdiri dari:
1. Pemikiran yang jelas dan komunikasi efektif; Meskipun tingkat pencapaian sering
kali diterjemahkan menjadi skor, ada dua fakta penting yang perlu dipahami. Pertama,
angka bukanlah satu-satunya cara untuk menyatakan pencapaian. Kita dapat
memanfaatkan kata-kata, gambar, ilustrasi, contoh, dan berbagai cara lainnya. Kedua,
simbol untuk menyatakan pencapaian siswa sama bermaknanya dan sama bergunanya
dengan definisi pencapaian dan kualitas penilaian yang digunakan untuk
menghasilkannya.
2. Guru yang memegang peranan; Guru berperan mengarahkan penilaian untuk
menentukan apa yang harus dipelajari oleh siswa dan apa yang siswa rasakan
berkaitan dengan penilaian yang dilakukan. Dalam berbagai konteks pendidikan, hasil
penilaian tingkat kotamadya/kabupaten, provinsi, nasional seolah-olah dianggap
sebagai satu-satunya hasil penilaian yang menentukan. Penilaian ini bahkan tidak
dapat disamakan dengan dengan penilaian kelas yang dilakukan oleh guru, berkaitan
dengan dampaknya terhadap keadaan siswa. Gurulah yang menentukan bagaimana
6
bentuk interaksi yang dilakukan dengan siswanya, rata-rata sebanyak satu kali setiap
dua atau tiga menit (mengajukan pertanyaan dan menginterpretasikan jawaban,
mengamati kinerja siswa, memeriksa pekerjaan rumah, menggunakan tes dan kuis).
Umumnya, penilaian dalam kelas berlangsung secara terus menerus.Dengan
demikian, jelas bahwa penilaian kelas adalah penilaian yang paling mudah dilakukan
oleh guru. Tidak perlu diragukan lagi, guru adalah pengendali sistem penilaian yang
menentukan keefektifan sekolah.
3. Siswa sebagai pengguna yang harus diperhatikan; Siswa adalah pihak yang paling
memanfaatkan hasil penilaian. Melalui penilaian kelas, mereka dapat mempelajari
kinerjanya serta mempelajari standar kualitas kinerjanya dari guru. Tidak seorang
pun, selain siswa, yang dapat memanfaatkan menggunakan hasil penilaian kelas yang
dilakukan oleh guru untuk menetapkan apa yang dapat mereka harapkan dari diri
mereka sendiri. Siswa dapat memperkirakan peluang keberhasilannya berdasarkan
kinerja yang ditunjukkan oleh hasil penilaian sebelumnya. Tidak ada satu keputusan
lain yang dapat memberikan pengaruh lebih besar pada keberhasilan siswa.
4. Sasaran yang jelas dan sesuai;Kita tidak dapat menilai hasil pendidikan secara
efektif jika kita tidak mengetahui dan memahami apa sebenarnya nilai keluaran
tersebut. Ada berbagai jenis keluaran dari sistem pendidikan kita, mulai dari
penguasaan materi sampai kemampuan menyelesaikan masalah yang kompleks.
5. Penilaian yang baik; Penilaian yang baik merupakan suatu keharusan dalam setiap
konteks penilaian. Lima standard yang harus dipenuhi untuk mencapai penilaian yang
baik meliputi: sasaran pencapaian yang jelas, maksud/tujuan yang jelas, metode yang
sesuai, kinerja contoh yang layak, pembatasan, dan adanya upaya untuk mencegah
kesalahan pengukuran.
6. Perhatian terhadap dampak antarpersonal; Kita harus selalu berusaha
melaksanakan penilaian yang baik, mengkomunikasikan hasilnya secara hati-hati dan
pribadi, dan mengantisipasi hasilnya sehingga dapat mempersiapkan diri untuk
memberikan dukungan terhadap siswa yang pencapaiannya rendah. Semakin muda
siswa, semakin penting adanya bimbingan bagi mereka.
7. Penilaian sebagai pembelajaran; Penilaian dan pengajaran dapat menjadi suatu
kesatuan. Potensi terbesar yang tersimpan dalam penilaian kelas adalah
7
kemampuannya untuk menjadikan siswa sebagai mitra penuh dalam proses penilaian.
Siswa yang mampu mendalami sasaran pencapaian secara menyeluruh mampu secara
percaya diri melakukan evaluasi, baik terhadap hasil kerjanya sendiri maupun hasil
kerja temannya.Tantangan yang kita hadapi dalam penilaian kelas adalah memastikan
bahwa siswa memiliki seluruh informasi yang diperlukannya, dalam bentuk yang
mudah dipahami, pada waktu yang tepat sehingga dapat digunakan secara efektif.
Asesmen yang baik hendaknya memenuhi standar spesifik asesmen berkualitas
yang terdiri dari (a) target yang jelas dan tepat; (b) tujuan asesmen yang jelas; (c)
metode yang sesuai dengan target dan tujuan; (d) penentuan sampel yang tepat; dan (e)
pencegahan atau minimalisir terhadap bias dan eror dalam menilai.
Sejalan dengan uraian diatas, asesmen dikatakan baik jika memenuhi
pesyaratan tes:
1. Validitas; Anderson (dalam Arikunto, 2008; 65) A test is valid is measure what it
purpose to measure atau dapat artikan sebuah tes dikatakan disebut valid, jika dapat
tepat mengukur apa yang hendak diukur.
2. Reliabilitas; Tes yang reliabel (dapat dipercaya), jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Anderson (dalam Arikunto, 2008; 87) A reliable
measure in one that provides consistent and stable indication of the characteristic
being investigated.
3. Objektivitas; Tes yang baik harus bersifat objektif, tidak ada unsur pribadi
(subjektivitas) yang mempengaruhi. Arikunto (2008) faktor yang mempengaruhi
subjektivitas.
4. Bentuk tes; Tes yang berbentuk uraian akan memberikan peluang untuk memberikan
penilaian subjektif, oleh karena itu dalam mengvaluasi tes perlu rentangan derajat
skor dalam item soal uraian.
5. Penilai; Subjektivitas penilai akan dapat mempengerahi secara leluasa terutama
dalam bentuk tes uraian, seperti faktor kesan terhadap siswa, tulisan, bahasa,
kelelahan dsb, untuk menghindari hal tersebut maka penilai dalam melakukan
evaluasi pertama secara kontinuitas (terus menerus) dalam arti bisa dilakukan lebih
dari 2 kali dan komprehensip yakni menyeluruh isi materi, aspek berpikir dan teknik
tes yang diguakan.
8
6. Praktibilitas (Practicability); Tes dikatakan memiliki praktibilitas yang tinggi,
apabila bersifat praktis dan mudah pengadminstrasian termasuk mudah dilaksanakan,
mudah pemeriksaan dan dilengkapi petunjuk yang jelas.
7. Ekonomis; Tes yang baik tidak terlalu membutuhkan biaya yang terlalu mahal,
tenaga yang banyak dan waktu yang lama.
Sejalan dengan perkembangan pendidikan, peranan dan pelaksanaan asesmen
mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan
masa sekarang yakni sebagai berikut:
Tabel 2. Perkembangan pendidikan, peranan dan pelaksanaan asesmen mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan masa sekarang
Peranan Dulu Sekarang Guru Mengajar Mendefinisikan hasil pembelajaran,
mengajar, melaksanakan penilaian utama
Siswa Dinilai Menilai diri sendiri dan temanKepala Sekolah Menginterpretasi
hasil ujian terstandard
Menginterpretasi hasil ujian dan menyediakan dukungan terhadap penilaian kelas
Pelaksanaan Dulu Sekarang
Tujuan Akuntabilitas Akuntabilitas, pembelajaran
Penggunaan
Penyaringan hasil pengujian dari atas ke bawah
Penyaringan hasil pengujian dari atas ke bawah dan dari kelas ke atas
Sasaran Bersifat umumTidak terbuka
Sangat terarahBersifat terbuka
Metode Terutama berupa respon terpilih
Terutama berupa penilaian kinerja dan essay dengan beberapa respon terpilih
9
Sementara itu, Berdasarkan National Science Education Standard in the United
States (National Research Council, 1996: 100) perubahan fokus yang terjadi pada
standard penilaian adalah sebagai berikut.
Tabel 3 Perubahan fokus yang terjadi pada standar penilaian berdasarkan National Science Education Standard in the United States
Hal yang dikurangi Hal yang diutamakanMenilai yang mudah diukur Menilai yang paling berharga
Menilai pengetahuan yang memiliki ciri yang jelas
Menilai pengetahuan yang kaya dan berstruktur baik
Menilai pengetahuan yang bersifat ilmiah
Menilai pemahaman dan pemikiran ilmiah
Menilai untuk mempelajari apa yang tidak dipahami siswa
Menilai untuk mempelajari apa yang dipahami siswa
Hanya melakukan penilaian atas pencapaian
Menilai pencapaian dan peluang untuk belajar
Penilaian akhir dilakukan oleh guru
Siswa terlibat dalam penilaian yang sedang berlangsung atas hasil kerjanya dan hasil kerja temannya
Pengembangan penilaian eksternal hanya oleh ahli
Guru terlibat dalam pengembangan penilaian eksternal
D. Analisis Pokok Uji
1. Pengertian
Analisis pokok uji adalah suatu prosedur yang sistematis, untuk menyelidiki
informasi-informasi khusus terhadap alat evaluasi yang disusun.
2. Tujuan
Analisis pokok uji lebih banyak digunakan pada alat evauasi yang bersifat
obejektif seperi tes pilihan ganda (multiple choice), mengengingat untuk tes yang
bersifat uraian belum banyak dikaji tentang standar baku yang digunakan, namun
demikian semua alat evaluasi dapat dianalisis pokok uji sesuai dengan ketentuan
masing-masing. Tujuan analisis pokok uji sebagai berikut.
10
a. Upaya memperbaiki atau meningkatkan kualitas alat evaluasi.
b. Mengidentifikasi soal yang baik, kurang baik dan jelek.
c. Mendiagnostik kemampuan siswa.
d. Mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih baik.
3. Aspek analisis pokok uji meliputi,
a. Penyusunan instrumen
b. Menentukan tingkat validitas soal.
c. Menentukan tingkat reliabilitas soal.
d. Menentukan tingkat kesulitan soal (difficulty level of an item).
e. Menentukan daya pembeda (discriminating power).
f. Menentukan pengecoh.
4. Jenis Validitas
Tes yang jika dapat digunakan untuk mengukur tujuan tertentu, maka tes tersebut
dikatakan valid. R.L. Thondrike dan H.P Hagen (1977 dalam Arifin, 2009) mengatakan
validity is always in relation to a spesific decesion or use. Sugiyomo (2011; 350)
validitas internal instrumen berupa tes harus memneuhi validitas kontruksi dan validitas
isi, jika instrumen untuk mengukur sikap cukup menggunakan validitas kontruksi. Jenis
validitas yang dikembangkan Arikunto (2008) sebagai berikut.
a. Validas logis
Tes yang valid, secara logis sesuai dengan aturan yang telah ditentukan, misalnya soal
yang lazim digunakan untuk jenjang SMP secara logis sesuai dengan materi SMP,
kecuali jika digunakan untuk kepentingan seleksi khusus olimpiade. Semua alat
evaluasi, soal harus tersusun secara validitas logis.
b. Validitas empiris
Tes yang valid secara pengalaman (empiris) sudah teruji. Validitas empiris meliputi
empat hal berikut.
1. Validitas isi (content validity)
Tes dikatakan mempunyai validitas isi, jika dapat mengukur isi materi dan tujuan
pembelejaran. Soal objektif maupun soal uraian dapat dapat dilakukan validitas isi
11
oleh pakar ahli melaui judment. Seorang guru biologi jika akan memastikan soal
untuk diagnostik peserta didik maka harus meninjau validitas isi.
2. Validitas kontruksi (construct validity)
Tes memiliki validitas kontruksi, apabila butir-butir soal dapat mengukur aspek
berpikir siswa. Seorang guru biologi jika memberikan soal postes untuk
diagnostik peserta didik maka harus meninjau validitas kontruksi. Antara validitas
isi dan kontruksi, keduanya saling berkaitan
3. Validitas empiris atau validitas ada sekarang (concurrent validity)
Tes memiliki validitas empiris jika secara pengalaman, sudah pernah diujikan dan
untuk perhitungan dijelaskan pada pembahasan dibawah ini.
4. Validitas prediksi (predictive validity)
Tes memiliki validitas empiris, jika dapat memprediksi kemampuan peserta didik,
sebagai contoh tes masuk perguruan tinggi diharapkan dapat menyeleksi
mahasiswa yang dapat mampu mengikuti proses studi perguruan tinggi.
Prinsip analisa soal yang valid disesuaikan dengan kegunaan evaluasi, agar
memperoleh tingkat kevalidan Grounlund (1977 dalam Arifin, 2009) menjelaskan ada
tiga faktor yang mempengaruhi validitas soal sebagai berikut
a. faktor instrumen evaluasi
Kualitas instrumen termasuk daya pembeda, tingkat kesulitan, pengecoh, bahasa
yang komunikatif da jelas sangat mempengaruhi validitas soal
b. faktor administrasi dan penskoran
Proses adminstrasi dan penskoran yang tidak tepat akan mempengaruhi validitas
soal, diantaranya semakin banyak siswa yang bekerjasama dalam tes (contek menyontek),
maka nilai kevalidan menjadi bekurang, karena tes tidak bisa mengukur secara akurat
kemampuan peserta didik
c. faktor jawaban dari peserta didik
Peserta didik yang memilih jawaban dengan mandiri atau spekulasi akan
mempengaruhi kevalidan tes.
12
5. Analisis pokok uji
1. Penyusunan instrumen
Analisis pokok uji berkaitan dengan penyusunan instrumen meliputi standar
penggunaan bahasa dalam menyusun tes maupun non tes, petunjuk instrumen dan
proporsi jumlah instrumen yang digunakan berkaitan dengan waktu yang dibutuhkan
peserta tes (testee). Penyusunan instrumen yang mengacu hal tersebut akan meningkatkan
kualitas hasil evaluasi.
Arifin (2009; 132) menjealaskan penyusunan intrumen baik soal pilihan ganda
dan uraian, dapat dianalisis sebagai berikut; 1) secara rasional dan 2) secara empiris.
Tabel 4. Tela’ah soal secara rasional
Nomor soal: Jenis soal:No Aspek yang ditelaah ya tidak
A. Materi1 Soal sesuai dengan indikator2 Batasan pertanyaan dan jawaban yang diharapkan jelas3 Isi materi sesuai dengan tujuan tes4 Isi materi sesuai dengan jenjang sekolah
B. Kontruksi5 Ada petunjuk soal tentang menjawab soal6 Ada pedoman penskoran7 Gambar, grafik, label, diagram dan sejenisnya disajikan dengan
jelas dan terbacaC. Bahasa
8 Rumusan soal komunikatif9 Rumusan soal tidak menggunakan kata yang menimbulkan
penafsiran ganda10 Rumusan soal tidak menggunakan negatif ganda11 Menggunakan bahasa baku Catatan;
2. Validitas
Sebuah instrumen dikatakan valid apabila valis secara logis, isi, empiris, prediksi,
sehingga dapat mengungkapkan data dari variabel yang diteliti secara tepat. Sebuah tes
dapat diukur tingkat kevalidan dengan meggunakan teknik korelasi product moment yang
ditemukan oleh Pearson dengan rumus sebagai berikut:
13
a. Korelasi product moment dengan simpangan
rxy= ∑ xy
√(∑ x2)(∑ y2)
Keterangan:rxy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x= X-Xrata-rata dan y= Y-Yrata-rata) Σ xy = jumlah perkalian skor item dan skor totalΣ x2 = jumlah kuadrat skor itemΣ y2 = jumlah kuadrat skor total
b. Korelasi product moment dengan angka kasar
rxy= N ∑ XY−∑ X ∑Y
√[ N ∑ X2−(∑ X)2 ][ N ∑Y 2−(∑Y )2]
Keterangan:rxy = koefisien korelasi tiap itemN = banyaknya subjek uji cobaΣ X = jumlah skor itemΣY = jumlah skor totalΣ X2 = jumlah kuadrat skor itemΣ Y2 = jumlah kuadrat skor totalΣ XY = jumlah perkalian skor item dan skor total
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
a. Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 5.
Tabel 5. Interval koefesien korelasi
Diadaptasi dari Arikunto (2008).
b. Hasil rxy dikonsultasikan dengan rtabel product moment dengan =5%. Jika rxy >
rtabel maka alat ukur dikatakan valid. Untuk mengukur validitas pengukuran
keterampilan kooperatif dilakukan dengan uji korelasi spearman rho. Hasil
korelasi menghasilkan signifikansi ≤ 0,05 maka terdapat kesesuaian yang
signifikan (Sugiyono, 2007).
14
Interval rxy Kriteria
0,00 rxy 0,20 sangat rendah
0,20 < rxy 0,40 Rendah
0,40 < rxy 0,60 Cukup
0,60 < rxy 0,80 Tinggi0,80 < rxy < 0,10 sangat tinggi
Rumus validitas lain dapat menggunakan rumus γpbi sebagai berikut:
γpbi = Mp−Mt
St √ Pq
Keterangan:γpbi = koefisien korelas biseralMp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnyaMt = rerata skor totalSt = Standar deviasi dari skor totalp = proporsi siswa yang menjawab benar (p = banyaknya siswa yang benar)
jumlah seluruh siswa q = proporsi siswa yang menjawab salah, (q = 1-p)
3. Reliabilitas
Alat instrumen evaluasi untuk dapat digunakan sebagai alat ukur yang dapat
dipercaya, harus memiliki nilai reliabel, sehingga ketika akan digunakan mempunyai
ukuran yang konsisten. Anastasi (1976 dalam Arifin, 2009) reliability refers to the
consistency of score obtained by the same persons when reexamined the same test on
different occasion or white different sets of equivalent items or under other variable
exmining conditions. Arikunto (2008) menjelaskan cara mengukur reliabilitas soal,
dengan menggunakan tiga teknik;
a. Metode bentuk pararel (equivalent)
Tes yang reliabel jika 2 tes atau lebih diujikan kepada siswa, misalnya ada 2 jenis tes
dengan tingkat kesulitan sama, namun butir soal yang berbeda kemudian diteskan
kepada siswa dan hasil kedua tes dikorelasikan, contohnya pada tabel 5 berikut ini,
siswa yang memiliki hasil belajar tinggi akan tetap terlihat tinggi pada tipe soal I dan
II khususnya pada peserta didik kode A dan D dan peserta didik dengan kode A dan
D menunjukan hasil belajar yang lebih rendah, sehingga tes tipe I dan II menunjukan
hasil yang reliabel, walaupun ada perbedaan angka tapi secara umum siswa yang
diteskan tipe II mengalami kenaikan yang sama. Hasil yang tidak reliabel jika hasil
belajar tipe II nilai yang diperoleh peserta didik kebalikannya dengan tipe I misal
peserta didik kode A tes tipe I memperoleh nilai 80 dan nilai tes tipe II nilai 50,
sedangkan peserta didik kode B tes tipe I memperoleh nilai 50 dan nilai tes tipe II
nilai 90. Reliabilitas memiliki makna kekonsistenan, soal yang reliabel semestinya
15
dapat menunjukan hasil yang konsisten pada prestasi siswa golongan upper dan
lower.
Tabel 6. Pengukuran reliabilitas menggunakan metode bentuk pararel
Kode peserta didik Tes tipe I Tes tipe II
A 80 83
B 50 53
C 60 62
D 90 94
b. Metode tes ulang (test-retest method)
Tes yang reliabel jika 1 tes telah diujikan 2 dua kali atau lebih kepada siswa yang
sama, hasil tes kedua dapat dihitung korelasinya. Pendekatan metode tes ulang
hampir sama dengan bentuk pararel namun yang berbeda tes yang akan digunakan
pada metode tes ulang terdiri satu jenis. Metode tes ulang menjadi tipe tes yang
sering digunakan untuk mengukur reliabilitas khususnya evaluasi yang sifatnya non
objektif seperti tes uraian. Ada beberapa trik-trik penerapan yang biasa digunakan
untuk menerapkan reliabilitas menggunakan metode tes ulang yakni dengan
pemberian suatu tes dilakukan pada hari tertentu, kemudian diberikan tes lagi pada
H+1 dan H+7, kemudian dapat dinilai tingkat reliabelnya.
c. Menggunakan rumus reliabilitas
Analisis relibilitas dengan menggunakan rumus reliabilitas, dapat dilakukan dengan
memberikan tes hanya 1 kali dan dapat diukur tingkat reliabilitasnya.
1. Penggunaan rumus K-R 20
Analisis realibilitas bentuk tes pilihan ganda menggunakan KR-20 yang
dikemukakan oleh Kuder dan Richardson. (Arikunto, 2008) bahwa penggunaan
rumus KR 20 dapat menghasilkan tingkat relibilitas dibandingkan dengan KR 21,
kedua rumus tersebut tanpa menggunakan teknik belahan ganjil-genap atau awal-
akhir.
r 11=( n
n−1)( S2−∑ pq
S2 )
16
Keterangan:r11 = reliabilitas tes secara keseluruhan p = proporsi siswa yang menjawab benarq = proporsi siswa yang menjawab salah (q =1 – p)Σpq = jumlah hasil perkalian antara p dan qn = banyaknya itemS = standar deviasi dari tes (standar deviasi adalah akar dari varians)
Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan
harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang
diujikan reliabel. Harga r11 yang diperoleh diinterpretasikan dengan derajat reabilitas
pada tabel 7 dibawah ini.
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
1). Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 6.
Tabel 7. Interval reliabilias (r11)
* Diadaptasi dari Arikunto (2008)
2). Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan
harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang
diujikan reliabel. rtabel product moment dengan =5%. Jika r11 > rtabel maka alat
ukur dikatakan reliabel.
2. Penggunaan rumus K-R 21
r 11=( nn−1 )(1− M−(n−M )
nS t2
)
Keterangan;M = rerata skor totalSt
2 = standar deviasi total
3. Penggunaan rumus Spearman-Brown.
17
Interval r11 Kriteria
0,00 r11 0,20 sangat rendah
0,20 < r11 0,40 Rendah
0,40 < r11 0,60 Cukup
0,60 < r11 0,80 Tinggi
0,80 < r11 0,10 sangat tinggi
Analisis reliabilitas menggunakan rumus speraman-brown, dikenal dengan metode
belah dua (split half method) yakni dengan dua cara membelah butir soal, 1)
membelah item-item genap dan item-item ganjil, 2) membelah item nomor awal da
akhir, sehingga agar dapat membelah butir soal harus genap. Oleh karena itu indek
korelasi menunjukan hubungan dua belahan instrument, adapun rumusnya sebagai
berikut.
r 11=2 xr 1
212
(1+r 12
12
) ,
Nilai rxy dalam belahan ini disebut dengan istilah r 12
12 atau r ganjil-genap
(Arikunto, 2002)
Hasil analisa reliabilitas menggunakan rumus Speraman-Brown dengan teknik dua
belahan, seringkali menunjukan hasil yang berbeda, jika hasilnya negatif maka menunjukan
tes yang tidak reliabel dan jika hasilnya positif maka dapat diukur dengan menggunakan
indeks reliabelitas. Oleh karena itu dalam menggunakan penelitian, kita dapat menggunakan
salah satu teknik yang dipandang dapat menghasilkanhasil yang lebih baik.
4. Penggunaan rumus Flanagan
Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
r 11=2(1−V 1 x V 2
V t
) dimana V=
∑ X−(∑ X )2
NN
Keterangan:V1 = varians beahan pertama (varians skor butir-butir ganjil)V2 = varians belahan kedua (varians skor butir-butir genap)Vt = varians total (Arikunto, 2002).
5. Penggunaan rumus Rulon
Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
18
r 11=1−V d
V t
Keterangan:
Vd = varians different
d = skor belahan awal dikurangi skor belahan akhir (Arikunto, 2002).
6. Penggunaan rumus Alpha
Penggunaan rumus Alpha, secara khusus untuk mengukur reliabilitas soal dalam
bentuk uraian, maka dapat dilakukan dengan langkah berikut.
1. Menentukan gradien penilaian tiap item soal, misalnya soal 1, penskoran antara
0-5, soal 2 penskoran antara 0-10 dst.
2. Menghitung koefisien korelasi dengan menggunakan rumus alpha;
r11¿(n
(n−1))(1−
∑ σ12
σ12 ) dimana
σ 2=∑ X−
(∑ X)2
NN
Keterangan:r11 = reliabilitas yang dicari∑σ 1
2 = jumlah varians skor setiap item soal
σ 12 = varians total (Arikunto, 2002).
Contoh perhitugan mencari reliabilitas soal uraian pada tabel 8:
Tabel 8. Perhitugan mencari reliabilitas soal uraian
No
Nama Nomor Itom Skor total Kuadrat skor total1 2 3 4 5 6
1 A 10 6 8 8 10 10 52 27042 B 6 4 4 6 6 5 31 9613 C 8 2 6 8 7 8 39 15214 D 7 3 7 7 6 6 36 12965 E 0 5 3 2 4 4 18 3246 F 2 4 2 8 6 8 30 9007 G 4 3 6 6 6 6 31 9618 H 5 5 5 7 7 7 36 12969 I 5 5 4 6 8 5 33 108610 J 3 6 3 4 6 6 28 784
Jumlah50 43 48 62 66 65 334 11836
Jumlah 328 201 264 418 458 451 2120
19
kuadrat
Diketahui σ 12 = 7,8; σ 2
2 = 1,61; σ 32 = 3,36; σ 4
2 = 3,36 σ 52 = 2,24; σ 6
2 = 2,85 dan varian total (
σ 2¿ berjumlah 68,40, kemudian dimasukan dala rumus alpha diperoleh 0,83, sehingga
interpretasi tingkat reliabilitas sangat tinggi (Arikunto, 2008).
4. Tingkat kesulitan
Tingkat kesulitan bisanya digunakan untuk menganalisa soal jenis objektif. Soal
yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sulit, soal yang terlalu
mudah akan menyebabkan peserta didik tidak dapat merangsang berfikit tingkat tinggi,
sedangkan soal yang terlalu sulit akan menyebabkan siswa berputus asa. Sriyati (2012)
menuturkan keseimbangan tingat kesulitan mengacu pada kurva normal yakni 30%
mudah, 50% sedang dan 20% sulit. Keseimbangan tingkat kesulitan pada prinsipnya
mengacu pada tujuan tes, jika tes tersebut digunakan untuk menseleksi kompetisi
olimpiade mata pelajaran, maka bisa saja proporsi tigkat kesulitan bisa diterapkan hingga
diatas 75%.
Analisa tingkat kesulitan, dapat dijadikan dalam penyusunan soal, seperti soal
yang mudah akan menjadi lebih baik jika diposisikan di awal soal, mengingat soal yang
mudah dapat meningkatkan motivasi siswa untuk mengerjakan soal. Analisis pokok uji
dapat dilakukan dengan mengukur tingkat kesulitan soal, sebagai berikut.
Keterangan:P = indek kesulitanB = banyaknya siswa yang menjawab benar.JS = jumlah seluruh siswa peserta tes.
Tingkat kesulitan diinterpretasikan pada tabel 9, dibawah ini.
Tabel 9. Interval tingkat kesulitan
* Diadaptasi dari Arikunto (2008).
20
JS
BP
Interval P Kriteria
0,00 P 0,30 Sulit
0,30 < P 0,70 Sedang
0,70 < P 1,00 Mudah
5. Daya pembedaAnalisis pokok uji soal objektif misalnya multiple choice dapat dilakukan dengan
mengukur daya pembeda soal. Tahapan awal dalam pengukuran daya pembeda, dengan
cara menentukan kelompok atas (upper group) dan kelompok bawah (lower group),
dengan mengacu pada nilai yang diperoleh berdasarkan tes. Rumus yang digunakan
untuk mencari daya pembeda sebagai berikut.
DP=BAJA
−BBJB
=PA−PB
Keterangan:
DP = daya pembedaJA = banyaknya peserta kelompok atasJB = banyaknya peserta kelompok bawahBA = banyaknya peserta kelompok atas yang menjawab benarBB = banyaknya peserta kelompok bawah yang menjawab benarPA = proporsi peserta kelompok atas yang menjawab benarPB = proporsi peserta kelompok bawah yang menjawab benar
Tabel 10. Interval daya pembeda
Interval DP Kriteria
0,00 DP 0,20 Jelek
0,20 < DP 0,40 Cukup
0,40 < DP 0,70 Baik
0,70 < DP 1,00 Baik sekali
* Diadaptasi dari Arikunto (2008).
6. Tingkat pengecoh (distraktor)
Tingkat pengecoh merupakan distribusi peserta tes (testee) dalam memilih jawaban,
dengan melihat pola jawaban soal dapat diketahui, 1) taraf kesulitan, 2) daya
pembeda soal, 3) baik dan tidaknya pengecoh (distraktor). Daya pembeda yang jelek,
diduga terjadi akibat adanya pengecoh (distraktor) yang tidak berfungsi dengan baik,
sehingga untuk peningkatan tingkat daya pembemda maka pilihan jawaban dapat
diganti yang lebih baik. Suatu distraktor dapat diperlakukan dengan cara, 1) diterima
karena sudah baik, 2) ditolak kareana tidak baik, 3) ditulis kembali karena kurang
baik (Arikunto, 2008; 220). Sriyati (2012) menuturkan analisis pengecoh dilakukan
denagan memperhatikan ciri sebagai berikut, sebagai berikut.
a. Ada yang memilih, khususnya dari kelompok bawah kelompok bawah
b. Dipilih lebih banyak oleh kelompok rendah dari pada kelompok tinggi
21
c. Jumlah pemilih kelompok tinggi pada pengecoh itu tidak menyamai pada
kelompok rendah yang memilih kunci jawaban yang benar.
d. Minimial distraktor dipilih oleh peserta tes sebanyak 5%.
Contoh analisis sebuah item soal tipe pilihaan ganda (multiple choice), sebagai
berikut. Diketahui jumlah siswa 60, kunci jawaban ada di pilihan D, pada table 9 berikut.
Tabel 9. Analisis item soal
Pilihan jawaban A B C D* Jumlah
Kelompok atas 5 6 3 16 30
Kelompok bawah 8 11 8 3 30
Jumlah 13 17 11 19 60
1). Tingkat kesulitan
P = 16 = 0,3 Tingkat kesulitan soal tergolong tipe sulit
60
2). Daya pembeda
DP = PA-PB = 0,53-0,1 = 0,43
Daya pembeda soal tergolong baik
3). Pengecoh soal, tergolong sudah baik, karena tiap distraktor (pengecoh) terpilih
oleh peserta didik 5% dari jumlah peserta didik atau minimal 3 orang memilih
distraktor.
Perkembangan analisis pokok uji, sangat dibantu oleh kajian statistik dan aplikasi
teknologi seperti Microsoft Office Excel, SPSS dll.
7. Pengembangan tes
a. Pengembangan tes bentuk uraian
Arifin (2009; 129) menjelaskan bentuk tes uraian ditinjau dari luas sempitnya materi
dibedakan menjadi dua jenis, sebagai berikut:
1. Uraian terbatas (restricted respons items)
Peserta didik dalam menjawab tes uraian memiliki batasan-batasan tertentu,
sebagai contoh sebagai berikut:
22
1) Jelaskan yang dimaksud dengan fotorespirasi
2) Jelaskan proses gilkolisis dan siklus krebs?
3) ……. merupakan organela yang berfungsi dalam respirasi seluler
2. Uraian bebas (extended respons items)
Peserta didik dalam menjawab tes uraian ini memiliki kebebasan dengan cara dan
sistematika sendiri, sebagai contoh sebagai berikut:
1) Jelaskan manfaat perkembangan bioteknologi?
2) Jelaskan dampak pencemaran insektisida?
Tes uraian memiliki keunggulan dalam menggali pengetahuan peserta didik, namun
dalam melakukan penilaian memiliki kesulitan yang lebih tinggi dibandingkan tes
objektif dan kecenderungan bersifat subjektif, oleh karena itu perlu cara untuk
mencari solusi atas kesulitan dan subjektivitas penilaian, sebagai berikut:
1. Menyusun bentuk uraian objektif
Pensokoran bentuk uraian objektif, biasanya digunakan dalam penskoran jawaban
uraian yang singkat. Skor hanya ditentukan 2 kategori yakni benar diberi skor 1,
diberi salah skor 0, misalnya jawaban uraian berupa mitokondria, jika benar skor1
dan jika salah skor 0.
2. Menyusun bentuk uraian non objektif
Dalam penskoran soal uraian non objektif, skor dijabarkan dalam bentuk
rentangan, besarnya rentangan ditentukan berdasarkan dengan kompleksitas
jawaban. Misalnya penjelasan tahapan glikolisis rentangan skor 1-10, dengan isi
jawaban meliputi reaksi enzimatis, pembentukan air dan subtrat, pembentukan
ATP dan NADPH. Guru dapat menilai soal dengan mengacu pada kelengkapan
jawaban sol uraian.
3. Pendekatan metode pengoreksian
a. Metode per lembar, yakni guru mengoreksi soal uraian pada tiap lembar dari
soal nomor awal sampai soal akhir. Keunggulan metode tersebut memerlukan
waktu yang lebih cepat, tinjauan biaya lebih murah, namun kelemahannya
penilaian skor antara peserta didik satu dengan yang lainnya cenderung
berbeda pada kualitas jawaban yang sama, sehingga untuk mengatasinya perlu
23
menyusun bentuk uraian objektif maupun uraian non objektif yang sudah
dijelaskan sebelumnya.
b. Metode per nomor, yakni guru mengoreksi soal uraian pada tiap nomor untuk
seluruh peserta didik, sebagai contoh guru mengoreksi nomor 1 untuk seluruh
peserta didik, kemudina dilanjutkan nomor 2 untuk seluruh peserta didik dan
seterusnya. Keunggulan metode tersebut akan sangat membantu dalam
memberikan skor dan membandingkatan jawaban antara peserta didik, namun
kekurangannya membutuhkan waktu yang lebih lama dibandingkan metode per
lembar.
c. Metode bersilang, yakni guru mengoreksi jawaban peserta didik dengan jalan
hasil koreksi dari satu korektor, kemudian dikoreksi (dinilai) ke korektor
lainnya. Keunggulan metode tersebut faktor subjektif bisa dikurangi namun
kelemahnnya membutuhkan waktu lebih lama dan tenaga yang lebih banyak.
Metode bersilang dianjurkan dalam penilaian untuk kepentingan yang bersifat
selektif, misalnya dalam penentuan tingkat peserta didik.
d. Point method merupakan metode pengkoreksian jawaban dibandingkan dengan
jawaban ideal yang telah ditetapkan dalam kunci jawaban, sehingga penskoran
sangat bergantung dengan tingkat kepadanan. Metode tersebut sangat tepat
digunakan untuk uraian terbatas.
e. Rating method yaitu setiap jawaban peserta didik ditetapkan dalam salah satu
kelompok yang sudah dipilah-pilah berdasarkan kualitasnya, misalnya sebuah
soal akan diberi skor antara 0-10, metode ini seperti penyusunan bentuk uraian
non objektif, sehingga tepat digunakan pada soal uraian soal uraian bebas
b. Pengembangan tes bentuk objektif
Tes bentuk objektif memiliki keunggulan mudah dikoreksi dan unsur objektifnya
lebih kuat dibandingkan soal uraian, sehingga siapapun yang mengoreksi maka akan
sama hasilnya. Perkembangan teknologi juga ikut membantu penilaian tes objektif
dalam sistem komputerisasi, sehingga aplikasinya sering digunakan misalnya tes
seleksi perguruan tinggi, tes toefl, tes CPNS. Kelemahan tes bentuk objektif
dimungkinkan unsur jawaban spekulasi menjadi benar dan jawaban peserta didik
24
terbatas sehingga belum bisa mengeksplor pengetahuan peserta didik lebih luas. Oleh
karena itu perlu meragamkan bentuk tes pilihan ganda diantaranya sebagai berikut:
1. Pilihan ganda (multiple choice)
Pilihan ganda merupakan jenis soal yang sering digunakan, karena memiliki
keunggulan diantaranya 1) mudah dikoreksi, 2) memiliki pengecoh (distraktor
yang banyak, 3) pengukuran untuk validitas dan reliabelitas lebih mudah.
Implimentasi dalam tes yang standar digunakan dalam proses pembelajaran
hendaknya memperhatikan hal-hal sebagai berikut:
a. Petunjuk soal jelas, meliputi teknis pengisian, waktu pelaksanaan dsb.
b. Bahasa dalam soal pilihan ganda standar baku.
c. Jika ada gambar, tabel atau bagan tersusun jelas dan komunikatif.
d. Memiliki komposisi soal yang mudah, sedang dan sulit. Soal yang mudah
hendaknya diletakan urutan bagian depan, karena dapat memotivasi peserta
didik dalam menjawab soal, namun jika soal sulit kecenderungan siswa
motivasi akan menurun khususnya bagi peserta didik dengan prestasi
golongan lower.
e. Pola jawaban soal tidak mengarahkan membentuk pola seperti jawaban no 1-5
kunci jawaban AAAAA dan kunci jawaban no 6-10 BBBBB, karena dapat
membantu spekulasi jawaban peserta didik.
f. Penggunaan soal negatif, sebaiknya diberi tanda khusus dengan bercetak tebal
seperti kecuali atau ditulis miring kecuali, untuk memperhatikan kejelasan
pada peserta tes.
g. Tidak menggunakan negatif ganda, karena akan menjadi kesulitan peserta
didik dalam memahami soal. Contoh soal pertanyaan negatif ganda sebegai
berikut. Organela sel yang tidak telibat langsung dalam sintesis protein
kecuali…, jika disusun pertanyaan yang tepat maka kata negatif cukup satu
saja.
Soal pilihan ganda untuk kepentingan penelitian menyusunan tes sangat perlu
diperhatiakan validitas, reliabelitas, tingkat kesukaran, daya pembeda dan
pengecoh, sehingga dalam penyusunan perlu memperhatikan beberapa pola
sebagai berikut (Arifin, 2009; 132):
25
Petunjuk.
Pilihlah jawaban soal pilihan ganda dengan jawaban menulis huruf A, B, C, D
atau E sesuai dengan jawaban yang paling tepat.
a. Distracters yaitu setiap pertanyaan atau pernyataan mempunyai beberapa
pilihan jawaban yang salah dan satu pilihan jawaban yang paling tepat,
contoh.
1. Jika darah seorang ditetesi serum anti A tidak menggumpal dan ditetesi serum anti B menggumpal, kemungkinan golongan darahnya...A. AB. ABC. A dan ABD. OE. B Jawaban A
b. Analisis hubungan antara hal yakni bentuk soal dapat digunakan untuk
menunjukan pernyataan (statement) dan alasan (reason), sehingga siswa
dapat diketahui tingkat pemahamanya lebih tinggi. Jenis soal ini diperlukan
keterangan untuk memilih jawaban misalnya.
a. Jika pernyataan benar, alasan benar dan alasan merupakan sebab dari
pernyataan.
b. Jika pernyataan benar, alasan benar tetapi merupakan alasan tidak
merupakan sebab dari pernyataan.
c. Jika pernyataan benar tetapi alasan salah.
d. Jika pernyataan salah tetapi alasan benar.
e. Jika pernyataan salah tetapi alasan salah.
Soal:
Retikulum endoplasma halus berfungsi dalam sintesis protein sebab di bagian
retikulum endoplasma melekat ribosom.
Penjelasan:
1. Retikulum endoplasma halus berfungsi dalam sintesis lemak (pernyatan
salah)
2. Retikulum endoplasma (RE) terdapat ribosom yang dikenal dalam RE
kasar (pernyataan benar)
26
Jadi jawabannya D
c. Variasi negatif yakni setiap pertanyaan atau pernyataan memiliki jawaban
yang benar namun disediakan jawaban yang salah. Tugas peserta didik
memilih jawaban yang salah, contoh.
Faktor-faktor yang mempengaruhi pembekuan darah, Kecuali...A. TromboplastinB. TrombokinaseC. Ca-
D. Vitamin KE. K+
Jadi jawabanya Ed. Variasi berganda yaitu memilih beberapa kemungkinan jawaban yang hampir
semuanya benar, tetapi ada satu jawaban yang paling benar contoh.
Sintesis polipeptida dimulai pada saat…
A. Menempelnya ribosom subunit kecil dan sub unit besar
B. mRNA meninggalkan nukleus ke sitosol
C. Ribosom bertemu mRNA kodon AUG
D. Ribosom melekat pada RE
E. mRNA menempel ribosom
Jawaban C
e. Pertanyaaan dalam bentuk studi kasus.
Ibu Misa sedang memilih makanan yang dapat meningkatkan perkembangan
otak anaknya, suatu ketika dia bertanya dengan Supriyono anak SMA N 3
Lampung untuk memastikan pilihan makanan yang tepat untuk buah hatinya,
melalui uji praktikum diperoleh data sebagai berikut:
Makana
n
Uji Benedik Uji Fehling Uji Biuret Uji lemak
I ++++ +++ + +
II ++++ ++ + +++
III ++ ++ ++ ++
IV + - ++++ +
Keterangan: tanda positif (+) menunjukan kadar tingkat senyawa tertentu dan
27
tanda negatif (-) menunjukan tidak ada senyawa tertentu
Pilihan makanan yang tepat sesuai dengan hasil uji makanan diatas adalah:
A. I
B. II
C. III
D. IV
E. I dan III
Jawaban D, karena uji biuret merupakan uji protein. Makanan yang mengandung
banyak protein pada makanan IV
f. Pertanyaan berkaitan dengan susunan dengan pernyataan yang tidak lengkap,
contoh.
Proses peredaran darah.
1. Darah masuk ke serambi kiri
2. Darah dari vena kava inferior menuju serambi kanan
3. Darah dipompa dari bilik kanan menuju paru-paru
4. Darah di pompa dari bilik kiri ke aorta
5. Darah melewati vena pulmonalis
6. Darah melewati arteri pulmonalis
Urutan peredaran darah dari darah yang banyak CO2 menjadi darah
banyak O2 adalah
A. 1-2-6-5-4-1
B. 5-4-6-5-1-4
C. 2-3-5-6-4-1
D. 2-3-6-5-1-4
E. 5-3-6-5-1-4
Jawaban D
2. Menjodohkan (Matching)
Soal tipe menjodohkan memiliki persamaan dengan soal tipe pilihan ganda yakni
pada memilih jawaban yang tepat, namun yang membedakan dua tipe tersebut
pada soal tipe menjodohkan soal berada pada kolom khusus dan jawaban berada
28
pada kolom khusus, jumlah jawaban biasanya melebihi jumlah soal dengan tujuan
sebagai pengecoh (distractor), berikut contohnya.
Petunjuk: Dibawah ini terdapat dua kelompok A dan kelompok B, pasangkan
antara kelompok A dan B yang memiliki hubungan yang tepat, dengan mengisi
kode huruf yang sesuai di kelompok A.
Kelompok A kelompok B
1. Proses pertukaran O2 dan CO2 melalui proses... (e) a. mitokondia
2. (c)... tempat pertukaran udara pernapasan b. paru-paru
3. Proses ekspirasi, keadaan di rongga dada...(i) c. alveolus
4. (a)... Organela respirasi d. osmosis
5. Kadar HCO3- menyebabkan…(g) e. difusi
f. emfisema
g. asidosis
h. golgi
i. tekanan besar
j. tekanan kecil
3. Soal tipe benar salah
Soal tipe benar salah, memiliki tingkat pengecoh yang paling sedikit jika
dibandingkan dengan tipe soal pilihan objektif, berikut ini contohnya.
Petunjuk, berilah tanda silang pada huruf B jika pernyataan benar dan huruf S jika
jawaban pernyataan salah
1. B- S : Semua mamalia tidak bisa terbang
2. B- S : Ribosom melekat pada RE kasar
3. B- S : Penderita hemofili lebih didominasi pada laki-laki
29
DAFTAR PUSTAKA
Arifin, Zaenal. (2009). Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Arikunto, S. (2002). Prosedur Penelitian suatu Pendekatan Praktek. Edisi V. Jakarta: Rineka Cipta
___________(2008). Dasar-Dasar Evaluasi Pendidikan (edisi revisi). Jakarta: PT Bumi Aksara.
NRC.(1996). National Science Education Standards.Washington: National Academic Press
Rustaman, Nuryani (___) Assesment Literacy Pdf. PPT
Rustaman, N.Y. dkk.(2005). Strategi Belajar Mengajar Biologi. Malang: UM Press
Sriyati, Siti. (2012). Bahan Ajar Pembelajaran Analisis Pokok Uji. Bandung: UPI. Tidak diterbitkan. [on line] at http://ebookbrows.com. (10 Februari 2012)
Stiggins, R.J. (1994). Student-centered Classroom Assessment. New York: Macmillan College Publishing Company.
Sugiyono. (2007). Statistika untuk Penelitian. Bandung: Alfabeta.
30