Đanh giá và trắc nghiệm kết quả học tậpsaomaidata.org/library/431... · web...
TRANSCRIPT
ĐÁNH GIÁ & TRẮC NGHIỆM KẾT QUẢ HỌC TẬP
ĐÁNH GIÁ & TRẮC NGHIỆMKẾT QUẢ HỌC TẬP
Tác giả: ĐOÀN VĂN ĐIỀU
LỜI NÓI ĐẦU
Kính thưa quý thầy/cô và các anh/chị sinh viên thân mến,
Hiện nay, có gần 10 cuốn sách viết về trắc nghiệm ở Việt Nam. Mỗi
cuốn có những đặc điểm và nét độc đáo riêng nhằm trình bày những góc nhìn
khác nhau về đánh giá và đo lường trong giáo dục theo mục đích của mỗi tác
giả.
Sau một thời gian học tập và giảng dạy bộ môn “Đánh giá và đo lường
thành tích học tập”, tác giả nhận thấy có nhiều thầy/cô và các anh/chị sinh
viên quan tâm đến bộ môn này. Vì vậy, tác giả cố gắng trình bày một số suy
nghĩ và kinh nghiệm khi nghiên cứu bộ môn này.
Đây là một bộ môn được phát triển từ lâu ở các nước có những điều
kiện giáo dục thuận tiện, nên tri thức của bộ môn này rất đa dạng và phong
phú. Do đó, trong cuốn sách nhỏ này, tác giả chỉ trình bày những điều cốt lõi
nhất về phần lý thuyết đánh giá và một số hướng dẫn về trắc nghiệm khách
quan để quý thầy/cô và các anh/chị sinh viên có thể thực hiện được việc soạn
thảo một bài trắc nghiệm khách quan về kết quả học tập cho bộ môn mình
phụ trách.
Nội dung sách được chia làm hai phần:
1. Một số lý thuyết về đánh giá trong giảng dạy và học tập: đánh giá,
đánh giá chung, mục đích và tác dụng của đánh giá, mục tiêu, nội dung và
chức năng đánh giá hoạt động giảng dạy, tiêu chuẩn để đánh giá hiệu quả
học tập, đánh giá sản phẩm của giảng dạy, đánh giá và cho điểm, đo lường
và lượng giá trong giáo dục, cách cho điểm.
2. Trắc nghiệm khách quan: lược sử trắc nghiệm, so sánh trắc nghiệm
và luận đề, các loại mục tiêu, những câu hỏi gợi ý để chuẩn bị cho bài trắc
nghiệm trong lớp học, hình thức câu trắc nghiệm khách quan, soạn thảo bài
trắc nghiệm khách quan, một cách viết câu trắc nghiệm nhiều lựa chọn, phân
tích câu trắc nghiệm, cách cải biến điểm trắc nghiệm thành điểm lớp.
Trong sách này, tác giả đặc biệt nhấn mạnh đến các loại mục tiêu và
tham khảo những hướng dẫn để viết các mục tiêu tương ứng trên cơ sở tác
phẩm của Benjamin S. Bloom và cộng sự “Nguyên tắc phân loại mục tiêu giáo
dục - Lĩnh vực nhận thức” hiện đang được sử dụng rộng rãi trên thế giới và
những phiên bản cập nhật của các tác giả khác làm cho việc viết các mục tiêu
giáo dục thích ứng với những thay đổi của sự phát triển tri thức và của công
nghệ thông tin.
Tác giả
Phần 1. MỘT SỐ LÝ THUYẾT VỀ ĐÁNH GIÁ TRONG GIẢNG DẠY VÀ HỌC TẬP
Bài 1. MỘT SỐ QUAN ĐIỂM VỀ ĐÁNH GIÁ
Đánh giá là phương tiện để xác định các mục đích và mục tiêu của một
công việc có đạt được hay không. Nó cũng gồm việc xem xét các phương tiện
đang được sử dụng để đạt đến mục đích và mục tiêu. Đánh giá làm rõ các
sản phẩm có được ngoài dự kiến, cả về mặt tích cực lẫn tiêu cực, từ các hoạt
động bổ trợ.
Việc đánh giá cần liên tục trong quá trình, nhưng nó đặc biệt quan trọng
khi mỗi bước được hoàn thành. Việc đánh giá được thực hiện sau khi lượng
giá để xem xét tất cả các thông tin cần thiết được thu thập và những kết luận
phù hợp về ý nghĩa của thông tin và về đối tượng được rút ra trong tình
huống đó. Khi lập kế hoạch, cần có sự đánh giá để xác định kế hoạch đó có
thực hiện được và hoàn chỉnh không. Sau khi một hành động được thực hiện,
cần đánh giá để xác định xem các mục tiêu cần thiết có đạt được không.
Đánh giá cũng là phần quan trọng của quá trình kết thúc. Vì thế, đánh giá là
tìm ra điều dự kiến có thực sự xảy ra hay không. Nó xem xét công việc một
cách hoàn chỉnh; xác định phương pháp, chiến lược nào có hiệu quả và tại
sao. Đó là cơ hội để rà soát lại đối tượng và những người tiêu biểu khác để
xem xét cách tiến hành dưới quan điểm của họ. Đánh giá một công việc là
nhiệm vụ nghề nghiệp cho mọi nhân viên của các công ty, các tổ chức xã hội
và đây là một quá trình liên tục. Các chương trình và các công ty bắt buộc
phải thực hiện đánh giá, trên cơ sở đang thực hiện một nhiệm vụ, mục đích
và mục tiêu của công ty cũng như chương trình hành động của nó.
Từ trước đến nay đánh giá được định nghĩa là “việc thu thập dữ liệu về
các kết quả của một chương trình hành động có liên quan đến mục đích và
mục tiêu được đề ra trước khi thực hiện chương trình đó” (1).
Theo Bernic Jones các chương trình được đánh giá vì một số lý do đặc
biệt. Sau đây là một số nguyên nhân:
1. Phát hiện một chương trình đáp ứng các mục đích của nó hiệu quả
như thế nào? (Nó có tạo ra sự thay đổi hay không? Cho ai?).
2. Nhận được các thông tin giúp cấu trúc lại hoặc quản lý chương trình
một cách hiệu quả hơn. Có lẽ các nhà đánh giá muốn xem xét yếu tố đặc biệt
nào cần được xóa bỏ hoặc thay đổi.
3. Xác định các mô hình cho những ngưòi khác làm theo, hoặc để kiểm
nghiệm một lý thuyết hoặc cách tiếp cận một vấn đề cần giải quyết. (Điều gì
đã làm cho chưong trình có tác dụng? Yếu tố nào có thể được sử dụng trong
các chương trình khác?).
4. Tìm ra biên chế cần giảm loại nhân viên nào để thực hiện chương
trình một cách có hiệu quả.
5. Tìm ra một chương trình có hiệu quả mức độ nào dưới quan điểm
của khách hàng và cách làm cho chương trình đó hiệu quả hơn.
Trước khi làm rõ khái niệm quá trình đánh giá, điều quan trọng là giải
quyết vấn đề thường ngăn cản khả năng khám phá tính năng động của đánh
giá. Vấn đề này có liên quan đến việc sử dụng các thuật ngữ “đánh giá” và
“cho điểm”. Có phải đánh giá và cho điểm giống nhau? Có thể nói, có hai mặt
giống nhau trong hai thuật ngữ này là chúng cùng quá trình và đều nói đến
hoạt động của một cá nhân. Tuy nhiên, chúng không phải là những quá trình
giống nhau.
- Đánh giá là một quá trình xét đoán. Giáo viên xét đoán về chất lượng
đạt được của các mục tiêu học tập dự kiến của người học.
- Cho điểm là quá trình định hướng. Qua đó, giáo viên định hướng
những dữ kiện đánh giá và đưa ra những ký hiệu thể hiện mức độ đạt được
về mặt học thuật của người học. Cho điểm, một quá trình định lượng, tùy
thuộc vào dữ liệu được cung cấp do quá trình và đánh giá mang tính định
tính.
Đánh giá có thể hiện diện như một hiện tượng độc lập trong khi đó cho
điểm luôn luôn phải tùy thuộc vào đánh giá.
Mặc dù, như được trình bày ở đây, đánh giá và cho điểm là hai quá
trình riêng biệt lần lượt diễn ra, trong thực tế, chúng ta biết rằng sự phân biệt
này không được thực hiện. Cho điểm và đánh giá thường được coi như là
các thuật ngữ đồng nghĩa. Những điểm số chính thức từ trước đến nay trở
thành phương tiện dễ thấy nhất trong việc lượng giá việc thực hiện nhiệm vụ
học tập của học sinh mặc dù cần xem xét lại tính tin cậy của đánh giá hoạt
động của người học.
Cách giải thích theo lối phân đôi của thuật ngữ đánh giá là (1) nó là một
quá trình trưởng thành hoặc (2) nó là một quá trình kiểm soát. Ý của hai cách
giải quyết hoàn toàn khác nhau này cần được chú ý. Nếu chúng ta chấp nhận
khái niệm đánh giá là một quá trình hay một loạt quá trình, qua đó việc phán
đoán giá trị về hoạt động của một người được thực hiện, thì chúng ta có thể
nhận thấy rằng đánh giá thực sự có thể được sử dụng tùy theo nhu cầu của
người đánh giá. Chúng ta hãy xem xét thuật ngữ đánh giá dưới góc cạnh
phán đoán giá trị thuật ngữ giá trị (value) là một phần thống nhất của từ đánh
giá (e-valuation). Vì giá trị là niềm tin tạo lập được người đó chấp nhận như
cái riêng của mình và sử dụng như một yếu tố quyết định hành vi của bản
thân, chúng ta có thể nhận thấy rằng không có một quá trình nào như thế là
quá trình đánh giá khách quan, đặc biệt trong lâm sàng y khoa, một việc tìm
kiếm mang tính mông lung, vì không có hiện tượng như thế hiện hữu. Tuv
nhiên, dù việc đánh giá có thể không khách quan, thì việc đánh giá vẫn có thể
công bằng. Chất lượng của tính công bằng này phải là mục tiêu của chúng ta.
Thái độ của người đánh giá đối với việc đánh giá là một trong những
yếu tố quyết định có liên quan đến việc sử dụng hướng đến quá trình nào.
Thái độ của chúng ta xác định việc hỏi đúng câu hỏi và xem xét hành vi đúng
hay không.
Việc theo đuổi, tìm kiếm tri thức của sinh viên bị ngăn chặn bởi các
thông tin nhận được từ người đánh giá. Việc đánh giá không được coi là một
quá trình tăng nhanh sự tự phát triển, mà là một quá trình soát xét, qua đó
người học có thể được đánh dấu bằng một số danh xưng trong cuộc sống.
Việc tiếp cận của người học đến việc đánh giá là việc tự duy trì chứ không
phải là việc tự khẳng định.
Thực ra, việc giải thích ý nghĩa của thuật ngữ đánh giá bạn sử dụng với
tư cách của một nhà đánh giá sẽ quyết định cách tiếp cận và hoàn cảnh bạn
tạo ra. Tất cả các nghề nghiệp mang tính giúp đỡ lôi cuốn các cá nhân bằng
một nhu cầu kiểm soát những người khác. Những “người điều khiển con
người này” tìm thấy trong các lĩnh vực dịch vụ một phạm vi màu mỡ đặc biệt,
vì khách hàng thường là những cá nhân hay nhóm đang ở trạng thái phụ
thuộc. Các nhà kiểm soát dựa trên các luật lệ, các quy định và các phương
pháp để tìm ra các phán đoán mang tính chất đánh giá và tìm cách vận động
người học vào một trạng thái hành vi được chấp nhận. Sau đó, người học
hướng năng lượng của họ vào việc duy trì sự sống trong một hệ thống hơn là
vào các kinh nghiệm đóng góp cho sự phát triển và trưởng thành của bản
thân.
Việc đánh giá thường phản ánh kỹ năng của người học, vào tài làm cho
đối thủ (người đánh giá) lãng trí để thắng cuộc, hơn là khả năng của người ấy
đáp ứng các mục tiêu, kinh nghiệm học tập được đưa ra. Trong ngành giáo
dục, trong lĩnh vực lý thuyết, cả yếu tố thực hành đặc biệt nhạy cảm với tài
làm cho đối thủ lãng trí để thắng cuộc này và được người đánh giá (cũng là
người giám sát) khuyến khích. Đặc điểm thực của quá trình giám sát làm nảy
sinh nhiều mối lo ngại làm cho có sự khác nhau giữa việc đánh giá trong lâm
sàng và tình huống học thuật thông thường. Thẩm quyền trong lâm sàng có
liên quan đến tất cả các lĩnh vực học tập: nhận thức, tình cảm và tâm lý cơ
động. Sự thay đổi hành vi trong tất cả các lĩnh vực này xảy ra ở phạm vi của
mối quan hệ gần gũi với giáo viên và thường được bạn bè, bệnh nhân, những
nhà chuyên môn hoặc những nhà thực hành nhận ra một cách đầy đủ. Cảm
giác về sự không phù hợp làm cho người học phải sợ phê bình, xấu hổ và bị
loại ra. Nếu thầy giáo trong tình huống lâm sàng đặt giá trị trước tiên trên cơ
sở các luật lệ và phương pháp, người học thường phải lựa chọn lại cách làm
cho đối thủ lãng trí để thắng cuộc để tự bảo vệ mình khỏi sự kiểm soát có ác
cảm khi đo lường.
Những điều nào của người đánh giá nhận thấy công việc này là để giúp
cho sự trưởng thành của người học? Những cá nhân này chấp nhận khái
niệm là: hầu hết những người học đều có khả năng thông thạo các nhiệm vụ
học tập và dùng đánh giá như là một quá trình chẩn đoán qua đó các chiến
lược dạy học được đưa ra để kích thích người học tìm kiếm tri thức, giá trị và
khả năng thực hành. Bầu không khí dành cho việc đánh giá mang tính ủng
hộ, đặt cơ sở trên sự tin tưởng và tôn trọng đối với người học. Quá trình phát
triển cũng như kết quả sau cùng là mối quan tâm của các nhà đánh giá này.
Trò chơi được giảm thiểu, bởi vì quá trình dạy - học là một việc làm khó khăn
được chia sẻ. Đánh giá là phần thống nhất của một quá trình giáo dục hoàn
chỉnh. Niềm tin của giáo viên về đặc điểm của con người và quá trình dạy -
học có liên quan trực tiếp đến niềm tin về quá trình đánh giá và đặc điểm của
các chiến lược đánh giá được soạn thảo.
Cách tiếp cận tâm lý giáo dục đến giảng dạy sử dụng đánh giá như là
một phương tiện để kiểm soát. Các kết quả mong đợi cũng như các điều kiện
học tập và các tiêu chuẩn được sử dụng để xác định thành tích học tập được
đặc biệt phác họa. Đó là cách tiếp cận đánh giá kết quả. Tất cả người học và
giáo viên đều được yêu cầu theo “cùng nhịp điệu”. Mặc dù không được ưa
chuộng vì không đạt đến kết quả học tập được coi như một phần ngoài lý
thuyết này, nhưng các kỹ thuật này thực sự được sử dụng. Trong nhiều
trường họp, việc không khen thưởng có thể được coi là phương pháp chống
đối.
Cách tiếp cận nhân văn sử dụng đánh giá như là sự lượng giá giúp
trưởng thành. Nó là một quá trình mở cơ động đan kết chặt chẽ với quá trình
dạy - học. Nó nhấn mạnh quá trình cũng như kết quả. Đánh giá giúp trưởng
thành là một phương tiện, chứ không phải là mục đích. Nó đề cao sự phát
triển cá nhân.
Cách ghi lại việc đánh giá được hướng tới sự trưởng thành của người
học gồm cả việc đánh giá tổng kết và đánh giá hình thành. Việc đánh giá tổng
kết xảy ra ở cuối một chương trình, một khóa học hay một đơn vị học trình và
dựa vào mức độ người học nhận biêt các mục tiêu đã được xác định. Đây là
hình thức đánh giá trong thực tế thông thường nhất và được sử dụng như là
một cơ sở để quyết định điểm Trắc nghiệm, bài tập và các công trình nghiên
cứu là các cách thức thông thường. Cách đánh giá này được gọi là cách
đánh giá “cái gì”.
Ngược lại, cách đánh giá hình thành xảy ra trong suốt chương trình,
khóa học hoặc đơn vị học trình và dựa vào sự tiến bộ của người học đối với
việc nhận ra các mục tiêu học tập. Loại đánh giá này được thực hiện xuyên
suốt quá trình học tập và gọi là quá trình đánh giá “cái gì” và “cái có thể”. Nó
dựa vào nguyên tắc thông tin phản hồi để hướng dẫn người dạy và người học
đến các mặt học tập cần sự quan tâm sâu sát khi người học tiếp cận đến việc
thành thạo các hành động học tập. Các phương pháp được sử dụng gồm các
ghi chép nhỏ, các tình huống giải quyết vấn đề, hồ sơ theo dõi, quan sát các
hành vi thực tiễn, các cuộc họp và ghi hình.
Loại đánh giá này không được soạn thảo để thu thập số liệu như là một
cơ sở để cho điểm. Nó được dùng để lượng giá sự tiến bộ của người học, để
chẩn đoán các nhu cầu học tập, các biện pháp sửa chữa có thể được thiết lập
một cách nhanh chóng và bắt kịp việc học tập của người học tùy theo nhu cầu
và khả năng riêng của người ấy.
Cách tiếp cận hệ thống đến việc đánh giá học tập về mặt tình cảm, phối
hợp các quá trình đánh giá tổng kết và hình thành, thì cần thiết. Các mục tiêu
được đưa ra trong các thuật ngữ tâm lý giáo dục được xác định như là các
kết quả thống nhất với mức độ học tập mong đợi. Các dữ liệu được thu thập
và các chiến lược được soạn thảo được các kết quả này xác định. Việc đánh
giá tổng kết có thể đạt đến được và cách đánh giá hình thành nhận ra các
mặt phát triển của việc học tập mang tính chất tình cảm.
Tài liệu tham khảo:
1. Dorothy E. Reilly, 1982, Teaching and Evaluating the Affective,
Domain in Nursing Programs, USA: Charles B. Slk, Inc. (p.p 52-57).
2. Louise C. Johnson, 1989, Social work pratice - A generalist
Approach, Boston. Allyn and B on (p.p 383-402).
Bài 2. ĐÁNH GIÁ
1. CÁC ĐẶC TRƯNG CỦA QUÁ TRÌNH ĐÁNH GIÁ
Quá trình đánh giá có các đặc trưng sau đây:
- Quá trình đánh giá xem xét tình hình giáo dục trong khuôn khổ sự
phát triển về xã hội, kinh tế và văn hóa, có nghĩa là nó đo lường những thay
đổi diễn ra trong giáo dục theo các mục tiêu phát triển tổng thể của quốc gia.
- Quá trình đánh giá sử dụng một ngôn ngữ chung bất kể mức độ chi
tiết của thông tin là như thế nào, sao cho các kết quả, các điều chỉnh là tương
thích và đồng bộ trong các cấp giáo dục.
- Quá trình đánh giá tạo ra các cơ chế để các có sự tham gia của các
cấp thẩm quyền vào hệ thống giáo dục nhằm tăng cường quá trình này.
- Quá trình đánh giá sử dụng các nghiên cứu cụ thể để cải thiện các kết
quả đánh giá.
- Quá trình đánh giá mang lại những thông tin đáng tin cậy, thích hợp
và đầy đủ, có ý nghĩa quan trọng khi sự phù hợp gắn với các vấn đề cần giải
quyết: tin cậy bởi được dựa trên các tiêu chí khách quan; thích hợp cho việc
đưa ra các quyết định kịp thời; đầy đủ về mặt loại hình và khối lượng thông tin
cần thiết.
2. CÁC CẤP ĐỘ ĐÁNH GIÁ
Việc đánh giá các kế hoạch, chương trình, dự án và hệ thống giáo dục
nói chung có thể tiến hành theo các cấp độ khác nhau: cấp quốc gia, cấp
vùng, cấp khu vực, cấp địa phương và cấp cơ sở.
Các cấp độ đánh giá phần lớn được xác định bởi mức độ địa phương
hóa của quá trình lập kế hoạch giáo dục. Ở mỗi cấp độ nêu trên thì mục tiêu
giáo dục cũng khác nhau.
Ví dụ: Ở cấp quốc gia thì khuôn khổ nhận thức, các tiêu chí và thông số
đánh giá đặt trọng tâm vào mối quan hệ giữa việc thực hiện chức năng của
hệ thống giáo dục và sự phát triển chung về xã hội, kinh tế và văn hóa, cũng
như chú trọng vào việc thực hiện kế hoạch quốc gia, các chương trình và các
dự án, trong đó có xét đến các mục tiêu một cách thỏa đáng.
Còn ở cấp thấp nhất, người ta sử dụng đánh giá cấp cơ sở và cấp địa
phương. Cấp đánh giá này liên quan đến quá trình thực hiện cụ thể của các
hoạt động đã được lên chương trình và việc sử dụng các nguồn lực theo các
mục tiêu đã dự kiến. Các kết quả có thể được diễn đạt theo cả hai mặt lượng
và chất, bao gồm cả những báo cáo nghiên cứu đối tượng cụ thể.
Cần lưu ý rằng các thông số đánh giá đã cho có thể có khuynh hướng
nội tại nghiêng về đánh giá cấp tỉnh, thành và cấp quốc gia. Với mục đích
quản lý và kế hoạch hóa giáo dục cấp vi mô, việc đánh giá đồng thời chương
trình từ góc độ cộng đồng, môi trường địa phương và các nguyện vọng của
cộng đồng có ý nghĩa rất quan trọng.
3. CÁC HÌNH THỨC ĐÁNH GIÁ
Căn cứ theo giai đoạn tiến hành đánh giá và quan hệ của nó tới quá
trình thực hiện, có thể chia đánh giá thành ba loại sau:
- Đánh giá khả thi ban đầu.
- Đánh giá song song.
- Đánh giá cuối kỳ.
3.1. Đánh giá khả thi ban đầu
Đây là sự phân tích về tính nhất quán, tính đồng bộ trong việc xây dựng
kế hoạch và là nội dung kiểm tra tính khả thi của kế hoạch. Ở cấp vi mô cần
kiểm tra xem các mục tiêu có được xây dựng đúng không và các mục tiêu này
có góp phần vào việc giải quyết các vấn đề phát sinh trong quá trình chẩn
đoán cục bộ không. Bên cạnh đó, cần kiểm tra xem các mục tiêu cụ thể, các
chương trình, dự án có đúng với các mục tiêu của kế hoạch hay không và liệu
kế hoạch có thể thực hiện được với các nguồn lực đã cho, với năng lực quản
lý hiện hành hay không, trong đó có xem xét đến cả các yếu tố bên trong và
bên ngoài.
Trong các yếu tố bên ngoài được xem xét có các vấn đề về nhân khẩu
học, văn hóa - xã hội, chính trị, quản lý nhà nước, kinh tế và sinh thái, tùy
theo mức độ mà chúng có thể ảnh hưởng đến sự phát triển của hệ thống giáo
dục. Cần chú ý rằng những yếu tố này thường được xem xét khi chẩn đoán
hệ thống giáo dục ở cấp vi mô trong phạm vi của nó. Bằng cách sử dụng đến
mức tối đa những thông tin trong chẩn đoán, có thể phân tích các yếu tố bên
ngoài khi tiến hành đánh giá ban đầu phòng trường hợp có thể phát sinh
những trở ngại trong khi kế hoạch được triển khai đúng.
Các yếu tố bên trong liên quan đến các nội dung của kế hoạch. Vấn đề
ở đây là việc phân tích tính nhất quán bên trong của kế hoạch, tức là xem xét
các mục tiêu chung có được xây dựng một cách phù hợp không, và các mục
tiêu, chiến lược, chương trình cũng như dự án cụ thể đã được nhất trí có giúp
cho việc đạt được các mục tiêu chung không.
Nhìn chung, việc phân tích tính nhất quán bên trong đặt trọng tâm vào
luồng lưu chuyển học sinh trong các cấp học và trong các loại hình giáo dục;
vào những thay đổi đã được dự kiến trước trong kế họach và vào những tiền
đề của các thay đổi này. Việc phân tích cũng đặt trọng tâm vào tính sẵn có
của các nguồn nhân lực và tài chính, cũng như năng lực điều hành để thực
hiện kế hoạch.
3.2. Đánh giá song song
Kiểu đánh giá này được tiến hành song song với quá trình triển khai dự
án. Xét về mặt thực hiện, đó là sự quan sát quá trình triển khai kế hoạch trên
góc độ khảo sát quá trình thực hiện các hoạt động được lên chương trình
nhằm có thông tin cho việc điều chỉnh bất cứ sự chệch hướng hay phân tán
nào, sao cho các mục tiêu đều có thể đạt được.
Kiểu đánh giá này cần phải được thực hiện liên tục và thể hiện kết quả
qua các báo cáo định kỳ, trong đó bao hàm mọi khía cạnh của kế hoạch. Ý
nghĩa chính của loại đánh giá này là có thể thực hiện kịp thời các bước điều
chỉnh để bảo đảm cho kế hoạch được thực hiện tốt hơn.
Nhìn chung, trong đánh giá song song, mức độ thực hiện chương trình
được xem xét trên các góc độ về tài chính, quản lý, các vấn đề về cơ sở vật
chất, văn hóa, kỹ thuật. Việc xem xét có thể tiến hành một cách tổng thể đối
với toàn bộ kế hoạch hoặc dưới dạng chi tiết, ứng với các chương trình, dự
án hoặc hoạt động khác nhau.
3.3. Đánh giá cuối kỳ
Đánh giá cuối kỳ, hay còn gọi là đánh giá tổng kết, có hai khía cạnh.
Thứ nhất, nó diễn ra đồng thời với giai đoạn cuối của quá trình đánh giá song
song và với mục đích cải thiện các kế hoạch sau này, nó phân tích một cách
nhất quán các kết quả vấn đề, những mặt khó khăn và tồn tại trong quá trình
thực hiện kế hoạch. Thứ hai, nó hướng vào sự phát triển của hệ thống giáo
dục ở cấp vi mô để nhận diện những vấn đề cần giải quyết. Nói một cách
khác, đánh giá cuối kỳ tập trung vào các kết quả triển khai kế hoạch phát triển
giáo dục và tác động của giáo dục đối với sự phát triển về kinh tế, xã hội, văn
hóa.
4. ĐÁNH GIÁ TẬP TRUNG VÀO CẤP VI MÔ
Trong thực tế, mặt thứ nhất đánh giá cuối kỳ đã được dành sự lưu tâm
trong giai đoạn cuối của quá trình đánh giá song song bởi đây là việc đối
chiếu những gì đã lên chương trình với những gì đã thực hiện. Đối với mặt
thứ hai, mặc dù không bị phủ nhận tầm quan trọng, song nó thực sự ít được
xem xét thường xuyên. Vì vậy, cần nghiên cứu các đánh giá tiếp theo sâu
hơn, hướng vào việc phân tích, đo đạc và đánh giá sự phát triển của giáo
dục. Đặc biệt, ở cấp vi mô, việc đánh giá này có thể tiến hành theo:
- Tác động của giáo dục đối với tình hình kinh tế - xã hội - văn hóa.
- Hiệu quả của hệ thống giáo dục.
- Các nguồn lực được sử dụng cho giáo dục.
4.1. Đánh giá tác động của giáo dục lên hệ thống xã hội - kinh tế - văn hóa
Đánh giá này tập trung vào việc thoả mãn các nhu cầu về giáo dục và
nhu cầu phát triển xã hội, kinh tế, văn hóa. Thứ nhất, việc phân tích được tiến
hành trên nhu cầu về giáo dục, các bậc tuyển sinh, khuynh hướng trẻ em ở
độ tuổi giáo dục phổ cập không đến trường, sự mất cân đối giữa về giới tính,
mất cân đối giữa các cộng đồng dân có điều kiện khó khăn, cộng đồng dân
tộc thiểu số… Thứ hai, xét về sự đóng góp của giáo dục vào phát triển kinh
tế, xã hội, văn hóa, người ta cho rằng, hệ thống giáo dục cần thỏa mãn các
nhu cầu về nguồn nhân lực có trình độ cao đã được nêu ra trong các kế
hoạch phát triển xã hội, kinh tế và văn hóa. Về vấn đề này, quá trình đánh giá
song song đặt trọng tâm vào mối quan hệ giữa giáo dục và sản xuất, vào tác
động của giáo dục đối với sự thay đổi dân trí của người lao động và vào nghề
nghiệp của những người đã hoàn thành các bậc học hoặc loại hình đào tạo
khác nhau.
Một khía cạnh khác của việc đánh giá này là sự đóng góp trực tiếp của
hệ thống giáo dục vào các mục tiêu phát triển xã hội và văn hóa. Việc đánh
giá theo hướng này gặp phải một số khó khăn, một mặt là do sự đa nghĩa của
khái niệm “phát triển xã hội và văn hóa”, mặt khác là vì sự phức tạp trong việc
đo đạc kết quả đóng góp của hệ thống giáo dục vào sự phát triển xã hội và
văn hóa. Với mục đích này, việc đánh giá cần đặt trọng tâm vào nội dung thực
tế của giáo dục để xác định xem nó đã ảnh hưởng như thế nào đến việc tạo
nên các thói quen, thái độ và nguyên tắc có lợi cho sự phát triển về xã hội và
văn hóa, nhờ đó tạo ra những lợi ích từ nội dung này.
4.2. Đánh giá hiệu quả của hệ thống giáo dục
Đánh giá này hướng vào đối tượng là việc thực hiện chức năng thực tế
của hệ thống giáo dục. Với mục đích như vậy, quá trình phân tích cần xem
xét các thông số khác nhau, cả về lượng lẫn về chất và có tính đến các
khuynh hướng đánh giá trong tuyển sinh theo các cấp học, loại hình đào tạo
cả trong và ngoài nhà trường.
Theo hướng phân tích về chất lượng giáo dục được cung cấp và các
yếu tố ảnh hưởng, việc đánh giá cần hướng vào đối tượng là giáo viên, nội
dung chương trình giảng dạy, sách giáo khoa và tư liệu giảng dạy, quản lý
giáo dục, chi phí và nguồn tài chính.
4.3. Đánh giá các nguồn lực được sử dụng trong hệ thống giáo dục
Việc đánh giá này có ý nghĩa đặc biệt quan trọng bởi các nguồn lực này
chiếm một phần khá lớn trong ngân sách quốc gia. Trong khuôn khổ của đánh
giá cuối kỳ, việc phân tích về sử dụng nhân lực và các nguồn lực tài chính,
vật chất cần đảm bảo rằng có thể xác định được ra các phương án phát triển
giáo dục có lợi nhất.
5. QUÁ TRÌNH ĐÁNH GIÁ
Một cách chung, có thể chia quá trình đánh giá thành tám giai đoạn:
(1) Định hình hoặc tái định hình các chính sách, kế hoạch, chương
trình, dự án và ngân sách giáo dục.
(2) Xác định các mục tiêu và cấp độ đánh giá.
(3) Lựa chọn các thông số.
(4) Lựa chọn các tiêu chí đánh giá.
(5) Chuẩn bị các thông số.
(6) Đo đạc và phân tích.
(7) Khuyến nghị.
(8) Đưa ra quyết định.
6. SỬ DỤNG CÁC THÔNG SỐ
Để lựa chọn các thông số, chỉ cần chọn trong số này những thông số
đã được sử dụng trong quá trình chẩn đoán và chuẩn bị kế hoạch ứng với
những vấn đề cần đánh giá. Cần lập ra một nhóm các tiêu chí đánh giá bởi
chính khái niệm đánh giá đã hàm ý việc đối chiếu với các cấp độ tối thiểu,
trung bình và tối ưu thông qua các thông số.
Để chuẩn bị các thông số, cần tuân thủ một số tiêu chí về tính chính
xác, khách quan, tính có thể đối chiếu được và tính sẵn có. Theo các vấn đề
được đánh giá, có thể chia các thông số thành hai nhóm.
Nhóm các thông số mang tính nội dung là nhóm sử dụng các thông tin
thống kê, thông tin tư liệu, thông tin khoa học và công nghệ về mối quan hệ
giữa giáo dục và sự phát triển xã hội - kinh tế - văn hóa hoặc về hiệu quả bên
trong của hệ thống.
Nhóm các thông số về quản lý là nhóm dùng để đánh giá việc thực
hiện.
Giai đoạn tiếp theo của quá trình đánh giá, giai đoạn đo đạc và phân
tích, sử dụng các thông số và chỉ tiêu. Giai đoạn này dẫn tới viện đưa ra các
khuyến nghị được sử dụng làm cơ sở cho những người có trách nhiệm ra
quyết định để điều chỉnh háy tái định hình kế hoạch sẽ thực hiện. Điều đó cho
phép giải quyết các vấn đề đã phát hiện và điều chỉnh lại các nhận xét đã rút
ra trong quá trình đánh giá.
Do đó, chu trình đánh giá kết thúc với việc bắt đầu một chu trình mới.
Đương nhiên, các kết luận và khuyến nghị chính yếu đều được đưa vào trong
các báo cáo.
7. QUÁ TRÌNH ĐÁNH GIÁ CÓ HIỆU QUẢ
Một quá trình đánh giá có hiệu quả của một kế hoạch hay chương trình
cần có tính liên quan, tin cậy, kịp thời và có tính hiệu quả.
- Tính liên quan: việc đánh giá phải áp dụng những tiêu chí có giá trị
vào việc đo đạc các mục tiêu của kế hoạch.
- Tính tin cậy: việc đánh giá phải được thực hiện một cách khách quan
để không gây nghi ngờ đối với các ý kiến đưa ra.
- Kịp thời: việc đánh giá cần được tiến hành trong suốt quá trình khai kế
hoạch và các kết quả phải sẵn sàng khi cần đưa ra quyết định.
- Hiệu quả: việc đánh giá phải hướng vào mục tiêu tối thiểu hóa chi phí
và tối đa hóa kết quả.
8. MỘT SỐ NGUYÊN TẮC ĐÁNH GIÁ
Quá trình đánh giá được coi là một quá trình cung cấp các thông tin có
giá trị và phù hợp với việc đưa ra các quyết định có liên quan. Từ định nghĩa
này có thể rút ra rất nhiều ý.
- Đánh giá phải được coi là một quá trình chứ không phải là một sản
phẩm để mối quan hệ tương tác giữa các thành phần của hệ thống đánh giá
cũng có vai trò quan trọng như các kết quả đưa ra.
- Đánh giá không chí là một sự việc bị hạn chế diễn ra trong một thời
điểm nhất định. Do các nội dung giáo dục đặt trọng tâm vào sự thay đổi nên
việc đánh gia bắt buộc phải được tiến hành đều đặn sau những khoảng thời
gian nhất định.
- Giai đoạn đầu tiên của mọi quá trình đánh giá đều cần phải có sự xác
định kỹ lưỡng các loại dữ liệu cần thiết nhất và khả thi nhất.
- Người tiến hành đánh giá cần nhận thức rằng chính quá trình thu thập
dữ liệu là quá trình đòi hỏi độ tin cậy và tính giá trị cao.
- Một nguy cơ cố hữu của quá trình phân tích dữ liệu là khuynh hướng
xử lý dữ liệu theo các kỹ thuật phân tích mà người thực hiện ưa thích nhất.
- Điều quan trọng hơn là cần kiểm tra tính giá trị của dữ liệu, ít nhất là
bên trong nếu không thể xác định bên ngoài, bởi làm đúng việc có ý nghĩa
quan trọng hơn là làm các việc trở thành đứng.
- Không được bỏ qua việc mô tả các cá nhân và tình huống đã được
lấy làm mẫu đánh giá.
- Không được coi thường tầm quan trọng của việc tìm hiểu lý do “tại
sao” của các kết quả.
- Bởi các kế hoạch đều hướng tới tương lai nên các dữ liệu đánh giá sẽ
đặc biệt có ích nếu nó giúp cho việc dự báo tình hình trong tương lai.
- Những người đưa ra quyết định quan trọng có thể không thạo về đánh
giá và thậm chí trong một số trường hợp còn không nắm rõ lắm về giáo dục.
Bởi vậy, các báo cáo đánh giá cần được diễn đạt theo ngôn ngữ dễ hiểu.
- Do quá trình ra quyết định đòi hỏi phải có những nhận xét liên quan
đến những hành động mang tính lựa chọn nên người thực hiện đánh giá
ngoài trách nhiệm đề xuất các phương án lựa chọn còn phải cố gắng tối đa
để cung cấp tiêu chí khác nhau cho người ra quyết định.
- Để các quyết định có ý nghĩa, cần có sự rõ ràng.
- Ngay cả khi việc đánh giá hướng vào các kết quả giáo dục thì các tiêu
chí nhận xét cũng phải đề cập tới các kế hoạch ban đầu để đảm bảo tính
hoàn thiện.
- Việc đánh giá các kế hoạch giáo dục không nên đứng ở chỗ kế hoạch
đã hoàn thành mà cần quan tâm đến cả việc kế hoạch đã triển khai tốt ở mức
độ nào.
9. AI LÀ NGƯỜI ĐÁNH GIÁ?
Trong rất nhiều trường hợp, những người đánh giá hay nhóm đánh giá
là những người nằm ngoài chương trình hoặc tổ chức được đánh giá. Song
có một vấn đề quan trọng hiện nay là bât cứ quá trình đánh giá nào cũng cần
chú trọng đến thành viên tham gia chương trình. Vì vậy, trong khi các chuyên
gia bên ngoài vẫn có thể được mời đến do năng lực và sự khách quan của
họ, các quyết định liên quan đến việc mời các chuyên gia này vẫn là những
quyết định có ý thức của các thành viên nằm trong hệ thống hay chương trình
được đánh giá.
Thực ra, những người đã tham gia vào giai đoạn lập kế hoạach thì
cũng cần tham gia càng nhiều càng tốt vào giai đoạn triển khai cũng như giai
đoạn đánh giá đi liền với giai đoạn triển khai đó.
Việc đánh giá có thể được coi là một phần của chu trình phát triển và
thực hiện. Và những quá trình đánh giá có sự tham gia của những người làm
nên kế hoạch tổng thể như người thiết kế, người thực hiện hoặc người thụ
hưởng có thể xem như là ít phải lo ngại hơn; do đó, cũng dễ đạt được những
kết luận có giá trị cũng như những kết luận dễ chấp nhận hơn so vói đánh giá
của những người “ngoại đạo”.
Bài 3. TỔ CHỨC MỘT CHƯƠNG TRÌNH ĐÁNH GIÁ
Ngày nay, hầu như tất cả các tổ chức từ giáo dục, dạy nghề, tư vấn…
và các dịch vụ đều tạo ra các phương pháp giúp cho con người đạt đến mục
đích của họ. Mặc dù, những vấn đề khoa học và kỹ thuật là những vấn đề
quan trọng trong môi trường kinh doanh, nhưng việc thành công trong hoạt
động thường là vấn đề của việc quản lý thành công nguồn nhân lực. Các cố
gắng để cải tiến năng suất, nâng cao tinh thần của nhân viên hoặc hoàn thiện
chất lượng sản phẩm, tất cả đều tùy thuộc vào các kỹ thuật được hoạch định
tốt, thông tin phản hồi chính xác về các ảnh hưởng của kế hoạch được áp
dụng và cách sử dụng thông tin phản hồi đó. Do đó, việc tổ chức đánh giá
chương trình hoạt động trong các lĩnh vực là việc làm cần thiết để đạt đến
hiệu quả cao hơn, hoặc cải tiến các phương pháp, cách thức cần thiết cho
chương trình hoạt động đó. Đặc biệt trong giáo dục, các trường học cần đánh
giá tính hiệu quả của các giáo viên, các chương trình chuyên môn và tính
hiệu quả của một chương trình học mói cũng cần được đánh giá trước khi
phổ biến rộng rãi sang các trường học khác.
Các chương trình giáo dục tạo thành một bộ phận chính của ngành
dịch vụ mang tính nhân văn. Các sản phẩm và mục đích của các chương
trình này khó mô tả đầy đủ được. Con người tham gia vào các chương trình
giáo dục để đạt được một trình độ học vấn hoặc để được cho phép làm các
nghề nghiệp hoặc công việc khác nhau, để học một tay nghề chuyên môn với
mục đích đạt được sự thoải mái, hoặc tự hoàn thiện, hoặc để củng cố vị thế
xã hội và để đạt đến sự phát triển trí tuệ và tâm lý.
Lý do để đánh giá các chương trình.
Có nhiều lý do để tiến hành các đánh giá chương trình. Trong số những
lý do này là:
- Thực hiện các yêu cần chứng nhận.
- Tính toán các chi phí.
- Trả lời các câu hỏi về thông tin.
- Lựa chọn các chương trình khả thi.
- Giúp các thành viên soạn thảo và cải tiến chương trình.
- Nghiên cứu các ảnh hưởng không dự kiến của chương trình.
Thông thường, các chương trình được nhà nước hay các tổ chức tài
trợ cần những đánh giá sau mỗi dự án và căn cứ trên các đánh giá, dự án đó
có được tiếp tục hay không, ở đây, trong khuôn khổ đánh giá một giáo trình,
ta xem xét đến lý do thứ năm là: “Mục đích của đánh giá là để đạt được các
thông tin để cải tiến thực tiễn và cấu trúc chương trình. Người thực hiện các
dịch vụ mang tính nhân văn cần thông tin có liên quan đến việc họ đã thực
hiện công việc tốt ở mức độ nào. Đồng thời, người đánh giá có thể cung cấp
thông tin phản hồi về người thụ hưởng dịch vụ đó xem xét những người thực
hiện. Các mối quan hệ liên cá nhân thì quan trọng đối với các nhà thực hiện
các dịch vụ mang tính nhân văn hơn là đối với con người làm công việc chỉ
đòi hỏi các tiếp xúc hời hợt với con người”.
Các loại đánh giá thông thường:
Một chương trình đánh giá có thể được tiến hành từ một số quan điểm.
Bài viết này chia đánh giá theo hai quan điểm: (1) theo loại vấn đề được đặt
ra về chương trình và (2) theo mục đích của đánh giá.
Các loại vấn đề do các người đánh giá đặt ra về chương trình được
phân làm bốn loại tổng quát: nhu cầu, quá trình, kết quả và tính hiệu quả.
1. ĐÁNH GIÁ NHU CẦU
Một đánh giá nhu cầu trả lời những câu hỏi:
- Những nét chính mang tính kinh tế xã hội của cộng đồng là gì?
- Những nhu cầu cụ thể của cộng đồng đối với loại chương trình đang
được xem xét.
- Các hình thức dịch vụ nào thu hút cộng đồng này?
Việc đo lường nhu cầu là điều kiện tiên quyết đối với việc hoạch định
chương trình hiệu quả. Ngày nay, các nhà đánh giá coi việc lập kế hoạch có
liên quan chặt chẽ với đánh giá. Thực ra, lập kế hoạch là một hình thức đánh
giá - việc đánh giá xảy ra trước khi chương trình được thực hiện.
2. ĐÁNH GIÁ QUÁ TRÌNH
Khi một chương trình được soạn thảo và bắt đầu, các nhà đánh giá sẽ
quay sang việc soạn thảo tài liệu ở mức độ chương trình được thực hiện như
đã dự thảo và sẽ phục vụ cho dân số dự kiến. Một người có thể nghĩ về quá
trình đánh giá như là việc xem xét các cố gắng được đưa vào chương trình.
Loại câu hỏi mà đánh giá quá trình cần trả lời là:
- Chương trình có hấp dẫn đủ số người tham gia?
- Số người tham gia có đại diện cho dân số dự kiến không?
- Nhân viên thực sự liên hệ với số người tham gia ở mức độ nào?
- Số công việc của nhân viên có phù hợp với những gì đã vạch ra
không?
- Có sự khác biệt giữa các thành viên trong nhóm nhân viên với cố
gắng được mở rộng không?
Trong khi các câu trả lời cho những câu hỏi này không chỉ ra là chương
trình thành công hay không, chúng vẫn quan trọng và bất cứ ai có trách nhiệm
điều hành, tài trợ hoặc mở rộng chương trình cần nghe các câu trả lời đó. Có
thể hiểu được là một kế hoạch tốt được thực hiện không phù hợp hoặc là một
chương trình thành công không phục vụ cho dân số dự kiến (dân số đó được
ủy thác và tài trợ). Các lưu ý sớm về những vấn đề như thế được việc đánh
giá quá trình cung cấp tạo cho các nhà quản lý cơ hội để điều khiển lại
chương trình và tạo cho nó cơ hội thành công.
3. ĐÁNH GIÁ KẾT QUẢ
Nếu một nghiên cứu việc thực hiện thực sự chỉ ra rằng chương trình
được đưa vào đúng nơi một cách thành công, việc đánh giá kết do người
trong chưong trình đạt được có thể trở thành trọng điểm của người đánh giá.
Ví dụ: Trong khóa học đọc tốc độ:
- Người tham gia vào khóa học cách đọc tốc độ có đọc nhanh không?
- Họ có đọc nhanh hơn những người không tham gia khóa học không?
- Có thể tìm thấy bằng chứng là việc tham gia vào khóa học tạo ra tốc
độ đọc tăng lên không?
Mặc dù hỏi những câu này là hợp lý, nhưng rõ ràng chỉ thông qua độ
dài của biện pháp đánh giá kết quả thì rõ ràng khó xác định các nguyên nhân
của sự thay đổi hành vi quan sát được ở những người tham gia.
Khi thiết kế và tiến hành đánh giá kết quả, các nhà đánh giá cần định
nghĩa các cách thức đo lường sự thành công. Các định nghĩa về các kết quả
thành công có thể thay đổi tốt nếu chúng ta so sánh các ý kiến của các nhóm
quan tâm khác nhau, như cơ quan tài trợ, nhân viên trực tiếp thực hiện
chương trình, và những người tham gia.
4. ĐÁNH GIÁ TÍNH HIỆU QUẢ
Trong chương trình có thể giúp những người tham gia, các nhà quản lý
và các nhà lập pháp cũng cần phải đáp ứng vấn đề đặt ra về chi phí. Đánh giá
tính hiệu quả đặt ra những câu hỏi sau đây:
- Chương trình có đạt được sự thành công ở một chi phí hợp lý?
- Đồng tiền có được phân phối đến các kết quả đạt được không?
- Chương trình có đạt được mức thành công tốt hơn các chương trình
khác có chi phí bằng hoặc thấp hơn trong điều hành không?
Hai tiêu chí quan trọng được sử dụng để so sánh các chương trình là
tính hiệu quả và chi phí. Nếu hai chương trình hiệu quả ngang nhau, thì
chương trình ít chi phí hơn đạt được kết quả tốt hơn tính theo tiền. Nếu một
chương trình chi phí cao hơn, hiệu quả hơn, thì vấn đề trở nên khó khăn hơn.
Có phải sự cải thiện hơn đáng giá với chi phí cộng thêm? Sự phức tạp khác
được thêm vào do hầu hết các chương trình tìm được sự thay đổi có nhiều
đặc tính. Một chương trình có thể khích lệ sự cải tiến trong nhiều lĩnh vực và
chương trình khác có thể ảnh hưởng những đặc tính khác nhau.
Hãy lưu ý rằng có một quy trình logic trong các câu hỏi đánh giá này.
Không có đo lường nhu cầu, các chương trình không thể hoạch định một
cách hợp lý, không thực hiện hiệu quả, không thể có các kết quả có ý nghĩa
từ chương trình và không có các kết quả có giá trị, không có lý do gì để lo
lắng về hiệu quả, chi phí. Sự tập trung vào vấn đề đánh giá không phù hợp
dường như tạo ra một cách đánh giá không có giá trị (Wholey, 1983).
Trên đây là những thông tin về việc đánh giá tổng quát. Tuy nhiên,
chúng ta có thể áp dụng chúng vào việc đánh giá việc giảng dạy các chương
trình cốt lõi của chúng ta để đạt mức độ hiệu quả nhăm cải tiến việc giảng dạy
một cách có kết quả hơn.
Một cách phân loại khác
Tất cả các quyết định của giáo viên và mục đích đánh giá vừa mô tả ở
trên có thể được chia thành ba loại chung (Airasian, 1997). Bảng 1.1 mô tả và
so sánh ba loại hình đánh giá này. Một số đánh giá trong lớp học giúp giáo
viên thực hiện trách nhiệm chính của mình là thành viên của nhà trường về
mặt cơ chế. Các quyết định như xếp hạng, phân nhóm, đánh giá tiến bộ, diễn
giải kết quả kiểm tra, họp phụ huynh, nhận biết các nhu cầu cần phân loại đặc
biệt của học sinh và đề nghị lên lớp là tất cả những trách nhiệm chính mà
giáo viên phải thực hiện khi đã là viên chức của hệ thống nhà trường. Đây
được gọi là đánh giá chính thức (official assessment). Các đánh giá khác
được sử dụng để lên kế hoạch và tiến hành giảng dạy bao gồm quyết định sẽ
dạy cái gì, khi nào dạy và dạy như thế nào, sử dụng tài liệu gì, bài học sẽ phát
triển ra sao và cần phải thay đổi gì trong các hoạt động lên kế hoạch sẵn. Đây
là đánh giá giảng dạy (instructional assessment).
Một loại đánh giá thứ ba được giáo viên sử dụng vào đầu năm học là
tìm hiểu đặc điểm và nhu cầu về xã hội, tri thức và hành vi của học sinh để
nâng cao việc giảng dạy, giao tiếp và hợp tác trong lớp học. Những đánh giá
này cho phép giáo viên tạo sự bình ổn trong lớp học. Chúng được gọi là đánh
giá sơ khởi. Các chương tiếp theo sẽ mô tả chi tiết hơn ba loại đánh giá tổng
quát này. Còn bây giờ điều quan trọng là nhận thức được kiểm tra đánh giá
phục vụ rất nhiều mục đích trong lớp học.
BẢNG 1.1. SO SÁNH BA LOẠI ĐÁNH GIÁ TRONG LỚP HỌC
Chính thức Giảng dạy Sơ khởi
Mục đích
Thực hiện các khía
cạnh mang tính thủ tục
hành chánh được quy
định của việc dạy học,
như là chấm điểm,
phân nhóm, và xếp
hạng.
Lên kế hoạch các
hoạt động giảng dạy
và đi theo sự tiến bộ
của việc giảng dạy.
Giúp giáo viên
nhận thức
nhanh vốn kiến
thức thực tế và
đặc điểm của
học sinh.
Kế hoạch thời gian
Định kỳ trong suốt năm
học.
Hàng ngày trong
suốt năm học.
Trong tuần đầu
hay hai tuần
đầu của năm
học.
Phương pháp thu
thập chứng cứ
Các bài thi, bài kiểm
tra, báo cáo, thi vấn
đáp và bài tập chính
thức.
Quan sát chính thức
và cho học sinh làm
bài kiểm tra viết để
lên kế hoạch; quan
sát không chính
thức để giám sát.
Phần lớn là
quan sát không
chính thức.
Loại chứng cứ thu thập
được
Chủ yếu liên quan đến
nhận thức.
Phần lớn liên quan
đến nhận thức và
tình cảm.
Liên quan đến
nhận thức, tình
cảm và hành vi
tâm vận động.
Lưu trữ dữ liệu
Các dữ liệu hình thức
được giữ trong sổ điểm
của giáo viên hoặc hồ
sơ của nhà trường.
Giáo án được viết
tay còn thông tin do
quan sát không
được viết ra.
Thông tin được
lưu giữ trong
đầu giáo viên,
một số ít được
viết ra.
Nguồn:
1. Emil I. Posavac et al, 1989, Program Evaluation - Methods and Case
Studies, New Jersey: Prentice Hall. Inc. (p. p1 - 14).
2. Airasian, P.W. 1997, Kiểm tra đánh giá trong lớp học (Classroom
Assessment (tái bản lần thứ 3). New York McGraw - Hill.
Bài 4. MỤC ĐÍCH, Ý NGHĨA CỦA VIỆC ĐO LƯỜNG KIỂM TRA ĐÁNH GIÁ TRONG GIÁO DỤC
1. MỤC ĐÍCH
Kiểm tra là công cụ hay phương tiện đo lường kiến thức, kỹ năng, kỹ
xảo của người học.
Đánh giá nhằm xác định mức độ, trình độ của người học, cụ thể là điểm
số.
Đo lường là quá trình thực hiện một lối mô tả mức độ mà một cá nhân
đã đạt được (hay đã có) một đặc điểm nào đó chẳng hạn như khá năng, thái
độ…
Kiểm tra là phương tiện của đánh giá. Còn đánh giá là mục đích của
kiểm tra. Và mục đích đánh giá quyết định nội dung và hình thức của kiểm tra.
Mục đích cơ bản nhất là phải xác định chất lượng, số lượng của giáo
dục và học tập nhằm khuyến khích trò học tốt, thầy dạy tốt. Người học học
tập và nâng cao tinh thần trách nhiệm của bản thân đối với việc học tập của
mình. Giáo viên phải kiểm tra đánh giá vì nhiều mục đích khác nhau bởi họ
phải ra nhiều quyết định. Nếu chúng ta xem lại các quyết định của giáo viên
trong suốt ngày dạy của mình, chúng ta sẽ thấy được mục đích để đánh giá
của giáo viên có ý nghĩa như thế nào. Phần còn lại của chương này tập trung
vào vấn đề và chiến lược kiểm tra đánh giá vì các mục đích sau: tạo sự bình
ổn trong lớp học, lên kế hoạch và tiến hành giảng dạy, phân loại người học,
phản hồi và khích lệ, phán đoán, xếp hạng việc học tập và mức tiến bộ.
Tạo sự bình ổn trong lớp học
Một mục đích thường bị bỏ sót của kiểm tra đánh giá là tạo sự bình ổn
trong lớp học. Lớp học là một môi trường xã hội phức tạp mà ở đó mọi người
tương tác với nhau theo muôn vàn cách. Để lớp học trở thành một môi trường
học tập và xã hội tích cực, cần phải có trật tự, kỷ luật và hợp tác. Vì vậy, giúp
đỡ người học học tập và duy trì trật tự trong lớp học có quan hệ mật thiết với
nhau. Đồng thời, để việc dạy và học thành công cũng phải cần đến việc chấp
hành kỷ luật.
Lên kế hoạch và tiến hành giảng dạy
Các quyết định về giảng dạy có thể chia thành hai loại: quyết định lên
kế hoạch và quyết định quá trình (hoặc dạy học). Khi giáo viên chọn chủ đề
cho bài học ngày mai, xem trước và chọn ra một đoạn phim ngắn cho môn
khoa học vào tuần tới, quyết định dành thêm hai ngày cho bộ sưu tập bài làm
môn thơ ca và giao bài tập về nhà chỉ một môn chứ không học thêm môn
khác. Như vậy, giáo viên đã lên kế hoạch cho các hoạt động giảng dạy cho
tương lai.
Cùng với quyết định lên kế hoạch, quá trình giảng dạy một lớp học thực
sự đòi hỏi việc đánh giá và ra quyết định thường xuyên. Vào hai thời điểm
trong ngày, giáo viên đã thay đổi cách dạy của mình vào giữa bài học vì lớp
học bắt đầu mất trật tự. Lần đầu, giáo viên ngưng bài học ngôn ngữ để ôn lại
bài của ngày hôm trước vì các câu trả lời của người học cho thấy rằng cả lớp
không nắm chắc bài. Lần khác, cô thay đổi cách dạy từ thảo luận sang làm
việc tại chỗ khi người học bắt đầu chán và mất trật tự. Rất nhiều đánh giá của
giáo viên nhằm mục đích lên kế hoạch và kiểm soát việc giảng dạy.
Phân loại người học
Hầu hết giáo viên phải ra quyết định phân loại người học. Bất cứ khi
nào giáo viên chia người học thành nhóm môn Tập đọc hoặc môn Toán, hay
tổ chức nhóm cùng nhau học tập, các cặp hay nhóm làm bài trong lớp, hoặc
đề nghị cho một người học cụ thể nào đó được học với một giáo viên cụ thể
vào năm tới, thì khi đó giáo viên sẽ đưa ra các đánh giá vì mục đích phân loại.
Đưa ra thông tin phản hồi và khích lệ
Một lý do quan trọng khác của kiểm tra đánh giá trong lớp học là đưa ra
phản hồi và khích lệ người học. Trong mỗi trường hợp, giáo viên đã sử dụng
các thông tin về sự thể hiện kỹ năng trong học tập để đưa ra phản hồi cho
người học về việc làm của các em. Thuật ngữ dùng để miêu tả ý kiến nhằm
thay đổi và cải thiện việc học tập trong khi giảng dạy được gọi là đánh giá
hình thành. Để đưa ra được các ý kiến như thế này, giáo viên phải thường
xuyên kiểm tra đánh giá việc học hành và hành vi của người học.
Chẩn đoán các vấn đề của người học
Giáo viên phải luôn luôn giám sát những người học có vấn đề về học
tập, tình cảm hoặc vấn đề xã hội trong lớp mình. Xác định được những vấn
đề này, giáo viên thính thoảng có thể tiến hành hoạt động giúp đỡ cần thiết,
nhưng đôi khi có những người học cần phải được chẩn đoán và giúp đỡ đặc
biệt ngoài lớp học. Phần nhiều dữ liệu kiểm đánh giá do giáo viên thu thập
được dùng để nhận biết, hiểu và khắc phục các vấn đề và khó khăn trong học
tập của người học.
Phán đoán giá trị, xếp loại học tập và mức tiến bộ
Một số quyết định của giáo viên liên quan đến phán đoán giá trị, xếp
loại học tập và mức tiến bộ trong nhà trường. Giáo viên chấm điểm bài kiểm
tra khoa học của người học, hoàn thành bản báo cáo tiến bộ hàng tháng của
mỗi em, quyết định tự soạn bài kiểm tra cho môn khoa học hơn là sử dụng bài
kiểm tra có sẵn trong sách giáo khoa, sửa bài tập của người học và họp với
phụ huynh. Phần lớn thời gian của giáo viên được dùng để thu thập thông tin
nhằm phán đoán giá trị người học hoặc xếp loại mức tiến bộ trong học tập
của các em. Thuật ngữ chỉ việc xếp loại hay phán đoán việc học hành của
người học sau khi dạy được gọi là đánh giá tổng kết (summative evaluation).
- Đối với người học:
Thông tin kiểm tra đánh giá sẽ giúp cho người học đào sâu kiến thức,
hệ thống hóa các kiến thức cũ. Khái quát hóa những tri thức đã được tiếp thu
và giúp họ phát triển tư duy, trí nhớ.
Giúp người học tránh được những lỗ hổng trong tri thức để kịp thời bổ
sung.
Giúp người học nâng cao tính độc lập và tích cực trong học tập, rèn
luyện thói quen tìm hiểu sâu tài liệu học tập, tham gia tích cực vào việc học
tập, thảo luận, phân tích, phê phán, rèn luyện khả năng giải quyết vấn đề
trong học tập.
- Đối với giáo viên:
Hiểu rõ kết quả của công tác giảng dạy dẫn đến hoàn thiện kết quả học
tập của người học.
Hoàn chỉnh các hình thức tổ chức và phương pháp giảng dạy để tăng
phần hữu hiệu.
Hiểu rõ trình độ học tập của người học nên hay không nên tiếp tục
nâng cao chất lượng giảng dạy cũng như lập kế hoạch cụ thể.
- Đối với nhà trường, phụ huynh và các cơ quan quản lý giáo dục:
Giúp nhà trường theo dõi được tình hình học tập của người học qua đó
đánh giá được công việc giảng dạy của giáo viên.
Giúp phụ huynh hiểu rõ về con em họ, nhờ đó tăng cường mối quan hệ
giữa nhà trường với gia đình.
Giúp các cơ quan lãnh đạo giáo dục nắm chính xác tình hình học tập
của người học để từ đó sửa chữa điều chỉnh lại chương trình và có những
biện pháp bổ sung cho thích hợp.
Trong trường học, việc đánh giá kết quả học tập của người học được
thực hiện chủ yếu thông qua việc tổ chức kiểm tra và thi cử một cách có hệ
thống với nhiều hình thức khác nhau theo những quy định chặt chẽ.
2. Ý NGHĨA
- Đối với người học:
Đối với người học, việc kiểm tra đánh giá có hệ thống và thường xuyên,
cung cấp kịp thời những thông tin “phản hồi” giúp cho người học tự điều chỉnh
hoạt động học.
- Đối với giáo viên:
Đối với giáo viên, việc kiểm tra đánh giá người học nhằm cung cấp cho
giáo viên những thông tin “phản hồi bên ngoài” giúp người dạy điều chỉnh
hoạt động dạy.
- Đối với các cấp cán bộ quản lý giáo dục:
Kiểm tra đánh giá người học cung cấp cho các cán bộ quản lý giáo dục
các cấp những thông tin cơ bản về thực trạng dạy và học trong một đơn vị
giáo dục để có những chỉ đạo, kịp thời uốn nắn những lệch lạc, khuyến khích
hỗ trợ nhằm đảm bảo thực hiện tốt mục tiêu giáo dục.
3. TIÊU CHUẨN VIỆC KIỂM TRA ĐÁNH GIÁ
Trong nhà trường, kiểm tra được xem là một phương tiện thường dùng
để đánh giá kết quả của người học, vì thế việc kiểm tra cần có ba tiêu chuẩn
đó là có giá trị, đáng tin cậy và dễ sử dụng:
* Có giá trị:
Bài kiểm tra phải thực hiện được nội dung muốn có gồm ba mặt:
- Nội dung kiểm tra phải phù hợp và bao gồm các phần quan trọng của
giáo trình sách giáo khoa và bài giảng của giáo viên.
- Sự nhất trí nội tại của bài kiểm tra phải thể hiện sự liên hệ nhất quán
trong các câu hỏi. Câu hỏi có giá trị là phải phân biệt được người học giỏi và
người học kém.
- Sự so sánh tiêu chuẩn ngoại lai: cho thấy kết quả kiểm tra phải phù
hợp với kết quả đánh giá khác có đối tượng tương tự.
* Đáng tin cậy:
Bài kiểm tra đáng tin cậy nói lên tính vững chắc của điểm số. Mức tin
cậy của bài kiểm tra tùy thuộc vào ba yếu tố:
- Vừa sức với trình độ người học.
- Không có các ảnh hưởng ngoại lai khi người học làm bài.
- Sự khách quan của người chấm thể hiện ở điểm số ổn định.
* Dễ sử dụng:
Bài kiểm tra dễ sử dụng thể hiện ở ba khía cạnh:
- Hình thức tổ chức kiểm tra: Bài kiểm tra phải soạn kỹ lưỡng, tránh các
trở ngại khi người học làm bài, phải có hướng dẫn rõ ràng, ghi thời gian làm
bài, các điểm số và tài liệu sử dụng (nếu có).
- Dễ chấm: Bài kiểm tra phải có thang điểm rõ ràng để việc chấm bài dễ
dàng và để nâng cao mức tin cậy của bài kiểm tra.
- Ít tốn kém: Để thực hiện một bài kiểm tra, các yếu tố như thời gian làm
bài, chấm bài cũng như thời gian soạn đề và phương tiện liên hệ phải được
giảm thiểu. Tuy nhiên, việc tiết kiệm này không làm thiệt hại đến tính chất
đáng tin cậy và có giá trị của bài kiểm tra. Sự tiết kiệm đúng đắn không rời
mức độ thỏa mãn mục đích của bài kiểm tra.
4. NGUYÊN TẮC VIỆC ĐÁNH GIÁ
Để việc đánh giá được chính xác và công bằng phải thể hiện các
nguyên tắc sau:
* Khách quan:
- Việc đánh giá không có tình cảm và tác nhân ngoại lai xen vào kết quả
điểm số.
- Phù hợp với trình độ thực tế kết quả học tập của người học.
- Để đạt được nguyên tắc khách quan trong đánh giá thì ta phải xác
định đúng đắn đối tượng đánh giá. Bài kiểm tra nhằm mục đích khảo sát kiến
thức, kỹ năng, kỹ xảo của người học thì việc đánh giá phải theo sát mục đích
đó.
* Dựa vào mục tiêu giáo dục:
- Mục tiêu giáo dục là khởi điểm của chương trình giảng dạy và học tập.
- Việc đánh giá là xem xét mục tiêu đã đạt được đến mức độ nào, do đó
đánh giá phải lấy mục tiêu giáo dục làm chuẩn.
* Toàn diện:
Đánh giá kiến thức, kỹ năng, kỹ xảo của người học phải bao gồm nội
dung đã được xác định.
Đánh giá không chỉ chú trọng vào kiến thức của người học mà còn cả
về tư tưởng chính trị, tác phong, thái độ.
* Đánh giá phải thường xuyên và có kế hoạch:
Kiến thức, kỹ năng, kỹ xảo cũng như với mọi hoạt động thường xuyên
của con người đều vận động và phát triển không ngừng. Do đó, kết quả đánh
giá chỉ có giá trị thực sự ngay trong thời điểm đánh giá. Chính vì vậy, việc
đánh giá chính xác phải thực hiện thường xuyên trong suốt quá trình học tập
với nhiều dạng khác nhau.
Việc đánh giá phải có kế hoạch, phải nghiên cứu thời gian và hình thức
kiểm tra thích hợp.
* Đánh giá nhằm cải tiến phương pháp giảng dạy hoàn chỉnh chương trình học:
Dựa vào cơ sở kết quả của kiểm tra và thi, giáo viên và cán bộ quản lý
giáo dục phải tìm hiểu tác nhân đưa đến kết quả để phát hiện những ưu điểm,
sửa chữa nhược điểm nhằm cải tiến phương pháp giảng dạy và sửa đổi
chương trình học cho thích hợp.
5. ƯU VÀ NHƯỢC ĐIỂM CỦA CÁC PHƯƠNG PHÁP KIỂM TRA ĐÁNH GIÁ CHỦ YẾU HIỆN NAY
* Kiểm tra vấn đáp:
- Kiểm tra vấn đáp được sử dụng bất cứ lúc nào trong quá trình dạy
học. Loại kiểm tra vấn đáp có:
- Kiểm tra cá nhân: là hình thức kiểm tra mà từng người học có nội
dung riêng.
- Kiểm tra đồng loạt: là hình thức đặt câu hỏi chung và tất cả người học
đều có thể tham gia trả lời được.
- Kiểm tra phối hợp: là hình thức tiến hành kiểm tra cá nhân và kiểm tra
đồng loạt.
+ Ưu điểm của kiểm tra vấn đáp:
- Kiểm tra vấn đáp giúp giáo viên dễ dàng nắm được tư tưởng và cách
suy luận của người học để kịp thời uốn nắn những sai sót trong nói, đồng thời
giúp người học sử dụng đúng những thuật ngữ và diễn đạt ý một cách logic.
- Người học sẽ hiểu rõ bài hơn và nhớ lâu tài liệu nhờ trình bày bằng
ngôn ngữ của mình.
- Giúp giáo viên có thể nhận định được ngay và xác định đúng trình độ
của người học nhờ hỏi thêm những câu phụ và các chi tiết bổ sung.
- Giúp giáo viên hiểu rõ trình độ của người học nhờ đó theo dõi việc
học tập của người học, dễ dàng và kịp thời phụ đạo người học kém.
- Giúp người học tích cực tham gia vào bài học tạo không khí sinh động
cho lớp học.
- Kiểm tra vấn đáp là phương tiện giúp người học mạnh dạn phát biểu ý
kiến luyện tập khả năng đối đáp, diễn đạt ý tưởng chính xác và tập cho người
học quan sát, suy nghĩ phán đoán nhanh chóng.
+ Nhược điểm của kiểm tra vấn đáp:
- Kết quả trả lời của một số người học không thể coi là đại diện cho cả
lớp. Điểm số của một vài người học không giúp cho giáo viên đánh giá đúng
mức trình độ chung của cả lớp.
- Áp dụng kiểm tra vấn đáp cho cả lớp mất nhiều thời gian.
- Các câu hỏi phân phối cho người học có độ khó không đều nhau.
- Những yếu tố ngoại lai có thể dẫn đến sự chủ quan của giáo viên.
* Kiểm tra thực hành:
Kiểm tra thực hành rất hạn chế chỉ dùng đối với kỹ năng, kỹ xảo nghề
nghiệp: cách thức thao tác, sử dụng công cụ lao động. Kiểm tra quá trình thực
hiện một sản phẩm hay các bước tiến hành một thao tác.
- Đối với kiểm tra thành phẩm thực hành thì mục đích kiểm tra là đánh
giá sản phẩm làm ra của người học dựa vào các tiêu chuẩn kỹ thuật đã được
phổ biến trước. Các tiêu chuẩn kỹ thuật bao gồm các yêu cầu về hình dáng
kích thước, phẩm chất, thời gian thực hiện, số lượng, những sai số cho phép.
- Đối với kiểm tra thao tác thực hành thì trong thời gian kiểm tra, giáo
viên phải theo dõi, quan sát người học thực hành từ đầu đến cuối. Trong việc
kiểm tra thao tác thực hành, giáo viên căn cứ vào tiêu chuẩn để đánh giá cụ
thể là tiêu chuẩn thao tác, tiêu chuẩn kỹ thuật và tiêu chuẩn nội quy.
+ Ưu điểm của kiểm tra thực hành:
Có thể nói đây là phương pháp kiểm tra hữu hiệu nhất và không loại
kiểm tra nào có thể thay thế được để đánh giá kỹ năng, kỹ xảo tay nghề.
+ Nhược điểm của kiểm tra thực hành:
- Đòi hỏi thời gian để thực hiện và đòi hỏi giáo viên phải theo dõi suốt
quá trình.
- Vì phải theo dõi cùng một lúc nhiều người học nên giáo viên không
thể theo dõi một cách cẩn thận. Để hạn chế điểm này việc theo dõi thực hành
cần từ 2 đến 6 người cùng một lúc.
- Kiểm tra thực hành chỉ khảo sát nội dung giới hạn ở phạm vi thực
hành thôi.
- Để kiểm tra và đánh giá kỹ năng, kỹ xảo của người học được khách
quan chính xác thì các phương tiện, dụng cụ, trang thiết bị, máy móc, phải
được chuẩn bị đầy đủ và đạt tiêu chuẩn.
* Kiểm tra viết:
Có trắc nghiệm chủ quan (loại luận đề, tự luận, loại câu hỏi ngắn và
trắc nghiệm khách quan.
Loại trắc nghiệm chủ quan
Thường kiểm tra định kỳ sau khi học xong một chương trình hay một
phần, hoặc học kỳ, thời gian kiểm tra là một tiết trở lên. Loại kiểm tra này đòi
hỏi người học diễn đạt kiến thức, kỹ năng bằng cách viết ra giấy trong thời
gian nhất định. Thời gian ấn định tùy thuộc tầm quan trọng và mục đích của
bài kiểm tra viết.
+ Ưu điểm của kiểm tra chủ quan:
- Trong một thời gian ngắn có thể kiểm tra toàn thể người học trong lớp
về một số nội dung nhất định.
- Người học có đủ thời gian để suy nghĩ, vận dụng kiến thức và trình
bày đầy đủ hiểu biết của mình, đồng thời phát huy được năng lực sáng tạo.
- Qua bài kiểm tra viết nắm được tình hình trình độ chung của lớp và
của từng người học, giúp giáo viên hoàn thiện nội dung bài giảng, phương
pháp dạy học để từ đó có kế hoạch bồi dưỡng người học khá và phụ đạo
người học kém.
+ Nhược điểm của kiểm tra chủ quan:
- Nội dung kiểm tra mặc dầu rộng nhưng cũng không bao trùm nội dung
toàn bộ chương trình ấn định mà thường tập trung vào một số nội dung quan
trọng nhất định. Chính vì vậy người học sẽ dễ học tủ.
- Nếu đề bài quá rộng đòi hỏi thang điểm phức tạp thì việc đánh giá sẽ
khó khăn.
- Kết quả kiểm tra thường chịu ảnh hưởng qua cách trình bày, chữ viết
và cách hành văn của người học.
Lọai trắc nghiệm khách quan:
+ Ưu điểm loại trắc nghiệm khách quan:
- Độ tin cậy cao (điểm số không phụ thuộc vào người chấm).
- Bài chấm nhanh, chính xác, có thể kết hợp chấm bằng máy.
- Khảo sát được toàn bộ nội dung chương trình môn học, tránh việc học
tủ, yếu tố may rủi trong thi cử.
+ Nhược điểm loại trắc nghiệm khách quan:
- Không khảo sát được diễn biến tư duy của người học khi làm bài.
- Đòi hỏi giáo viên làm chủ chuyên môn và có kiến thức soạn thảo câu
hỏi trắc nghiệm.
- Tốn công sức, tiền của, thời gian.
- Người học có khuynh hướng đoán mò khi làm bài trắc nghiệm.
- Khó soạn những câu có giá trị đồng đều.
- Kiểm tra bằng trắc nghiệm thì đề thi phải in sẵn, phải tổ chức chặt chẽ
tránh sự thông đồng (cử chỉ - tiếng nói) tiêu cực trong thi.
6. CÁC VẤN ĐỀ ĐẠO ĐỨC VÀ TRÁCH NHIỆM
Cho đến hiện nay chúng ta đã xem xét nhiều khía cạnh kỹ thuật của
kiểm tra đánh giá trong lớp học. Tuy nhiên, kiểm tra đánh giá không chỉ là một
hoạt động kỹ thuật; nó còn là một hoạt động nhân bản có ảnh hưởng và tác
động đến nhiều người trong đó bao gồm người học, phụ huynh, thầy cô giáo,
huấn luyện viên, những người tư vấn tuyển sinh và các nhân viên khác nữa.
Hãy suy nghĩ về nhiều loại hình và mục đích kiểm tra đánh giá khác nhau đã
được miêu tả trong chương này, và sau đó nghĩ về tất cả mặt ảnh hưởng mà
chúng tác động lên con người. Điều này giúp bạn nhận thức được phương
diện nhân bản của kiểm tra đánh giá.
Dạy học là một nghề đòi hỏi nền tảng về kiến thức lẫn đạo đức. Giống
như những người có chuyên môn sâu như bác sĩ chẳng hạn, họ có kiến thức
và chuyên môn mà bệnh nhân không có và những hành vi và xét đoán của họ
ít nhiều ảnh hưởng đến bệnh nhân của mình theo nhiều cách khác nhau,
người thầy giáo đứng lớp có trách nhiệm cư xử theo một khuôn mẫu đạo đức.
Trách nhiệm này đặc biệt quan trọng trong quá trình giáo dục bởi vì không
giống như hầu hết các ngành nghề khác, người học không được lựa chọn sẽ
hoặc không đi học. So với thầy giáo, người học cũng ít kinh nghiệm và
thường dễ bị ảnh hưởng hơn. Trong số các tiêu chuẩn đạo đức xuyên suốt
mọi phạm vi giảng dạy là nhu cầu đối xử với người học như một cá thể để
tránh xúc phạm thể chất và tình cảm của người học, để tôn trọng tính đa
dạng, trung thực về mặt trí tuệ với người học, tránh tình trạng thiên vị và quấy
rối, đưa ra một quan điểm cân bằng về các vấn đề nêu ra trong khi dạy học,
và truyền đạt những kiến thức tốt nhất có thể cho tất cả người học
(Fenstermacher, 1990; Clark, 1990; Strike và Soltis, 1991).
Nói một cách đơn giản, mỗi tiêu chuẩn đạo đức này đều đề cập đến
một số khía cạnh về sự công bằng của giáo viên trong cách đối xử với người
học của mình. Rõ ràng việc thu thập và diễn giải dữ liệu đáng tin cậy và có giá
trị để ra quyết định là cơ sở cho sự công bằng trong các đánh giá của giáo
viên. Các khía cạnh khác của tính công bằng này bao gồm:
(1) Thông báo với người học về các yêu cầu của giáo viên trước khi bắt
đầu dạy học và kiểm tra đánh giá;
(2) Dạy cho người học những gì các em sẽ được kiểm tra trước khi
đánh giá;
(3) Không đưa ra những ý kiến vội vàng và “chỉ mặt đặt tên” người học
theo lối “dán nhãn hiệu” do cảm tính ví dụ như “hay lo ra”, “liều mạng”, “chậm
tiêu”,… trước khi bạn dành thời gian với những người học đó;
(4) Tránh rập khuôn người học theo kiểu “Thằng đó đần lắm”, “Mấy đứa
đến từ vùng đó hay gây rối lắm”, hoặc “Học trò mà ăn mặc kiểu đó chẳng
quan tâm gì đến học hành hết”;
(5) Tránh dùng các từ ngữ và ví dụ có thể xúc phạm đến những người
học khác giới, chủng tộc, tôn giáo, văn hóa hoặc quốc tịch;
(6) Tránh thành kiến với người học có vốn ngoại ngữ hạn chế hoặc kinh
nghiệm văn hóa khác nhau khi dạy học và đánh giá (Airasian, 1997; McMillan,
1997). Có nhiều phương diện về tính công bằng trong lớp học.
Thêm vào đó còn có các lưu ý về đạo đức có thể áp dụng riêng cho
kiểm tra đánh giá. Giáo viên trực tiếp giảng dạy luôn ở vị trí có thể thu thập
được rất nhiều thông tin về vấn đề học hành, cá nhân, xã hội và gia đình của
người học. Nhưng ngoài việc tiếp cận được các thông tin như thế, người giáo
viên còn sử dụng thông tin đó để ra quyết định có thể có tầm ảnh hưởng ngắn
hoặc dài hạn đối với người học. Ví dụ, cơ hội vào đại học và nghề nghiệp
tương lai, ở đây không tính đến lòng tự trọng của người học, thường lơ lửng
theo các quyết định từ kiểm tra đánh giá của giáo viên. Kết quả là có những
vấn đề trách nhiệm liên quan đến việc thu thập và sử dụng thông tin đánh giá.
Giáo viên phải luôn cố gắng thu thập được những thông tin có giá trị và đáng
tin cậy khi đưa ra quyết định quan trọng có thể ảnh hưởng đến người học.
Hơn nữa, một khi thu thập được thông tin đánh giá, giáo viên có trách nhiệm
bảo đảm tính riêng tư, nhận biết các hạn chế của việc ra quyết định và không
bao giờ sử dụng thông tin đó để hạ thấp hoặc nhạo báng bất kỳ một người
học nào.
Chương này chỉ ra rằng lớp học là một môi trường phức tạp đòi hỏi
giáo viên phải ra quyết định trong nhiều lĩnh vực. Trong một môi trường như
thế, chúng ta không trông đợi giáo viên phải luôn chính xác trong mọi quyết
định. Điều này có thể là một tiêu chuẩn không thực tế, nhất là trong bối cảnh
lớp học hay thay đổi, cần phải ra nhiều quyết định và xảy ra nhiều tình huống
khó xác định. Tuy nhiên, chúng ta nên mong đợi giáo viên có thể đạt được độ
chính xác cao và luôn gắn với đạo đức khi đưa ra những chứng cứ đánh giá
chắc chắn nhằm hỗ trợ cho các quyết định và hành động trong lớp học. Đây
là điều tối thiểu chúng ta có thể trông đợi trong một môi trường mà hành vi
của giáo viên có ảnh hưởng vô cùng quan trọng đến người học.
BẢNG 1.2: NHỮNG TIÊU CHUẨN ĐẠO ĐỨC TRONG MỐI QUAN HỆ THẦY - TRÒ
Cam kết với người học
Nhà giáo dục phải cố gắng giúp từng người học nhận thức được rằng
mình có khả năng trả thành một thành viên xứng đáng và có ích cho xã hội.
Do đó, người thầy phải làm việc để động viên tinh thần học hỏi lĩnh hội tri
thức, hiểu biết và sự cân nhắc hình thành các mục tiêu thích hợp của người
học. Để hoàn thành nghĩa vụ đối với người học người thầy phải:
1. Không cản trở vô lý những hành động độc lập của người học trong
quá trình học tập.
2. Không phủ nhận vô lý cách tiếp cận các quan điểm khác nhau của
người học.
3. Không cố tình lấp liếm hoặc bóp méo những vấn đề liên quan đến sự
tiến bộ của người học.
3. Luôn nỗ lực để bảo vệ người học tránh khỏi những điều kiện tác hại
đến việc học hành hay sức khỏe và sự an toàn cá nhân.
4. Không cố ý đặt người học vào những tình huống lúng túng hoặc mất
thể diện.
5. Không vì chủng tộc, giới tính, tín ngưỡng, xuất xứ, tình trạng hôn
nhân, quan điểm chính trị hoặc tôn giáo, nền tảng gia đình, xã hội hoặc văn
hóa, hay định hướng giới tính mà:
a. Không cho người học tham gia vào một chương trình nào đó.
b. Từ chối không giúp đỡ một người học nào đó.
c. Thiên vị một người học nào đó.
6. Không dùng các mối quan hệ nghề nghiệp với người học để vụ lợi.
7. Không được tiết lộ thông tin về người học mà người thầy có được
trong quá trình giảng dạy, trừ khi bắt buộc phục vụ cho một mục đích nghề
nghiệp nào đó hoặc do luật pháp yêu cầu.
Nguồn:
1. Arasian, P.W. (1997), Kiểm tra đánh giá trong lớp học (Classroom
Assessment; tái bản lần thứ 3, New York: McGraw-Hill.
2. Từ NEA Handbook, 1992-1993, Tái bản với sự cho phép của Hiệp
hội Giáo dục quốc gia (NEA).
3. Dương Thiệu Tống (1995), Trắc nghiệm và đo lường thành quả học
tập, Bộ Giáo Dục - Đào Tạo: Trường ĐH Tổng Hợp Tp. HCM.
Bài 5. MỘT SỐ TÁC DỤNG CỦA VIỆC ĐÁNH GIÁ
Việc đánh giá nói chung, đánh giá trong trường học nói riêng từ trước
đến nay được thực hiện theo một quy trình nhất định trong xã hội cũng như
trong nhà trường.
Hiện nay, công việc đánh giá trong nhà trường được xem xét một cách
nghiêm túc hơn và được đưa vào chương trình đào tạo giáo viên. Sau đây,
chúng ta cùng nhau xét một số tác dụng của việc đánh giá trong giáo dục.
1. KHÁI NIỆM ĐÁNH GIÁ
Kỹ thuật dùng để đánh giá hành vi của con người có một lịch sử lâu dài.
Các trắc nghiệm thể hiện sức mạnh và sức chịu đựng thể chất, như các trắc
nghiệm thông thường trong xã hội tiền sử, chắc chắn cần phải đi ngược dòng
lịch sử nhiều ngàn năm. Ngay cả phương pháp trắc nghiệm chính thức như
các trắc nghiệm viết xuất hiện từ khi lịch sử được ghi lại. Vì thế, người Trung
Quốc đã có hệ thống thi cử được tổ chức cao trước Công nguyên.
Ngược lại, khái niệm đánh giá là một khái niệm xuất hiện không lâu
lắm. Mầm mống của khái niệm được nói đến trong tác phẩm của Rice, vào
thập kỷ cuối của thế kỷ XIX, đã tìm thấy các dữ kiện thực nghiệm để đưa ra
đề xuất giảng dạy và học tập theo phương pháp 3R (Rice nhận thấy số lượng
bài tập luyện tập dùng vào môn học như chính tả thì quá nhiều, thời gian bị
lãng phí nên dùng vào những mục tiêu khác. Kết quả đạt được là ông đã nghĩ
ra một bài trắc nghiệm và cho người học làm bài rộng rãi để so sánh thành
tích của người học đã dùng khối lượng tri thức khác nhau làm bài tập luyện
tập. Trên cơ sở của các dữ kiện trắc nghiệm, ông kết luận rằng thời gian thực
sự được dùng để luyện tập là yếu tố ít quan trọng nhất trong việc xác định kỹ
năng viết chính tả của người học).
Rice đã đi trước thời đại và mãi cho đến nhiều thập niên sau phong trào
đánh giá bắt đầu ảnh hưởng đến nền giáo dục nhà trường. Kể từ đó đến nay
có nhiều nghiên cứu về đánh giá ở phạm vi rộng rãi trong giáo dục và hàng
ngàn nghiên cứu về giảng dạy và học tập. Hơn nữa, những người đi đầu
trong phong trào này đã làm rõ việc hình thành mục đích và các giả định làm
nền tảng cho việc đánh giá, nghiên cứu giáo dục. Có nhiều quan điểm tuyệt
vời về đánh giá mà không cần thiết phải phát triển quan điểm này rộng rãi
hơn.
Theo một quan điểm, đánh giá là nhiệm vụ căn bản của nhà giáo. Đó là
một trong bốn nhiệm vụ căn bản trong việc soạn thảo chương trình học hoặc
vạch kế hoạch giảng dạy mà chúng ta có thể phân biệt. Đây là bốn nhiệm vụ:
(1) Xác định các mục tiêu của một khóa học hoặc chương trình muốn
đạt đến.
(2) Lựa chọn các nội dung học tập giúp đạt đến các mục tiêu này.
(3) Tổ chức những nội dung học tập để nó mang tính liên tục, nối tiếp
cho người học và giúp người học thống nhất những nội dung học tập có vẻ
riêng biệt đó.
(4) Xác định mức độ đạt được của các mục tiêu.
Quan điểm này đặt trên giả định rằng giáo dục là một quá trình để thay
đổi kiểu loại hành vi của con người. Kết quả của quá trình này, ta hy vọng
rằng các cá nhân sẽ thâu nhận những ý tưởng trước đây họ không có, hoàn
thiện các phương pháp suy nghĩ, phát triển óc thẩm mỹ và tính nhạy cảm, bổ
sung thái độ của họ, đồng thời hoàn chỉnh các phương pháp nảy sinh khác.
Nó tuân theo khái niệm giáo dục là các loại thay đổi mà một nhà dục
tìm cách thực hiện các mục tiêu giáo dục của mình. Những mục tiêu căn bản
của nền giáo dục là ảnh hưởng đến sự thay đổi theo cách một cá nhân suy
nghĩ, cảm nhận và hành động.
Quá trình đánh giá là quá trình xác định tính hiệu quả của khóa học
hoặc chương trình trong việc thực hiện sự thay đổi cần thiết như thế. Theo
quan điểm ở trên, đánh giá là mặt thống nhất của việc soạn thảo chương trình
học và giảng dạy. Điều này được minh họa một cách sơ lược trong hình dưới
đây, tạo ra mối quan hệ hỗ tương giữa các yếu tố chính trong một chương
trình giáo dục được hoạch định tốt.
Vì thế, các mục tiêu được coi là cơ sở để soạn thảo cả nội dung học
tập lẫn các phương pháp đánh giá. Đến lượt, nội dung học tập và phương
pháp đánh giá giúp làm rõ các mục tiêu. Hơn nữa, các hoàn cảnh được dùng
để giảng dạy tạo ra sự so sánh cho việc đánh giá và thật ra có thể đưa ra
những hướng dẫn tốt cho việc đánh giá. Vì thế, các phương pháp đánh giá
đưa ra bằng chứng về tính hiệu quả của nội dung học tập, về việc đạt được
chính các mục tiêu. Vì thế, có khả năng của mối tác động giữa những yếu tố
khác nhau này, mỗi yếu tố có ảnh hưởng tiềm tàng trên các yếu tố khác.
2. SO SÁNH QUÁ TRÌNH GIẢNG DẠY VÀ ĐÁNH GIÁ
Giảng dạy
(1) Giảng dạy mang tính hiệu quả khi nó dẫn đến các thay đổi cần có ở
người học.
(2) Các kiểu loại hành vi mới được người học học tập tốt nhất khi họ
nhận ra tính không phù hợp của hành vi hiện có và tầm quan trọng của việc
làm rõ kiểu hành vi mới.
(3) Các kiểu hành vi mới có thể được phát triển một cách hiệu quả hơn
khi các thầy giáo hiểu biết các loại hành vi hiện có của các người học cụ thể
và các lý do để giải thích các hành vi đó.
(4) Việc học tập được khuyến khích bằng các vấn đề và các hoạt động
đòi hỏi sự suy nghĩ hoặc và hành động của mỗi người học.
(5) Các hoạt động cung cấp nền tảng cho việc giảng dạy và học tập của
hành vi chuyên biệt nào đó cũng là những hoạt động phù hợp nhất cho việc
gợi lại và đánh giá sự phù hợp của hành vi đó.
Đánh giá
(1) Đánh giá mang tính hiệu quả khi nó cung cấp các bằng chứng về
mức độ thay đổi ở người học.
(2) Đánh giá giúp cho việc học tập tốt khi nó cung cấp và khuyến khích
việc tự đánh giá.
(3) Đánh giá đóng góp vào việc dạy tốt khi nó làm bộc lộ các loại hành
vi không phù hợp chính và các nguyên nhân phụ.
(4) Đánh giá quan trọng nhất trong học tập khi nó cho phép và khuyến
khích việc thực hiện các sáng kiến cá nhân.
(5) Các hoạt động hoặc luyện tập được phát triển cho các mục đích
đánh giá hành vi chuyên biệt cũng rất hữu ích trong việc giảng dạy và học tập
hành vi đó.
Như vậy, đánh giá không khác việc giảng dạy về mục tiêu, về phương
pháp hoặc về tài liệu và có thể phân biệt với giảng dạy chỉ khi mục tiêu chính
yếu là đưa ra quvết định thành tích của một người học ở cuối thời điểm của
việc giảng dạy.
3. CÁC MỤC ĐÍCH CỦA ĐO LƯỜNG VÀ ĐÁNH GIÁ
Đánh giá có thể dùng với nhiều mục đích, một số mục đích trung tâm
và những mục đích khác chỉ mang tính bên ngoài hoặc không quan trọng.
Các mục đích trung tâm là xác định tính hiệu quả của khóa học, các chương
trình giáo dục và cung cấp cơ sở để hoàn thiện chúng. Nhưng những kỹ thuật
được soạn thảo để phục vụ cho các mục đích trung tâm, các dữ kiện được
thu thập, thực ra là quá trình trọn vẹn, tự đưa chúng vào các sử dụng quan
trọng khác. Tuy nhiên, trong thực tế, một số nhiệm vụ chúng ta sắp xem xét
thường được thực hiện một cách độc lập với các nhiệm vụ của bất cứ
chương trình đánh giá chính thức nào.
3.1. Xác định tính hiệu quả của khóa học và chương trình
Nhu cầu đánh giá chưa bao giờ khẩn thiết như ngày nay. Một số sức
ép đã tạo ra sự thúc đẩy cho nhu cầu này: sự tiến công vào nền giáo dục hiện
đại, việc ghi danh gia tăng và sự gia tăng chi phí. Những sức ép này sẽ bắt
buộc nhà giáo dục tìm kiếm các bằng chứng về tính hiệu quả của các chương
trình hiện có và các phương pháp mới để thực hiện công việc đó.
Nhu cầu đánh giá đặc biệt cao hơn khi trường phổ thông hoặc một
trường đại học đưa ra một chương trình mới. Vào lúc đó có nhiều điều không
chắc chắn - và một số điều nhầm lẫn - về tính hiệu quả tiềm ẩn của chương
trình mới này.
3.2. Kiểm nghiệm giả định về các thực hành cho sẵn
Mỗi chương trình, thực ra mỗi khóa học, khi được giảng dạy, đều được
đặt trên một số giả định nào đó. Mục đích chính của đánh giá là kiểm nghiệm
tính giá trị của những giả định này để việc làm đúng đắn có thể được tiếp tục
và những việc làm không đúng được bỏ đi.
Phạm vi của những giả định như thế thay đổi nhiều và được liệt kê
trong danh sách như các ví dụ dưới đây:
- Người học sẽ phát triển thói quen và kỹ năng viết một cách hiệu quả
nếu nhiệm vụ này được đặt hoàn toàn trên các giờ Tập làm văn.
- Một giáo trình dạy khoa học trong phòng thí nghiệm mang tính giới
thiệu sẽ phát triển sự hiểu biết tốt và đưa đến việc đánh giá cao phương pháp
khoa học.
- Việc đọc các tiểu sử của các nhân vật lịch sử xuất sắc sẽ khắc sâu
vào tâm trí người học các giá trị xã hội có trong cuộc sống của những nhân
vật này.
- Một khi người học đọc được một thứ tiếng nước ngoài, ta có thể dễ
dàng dạy chúng nói.
- Người học nào có nhu cầu lưu trữ thông tin tốt về các hiện tượng tự
nhiên hàng ngày sẽ phát triển khả năng giải thích những hiện tượng này nhờ
các nguyên tắc khoa học.
- Một giáo trình cung cấp thông tin cho việc định hướng nghề nghiệp
dành cho ngưòi học năm cuối ở trung học và sinh viên đại học năm thứ nhất
sẽ củng cố việc chọn nghề đúng đắn.
- Các giáo trình nhấn mạnh trên việc giải thích và phân tích các tác
phẩm gốc trong một lĩnh vực cũng giúp cho người học có nhu cầu lưu trữ khối
lượng lớn tri thức về lĩnh vực đó.
Các giả định giống như thế này đã được kiểm nghiệm qua các nghiên
cứu chính thức và có những dữ liệu về tính giá trị của chúng. Bằng chứng cho
thấy hầu hết những giả định nêu trên không thể chấp nhận được; giả định
cuối cùng là một ngoại lệ. Tuy nhiên, điều quan trọng không phải là những kết
quả về danh sách các giả định riêng biệt này. Tốt hơn là những niềm tin như
thế cần được kiểm nghiệm trong các hoàn cảnh ở trường do các nhà giáo
dục, người có thể và sẵn sàng bỏ thời gian ra thu thập các chứng cứ phù
hợp.
Ý tưởng ban đầu của nhà giáo dục cho rằng yêu cầu loại này không
phải là việc của họ, mang tính kỹ thuật cao quá họ không thể tiến hành được
và các kết quả của việc họ làm khó có giá trị. Không có gì hơn sự thật, nếu
chúng ta nhìn vào những kinh nghiệm của các nhà thực hành đã làm việc với
“công việc nghiên cứu”. Nhà giáo dục có thể kiểm nghiệm nhiều việc làm của
họ bằng các phương pháp như thế, và mặc dù những việc làm này có thể
thiếu sự chính xác của các phương pháp nghiên cứu, chúng có thể giúp các
nhà giáo dục cải tiến các việc làm riêng của họ.
3.3. Làm rõ các mục tiêu
Sự thật là việc giảng dạy tốt có thể tiến hành mà không cần sự xác định
một cách rõ ràng mục đích của người thầy dựa vào hành vi của người học.
Các mục đích đó làm rõ những hoạt động được thực hiện nhưng không được
viết ra. Hoặc các hoạt động được viết ra bằng các thuật ngữ tổng quát. Cả hai
điều kiện này đều không thỏa mãn mục đích đánh giá.
Để đánh giá bất cứ khóa học hoặc chương trình nào hoặc để nghĩ ra
bất cứ phương pháp đánh giá nào, điều quan trọng là định nghĩa các mục
đích bằng hành vi của người học. Ngược lại, hiểu đúng đắn bằng chứng nào
cần tìm là điều không thể được. Vì vậy, đánh giá tạo ra cả sự thử thách lẫn
cơ hội để làm rõ các mục tiêu giáo dục.
3.4. Lựa chọn và cân nhắc các mục tiêu
Một trong những nhiệm vụ chính của nhà giáo dục là xác định các mục
tiêu giáo dục. Đánh giá có thể giúp nhà giáo dục ở đây là cung cấp các dữ
kiện về tình trạng hoặc tiến bộ của người học.
Trắc nghiệm thành tích học tập được cho người học làm trước một
khóa học có thể làm bộc lộ các thiếu sót cần phải bổ sung. Ví dụ, có thể xảy
ra tình trạng người học có khái niệm sai lầm về một loại tri thức hoặc có tình
trạng hứng thú đọc của người học thường thường hẹp. Những “lỗ hổng” như
thế được phát triển sẽ đưa ra các đề xuất cho các đích giáo dục.
Vào cuối mỗi khóa học hoặc chương trình, người ta thu thập các dữ
kiện, mà khi so sánh với các dữ kiện trước đó, sẽ đưa ra chỉ số về sự tiến bộ
của nhóm. Các dữ kiện về mức độ hoàn chỉnh giúp chỉ ra rằng các thay đổi
(mục tiêu) cần thiết có thực hay không. Khả năng có thể đạt được là một tiêu
chuẩn quan trọng cần phải được xem xét trong việc lựa chọn hoặc đánh giá
một mục đích giáo dục.
3.5. Phát hiện và hiểu các khó khăn trong học tập
Gần như bất cứ phương thức đánh giá nào cũng có thể giúp phát hiện
những khó khăn trong học tập và một số phương thức có thể giúp ngay cả
việc chẩn đoán các khó khăn nữa. Đánh giá, nếu được thực hiện thường
xuyên, có thể cung cấp các dữ kiện về các điểm yếu của các cá nhân người
học và cả nhóm. Ví dụ, nó có thể làm bộc lộ ra rằng người học đang theo học
gặp khó khăn trong việc phát hiện ra các giả định căn bản trong việc thảo luận
và rằng nhiều người học nhầm lẫn giữa ý kiến với sự kiện được coi là bằng
chứng cho việc kết luận. Từ đó, những mục tiêu riêng biệt này không được
nhận ra.
Việc khám phá những khó khăn riêng biệt như thế làm cho quá trình
phản hồi thông tin có thể xảy ra ở cả người học lẫn giáo viên. Việc phản hồi
thông tin đó đến người học cung cấp cho họ những ý tưởng về việc học tập
của mình, để những người học nào chưa đạt được trình độ có thể biết những
khiếm khuyết nào cần sửa đổi. Tương ứng với điều này, việc phản hồi thông
tin đến các thầy giáo cung cấp cho họ một nền tảng đúng đắn hơn cho việc
bổ sung giảng dạy.
Quá trình khám phá những khó khăn riêng biệt này có những gợi ý
trong việc lựa chọn mục tiêu, có sự kiện một số đông người học gặp khó khăn
trong việc đạt đến những mục tiêu nào đó không nhất thiết có nghĩa là những
mục tiêu đó không thể đạt được và vì thế không phù hợp với những người
học đó. Nó chỉ có nghĩa là dưới điều kiện đặc biệt của việc giảng dạy những
mục tiêu đó không đạt được một cách đầy đủ. Khả năng đạt được một mục
tiêu luôn luôn có liên quan đến phương pháp giảng dạy cũng như tiềm lực
của nhóm. Cũng có thể là việc bổ sung giảng dạy sau đó sẽ đưa các mục tiêu
để hầu hết người học có thể đạt được.
3.6. Vạch kế hoạch giảng dạy
Mặc dù mối tác động qua lại giữa đánh giá và giảng dạy vừa được bàn
thảo, chúng cần được nhấn mạnh hơn và minh họa rõ hơn.
Việc thu thập dữ liệu với mục đích vạch kế hoạch giảng dạy có thể ra ở
bất cứ lúc nào trong giảng dạy, ngay cả trước và đôi lúc sau việc giảng dạy.
Lợi điểm to tát của việc cho làm trắc nghiệm trước là nó cho phép giáo
viên biết bắt đầu dạy ở trình độ nào (hoặc thực ra trình độ của khóa học mình
bắt đầu). Nó nói lên thực trạng của người học - phạm vi sự chính xác của tri
thức về môn học, sự hiểu nhầm các khái niệm, việc nắm vững các kỹ năng
cần thiết ban đầu,… Bằng những thông tin được tùy nghi sử dụng như thế,
giáo viên ở một vị thế tốt để hoạch định việc giảng dạy hơn là trong hoàn
cảnh không có thông tin.
Trong quá trình giảng dạy, việc đánh giá cẩn thận sẽ làm bộc lộ nhóm
tiến bộ mức nào và điểm nào người học còn kém. Trong một khóa học căn
bản về vật tư và quá trình cơ khí, một giảng viên nhận thấy rằng sinh viên có
khuynh hướng suy nghĩ là luôn luôn có một lời giải “đúng” cho mỗi bài toán.
Có lẽ thái độ này có từ những năm đầu đi học là có các bài tập về môn Toán
hoặc Khoa học thực sự một lời giải. Sinh viên cơ khí cần phải nhận thấy rằng,
một cách tương tự, nhiều yếu tố chính xác định cách giải một bài toán cơ khí,
chứ không phải đáp án ít tốn kém nhất và rằng có nhiều cách giải có thể chấp
nhận được. Việc nhận ra thái độ ở trên thúc đẩy giảng viên đặt nặng nghệ
thuật vào cơ khí. Quan điểm này được giảng viên nhấn mạnh qua các bài
giảng, thảo luận và qua việc phân tích những cách giải khác nhau cho các bài
toán tương tự làm tại lớp.
Đánh giá cũng cung cấp những dữ kiện hữu ích để vạch kế hoạch vào
cuối khóa học. Lợi điểm của trắc nghiệm sau khóa học được nói lên ở chỗ
khác. Trong giáo trình ở trường trung học về các vấn đề xã hội cần giải quyết
hiện nay, người ta nhận thấy rằng, sau một năm, người học đòi hỏi có nhiều
thông tin hơn về những vấn đề này và các vấn đề này đã làm thay đổi một ít
thái độ hướng về xã hội rộng lớn hơn và ích kỷ hơn; nhưng thái độ của người
học thì nhầm lẫn và không nhất quán hơn trước đó; người học chưa đạt được
kỹ năng phân tích vấn đề xã hội, khả năng giải thích các dữ kiện xã hội thì tệ
hơn, bởi người học rút ra những kết luận thiếu cơ sở hơn trước đây. Sau khi
xem xét những kết quả này, hội đồng giáo viên kết luận rằng có quá nhiều tài
liệu được viết ra (trên 6000 trang) và không có đủ thời gian để giải thích, phân
tích và áp dụng một cách có phê phán. Vì vậy, đối với năm học sau, hội đồng
giáo viên quyết định giảm số lượng những vấn đề chính từ 21 xuống còn 7 và
giảm khối lượng tài liệu đọc xuống hơn một nửa để sử dụng nhiều thời gian
hơn trong việc phân tích và để xử lý các tài liệu liên quan. Một cuộc đánh giá
được tiến hành vào cuối năm học sau cho thấy rằng, mặc dù người học chưa
đạt toàn bộ thông tin đòi hỏi, chúng đã đạt được tính nhất quán hơn trong các
thái độ xã hội kỹ năng tốt hơn trong việc phân tích các vấn đề xã hội, và có
thể rút ra những khái quát tốt hơn từ các dữ kiện được trình bày cho chúng.
Những kết quả này ủng hộ giả thuyết khóa học năm trước đã dạy quá nhiều
điều không cần thiết. Ví dụ có phần mang kịch tính này nói lên một cách rõ
ràng cách đánh giá có thể giúp cải tiến chương trình và giảng dạy.
3.7. Kích thích học tập
Có thể lặp lại rằng từ trước người ta đã chứng tỏ rằng trắc nghiệm có
ảnh hưởng đến học tập. Không còn nghi ngờ gì những điều người học đặt
trọng tâm học tập tùy thuộc nhiều vào điều chúng mong đợi ở kỳ thi hơn là tùy
thuộc vào bất cứ sự xác định chính thức về các mục tiêu khóa học. Vì vậy,
trong một trường học người ta đã nhận thấy rằng ở các kỳ thi tổng hợp gồm
những câu hỏi thuộc tri thức trong khi việc giảng dạy đặt trọng tâm trên kỹ
năng giải quyết vấn đề, thì người học có khuynh hướng học thuộc lòng các tri
thức (và bỏ qua nhiều điều trong giảng dạy) để thi đậu. Ngược lại, khi các kỳ
thi là các kỳ thi thuộc loại cho tham khảo tài liệu, thì người học không cố gắng
để nhồi nhét, nhưng trong khi học thi người học tìm cách áp dụng các
phương pháp và nguyên tắc của khóa học vào tình huống và vấn đề mới.
Rõ ràng là trắc nghiệm có thể có những ảnh hưởng xấu không mong
muốn trên học tập. Để trắc nghiệm là một trong những ảnh hưởng quan trọng
nhất thì các kỳ thi nên nhất quán với các mục tiêu, phương pháp giảng dạy và
tài liệu. Vì thế, khi nhất quán, các kỳ thi và các phương pháp đánh giá khác có
thể giúp kích thích người học theo hướng đúng đắn.
Quá trình đánh giá có thể giúp kích thích học tập ít nhất bằng hai cách
quan trọng:
(1) Qua việc khuyến khích giáo viên làm rõ các mục tiêu để người học
biết sử dụng thời gian học cái gì. Người học có vẻ chấp nhận và học tập đạt
đến mục tiêu rõ ràng đối với chúng hơn là đạt đến các mục tiêu mơ hồ. Mục
tiêu rõ ràng tạo ra ý nghĩ và phương hướng học tập.
(2) Qua việc đưa ra cho người học bằng chứng thường xuyên về sự
tiến bộ của bản thân để họ biết cách thức học tập. Tri thức về sự tiến bộ chỉ
ra cho người học mức độ hoàn thiện của chúng và khuyến khích họ tiến lên
một cách tự tin đến các mục tiêu cao hơn. Do vậy, khi người học khám phá
sự không phù hợp trong hành vi của bản thân, họ cảm thấy phải vượt qua
chúng.
3.8. Hướng dẫn
Một trong những mục đích quan trọng nhất của việc đánh giá là cung
cấp những dữ kiện hữu ích cho việc hướng dẫn mỗi cá nhân người học. Việc
khám phá ra các khó khăn trong học tập, việc làm rõ các mục đích giáo dục
và việc phản hồi các bằng chứng về sự tiến bộ đến các mục tiêu ngắn hạn, tất
cả tạo thành các hình thức hướng dẫn. Nhưng ngoài những dịch vụ này vẫn
còn những thứ khác giúp cho cá nhân người học qua các quá trình liên tục,
mang tính thuyết phục của sự điều chỉnh và trưởng thành. Loại soạn thảo này
là điểm chủ yếu của hướng dẫn được nhận thấy ở đây.
Dưới quan điểm này, hướng dẫn là một quá trình giúp người học làm rõ
hứng thú và các mục tiêu dài hạn của họ, để vượt qua các khó khăn hoặc để
thỏa mãn nhu cầu riêng và một cách tổng quát đạt được mức độ tự bộc lộ
hợp lý. Ở mỗi mức độ, điều này có nghĩa là giúp người học vạch kế hoạch
giáo dục của bản thân trong mối quan hệ với nhu cầu riêng, lựa chọn lĩnh vực
chuyên môn và học tập đạt đến các mục tiêu giáo dục quan trọng.
Một chương trình đánh giá liên tục tự nó sẽ thâm nhập vào những
phương diện phát triển rộng lớn hơn này - rộng lớn hơn theo ý nghĩa là vượt
hoơn bất cứ lĩnh vực hoặc trọng tâm trong việc giáo dục người học. Nó có thể
soi sáng kiểu phát triển của người học và làm rõ các yếu tố, đặc biệt là các
yếu tố xúc cảm có thể ngăn cản sự phát triển tốt: Một chương trình như thế
có thể tìm câu trả lời cho các câu hỏi sau đây:
Người học thuộc loại người nào? Người học muốn trở thành loại người
nào? Người học muốn đóng vai trò nào trong những năm trước mắt?
Hiện nay các hứng thú và các mục tiêu người học đó thể hiện phù hợp
như thế nào với loại người của người học đó? Các khả năng có thể có của
người học có duy trì được các hứng thú và mục tiêu đó không? Những hứng
thú và mục tiêu này có chứng tỏ đủ mạnh để kích thích sự trưởng thành của
người học đó? Mặt nào của nhân cách người học cần được xem xét để làm
cho người học đó theo đuổi được những mục tiêu này và mặt nào làm trở lực
mà người học đó phải đối đầu?
Trường hợp này có thể đóng góp gì vào sự phát triển đầy đủ nhất các
điểm mạnh và khắc phục các yếu điểm của người học đó? Tài liệu nào, hoạt
động nào và kiểu nhân cách nào trong trường sẽ hữu ích nhất cho sự phát
triển của người học?
Các câu trả lời cho những câu hỏi rộng lớn như thế phải từ các thông
tin khác riêng biệt về từng người học. Những thông tin này không thể có được
từ các điểm số cho theo mẫu tự như quy định hoặc từ các hướng dẫn tóm tắt
tương tự như thế. Chỉ có một chương trình đánh giá liên tục, tổng hợp có thể
cung cấp các dữ liệu cần thiết cho các loại hướng dẫn được nêu ra ở đây.
3.9. Lựa chọn
Ở một phạm vi nào đó, mỗi trường học đều phải thực hiện việc lựa
chọn người học. Trong các trường đại học, việc lựa chọn có lẽ được quan
tâm nhiều hơn vì các trường nhận thức được vai trò cung cấp một trình độ
học vấn cao cấp cho một số lượng những người học có khả năng hơn trình
độ hiện có ở các trường trung học. Triết lý giáo dục hiện có ở trình độ tiểu học
và trung học tương phản rất rõ với triết lý này, bởi vì việc lựa chọn ở các
trường tiểu học và trung học bị từ chối khi nó không phù hợp với niềm tin cho
rằng mỗi đứa trẻ hoặc mọi thanh niên đều có quyền đòi hỏi cơ hội để phát
triển tốt nhất các năng khiếu của mình. Tuy nhiên, nhiều trường trung học,
đặc biệt là trường tư, thực hiện việc lựa chọn bởi vì các trường này thích thỏa
mãn các nhu cầu của những người học có khả năng về mặt học thuật có
khuynh hướng về mặt kỹ thuật hoặc có tài năng về mặt nghệ thuật. Trong một
xã hội dân chủ không nên có những chống đối với loại mục đích đặc biệt này.
Cũng không chống đối việc thực hiện việc lựa chọn người học cho những
khóa học đòi hỏi các phẩm chất cao, ngay cả trong những trường cố gắng
đáp ứng nhu cầu của tất cả thanh niên.
Đánh giá có thể đóng góp vào việc lựa chọn qua việc cung cấp các dữ
kiện về các kiểu loại trưởng thành mong đợi ở người học và các mức độ khả
năng hay tiềm năng khác nhau và bằng các kiểu nhân cách khác nhau. Để
thực hiện mục tiêu này, việc đánh giá đòi hỏi nhiều dữ kiện về các cách hình
thành nhân cách và khả năng phân biệt của người học. Cần thiết phải biết
được các loại thay đổi xảy ra trong các loại người học đặc thù, để trường học
có thể phân biệt loại người học học tập được với loại người học không học
tập được. Chắc chắn là một trường có đầy đủ lý do trong việc lựa chọn những
người học có thể đạt được mục tiêu của trường đó.
3.10. Sắp xếp người học vào lớp
Ngay cả khi người học được lựa chọn để theo học một trường học
hoặc một chương trình đặc biệt, theo từng nhóm, các người học này có
khuynh hướng thể hiện các mức độ khác biệt cá nhân rộng lớn trong các đặc
điểm của tính tiêu biểu giáo dục. Mức độ này sẽ biện hộ cho việc điều chỉnh
trong các loại khóa học và ở mức độ các người học có tiến bộ được. Theo
một ý nghĩa nào đó, sự điều chỉnh như thế là một hình thức của sự hướng
dẫn và theo ý nghĩa khác, chúng là hình thức của việc lựa chọn. Do tính quan
trọng của chúng, chúng xứng đáng quan tâm riêng biệt ở đây.
Việc sắp xếp người học vào lớp là một quá trình bắt đầu đưa người học
vào một điểm trong một chương trình hay sự nối tiếp các khóa học ở đó khả
năng tiềm tàng hoặc khả năng được chứng minh thể hiện được. Có lẽ, quá
trình này thông thường nhất ở cấp đại học. Nhiều trường sắp xếp người học
thi vào theo học các lớp như viết luận tiếng Anh, Toán học, Hóa học… Phần
lớn người học sẽ được xếp vào các phần thông thường của giáo trình nhập
môn, nhưng một số sẽ được sắp xếp vào các phần nâng cao hoặc được miễn
theo yêu cầu. Những người học kém chất lượng được sắp xếp ngay cả vào
các phần ôn tập.
Có hai cách tiếp cận hơi khác nhau. Một cách tiếp cận nhấn mạnh khả
năng học tập và cách khác nhấn mạnh trên quá trình học tập. Tính phù hợp
của cả hai lối tiếp cận này tùy thuộc vào khóa học hoặc tính liên tục. Trong
môn Toán của năm thứ nhất, cách tiếp cận đầu thì thông thường. Sinh viên
có thể đến học với những căn bản Toán học khác nhau, để một trắc nghiệm
tổng quát về sự hiểu biết và kỹ năng Toán học đưa ra một chỉ số tốt về khả
năng học tập Toán năm thứ nhất. Điểm số trắc nghiệm chỉ ra mức độ học tập
có thể. Trong ngoại ngữ cách tiếp cận khác thì thông thường. Nó đặt cơ sở
trên một chuẩn mực được thiết lập một cách cẩn thận nói lên mức độ khả
năng mong đợi của người học ở cuối nhiều khóa học theo trình tự. Ở đây,
bằng chứng về sự thành thạo (quá trình học tập) xác định mức độ nào người
học sắp xếp vào.
Thông qua các dữ liệu tích lũy về các mức độ của khả năng thường
thường đạt được ở các mức khác nhau theo trình tự, một chương trình đánh
giá có thể cung cấp một cơ sở vững vàng cho các phương pháp sắp xếp
người học. Đến lượt nó, sự sắp xếp có thể đóng góp vào việc nối kết tốt hơn
của trường trung học và đại học bằng cách làm nhanh quá trình học cho
người học nào đạt được một số mục tiêu chính của chương trình ở đại học.
Việc tăng quá trình học của người học học giỏi là một trong những nhu cầu
cấp bách của đại học Hoa Kỳ.
3.11. Cấp giấy chứng nhận
Công bình mà nói, công tác chứng nhận việc hoàn thành khóa học cho
người học không phải là mục đích chính của việc đánh giá được định nghĩa ở
đây. Tuy nhiên có điều đúng là các dữ liệu thu thập được trong việc làm như
thế có thể phục vụ cho nhiều mục đích quản lý khác nhau như: cho điểm,
khen thưởng, tốt nghiệp, báo cáo cho cha mẹ, báo cáo cho các trường khác
và cho các nơi làm việc trong tương lai.
Ngay cả ở đây, cơ sở lý thuyết của đánh giá có thể dẫn đến việc cải
tiến việc cấp giấy chứng nhận theo truyền thống. Trong ví dụ đầu tiên nó có
thể khuyến khích việc tường trình điểm số nói lên mức độ khả năng có được
hơn là vị trí tương đối trong một nhóm. Qua việc liên quan của nó đến nhiều
phương diện của sự phát triển người học đánh giá cũng có thể khuyến khích
các báo cáo mang tính phân tích về sự hoàn thành nhiệm vụ học của người
học, hoặc bổ sung vào các điểm chữ điểm số thông thường.
3.12. Đào tạo và phát triển nhân viên của tổ chức
Trong khi theo đuổi các mục đích như thế như được nêu ra làm lợi cho
cá nhân ngưòi học, đánh giá cũng có thể làm lợi cho giảng viên. Đánh giá
cung cấp một phương tiện mạnh mẽ để phát triển nhân viên tại chức liên tục.
Các hoạt động do việc tiếp cận đánh giá đòi hỏi cung cấp những cơ hội
tuyệt vời cho một giảng viên trưởng thành về nghề nghiệp. Đó là sự thách
thức thực sự khi cần phải xác định các mục đích giảng dạy của một giảng
viên như các thay đổi mong đợi ở hành vi của người học, khi cân đối giá trị
của những mục tiêu này với các khả năng khác, liên hệ việc giảng dạy của
giảng viên với các mục đích được xác định càng chặt chẽ càng tốt, tìm ra các
hoàn cảnh sẽ đưa ra các bằng chứng có giá trị về việc đạt được các mục đích
của người học và tìm cách cải tiến giáo trình hoặc chương trình. Những giải
đáp mà một giảng viên trả lời cho các thách thức này tạo ra kinh nghiệm
chính cho sự trưởng thành.
Lợi điểm thực sự của cách tiếp cận đánh giá là nó củng cố cách tiếp
cận khách quan, sáng tạo việc giảng dạy. Sự thách thức nói trên đây bây giờ
trở thành tiêu điểm của việc chú ý, chứ không phải là giảng viên và nhân cách
của bản thân ông. Bằng cách này chúng giúp ngăn chặn sự phòng thủ về
phía giảng viên và củng cố sự suy nghĩ sáng tạo về công việc của mình. Khi
một giảng viên tiếp tục đặt các vấn đề hay về việc giảng dạy và ảnh hưởng
của nó trên người học và khi giảng viên đó tiếp tục tìm kiếm các câu trả lời
hay cho những vấn đề này, anh ta đã áp dụng việc đánh giá như là phương
pháp suy nghĩ, hành động. Và khi anh ta thực hiện điều này, anh ta đã giải
phóng sức lực trong bản thân mình bảo đảm cho sự trưởng thành được tiếp
tục.
4. CÁC KỸ THUẬT ĐỂ THỰC HIỆN CÁC MỤC ĐÍCH
Sự đa dạng các kỹ thuật thì cần thiết để phục vụ rất rộng rãi các mức
độ mục tiêu như các mục tiêu vừa được tóm lược. Việc dựa trên một số
phương thức đã được tôn vinh một thời như trắc nghiệm dùng giấy và viết chì
sẽ khó thực hiện. Một bức tranh mang nhiều mặt của sự phát triển người học
đòi hỏi việc sử dụng nhiều loại kỹ thuật thu thập bằng chứng. Ví dụ, để đạt
được các bằng chứng về các phương pháp suy nghĩ đòi hỏi không những các
trắc nghiệm về khả năng bằng giấy và viết chì để đánh giá đúng những kỹ
thuật khác được thiết kế để phát hiện các phương pháp đặc trưng tiến đến sự
đánh giá của sinh viên. Các kỹ thuật bổ trợ có thể là kỹ thuật phỏng vấn và
qua kỹ thuật này người học cố gắng vạch lại suy nghĩ của mình hoặc ghi nhận
sâu sắc lời nói của mình khi anh ta cố gắng giải quyết vấn đề hoặc trả lòi các
câu hỏi thành lời. Những kỹ thuật bổ sung này thì cần thiết để đạt đến quá
trình tư duy được bộc lộ một cách không hoàn toàn bằng trăc nghiệm giấy và
viết chì.
Trong số những loại kỹ thuật quan trọng hơn như các kỹ thuật dưới
đây: trắc nghiệm giấy và viết chì, trắc nghiệm hoạt động (của kỹ năng cơ
động và các thứ cùng loại), trắc nghiệm bằng cách chiếu phim, quan sát hành
vi trong các tình huống đời thường, quan sát hành vi trong tình huống trắc
nghiệm và các phương pháp phỏng vấn và bút vấn. Đây không phải là một
danh sách đầy đủ nhưng nó chỉ đưa ra một sôố ý tưởng về phạm vi các khả
năng.
5. CÁC VẤN ĐỀ CẦN GIẢI QUYẾT LÀM CƠ SỞ CHO CÁC LOẠI KỸ THUẬT
Mặc dù có sự khác nhau giữa các kỹ thuật khác nhau được sử dụng,
các kỹ thuật có nhiều điểm chung. Không kể đến hình thức hay các mục đích
dự định của chúng, các kỹ thuật được dùng để đo lường, mô tả, hoặc đánh
giá hành vi của con người cần phải giải quyết một số vấn đề cơ bản. Những
vấn đề này là:
(1) Xác định đánh giá cái gì - có nghĩa là các đặc tính, đặc điểm của
hành vi con người và các ảnh hưởng của nó.
(2) Định nghĩa các đặc điểm hành vi đó.
(3) Lựa chọn các tình huống phù hợp để phát huy hết các loại hành vi
này
(4) Nghĩ ra một số phương pháp để ghi lại loại hành vi này.
(5) Nghĩ ra một số phương pháp để tóm tắt hoặc đánh giá hành vi đã
được ghi lại.
Nói tóm lại, việc đánh giá trong trường học là một việc làm mang lại
nhiều lợi ích cho việc học tập, giảng dạy và giáo dục. Tuy nhiên, công việc
đánh giá không thể thực hiện băng một phương pháp đơn lẻ nào mà là tập
hợp các phương pháp và kỹ thuật theo những thông số được quy định chặt
chẽ. Đặc biệt, qua trình bày trên đây, chúng ta cũng dễ dàng nhận thấy rằng
đánh giá được thực hiện ở tất cả các giai đoạn hoạch định kế hoạch, soạn
thảo chương trình, biên soạn nội dung và kiểm tra kiểm soát,… và muốn thực
hiện các giai đoạn này một cách hiệu quả ta phải đặt trên cơ sở mục tiêu giáo
dục.
Tài liệu tham khảo:
1. Edward J. Furst (1961), Constructing Evaluation Instruments, New
York, Longmans, Green and Co.
2. Trần Bá Hoành (1995), Đánh giá trong giáo dục, Hà Nội.
3. Louis C. Johnson (1989), Social work Practice: A Generalist
Approach Boston, Allyn and Bacon.
4. Emil J. Posavae et al (1989), Program Evaluation, New Jersey,
Prentice Hall.
Bài 6. MỤC TIÊU, NỘI DUNG VÀ CHỨC NĂNG CỦA VIỆC ĐÁNH GIÁ HOẠT ĐỘNG GIẢNG DẠY
Về mặt từ nguyên, “đánh giá” có nghĩa là ước lượng giá trị, xác định giá
trị. Như vậy, đánh giá bao hàm sự phán xét giá trị. Áp dụng giáo dục, chúng
ta có thể định nghĩa một cách tổng quát đánh giá là việc xác định giá trị hoặc
ước lượng giá trị của quá trình giảng dạy - học tập.
1. HAI HÌNH THỨC CHÍNH CỦA ĐÁNH GIÁ
Đánh giá một sự vật (ví dụ một dụng cụ, một hoạt động, một quá trình)
có thể được tiến hành bằng hai phương pháp khác nhau.
- Nhận xét sự vật qua kết quả của nó tùy theo một mục tiêu đã xác
định;
- Nhận xét bản thân sự vật tùy thuộc vào các chỉ tiêu đã xác định mà sự
vật đó cần đáp ứng.
Cả hai cách làm này có thể coi như cách làm bổ sung. Thật vậy, một sự
vật nào đó có hiệu suất kém, ta có thể đưa bản thân sự vật ra xem xét một
cách chính xác hơn để tìm ra lời giải thích cho tình trạng kém hiệu suất đó.
Cả hai hình thức đánh giá này cũng được áp dụng trong hoạt động
giảng dạy.
- Người ta có thể xem xét những gì là kết quả, tác động, hiệu suất hoạt
động này sinh ra ở người học, nhất là trong khi phải xác định người học đạt
được mục tiêu giảng dạy tới mức độ nào. Cách này gọi là đánh giá sản phẩm
hoặc đánh giá hiệu suất.
- Ta có thể đánh giá trực tiếp hoạt động giảng dạy theo các bộ phận
cấu thành khác nhau của nó, như bản thân các mục tiêu, các nội dung, các
hình thức của công việc giảng dạy và các công cụ nhờ chúng mà ta thu được
kết quả, cũng như các điều kiện mà trong đó ta đã đạt được hiệu suất; cách
đánh giá này gọi là cách đánh giá quá trình; khi xem xét ghi nhận này, ta nhận
thức được tính chất bổ sung của nó so với cách đánh giá sản phẩm.
Đánh giá quá trình giảng dạy là một cách làm tương đối mới thu hút
được sự chú ý nhất là trong thập kỷ vừa qua. Trước đây, người ta đánh giá
việc giảng dạy hầu như chỉ bằng một cách duy nhất là căn cứ vào kết quả đạt
được của người học. Mô hình đầu tiên có tính hệ thống để đánh giá hiệu suất
đã được Taylor, người Mỹ, soạn thảo vào những năm ba mươi của thế kỷ XX.
Thành tựu này định hướng cho phần lớn các nghiên cứu về đánh giá giảng
dạy thời gian sau đó.
Trong những năm năm mươi của thế kỷ XX, phong trào đổi mới các
chương trình giảng dạy, ở Mỹ bắt đầu với các môn Toán và Khoa học sau đó,
với các ngành Văn học và các môn Nghiên cứu xã họi. Cố gắng này đã làm
nảy sinh đồng thời nhu cầu đánh giá kết quả của việc đổi mới chương trình
giảng dạy này. Do đó, đánh giá đã được lồng ghép vào khuôn khổ của việc
xây dựng các chương trình giảng dạy. Mục tiêu của việc làm này là đóng góp
vào hoạt động sửa đổi, bổ sung các chương trình giảng dạy. Khi thực hiện ý
định này, người ta nhanh chóng nhận ra rằng khái niệm đánh giá của Taylor
là quá hẹp và không đủ sức để cải tiến nền giáo dục một cách trực tiếp được.
Đồng ý là, việc xác định kết quả học tập cho phép vạch ra những điểm yếu
trong giáo dục, nhưng bằng cách đó, người ta vẫn chưa tìm ra biện pháp then
chốt để giải thích các thiếu sót này, một điều kiện tiên quyết cho một sự thay
đổi có hiệu quả. Để đạt tới mục tiêu đó, cần thiết phải tiến hành việc điều tra
trực tiếp đối với hoạt động giảng dạy, tức là tiến hành đánh giá quá trình.
2. MỤC ĐÍCH CỦA ĐÁNH GIÁ GIẢNG DẠY
Đánh giá hoạt động giảng dạy rõ ràng không phải là mục đích tự nó.
Như chúng ta đã thấy, mục tiêu của nó là để giúp đỡ tiến hành những thay
đổi, nghĩa là đóng góp vào cải tiến hoặc tối ưu hóa quá trình giảng dạy.
Thay đổi giáo dục bao giờ cũng đi đôi với sự lựa chọn giữa những
phương án sẵn có, nghĩa là thay đổi và thích ứng các phương tiện giảng dạy
đã được sử dụng, hay nói một cách khác, việc này bao gồm một quá trình để
quyết định. Sự đóng góp của việc đánh giá được xem xét như là một hoạt
động nằm trong khuôn khổ của quá trình để quyết định này. Nó bao gồm việc
thu thập thông tin làm cơ sở để đưa ra các quyết định có liên quan đến những
thay đổi phải tiến hành vì từ những thay đổi này, người ta chờ đợi chúng sẽ
cải tiến được việc giảng dạy.
Những quyết định nhằm cải tiến một quá trình hoặc một hệ thống được
xác định phần lớn bởi những dữ liệu có liên quan đến những chất lượng và
những thiếu sót của các yếu tố, các thành phần của quá trình hoặc hệ thống
đang được bàn đến. Việc này cũng có ý nghĩa cả đối với các quyết định giảng
dạy. Đồng thời, chúng cũng đã chỉ ra bản chất của các thông tin mà việc đánh
giá cần được thu thập, đặc biệt là những dữ liệu có giá trị về giảng dạy, tính
hữu ích từ hiệu suất của các khía cạnh hoặc các biến đổi khác nhau trong
quá trình giảng dạy - học tập và những dữ liệu về những tác động qua lại của
các biến đổi đó. Ví dụ, những mục tiêu ta cố đạt tới có đáng để ta theo đuổi
không? những tình huống của hoạt động giảng dạy có thỏa đáng để thực hiện
những mục tiêu đề ra hay không? Những tình huống giảng dạy này liệu có
thỏa đáng với trình độ xuất phát của người học hay không?
Từ các nguyên tắc trên, người ta có thể suy ra những vấn đề mấu chốt
của công tác đánh giá giảng dạy:
- Xác định các đối tượng đánh giá, hay nói một cách khác, xác định
những khía cạnh của hoạt động giảng dạy và các mối tác động lẫn nhau của
chúng, những khía cạnh này là đối tượng của đánh giá. Tất nhiên, việc vạch
ra giới hạn này cần dựa trên sự phân tích về hoạt động giảng dạy.
- Xây dựng các phương pháp đánh giá, nghĩa là các phương pháp và
các phương tiện kỹ thuật cho phép thu thập một cách khách quan và đầy đủ,
những dữ liệu mô tả về các thay đổi môn học.
- Xác định các tiêu chuẩn đánh giá, nghĩa là các tiêu chuẩn để ta cũng
có thể nhận định được giá trị và tính hiệu quả của các thay đổi trong giảng
dạy.
3. NHỮNG CHỨC NĂNG KHÁC NHAU CỦA VIỆC ĐÁNH GIÁ
Mục đích của đánh giá bao giờ cũng như nhau, đặc biệt là để tập hợp
các thông tin có tính chất đánh giá về chủ đề các thay đổi trong giảng dạy,
những thông tin mà ta có thể dựa vào đấy để ra những quyết định nhằm tối
ưu hóa việc giảng dạy. Tuy nhiên, những quyết định nhằm cải tiến giáo dục
và các tình huống xung quanh những quyết định đó có thể khác nhau về bản
chất. Như vậy, chức năng và vai trò của việc đánh giá sẽ khác nhau tùy theo
tình huống ra quyết định đánh giá. Sau đây một vài chức năng quan trọng của
đánh giá:
3.1. Đánh giá và xây dựng chương trình giảng dạy
Hiện nay đánh giá chiếm một vị trí quan trọng trong việc xây dựng các
chương trình giảng dạy. Việc xây dựng chương trình giảng dạy là một việc
quan trọng và lâu dài. Để đảm bảo đến mức tối đa có thể của chất lượng sản
phẩm cuối cùng của hoạt động này, nên đánh giá thường xuyên, nếu không
thì cũng nên định kỳ đánh giá sản phẩm này trong giai đoạn xây dựng để có
thể tạo ra những điều chỉnh và thích ứng. Việc đánh giá này, được hoàn
thành trong quá trình xây dựng chương trình giảng dạy gọi là đánh giá hình
thành. Như vậy người ta thực hiện (và đánh giá) dự án thử nghiệm về một
chương trong những chương trình giảng dạy lớp thí điểm. Việc đánh giá này
có thể bao gồm những hoạt động sau: quan sát giáo viên và người học trong
quá trình giảng dạy; ghi chép các kinh nghiệm và phê phán của thầy và trò;
đánh giá hiệu suất bằng một bài kiểm tra viết… Những thông tin thu thập
được có thể cung cấp những dấu hiệu về những khó khăn gặp phải trong việc
áp dụng chương trình giảng dạy và cả những thiếu sót và điểm yếu của
chương trình. Như vậy, những dữ liệu tập hợp lại có thể cung cấp được
những dấu hiệu quý báu để xem xét lại và sửa đổi bổ sung dự án.
Đánh giá một chương trình giảng dạy đã được thực hiện gọi là đánh giá
tổng kết. Ngay cả khi một chương trình giảng dạy xác định đã được đánh giá
một cách đầy đủ, nhằm mục đích xem xét lại mục tiêu và tính hiệu quả, ta nên
đánh giá sản phẩm cuối cùng trước khi phổ biến trong cộng đồng. Việc đánh
giá này thu thập những thông tin mà những người sử dụng chương trình
giảng dạy trong tương lai có thể dựa vào đó để làm cơ sở cho quyết định là
họ có nên hay không nên đưa nó vào trong trường học của mình.
Ngoài các chức năng hình thành và tổng kết, việc đánh giá còn có thêm
một chức năng thứ ba nữa phù hợp với việc soạn thảo và áp dụng các
chương trình giảng dạy. Thật vậy, việc đánh giá chương trình dạy vẫn còn
cần thiết, sau khi nó đã được chấp nhận đưa ra áp dụng trong giáo dục. Ở
đây, chúng tôi muốn nói đến sự đánh giá liên tục. Sở dĩ phải làm việc đánh
giá thường xuyên này là nhằm kiểm tra lại xem chương trình giảng dạy áp
dụng trong thực tế liệu có được thỏa đáng hay không và dựa trên những dữ
liệu thu thập được để có thể nhận được sự hỗ trợ và góp ý kiến của các nhà
thực hành. Nhưng dữ liệu của sự đánh giá liên tục này đồng thời có thể là
hữu ích đối với các nhà biên soạn các chương trình giảng dạy. Thật vậy, khi
chương trình giảng dạy được sử dụng trong thực tế không gạt bỏ khả năng
sẽ được sửa đổi bổ sung sau đó.
Các đánh giá hình thành, tổng kết và liên tục đối với chúng ta cũng
quan trọng để soạn thảo sách giáo khoa và làm ra những công cụ giảng dạy.
Một sự thật ở thời đại hiện nay là tư liệu học tập được sản xuất thừa thải,
nhưng về giá trị giảng dạy người ta còn đang mò mẫm vì thiếu những điều tra
đánh giá có giá trị.
3.2. Đánh giá liên trường và đánh giá ở trường hoặc ở trong lớp
Việc đánh giá công tác giáo dục được chỉ định theo một chương trình
nào đó, có thể nằm trong phạm vi liên trường: một số trường học cũng tham
gia vào một công trình nghiên cứu có tính chất đánh giá, được thiết kế và
soạn thảo chi tiết bởi những cấp cán bộ có thẩm quyền trong công tác trong
các trường tham gia đánh giá.
Các mục tiêu đặc thù của những nghiên cứu có tính chất đánh giá, ta
có thể kể ra như sau: xác định hiệu suất học tập và nhất là những điểm yếu
của công tác giáo dục; phản ánh những góp ý cho giảng viên về áp dụng
chương trình dạy học; thu thập những thông tin để soát lại chương trình; thu
được những kết quả học tập dễ so sánh hơn bằng cách trình bày những cơ
sở vững vàng nhằm phổ biến những hướng dẫn về giảng dạy cho người học,
đặc biệt là trong khuôn khổ lãnh đạo và định hướng.
Ngay cả khi đã có đánh giá liên trường kiểu này, mỗi thầy giáo (môi
trường) đánh giá việc giáo dục của mình vẫn là việc cần phải làm. Vả lại,
thông thường việc đánh giá liên trường có liên quan không phải đến toàn bộ
công tác giáo dục, mà chỉ một phần của công tác này mà thôi. Vì vậy, bản
thân giáo viên phải liên tục tiến hành việc đánh giá để: 1) Kiểm tra và phân
tích chất lượng và hiệu quả giảng dạy của mình để cải tiến nó; (2) Phát hiện
trở ngại và thiếu sót trong mỗi người học để khắc phục, đóng góp để xây
dựng và phát triển ở người học một thái độ có tính chất đánh giá (tự đánh giá
bản thân).
Các khái niệm đánh giá hình thành và đánh giá tổng kết được bàn trên
đây đã được Benjamin S. Bloom áp dụng để đánh giá quá trình giảng dạy -
học tập cụ thể được thực hiện ngay trong lớp học. Trong trường hợp này,
đánh giá tổng kết có nghĩa là đánh giá một kết quả học tập đạt được bởi các
người học khi kết thúc một lớp học, một kỳ dạy học hoặc toàn bộ chương
trình. Đánh giá định hình có liên quan đến việc sử dụng “các trắc nghiệm nhỏ
chuyên dùng để chẩn đoán tiến bộ có thể được áp dụng cho những loạt
những nhiệm vụ học tập tương đối ngắn”. Vì vậy, cần phải bàn đến một hệ
thống nghiên cứu chẩn đoán được lồng ghép vào trong tình huống giảng dạy.
3.3. Đánh giá hiệu suất của một nhóm và đánh giá hiệu suất của một cá nhân
Khi thực hiện đánh giá có thể trước tiên nhằm vào tác dụng và hiệu
suất của giáo dục đối với một cá nhân người học. Ví dụ: Người học thực hiện
được các mục tiêu ở mức độ nào? Trả lời cho câu hỏi này đồng thời là việc
xác định yếu tố nào quyết định có liên quan đến sự tiến bộ (hoặc phương
hướng) của các cá nhân người học. Một khía cạnh chủ yếu thứ hai của việc
đánh giá hướng về cá nhân người học là phát hiện những yếu kém và khó
khăn ở người học cũng như nguyên nhân gây nên những trở ngại đó; từ đó,
tạo điều kiện thuận lợi để giúp đỡ và hướng dẫn họ một cách thỏa đáng.
Như vậy, ta có thể nhận thấy có sự chồng chéo về những chức năng
khác nhau của đánh giá. Đánh giá liên trường có thể áp dụng cho cả một
nhóm cũng như cho các cá nhân người học; đánh giá trong một trường học
cụ thể có thể làm theo nhóm, nhưng phần lớn là làm theo cá nhân. Đánh giá
trong khuôn khổ xây dựng chương trình giảng dạy (định hình, tổng hợp, tiếp
tục) sẽ được áp dụng để nhận xét một nhóm.
3.4. Đánh giá và đo lường
Các từ ngữ đánh giá (dùng trong ý nghĩa đánh giá sản phẩm) và đo
lường thường gây nên sự nhầm lẫn hoặc ít nhất là người ta không phân biệt
được hai từ ngữ này một cách đầy đủ.
Một số đo của những cách đáp ứng hoặc của những hành vi là một sự
mô tả về lượng của những thái độ đó. Người ta sử dụng các con số để thể
hiện những quan sát có liên quan đến kinh nghiệm chủ nghĩa nghĩa là các
cách đáp ứng. Nội hàm của từ ngữ đánh giá rộng hơn nội hàm của đo lường
và cũng bao gồm cả đo lường.
- Đánh giá không chỉ có nghĩa là mô tả các cách cư xử, mà còn đưa ra
một nhận định về giá trị có liên quan đến chúng, tùy thuộc vào một chuẩn
mực hoặc một tiêu chuẩn nào đó.
- Đối với mô tả, việc đánh giá bao gồm cả mô tả về chất cũng như về
lượng của các cách cư xử.
Ví dụ sau đây là một minh họa cụ thể để phân biệt giữa đánh giá và đo
lường.
- Những kết quả của một trắc nghiệm nghiên cứu cho chúng ta biết
rằng một nhiệm vụ có liên quan đến mục tiêu nào đó để được thực hiện một
cách đúng đắn bởi 55% của một nhóm người học đã tham dự nhiệm vụ đó.
Cái đó là một kết quả của việc đo, một sự mô tả về số lượng của hành động.
- Giả thuyết rằng theo nhận định của một nhóm chuyên gia, mục tiêu có
thể đạt được bởi 75% của nhóm người học nói trên, nếu việc giáo dục được
phục vụ trong những điều kiện tối ưu.
- Tác dụng của chương trình như đã được đo thông qua nhiệm vụ (mà
chúng ta đã chấp nhận rằng nhiệm vụ đó là thích hợp để kiểm tra mục tiêu
tương ứng) rõ ràng là đã ở dưới mức tiêu chuẩn. Nếu ta giả thuyết rằng tiêu
chuẩn này là phù hợp với thực tế, ta có thể kết luận rằng hiệu suất hoặc tác
dụng của việc giáo dục, đối với mục tiêu học tập này là thấp kém (= nhận định
về giá trị).
Dĩ nhiên, trong việc đánh giá hiệu suất học tập, cần phải tận dụng hết
khả năng căn cứ vào những kết quả khách quan, nhưng ta vẫn hoàn toàn
đúng khi nói rằng nhận định về giá trị bao giờ cũng là một kết quả suy nghĩ
của một nhân vật có thẩm quyền đang đánh giá hoặc là của một nhóm
chuyên gia có khả năng tính đến các yếu tố khác ngoài “con số”, chẳng hạn
như những hoàn cảnh một trường học nào đó phải hoàn thành nhiệm vụ của
mình, trình độ học vấn và xã hội cùng văn hóa của người học. Hơn nữa, cũng
không chắc là người ta đã có thể thể hiện được bằng những kết quả về lượng
tất cả mọi mục tiêu đề ra để thực hiện ở người học bằng biện pháp giảng dạy.
Chẳng hạn việc đánh giá một vài kỹ năng như nói năng lưu loát và chính xác,
đánh giá những thái độ, sở thích và phương pháp làm việc.
Bài 7. ĐO LƯỜNG, LƯỢNG GIÁ VÀ ĐÁNH GIÁ TRONG GIÁO DỤC
Nhiều sinh viên ngành giáo dục học những môn cần thiết về “trắc
nghiệm và đo lường trong giáo dục” hoặc một giáo trình tương tự như là một
phần cho việc chuẩn bị nghề nghiệp không có ý tưởng về sự khác biệt căn
bản về những thuật ngữ như đo lường, lượng giá và đánh giá được sử dụng
trong giáo dục. Khi đặt câu hỏi: Sự khác biệt giữa lượng giá và đánh giá là
gì?”, giảng viên nhận được những cái nhìn chằm chằm trống rỗng. Việc hiểu
sự khác biệt giữa đo lường, lượng giá và đánh giá là cơ sở của tri thức căn
bản trong giảng dạy và các quá trình được sử dụng trong giáo dục của những
giáo viên tương lai.
Sinh viên thường phấn đấu bằng việc mô tả hoặc giải thích “hiểu” điều
họ hiểu nghĩa là gì. Trong nhiều giáo trình trắc nghiệm và đo lường giáo dục
hiểu được suy ra từ những câu trả lời về trắc nghiệm câu nhiều lựa chọn
hoặc giải những bài toán thống kê. Kết quả là trong học kỳ tiếp theo, khi được
hỏi về những ý tưởng rất căn bản trong thống kê, đo lường, lượng giá và
đánh giá, sinh viên gần như quên hết, nếu không nói là toàn bộ điều họ đã
“học”.
Đo lường, lượng giá và đánh giá có nhiều nghĩa rất khác nhau và hầu
hết sinh viên không thể giải thích đúng sự khác biệt đó. Vì thế, cách tiếp cận
đến việc giải thích sự việc bằng cách càng trực tiếp và có ý nghĩa càng tốt là
nhưng mô tả có ích cho ba thuật ngữ căn bản này.
Đo lường nói đến quá trình qua đó những đặc điểm hoặc chiều hướng
của một sự vật được xác định. Một ngoại lệ là việc sử dụng từ đo lường trong
việc xác định thương số trí tuệ của một người (IQ) Câu: “Trắc nghiệm này đo
lường IQ” thường được sử dụng. Đo lường những thứ như thái độ hoặc sở
thích cũng được áp dụng. Tuy nhiên, khi chúng ta đo lường, chúng ta thường
dùng một số dụng cụ tiêu chuẩn để quyết định một thứ nào đó thực sự lớn,
cao, nặng, đồ sộ, nóng, lạnh, nhanh hoặc thẳng bao nhiêu. Những dụng cụ
tiêu chuẩn nói đến những dụng cụ như thước, thang đo, nhiệt kế, máy đo sức
ép… - Chúng ta đo lường để thu thập thông tin về những thứ đó. Những
thông tin như thế có thể hữu ích hoặc không hữu ích, tùy thuộc vào tính chính
xác của dụng cụ chúng ta dùng và những kỹ năng khi sử dụng chúng. Có ít
dụng cụ như thế trong khoa học xã hội đạt đến tính giá trị và tính tin cậy của
thước đo bằng mét. Chúng ta đo lường độ lớn của căn phòng dựa vào mét
vuông, nhiệt độ của phòng bằng nhiệt kế, và máy đo Ohm để đo volt, am-père
và điện trở của dòng điện. Trong tất cả những thí dụ này, đơn giản chúng ta
chỉ thu thập dữ liệu có liên quan đến một số thước đo hoặc tiêu chuẩn đã
được thiết lập. Vì thế, lượng giá rất khác với đo lường và có cách sử dụng
đưa ra những mục đích hoàn toàn khác nhau. Khi được sử dụng trong mục
tiêu học tập, định nghĩa được đưa ra cho động từ chỉ hành vi đo lường là: Áp
dụng thang đo tiêu chuẩn hoặc cách thức đo lường trên một sự vật, một loạt
sự vật, sự kiện hoặc điều kiện phù hợp với thực tế được những người sử
dụng thành thạo cách thức hoặc thang đo.
Lượng giá là quá trình thông tin nhận được có liên quan đến mục tiêu
hoặc mục đích đã biết. Chúng ta lượng giá ở cuối giờ học hoặc đơn vị học
tập. Chúng ta lượng giá sự tiến bộ ở cuối năm học thông qua trắc nghiệm và
chúng ta lượng giá những kỹ năng lời nói, định lượng thông qua những công
cụ như các trắc nghiệm về khả năng chuyên biệt hoặc trắc nghiệm khả năng
toán học tổng quát. Cho dù rõ ràng hoặc chưa rõ ràng, lượng giá được nối kết
một cách hữu ích nhất với mục đích hoặc mục tiêu để cho việc lượng giá
được thiết kế. Lượng giá là cách nói khác của trắc nghiệm. Trắc nghiệm hoặc
lượng giá đưa ra thông tin có liên quan đến mục tiêu hoặc mục đích. Theo ý
nghĩa đó, chúng ta trắc nghiệm hoặc lượng giá để xác định có đạt được mục
tiêu hoặc mục đích hay không. Lượng giá việc đạt được kỹ năng thì khá trực
tiếp. Cho dù kỹ năng đó có hiện hữu ở mức độ chấp nhận được hay không.
Những kỹ năng sẵn sàng có thể chứng minh. Lượng giá thông hiểu thì khó
khăn và phức tạp hơn nhiều. Kỹ năng có thể thực hành, còn thông hiểu thì
không. Chúng ta có thể lượng giá tri thức của một người bằng nhiều cách,
nhưng luôn luôn có một bước nhảy, một sự suy luận về việc một người làm
trong mối quan hệ với những điều mà người đó chứng tỏ những thứ mình
hiểu biết. Trong phần này về phía động từ chỉ hành vi, lượng giá là quy định
điều kiện qua đó hành vi được chuyên môn hóa trong một mục tiêu có thể
được khẳng định lại. Việc quy định đó thường dưới hình thích mô tả bằng văn
viết.
Kiểm tra đánh giá là quá trình thu thập, tổng hợp và diễn giải thông tin
hỗ trợ cho việc ra quyết định. Khi nghe đến từ “kiểm tra”, nhiều người hình
dung rằng người học phải làm bài kiểm tra viết để xem các em đã học đến
đâu. Mặc dù, kiểm tra viết là phần quan trọng của kiểm tra đánh giá, bảng
danh sách các quyết định của giáo viên cho thấy rằng kiểm tra đánh giá trong
lớp học không chỉ là cho làm bài kiểm tra để đánh giá người học. Kiểm tra
đánh giá, theo cách chúng ta sẽ sử dụng thuật ngữ này, bao gồm nhiều loại
thông tin giáo viên thu thập được trong lớp học: các thông tin giúp họ hiểu
người học hơn, lên kế hoạch và theo dõi việc giảng dạy của mình và thiết lập
một nền văn hóa học tập bền vững bên cạnh việc kiểm tra và xếp loại. Có
nhiều sự khác nhau giữa kiểm tra, đo lường đánh giá và định giá. Kiểm tra
đánh giá là một thuật ngữ chung bao gồm tất cả các cách giáo viên thu thập
và sử dụng thông tin trong lớp của mình.
Kiểm tra là quá trình dùng giấy bút chì có hệ thống và hình thức được
sử dụng để thu thập thông tin về sự thể hiện kỹ năng của người học. Bài kiểm
tra chỉ là một trong những loại thông tin kiểm tra đánh giá mà giáo viên gặp
phải, thế cho nên cho làm bài kiểm tra cũng chỉ là một cách đánh giá. Các
cách kiểm tra quan trọng khác là quan sát, hỏi vấn đáp, ra bài tập và sưu tập
bài làm của người học.
BẢNG 1. ĐỊNH NGHĨA CÁC THUẬT NGỮ KIỂM TRA ĐÁNH GIÁ PHỔ BIẾN
Kiểm tra đánh giá: thu thập, tổng hợp và diễn giải thông tin nhằm hỗ trợ
giáo viên trong việc ra quyết định
Kiểm tra: quá trình dùng giấy bút một cách hệ thống và hình thức để thu
thập thông tin.
Đo lường: Áp dụng thang đo tiêu chuẩn hoặc cách thức đo lường trên
một sự vật một loạt sự vật, sự kiện, hoặc điều kiện phù hợp với thực tế được
những người sử dụng thành thạo cách thức hoặc thang đo.
Lượng giá: quy định điều kiện qua đó hành vi được chuyên môn hóa
trong một mục tiêu có thể được khẳng định lại. Việc quy định đó thường dưới
hình thức mô tả bằng văn viết.
Nguồn:
1. Dr. Bob Kizlik, Updated September 12, 2004.
2. Airasian P.W. (1997), Kiểm tra đánh giá trong lớp học (Classroom
Assessmer), tái bản lần thứ 3, New York: McGraw-Hill.
Bài 8. ĐÁNH GIÁ SẢN PHẨM CỦA GIẢNG DẠY
Đánh giá sản phẩm nghĩa là kiểm tra và nhận xét những mục tiêu giảng
dạy đạt được ở mức độ nào bởi các người học theo học.
Cũng như mọi xí nghiệp theo đuổi những mục tiêu xác định, việc giảng
dạy cần thường xuyên tự hỏi liệu những phương tiện sử dụng có đang thực
sự dẫn tới các mục tiêu hay không. Liên hệ với mục đích của đánh giá nói
chung, việc nghiên cứu kết quả giảng dạy này cần góp phần - qua thông tin
phản hồi - vào việc tối ưu hóa hoạt động giảng dạy.
Từ định nghĩa của đánh giá sản phẩm, tiếp theo sẽ có:
1. Những mục tiêu giảng dạy đồng thời là những tiêu chuẩn cho phép
có được nhận xét hiệu suất.
2. Để xây dựng các công cụ đánh giá, người ta cần có sẵn, từ lúc đầu,
một danh sách có tính chất hệ thống của các mục tiêu đó.
Đánh giá sản phẩm có mục đích là xác định xem các mục tiêu đã được
thực hiện đến mức độ nào. Ở đây, mục tiêu là những thay đổi cần có trong
cách giải quyết vấn đề của người học. Như vậy, việc đánh giá sản phẩm phải
được quan niệm rõ ràng như là một sự xác định về số đo, trong đó những
hành vi đề ra đã được thừa nhận. Trong nhiều trường hợp, người ta sẽ không
thực hiện trực tiếp việc kiểm tra mà sử dụng vai trò gián tiếp của tác dụng
hoặc của kết quả do hành vi tạo ra. Trong những trường hợp khác, việc kiểm
tra lại trực tiếp hành vi cần thiết. Việc này diễn ra trong trường hợp khi người
ta có thể thu được cùng một kết quả như vậy bằng nhiều cách làm, ví dụ
bằng các phương pháp khác nhau hoặc bằng cách dựa vào các cấu trúc đáp
ứng đa dạng và trong trường hợp đã được quy định từ trước, trong các mục
tiêu, phải sử dụng một biện pháp hoặc một kết cấu hành vi đã được xác định.
Việc nghiên cứu bản thân các hành vi đặc biệt quan trọng đối với các mục
tiêu về năng lực - cảm xúc, ví dụ như thái độ.
Về loại các mục tiêu cuối cùng này, điều quan trọng là phải phân biệt
được hai loại tình huống đánh giá sau đây: đánh giá cụ thể và đánh giá thông
thường. Trong tình huống đánh giá cụ thể, cả giảng viên lẫn người học đều
có ý thức đối với việc tiến hành đánh giá; chẳng hạn, người ta yêu cầu người
học phải làm một bài kiểm tra hoặc một bài thi để một môn đã học ở lớp.
Trong việc đánh giá thông thường, thầy giáo thu thập những thông tin về
người học mà không cho người học biết trước. Khá nhiều mục tiêu có tính
chất năng lực - tình cảm chỉ có thể đánh giá được một cách thỏa đáng trong
tình huống thứ hai này, bởi vì trong một tình huống cụ thể, người học thường
sẽ không hành động một cách tự nhiên. Điều này có thể dẫn đến thái độ giả
tạo.
1. CÁC KHÍA CẠNH CỦA ĐÁNH GIÁ SẢN PHẨM
Trong đánh giá sản phẩm, người ta còn có thể đi sâu hơn nữa việc cá
biệt hóa. Chúng ta phân biệt các loại đánh giá tổng thể và đánh giá phân tích
với đánh giá chẩn đoán.
1.1. Đánh giá tổng thể và đánh giá phân tích
Đánh giá tổng thể nghĩa là định nghĩa và nhận xét hiệu quả dạy học
trong một lĩnh vực nhất định của toàn bộ các mục tiêu giảng dạy hoặc ở một
nhóm người học xác định hoặc ở trong một lớp học, một trường học hay ở
một nhóm người học nào đó. Ví dụ, việc đánh giá hiệu quả dạy học đối với
một ngành xác định; bằng cách sử dụng kết quả của một bài luận đề hoặc
của một bài trắc nghiệm khách quan, trong đó các nội dung đều có tính chất
đại diện cho các mục tiêu của việc dạy toán, người ta có thể phát biểu ý kiến
về hiệu suất của giảng dạy này trong một lớp nhất định
Đánh giá phân tích có nghĩa là mô tả và nhận xét hiệu suất của việc
giảng dạy đối với từng mục tiêu riêng biệt của một lĩnh vực nhất định. Ví dụ,
một nhóm người học xác định đã đạt đến mức nào một mục tiêu nào đó của
việc dạy Toán (có thể làm tất cả các trường hợp cách chia số thường và số
thập phân)? Người ta đồng thời bàn bạc cả việc đánh giá tổng thể lẫn đánh
giá phân tích bởi vì, nói chung, thông qua cùng một bài thi đó, người ta có thể
thu thập những thông tin có liên quan đến hai hình thức đánh giá này. Thật
vậy, các dữ liệu được tập hợp lại qua sử dụng một trắc nghiệm về đánh giá
kết quả học tập tổng thể một ngành học cũng có thể được xem xét từ quan
điểm phân tích. Số đo lường mà trong đó các nội dung riêng biệt đã được tính
toán thỏa đáng bởi một nhóm người học cho ta biết rằng các mục tiêu có liên
quan đến các nội dung này đã đạt được hay chưa đạt được.
1.2. Đánh giá chẩn đoán
Nhờ đánh giá tổng hợp và phân tích, người ta có một ranh giới và một
nhận xét đối với hiệu suất của một lĩnh vực mục tiêu xác định. Nhưng điều
này không nhất thiết phải đi đôi với việc giải thích những thiếu sót có thể xảy
ra sau này của hiệu suất; nói một cách khác, việc đánh giá này không nêu lên
nguyên nhân các mặt yếu kém. Tuy nhiên, vẫn cần phải biết được những
nguyên nhân đó để tiến một cách có giá trị các chương trình giảng dạy hoặc
để ngăn ngừa những khuyết điểm về giảng dạy trong lớp học. Đó là lý do tại
sao phải tiến hành đánh giá chẩn đoán và người ta sẽ định hướng việc đánh
giá này chủ yếu vào những mục tiêu mang dấu hiệu có những nhược điểm về
hiệu suất.
Trong đánh giá chẩn đoán, người ta có thể xem xét hai giai đoạn: chẩn
đoán mô tả và chẩn đoán căn nguyên.
Chẩn đoán mô tả có nghĩa là khoanh lại một cách chính xác những
thiếu sót trong các kiến thức và trong các kỹ năng và những lệch lạc trong
quá trình học tập xảy ra vào thời điểm nào? Để xác minh điều này, người ta
có thể dùng những bài kiểm tra chẩn đoán; đối với từng mục tiêu, chúng sẽ
thể hiện những bước đi kế tiếp (những khó khăn); còn ẩn náu khi vươn tới
những mục tiêu đó. Chẳng hạn, khi quan sát người học ở lớp Sáu, thấy có kết
quả kém về thực hiện các phép chia đánh giá chẩn đoán: xem ví dụ trên đây),
thì người ta có thể xem xét quá trình học tập của chủ đề đó là không hữu hiệu
ở thời điểm nào (ví dụ: cảm thấy lúng túng về dấu phẩy của số thập phân, về
các số không trong số chia và/hoặc số bị chia).
Việc chẩn đoán căn nguyên nhằm mục đích tìm ra nguyên nhân các
mặt yếu kém và khó khăn. Nói một cách khác, ở đây muốn nói đến việc chẩn
đoán theo nghĩa hẹp. Có hai loại yếu tố có ảnh hưởng ở đây: một là các yếu
tố có liên quan đến người học, như năng lực yếu kém, rối loạn hành vi cùng
như những yếu tố quyết định về mặt văn hóa và xã hội; thứ hai là các yếu tố
nảy sinh từ bản thân hoạt động giảng dạy, như các mục tiêu có thể về sau
này không thích hợp đối với tình huống xuất phát của người học, việc sử
dụng các phương tiện không hiệu quả và ứng dụng không thỏa đáng để thực
hiện các mục tiêu. Rõ ràng là chỉ có thể tìm ra nhóm thứ hai này thông qua
việc nghiên cứu trực tiếp bản thân hoạt động giảng dạy, khía cạnh phán đoán
căn nguyên này trên thực tế là bộ phận hợp thành của đánh giá quá trình, mà
việc đó ở đây hình như là bổ sung rất rõ ràng cho việc đánh giá sản phẩm.
2. CÁC PHƯƠNG PHÁP ĐÁNH GIÁ SẢN PHẨM
Đối với việc đánh giá sản phẩm, các công cụ được ưa chuộng nhất là
những bài kiểm tra viết hoặc những trắc nghiệm (được biểu thị hay không
được biểu thị bằng một điểm số khách quan). Các bài kiểm tra viết này (bài
kiểm tra “giấy - bút chì”) tuy vậy cũng không phải là những phương pháp kỹ
thuật duy nhất có thể có của đánh giá sản phẩm. Thật vậy, mọi phương pháp
đều có thể được áp dụng để cung cấp những thông tin có giá trị về mức độ
đạt được của các người học trong việc thực hiện các mục tiêu. Vấn đề là phải
chọn ra phương pháp thỏa đáng nhất đối với khía cạnh của hành vi dự định
đánh giá. Tiêu chuẩn này, tuy mang tính quan trọng hàng đầu, thường làm
chúng ta lúng túng, vì cũng có những tiêu chuẩn khác, tuy là thứ yếu, ảnh
hưởng rất nhiều đến việc lựa chọn các phương pháp đánh giá. Chẳng hạn,
khả năng thực hiện việc mô tả về định lượng và khách quan đối với hành vi,
việc dễ dàng xây dựng và áp dụng các công cụ xác định… Khi nói đến tiêu
chuẩn vừa mới mô tả, chúng tôi có thể kết luận rằng một phương pháp kỹ
thuật đánh giá này có thể thích hợp với một vài mục tiêu này, nhưng lại không
thỏa đáng với những mục tiêu khác, về vấn đề các phương pháp kỹ thuật có
thể sử dụng được, câu hỏi nên đặt ra chắc hẳn không phải là: “Liệu phương
pháp kỹ thuật này có thích hợp để đánh giá sản phẩm không?”, mà sẽ là:
“Trong những trường hợp nào và trong những tình huống nào thì phương
pháp kỹ thuật này là thích hợp?”.
Tóm lại, ta có thể có được những thông tin mô tả liên quan đến các
hành vi của người học bằng ba cách:
(1) Đặt ra cho người học những công việc phải hoàn thành;
(2) Đặt cho người học những câu hỏi liên quan đến bản thân công việc;
(3) Yêu cầu những người khác quan sát và nhận xét hành vi của người
học.
Cả ba phương pháp xử lý vấn đề này đồng thời cũng là những phạm
trù cho phép ta xếp loại các phương pháp kỹ thuật đánh giá sản phẩm: các
bài kiểm tra về thành tích, các phương pháp kỹ thuật tự mô tả và các phương
pháp quan sát.
2.1. Những bài trắc nghiệm về thành quả học tập (“Achievement Tests”).
Có hai cách kiểm tra: kiểm tra miệng và kiểm tra viết. Ta có thể chia
những bài kiểm tra viết bằng những cách khác nhau:
- Các trắc nghiệm mang tính chủ quan (essay tests);
- Các trắc nghiệm khách quan (objective tests): trắc nghiệm do thầy
giáo soạn (teacher made tests hoặc informal tests), trắc nghiệm chuẩn hóa
(standardized tests).
2.2. Các phương pháp kỹ thuật tự mô tả
Các phương pháp kỹ thuật mô tả chủ yếu là:
- Phỏng vấn,
- Bút vấn (questionnaires hoặc inventories),
- Thang thái độ (attitude scales).
2.3. Các kỹ thuật quan sát
Trong loại này, người ta có thể xếp những kỹ thuật sau: các phiếu kiểm
tra, các thang đánh giá và các phương pháp trắc đạt xã hội.
- Phiếu kiểm tra (checklist) là bảng kê những lời diễn đạt về hành vi;
người quan sát hoặc người nhận xét cần chỉ ra, đối với từng phiếu diễn đạt,
liệu loại hành vi đang nói đến có hay không có ở trong người học được quan
sát.
- Trong các thang đánh giá (rating scales), người quan sát cần ghi rõ
người học được quan sát có một đặc điểm nào đó ở một mức độ nào.
- Đối với các phương pháp trắc đạt xã hội, người ta xác định những mối
quan hệ xã hội trong một nhóm nào đó. Mỗi thành viên trong nhóm cho biết,
trong một tình huống xác định, người đó ưa thích những thành viên nào khác
trong nhóm, như bạn ngồi bên cạnh trong lớp, bạn cùng chơi trò chơi, bạn
cùng lao động của nhóm. Qua phân tích các dữ liệu, ta có thể tìm ra mối quan
hệ xã hội của các thành viên trong nhóm và phát hiện ra cấu trúc của nhóm.
Ở đây không bàn về việc soạn thảo các trắc nghiệm chuẩn hóa, vì hiện
nay vấn đề này được nhiều sách đề cập. Phần lớn các tác giả khẳng định một
cách rõ ràng rằng, đối với việc soạn thảo các trắc nghiệm chuẩn hóa, cần
phải dựa vào các mục tiêu.
Về các phương pháp tự mô tả và các phưong pháp quan sát, hiện nay
có những giới thiệu tổng quát mang tính giá trị trong nhiều công trình về cách
đo lường và đánh giá trong giáo dục.
Việc đánh giá thái độ bằng cách quan sát hiện đang được nhiều người
quan tâm, nên mục sau đây dành cho việc nghiên cứu vấn đề này.
3. ĐÁNH GIÁ THÁI ĐỘ
Những năm gần đây, việc chú ý ngày càng nhiều đến tầm quan trọng
của việc đánh giá thái độ của người học. Tuy nhiên, việc thực hiện này gặp
phải những khó khăn. Hơn nữa, hiện nay vẫn chưa một phương pháp nào có
cơ sở lý luận vững chắc được trình bày, theo quan điểm sư phạm học. Dựa
vào lý luận về các mục tiêu và cách đánh giá, có thể phác thảo một vài nét
chính, có liên quan đến đánh giá thái độ bằng biện pháp gián tiếp là quan sát.
Việc xây dựng thái độ được triển khai như một mục tiêu giảng dạy. Vì
thế, vấn đề đánh giá thái độ đang trở thành mối quan tâm mang tính thời sự
của các nhà giáo dục. Điều này có nghĩa đây là một bước tiến triển thuận lợi
để hình thành nhân cách một cách đầy đủ hơn thông qua công tác giảng dạy
và là sự cần thiết phải xác định, với một mức độ chính xác hơn, loại thái độ
nào người ta muốn phát triển ở người học. Trong một loạt những mục tiêu
này, ta có thể sử dụng những tiêu chuẩn sau đây:
- Quan niệm về kiểu phát triển cần có của nhân cách, phù hợp với tình
hình xã hội hiện tại;
- Trình độ phát triển của các người học;
- Tính chất của giảng dạy (chẳng hạn trong các bộ phận dạy nghề hoặc
đào tạo ngắn ngày của ngành giáo dục kỹ thuật, nên bồi dưỡng nhiều hơn về
thái độ tích cực đối với học tập trong các bộ phận chuyển tiếp hoặc học tập
lâu dài ở bậc giáo dục trung học phổ thông tổng hợp);
- Những khả năng có sẵn của trường học có thể phát triển được những
thái độ xác định.
Trên đây nhấn mạnh đến tầm quan trọng của việc cụ thể hóa các mục
tiêu giảng dạy. Điều này cũng được áp dụng đối với những thái độ mà ta
muốn hình thành trong giảng dạy. Thật vậy, người ta chỉ có thể hình thành
thái độ này bằng cách xác định rõ những thái độ này bằng những từ ngữ về
hành vi cụ thể có thể diễn ra trong tình huống giảng dạy. Thông qua quan sát,
ta có thể nhận thấy người học có bộc lộ những hành vi báo hiệu một thái độ
xác định hay không. Hơn nữa, việc cụ thể hóa đó có những điểm lợi như sau:
(1) Các thái độ được xác định sát với thực tế hơn đối với các giáo viên
khác nhau.
(2) Nêu được những tình huống trong đó người ta có thể quan sát tùy
theo sở thích một thái độ xác định. Để minh họa, một vài ví dụ về hành vi có
liên quan đến thái độ “tinh thần hợp tác”: xử sự độc lập trong nhóm, tham gia
tích cực vào hoạt động của nhóm, sẵn sàng giúp đỡ khi thầy giáo yêu cầu, tự
giác cộng tác vào hoạt động học tập, có sáng kiến trong hoạt động tập thể.
Khi các mục tiêu giảng dạy được cụ thể hóa như vậy, ta có thể bằng
quan sát, chứng minh được một người học nào đó có hay không có hành vi
biểu thị của một thái độ xác định. Tuy nhiên, điều này hãy còn chưa đủ để có
một đánh giá đầy đủ. Thật vậy, những hành vi đa dạng phụ thuộc vào cùng
một thái độ có thể khác nhau ở cách biểu hiện, xét về mức độ hoặc về chất
lượng đối với thái độ đó. Ví dụ, về tinh thần hợp tác: sáng kiến trong hoạt
động của nhóm có thể được xem xét như một mức độ cao hơn của tinh thần
hợp tác so với sẵn sàng giúp đỡ khi có yêu cầu của thầy giáo. Nhận xét đó
đồng thời chỉ ra phương hướng ta cần tìm để tiến tới xây dựng một công cụ
thích hợp cho đánh giá thái độ. Đặc biệt cần phải có sẵn bậc thang mô tả theo
kiểu kết câu, những mức độ khác nhau trong việc xây dựng được một thái độ.
Nguyên tắc phân loại các mục tiêu cảm xúc của Krathwohl cho chúng ta bậc
thang như vậy. Trong nguyên tắc phân loại này, các hành vi cảm xúc đều
được sắp xếp có thứ bậc và theo một mức độ tăng dần trong kết cấu của
nhân cách. Ở đây, chúng tôi chỉ liệt kê những phạm trù của phép phân loại
này.
Thứ bậc tiến triển
1.0 NHẬN BIẾT
1.1 Ý thức
1.2 Sẵn sàng chấp nhận
1.3 Chú ý có kiểm soát hoặc lựa chọn
2.0 ĐÁP ỨNG
2.1 Bằng lòng đáp ứng
2.2 Sẵn sàng đáp ứng
2.3 Thỏa mãn khi đáp ứng
3.0 ĐỊNH GIÁ TRỊ ĐẠO ĐỨC
3.1 Chấp nhận một giá trị
3.2 Lựa chọn một giá trị đạo đức
3.3 Sự chấp nhận một giá trị đạo đức
4.0 CẤU TRÚC GIÁ TRỊ ĐẠO ĐỨC
4.1 Khái niệm hóa một giá trị
4.2 Cấu trúc một hệ thống giá trị
5.0 TÍNH CÁCH HÓA MỘT GIÁ TRỊ ĐẠO ĐỨC HOẶC MỘT PHÚC
HỢP CÁC GIÁ TRỊ ĐẠO ĐỨC
5.1 Tập hợp được khái quát hóa
5.2 Tính cách hóa
Khi sắp xếp theo chuỗi liên tục này thành hành vi cụ thể biểu hiện của
một thái độ, ta có một dụng cụ đánh giá. Thật vậy, một người học thể hiện
cách cư xử nào đó bộc lộ cho chúng ta biết người đó đã có được một mức độ
xác định của thái độ đang bàn đến. Dựa trên chuỗi liên tục cảm xúc của
Krathwohl, Bellemans đã xây dựng được một sơ đồ đánh giá bốn thái độ ở
các người học thuộc quá trình quan sát của bậc giáo dục trung học phổ thông
đổi mới ở Bỉ: tự quản trong học tập, tinh thần ham hiểu biết tri thức, thái độ
phê phán và tinh thần hợp tác. Có xem xét đến trình độ phát triển của những
người học 12 - 13 tuổi này, các tác giả chỉ lấy hạn chế bảy phạm trù đầu tiên
của Krathwohl. Để minh họa, mỗi một trong bảy phạm trù này được đặt tên
như thế nào cho hợp với tinh thần hợp tác và mỗi loại về một hành vi cụ thể
sẽ được đưa ra một ví dụ về mức phát triển.
Mức 1
- Giải thể nhóm (đối lập với hoạt động của nhóm bằng một hành vi hung
hăng).
- Hợp tác thụ động (vai trò của người tham gia thụ động: dựa dẫm vào
những người khác khi phân công phân nhiệm).
- Chọn nhóm (khi phải đứng trước sự lựa chọn là làm việc cho nhóm
hoặc làm việc cho cá nhân, người học đó sẽ chọn làm việc cho nhóm).
Mức 2
- Hợp tác theo thỏa thuận (sẵn sàng giúp đỡ khi có yêu cầu của thầy
giáo).
- Hợp tác theo ý muốn (tự giác tham gia hoạt động của giờ học).
Mức 3
- Đoàn kết (có những sáng kiến phù hợp với hoạt động của tập thể,
nhưng không áp đặt tình cảm cá nhân của mình).
- Hợp tác động viên (khuyến khích những người khác tham gia bằng
cách yêu cầu họ hợp tác với tập thể).
De Block cũng đã xây dựng sơ đồ để đánh giá thái độ cũng dựa trên
những nguyên tắc như thế. Ông dùng bốn giai đoạn của quá trình học tập của
“phương pháp phân loại các mục tiêu giảng dạy” của mình làm thang đánh
giá. Những thái độ được bàn đến trong sơ đồ này chủ yếu là thuộc bản chất
trí tuệ như xu hướng về thấu hiểu, về năng suất, về tinh thần phê bình, về tính
khách quan…
4. CÁC TIÊU CHUẨN ĐỂ ĐÁNH GIÁ HIỆU SUẤT HỌC TẬP
Chúng ta đã bàn đến vấn đề các tiêu chuẩn đánh giá hiệu suất học tập
một khi nói đến sự khác biệt giữa đánh giá và đo lường. Ở đây có một vài ghi
chú ngoài lề về vấn đề tế nhị và gây nhiều tranh cãi này.
Ngoài bảng tổng kết tình hình kết quả học tập, việc đánh giá sản phẩm
còn bao gồm cả việc nhận xét hiệu suất. Ví dụ, ta có được bảng tổng kết tình
hình kết quả học tập bằng cách áp dụng một trắc nghiệm đo hiệu suất học tập
cho một nhóm người học, nhưng không nhất thiết phải làm sáng tỏ tính “giá
trị” của giảng dạy. Để làm được điều này, chúng ta cần có những tiêu chuẩn
cho phép so sánh những kết quả quan sát được. Dựa trên sự so sánh này,
người ta có thể trả lời câu hỏi sau đây: liệu các kết quả có đầy đủ không, liệu
chúng có đáp ứng mong đợi về hiệu suất giảng dạy hay không, hay nói một
cách khác, liệu chúng ta có thể kết luận rằng người học đã đạt được một cách
đầy đủ mục tiêu giảng dạy hay chưa.
Đề cập đến vấn đề này, người ta cho rằng vấn đề ở đây là các chuẩn
mực dùng để định giá những kết quả của một cá nhân qua một trắc nghiệm
tâm lý. Những chuẩn mực này được suy diễn về mặt thống kê học từ phân bố
các kết quả thực tế của một trắc nghiệm và sự phân bố đó có được bằng một
mẫu đại diện cho các cá nhân trong dân số mà trắc nghiệm đó được soạn
thảo. Muốn đánh giá những kết quả của một cá nhân qua một trắc nghiệm,
người ta đối chiếu kết quả của người học đó với các chuẩn mực có sẵn để
xác định bằng cách định vị trí tương đối hoặc trình độ của người đó trong dân
số người học.
Những chuẩn mực thống kê học loại này có thể rất hữu ích so với mục
đích tìm kiếm của các nhà tâm lý học học tập sử dụng các trắc nghiệm đó,
trong đó phần lớn có nghĩa là lập ra những dự báo phù hợp với những hành
vi sau này của cá nhân trong những tình huống nhất định. Những chuẩn mực
như vậy không phải là những tiêu chuẩn thích hợp đối với những nơi cần phải
đưa ra một nhận định có giá trị về kết quả học tập. Thật vậy, chuẩn mực về
hiệu suất được vận dụng như thế phản ánh những thành tích thật sự của
người học và những thành tích này lại không nhất thiết phải tương xứng với
những kết quả mong đợi một cách hợp lý trong một nền giáo dục. Ngoài ra,
việc sử dụng những chuẩn mực thống kê học che đậy một nguy cơ mà
Stellwag gọi là giáo dục « bị đóng băng”, nghĩa là mặt tiến triển của giáo dục
có thể bị tiêu tan, bởi vì người ta đang cố gắng thực hiện những chuẩn mực
có trong các trắc nghiệm.
Người ta không hài lòng về sự kiện của các chuẩn mực thống kê học
trong các sách của Mỹ, gồm cả tác phẩm của nhà sư phạm học nổi tiếng
Glaser. Năm 1963, ông đưa ra sự phân biệt giữa “những số đo so chuẩn mực
cho những thông tin về », « việc xếp loại tương đối các cá nhân có liên quan
đến hành vi của họ” với “các số đo dựa trên một tiêu chuẩn được tập trung
vào việc xác định vào kết quả mà người học đạt được so với tiêu chuẩn”.
Những năm gần đây, những “trắc nghiệm tiêu chuẩn” này được nghiên cứu
nhiều ở Mỹ. Người ta dùng trắc nghiệm đó không những để chẩn đoán cá
nhân mà còn để đánh giá chẩn đoán sản phẩm.
Những ý tưởng này của Glaser dựa vào sự phân biệt mà Flanagan đã
phát biểu năm 1951 với một bên là các “chuẩn mực” (“norms”) thống kê học
và một bên khác là các “tiêu chuẩn” (“standards”). Khái niệm sau cùng này có
nghĩa là “các mức độ cần đạt tới hoặc các mức độ mong đợi của thực tiễn
được diễn đạt bằng từ ngữ kết quả học tập”.
Bloom trình bày khái niệm sau cùng này bằng cụm từ “các chuẩn kỹ
năng thành thạo hoặc các chuẩn hiệu suất”.
Khái niệm “các chuẩn” gợi lên một ý cho rằng vấn đề ở đây là những
“tiêu chuẩn” tuyệt đối gắn liền với những giá trị, những tiêu chuẩn tuyệt đối đó
được áp đặt từ trên xuống và không có một cơ sở khoa học nào cả. Thế
nhưng, tính chất tuyệt đối, theo nghĩa hẹp, cũng không gắn liền với khái niệm
“các chuẩn của mức độ đạt được” hoặc là các tiêu chuẩn của hiệu suất. Vì
thế, có thể gán cho nó một cách giải thích để chứng minh theo quan điểm sư
phạm và, đồng thời, cách giải thích đó làm cho việc xác định các tiêu chuẩn
trở thành một cách xử lý đúng đắn có thể tiến hành được.
Đối với bản chất của các loại tiêu chuẩn này, chúng cần thỏa mãn hai
điều kiện trái ngược nhau sau đây:
- Các tiêu chuẩn cần biểu thị một mức độ hiện thực của hiệu suất mong
đợi, trong một lĩnh vực mục tiêu xác định, nghĩa là chúng phải tính đến mức
độ phát triển của người học và của các khả năng thực tế của trường học hiện
nay, đối với các giáo viên, các công cụ dạy học và thời gian có thể sử dụng
được.
- Các tiêu chuẩn cần phản ánh một mức độ có thể đạt tới về mặt lý
thuyết, nghĩa là mức độ cao nhất của hiệu suất được nhận định là có thể đạt
tới được bởi dân số người học đang nói đến, với giả thiết là việc giảng dạy đã
được phục vụ đến mức tối ưu, nghĩa là tốt nhất có thể được, có tính đến các
hoàn cảnh hiện hữu. Định đề cuối cùng này đồng thời chỉ rõ rằng cả hai yêu
cầu này cần gập nhau ở một điểm.
Tùy theo phương pháp xây dựng các loại tiêu chuẩn hiệu suất này,
người ta có thể gợi ý cách làm sau:
- Trong giai đoạn đầu, người ta kêu gọi một nhóm chuyên gia và yêu
cầu họ nhận định về khả năng có thể đạt tới về mặt lý thuyết của các nội dung
của một cuộc kiểm tra đánh giá. Việc xây dựng một phương pháp kỹ thuật để
thu thập và viết những nhận xét của các người đánh giá là một nhiệm vụ của
khảo sát giáo dục học.
- Trong giai đoạn thứ hai, cần có những đánh giá cúa các chuyên gia
được kiểm tra lại theo kinh nghiệm thực tế, song việc này đến bây giờ lại rất
khó thực hiện. Một biện pháp có thể làm được là đi sâu vào các nội dung mà
khả năng thành công về mặt lý thuyết đã được các chuyên gia xác định, trong
các lớp học, nơi việc giảng dạy đã được tiến hành trong những điều kiện tối
ưu. Dựa vào mức độ khó khăn được quan sát cả trong các lớp học, người ta
còn cải biên cả những tiêu chuẩn đã được chấp nhận từ lúc xuất phát. Đó rõ
ràng là những tiêu chuẩn hiệu suất không phải là những tiêu chuẩn tuyệt đối.
4. CÁC TIÊU CHUẨN ĐỂ ĐÁNH GIÁ HIỆU QUẢ HỌC TẬP
Chúng ta đã đụng đến vấn đề các tiêu chuẩn đánh giá hiệu quả học tập
một khi nói đến sự khác biệt giữa đánh giá và đo lường. Sau đây một vài điều
đáng chú ý ngoài lề về vấn đề tế nhị và gây nhiều tranh cãi này.
Ngoài bảng tổng kết tình hình kết quả học tập, việc đánh giá sản phẩm
còn bao gồm cả việc nhận xét hiệu quả. Ta có được bảng tổng kết tình hình,
chẳng hạn, bằng cách áp dụng một trắc nghiệm học tập cho một nhóm người
học. Nhưng những kết quả không nhất thiết phải làm sáng tỏ cái “giá trị” của
giảng dạy. Để làm được điều này, rõ ràng chúng ta cần có những tiêu chuẩn
cho phép so sánh những kết quả quan sát được. Dựa trên sự so sánh này,
người ta có thể trả lời câu hỏi sau đây: Liệu các kết quả có đầy đủ không?
Liệu chúng có đáp ứng mong đợi của chúng ta về hiệu quả giảng dạy hay
không? Hay nói một cách khác, liệu chúng ta có thể kết luận rằng người học
đã đạt được một cách đầy đủ mục tiêu giảng dạy hay chưa?
Đề cập đến vấn đề này, người ta cho rằng ở đây có vấn đề về các
chuẩn mực dùng để định giá những kết quả của một cá nhân qua một trắc
nghiệm tâm lý học. Những chuẩn mực này được suy diễn về mặt thống kê
học từ chỗ phân bổ các kết quả thực tế thành một trắc nghiệm và sự phân bổ
đó có được bằng một mẫu đại diện cho các cá nhân trong dân số mà trắc
nghiệm đó được xây dựng. Muốn đánh giá những kết quả của một cá nhân
qua một trắc nghiệm, người ta đối chiếu kết quả của người đó với các chuẩn
mực đó để xác định bằng các vị trí tương đối hoặc trình độ của người đó
trong dân số.
Chúng ta không nghi ngờ rằng những chuẩn mực thống kê học loại này
có thể rất hữu ích so với mục đích nghiên cứu của nhà tâm lý học tập học là
người sử dụng các trắc nghiệm đó, việc đó phần lớn có nghĩa là lập ra những
dự báo hợp thức đối với những cách giải quyết về sau này của cá nhân trong
những tình huống nhất định. Những chuẩn mực như vậy, với chúng ta hình
như không phải là những tiêu chuẩn thích hợp đối với những nơi cần phải
đưa ra một nhận định có giá trị về kết quả học tập. Thật vậy, chuẩn mực về
hiệu quả mà người ta vận dụng như thế phản ánh những thành tích thật sự
của người học, những thành tích này lại không nhất thiết phải tương xứng với
những kết quả người ta có thể mong đợi một cách hợp lý/đúng đắn ở một nền
giáo dục có giá trị. Ngoài ra, việc sử dụng những chuẩn mực thống kê học
che đậy một nguy cơ mà Stellwag gọi là giáo dục “bị đóng băng”, nghĩa là mặt
tiến hóa của giáo dục có thể bị tiêu tan, bởi vì người ta đang cố gắng thực
hiện những chuẩn mực bao hàm trong các trắc nghiệm.
Người ta tìm thấy sự không hài lòng này vốn là một sự kiện của các
chuẩn mực thống kê học, trong các sách của Mỹ, trong đó có cả tác phẩm
của nhà sư phạm học nổi tiếng Glaser. Năm 1963, ông đưa ra sự phân biệt
giữa những số đo so với một chuẩn mực cho những thông tin về “sự xếp loại
tương đối các cá nhân có liên quan đến hành vi của họ” với các số đo dựa
trên một tiêu chuẩn được tập trung vào việc xác định vào “kết quả mà người
học đã đạt được so với tiêu chuẩn”. Những năm gần đây, những “trắc nghiệm
dẫn chứng - tiêu chuẩn” này được nghiên cứu rất nhiều ở Mỹ. Người ta
thường dùng những trắc nghiệm đó để chẩn đoán cá nhân nhưng còn dùng
chúng để đánh giá mô tả chẩn đoán sản phẩm.
Những ý tưởng này của Glaser dựa vào sự phân biệt mà Flanagan đã
phát biểu năm 1951 với một bên là các “chuẩn mực” (“norms”) thống kê học
và một bên khác là các “tiêu chuẩn” (“standards”). Khái niệm sau cùng này có
nghĩa là “các mức độ nên đạt tới hoặc các mức độ mong đợi của thực hành
thường được diễn đạt bằng từ ngữ kết quả học tập”.
Bloom trình bày khái niệm sau cùng này bằng cụm từ “các chuẩn kỹ
năng thành thạo hoặc các chuẩn hiệu quả”.
Khái niệm “các chuẩn mực” gợi lên một ý rằng vấn đề ở đây là những
“tiêu chuẩn tuyệt đối gắn liền với những giá trị, những tiêu chuẩn tuyệt đối đo
được áp đặt từ trên xuống và không có một cơ sở khoa học nào cả. Nếu như
vậy, khái niệm không còn là khái niệm của thời đại chúng ta. Thế nhưng, tính
chất tuyệt đối, theo nghĩa hẹp, cũng không gắn liền với khái niệm “các chuẩn
của mức độ thu được” hoặc là các tiêu chuẩn của hiệu quả. Có thể gán cho
nó một cách giải thích để chứng minh theo quan điểm sư phạm và, đồng thời,
cách giải thích đó làm cho việc xác định các tiêu chuẩn trả thành một cách xử
lý đứúg đắn có thể tiến hành được.
Đối với bản chất của các loại tiêu chuẩn này, chúng cần thỏa mãn hai
điều kiện trái ngược nhau sau đây:
- Các tiêu chuẩn cần biểu thị một mức độ hiện thực của hiệu quả mong
đợi, trong một lĩnh vực mục tiêu xác định, nghĩa là chúng phái tính đến mức
độ phát triển của các người học và của các khả năng thực tế của trường học
hiện nay, đối với các giáo viên, các công cụ dạy học và thời gian có thể sử
dụng được.
- Mặt khác, các tiêu chuẩn cần phản ánh một mức độ hiệu quả có thể
đạt tới về mặt lý thuyết, nghĩa là mức độ cao nhất có thể có của hiệu quả
được nhận định là có thể đạt tới được bởi nhóm các người học đang nói đến,
trong giả thiết là việc giảng dạy đã được phục vụ đến mức tối ưu, nghĩa là tốt
nhất có thể được, có tính đến các hoàn cảnh hiện nay. Định đề cuối cùng này
đồng thời chỉ rõ rằng cả hai yêu cầu này cần gặp nhau ở một điểm.
Tùy theo phương pháp xây dựng các loại tiêu chuẩn hiệu quả này,
người ta có thể gợi ý cách làm sau:
- Trong giai đoạn đầu, người ta mời một nhóm chuyên gia và yêu cầu
họ nhận định về khả năng có thể đạt tới về mặt lý thuyết của các nội dung có
thể xảy ra sau này của một cuộc kiểm tra đánh giá. Việc xây dựng một
phương pháp kỹ thuật để thu thập và viết những nhận xét của các định giá
viên là một nhiệm vụ điều tra sư phạm học.
- Trong giai đoạn thứ hai, nên có những đánh giá của các chuyên gia
được kiểm tra lại theo kinh nghiệm thực tế, song việc này đến bây giờ lại rất
khó thực hiện. Một biện pháp có thể làm được là đi sâu vào các nội dung mà
khả năng thành công về mặt lý thuyết đã được các chuyên gia xác định, trong
các lớp học, nơi người ta chấp nhận rằng việc giảng dạy đã được tiến hành
trong những điều kiện tối ưu. Dựa vào mức độ khó khăn được quan sát ở
trong các lớp học, người ta còn cải biên cả những tiêu chuẩn đã được chấp
nhận từ lúc xuất phát. Đó rõ ràng là những tiêu chuẩn hiệu quả không phải là
những tiêu chuẩn tuyệt đối.
Bài 9. ĐÁNH GIÁ VÀ CHO ĐIỂM
Trước khi làm rõ khái niệm quá trình đánh giá, điều quan trọng là giải
quyết một vấn đề thường ngăn cản khả năng khám phá tính năng động của
đánh giá. Vấn đề này có liên quan đến việc sử dụng các thuật ngữ “đánh giá”
và “cho điểm” một cách đồng nghĩa.
Có phải đánh giá và cho điểm giống nhau? Có thể nói, có hai mặt giống
nhau trong hai thuật ngữ này là chúng cùng quá trình và đều nói đến hoạt
động của một cá nhân. Tuy nhiên, chúng không phải là những quá trình giống
nhau. Đánh giá là một quá trình xét đoán. Giáo viên xét đoán về chất lượng
đạt được của các mục tiêu học tập dự kiến của ngưòi học. Cho điểm là quá
trình định hướng qua đó giáo viên định hướng những dữ kiện đánh giá và
đưa ra những ký hiệu thể hiện mức độ đạt được về mặt học thuật của người
học. Cho điểm, một quá trình định lượng, tùy thuộc vào dữ liệu được cung
cấp do quá trình và đánh giá định tính. Đánh giá có thể hiện diện như một
hiện tượng độc lập trong khi đó cho điểm luôn luôn phải tùy thuộc vào đánh
giá.
Mặc dù, như được trình bày ở đây, đánh giá và cho điểm là hai quá
trình riêng biệt lần lượt diễn ra, trong thực tế, chúng ta biết rằng sự phân biệt
này không được thực hiện. Cho điểm và đánh giá thường được coi như là
các thuật ngữ đồng nghĩa. Những điểm số chính thức từ trước đến nay trở
thành phương tiện dễ thấy nhất trong việc lượng giá việc thực hiện nhiệm vụ
học tập của người học mặc dù có việc cần xem xét lại là tính tin cậy của việc
đánh giá hoạt động của người học.
Cách giải thích theo lối phân đôi của thuật ngữ đánh giá là (1) nó là một
quá trình trưởng thành hoặc (2) nó là một quá trình kiểm soát. Ý nghĩa của hai
cách giải quyết hoàn toàn khác nhau này cần được chú ý. Nếu chúng ta chấp
nhận khái niệm đánh giá là một quá trình hay một loạt quá trình qua đó việc
phán đoán giá trị về hoạt động của một người được thực hiện, thì chúng ta có
thể nhận thấy rằng đánh giá thực sự có thể được sử dụng tùy theo nhu cầu
của người đánh giá.
Chúng ta hãy xem xét thuật ngữ đánh giá. Trên đây, ý tưởng phán
đoán giá trị đã được sử dụng. Thuật ngữ giá trị (value) là một phần thống nhất
của từ đánh giá (e-valuation). Vì giá trị là niềm tin tạo lập mà người đó chấp
nhận như cái riêng của mình và sử dụng như một yếu tố quyết định hành vi
của người đó. Chúng ta có thể nhận thấy ngay rằng không có một quá trình
nào như thế là quá trình đánh giá khách quan, đặc biệt trong lâm sàng y khoa,
sự tìm kiếm mang tính mông lung, vì không có hiện tượng như thế hiện hữu.
Tuy nhiên, mặc dù việc đánh giá có thể không khách quan, việc đánh giá vẫn
có thể công bằng. Chất lượng của tính công bằng này phải là mục tiêu của
chúng ta.
Thái độ của người đánh giá đối với việc đánh giá là một trong những
yếu tố quyết định có liên quan đến việc sử dụng hướng đến quá trình nào.
Thái độ của chúng ta xác định việc sẽ hỏi đúng câu hỏi và có xem xét hành vi
đúng hay không.
Việc tìm kiếm tri thức của người học bị ngăn chặn bởi các thông tin
nhận được từ người đánh giá các em. Việc đánh giá không được coi là một
quá trình tăng nhanh sự tự phát triển, mà là một quá trình soát xét qua đó
người học có thể được ghi nhận bằng một số danh xưng trong cuộc sống.
Việc tiếp cận của người học liên quan đến việc đánh giá là sự tư duy trì chứ
không phải là tự khẳng định.
Thực ra, việc giải thích ý nghĩa của thuật ngữ đánh giá mà bạn sử dụng
với tư cách của một nhà đánh giá sẽ quyết định cách tiếp cận mà bạn sử
dụng và hoàn cảnh bạn tạo ra. Tất cả các nghề nghiệp mang tính giúp đỡ lôi
cuốn các cá nhân nào đó bằng một nhu cầu kiểm soát những ngưòi khác.
Những “người điều khiển con người này” tìm thấy trong các lĩnh vực dịch vụ
một phạm vi màu mỡ đặc biệt, vì khách hàng thường là những cá nhân hay
nhóm đang ở trạng thái phụ thuộc. Các nhà kiểm soát dựa trên các luật lệ,
quy định và phương pháp để tìm ra những phán đoán mang tính chất đánh
giá và tìm cách vận động người học vào một trạng thái hành vi được chấp
nhận. Sau đó, người học hướng năng lực của họ vào việc duy trì sự sống
trong một hệ thống hơn là vào các kinh nghiệm đóng góp vào sự tăng trưởng
và trưởng thành.
Việc đánh giá thường phản ánh kỹ năng của người học, vào tài làm cho
đối thủ lãng trí để thắng cuộc, hơn là khả năng của người ấy đáp ứng các
mục tiêu hoạt động học tập được đưa ra. Trong ngành giáo dục, gồm cả yếu
tố thực hành, thì đặc biệt nhạy cảm với tài làm cho đối thủ lãng trí để thắng
cuộc này và được người đánh giá cũng là người kiểm soát khuyến khích. Đặc
điểm thực của quá trình giám sát làm nảy sinh nhiều mối lo ngại làm cho có
sự khác nhau giữa việc đánh giá trong lâm sàng khác với tình huống học
thuật thông thường. Thẩm quyền trong lâm sàng có liên quan đến tất cả các
lãnh vực học tập: nhận thức, tình cảm, và tâm lý cơ động. Sự thay đổi trong
hành vi trong tất cả các lãnh vực này xảy ra trong phạm vi của mối quan hệ
gần gũi với giáo viên và thường được bạn bè, bệnh nhân và những nhà
chuyên môn hoặc những nhà thực hành nhân ra một cách đầy đủ. Cảm giác
về sự không phù hợp làm cho người học phải sợ phê bình, xấu hổ và bị loại
ra. Nếu thầy giáo trong tình huống lâm sàng đặt giá trị trước tiên trên các luật
lệ và phương pháp, người học thường phải lựa chọn lại cách làm cho đối thủ
lãng trí để thắng cuộc để tự bảo vệ mình khỏi sự kiểm soát có ác cảm đo
lường.
Những điều nào của người đánh giá nhận thấy được về việc đánh giá
để giúp cho sự trưởng thành? Những cá nhân này chấp nhận khái niệm là
hầu hết những người học đều có khả năng thông thạo các nhiệm vụ học tập
và dùng đánh giá như là một quá trình chẩn đoán qua đó các chiến lược dạy
học được đưa ra để kích thích người học tìm kiếm tri thức, giá trị và khả năng
thực hành. Bầu không khí dành cho việc đánh giá manh tính ủng hộ, đặt cơ
sở trên sự tin tưởng và tôn trọng đối với người học. Quá trình phát triển cũng
như kết quả sau cùng là mối quan tâm của các nhà đánh giá này. Trò chơi
được giảm thiểu, bởi vì quá trình dạy - học là một việc làm khó khăn được
chia sẻ. Đánh giá là phần thống nhất của một quá trình giáo dục hoàn chỉnh.
Niềm tin của giáo viên về đặc điểm của con người và quá trình dạy -
học có liên quan trực tiếp đến niềm tin về quá trình đánh giá và đặc điểm của
các chiến lược đánh giá được soạn thảo.
Cách tiếp cận tâm lý giáo dục đến giảng dạy sử dụng đánh giá như là
một phương tiện để kiểm soát. Các kết quả mong đợi cũng như các điều kiện
học tập và các tiêu chuẩn được sử dụng để xác định thành tích học tập được
phác họa cụ thể. Đó là cách tiếp cận đánh giá kết quả. Tất cả người học và
giáo viên đều được yêu cầu theo “cùng nhịp điệu”. Mặc dù các kỹ thuật không
được ưa chuộng vì thất bại để đạt đến kết quả học tập không được coi như
một phần của lý thuyết này thực sự được sử dụng. Trong nhiều trường hợp,
việc không khen thưởng có thể được coi là phương pháp chống đối.
Cách tiếp cận nhân văn sử dụng đánh giá là sự lượng giá giúp trưởng
thành. Nó là một quá trình mở cơ động đan kết chặt chẽ với quá trình dạy -
học. Nó nhấn mạnh quá trình cũng như kết quả. Đánh giá giúp trưởng thành
là một phương tiện, chứ không phải là mục đích. Nó đề cao sự phát triển cá
nhân.
Cách ghi lại việc đánh giá được hướng tới sự trưởng thành của người
học gồm cả việc đánh giá tổng kết và đánh giá hình thành. Việc đánh giá tổng
kết xảy ra ở cuối một chương trình, một khóa học hay một đơn vị học trình và
dựa vào mức độ người học nhận biết các mục tiêu đã được xác định. Đây là
hình thức đánh giá trong thực tế thông thường nhất và được sử dụng như là
một cơ sở để quyết định điểm số. Trắc nghiệm, bài tập và các công trình
nghiên cứu là các cách thức thông thường. Cách đánh giá này được gọi là
cách đánh giá “cái gì”.
Ngược lại, cách đánh giá hình thành xảy ra trong suốt chương trình,
khóa học hoặc đơn vị học trình và dựa vào sự tiến bộ của người học đối với
việc nhận ra các mục tiêu học tập. Loại đánh giá này được thực hiện xuyên
suốt quá trình học tập và gọi là quá trình đánh giá “cái gì” và “cái có thể”. Nó
dựa vào nguyên tắc thông tin phản hồi để hướng dẫn người dạy và người học
đến các mặt học tập cần sự quan tâm sâu sắc khi người học tiếp cận đến việc
thành thạo các hành động học tập. Các phương pháp được sử dụng gồm các
ghi chép nhỏ, các tình huống giải quyết vấn đề, hồ sơ theo dõi, quan sát các
hành vi thực tiễn, các cuộc họp và ghi hình.
Loại đánh giá này không được soạn thảo để thu thập số liệu như là một
cơ sở để cho điểm. Nó được dùng để lượng giá sự tiến bộ của người học, để
chẩn đoán các nhu cầu học tập để các biện pháp sửa chữa có thể được thiết
lập một cách nhanh chóng, và bắt kịp việc học tập của người học tùy theo nhu
cầu và khả năng riêng của người đó.
Cách tiếp cận hệ thống đến việc đánh giá học tập về mặt tình cảm, phối
hợp các quá trình đánh giá tổng kết và hình thành, thì cần thiết. Các mục tiêu
được đưa ra trong các thuật ngữ tâm lý giáo dục được xác định như là các
kết quả thống nhất với mức độ học tập mong đợi. Các dữ liệu được thu thập
và các chiến lược được soạn thảo được các kết quả này xác định. Việc đánh
giá tổng kết có thể đạt đến được và cách đánh giá hình thành nhận ra các
mặt phát triển của việc học tập mang tính chất tình cảm.
Tài liệu tham khảo:
Dorothy E. Reilly (1982), Teaching and Evaluating the Affective,
Domain in Nursing Programs, USA: Charles B. Slack, Inc. (p.p 52-57).
Bài 10. CÁCH CHO ĐIỂM
Không có một quy luật chặt chẽ nào về phương pháp cho điểm tốt nhất.
Thực ra, như Erickson và Strommer (1991) chỉ ra rằng, bạn cho điểm như thế
nào tùy thuộc nhiều vào việc đánh giá, giả định và triết lý giáo dục của bạn:
nếu bạn coi những lớp học nhập môn là những lớp học “hạt giống” - để phân
biệt người học không có tiềm năng cho sự học thành công trong tương lai về
lĩnh vực đó - bạn sẽ chấp nhận cách tiếp cận việc cho điểm khác với giáo viên
xem các lớp học nhập môn là giảng dạy những kỹ năng quan trọng mà tất cả
các người học phải thông thạo.
Tuy nhiên, tất cả các giáo viên đều đồng ý rằng điểm số cung cấp thông
tin về việc người học học tập như thế nào (Erickson và Strommer, 1991).
Nhưng điểm số cũng được dùng cho những mục đích khác. Scriven (1974) đã
xác định ít nhất việc cho điểm có sáu chức năng:
- Mô tả rõ ràng giá trị, niềm vui hoặc cách đánh giá công việc thực hiện.
- Cải thiện năng lực của người học để xác định công việc tốt, có nghĩa
là, cải tiến việc tự đánh giá hoặc những kỹ năng phân biệt của người học dựa
vào công việc được giao.
- Kích thích và khuyến khích việc người học học giỏi.
- Trao đổi cách đánh giá của giáo viên về tiến bộ của người học.
- Thông báo cho giáo viên về những điều người học đã học được và
chưa học được.
- Chọn lựa người để phát thưởng hoặc tiếp tục học.
Đối với một số người học, điểm số cũng là dấu hiệu của sự chấp nhận
hoặc không chấp nhận; nên họ xem xét chúng theo cách riêng của cá nhân.
Do tầm quan trọng của điểm số, giáo viên cần thông tin cho người học lý do
và phương thức cho điểm rõ ràng.
Nếu bạn soạn những hướng dẫn rõ ràng làm căn cứ cho việc đánh giá
hoạt động, bạn sẽ nhận thấy quá trình cho điểm hiệu quả hơn và chức năng
quan trọng của việc cho điểm - thông báo mức độ hiểu của người học - sẽ dễ
dàng hơn. Hơn nữa, nếu bạn cho điểm một cách cẩn thận và nhất quán, bạn
có thể giảm số người học khiếu nại và yêu cầu bạn cho điểm lại. Những đề
xuất dưới đây giúp bạn thiết kế phương thức cho điểm rõ ràng và công bằng.
Đối với hướng dẫn tính điểm cuối khóa, hãy đọc “Tính toán và cho điểm.”
Dưới đây là bảng so sánh giữa đánh giá và cho điểm:
Đánh giá Cho điểm
Mang tính hình thành Mang tính tổng kết
Mang tính chẩn đoán Mang tính cuối cùng
Không mang tính đánh giá Mang tính đánh giá
Mang tính riêng tư Mang tính quản lý
Thường không nêu danh tính Xác định rõ ràng
Từng phần Tổng thể
Riêng biệt Toàn diện
Chủ yếu là từng phần giáo trình Hầu như toàn bộ giáo trình
Mang tính đề xuất Mang tính cứng
Thường được định hướng theo mục
tiêu
Thường được hướng dẫn theo nội
dung
Chiến lược tổng quát
(1) Cho điểm căn cứ trên việc thành thạo tri thức và kỹ năng của người
học. Hãy giới hạn cách đánh giá của bạn với kết quả học thuật. Loại bỏ
những xem xét như hành vi trong lớp, sự cố gắng, việc tham gia trong lớp,
chuyên cần, đúng giờ, thái độ tốt, đặc điểm nhân cách, hoặc hứng thú của
người học vào tài liệu khóa học, như là cơ sở để cho điểm khóa học. Nếu bạn
xem xét những yếu tố không mang tính học thuật này, bạn sẽ mơ hồ ý nghĩa
ban đầu của điểm số, như là một chỉ số về những điều người học đã học. Để
thảo luận về việc tại sao không tính việc tham gia trong lớp học vào việc cho
điểm, hãy đọc “Khuyến khích người học tham gia vào việc thảo luận.” (Nguồn:
Jacobs và Chase, 1992)
(2) Tránh hệ thống cho điểm đưa người học vào sự thi đua với bạn
cùng lớp và giới hạn điểm số cao. Hệ thống quy chuẩn này, như cho điểm
theo đường cong, một việc chống lại chiến lược học tập hợp tác được chỉ ra
rằng là có hiệu quả trong việc nâng cao việc học của người học. Chấm điểm
theo hệ thống quy chuẩn tạo ra những kết quả không cần thiết đối với nhiều
người học, như làm giảm động cơ học tập, làm tăng sự lo lắng về đánh giá,
làm giảm khả năng sử dụng thông tin phản hồi để cải tiến học tập, và làm làm
cho các mối quan hệ xã hội tồi tệ. (Nguồn: Crooks, 1988; McKeachie, 1986).
(3) Cố gắng đừng quá nhấn mạnh trên điểm số. Giải thích cho lớp của
bạn ý nghĩa và căn bản của điểm số và cách thức bạn dùng khi cho điểm.
Vào đầu học kỳ, hãy thông báo cho người học bằng văn bản (đọc “The
Course Syllabus”) có bao nhiêu bài kiểm tra, bài viết, bài tập ở nhà và bài thi
cuối khóa để tính vào điểm môn học. Một khi bạn đã giải thích xong cách cho
điểm, tránh nhấn mạnh điểm số hoặc bài tập có liên quan đến điểm số, một
việc chỉ làm tăng thêm sự lo lắng của người học và làm giảm động cơ học tập
của họ chứ không phải để nhận được phần thưởng bên ngoài như điểm số.
(Nguồn: Allen and Rueter, 1990; Fuhrmann và Grasha, 1983).
(4) Thông báo cho người học về tiến bộ của họ trong suốt học kỳ. Đối
với mỗi bài làm, bài phân về nhà, bài kiểm tra giữa học kỳ hoặc dự án mà bạn
cho điểm, hãy cho ngưòi học biết ý nghĩa về điểm số của họ. Hãy cho điểm
tổng số điểm hơn là một điểm bằng chữ. Điểm bằng chữ có khuynh hướng
tạo ra sự liên kết về mặt xúc cảm mà điểm tổng số không có. Hãy chỉ ra mức
độ và phân bố điểm chỉ ra mức độ kết quả nào là được. Thông tin như thế có
thể tạo động cơ cho người học cải tiến học tập nếu họ đang học kém hoặc
duy trì hoạt động của họ nếu họ đang học tốt. Bằng việc thông báo cho người
học trong suốt học kỳ, bạn cũng ngăn chặn được những ngạc nhiên không
thoải mái vào cuối học kỳ. (Nguồn: Lowman, 1984; Shea, 1990).
Giảm thiểu khiếu nại của người học về cách cho điểm
(1) Xác định rõ ràng cách cho điểm trong nội dung giáo trình của bạn
và thông báo thông tin này trong lớp. Người học muốn biết điểm số của họ
được cho như thế nào, trọng số của những bài làm và những bài cho về nhà
và mô hình cho điểm của bạn sẽ sử dụng để tính điểm của họ: lớp học sẽ
được cho điểm theo đường cong bình thường hoặc theo tiêu chuẩn tuyệt đối?
Nếu bạn có ý định cho phép học vào những học kỳ không chính thức, nộp bài
tập phân về nhà chậm, hoặc sửa bài làm, hãy nói rõ ý định đó.
(2) Hãy nói cách thức về những bài làm trễ. Bạn sẽ từ chối hoặc chấp
nhận bài làm trễ? Có bớt điểm theo thời gian nộp bài trễ không? Giải quyết
những bài làm trễ trên cơ sở cụ thể không? Có thời gian chiếu cố không? Hãy
đọc “Preparing or Revising a Course.”
(3) Tránh bổ sung cách cho điểm trong học kỳ. Sự thay đổi cách cho
điểm giữa khóa học có thể làm xói mòn lòng tin của người học vào tính công
bằng, nhất quán, khách quan và kỹ năng tổ chức của bạn. Nếu bạn cần thay
đổi, hãy giải thích đầy đủ cho người học của bạn. (Nguồn: Frisbie, Diamond
và Ory, 1979).
(4) Hãy tạo nhiều cơ hội cho học sinh bày tỏ họ hiểu điều gì. Bằng cách
tạo nhiều cơ hội cho học sinh bày tỏ họ hiểu điều gì, bạn sẽ có một hình ảnh
chính xác hơn về khả năng của họ và tránh phạt một người học nghỉ vào
ngày làm bài thi. Vì thế, ngoài bài thi cuối khóa, hãy cho một hoặc hai bài giữa
học kỳ và một hoặc hai bài viết ngắn. Đối với những khóa học chia nhỏ hơn,
Erickson và Strommer (1991) đề nghị cho những bài làm hoặc những bài viết
ngắn hơn và lập kế hoạch một số hình thức đánh giá mỗi hai hoặc ba tuần.
(5) Xem xét cho người học lựa chọn những bài tập phân về nhà thay
thế. Giáo viên trình bày một danh sách những hoạt động có cho điểm theo
từng hoạt động xem xét giá trị về giáo dục và động cơ của bài phân về nhà,
độ khó, sức cố gắng có thể cần. Hãy nói cho người học họ cần bao nhiêu
điểm để họ đạt được mức A, B hoặc C và họ chọn sự kết hợp những bài
phân về nhà đáp ứng được điểm họ cần cho phần của khóa học. Đây là một
số hoạt động khả thi:
- Viết một nghiên cứu tình huống.
- Tham gia vào việc báo cáo về những kinh nghiệm thực địa.
- Lãnh đạo nhóm tham gia hội thảo.
- Phục vụ cho nhóm tham gia hội thảo.
- Ghi nhật ký hoặc ghi những ý tưởng có liên quan đến khóa học.
- Viết đánh giá tổng kết sâu sắc về những bài giảng.
- Làm ra tài liệu giảng dạy cho khóa học (hướng dẫn giảng dạy, câu hỏi
thi, hoặc những tài liệu nghe nhìn) về một khái niệm hoặc chủ đề cụ thể.
- Tham gia dự án nghiên cứu hoặc bài tập nghiên cứu ban đầu.
- Tổng quan tài liệu nghiên cứu hiện nay về chủ đề có liên quan đến
khóa học.
- Ghi chép những bài đọc gồm những bài tóm tắt ngắn của các bài đọc
và bài góp ý, áp dụng hoặc những lời phê bình.
- Hoàn thành bài tập phân về nhà giải quyết vấn đề (như lập mô hình
nghiên cứu để kiểm nghiệm một giả thuyết hoặc tạo ra một trắc nghiệm để đo
lường thứ gì đó) (Nguồn: Davis, Wood, và Wilson, 1983).
(6) Nhấn mạnh cho người học biết rằng điểm số phản ánh việc học về
một nhiệm vụ cụ thể chứ không phải là đánh giá về con người. Nhắc người
học rằng giáo viên cho điểm chỉ trên một tờ giấy. Bạn cũng có thể cho người
học biết, nếu phù hợp, kết quả nghiên cứu cho thấy rằng điểm số có ít hoặc
không có mối liên hệ để đo lường thành quả của người lớn (Eble, 1988, trang
156).
(7) Khuyến khích người học học tập kém. Nếu người học gặp khó khăn,
hãy làm những điều bạn có thể để giúp họ cải tiến hơn vào bài tập hoặc bài
thi sắp tới. Nếu họ thực sự học tốt, hãy xem xét điều này khi tính trung bình
bài điểm thấp ban đầu với bài lần sau có điểm cao hơn. (Nguồn: Lowman,
1984).
(8) Liên hệ trực tiếp với người học nổi giận hoặc buồn về điểm số của
họ. Bảo người học buồn này cần một ngày hoặc nhiều hơn để khuây khỏa.
Việc này cũng hữu ích khi bảo một người học chuẩn bị viết đơn khiếu nại
hoặc yêu cầu xem xét lại điểm. Khi bạn gặp người học này tại văn phòng, hãy
chuẩn bị sẵn mọi tài liệu phù hợp: câu hỏi kiểm tra, câu trả lời hoặc tiêu chí,
những mẫu của câu trả lời hay.
- Hãy lắng nghe mối quan tâm của người học hoặc đọc lời thông báo
với tinh thần mở rộng và trả lời một cách bình tĩnh. Đừng tự cho phép mình
gây ra chống đối và đừng chống đối người học.
- Hãy mô tả những yếu tố chính của câu trả lời hay và chỉ ra câu trả lời
chưa hoàn chỉnh hoặc chưa đúng như thế nào.
- Hãy giúp cho người học hiểu những lý do mà bạn cho điểm, cần có
thời gian để suy nghĩ về yêu cầu của người học hoặc đọc lại bài thi nếu bạn
cần, nhưng chống lại sức ép để thay đổi một điểm số do nhu cầu cá nhân của
người học (để tiếp tục học sau đại học hoặc duy trì tên trong danh sách của
chủ nhiệm khoa). Nếu phù hợp, đề nghị viết thư cho cố vấn người học hoặc
người khác, mô tả bài làm của người học một cách chi tiết và chỉ ra những
tình tiết giảm khinh đã làm cho điểm số thấp. (Nguồn: Allen and Rueter, 1990;
McKeachie, 1986).
(9) Lưu giữ điểm chính xác của người học. Khoa của bạn có thể lưu
một bản báo cáo điểm cuối khóa, nhưng điều quan trọng đối với bạn là lưu
toàn bộ điểm đã cho trong suốt học kỳ, phòng khi một người học muốn tranh
luận về điểm số, trả nợ môn học hoặc xin thư giới thiệu.
Sử dụng hiệu quả chiến thuật cho điểm
Đánh giá cách cho điểm của bạn
(1) So sánh phân bố điểm số của bạn với những phân bố điểm số của
những khóa học tương tự trong khoa của bạn. Sự khác biệt giữa phân bố
điểm số của bạn với phân bố điểm số của đồng nghiệp không nhất thiết có
nghĩa là phương pháp của bạn là sai. Nhưng khi thấy sự khác biệt có thể gợi
ý cho bạn xem xét lại cách làm của mình. (Nguồn: Frisbie, Diamond và Ory,
1979).
(2) Hỏi người học về cách cho điểm các bạn trong bản thăm dò ý kiến
vào cuối khóa học. Đây là một số câu hỏi mẫu (được cải biên từ Frisbie,
Diamond và Ory, 1979, trang 22):
Ở mức độ nào:
- Cách cho điểm trong khoa học công bằng không?
- Cách cho điểm trong khoa học có được giải thích rõ ràng không?
- Bạn có nhận được thông tin phản hồi phù hợp về kết quả của bạn
không?
- Những yêu cầu để chấm lại điểm hoặc việc xem xét có diễn ra công
bằng không?
- Giáo viên có đánh giá việc học tập của bạn một cách có ý nghĩa và có
ý thức không?
Barbara Gross Davis, University of California, Berkeley.
(Từ Tools for Teaching, bản quyền của Jossey-Bass.
Muốn tìm hiểu thông tin về mua bản quyền hoặc in lại, hãy liên hệ với
Jossey-Bass. Được phép in lại September 1,1999).
Tài liệu tham khảo:
1. Allen R. R. and RueterT. (1990), Teaching Assistant Strategies,
Dubuque, Iowa: Kendall / Hunt.
2. Crooks T. J. (1988), “The Impact of Classroom Evaluation Practices
on Students” Review of Educational Research, 58(4), 438-481.
Phần 2. TRẲC NGHIỆM KHÁCH QUAN
Bài 1. LƯỢC SỬ TRẮC NGHIỆM
1. NHỮNG THÀNH TỰU ĐẠT ĐƯỢC VIỆC ỨNG DỤNG PHƯƠNG PHÁP TRẮC NGHIỆM Ở MỘT SỐ NƯỚC TRÊN THẾ GIỚI
Tại một số nước, việc áp dụng trắc nghiệm trong trường học còn tùy
thuộc vào mức độ khác nhau.
Ở Pháp, nơi phát xuất trắc nghiệm trí tuệ Binet nhưng lại phổ biến
chậm. Khi Hoa Kỳ cải biến trắc nghiệm Binet thành trắc nghiệm Stanford-
Binet sử dụng rộng rãi thì sau chiến tranh thế giới lần thứ nhất, Pháp mới để ý
trắc nghiệm. Sau chiến tranh thế giới thứ hai, trắc nghiệm thành quả học tập
phổ biến rộng rãi ở Pháp không những ở nhà trường phổ thông mà còn ở các
trường đại học nữa.
Ở Mỹ, vào đầu thế kỷ XX đã bắt đầu sử dụng phương pháp trắc nghiệm
trong dạy học. Đến năm 1940 đã xuất hiện nhiều hệ thống trắc nghiệm đánh
giá kết quả học tập của học sinh. Năm 1961 đã có 2126 mẫu trắc nghiệm tiêu
chuẩn. Năm 1963 đã xuất hiện công trình của Gedevik dùng máy tính điện tử
xử lý các kết quả trắc nghiệm trên diện rộng.
Ở Liên Xô, việc nghiên cứu kết quả của phương pháp trắc nghiệm trở
thành một đề tài kín của viện Hàn lâm khoa học Liên Xô. Tuy nhiên do kỹ
thuật trắc nghiệm chưa hoàn chỉnh, người áp dụng trắc nghiệm chưa thấy hết
nhược điểm của nó nên gây ra nhiều sai sót, sau đó trắc nghiệm không còn
được sử dụng ở Nga. Cho đến năm 1962, các nhà giáo dục ở Nga mới quay
trở lại nghiên cứu và sử dụng trắc nghiệm, các trường đại học cũng nghiên
cứu trắc nghiệm thành tích học tập như là một bộ phận trong nghiên cứu dạy
học chương trình hoá. Đến thập niên 70, trắc nghiệm thành tích học tập mới
phát triển rộng rãi, nhất là trắc nghiệm môn tiếng nước ngoài. Một số tài liệu
nước ngoài về Test cũng được dịch ra sang tiếng Nga để tham khảo.
Ở Anh, năm 1963 đã có hội đồng Hoàng Gia hàng năm quyết định các
trắc nghiệm chuẩn cho trường trung học.
Những năm gần đây, nhiều nước trên thế giới cũng đã sử dụng trắc
nghiệm ngày càng phổ biến và rộng sâu trong quá trình giảng dạy ở phổ
thông cũng như việc thi tuyển ở đại học như: ở Anh, Mỹ, Úc, Hà Lan, Bỉ,
Pháp, Nhật Bản, Trung Quốc, Thái Lan, Hàn Quốc đã phát triển mạnh.
2. VIỆC ỨNG DỤNG TRẮC NGHIỆM THÀNH TÍCH HỌC TẬP Ở VIỆT NAM
Việc sử dụng trắc nghiệm đã có một lịch sử lâu dài gần một thế kỷ thì
tại Việt Nam, cụ thể:
Ở miền Nam từ năm 1950 một số học sinh đã làm quen với trắc nghiệm
qua các cuộc khảo sát khả năng ngoại ngữ do các cơ quan quốc tế tổ chức
tại Việt Nam. Năm 1964 đã có một số tài liệu hướng dẫn soạn trắc nghiệm do
trung tâm trắc nghiệm và hướng dẫn phổ biến nhưng rất sơ lược bằng những
tài liệu mỏng ra định kỳ.
Ở miền Bắc từ những năm 1960 các nhà nghiên cứu giáo dục tìm hiểu
qua các tài liệu về tâm lý học và giáo dục học của Liên Xô.
Việc áp dụng trắc nghiệm trong các kỳ thi được thực hiện ở miền Nam
từ năm 1966, ở các môn Sử, Địa, Công dân cho kỳ thi lấy bằng trung học đệ
nhất cấp. Tại trường trung học kiểu mẫu Thủ Đức, trắc nghiệm cũng được
dùng để sát hạch khả năng của các học sinh trong các đợt tuyển sinh vào
trường cũng như kiểm tra, đánh giá học tập của học sinh.
Từ khoá thi Tú tài I, Tú tài II năm 1971 về sau các môn Triết học, Sử,
Địa, Công dân đều được đánh giá bằng trắc nghiệm với hình thức câu nhiều
lựa chọn. Đến kỳ thi Tú Tài II khoá 1974, tất cả các môn thi (trừ môn Thể dục)
đều được đưa ra đề bằng trắc nghiệm và bài thi được chấm bằng máy tính
điện tử IBM 360 nhập từ Mỹ.
Cũng từ năm 1970 - 1971 trong các kỳ thi tuyển sinh Đại học như các
trường Đại học Sư phạm, Đại học Y dược, Đại học Bách khoa đều áp dụng
cả hai loại đề là trắc nghiệm (Test) và luận đề cho những môn Toán, Lý,
Hoá…
Cũng từ năm 1970, môn trắc nghiệm được giảng dạy ở các lớp Cao
học Giáo dục tại trường Đại học Sư phạm Sài Gòn, đều được huấn luyện kỹ
lưỡng về Test. Họ đã biên soạn các câu trắc nghiệm, trên các lớp học tại
trường phổ thông trong nhiều năm và nhiều người đã hoàn tất luận văn tốt
nghiệp theo hướng ứng dụng Test để đo lường thành tích của học sinh về
các môn như Anh, Pháp,Toán, Lý, Sinh, Sử, Địa…
Năm 1972, tác giả Dương Thiệu Tống đã viết “Trắc nghiệm và đo
lường thành tích học tập”, Đại học Sư phạm Sài Gòn, dùng làm tài liệu học
tập cho các lớp này. Một số người trong lớp này, sau giải phóng còn ở lại
trong nước tiếp tục ứng dụng Test trong phạm vi lĩnh vực mình giảng dạy:
như ông Châu Kim Lang, giảng viên trường ĐH Sư phạm Kỹ thuật TP. Hồ Chí
Minh, sau năm 1975 vẫn tiếp tục nghiên cứu tìm tòi tham khảo nhiều sách về
Test do Liên Xô (cũ) và các nước Đông Âu (như Rumani, Bungari, Tiệp…)
xuất bản và viết cuốn “Trắc nghiệm kiến thức kỹ thuật Nông Nghiệp ở trường
phổ thông trung học” được nhà xuất bản Giáo dục in và phát hành năm 1988.
Nhìn chung, từ năm 1975 đến 1993 việc hình thức trắc nghiệm áp dụng
trong thi, kiểm tra việc học tập của học sinh rất ít phổ biến, chỉ trừ các môn
ngoại ngữ như: Anh, Pháp (do đặc điểm của môn học này, trắc nghiệm vẫn
thường được dùng trong các kỳ thi xếp lớp, cuối khoá, thi chứng chỉ quốc gia.
Việc nghiên cứu trắc nghiệm còn hạn chế trong phạm vi quan tâm của từng
cá nhân. Cả hai miền Nam, Bắc đều có những người nghiên cứu tìm hiểu về
trắc nghiệm.
Sau một thời gian dài phương pháp kiểm tra đánh giá bằng trắc nghiệm
hầu như không được đề cập tới trên các tài liệu tạp chí về giáo dục ở cả hai
miền Nam, Bắc. Cho đến hội thảo về đổi mới đại học do Bộ Giáo dục và Đào
tạo tổ chức năm 1994 gồm đại biểu các trường đại học trong và ngoài nước,
qua kết quả thăm dò ý kiến về các chủ trương đổi mới đại học. Và cũng từ
đầu năm 1994 Bộ Giáo dục và Đào tạo đã ra các văn bản khuyến khích sử
dụng trắc nghiệm trong kiểm tra đánh giá kết quả học tập. Đồng thời, có
những hoạt động cụ thể như tập huấn hội thảo về Test thì tại nhiều trường đại
học (Y khoa, Kinh tế, Bách khoa, Tổng hợp Sư phạm) đã áp dụng hình thức
trắc nghiệm vào việc đánh giá, kiểm tra tri thức của sinh viên.
Cũng trong năm đó Vụ Đại học cho in cuốn “Những cơ sở của kỹ thuật
trắc nghiệm” (tài liệu sử dụng nội bộ) của tác giả Lâm Quang Thiệp.
Theo xu hướng đổi mới việc kiểm tra đánh giá, Bộ Giáo dục và Đào tạo
đã giới thiệu phương pháp trắc nghiệm trong các trường đại học và bắt đầu
những công trình thử nghiệm (Phan Tuấn Nghĩa, Những vấn đề giảng dạy
Sinh học, Hà Nội, 1994).
Tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan ở Việt Nam
Theo Báo Sài Gòn Giải Phóng ra ngày 20.04.1996 thì Bộ Giáo dục và
Đào tạo cho phép trường Đại học Đà Lạt là trường đại học đầu tiên ở Việt
Nam áp dụng phương thức thi trắc nghiệm khách quan vào kỳ thi tuyển sinh
năm 1996 của trường này. Và trường Đại học Đà Lạt đã tổ chức được kỳ thi
này.
Đại học Quốc gia Thành phố Hồ Chí Minh đã nhiều lần có ý định tổ
chức tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan cho các
môn Toán, Hoá, Sinh và Anh Văn. Chủ trương này đã được Đại học Quốc gia
Thành phố chuẩn bị từ nhiều năm qua nhưng chưa thực hiện được bởi nhiều
nguyên nhân, nhưng Đại học Quốc gia Thành phố Hồ Chí Minh vẫn quyết tâm
thực hiện việc thi tuyển sinh bằng phương pháp trắc nghiệm vì nó có những
ưu điểm của phương pháp này.
Trước đây, trong cả nước chỉ mới có hai trường Đại học Đà Lạt và Đại
học Tây Nguyên tổ chức được việc thi tuyển sinh bằng phương pháp trắc
nghiệm.
Cho đến nay, kể từ năm học 2006-2007, Đại học Quốc gia Thành phố
Hồ Chí Minh và nhiều trường đại học ở Thành phố Hồ Chí Minh sẽ chính thức
áp dụng thi tuyển sinh đại học bằng hình thức thi trắc nghiệm. Thêm vào đó là
kể từ năm học này kỳ thi tốt nghiệp trung học phổ thông sẽ áp dụng hình thức
thi trắc nghiệm, trước tiên cho môn ngoại ngữ.
Bài 2. SO SÁNH CÁCH ĐÁNH GIÁ BẰNG TRẮC NGHIỆM VÀ LUẬN ĐỀ
1. ĐỊNH NGHĨA TRẮC NGHIỆM
Trắc nghiệm được dịch từ chữ “Test” ngày nay trắc nghiệm được hiểu
theo nghĩa rộng là dụng cụ, phương tiện, cách thức để khảo sát, đo lường.
Trắc nghiệm thành quả học tập có nghĩa là khảo sát đo lường các
thành quả đạt được của người học trong quá trình học tập.
Trắc nghiệm thành quả học tập với tính cách là một công cụ để khảo
sát trình độ của người học, có hai đặc điểm cơ bản là tính tin cậy và tính giá
trị:
(1) Tính tin cậy của trắc nghiệm đòi hỏi sự rõ ràng, trong sáng của câu
hỏi trắc nghiệm, đó là các yếu tố: từ ngữ sử dụng chính xác, không mơ hồ,
không gây nhầm lẫn, không thể hiểu nhiều nghĩa. Đặc trưng tin cậy của trắc
nghiệm làm cơ sở cho đặc trưng giá trị.
(2) Tính giá trị: một bài trắc nghiệm có giá trị khi nó đáp ứng được mục
đích đề ra.
2. MỘT VÀI SỰ KHÁC BIỆT GIỮA KIỂM TRA TRẮC NGHIỆM KHÁCH QUAN VÀ VIỆC KIỂM TRA BẰNG LUẬN ĐỀ
* Kiểm tra bằng luận đề
Là dạng dùng những câu hỏi tự luận đòi hỏi người học tự xây dựng câu
trả lời và diễn tả nó bằng ngôn ngữ của chính mình. Mặt khác, dạng này được
xem như là chủ quan, vì việc đánh giá cho điểm câu trả lời có thể tùy thuộc
rất nhiều vào chủ quan của người chấm, từ khâu xây dựng đáp án, biểu điểm,
xác định các tiêu chí đánh giá đến khâu đối chiếu bài trả lời với đáp án, tất cả
đều là các tiêu chí đã định.
* Kiểm tra bằng trắc nghiệm khách quan:
Là dạng Test trong đó mỗi câu hỏi có kèm những câu trả lời sẵn. Loại
dạng câu hỏi này cung cấp cho người học một phần hay tât cả những thông
tin cần thiết và đòi hỏi người học phải chọn một câu để trả lời hoặc chỉ cần
điền thêm một vài từ. Dạng này được xem là khách quan vì chúng đảm bảo
tính khách quan khi chấm điểm, bên cạnh đó phải xây dựng sao cho mỗi câu
hỏi chỉ có một câu trả lời đúng nhất.
3. SỰ KHÁC BIỆT GIỮA KIỂM TRA BẰNG TRẮC NGHIỆM KHÁCH QUAN VÀ LUẬN ĐỀ
Bảng 1. Sự khác biệt giữa kiểm tra bằng trắc nghiệm khách quan và luận đề
TRẮC NGHIỆM KHÁCH QUAN LUẬN ĐỀ
- Số câu hỏi trong một bài (đề) gồm
nhiều câu mang tính cách chuyên
biệt.
- Số câu hỏi trong một bài (đề) thì
tương đối ít, mang tính cách tổng
quát.
- Không đánh giá được khả năng diễn
đạt mà chỉ đòi hỏi những câu trả lời
ngắn gọn.
- Đánh giá được khả năng diễn đạt,
đặc biệt là diễn đạt tư duy, cách lập
luận một vấn đề.
- Thời gian kiểm tra trong một bài (đề)
ngắn, kiểm tra được nhiều kiến thức,
bao trùm toàn bộ nội dung.
- Thời gian kiểm tra tương đối dài,
nhưng chỉ ở trong phạm vi kiến thức
hẹp.
- Tránh được khuynh hướng học tập
trung (học tủ) một chỗ.
- Khuynh hướng chỉ học tập trung vào
một số kiến thức trọng tâm rất cao.
- Người học phải độc lập trong cách
nghĩ, phải biết nhìn nhận sự vật hiện
tượng một cách đúng nhất.
- Người học thuần túy chỉ dựa vào nội
dung ghi chép, tài liệu là chính.
- Khách quan trong khi chấm và kết
quả điểm số có độ tin cậy và chính
xác cao.
- Kết quả điểm số phụ thuộc vào chủ
quan của người chấm.
- Người học có thể tự đánh giá được
kết quả bài làm của mình.
- Người học không tự mình đánh giá
được chính xác qua kết quả bài làm
của mình.
- Trong thời gian ngắn, hạn chế được
tình trạng trao đổi, dùng tài liệu quay
cóp.
- Người học có thể dễ trao đổi bài, sử
dụng tài liệu, quay cóp.
- Áp dựng được công nghệ hiện đại - Khó áp dụng được vào trong công
trong quá trình chấm bài và phân tích kết quả.
nghệ, phải đọc kỹ từng bài, chấm rất công phu và phân tích kết quả thi.
Thực tế, qua hai phương pháp trên phương pháp được sử dụng phổ
biến nhất trong thi cử, kiểm tra, đánh giá ở nước ta từ bấy lâu nay vẫn là
phương pháp tự luận. Phương pháp trắc nghiệm, nói chung cũng còn mới,
chưa được áp dụng rộng rãi trong các trường học về thi cử cũng như trong
tuyển sinh. Tuv nhiên, với hai phương pháp trên chưa hẳn phương pháp nào
hoàn toàn tốt hơn, mỗi phương pháp đều có ưu, nhược điểm nhất định của
nó.
Theo ý kiến của các chuyên gia về trắc nghiệm, ta nên sử dụng luận đề
để khảo sát thành quả học tập trong những trường hợp dưới đây:
(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ
được sử dụng một lần, không dùng lại nữa.
(2) Khi thầy giáo cố gắng để khuyến khích và khen thưởng sự phát triển
kỹ năng diễn tả bằng văn viết của học sinh.
(3) Khi thầy giáo muốn tìm hiểu thêm về quá trình tư duy và diễn biến
tư tưởng của học sinh về một vấn đề nào đó ngoài việc khảo sát kết quả học
tập của các em.
(4) Khi thầy giáo tin tưởng vào khả năng phê phán và chấm bài luận đề
một cách vô tư và chính xác hơn.
(5) Khi không có nhiều thời gian soạn thảo bài khảo sát nhưng lại có
thời gian để chấm bài.
Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trường
hợp như sau:
(1) Khi ta cần khảo sát kết quả học tập của một số đông học sinh, hay
muốn sử dụng lại bài khảo sát ấy vào một lúc khác.
(2) Khi ta muốn có những điểm số đáng tin cậy, không phụ thuộc phần
lớn vào chủ quan của người chấm bài.
(3) Khi các yếu tố công bằng, vô tư, chính xác được coi là những yếu tố
quan trọng nhất của việc thi cử.
(4) Khi ta có nhiều câu trắc nghiệm tốt đã được dự trữ sẵn để có thể
lựa chọn và cấu trúc lại một bài trắc nghiệm mới. Đặc biệt, ta muốn chấm
nhanh và công bố kết quả sớm.
(5) Khi ta muốn ngăn ngừa nạn học tủ, học vẹt và gian lận thi cử của
học sinh.
Cả trắc nghiệm lẫn luận đề đều có thể sử dụng để:
(1) Đo lường tất cả các kết quả học tập mà một bài khảo sát viết có thể
đo lường được.
(2) Khảo sát các khả năng nhận thức ở các mức độ từ thấp đến cao, từ
đơn giản đến phức tạp như:
- Khả năng hiểu và áp dụng các nguyên lý.
- Khả năng suy nghĩ có phê phán.
- Khả năng giải quyết các vấn đề.
- Khả năng lựa chọn những sự kiện thích hợp và các nguyên tắc để
phối hợp chúng lại với nhau nhằm giải quyết những vấn đề phức tạp.
(3) Khuyến khích học tập để nắm vững kiến thức.
MỘT SỐ SUY NGHĨ VỀ VIỆC CHO HỌC SINH THI TRẮC NGHIỆM
Đối với học sinh, vấn đề thi trắc nghiệm chỉ là kỹ thuật làm bài. Ngoài
ra, học sinh có thể cảm thấy thoải mái hơn khi thi trắc nghiệm vì:
(1) Các bài thi trước không ảnh hưởng đến bài thi tiếp theo.
(2) Không phải lo lắng khi chưa làm đúng hoàn chỉnh bài.
Đối với giáo viên có một số ngộ nhận sau:
(1) Lo sợ vì không biết phải dạy làm sao cho các em có thể làm bài
được, nhưng đây là một suy nghĩ theo chiều ngược vì:
* Trắc nghiệm phục vụ giảng dạy chứ không phải giảng dạy phục vụ
trắc nghiệm nên giáo viên phải:
- Nắm được mục tiêu giảng dạy của bộ môn.
- Giảng dạy tốt hơn, từ đó học sinh học tốt hơn.
* Người soạn thảo trắc nghiệm sẽ phải đưa ra những bài để đánh giá:
- Những gì đã giảng dạy.
- Những gì phải giảng dạy.
- Những gì giảng dạy đuợc.
* Giáo viên sẽ là người bị tố cáo gian lận chứ không phải là học sinh vì:
- Giáo viên sẽ dạy tủ (tương tự đề thi đã ra trước đó).
- Giáo viên chỉ chú trọng những ý tưởng quan trọng chính mà bỏ qua
những ý tưởng quan trọng thứ yếu trong chương trình.
* Trong phòng thi, giám thị có thể gian lận như:
- Kéo dài thời gian thi.
- Gợi ý cho học sinh trong phòng thi câu trả lời.
- Nói bóng nói gió cho học sinh sửa câu làm sai.
Bài 3. CÁC LOẠI MỤC TIÊU
Có nhiều thuật ngữ để diễn đạt cái “đích” như tôn chỉ, mục đích mục
tiêu tùy theo thời gian và tính khái quát của nó.
1. CÁC ĐẶC ĐIỂM CỦA MỤC TIÊU NÓI CHUNG
Mục tiêu phải gồm các mẫu tự đầu của tiếng Anh là SMART điều này
có nghĩa rằng mục đích của bạn phải:
S - Specific (cụ thể)
M - Measurable (có thể đo được)
A - Achievable (có thể đạt được)
R - Result - oriented (hướng vào kết quả)
T - Time - bound (giới hạn thời gian)
* Mục tiêu cần phải cụ thể. Nó cần phải nêu ra kết quả mà nó nhằm đạt
được. Liệu điều đó có phải nhằm xác định các vấn đề của dự án hay không?
Nhằm thu thập thông tin phản hồi hay nó nhằm xác định xem các mục đích đã
đạt được hay chưa?
Các mục tiêu cụ thể sẽ giúp cho việc làm sáng tỏ các mục đích định
hướng cho các hoạt động, hướng dẫn thu thập số liệu và các phương tiện đo
đạc, cung cấp cơ sở cho việc kiểm tra tính hiệu quả của đánh giá.
* Mục tiêu phải có thể đo được. Để có thể đo được, thì các mục tiêu
nếu có thể cần nhằm vào các kết quả có thể quan sát được hoặc thể hiện
được, ví dụ kiến thức về lịch sử của một người nào đó có thể được thể hiện
thông qua điểm số của anh ta trong bài kiểm tra môn Lịch sư… Thái độ của
anh ta đối với một chương trình có thể được thể hiện qua mức độ mà anh ta
đạt được trong thang đo thái độ. Ta có thể thấy những tiến bộ trong môn
Toán thông qua điểm số mà học sinh đạt được từ bản đánh giá ban đầu so
với bản đánh giá cuối cùng. Tính có thể đo được có nghĩa rằng ta có thể xác
định được số lượng.
Nếu như có khó khăn trong việc đo kết quả thái độ hoặc hiệu quả của
chương trình, bạn có thể lựa chọn việc đo những nhân tố liên quan như là sự
chú ý và tham gia của học sinh trong những buổi học trên lớp. Đối với những
mục đích dài hạn như là tính trách nhiệm của người trưởng thành, việc tự
học, hoặc quyền công dân thì bạn không thể đo kết quả của chúng một cách
trực tiếp được. Trong những trường hợp như vậy, bạn nên đo phạm vi tiến
hành các hoạt động mà ít nhất sẽ đạt được các kết quả dài hạn.
Liệu mục tiêu sau có thể đo được hay không? Hãy giải thích câu trả lời
của bạn.
Sau một học kỳ áp dụng phương pháp giảng dạy mới, giáo viên sẽ
nâng tỷ lệ học sinh khá, giỏi lên 90%.
1. ………………………………………………………………………………
* Tính có thể đo được có nghĩa rằng ta có thể xác định được số lượng.
Vì các mục tiêu đánh giá, liệu bạn có thể xác định được số lượng đối với tình
yêu đất nước hay không? Bạn làm cách nào?
………………………………………………………………………………
* Mục tiêu cần có thể đạt được, cần đạt được mục tiêu đánh giá trên cơ
sở các nguồn tài chính và vật chất có sẵn, yêu cầu kỹ thuật của các phương
pháp được sử dụng, năng lực của đội ngũ nhân viên và thời gian cần thiết để
tiến hành các hoạt động.
* Mục tiêu cần phải hướng vào kết quả. Chỉ số giá trị của phần lớn các
chương trình giáo dục là loại kết quả mà chúng đạt được. Vì vậy, các mục
đích đánh giá càng cần phải tập trung vào các kết quả dự kiến hơn là các quá
trình, các hoạt động hoặc lượng các nguồn được đầu tư. Trong bản phân tích
cuối cùng, ta sẽ đánh giá tính hiệu quả của đầu vào xem chúng đã đóng góp
như thế nào cho các kết quả dự kiến. Thậm chí nếu việc đánh giá có mục
đích định hình hay chẩn đoán thì người đánh giá cũng không nên bỏ qua yếu
tố quan trọng nhất, đó là việc đạt được các mục tiêu của chương trình.
Liệu mục tiêu đánh giá này có hướng đến kết quả hay không? Mục tiêu
này nhằm đạt được kết quả gì?
Bài tập điền vào ô trống có thể nâng cao khả năng đọc hiểu của các
học sinh hay không?
* Mục tiêu cần phải có giới hạn thời gian. Điều này có nghĩa rằng việc
đánh giá cần có một khung thời gian. Phải xác định được khoảng thời gian
theo đó việc đánh giá sẽ đạt được mục tiêu của nó hay có thể đưa ra được
các đầu ra cần có. Liệu khoảng thời gian này nên là hai tháng hay một năm
sau khi đã bắt đầu chương trình? Cần phải cân nhắc kỹ nhiều biến cố xảy ra
khi quyết định khung thời gian và phần lớn các biến cố này có liên quan có
liên quan đến loại hình và lượng số liệu sẽ được thu thập, các nguồn có sẵn,
các phương pháp xử lý sẽ được tiến hành và dĩ nhiên phạm vi của chương
trình được đánh giá.
Không kể đến tôn chỉ và mục đích, ở mức độ trường học chúng ta có
những loại mục tiêu sau đây:
Mục tiêu chương trình:
Mục tiêu chương trình xuất phát từ các mục đích của trường hoặc của
địa phương nơi trường đóng được viết ra ở mức độ môn học và lớp. Mặc dù,
nó thường không xác định nội dung hoặc khả năng cụ thể, nhưng nó nhấn
mạnh trên nội dung và hành vi. Giống như mục đích, chúng nói đến sự hoàn
thành nhiệm vụ học tập của tất cả học sinh, chứ không phải của những cá
nhân học sinh nào.
Mục tiêu khóa học:
Mục tiêu khóa học nảy sinh từ mục tiêu chương trình và được hình
thành ở mức độ môn học và khoa. Nó xếp vào phạm trù, kết cấu nội dung và
đôi khi khái niệm, vấn đề hoặc hành vi, nhưng không cụ thể hóa nội dung
chính xác để xem xét hoặc phương pháp giảng dạy và nội dung chính xác để
sử dụng. Mục tiêu khóa học được xác định dưới hình thức chủ đề, khái niệm
hoặc hành vi tổng quát.
Mục tiêu giờ học:
Mục tiêu giờ học thường được giáo viên hình thành. Mục tiêu giờ học
chia mục tiêu khóa học thành nhiều đơn vị học tập. Các mục tiêu kế hoạch
đơn vị học tập thường gồm từ một đến ba tuần giảng dạy, được cấu trúc theo
một chuỗi và phù hợp đối với toàn bộ lớp học, chứ không phải đối với cá nhân
nào hoặc nhóm cụ thể nào. Các mục tiêu kế hoạch đơn vị học tập sau đó
được chia ra để hình thành các mục tiêu kế hoạch giờ học, một cách lý
tưởng, được cấu trúc khoảng trong một ngày giảng dạy về một chủ đề chuyên
biệt.
* Các đặc điểm của mục tiêu giảng dạy ở mức độ giờ học:
- Xác định mục tiêu cần mô tả cả loại hành vi mong đợi lẫn nội dung
hoặc ngữ cảnh mà hành vi đó áp dụng.
- Những mục tiêu phức tạp cần được xác định mang tính phân tích và
cụ thể để hành vi mong đợi và những thứ hành vi đó áp dụng có thể thực hiện
được.
- Các mục tiêu cần được xác định để phân biệt rõ ràng khả năng người
học khi họ đạt đến những kết quả khác nhau.
- Các mục tiêu mang tính phát triển, tạo ra con đường mở chứ không
phải là điểm kết thúc.
- Phạm vi các mục tiêu cần rộng rãi đủ để bao gồm tất cả các loại kết
quả mà nhà trường (hoặc giáo viên) có trách nhiệm tạo ra.
Nói tóm lại:
- Mục tiêu giảng dạy là hành vi của người học mang tính cụ thể, đo
lường được, ngắn hạn và có thể quan sát được.
- Mục tiêu không phải là tổng số kết quả của giáo dục, mà là điều kiện
tiên quyết, hoặc nền tảng, để đạt mục đích cao hơn có liên quan với lĩnh vực
học thuật. Mục tiêu tạo ra một quá trình được cấu trúc sẵn làm cho việc đáp
ứng các mục tiêu cao hơn khả thi.
2. TẦM QUAN TRỌNG CỦA VIỆC XÂY DỰNG MỤC TIÊU
Xác định mục tiêu cụ thể cho từng môn học/chương trình học là phải
xác định những tiêu chí, kỹ năng, kiến thức sinh viên cần đạt khi kết thúc
chương trình đào tạo và sau đó xây dựng quy trình và công cụ đánh giá nhằm
đo lường xem sinh viên có đạt được các tiêu chí đó không.
Việc xác định rõ ràng các mục tiêu cần đạt có những lợi điểm sau đây:
- Tạo điều kiện dễ dàng cho việc kiểm tra và chấm điểm công bằng.
- Mục đích của môn học, nội dung môn học và quy trình đánh giá vừa
nhất quán vừa quan hệ chặt chẽ với nhau.
- Mục tiêu cho phép các nhà đánh giá xác định hoạt động giảng dạy và
tài liệu học tập nào có hiệu quả.
- Cho thấy rõ ràng sự đối chiếu kết quả đào tạo giữa nội dung giảng
viên truyền đạt với nội dung sinh viên tiếp thu và có thể thực hành được.
- Mô hình giảng dạy hợp lý phải xác định được trình tự giữa mục tiêu và
nội dung - nghĩa là sinh viên phải làm được A trước khi có thể làm B.
- Cải tiến mối quan hệ trong ban giảng huấn.
- Khuyến khích sinh viên tự đánh giá vì họ biết họ phải đạt cái gì.
- Hỗ trợ hiệu quả việc học của sinh viên và giảm bớt lo lắng vì có
hướng dẫn và xác định rõ các ưu tiên trong giảng dạy.
- Sinh viên hiểu rõ các môn học có liên thông với nhau và gắn với mục
đích đào tạo.
* Cách viết mục tiêu
Một cách tổng quát, khi ta viết mục tiêu cho bài giảng hoặc mục tiêu
cho bài kiểm tra, ta cần đặt hai câu hỏi:
- Người học sẽ học được gì sau bài giảng hoặc đơn vị học tập này?
- Người học sẽ làm được gì sau bài giảng hoặc đơn vị học tập này?
Cụ thể, một mục tiêu giảng dạy gồm ba yếu tố:
(1) Xác định rõ loại hoạt động trong đó năng lực nào cần (Ví dụ: giải
phẫu ếch).
(2) Cụ thể hóa các tiêu chí hoặc tiêu chuẩn qua đó năng lực trong hoạt
động được đánh giá (Ví dụ: một con ếch để các bộ phận sau đây được trình
bày một cách rõ ràng)
(3) Lập danh mục những điều kiện hoặc hoàn cảnh cần thiết cho người
học đạt được mục tiêu (Ví dụ: “…trong thòi gian hai tiết làm việc với vật liệu
tại phòng thí nghiệm “).
Như vậy, ta cần xem xét:
- Mục tiêu cần cụ thể và chi tiết đến mức độ nào? Nó tùy thuộc vào việc
chúng được sử dụng để làm gì. Ví dụ, các mục tiêu cho chuỗi một giáo án
của đơn vị học tập sẽ tổng quát hơn việc cụ thể một giáo án của bài học.
- Đừng làm cho việc viết mục tiêu dài dòng, manh mún, tốn thời gian,
hoặc mang tính máy móc. Hãy viết các mục tiêu đơn giản, không mơ hồ và
tập trung rõ ràng như là một bảng hướng dẫn học tập.
- Mục đích của mục tiêu không giới hạn tính tự phát hoặc hạn chế trong
tầm nhìn giáo dục về môn học; nhưng bảo đảm rằng học tập được tập trung
một cách rõ ràng đủ để cho cả người học lẫn người dạy biết việc gì sẽ diễn
ra.
- Diễn đạt các mục tiêu dựa vào các hoạt động, hành vi và kết quả của
người học, chứ không phải dựa vào hoạt động của giáo viên.
* Cần phát biểu mục tiêu như thế nào?
Để nhằm mục đích đo lường, các mục tiêu thường thấy trong chương
trình các môn học cần phải được phát biểu lại sao cho rõ ràng, cụ thể. Một số
các mục tiêu sẽ được lựa chọn để làm căn bản cho việc soạn thảo trắc
nghiệm, một số khác có thể được khảo sát bằng các phương tiện khác. Các
câu phát biểu:
(1) Phải rõ ràng, cụ thể.
(2) Phải đạt tới được trong khóa học hay trong đơn vị học tập.
(3) Phải bao gồm nội dung học tập thiết yếu của môn học.
(4) Phải quy định rõ kết quả của việc học tập, nghĩa là các khả năng mà
người học sẽ có được khi họ đã đạt đến mục tiêu.
(5) Phải đo lường được.
(6) Phải chỉ rõ những gì người học có thể làm được vào cuối giai đoạn
học tập.
Trong khi viết mục tiêu, người soạn trắc nghiệm có thể tự đặt cho mình
những câu hỏi đại loại như sau: “Học sinh có thể làm được những gì sau khi
hoàn tất khóa học hay bài học này?”. “Học sinh có thể chứng minh rằng họ đã
đạt được mục tiêu bằng cách nào với một bài khảo sát viết?”
* Xây dựng mục tiêu từ chung nhất đến cụ thể.
Nhằm đạt được hiệu quả, các mục tiêu đưa ra bao gồm ba yếu tố cơ
bản sau:
- Một động từ mô tả cho một hành động quan sát.
- Một mô tả về các điều kiện, qua đó một hành động xảy ra: “Khi đạt
được X, bạn sẽ có thể…”
- Mức độ thành công có thể chấp nhận được - tỷ lệ phần trăm các câu
trả lời đúng, số lỗi được phép sai và các ví dụ nào phải có…
Thêm vào đó, trước khi bắt đầu công việc này, cần xác định đối tượng
người học là ai và các môn tiếp đến là gì. Khó khăn thường gặp ở giảng viên
là sự hiểu biết chưa đầy đủ về kinh nghiệm và khả năng có sẵn của sinh viên
trước khi vào học.
Cần dùng những từ rõ ràng, cô đọng để mô tả động thái của người học
trong các mục tiêu này. Mager (1975) thống kê các thuật ngữ sử dụng như
sau:
Những từ có thể có nhiều cách hiểu
Những từ có cách hiểu giới hạn hơn
Biết Viết
Hiểu Liệt kê ra
Thật sự hiểu Xác định
Tán thành Sắp xếp
Hoàn toàn tán thành Giải quyết
Hiểu được tầm quan trọng Xây dựng
Thích thú Tương phản
Tin tưởng So sánh
Có niềm tin vào
Mặc dù sử dụng được hơn 50 năm, nhiều người vẫn xem nó là cách để
phân loại các mục tiêu, mặc dù việc sắp xếp tuỳ thuộc vào cách chúng ta cảm
thấy thoải mái nhất.
NGUYÊN TẮC PHÂN LOẠI MỤC TIÊU GIÁO DỤC - LĨNH VỰC NHẬN THỨC
Hiện nay, thuật ngữ “mục tiêu” được sử dụng khá rộng rãi trong nhiều
lĩnh vực khác nhau, vì thế có một số nhà giáo dục hiểu nhầm mục tiêu là việc
đạt đến nội dung tri thức cần truyền đạt hoặc họ nhấn mạnh trên việc tiếp số
số lượng tri thức chứ không phải nói đến chất lượng tiếp thu tri thức. Do việc
phân biệt mức độ chất lượng tiếp thu tri thức cần có những tình huống cụ thể,
nên chúng ta cần tham khảo thêm tác phẩm của Benjamin S. Bloom.
Như đã trình bày ở trên, vào cuối thập niên 60 của thế kỷ XX, một
nhóm giáo sư ở các trường đại học Mỹ do Ông Benjamin S. Bloom chủ trì đã
soạn thảo cuốn “Taxonomy of Educational Objectives - Cognitive Domain”
(Nguyên tắc phân loại mục tiêu giáo dục - Lĩnh vực nhận thức). Các tác giả đã
trình bày cơ sở lý thuyết của việc phân loại và sắp xếp quá trình nhận thức
của người học theo các thang bậc từ đơn giản đến phức tạp, từ cụ thể đến
trừu tượng để đánh giá quá trình tiếp thu của người học theo sáu mức độ từ
thấp đến cao như sau: biết, thông hiểu, áp dụng, phân tích, tổng hợp và đánh
giá. Nói cách khác, các tác giả nhấn mạnh đến quá trình trí tuệ của việc tiếp
thu tri thức ở những mức độ khác nhau của quá trình đánh giá nhận thức của
học sinh. Mỗi mức độ này được định nghĩa cụ thể bằng những tiêu chí cần
đạt được. Sách đã được các nhà giáo dục trên thế giới sử dụng rộng rãi.
Dưới đây là tóm tắt các mức độ phân loại lĩnh vực nhận thức:
(1) Biết
Mức độ này gồm các mục tiêu có liên quan đến:
(a) Tri thức cụ thể như thuật ngữ và sự kiện.
(b) Tri thức về cách thức và phương tiện để giải quyết những điều cụ
thể như quy ước, khuynh hướng và quy trình, sự phân loại và sắp xếp phạm
trù, tiêu chí và phương pháp luận.
(c) Tri thức về tổng quát và trừu tượng như những nguyên tắc, khái
quát hóa, lý thuyết và cấu trúc.
(2) Thông hiểu
Các mục tiêu ở mức độ này có liên quan đến
(a) Chuyển dịch.
(b) Giải thích.
(c) Ngoại suy các tài liệu.
(3) Ứng dụng
Các mục tiêu ở mức độ này có liên quan đến việc sử dụng tính trừu
tượng trong những tình huống cụ thể
(4) Phân tích:
Các mục tiêu ở mức độ này có liên quan đến việc chia tổng thể thành
các bộ phận và phân biệt:
(a) Các yếu tố.
(b) Các mối quan hệ.
(c) Nguyên tắc cấu trúc.
(5) Tổng hợp:
Các mục tiêu ở mức độ này có liên quan đến kết hợp các bộ phận dưới
một hình thức mới như:
(a) Thông tin độc đáo.
(b) Kế hoạch vận hành.
(c) Tập hợp những mối quan hệ trừu tượng.
(6) Đánh giá:
Đây là mức độ phức tạp cao nhất và gồm các mục tiêu có liên quan đến
sự đánh giá nhờ vào:
(a) Bằng chứng bên trong hoặc sự thống nhất về logic.
(b) Bằng chứng bên ngoài hoặc sự thống nhât có các sự kiện được
phát triển nơi khác.
Những từ gợi ý sử dụng cho cách phân loại mục tiêu giáo dục - Lĩnh
vực nhận thức
Ở đây có hai phần trong mỗi mức độ phân loại (phạm trù): động từ và
túc từ sử dụng trong câu hỏi. Khi muốn đặt câu hỏi cho phạm trù đó, độc giả
hãy nối một động từ với một túc từ phù hợp với ý định của mình.
(1) Biết:
- Động từ sử dụng trong câu hỏi: định nghĩa, phân biệt, đạt được, xác
định, nhớ lại, nhận ra.
- Túc từ sử dụng trong câu hỏi: thuật ngữ, từ vựng, nghĩa của từ, định
nghĩa, vật ám chỉ, yếu tố, sự kiện, nguồn, tên, ngày tháng, con người, nơi
chốn, thời gian, đặc điểm, ví dụ, các hình thức, hiện tượng, quy ước, cách sử
dụng, quy luật, cách thức, phương sách, biểu tượng, tượng trưng, kiểu, quy
định, hành động, quá trình, sự phát triển, khuynh hướng nguyên nhân, mối
quan hệ, ảnh hưởng, loại, nét đặc trưng, lớp, tập hợp, sự sắp xếp, sự phân
loại, phạm trù, tiêu chí, phương pháp, kỹ thuật, cách sử dụng, cách thức, cấu
trúc, cách tạo thành.
(2) Thông hiểu:
- Động từ sử dụng trong câu hỏi: dịch, chuyển di, minh họa, chuẩn bị,
đọc, trình bày, thay đổi, chuyển đoạn văn, xác định lại, giải thích, sắp xếp lại,
phân biệt, tìm sự khác nhau, tạo thành, giải thích, chứng minh, đánh giá, suy
ra, đưa vào, tiên đoán, quyết định, mở rộng, nội suy.
- Túc từ sử dụng trong câu hỏi: ý nghĩa, mẫu, định nghĩa, tóm tắt,
tượng trưng, từ, đoạn ngữ, sự phù hợp, mối quan hệ, cơ sở, các mặt, phẩm
chất, kết luận, phương pháp, lý thuyết, tóm tắt, kết quả, giải thích, yếu tố, sự
phân nhánh, hệ luận, ảnh hưởng, xác suất.
(3) Áp dụng:
- Động từ sử dụng trong câu hỏi: áp dụng, khái quát hóa, liên hệ, lựa
chọn, phát triển, kết cấu, sử dụng, khai thác, chuyển di, cấu trúc lại, phân loại.
- Túc từ sử dụng trong câu hỏi: nguyên tắc, quy luật, kết luận, ảnh
hưởng, phương pháp, lý thuyết, tóm tắt, tình huống, sự khái quát hóa, quá
trình, sự kiện, cách thức.
(4) Phân tích:
- Động từ sử dụng trong câu hỏi: phân biệt, khám phá, xác định, tìm sự
khác biệt, nhận ra, xếp vào phạm trù, phân tích, đối chiếu, so sánh, suy luận.
- Túc từ sử dụng trong câu hỏi: yếu tố, giả thuyết, kết luận, giả định, lý
lẽ, điều cụ thể, mối quan hệ, liện hệ bên trong, sự phù hợp, chủ đề, bằng
chứng, ngụy biện, quy luật nhân quả, tính kiên định, bộ phận, ý tưởng, giả
định, hình thức, kiểu loại, mục đích, quan điểm, kỹ thuật, sự thiên vị, cấu trúc,
sự sắp xếp, cách tổ chức.
(5) Tổng hợp:
- Động từ sử dụng trong câu hỏi: viết, kể lại, liên hệ, tạo ra, chuyển,
hình thành, bổ sung, lập hồ sơ, đề xuất, lập kế hoạch, thiết kế, phận loại,
chuyển hóa từ, phát triển, kết hợp, tổ chức, tổng hợp, phân loại, suy luận, lập
công thức.
- Túc từ sử dụng trong câu hỏi: cấu trúc, kiểu loại, sản phẩm, hiệu suất,
thiết kế, tác phẩm, giao tiếp, cố gắng, bài sáng tác, kế hoạch, mục tiêu, phân
loại, thao tác, cách thức, giải pháp, phương tiện, hiện tượng, cách phân loại,
khái niệm, kế hoạch, lý thuyết, mối quan hệ, tóm tắt, sự khái quát hóa, giả
thuyết, sự khám phá.
(6) Đánh giá:
- Động từ sử dụng trong câu hỏi: đánh giá, tranh luận, làm cho hợp lệ,
đánh giá, quyết định, xem xét, so sánh, đối chiếu, tiêu chuẩn hóa, khen
thưởng.
- Túc từ sử dụng trong câu hỏi: sự chính xác, tính kiên định, ngụy biện,
tính tin cậy, thiếu sót, sai lầm, tính chính xác, điểm chính xác, phương tiện,
hiệu quả, nền kinh tế, cách sử dụng, phương án thay thế, quá trình hành
động, tiêu chuẩn, lý thuyết, sự khái quát hóa.
Câu hỏi trắc nghiệm gợi ý dựa trên cách phân loại của B.S. Bloom
Bloom và cộng sự, 1956
Là giáo viên, chúng ta có khuynh hướng hỏi những câu thuộc phạm trù
“biết” từ 80% đến 90%. Lọai câu hỏi thuộc phạm trù này không phải là không
hay, nhưng việc dùng chúng thường xuyên thì trở thành không hay. Hãy cố
gắng sử dụng những câu hỏi ở mức độ cao hơn. Những câu hỏi ở mức độ
cao đòi hỏi “năng lực trí tuệ nhiều hơn và câu trả lời mở rộng và trau chuốt
hơn. Dưới đây là sáu loại phạm trù câu hỏi do Bloom định nghĩa.
Biết
Nhớ lại
Hồi tưởng
Nhận ra
Nhớ lại đặc điểm
Nhớ lại thông tin
Ai, cái gì, khi nào, ở đâu, cách nào…?
Mô tả
Thông hiểu
Giải thích
Chuyển dịch từ một thông tin này qua một thông tin khác
Diễn tả bằng từ ngữ riêng
Cấu trúc và lựa chọn các sự kiện và ý tưởng
Kể lại…
Áp dụng
Giải quyết vấn đề
Áp dụng thông tin để tạo ra một số kết quả
Sử dụng sự kiện, quy luật và nguyên tắc
Thế nào là… một ví dụ của…?
… liên hệ thế nào với…?
Tại sao… là quan trọng?
Phân tích
Phân chia sự việc để cho thấy nó kết hợp như thế nào
Tìm cấu trúc có liên hệ của một thông tin
Xác định động lực
Tách biệt toàn thể thành những phần yêu tố
Các phần hoặc đặc điểm của… là gì?
Phân loại… theo…
Lập dàn bài/hình vẽ…
… so sánh/đối chiếu với… như thế nào?
Sự kiện nào bạn có thể lập danh mục cho…?
Tổng hợp
Tạo ra một sản phẩm độc đáo, mới mẻ dưới dạng ngôn ngữ hoặc là
một vật thể
Kết hợp các ý tưởng để tạo thành một tổng thể mới
Điều gì bạn có thể tiên đoán/suy ra từ…?
Ý tưởng nào bạn có thể thêm vào…?
Bạn có thể tạo ra/thiết kế một… mới như thế nào?
Điều gì sẽ diễn ra khi bạn kết hợp…?
Giải pháp nào bạn sẽ đề xuất cho…?
Đánh giá
Đưa ra quyết định có giá trị cho vấn đề
Giải quyết những xung đột hoặc khác biệt về ý kiến
Phát triển ý kiến, đánh giá hoặc quyết định
Bạn có đồng ý rằng…?
Bạn nghĩ như thế nào về…?
Điều gì là quan trọng nhất…?
Hãy sắp đặt những thứ dưới đây theo thứ tự ưu tiên…
Bạn sẽ quyết định như thế nào về…?
Bạn sẽ dùng tiêu chí nào để đánh giá…?
Đến năm 2001, Anderson và Krathwohl cải tiến nguyên tắc phân loại
nhận thức của Benjamin S. Bloom theo các mức độ từ đơn giản đến phức tạp
như sau:
(1) Nhớ lại
(2) Thông hiểu
(3) Ứng dụng
(4) Phân tích
(5) Đánh giá
(6) Sáng tạo
Bài 4. NHỮNG CÂU HỎI ĐỂ CHUẨN BỊ CHO BÀI TRẮC NGHIỆM TRONG LỚP HỌC
Những trắc nghiệm do thầy giáo soạn thảo thường là căn bản chính
cho việc đánh giá sự tiến bộ của người học trong nhà trường. Những bài trắc
nghiệm tốt không xuất hiện ngẫu nhiên! Chúng đòi hỏi việc lập kế hoạch phù
hợp để mục tiêu giảng dạy, nội dung chương trình và tài liệu giảng dạy có liên
hệ một cách có ý nghĩa. Dưới đây là bảng kiểm tra cần xem xét khi chuẩn bị
trắc nghiệm trong lớp học:
1. Mục tiêu của trắc nghiệm là gì? Tại sao tôi đưa nó ra?
2. Kỹ năng, tri thức, thái độ,… nào tôi muốn đo lường?
3. Tôi có xác định rõ ràng mục tiêu giảng dạy của tôi dựa vào động thái
của người học chưa?
4. Các câu trắc nghiệm có phù hợp với các mục tiêu không?
5. Loại trắc nghiệm nào (hình thức câu trắc nghiệm nào) tôi muốn sử
dụng? Tại sao?
6. Trắc nghiệm kéo dài trong bao lâu?
7. Mức độ khó của bài trắc nghiệm?
8. Độ phân cách của những câu trắc nghiệm của tôi cần như thế nào?
9. Tôi sẽ sắp xếp những hình thức câu trắc nghiệm như thế nào?
10. Tôi sẽ sắp xếp những câu trắc nghiệm trong mỗi hình thức câu trắc
nghiệm như thế nào?
11. Tôi cần phải làm gì để chuẩn bị người học của tôi làm trắc nghiệm?
12. Cách người học tôi ghi lại các câu trả lời cho các câu trắc nghiệm
khách quan như thế nào? Trên tờ trả lời riêng? Ngay trên bài trắc nghiệm?
13. Các phần khách quan được chấm điểm như thế nào?
14. Các phần luận đề được chấm điểm như thế nào?
15. Đối với các câu trắc nghiệm khách quan, có cần những chỉ dẫn về
đoán mò không? Có cần sử dụng công thức sửa chữa đoán mò không?
16. Các điểm số của trắc nghiệm cần được lập thành bảng như thế
nào?
17. Các điểm số (thứ bậc hoặc mức độ giỏi) cần được phân như thế
nào?
18. Kết quả trắc nghiệm cần được báo cáo như thế nào?
Bài 5. HÌNH THỨC CÂU TRẮC NGHIỆM KHÁCH QUAN
Trắc nghiệm thành quả học tập bao gồm các loại thông dụng nhất như
sau:
1. LOẠI ĐÚNG - SAI (TRUE - FALSE)
Loại này được trình bày dưới dạng một câu phát biểu (nhận định), đòi
hỏi người học phải xác định xem nội dung của câu ấy là đúng hay sai. Và
người học trả lời bằng cách lựa chọn câu thích hợp với chữ Đ (Đúng) hay S
(Sai). Đối với câu đúng mọi chi tiết trong câu phải phù hợp với tri thức khoa
học, còn đối với câu sai thì chỉ cần một trong những chi tiết là sai.
Loại câu trắc nghiệm này là một loại hình đặc biệt của loại câu trắc
nghiệm nhiều lựa chọn, nhưng chỉ có hai cách lựa chọn.
Loại trắc nghiệm này phù hợp cho việc kiểm tra kiến thức bằng các
định nghĩa, khái niệm, công thức, các sự kiện (như mốc lịch sử, địa danh, tên
nhân vật…). Với loại này thường đòi hỏi trí nhớ nhiều hơn, ít kích thích sự suy
nghĩ.
1.1. Ưu, nhược điểm của loại đúng - sai:
* Ưu điểm:
- Loại đúng - sai được dùng rộng rãi vì hình thức đơn giản, có thể soạn
nhiều câu trắc nghiệm cho từng bài học, khảo sát bất kỳ nội dung nào nên
người học không thể học “tủ” được.
- Hình thức trắc nghiệm gọn gàng, ít tốn giấy, ngoại trừ hình vẽ.
- Thời gian trả lời của người học khá nhanh. Một phút có thể trả lời ba
đến bốn câu trắc nghiệm.
* Nhược điểm:
- Xác suất may rủi của từng câu trắc nghiệm Đ - S là 50%, người học
không nắm vững bài cũng hy vọng trả lời đúng 50% cho mỗi câu trắc nghiệm.
- Giáo viên thường có xu hướng trích nguyên văn trong sách để soạn
câu Đ và sửa một vài chữ để trở thành câu S, vì thế người học dễ dàng nhận
ra.
- Dễ có các câu trắc nghiệm không có giá trị. Vì câu văn gây nhiều cách
giải thích và có thể hiểu là Đ mà cũng có thể hiểu là S, đều được cả.
- Dễ có một số từ tiết lộ kết quả trong câu trắc nghiệm.
2.2. Cách thức soạn thảo:
Tránh trích ra những câu có sẵn trong sách giáo khoa hoặc chép
nguyên văn trong sách, tài liệu. Khi đó người học sẽ dễ dàng phát hiện.
Nội dung xác định câu Đ hoặc S phải chắc chắn, chính xác, rõ ràng,
dựa vào cơ sở khoa học chớ không phụ thuộc vào quan niệm riêng của người
soạn thảo.
Tránh dùng các từ, cụm từ như: “tất cả”, không bao giờ, “không một ai”,
“không thể nào”, khi đó người học sẽ nhận rõ là những câu sai. Bên cạnh đó
tránh dùng từ “thường thường”, “đôi khi”, “có khi”, “một số người”, đó là
những từ thường dùng cho câu Đ. Nói chung, nếu dùng các từ trên trong câu
trắc nghiệm sẽ làm cho người học, dè dặt, ung dung, lúng túng không rõ ràng.
Nội dung câu trắc nghiệm có thể gồm nhiều yếu tố nhưng theo mệnh đề
kéo theo (Toán học), các yếu tố đều đúng thì kết quả mới đúng và chỉ cần một
yếu tố sai thì kết quả sẽ là sai, do đó ta không nên có nhiều yếu tố sai, như
vậy sẽ làm cho người học dễ dàng phát hiện ra câu S.
2. LOẠI NHIỀU LỰA CHỌN (MULTIPLE CHOICE)
Loại này gồm có hai phần là phần gốc và phần giải đáp (hay phần lựa
chọn):
Phần gốc: là một câu hỏi (hay một câu chưa hoàn tất), chúng phải tạo
căn bản cho sự lựa chọn.
Phần lựa chọn: gồm một số kết quả trả lời trong đó có một trả lời đúng
nhất mà người học phải chọn, còn những phần còn lại là những “mồi nhử”.
Khi đó người học phải nắm vững kiến thức thì mới phân biệt được. Các câu
mồi nhử (hay câu nhiễu) trông bề ngoài sẽ ngang nhau đối với câu đúng nhất,
bề ngoài có thể là đúng nhưng thực ra là sai hoặc chỉ đúng một phần.
2.1. Ưu, nhược của loại nhiều lựa chọn:
* Ưu điểm:
- Loại nhiều lựa chọn có xác suất may rủi thấp hơn so với loại đúng -
sai. Nếu câu trắc nghiệm có bốn lựa chọn thì tỉ lệ là 25%, nếu có năm lựa
chọn thì tỉ lệ may rủi là 20%.
- Có thể đo lường sự hiểu biết, sự xem xét và khả năng lý luận.
- Thích hợp với mọi trình độ.
- Loại nhiều lựa chọn là cơ sở để soạn thảo nội dung dạy học chương
trình theo kiểu phân nhánh.
* Nhược điểm:
- Đòi hỏi tốn nhiều công soạn thảo, vì phải tìm những yếu tố trả lời có
sức hấp dẫn tương đương.
- Tốn giấy và mất nhiều thời gian trả lời so với trắc nghiệm đúng - sai.
- Kết quả trắc nghiệm nằm sẵn ở phần trả lời người học có thể nhận ra.
2.2. Cách thức soạn thảo:
Phần trả lời lựa chọn chỉ có một câu đúng hoặc đúng nhất, các câu
khác là đúng nhưng chưa được hoàn hảo hoặc là sai, không nên chọn những
câu quá xa so với câu hỏi đặt ra, khi đó người học sẽ dễ dàng nhận dạng
ngay, làm cho câu kém hiệu quả.
Trong một bài các câu trắc nghiệm phải độc lập với nhau, kết quả câu
trắc nghiệm này không ảnh hưởng đến kết quả câu trắc nghiệm khác.
Phần trả lời các câu trắc nghiệm phải đồng nhất về mặt nội dung và
hình thức như từ ngữ, con số, mệnh đề…
Đặt các mồi nhử (hay câu nhiễu) phải làm sao cho khả năng phân tích
câu trả lời của từng trình độ người học rơi vào đúng từng tình huống các mồi
nhử đặt ra, để khi đó người học nào nắm vững vấn đề thì mới chọn được câu
trả lời đúng nhất.
3. LOẠI GHÉP HỢP (ĐỐI CHIẾU CẶP ĐÔI) (MATCHING)
Loại này là một dạng đặc biệt của trắc nghiệm nhiều lựa chọn. Đòi hỏi
người học phải ghép đúng từng cặp nhóm từ ở hai cột với nhau sao cho phù
hợp về nội dung.
Hai tập hợp dữ kiện xếp thành hai cột có số lượng các phần tử không
bằng nhau. Các phần tử ở cột bên trái là những phần tử để hỏi, còn các phần
tử ở cột bên phải là yếu tố để lựa chọn. Thông thường số lượng ở phần tử cột
bên phải bao giờ cũng nhiều hơn số lượng phần tử ở cột bên trái.
Loại trắc nghiệm này thường dùng để kiểm tra sự hiểu biết của người
học về thuật ngữ, định nghĩa, ký hiệu, hình dáng…
3.1. Ưu, nhược điểm của loại ghép hợp:
* Ưu điểm:
- Loại ghép hợp có thể xem là một dạng đặc biệt của trắc nghiệm lựa
chọn. Trắc nghiệm lựa chọn có yếu tố hỏi tương ứng với yếu tố trả lời. Còn
loại ghép hợp có nhiều yếu tố hỏi tương ứng với nhiểu yếu tố trả lời.
- Dùng để khảo sát sự hiểu biết của người học về các thuật ngữ, khả
năng quan sát, các khái niệm và hình ảnh.
- Đánh giá khả năng liên kết các tập hợp kiến thức của người học về
mối liên hệ giữa các sự kiện.
- Xác suất may rủi để trả lời loại câu ghép hợp là 50%.
* Nhược điểm:
- Chỉ khảo sát được những vấn đề lẻ tẻ, đòi hỏi người học vận dụng trí
nhớ nhiều.
- Khảo sát bằng trắc nghiệm ghép hợp phải có nhiều nội dung và nhiều
bài học kế tiếp nhau.
3.2. Cách thức soạn thảo:
Một phần tử ở cột bên trái chỉ ghép với một phần tử ở cột bên phải.
Tránh một phần tử ở cột bên trái ghép được với nhiều phần tử ở cột bên phải
hay ngược lại.
Nội dung của cột câu hỏi cũng như cột lựa chọn không nên quá dài,
nên thuộc cùng một loại và có liên quan với nhau.
Các phần tử ở cột lựa chọn bên phải có số lượng nhiều hơn các phần
tử ở cột bên trái để tránh sự đoán mò.
4. LOẠI ĐIỀN KHUYẾT (COMPLETION)
Loại này có thể có hai dạng, chúng có thể là những câu hỏi với giải đáp
ngắn, hay cũng có thể gồm những câu phát biểu với một hay nhiều chỗ để
trống mà người học phải điền vào bằng một từ hay một nhóm từ ngắn hay
công thức hay số… cho đúng với nội dung câu hỏi.
Loại này thường được dùng để kiểm tra khả năng ghi nhớ các khái
niệm, thuật ngữ, tên người, công thức…
4.1. Ưu, nhược điểm của trắc nghiệm điền khuyết:
* Ưu điểm:
- Loại điền khuyết đòi hỏi mức độ tái hiện cao, người học không thể
đoán mò. Tỉ lệ may rủi trả lời đúng không có.
- Loại điền khuyết thường dùng để kiểm tra trí nhớ các khái niệm, thuật
ngữ, tên người, địa danh, ký hiệu, công thức, số liệu, dữ kiện, hiện tượng…
- Dễ soạn.
- Đôi khi trắc nghiệm điền khuyết là biến thể của câu hỏi ngắn hoặc là
phần gốc của trắc nghiệm lựa chọn, có dạng câu lửng.
* Nhược điểm:
- Chỉ kiểm tra được những kiến thức rời rạc, không khảo sát được khả
năng tổng hợp của người học.
- Khó chấm bài hơn và tốn thời gian chấm hơn.
- Không thể khảo sát hết chương trình học.
- Không thể dùng bảng đục lỗ hoặc dùng máy để chấm.
4.2. Cách thức soạn thảo:
Không nên chừa nhiều khoảng trống trong một câu và khoảng trống
nên đặt ở cuối câu.
Mỗi khoảng trống chỉ có một câu trả lời đúng nhất thôi.
Chỗ điền khuyết phải là yếu tố chính, không nên hỏi, điền những chi tiết
vụn vặt.
Câu trả lời điền vào rất ngắn và tiêu chuẩn đúng hay sai rõ ràng.
Bài 6. SOẠN THẢO BÀI TRẮC NGHIỆM KHÁCH QUAN
CÁC BƯỚC CẦN THỰC HIỆN
1. Lập kế hoạch cho bài trắc nghiệm:
- Phác thảo nội dung môn học được xem xét như là cơ sở để viết bài
trắc nghiệm.
- Xác định kết quả học tập cần được đo bằng trắc nghiệm.
- Chuẩn bị bảng quy định (nội dung và mục tiêu) của bài trắc nghiệm.
- Chọn loại câu hỏi trắc nghiệm thích hợp cho việc đánh giá kết quả học
tập được tóm tắt trong bảng quy định.
2. Chuẩn bị viết các bài trắc nghiệm:
- Viết câu trắc nghiệm theo các nguyên tắc xây dựng các loại được
chọn.
- Chọn câu hỏi được đưa vào bài trắc nghiệm theo bảng quy định.
- Xem xét và chỉnh sửa các câu hỏi theo hướng dẫn.
- Sắp xếp các câu hỏi quyết định: a) sắp theo nhóm các câu hỏi, b) thứ
tự độ khó các câu hỏi theo nhóm, c) thứ tự theo nội dung các câu hỏi theo
nhóm.
- Chuẩn bị các hướng dẫn cho các bài trắc nghiệm, nếu cần thiết,
chuẩn bị các hướng dẫn cho những loại câu hỏi khác nhau (ví dụ như, loại
câu đối chiếu cặp đôi), hoặc cho các phần của bài trắc nghiệm (ví dụ như,
hình thức phủ định của loại câu trả lời đúng nhất).
- Quyết định phương pháp cho điểm.
3. Phân tích và sửa các bài trắc nghiệm:
- Thực hiện việc phân tích trắc nghiệm để xác định độ khó, độ phân
cách và tính tin cậy.
- Lưu trữ, sửa đổi khi cần thiết, hoặc hủy bỏ câu hỏi trên cơ sở kết quả
phân tích.
- Chỉnh sửa bài trắc nghiệm như một tổng thể, nếu cần thiết.
Chuẩn bị trắc nghiệm
Các bước đầu tiên trong trắc nghiệm là cần phải xác định bạn đang cố
gắng để đo lường cái gì. Khi quyết định này được thực hiện và ngay sau khi
nó được đưa ra bạn có thể quyết định những loại trắc nghiệm sử dụng.
A. NHỮNG QUY ĐỊNH CHO VIỆC SOẠN THẢO CÂU HỎI NHIỀU LỰA CHỌN
1. Thiết kế mỗi câu hỏi để đo kết quả học tập quan trọng.
2. Trình bày từng vấn đề, theo quy định rõ ràng trong phần gốc của câu
hỏi.
3. Viết phần gốc của câu hỏi bằng ngôn ngữ đơn giản, rõ ràng.
4. Dùng từ càng chính xác càng tốt trong phần gốc của câu trắc
nghiệm.
5. Viết phần gốc của câu hỏi dưới thể xác định ở bất cứ nơi nào trong
bài trắc nghiệm.
6. Làm rõ việc sử dụng từ phủ định khi nó được sử dụng trong phần
gốc của câu hỏi.
7. Hãy làm cho người học biết rằng trả lời theo dự định là đúng hay câu
đúng nhất.
8. Làm cho tất cả các lựa chọn ở phần trả lời phù hợp về mặt ngữ pháp
với phần gốc của câu hỏi và tương đương về mặt hình thức.
9. Tránh những gợi ý bằng lời giúp cho người học lựa chọn câu trả lời
đúng hoặc để loại bỏ trả lời khác không đúng như:
- Tính tương tự của cách dùng từ ở cả phần gốc và những câu trả lời
đúng là một trong những gợi ý rõ ràng. Những từ chính trong phần gốc có thể
được lặp đi lặp lại theo nguyên văn một cách vô ý trong câu trả lời đúng, từ
đồng nghĩa có thể được sử dụng, hoặc các từ đơn giản đồng âm hoặc trông
giống nhau.
- Viết câu trả lời đúng bằng ngôn ngữ sách giáo khoa hay đoạn ngữ
tương tự có thể làm cho người học lựa chọn trả lời đó bởi vì nó trông có vẻ
hay hơn so với các lựa chọn khác, hoặc bởi vì người học nhớ man mán đã
nhìn thấy nó trước đây.
- Viết câu trả lời đúng với nhiều chi tiết hơn có thể cung cấp một gợi ý.
Ngoài ra, khi các câu trả lời được bổ sung bằng nhiều từ có liên quan với câu
thường là câu đúng (ví dụ: đôi khi, có thể, thông thường), nó có nhiều khả
năng được chọn.
- Đưa các thuật ngữ mang tính tuyệt đối trong mồi nhử giúp người học
loại bỏ chúng như câu trả lời có thể được chọn, bởi vì những thuật ngữ như
thế thông thường có liên quan với các câu sai (ví dụ như luôn luôn, không
bao giờ, tất cả, không một ai, chỉ). Điều này làm cho các câu trả lời đúng rõ
ràng hơn hoặc ít nhất là làm tăng cơ may đoán ra nó.
- Đưa hai trả lời hoàn toàn có ý giống nhau, làm cho khả năng loại bỏ
những trả lời khác, do một trong hai trả lời rõ ràng chắc chắn là câu trả lời
đúng.
- Đưa hai trả lời có cùng một ý nghĩa làm cho khả năng loại bỏ chúng
như là câu trả lời có thể được chọn. Nếu hai lựa chọn trả lời có cùng một ý
nghĩa và chỉ có một trả lời được lựa chọn, điều này khá rõ ràng rằng cả hai
câu đó là không đúng.
10. Làm cho các mồi nhử hợp lý và hấp dẫn đối với dạng tương tự
- Sử dụng khái niệm thông thường sai hoặc các lỗi phổ biến của người
học như là những mồi nhử.
- Viết các lựa chọn bằng ngôn ngữ của người học.
- Sử dụng các từ nghe có vẻ hay (ví dụ, chính xác, quan trọng,…) trong
mồi nhử, cũng như trong các câu trả lời đúng.
- Viết các mồi nhử tương tự với câu trả lời đúng với cách dùng từ dài
bằng nhau phức tạp ngang nhau.
11. Thay đổi độ dài tương đối của câu trả lời đúng để loại bỏ độ dài như
là một gợi ý.
12. Tránh sử dụng đáp án “tất cả các trả lời trên đều” và “không có
trường hợp nào ở trên” một cách thận trọng.
13. Sắp xếp vị trí của các câu trả lời đúng một cách ngẫu nhiên.
14. Kiểm soát độ khó của câu trắc nghiệm bằng cách thay đổi các vấn
đề trong các phần gốc hoặc bằng cách thay đổi các lựa chọn.
15. Hãy chắc chắn mỗi câu hỏi độc lập với câu hỏi khác trong bài trắc
nghiệm.
16. Sử dụng ước tính thời gian hiệu quả.
B. MỘT SỐ Ý KIẾN VỀ CÂU TRẮC NGHIỆM NHIỀU LỰA CHỌN
1. Ưu điểm
* Về định lượng
- Các câu nhiều lựa chọn đóng góp vào việc cải thiện tính tin cậy và
tính giá trị của một bài kiểm tra.
- Các câu nhiều lựa chọn này là phương tiện để thu thập và sửa chữa
một khối lượng tri thức lớn trong khoảng thời gian ngắn.
* Về định tính
- Các câu nhiều lựa chọn cho phép đánh giá kết quả học tập một cách
hệ thống, chính xác ở mức cao.
- Câu hỏi nhiều lựa chọn cho phép đưa ra các yêu cầu chính xác về
học thuật.
Thực tế, người học không thể che dấu được các lỗ hổng trong kiến
thức khi trả lời các câu hỏi mang tính chất học thuộc lòng. Đối với các câu hỏi
luận đề về tri thức học thuộc lòng, người học có thể tránh nói những phần
mình chưa nắm kỹ bằng cách nói sâu những phần mình biết rõ nhất.
- Các câu nhiều lựa chọn đảm bảo tính khách quan, rõ ràng trong việc
chấm bài.
Thực tế, cũng như các quy trình đánh giá được định nghĩa ở phần
trước, sự không minh bạch trong quá trình chấm bài sẽ bị loại bỏ.
Tính xúc tích của các số thứ tự của các lựa chon cho phép phân tích
kết quả học tập một cách khái quát và mang tính tự điều chỉnh.
Một chữ hoặc con số được mã hóa cho phép giáo viên nhận ra một
cách khái quát câu trả lời của từng người học đối với một câu hỏi nhiều lựa
chọn hỏi về tri thức được mở rộng trong bài giảng.
2. Nhược điểm cơ bản của các câu hỏi nhiều lựa chọn
- Các câu nhiều lựa chọn không thể đánh giá một số kỹ năng như là
trình bày bài một cách sáng tạo, khả năng trình bày và viết ra những điều
người học suy nghĩ, tìm ra những lựa chọn trả lời mới và thậm chí khả năng
tự viết lại những điều trong trí nhớ có liên quan đến bài kiểm tra.
- Đưa ra những lựa chọn sai sẽ ảnh hưởng không tích cực đến người
học trong tương lai do các lỗi sẽ đọng lại trong trí nhớ của các người học.
(Hiện nay những nghiên cứu khoa học đã chứng minh e ngại này không có cơ
sở).
- Tầm nhận thức bị hạn chế:
Chúng ta có thể lo ngại rằng các câu nhiều lựa chọn sẽ làm đơn giản
hoá “thế giới quan” của người học, thu về ở dạng như một sơ đồ, và do đó
đồng nhất hóa các cá thể với nhau.
Các nhược điểm khác:
- Công việc thực hiện một câu hỏi nhiều lựa chọn:
Để xây dựng một câu nhiều lựa chọn, giáo viên sử dụng những lỗi mà
các người học thường mắc phải. Việc xây dựng một câu nhiều lựa chọn đòi
hỏi phải có một khả năng thực sự dựa trên sự dày dạn kinh nghiệm sư phạm.
Một câu hỏi nhiều lựa chọn khi biên soạn lần đầu tiên cần phải được
thử nghiệm trước khi đem ra sử dụng. Trong quá trình thử nghiệm này, các
câu trả lời được phân tích theo các mô hình, các công thức và các quy trình
nghiêm ngặt. Tuy nhiên, trong các kỳ thi đòi hỏi phải giữ bí mật bài thi thì việc
thử nghiệm các câu nhiều lựa chọn sẽ gặp trở ngại. Đây là một nhược điểm
khi sử dụng loại câu hỏi này.
- Không thể truyền đạt bằng lời cho người học nội dung một câu hỏi
nhiều lựa chọn:
Về nguyên tắc, một câu hỏi nhiều lựa chọn gồm có phần hỏi và các lựa
chọn đề ra đôi khi chỉ sai khác nhau một hoặc hai yếu tố nào đó. Người học
phải có khả năng phân tích các dữ kiện này theo ý của mình. Hơn nữa, các
số ký hiệu các lựa chọn trả lời có tính chất hoàn toàn ước lệ và do đó sẽ trở
nên vô lý nếu bắt người học phải nhớ những con số này. Chính vì hai lý do
trên mà không thể trình bày bằng lời câu nhiều lựa chọn ngoại trừ những
trường hợp đặt biệt.
- Xu hướng đưa ra các câu hỏi chi tiết:
Noizet và Caverni (1978, tr.155) cho rằng các câu hỏi phải có tính “chắc
chắn” tức là không dành chỗ cho nhiều ý kiến khác nhau.
Người viết câu nhiều lựa chọn theo cách chia nhỏ kiến thức nhằm mục
đích để tránh các yếu tố không chắc chắn. Việc đặt câu hỏi như vậy sẽ có tác
dụng gián tiếp khiến cho người học phải vận dụng trí nhớ nhiều hơn là suy
luận logic và ảnh hưởng này sẽ không thể tránh khỏi
- Người học dễ tham khảo câu trả lời của người bên cạnh:
Hai người học dưới đây quy ước với nhau từ trước khi vào phòng thi là
sẽ trao đổi với nhau qua cử chỉ: chỉ vào mũi = 1, má = 2, tóc = 3, tai = 4. Để
tránh sự gian lận này, chúng ta tìm cách “gây nhiễu” số thứ tự câu hỏi và số
thứ tự các lựa chọn trả lời. Tất cả người học đều nhận được một nội dung
các câu và các câu trả lời như nhau nhưng các câu đó đánh số khác nhau.
Sau đó chuyển các câu trả lời vào máy tính, máy tính sẽ sắp xếp lại theo một
trình tự nhất định và việc chữa các câu sẽ được thực hiện thuận lợi cho tất cả
các bài thi. Ngoài ra, còn có các phương pháp khác để “gây nhiễu”.
- Các người học có thể trả lời đúng một cách ngẫu nhiên:
Việc chọn các câu trả lời đúng một cách ngẫu nhiên rất khó phân biệt
với việc chọn câu trả lời đúng bằng thực lực. Ngược lại, ta cũng khó có thể
phân biệt được việc chọn các câu trả lời sai là do xác suất hay là lỗi cố ý.
Những quy ước cho việc soạn thảo câu hỏi “đối chiếu cặp đôi”
1. Đưa tài liệu tương tự vào câu hỏi đối chiếu cặp đôi.
2. Đặt các câu hỏi ngắn ở cột bên trái và đặt các câu trả lời về bên phải.
3. Viết số lượng các trả lời nhiều hơn hoặc ít hơn, so với câu hỏi, và đặt
câu hỏi cho phép được sử dụng nhiều lần một câu trả lời.
4. Xác định trong các hướng dẫn loại “câu đối chiếu cặp đôi” rằng mỗi
câu trả lời có thể được sử dụng một lần, nhiều lần hoặc không được dùng.
Những quy ước cho việc soạn thảo câu hỏi Đúng - Sai
1. Chỉ đưa một ý tưởng trọng tâm quan trọng vào mỗi câu.
2. Từ sử dụng trong câu cần chính xác để người đọc đánh giá được
đúng hoặc sai.
3. Nên sử dụng câu phủ định đơn và tránh sử dụng phủ định kép.
4. Câu hỏi về quan điểm cần được bổ sung nguồn của nó.
5. Hay sử dụng câu hỏi ngắn về cấu trúc ngôn ngữ đơn giản.
C. CÁC HƯỚNG DẪN ĐỂ XEM XÉT BẢN THẢO BI TRẮC NGHIỆM LẦN CUỐI CÙNG, LỰA CHỌN VÀ CHỈNH SỬA CÂU TRẮC NGHIỆM
1. Mỗi câu hỏi trắc nghiệm có đo lường một kết quả học tập quan trọng
được ghi trong bảng quy định không?
2. Mỗi câu hỏi trắc nghiệm có thích hợp với một kết quả học tập cụ thể
được đo lường không?
3. Mỗi câu hỏi trắc nghiệm có trình bày một nhiệm vụ rõ ràng không?
4. Câu hỏi trắc nghiệm có được nêu bằng ngôn ngữ đơn giản, rõ ràng
không?
5. Câu hỏi trắc nghiệm có những gợi ý không liên quan không?
6. Độ khó của câu trắc nghiệm có thích hợp đối với trình độ người học
được kiểm tra không?
7. Mỗi câu hỏi trắc nghiệm có độc lập và các câu, trong một nhóm, có
chồng chéo không?
8. Những câu hỏi trắc nghiệm trong bài kiểm tra có bao trùm nội dung
của bảng quy định hai chiều không?
Sắp xếp câu trắc nghiệm
1. Các câu hỏi trong bài trắc nghiệm cần được sắp xếp để tất cả các
câu trắc nghiệm cùng loại ở cùng nhóm với nhau.
2. Các câu hỏi trong bài trắc nghiệm cần được sắp xếp theo thứ tự khó
dần lên.
3. Đối với một số mục đích, cần phân nhóm các câu trắc nghiệm đo
lường cùng một kết quả học tập hoặc trong cùng nội dung môn học lại với
nhau.
Viết lời hướng dẫn
Các hướng dẫn cho một trắc nghiệm thành tích cần đơn giản và chính
xác nhưng chứa đựng thông tin có liên quan đến các điểm sau đây:
1. Mục đích của bài trắc nghiệm.
2. Thời gian cho phép để làm xong bài trắc nghiệm.
3. Cách ghi lại các câu trả lời.
4. Có cho phép đoán mò khi chưa chắc về câu trả lời không?
Nguồn: Giáo sư Marjorie Devine & Nevart Yaghlian
Bài 7. MỘT CÁCH VIẾT CÂU TRẮC NGHIỆM NHIỀU LỰA CHỌN
Mối quan tâm đáng trân trọng của nhiều giáo viên là họ thường nhận
nhiệm vụ soạn thảo câu trắc nghiệm nhưng họ tương đối ít được đào tạo
hoặc ít thông tin để tham khảo khi thực hiện nhiệm vụ này. Mục tiêu của bài
viết này là trình bày một số kinh nghiệm truyền thống cho việc soạn thảo các
trắc nghiệm nhiều lựa chọn, một trong những hình thức thông thường nhất
của trắc nghiệm do giáo viên soạn. Những ý kiến dưới đây có thể áp dụng
được chủ yếu cho trắc nghiệm nhiều lựa chọn đánh giá các lĩnh vực chủ đề
tương đối rộng rãi.
Trước khi tiến hành, việc thiết lập những thuật ngữ của chúng ta để
thảo luận câu trắc nghiệm nhiều lựa chọn là hữu ích. Phần gốc là câu hỏi giới
thiệu hoặc một câu chưa hoàn chỉnh bắt đầu mỗi câu và được theo sau bằng
những lựa chọn. Phần lựa chọn gồm câu trả lời - lựa chọn đúng - và mồi nhử,
câu không đúng nhưng (chúng ta hy vọng) là những lựa chọn hấp dẫn.
Mục tiêu tổng quát
Theo quy định, người ta quan tâm đến việc viết phần gốc rõ ràng và chi
li, các câu trả lời thì không lập lờ và được người học làm bài trắc nghiệm tốt
nhất chọn, và các mồi nhử là những cạnh tranh đáng tin cậy của câu trả lời
khi được chứng minh bằng tần số mà người học chọn. Sau cùng, và có lẽ là
quan trọng nhất, chúng ta cần thái độ là những câu trắc nghiệm soạn thảo
cần đuợc thử nghiệm bằng những số thống kê tiêu biểu từ các dữ liệu thực
tiễn.
Lập kế hoạch
Mục tiêu đầu tiên trong việc lập kế hoạch một bài trắc nghiệm là tóm tắt
nội dung khóa học thực sự mà trắc nghiệm đó sẽ đánh giá. Cách thuận tiện
của việc hoàn thành việc này là dành 10 phút sau giờ học để lập thành thẻ
danh mục những khái niệm quan trọng được giảng dạy trong lớp và trong bài
đọc được phân về nhà trong ngày đó. Sau này, những thẻ đó được sử dụng
như là nguồn của các câu trắc nghiệm. Dĩ nhiên, một cách tiếp cận có ý thức
hơn nhiều là việc xây dựng chính những câu trắc nghiệm sau mỗi giờ học. Ưu
điểm của cả hai cách tiếp cận này là kết quả trắc nghiệm có lẽ là cách trình
bày hoạt động khoá học tốt hơn khi trắc nghiệm được soạn thảo trước khóa
học hoặc sau khoá học, lúc chúng ta có chỉ một trí nhớ ưa thích hoặc chương
trình lạc quan để rút ra. Khi chúng ta thỏa mãn rằng chúng ta có một mô tả
chính xác lĩnh vực nội dung, thì tất cả điều còn lại là soạn thảo những câu trắc
nghiệm đại diện cho lĩnh vực nội dung cụ thể. Để soạn thảo những câu trắc
nghiệm nhiều lựa chọn hay, có ba nhiệm vụ cần được xem xét: viết phần gốc,
viết phần lựa chọn và soạn thảo câu tiếp theo. Hai nhiệm vụ đầu được bàn
luận trong bài này.
Viết phần gốc
Trước hết chúng tôi sẽ mô tả một số quy định căn bản cho việc soạn
thảo phần gốc câu trắc nghiệm nhiều lựa chọn vì mặc dù không cần thiết, một
cách tiêu biểu chúng được viết trước phần lựa chọn.
1. Trước khi viết phần gốc, hãy xác định một điểm chính cần trắc
nghiệm trong câu đó. Một cách tổng quát, phần gốc nên trình bày một vấn đề,
mặc dù giải quyết vấn đề đó có thể đòi hỏi nhiều bước.
2. Xây dựng phần gốc là câu chưa hoàn chỉnh hoặc là một câu hỏi trực
tiếp, tránh những câu rập khuôn để không những câu trả lời theo lối học vẹt.
Ví dụ:
- Cách mạng tháng Tám của Việt Nam diễn ra vào ngày nào?
Hãy sửa cách trả lời những câu hỏi này để chúng được trả lời ít nhiều
dựa trên sự hiểu biết chứ không phải dựa vào việc nhận ra câu quen thuộc.
3. Tránh đưa những từ không diễn đạt gì thêm để giúp cho việc lựa
chọn câu trả lời. Thường một câu giới thiệu được thêm vào để làm rõ hơn
tính phù hợp hoặc tính ý nghĩa của một câu trắc nghiệm nhưng không ảnh
hưởng ý nghĩa của vấn đề giải quyết trong câu trắc nghiệm. Thông thường,
những đoạn ngữ dư thừa cần phải bỏ đi. Ví dụ, hãy xem xét câu:
- Cờ của nước Mỹ có ba màu. Một trong những màu đó là (1) đỏ (2)
xanh (đen).
Với câu:
- Một trong những màu của cờ nước Mỹ là (1) đỏ (2) xanh (đen).
Đặc biệt, tài liệu không phù hợp không được sử dụng để làm cho câu
trả lời kém rõ ràng. Điều này có khuynh hướng đặt quá cao tầm quan trọng
của việc đọc hiểu như là yếu tố quyết định câu lựa chọn đúng.
4. Hãy đưa càng nhiều thông tin vào phần gốc và càng ít thông tin vào
phần lựa chọn càng tốt. Ví dụ: Nếu điểm chính của câu trắc nghiệm có liên
quan đến thuật ngữ có định nghĩa, cách thức phù hợp hơn là trình bày định
nghĩa bằng phần gốc và nhiều thuật ngữ trong phần lựa chọn hơn là trình bày
thuật ngữ trong phần gốc và nhiều định nghĩa trong phần lựa chọn.
5. Hạn chế sử dụng phủ định trong phần gốc. Phủ định trong phần gốc
thường đòi hỏi câu trả lời là một câu sai. Do người học dường như có thói
quen tìm câu đúng, điều này có thể đưa ra một sai lệch không mong muốn.
6. Tránh những gợi ý không phù hợp với lựa chọn đúng. Ví dụ: Cấu trúc
nghữ pháp có thể dẫn người học bỏ những lựa chọn sai về mặt ngữ pháp khi
phần gốc xác định. Có lẽ thông thường và tế nhị hơn là vấn đề của những
yếu tố chung trong phần gốc và trong phần trả lời.
Cách viết phần lựa chọn
Theo sau phần hướng dẫn viết phần gốc câu trắc nghiệm, nhiệm vụ
khó khăn hơn của việc trình bày bản thân những lựa chọn. Những quy tắc
dưới đây không phải là đơn giản hóa công việc này càng nhiều càng tốt mà
chúng là hướng dẫn những cố gắng sáng tạo của chúng ta.
1. Hãy thỏa mãn với ba hoặc bốn lựa chọn có cấu trúc tốt. Thông
thường, việc cải tiến nhỏ đối với một câu trắc nghiệm do lựa chọn thứ năm
khó soạn không tương xứng với công sức để soạn thảo nó. Thật ra, những
câu khác đều giống nhau, một trắc nghiệm gồm mười câu mỗi câu bốn lựa
chọn có vẻ tốt hơn một trắc nghiệm có chín câu mỗi câu năm lựa chọn.
2. Soạn thảo mồi nhử cần cân đối theo chiều dài, tính phức tạp và hình
thức ngữ pháp đối với câu trả lời, tránh sử dụng từ luôn luôn”, “không bao
giớ” và “tất cả”. Kết hợp với quy tắc này tránh một số nguồn thông thường
của gợi ý gây sai lệch. Ví dụ, đôi khi bản thân chúng ta nhận thấy việc tăng
chiều dài và tính cụ thể của một trả lời (tương đối với mồi nhử) để bảo đảm
tính trung thực của nó. Tuy nhiên, điều này trở thành một gợi ý dễ xác định
câu đúng hoặc sai đối với người học thông thái khi làm trắc nghiệm. Liên
quan với vấn đề này là câu hỏi có hay không việc người soạn trắc nghiệm
nên lợi dụng những loại gợi ý này để soạn thảo những mồi nhử hấp dẫn hơn.
Cắc chắn là không! Số người học chọn một mồi nhử chỉ tùy thuộc vào sự
khiếm khuyết trong lĩnh vực nội dung mà câu trắc nghiệm nhằm đến và không
phải tùy thuộc vào sự sai lệch của gợi ý hoặc sự khác biệt về đọc hiểu “ủng
hộ” mồi nhử.
3. Cần tránh những lựa chọn như “không có câu nào ở trên”, “cả A và B
ở trên”, “tất cả các câu trên”,. khi người học được hướng dẫn để lựa chọn
“câu trả lời đúng nhất” ngầm hiểu rằng những lựa chọn thay đổi theo mức độ
đúng. Nói cách khác, “không có câu nào ở trên” thì chấp nhận được khi câu
hỏi mang tính sự kiện và có lẽ cần thiết khi sự tính toán đưa ra câu trả lời. “tất
cả các câu trên” không bao giờ cần, khi một mồi nhử được nhận ra xóa bỏ nó
và hai trả lời được nhận ra xác định nó.
4. Sau khi các lựa chọn được soạn thảo, hãy thay đổi vị trí câu trả lời
theo lối ngẫu nhiên. Có nhiều phương pháp để thực hiện việc này như tung
đồng xu, dùng bảng số ngẫu nhiên,… Hơn nữa, khi người soạn thảo trắc
nghiệm có ý thức ngẫu nhiên hóa vị trí câu trả lời đúng, cần thông báo cho
người học biết điều đó. (Những học viên làm trắc nghiệm thành thạo hiểu
rằng, đối với một số giáo viên, những lựa chọn đầu tiên hiếm khi là câu trả
lời).
5. Nếu có thể, hãy nhờ đồng nghiệp có chuyên môn trong lĩnh vực nội
dung của bài thi coi lại những câu trắc nghiệm để tìm ra những chỗ mơ hồ, dư
thừa hoặc cấu trúc câu khó. Sau khi hoàn chỉnh câu trắc nghiệm chúng ta
thường cảm thấy nhẹ nhỏm cho đến nỗi chúng ta bị mê hoặc để coi công việc
đã hoàn chỉnh và mỗi câu trắc nghiệm dưới dạng hoàn chỉnh tuyệt đối. Tuy
nhiên, việc cải tiến nguồn câu trắc nghiệm và bài trắc nghiệm thì có sẵn, có
nghĩa là, phân tích thống kê câu trả lời của thí sinh.
Tác giả: Jerard Kehoe Viện Bách khoa và Đại học tiểu Bang Virginia.
Bài này được soạn lại từ cuốn “Testing Memo 4: Constructing Multiple -
Choice Tests - Part I, “Office of Measurement and Research Services,
Virginia Polytechnic Institute and State University, Blacksburg, VA 24060.
Tài liệu tham khảo
Airasian P. (1994), Classroom Assessment, Second Edition, NY:
McGraw-Hill.
Cangelosi J. (1990), Designing Tests for Evaluating student
Achievement, NY: Addison Wellesley.
Grunlund N (1993), How to make achievementtests and assessments,
5th edition, NY: Allen and Bacon.
Haladyna T.M. & Downing, S.M. (1989), Validity of a Taxonomy of
Multiple - Choice Item-Writing Rules, Applied Measurement in Education, 2
(1), 51-78.
Bài 8. PHÂN TÍCH CÂU TRẮC NGHIỆM
1. ĐÁNH GIÁ ĐO LƯỜNG THÀNH QUẢ HỌC TẬP
Khi đánh giá một bài trắc nghiệm thì có hai yếu tố quan trọng được xét
đến là độ tin cậy và tính giá trị của bài trắc nghiệm. Sự ước lượng về đặc
trưng này thường được nêu ra như là các hệ số tương quan.
1.1. Độ tin cậy của bài trắc nghiệm (Reliability)
Trong lĩnh vực đo lường thành quả học tập, khái niệm tính tin cậy được
nêu ra đầu tiên, bởi vì người ta rất cần biết về mức độ tin tưởng vào dụng cụ
để đo. Trong học tập khi dùng một bài trắc nghiệm để đo sự tiếp thu bài học
của học sinh, trước hết ta cần xem bài trắc nghiệm ấy có đáng tin cậy hay
không.
Theo tác giả Dương Thiệu Tống: “Một bài trắc nghiệm được xem là
đáng tin cậy khi nó cho ra những kết quả có tính vững chãi, ổn định”(1). Điều
này có nghĩa là, nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh vẫn sẽ
giữ được thứ hạng tương đối của mình trong nhóm. Thực chất, có thể hiểu về
tính tin cậy của bài trắc nghiệm như sau: với cùng một bài trắc nghiệm, điểm
số của học sinh qua mỗi lần làm bài ấy có thể thay đổi: tăng lên hay giảm đi.
Nhưng nếu là một bài trắc nghiệm đáng tin cậy thì sự thay đổi ấy không
nhiều, đến nỗi gây ra những xáo trộn về thứ bậc của mỗi học sinh đã được
xác lập sau lần làm bài đầu tiên (nghĩa là một học sinh đã đạt được điểm cao
bây giờ lại có điểm thấp hoặc một học sinh đã đạt trung bình thì bây giờ lại có
điểm cao…)
Nói chung, tính tin cậy được hiểu là sự ổn định thứ bậc các điểm số
của học sinh, nếu cho thực hiện trắc nghiệm nhiều lần.
Tính tin cậy được đo bằng hệ số tin cậy. Theo tác giả Dương Thiệu
Tống, hệ số tin cậy là một “định nghĩa vận toán”(2) của tính tin cậy.
Hệ số tin cậy: đối với một bài trắc nghiệm, được tính theo hệ số tương
quan giữa điểm số của học sinh và các điểm số khác cũng của những học
sinh ấy thu được độc lập từ một bài trắc nghiệm khác tương đương.
Đối với một bài trắc nghiệm, hệ số tin cậy được tính theo phương pháp
phân đôi bài trắc nghiệm (phân đôi thành hai bài trắc nghiệm ngắn) mang
những câu hỏi số chẵn Y và những câu hỏi số lẻ X. Cụ thể công thức tính hệ
số tương quan Pearson giữa hai đại lượng X và Y như sau:
Trong đó:
X: là điểm các câu lẻ của bài trắc nghiệm của mỗi học sinh.
Tổng X: là tổng điểm các câu lẻ của tất cả các bài trắc nghiệm của học
sinh.
Y: là điểm các câu chẵn của bài trắc nghiệm của mỗi học sinh.
Tổng Y: là tổng điểm các câu chẵn của tất cả các bài trắc nghiệm của
học sinh.
N: là số học sinh làm bài trắc nghiệm.
Từ rxy của SPEARMAN-BROWN đưa ra công thức tính hệ số tin cậy r
của bài trắc nghiệm như sau:
r = (2rXY) / (1 + rXY)
Với: rXY là hệ số tương quan Pearson của bài trắc nghiệm chia đôi.
Tuy nhiên, với sự hỗ trợ của máy tính ta còn có thể dùng công thức
Kuder - Richardson 20 được sử dụng khá phổ biến để tính hệ số tin cậy của
bài trắc nghiệm là:
r = [K / (K – 1)][1 – (pq / s2)]
Với:
K: là số câu hỏi trong bài trắc nghiệm.
p: là tỉ lệ các câu trả lời đúng cho một câu hỏi.
q:là tỉ lệ các câu trả lòi sai cho một câu hỏi q =1- p.
xích ma: biến lượng của điểm số trên bài trắc nghiệm.
Công thức trên tính mức tin cậy căn cứ vào độ khó của câu hỏi hay là tỉ
lệ trả lời đúng cho từng câu hỏi. Công thức này chỉ áp dụng với những bài
trắc nghiệm trong mỗi câu đúng được tính 1 điểm và các câu sai là 0 điểm.
* Ý nghĩa của độ tin cậy trong bài trắc nghiệm:
Chiều dài của bài trắc nghiệm (số lượng câu hỏi) cũng ảnh hưởng đến
tính tin cậy. Theo các chuyên gia về trắc nghiệm thì một bài trắc nghiệm càng
dài thì tính tin cậy của nó càng được nâng cao và ngược lại.
Tính tin cậy của một bài trắc nghiệm tùy thuộc vào các yếu tố như sự
may rủi do phỏng đoán, độ khó của bài trắc nghiệm, việc chọn mẫu và độ dài
các câu hỏi.
Độ khó của một bài trắc nghiệm sẽ ảnh hưởng đến độ tin cậy của nó.
Nếu ta cho học sinh làm một bài trắc nghiệm dễ, các điểm số có khuynh
hướng tập trung vào đầu mút cao của thang điểm, khi đó sẽ khó phân biệt
được trình độ khác nhau của học sinh. Ngược lại, nếu đưa ra một bài trắc
nghiệm quá khó, các điểm số lại tập trung vào đầu mút thấp của thang điểm,
khi đó, sẽ không thấy được tính chất về trình độ hiểu biết của học sinh.
* Các biện pháp để có thể tăng hệ số tin cậy cho một bài trắc nghiệm:
Chọn những câu trắc nghiệm đồng đều về nội dung.
Tăng số lượng câu hỏi của bài trắc nghiệm, khi đó có thể khảo sát
được lượng kiến thức lớn của học sinh.
Chọn những câu trắc nghiệm có độ phân cách lớn.
Nên chọn những câu trắc nghiệm có độ khó trung bình từ 0.25 - 0.75.
Bài thi trắc nghiệm được ra cho các học sinh ở nhiều mức độ khác
nhau về trình độ. Mức phân tán điểm số (độ lệch tiêu chuẩn) càng lớn thì hệ
số tin cậy càng cao.
1.2. Tính giá trị của bài trắc nghiệm:
Một đặc tính quan trọng thứ hai của trắc nghiệm là giá trị của bài trắc
nghiệm. Vì một bài trắc nghiệm có giá trị thì thường đáng tin cậy nhưng không
phải bài trắc nghiệm nào đáng tin cậy cũng có giá trị.
Tính tin cậy và giá trị khác nhau ở chỗ tính tin cậy liên quan đến tính
vững chãi của điểm, còn tính giá trị liên quan đến mục đích của sự đo lường.
Tính giá trị liên quan đến mức độ đo lường của bài trắc nghiệm theo
mục đích mà ta muốn khảo sát trên một nhóm người. Khái niệm giá trị có ý
nghĩa khi ta xác định rõ: “ta muốn đo lường cái gì và với nhóm người nào”.
Tóm lại, một bài trắc nghiệm có giá trị khi nó đáp ứng được mục đích
đề ra, nó phải đo lường đúng loại thành quả học tập mà ta muốn khảo sát.
Tính giá trị của bài trắc nghiệm thành quả học tập thông thường được
phân loại như sau:
Giá trị nội dung:
Là mức độ “bao trùm” được nội dung môn học, bài học. Một bài luận đề
nhằm đo lường kiến thức môn học có thể kém giá trị nội dung vì nó giới hạn
bởi số câu hỏi quá ít. Một bài trắc nghiệm có thể “bao trùm” nhiều nội dung
môn học vì có nhiều câu hỏi, nhưng nó vẫn có thể kém giá trị vì chỉ chú trọng
vào một phần nội dung nào đó mà bỏ qua các phần nội dung khác.
Để đảm bảo cho giá trị nội dung của bài trắc nghiêm, người soạn thảo
cần phác họa trước một dàn bài trắc nghiệm trong đó quy định một cách khá
chi tiết nội dung của giáo trình và các mục tiêu. (Xem Phụ Lục 3, [t.10]).
Giá trị tiên đoán:
Giá trị tiên đoán nói lên mối quan hệ giữa điểm số bài trắc nghiệm với
một tiêu chí khác căn cứ vào khả năng (hay thành quả học tập) ở thời điểm
tương lai.
Giá trị mục tiêu:
Bài trắc nghiệm có giá trị mục tiêu khi khảo sát mức độ và năng lực
nhận thức của học sinh về nội dung học tập. Năng lực nhận thức đó chính là
hiểu, nhớ, vận dụng, phân tích, tổng hợp, so sánh…
Trong các loại giá trị trên, người nghiên cứu đề cập trong đề tài là giá trị
nội dung (Content Validity) là mức độ bao trùm được nội dung bài học và môn
học. Để đảm bảo cho giá trị nội dung bài trắc nghiệm, người nghiên cứu lập
ra một dàn bài trắc nghiệm trong đó có quy định khá chi tiết nội dung của
chương trình và các mục tiêu.
(Xem Phụ lục 3: Bảng phân tích nội dung, xác lập mục tiêu, kiểm tra
đánh giá).
1.3. Phân tích câu trắc nghiệm:
Phân tích câu trắc nghiệm trong một bài trắc nghiệm là một việc làm rất
cần thiết giúp người xây dựng bài trắc nghiệm:
Xác định được độ khó của câu trắc nghiệm.
Xác định được độ phân cách của câu trắc nghiệm.
Tính mồi nhử (câu nhiễu) trong câu trắc nghiệm.
Từ đó, người xây dựng bài trắc nghiệm mới biết được lý do vì sao câu
trắc nghiệm này khó, câu kia dễ, không hiệu quả để khi đó cần sửa đổi như
thế nào cho tốt hơn.
* Độ khó của câu trắc nghiệm:
Độ khó của câu trắc nghiệm là tỉ lệ phần trăm số học sinh trả lời đúng
câu trắc nghiệm ấy.
Công thức tính độ khó của câu trắc nghiệm:
Độ khó p của câu trắc nghiệm thứ
i = (Tổng số người trả lời đúng câu i) / (Tổng số người làm bài
trắc nghiệm)
Hoặc nếu gọi Mean (câu i) là điểm trung bình của câu thứ I, ta có:
Tổng số người trả lời đúng câu i = tổng điểm câu i
Tổng số người làm bài trắc nghiệm = số bài trắc nghiệm
Vậy Mean (câu i) = (Tổng điểm câu i) / (Số bài trắc nghiệm)
Theo cách tính này, giá trị độ khó có ý nghĩa như sau:
+ Độ khó = 1: câu trắc nghiệm quá dễ.
+ Độ khó = 0: câu trắc nghiệm quá khó.
+ Độ khó câu trắc nghiệm thay đổi theo trình độ của lớp học sinh.
Sau khi tính được độ khó câu trắc nghiệm, ta phải xét đến câu trắc
nghiệm này là khó hay dễ đối với học sinh và với tiêu chuẩn nào thì câu thứ i
vừa sức với học sinh.
Nếu độ khó của từng câu nằm trong khoảng:
Mean 0.19 thì kết luận: câu trắc nghiệm quá khó.
[0.20 - 0.40] thì kết luận: câu trắc nghiệm khó.
[0.41 - 0.70] thì kết luận: câu trắc nghiệm trung bình.
[0.71 - 0.90] thì kết luận: câu trắc nghiệm dễ.
Mean > 0.9 thì kết luận: câu trắc nghiệm quá dễ.
Độ khó vừa phải của câu trắc nghiệm:
Mỗi câu trắc nghiệm có độ khó vừa phải là câu có 50% số học sinh làm
đúng câu ấy và 50% làm sai, nhưng còn tùy thuộc vào từng loại câu trắc
nghiệm.
Một câu trắc nghiệm có độ khó vừa phải bằng số trung bình cộng của tỷ
lệ may rủi kỳ vọng (Expected Chance Proportion) và 100%. Tỉ lệ may rủi kỳ
vọng này thay đổi theo loại câu trắc nghiệm.
Cụ thể với các loại trắc nghiệm như sau:
Độ khó vừa phải của câu trắc nghiệm loại đúng - sai là trung điểm giữa
tỷ lệ may rủi kỳ vọng và 100%.
Loại này có tỷ lệ may rủi kỳ vọng là 50%.
Tức là: (100 + 50)/2 x% = 75%.
Vậy nếu có 75% học sinh trả lời đúng câu ấy thì câu ấy có độ khó vừa
phải.
Độ khó vừa phải của câu trắc nghiệm loại nhiều lựa chọn:
Với năm lựa chọn có tỷ lệ may rủi kỳ vọng là 20% thì:
Độ khó vừa phải là: (100 + 20)/2 X% = 60%.
Với bốn lựa chọn có tỷ lệ may rủi kỳ vọng là 25% thì:
Độ khó vừa phải là: (100 + 25)/ X2% = 62.5%.
Độ khó vừa phải của câu trắc nghiệm loại điền khuyết và đối chiếu cặp
đôi là trung điểm giữa tỷ lệ may rủi kỳ vọng và 100%.
Loại này có tỷ lệ may rủi kỳ vọng là 50%.
Tức là: (100 + 50)/2 x% = 75%.
Vậy nếu có 75% học sinh trả lời đúng câu ấy thì câu ấy có độ khó vừa
phải
Tóm lại, một bài trắc nghiệm được gọi là tốt không phải là bài trắc
nghiệm gồm toàn những câu khó hay câu dễ mà là bài trắc nghiệm gồm
những câu có mức độ khó trung bình hay là mức độ khó vừa phải.
Một bài trắc nghiệm có giá trị và đáng tin cậy thường là những bài gồm
những câu trắc nghiệm có độ khó xấp xỉ hay bằng độ khó vừa phải.
* Độ khó của bài trắc nghiệm:
Độ khó của bài trắc nghiệm phụ thuộc vào rất nhiều về trình độ kiến
thức của học sinh. Một bài trắc nghiệm có thể là dễ đối với học sinh khá giỏi,
nhưng ngược lại là khó đối với học sinh trung bình, yếu. Do đó, độ khó của
bài trắc nghiệm là tỷ lệ số giữa điểm trung bình của bài trắc nghiệm với tổng
số câu trắc nghiệm (mỗi câu trắc nghiệm được tính là 1 điểm) tỷ số này được
tính ra tỷ lệ % như sau:
Độ khó p của bài trắc nghiệm = trung bình X / K x 100%.
Vói X: điểm trung bình thực tế của bài trắc nghiệm.
K: tổng số câu trắc nghiệm (bằng điểm tối đa của bài).
Độ khó vừa phải của bài trắc nghiệm: là tỷ số giữa điểm trung bình lý
thuyết (TBLT) với điểm tối đa của bài trắc nghiệm K.
Độ khó vừa phải p của bài trắc nghiệm:
= (Trung bình lý thuyết / K) x 100%
Trong đó: Trung bình lý thuyết = (K + T) / 2
Vói K: tổng số câu trắc nghiệm.
T: điểm có được do may rủi.
Với hai thông số trên, ta có thể đánh giá độ khó của bài trắc nghiệm với
trình độ của học sinh như sau:
Nếu p = p’: bài trắc nghiệm phù hợp với trình độ học sinh,
p > p’: bài trắc nghiệm dễ so với trình độ học sinh,
p < p’: bài trắc nghiệm khó so với trình độ học sinh.
* Độ phân cách của câu trắc nghiệm:
Đó là khả năng phân biệt nhóm học sinh giỏi và nhóm học sinh kém khi
trả lời câu trắc nghiệm. Nếu một câu trắc nghiệm mà tất cả học sinh đều trả
lời đúng hoặc đều không trả lời đúng thì câu trắc nghiệm ấy không có khả
năng phân cách. Vì vậy, câu trắc nghiệm cần có độ phân cách cao.
Công thức tính độ phân cách:
Độ phân cách D = (Dg – Dk) / n
Vói: Dg: Số học sinh của nhóm giỏi trả lời đúng câu trắc nghiệm.
Dk: Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.
n: Tổng số học sinh làm bài trắc nghiệm.
Nhóm giỏi và nhóm kém được lựa chọn như sau:
Xếp đặt các bảng trả lời (phiếu làm bài) đã được chấm thứ tự các điểm
số từ cao đến thấp.
Phân chia bảng trả lời theo hai nhóm, nhóm cao gồm có xấp xỉ 27%
của nhóm có số điểm cao nhất, được gọi là nhóm giỏi và nhóm thấp gồm có
số bài tương đương 27% có điểm số thấp nhất gọi là nhóm kém.
Với cách tính theo phương pháp này là ta chỉ chọn ra 54% học sinh
trong hai nhóm, còn lại 46% học sinh có điểm ở mức trung bình không được
xét điểm.
Do đó, ngoài cách tính trên, người ta còn tính độ phân cách bằng hệ số
tương quan điểm nhị phân (Rpoint-biserial correlsion, viết tắt là Rpbis) như
sau:
Pbis = (Mp-Mq/xích ma t) x căn bậc hai pxq
Vói Mp: trung bình tổng điểm các bài làm đúng câu trắc nghiệm thứ i.
Mq: trung bình tổng điểm các bài làm sai câu trắc nghiệm thứ i.
p: tỷ lệ học sinh làm đúng câu i.
q: tỷ lệ học sinh làm sai câu i.
xích ma t: độ lệch tiêu chuẩn điểm bài trắc nghiệm.
Hai Tiến sĩ Giáo dục người Mỹ Quentin Stodola và Kalmer Stordahl
trong cuốn “Trắc nghiệm và đo lường cơ bản trong giáo dục” đã đưa ra một
thang đánh giá chỉ số phân cách như bảng dưới đây để giúp chúng ta lựa
chọn tốt các câu trắc nghiệm dùng ở lớp học.
Bảng 2: Thang đánh giá chỉ số phân cách
CHỈ SỐ D ĐÁNH GIÁ CÂU TRẮC NGHIỆM
Từ 0.4 trở lên
Từ 0.30 - 0.39
Từ 0.20 - 0.29
Dưới 0.19
Rất tốt
Khá tốt, nhưng có thể chỉnh sửa câu cho tốt hơn
Tạm được, nên hoàn chỉnh cho tốt hơn
Rất kém, cần phải chỉnh sửa
* Phân tích mồi nhử trong câu trắc nghiệm:
Ngoài việc đánh giá độ khó và độ phân cách của câu trắc nghiệm, ta có
thể làm cho câu trắc nghiệm tốt hơn bằng cách xem xét tần số của đáp án sai
trong mỗi câu hỏi.
Trở lại với phương pháp đơn giản để tính độ phân cách của trắc
nghiệm, ta chọn ra hai nhóm: 27% nhóm cao, 27% nhóm thấp, ghi tần số đáp
ứng của học sinh trong mỗi nhóm cho mỗi lựa chọn (A, B, C…) trong mỗi câu
trắc nghiệm, đồng thời ghi chỉ số khó và chỉ số phân cách cho mỗi câu trắc
nghiệm.
Chính chỉ số khó và chỉ số phân cách là những chỉ dẫn đầu tiên cho ta
biết câu trắc nghiệm nào là tốt, câu nào kém. Căn cứ vào chỉ số ấy, ta có thể
lựa chọn ra những câu trắc nghiệm để sử dụng cho bài trắc nghiệm chính
thức. Còn những câu có chỉ số khó quá thấp hay quá cao, đồng thời chỉ số
phân cách âm hoặc quá thấp là những câu kém cần phải xem xét sửa đi sửa
lại hoặc loại đi cho tốt hơn. Trong công việc xét lại này, ta cần phải xét lại toàn
bộ câu trắc nghiệm, nhất là những câu trắc nghiệm trả lời lựa chọn, trong đó
có những câu trả lời đúng và số còn lại là những mồi nhử.
Nguyên tắc cơ bản để xét tính mồi nhử là:
Với câu đúng thì số học sinh trả lời đúng của nhóm cao phải nhiều hơn
nhóm thấp.
Với mỗi câu sai thì số học sinh nhóm cao chọn phải ít hơn số học sinh
nhóm thấp.
Bảng 3: Ví dụ phân tích 1 câu trắc nghiệm số 16 trong bài TN lần I như sau:
Đáp án A B C D Tổng cộng
Nhóm cao 2 0 1 41 44
Nhóm thấp 6 0 5 33 44
Trong đó:
D: là đáp án đúng
A, B, C,: là các mồi nhử
Độ khó của câu là 0.79, độ phân cách là 0.108, vậy, đây là câu trắc
nghiệm dễ nhưng có độ phân cách rất thấp, do đó ta phải điều chỉnh lại câu
trắc nghiệm này.
Việc chọn đáp án đúng D tương quan thuận với tiêu chí như mong đợi
(nghĩa là theo nguyên tắc: số học sinh trả lời đúng trong nhóm cao phải nhiều
hơn số học sinh trả lời đúng trong nhóm thấp).
Về các mồi nhử A, C tương quan nghịch với tiêu chí như mong đợi
(nghĩa là theo nguyên tắc: số học sinh trong nhóm cao lựa chọn câu này phải
ít hơn số học sinh lựa chọn câu này trong nhóm thấp). Riêng mồi nhử B
không có sự phân biệt giữa nhóm cao và nhóm thấp, trái với sự mong đợi.
Kết kuận: ta cần xem xét sửa lại mồi nhử B
1.4. Đánh giá bài trắc nghiệm:
Sau khi chấm điểm cho từng bài trắc nghiệm, ta sử dụng điểm này để
tính toán các thông số của bài trắc nghiệm. Việc đánh giá bài trắc nghiệm dựa
trên bảy thông số sau đây:
- Điểm trung bình lý thuyết (TBLT) và điểm trung bình thực tế (TBTT)
của bài trắc nghiệm.
- Độ lệch tiêu chuẩn của bài trắc nghiệm.
- Độ khó của câu trắc nghiệm, bài trắc nghiệm.
- Độ phân cách của câu trắc nghiệm.
- Độ tin cậy của bài trắc nghiệm.
- Tính giá trị của bài trắc nghiệm.
- Sai số đo lường tiêu chuẩn xích ma ss.
* Điểm trung bình lý thuyết (TBLT):
Là trung bình cộng của điểm tối đa có thể đạt được với điểm may rủi
của bài trắc nghiệm:
TBLT = (K + T)/2
Vói K: là số điểm tối đa bằng số câu trắc nghiệm (điểm thô)
T: là điểm may rủi của bài trắc nghiệm (T được tính bằng cách lấy tổng
điểm may rủi của mỗi loại trắc nghiệm có trong bài)
* Điểm trung bình thực tế (X) của bài trắc nghiệm:
Là trung bình cộng của tất cả các điểm trắc nghiệm của học sinh:
Trung bình X = Tổng f.x/N
Với x: Điểm trung bình của mỗi học sinh.
f: Tần số của mỗi điểm trắc nghiệm.
N: Tổng số học sinh làm bài trắc nghiệm.
* So sánh điểm TBLT với điểm TBTT của bài trắc nghiệm:
TBLT > trung bình X: Bài trắc nghiệm khó đối với học sinh.
TBLT < trung bình X: Bài trắc nghiệm dễ đối với học sinh.
TBLT = trung bình X: Bài trắc nghiệm vừa sức với học sinh.
Ngoài ra còn có điểm trung vị và điểm Mod của bài trắc nghiệm nhưng
cách tính khó hơn. Trong thực tế, khi đánh giá bài trắc nghiệm, người soạn
thảo không cần phải tính toán chính xác điểm trung vị, chỉ so sánh trung vị
hơn hay kém điểm trung bình của bài trắc nghiệm.
* Độ lệch tiêu chuẩn xích ma t
Sau khi chấm điểm bài trắc nghiệm, các điểm này được sắp xếp từ
thấp đến cao thành một hàng số. Nếu ta chỉ dựa vào hàng số của bài trắc
nghiệm thì chưa thể xác định chính xác về sự cách biệt về trình độ của học
sinh, mà ta phải dùng đến độ lệch tiêu chuẩn.
Độ lệch tiêu chuẩn là số đo lường sự phân tán của các điểm trắc
nghiệm. Nếu trình độ học sinh đồng đều, thì độ lệch tiêu chuẩn sẽ thấp tức là
sự phân tán của các điểm trắc nghiệm rất ít so với điểm trung bình. Còn nếu
trình độ học sinh quá chênh lệch thì độ lệch tiêu chuẩn sẽ cao.
Công thức tính độ lệch tiêu chuẩn:
Xích ma t = Căn bậc hai của N nhân tổng fx2-(tổng fx)2/ N(N-1)
Trong đó:
N: Tổng số học sinh làm bài trắc nghiệm.
f: Tần số xuất hiện mỗi điểm số.
x: Điểm số của mỗi bài trắc nghiệm (điểm thô).
* Sai số đo lường tiêu chuẩn: xích ma ss
Sai số đo lường tiêu chuẩn của bài trắc nghiệm được tính theo công
thức:
Xích ma ss = xích ma căn bậc hai (1-r)
Trong đó:
Xích ma: Độ lệch tiêu chuẩn của bài trắc nghiệm.
r: Hệ số tin cậy.
Sai số đo lường tiêu chuẩn phụ thuộc vào mức phân tán của điểm số
trắc nghiệm và hệ số tin cậy. Nếu trình độ kiến thức của học sinh đồng đều thì
xích ma ss nhỏ. Ngược lại, nếu trình độ kiến thức của học simh quá cách biệt
thì xích ma ss sẽ tăng. Mặt khác, nếu bài trắc nghiệm có độ tin cậy cao thì
xích ma thấp.
Bài 9. CÁCH BIẾN CẢI ĐIỂM TRẮC NGHIỆM THÀNH ĐIỂM LỚP
1. BIẾN CẢI ĐIỂM TRẮC NGHIỆM RA ĐIỂM LỚP
Điểm của bài trắc nghiệm chấm được gọi là điểm thô. Với điểm thô, ta
không thể nào đánh giá được trình độ của học sinh giữa các môn học khác
nhau và giữa những bài trắc nghiệm có số câu khác nhau. Do đó, ta phải biến
cải điểm thô sang điểm lớp:
Có nhiều cách biến cải, một trong những cách đó là dùng công thức:
An pha = 10 / (K-T)x(X-T)
Trong đó:
K: Là điểm tối đa của bài trắc nghiệm.
T: Là điểm may rủi của bài trắc nghiệm.
X: Là điểm trắc nghiệm của từng học sinh.
Do đó mỗi điểm trắc nghiệm phải trừ đi T.
Ta có:
K - T là điểm tối đa tương ứng với điểm 10.
X -T sẽ tương ứng với điểm a của điểm lớp.
2. THỨ HẠNG BÁCH PHÂN (PERCENTILE RANKS) VÀ ĐIỂM BÁCH PHÂN (CENTILES)
Các điểm thô bắt đầu có ý nghĩa khi ta xếp hạng chúng từ điểm cao
nhất đến điểm thấp nhất. Tuy nhiên, lối xếp hạng này lại không để ý đến cỡ
của mẫu (Sample size), tức là số người trong mẫu, do đó giải pháp thuận tiện
thường được áp dụng là biến cải các điểm số ra thành các trị số phần trăm.
Có hai loại thống kê được sử dụng cho mục đích này là:
Thứ hạng bách phân PR (Percentile Ranks) của bất kỳ điểm số nào:
Thứ hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao
nhiêu phần trăm trường hợp trong một nhóm chuẩn mực rơi vào chính điểm
số ấy hay ở dưới nó.
Điểm bách phân (Centiles):
Điểm bách phân là một điểm (point) trên thang điểm số mà ở đó có một
số phần trăm trường hợp nào đó rơi vào chính điểm số ấy hay ở dưới nó.
Do cách giải thích của thứ hạng bách phân và điểm bách phân gần
giống nhau, nên trong đề tài, người nghiên cứu quan tâm đến việc tính thứ
hạng bách phân.
Sau đây là cách để biến cải một phân bố điểm thô ra thứ hạng bách phân PR, ta thực hiện các bước sau đây:
Liệt kê tất cả các điểm thô có thể có được.
Tính tần số f của mỗi điểm số.
Tính tần số tích lũy cf (cumulative frequency) từ dưới lên trên cho đến
mỗi điểm số bằng cách cộng điểm số ấy với các tần số của tât cả các điểm số
thấp hơn.
Tính tần số tích lũy cho đến trung điểm của mỗi điểm số (cf/mp) bằng
cách cộng 1/2 tần số f của điểm số ấy với tần số tích lũy của điểm số ngay
dưới nó.
Biến cải ra thành số phần trăm tích lũy (Cumulative Percentage -
cp/mp) bằng công thức:
cp/mp = 100(cf/mp).
Với cp/mp và cf/mp được xác định như trên và N là số học sinh tham
gia làm bài trắc nghiệm (tức số người mẫu) hoặc dùng 100/N như một hằng
số rồi nhân với nó với các trị số của cf/mp kế tiếp nhau.
Tìm ra thứ hạng bách phân bằng cách làm tròn các trị số cp/mp cho
đến các số nguyên gần nhất, riêng các trị số dưới 1 và trên 99 thì được xem
là 0 và 99.
3. ĐIỂM TIÊU CHUẨN (STANDARD SCORES)
Khi cải biến các điểm thô của bài trắc nghiệm ra một loại điểm khác
điểm này gọi là điểm tiêu chuẩn. Điểm chuẩn này được đặt trên cơ sở độ lệch
tiêu chuẩn của phân bố điểm số.
Có nhiều loại điểm tiêu chuẩn khác nhau thông dụng nhất là:
3.1. Điểm Z (Z Score):
Là loại điểm tiêu chuẩn căn bản mà tất cả các loại điểm tiêu chuẩn khác
được thiết lập từ đó, nó cho ta biết hiệu số điểm hay khoảng cách giữa một trị
số điểm thô nào đó và điểm trung bình của nhóm làm bài trắc nghiệm.
Công thức tính điểm Z là:
Z = X-x/ xích ma
Với
X: Là điểm trung bình lý thuyết của nhóm làm bài trắc nghiệm.
x: Là một điểm thô nào đó của bài trắc nghiệm.
xích ma t: Là độ lệch tiêu chuẩn của bài trắc nghiệm.
Như vậy, điểm Z có thể là điểm âm, điểm dương và có một hoặc nhiều
số lẻ. Để khắc phục nhược điểm này, có các loại điểm tiêu chuẩn khác.
3.2. Điểm tiêu chuẩn V:
Đổi điểm thô ra điểm đánh giá được mức độ nhận thức của học sinh,
sau khi khảo sát kết quả bài trắc nghiệm ta cần phải đổi điểm thô ra điểm lớp
và quy chung về một thang điểm nhất định.
Có nhiều hệ thống thang điểm biến cải điểm trắc nghiệm, ở đây ta chỉ
sử dụng thang điểm 11 bậc (từ 0 -> 10) cho phù hợp với thang điểm hiện nay
của nước ta. Điểm tiêu chuẩn V là điểm tiêu chuẩn được áp dụng hiện nay
trong các kỳ thi trắc nghiệm, cũng dựa trên cơ sở điểm Z nhưng loại trừ điểm
âm cho phù hợp với thang điểm Việt Nam.
Công thức tính điểm V là: V = 2Z + 5.
Trong công thức này ta chọn điểm trung bình là 5 và độ lệch tiêu chuẩn
bằng 2. Điểm tính ra theo thang điểm 10 của hệ thống thang điểm Việt Nam
hiện nay.
Điểm V cũng có thể có giá trị lẻ do Z lẻ nên phải làm tròn số.
Ngoài điểm Z và điểm V, còn có một số loại điểm khác được áp dụng
trên thế giới, cách tính toán phức tạp hơn, nhưng lại không thông dụng ở Việt
Nam.
Tóm lại:
Thông qua việc xử lý, tính toán, phân tích các thông số trên của câu
trắc nghiệm, bài trắc nghiệm là nhằm để tìm ra những câu đạt tiêu chuẩn (về
độ tin cậy, tính giá trị) cao và loại đi những câu không đạt tiêu chuẩn nhằm
tạo ra ngân hàng câu hỏi trắc nghiệm hoàn chỉnh có chất lượng cao.
Bên cạnh đó, thông qua việc xử lý các thông số trên cũng giúp cho giáo
viên phát hiện ra mức độ nhận thức của học sinh như thế nào để kịp thời điều
chỉnh những sai sót trong quá trình giảng dạy, chương trình môn học…
Việc đổi điểm thi ra điểm thứ hạng bách phân và điểm lớp nhằm qui về
một thang điểm chuẩn để thuận lợi cho việc so sánh đánh giá bài trắc nghiệm
của học sinh.
PHỤ LỤC
Sử dụng phần mềm Excel để xử lý bộ đề thi trắc nghiệm
1. GIỚI THIỆU CHUNG VỀ PHẦN MỀM EXCEL
Nếu ta chỉ sử dụng phần mềm thống kê SPSS 11.5 để xử lý thì vẫn cho
những kết quả tin cậy. Tuy nhiên, để cho việc xử lý số liệu được phổ biến,
đơn giản, tiện ích và được nhanh hơn, người nghiên cứu sử dụng kết hợp với
phần mềm Excel.
Phần mềm Excel rất thông dụng cho mọi người sử dụng nó trong bất kỳ
sử dụng máy tính nào (không phải cài đặt như SPSS).
Excel là phần mềm bảng tính điện tử dùng trong văn phòng quản lý do
hãng Microsoft sản xuất. Đây là một phần mềm có nhiều chức năng trong đó
chủ yếu xử lý số liệu dưới dạng bảng biểu. Bên cạnh những hàm trang bị sẵn,
Excel còn cho phép người sử dụng tự thành lập những công thức để tính toán
cho những lĩnh vực riêng biệt. Chính vì vậy, người xử lý trắc nghiệm nếu biết
về Excel có thể xử lý câu và bài trắc nghiệm hoàn toàn bằng phần mềm này.
Cụ thể Excel có một số chức năng cơ bản như sau:
- Lập và xử lý bảng tính về:
Thống kê, tổng hợp dữ liệu Phân tích, dự báo
Giải các bài toán qui hoạch, tài chính…
- Vẽ biểu đồ, đồ thị
- Quản trị cơ sở dữ liệu
- Lập trình với ngôn ngữ VBA (Visual Basic for Application)
2. DÙNG PHẦN MỀM EXCEL ĐỂ XỬ LÝ VÀ PHÂN TÍCH BÀI VÀ CÂU TRẮC NGHIỆM
Để đánh giá bài trắc nghiệm qua hai lần khảo sát, ta phải tính toán trên
hàng loạt các công thức phức tạp với một bảng dữ liệu khá lớn. Để thực hiện
nhanh chóng và chính xác, phần mềm Excel đã có những hàm chuyên dùng
để ta tính toán các thông số đánh giá trắc nghiệm đó. Khi đó, ta có thể thực
hiện đánh giá bài trắc nghiệm như sau:
Nhập dữ liệu của từng học sinh vào máy, sau đó tiến hành xử lý trên
bảng dữ liệu này.
- Chấm điểm từng học sinh trên máy tính, để được điểm trắc nghiệm
(điểm thô)
- Sau đó thực hiện việc phân tích đánh giá.
Cụ thể cách tính trên như sau:
Giả sử bảng điểm trắc nghiệm của toàn bài có tọa độ từ DA2 đến
DA163, ta có:
2. Điểm trung bình của bài trắc nghiệm
=AVERAGE(DA2:DA163)
2. Độ lệch tiêu chuẩn
=STDEV(DA2:DA163)
3. Điểm trung vị
=MEDIAN (DA2:DA163)
Điểm trung vị là điểm trong một phân bố điểm số phân chia phân bố ấy
ra thành hai nửa, mỗi nữa có số dữ kiện bằng nhau.
4. Điểm yếu vị
=MODE (DA2:DA163)
Điểm yếu vị là điểm số ở đó có tần số lớn nhất, nghĩa là tại điểm đó có
nhiều người đạt tới nhất.
5. Khoảng tin cậy
Khoảng tin cậy của điểm trung bình bài trắc nghiệm đó là khoảng biến
thiên của trị số trung bình:
=CONFIDENCE(an pha, độ lệch tiêu chuẩn t, n)
Với
An pha: Mức ý nghĩa thường chọn 0.05.
S: Độ lệch tiêu chuẩn.
n: Số bài trắc nghiệm.
Công thức cụ thể được lập như sau:
=CONFIDENCE(0.05,DF3,DA2:DA163)
6. Điểm tiêu chuẩn Z: ta phải căn cứ vào:
Điểm trắc nghiệm của từng học sinh.
Trị số trung bình của điểm bài trắc nghiệm.
Độ lệch tiêu chuẩn của bài trắc nghiệm.
Nếu Z > 0: điểm trên trung bình,
Nếu Z < 0: điểm dưới trung bình.
Công thức cụ thể được lập như sau:
=(DA2-$DF$2) / $DF$3
Trong đó, DA2: Tọa độ điểm bài trắc nghiệm của học sinh thứ nhất.
DF2: Tọa độ điểm trung bình bài trắc nghiệm (được tính bởi hàm
AVERAGE).
DF3: tọa độ của độ lệch tiêu chuẩn (được tính bởi hàm STDEV).
(Các dấu $ để chỉ địa chỉ cố định, nó sẽ không đổi khi ta chép công
thức vừa lập để tính điểm Z cho các học sinh còn lại).
Sau đó, rê chuột ta sẽ được kết quả cho những bài còn lại.
7. Điểm lớp từ điểm Z:
Điểm lớp = 2Z + 5 (Giả sử điểm Z có tọa độ là DB2).
Công thức cụ thể được lập như sau:
=2* DB2+5
Sau đó, rê chuột ta sẽ được kết quả cho những bài còn lại.
8. Độ khó của câu trắc nghiệm:
Độ khó của câu trắc nghiệm thứ
i = Tổng số người trả lời đúng câu I / Tổng số người làm bài trắc
nghiệm
Công thức cụ thể được lập như sau:
=ROUND(COUNTIF(B2:B163/T)/COUNT(B2:B163),3)
Trong đó, (B2:B163,”1”): Là tổng số người làm đúng.
(B2:B163): Là tổng số người làm bài trắc nghiệm.
Số (3):Là làm tròn lấy 3 số thập phân ở hàm ROUND.
8. Độ phân cách của câu trắc nghiệm:
Độ phân cách D = (Dg – Dk)/n
Với:
Dg: Số học sinh của nhóm giỏi trả lời đúng câu trắc nghiệm.
Dk: Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.
n: Tổng số học sinh làm bài trắc nghiệm.
Hình thức lựa chọn nhóm giỏi và nhóm kém đã được trình bày [t.34].
Với bài TN khảo sát lần I là 162 bài thì 27% là 44 bài.
Với bài TN khảo sát lần II là 412 bài thì 27% là 111 bài.
(Ở đây, người nghiên cứu đặt 27% toàn nhóm có điểm số cao nhất là
“giỏi”, 27% toàn nhóm có điểm số thấp nhất là “kém”).
Công thức cụ thể được lập cho nhóm giỏi và nhóm kém như sau:
=ROUND(27%* COUNT(A2:A163),0)
Công thức cụ thể được lập cho độ phân cách của câu như sau:
=B177/B179-B178/B180
Trong đó, (B177): Số học sinh của nhóm giỏi trả lời đúng câu trắc
nghiệm.
(B179): Tổng số học sinh làm bài TN của 27%.
(B178): Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.
(B180): Tổng số học sinh làm bài TN của 27%.
Sau đó, rê chuột ta sẽ được kết quả cho những bài còn lại.
10. Mồi nhử:
Sau khi có độ phân cách và độ khó của câu, ta tiếp tục phân tích các
mồi nhử của câu.
Phần phụ lục này do Anh Nguyễn Hồng Phụng (Lớp Cao học - Khóa 12
ngành Giáo dục học trường Đại học Sư phạm Kỹ thuật Tp. Hồ Chí Minh) viết
trong luận văn tốt nghiệp cao học và tác giả cho phép trích lại.
MỤC LỤC
Lời nói đầu
Phần 1. Một số lý thuyết về đánh giá trong giảng dạy và học tập
Bài 1. Một số quan điểm về đánh giá
Bài 2. Đánh giá
Bài 3. Tổ chức một chương trình đánh giá
Bài 4. Mục đích, ý nghĩa của việc đo lường kiểm tra đánh giá trong giáo
dục
Bài 5. Một số tác dụng của đánh giá
Bài 6. Mục tiêu, nội dung và chức năng của việc đánh giá hoạt động
giảng dạy
Bài 7. Đo lường, lượng giá và đánh giá trong giáo dục
Bài 8. Đánh giá sản phẩm của giảng dạy
Bài 9. Đánh giá và cho điểm
Bài 10. Cách cho điểm
Phần 2. Trắc nghiệm khách quan
Bài 1. Lược sử trắc nghiệm
Bài 2. So sánh cách đánh giá bằng trắc nghiệm và luận đề
Bài 3. Các loại mục tiêu
Bài 4. Những câu hỏi để chuẩn bị cho bài trắc nghiệm trong lớp học
Bài 5. Hình thức câu trắc nghiệm khách quan
Bài 6. Soạn thảo bài trắc nghiệm khách quan
Bài 7. Một cách khác viết câu trắc nghiệm nhiều lựa chọn.
Bài 8. Phân tích câu
Bài 9. Cải biến cải điểm trắc nghiệm thành điểm lớp
Phụ lục. Sử dụng phần mềm Excel để xử lý bộ đề thi trắc nghiệm
-//-
ĐÁNH GIÁ & TRẮC NGHIỆMKẾT QUẢ HỌC TẬP
Tác giả: ĐOÀN VĂN ĐIỀU
NHÀ XUẤT BẢN ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
280 An Dương Vương, Phường 4, Quận 5, TP.HCM
Điện thoại: (08) 38 301 303 - Fax: (08) 39 381 382
Email: [email protected] - http://nxb.hcmup.edu.vn
Chịu trách nhiệm xuất bản:
Giám đốc – Tổng biên tập: PGS.TS. NGUYỄN KIM HỒNG
Biên tập: NGÔ THỊ THU NGỌC
Tổ chức nội dung: ĐOÀN VĂN ĐIỀU
Trình bày bìa & Sửa bản in: DIỆP QUANG PHƯỚC
In 500 cuốn khổ 16 x 24cm tại Cty TNHH MTV In Kinh Tế. Số 279 Nguyễn Tri
Phương, Phường 5, Quận 10, TP.HCM. Số đăng ký kế hoạch xuất bản 190-
2011/CXB/11-07/ĐHSPTPHCM. Quyết định xuất bản số: 152/QĐ-NXBĐHSP,
cấp ngày 15/03/2012. In xong và nộp lưu chiểu Quý II năm 2012.