Đanh giá và trắc nghiệm kết quả học tậpsaomaidata.org/library/431... · web...

ĐÁNH GIÁ & TRẮC NGHIỆM KẾT QUẢ HỌC TẬP

ĐÁNH GIÁ & TRẮC NGHIỆMKẾT QUẢ HỌC TẬP

Tác giả: ĐOÀN VĂN ĐIỀU

LỜI NÓI ĐẦU

Kính thưa quý thầy/cô và các anh/chị sinh viên thân mến,

Hiện nay, có gần 10 cuốn sách viết về trắc nghiệm ở Việt Nam. Mỗi

cuốn có những đặc điểm và nét độc đáo riêng nhằm trình bày những góc nhìn

khác nhau về đánh giá và đo lường trong giáo dục theo mục đích của mỗi tác

giả.

Sau một thời gian học tập và giảng dạy bộ môn “Đánh giá và đo lường

thành tích học tập”, tác giả nhận thấy có nhiều thầy/cô và các anh/chị sinh

viên quan tâm đến bộ môn này. Vì vậy, tác giả cố gắng trình bày một số suy

nghĩ và kinh nghiệm khi nghiên cứu bộ môn này.

Đây là một bộ môn được phát triển từ lâu ở các nước có những điều

kiện giáo dục thuận tiện, nên tri thức của bộ môn này rất đa dạng và phong

phú. Do đó, trong cuốn sách nhỏ này, tác giả chỉ trình bày những điều cốt lõi

nhất về phần lý thuyết đánh giá và một số hướng dẫn về trắc nghiệm khách

quan để quý thầy/cô và các anh/chị sinh viên có thể thực hiện được việc soạn

thảo một bài trắc nghiệm khách quan về kết quả học tập cho bộ môn mình

phụ trách.

Nội dung sách được chia làm hai phần:

1. Một số lý thuyết về đánh giá trong giảng dạy và học tập: đánh giá,

đánh giá chung, mục đích và tác dụng của đánh giá, mục tiêu, nội dung và

chức năng đánh giá hoạt động giảng dạy, tiêu chuẩn để đánh giá hiệu quả

học tập, đánh giá sản phẩm của giảng dạy, đánh giá và cho điểm, đo lường

và lượng giá trong giáo dục, cách cho điểm.

2. Trắc nghiệm khách quan: lược sử trắc nghiệm, so sánh trắc nghiệm

và luận đề, các loại mục tiêu, những câu hỏi gợi ý để chuẩn bị cho bài trắc

nghiệm trong lớp học, hình thức câu trắc nghiệm khách quan, soạn thảo bài

trắc nghiệm khách quan, một cách viết câu trắc nghiệm nhiều lựa chọn, phân

tích câu trắc nghiệm, cách cải biến điểm trắc nghiệm thành điểm lớp.

Trong sách này, tác giả đặc biệt nhấn mạnh đến các loại mục tiêu và

tham khảo những hướng dẫn để viết các mục tiêu tương ứng trên cơ sở tác

phẩm của Benjamin S. Bloom và cộng sự “Nguyên tắc phân loại mục tiêu giáo

dục - Lĩnh vực nhận thức” hiện đang được sử dụng rộng rãi trên thế giới và

những phiên bản cập nhật của các tác giả khác làm cho việc viết các mục tiêu

giáo dục thích ứng với những thay đổi của sự phát triển tri thức và của công

nghệ thông tin.

Tác giả

Phần 1. MỘT SỐ LÝ THUYẾT VỀ ĐÁNH GIÁ TRONG GIẢNG DẠY VÀ HỌC TẬP

Bài 1. MỘT SỐ QUAN ĐIỂM VỀ ĐÁNH GIÁ

Đánh giá là phương tiện để xác định các mục đích và mục tiêu của một

công việc có đạt được hay không. Nó cũng gồm việc xem xét các phương tiện

đang được sử dụng để đạt đến mục đích và mục tiêu. Đánh giá làm rõ các

sản phẩm có được ngoài dự kiến, cả về mặt tích cực lẫn tiêu cực, từ các hoạt

động bổ trợ.

Việc đánh giá cần liên tục trong quá trình, nhưng nó đặc biệt quan trọng

khi mỗi bước được hoàn thành. Việc đánh giá được thực hiện sau khi lượng

giá để xem xét tất cả các thông tin cần thiết được thu thập và những kết luận

phù hợp về ý nghĩa của thông tin và về đối tượng được rút ra trong tình

huống đó. Khi lập kế hoạch, cần có sự đánh giá để xác định kế hoạch đó có

thực hiện được và hoàn chỉnh không. Sau khi một hành động được thực hiện,

cần đánh giá để xác định xem các mục tiêu cần thiết có đạt được không.

Đánh giá cũng là phần quan trọng của quá trình kết thúc. Vì thế, đánh giá là

tìm ra điều dự kiến có thực sự xảy ra hay không. Nó xem xét công việc một

cách hoàn chỉnh; xác định phương pháp, chiến lược nào có hiệu quả và tại

sao. Đó là cơ hội để rà soát lại đối tượng và những người tiêu biểu khác để

xem xét cách tiến hành dưới quan điểm của họ. Đánh giá một công việc là

nhiệm vụ nghề nghiệp cho mọi nhân viên của các công ty, các tổ chức xã hội

và đây là một quá trình liên tục. Các chương trình và các công ty bắt buộc

phải thực hiện đánh giá, trên cơ sở đang thực hiện một nhiệm vụ, mục đích

và mục tiêu của công ty cũng như chương trình hành động của nó.

Từ trước đến nay đánh giá được định nghĩa là “việc thu thập dữ liệu về

các kết quả của một chương trình hành động có liên quan đến mục đích và

mục tiêu được đề ra trước khi thực hiện chương trình đó” (1).

Theo Bernic Jones các chương trình được đánh giá vì một số lý do đặc

biệt. Sau đây là một số nguyên nhân:

1. Phát hiện một chương trình đáp ứng các mục đích của nó hiệu quả

như thế nào? (Nó có tạo ra sự thay đổi hay không? Cho ai?).

2. Nhận được các thông tin giúp cấu trúc lại hoặc quản lý chương trình

một cách hiệu quả hơn. Có lẽ các nhà đánh giá muốn xem xét yếu tố đặc biệt

nào cần được xóa bỏ hoặc thay đổi.

3. Xác định các mô hình cho những ngưòi khác làm theo, hoặc để kiểm

nghiệm một lý thuyết hoặc cách tiếp cận một vấn đề cần giải quyết. (Điều gì

đã làm cho chưong trình có tác dụng? Yếu tố nào có thể được sử dụng trong

các chương trình khác?).

4. Tìm ra biên chế cần giảm loại nhân viên nào để thực hiện chương

trình một cách có hiệu quả.

5. Tìm ra một chương trình có hiệu quả mức độ nào dưới quan điểm

của khách hàng và cách làm cho chương trình đó hiệu quả hơn.

Trước khi làm rõ khái niệm quá trình đánh giá, điều quan trọng là giải

quyết vấn đề thường ngăn cản khả năng khám phá tính năng động của đánh

giá. Vấn đề này có liên quan đến việc sử dụng các thuật ngữ “đánh giá” và

“cho điểm”. Có phải đánh giá và cho điểm giống nhau? Có thể nói, có hai mặt

giống nhau trong hai thuật ngữ này là chúng cùng quá trình và đều nói đến

hoạt động của một cá nhân. Tuy nhiên, chúng không phải là những quá trình

giống nhau.

- Đánh giá là một quá trình xét đoán. Giáo viên xét đoán về chất lượng

đạt được của các mục tiêu học tập dự kiến của người học.

- Cho điểm là quá trình định hướng. Qua đó, giáo viên định hướng

những dữ kiện đánh giá và đưa ra những ký hiệu thể hiện mức độ đạt được

về mặt học thuật của người học. Cho điểm, một quá trình định lượng, tùy

thuộc vào dữ liệu được cung cấp do quá trình và đánh giá mang tính định

tính.

Đánh giá có thể hiện diện như một hiện tượng độc lập trong khi đó cho

điểm luôn luôn phải tùy thuộc vào đánh giá.

Mặc dù, như được trình bày ở đây, đánh giá và cho điểm là hai quá

trình riêng biệt lần lượt diễn ra, trong thực tế, chúng ta biết rằng sự phân biệt

này không được thực hiện. Cho điểm và đánh giá thường được coi như là

các thuật ngữ đồng nghĩa. Những điểm số chính thức từ trước đến nay trở

thành phương tiện dễ thấy nhất trong việc lượng giá việc thực hiện nhiệm vụ

học tập của học sinh mặc dù cần xem xét lại tính tin cậy của đánh giá hoạt

động của người học.

Cách giải thích theo lối phân đôi của thuật ngữ đánh giá là (1) nó là một

quá trình trưởng thành hoặc (2) nó là một quá trình kiểm soát. Ý của hai cách

giải quyết hoàn toàn khác nhau này cần được chú ý. Nếu chúng ta chấp nhận

khái niệm đánh giá là một quá trình hay một loạt quá trình, qua đó việc phán

đoán giá trị về hoạt động của một người được thực hiện, thì chúng ta có thể

nhận thấy rằng đánh giá thực sự có thể được sử dụng tùy theo nhu cầu của

người đánh giá. Chúng ta hãy xem xét thuật ngữ đánh giá dưới góc cạnh

phán đoán giá trị thuật ngữ giá trị (value) là một phần thống nhất của từ đánh

giá (e-valuation). Vì giá trị là niềm tin tạo lập được người đó chấp nhận như

cái riêng của mình và sử dụng như một yếu tố quyết định hành vi của bản

thân, chúng ta có thể nhận thấy rằng không có một quá trình nào như thế là

quá trình đánh giá khách quan, đặc biệt trong lâm sàng y khoa, một việc tìm

kiếm mang tính mông lung, vì không có hiện tượng như thế hiện hữu. Tuv

nhiên, dù việc đánh giá có thể không khách quan, thì việc đánh giá vẫn có thể

công bằng. Chất lượng của tính công bằng này phải là mục tiêu của chúng ta.

Thái độ của người đánh giá đối với việc đánh giá là một trong những

yếu tố quyết định có liên quan đến việc sử dụng hướng đến quá trình nào.

Thái độ của chúng ta xác định việc hỏi đúng câu hỏi và xem xét hành vi đúng

hay không.

Việc theo đuổi, tìm kiếm tri thức của sinh viên bị ngăn chặn bởi các

thông tin nhận được từ người đánh giá. Việc đánh giá không được coi là một

quá trình tăng nhanh sự tự phát triển, mà là một quá trình soát xét, qua đó

người học có thể được đánh dấu bằng một số danh xưng trong cuộc sống.

Việc tiếp cận của người học đến việc đánh giá là việc tự duy trì chứ không

phải là việc tự khẳng định.

Thực ra, việc giải thích ý nghĩa của thuật ngữ đánh giá bạn sử dụng với

tư cách của một nhà đánh giá sẽ quyết định cách tiếp cận và hoàn cảnh bạn

tạo ra. Tất cả các nghề nghiệp mang tính giúp đỡ lôi cuốn các cá nhân bằng

một nhu cầu kiểm soát những người khác. Những “người điều khiển con

người này” tìm thấy trong các lĩnh vực dịch vụ một phạm vi màu mỡ đặc biệt,

vì khách hàng thường là những cá nhân hay nhóm đang ở trạng thái phụ

thuộc. Các nhà kiểm soát dựa trên các luật lệ, các quy định và các phương

pháp để tìm ra các phán đoán mang tính chất đánh giá và tìm cách vận động

người học vào một trạng thái hành vi được chấp nhận. Sau đó, người học

hướng năng lượng của họ vào việc duy trì sự sống trong một hệ thống hơn là

vào các kinh nghiệm đóng góp cho sự phát triển và trưởng thành của bản

thân.

Việc đánh giá thường phản ánh kỹ năng của người học, vào tài làm cho

đối thủ (người đánh giá) lãng trí để thắng cuộc, hơn là khả năng của người ấy

đáp ứng các mục tiêu, kinh nghiệm học tập được đưa ra. Trong ngành giáo

dục, trong lĩnh vực lý thuyết, cả yếu tố thực hành đặc biệt nhạy cảm với tài

làm cho đối thủ lãng trí để thắng cuộc này và được người đánh giá (cũng là

người giám sát) khuyến khích. Đặc điểm thực của quá trình giám sát làm nảy

sinh nhiều mối lo ngại làm cho có sự khác nhau giữa việc đánh giá trong lâm

sàng và tình huống học thuật thông thường. Thẩm quyền trong lâm sàng có

liên quan đến tất cả các lĩnh vực học tập: nhận thức, tình cảm và tâm lý cơ

động. Sự thay đổi hành vi trong tất cả các lĩnh vực này xảy ra ở phạm vi của

mối quan hệ gần gũi với giáo viên và thường được bạn bè, bệnh nhân, những

nhà chuyên môn hoặc những nhà thực hành nhận ra một cách đầy đủ. Cảm

giác về sự không phù hợp làm cho người học phải sợ phê bình, xấu hổ và bị

loại ra. Nếu thầy giáo trong tình huống lâm sàng đặt giá trị trước tiên trên cơ

sở các luật lệ và phương pháp, người học thường phải lựa chọn lại cách làm

cho đối thủ lãng trí để thắng cuộc để tự bảo vệ mình khỏi sự kiểm soát có ác

cảm khi đo lường.

Những điều nào của người đánh giá nhận thấy công việc này là để giúp

cho sự trưởng thành của người học? Những cá nhân này chấp nhận khái

niệm là: hầu hết những người học đều có khả năng thông thạo các nhiệm vụ

học tập và dùng đánh giá như là một quá trình chẩn đoán qua đó các chiến

lược dạy học được đưa ra để kích thích người học tìm kiếm tri thức, giá trị và

khả năng thực hành. Bầu không khí dành cho việc đánh giá mang tính ủng

hộ, đặt cơ sở trên sự tin tưởng và tôn trọng đối với người học. Quá trình phát

triển cũng như kết quả sau cùng là mối quan tâm của các nhà đánh giá này.

Trò chơi được giảm thiểu, bởi vì quá trình dạy - học là một việc làm khó khăn

được chia sẻ. Đánh giá là phần thống nhất của một quá trình giáo dục hoàn

chỉnh. Niềm tin của giáo viên về đặc điểm của con người và quá trình dạy -

học có liên quan trực tiếp đến niềm tin về quá trình đánh giá và đặc điểm của

các chiến lược đánh giá được soạn thảo.

Cách tiếp cận tâm lý giáo dục đến giảng dạy sử dụng đánh giá như là

một phương tiện để kiểm soát. Các kết quả mong đợi cũng như các điều kiện

học tập và các tiêu chuẩn được sử dụng để xác định thành tích học tập được

đặc biệt phác họa. Đó là cách tiếp cận đánh giá kết quả. Tất cả người học và

giáo viên đều được yêu cầu theo “cùng nhịp điệu”. Mặc dù không được ưa

chuộng vì không đạt đến kết quả học tập được coi như một phần ngoài lý

thuyết này, nhưng các kỹ thuật này thực sự được sử dụng. Trong nhiều

trường họp, việc không khen thưởng có thể được coi là phương pháp chống

đối.

Cách tiếp cận nhân văn sử dụng đánh giá như là sự lượng giá giúp

trưởng thành. Nó là một quá trình mở cơ động đan kết chặt chẽ với quá trình

dạy - học. Nó nhấn mạnh quá trình cũng như kết quả. Đánh giá giúp trưởng

thành là một phương tiện, chứ không phải là mục đích. Nó đề cao sự phát

triển cá nhân.

Cách ghi lại việc đánh giá được hướng tới sự trưởng thành của người

học gồm cả việc đánh giá tổng kết và đánh giá hình thành. Việc đánh giá tổng

kết xảy ra ở cuối một chương trình, một khóa học hay một đơn vị học trình và

dựa vào mức độ người học nhận biêt các mục tiêu đã được xác định. Đây là

hình thức đánh giá trong thực tế thông thường nhất và được sử dụng như là

một cơ sở để quyết định điểm Trắc nghiệm, bài tập và các công trình nghiên

cứu là các cách thức thông thường. Cách đánh giá này được gọi là cách

đánh giá “cái gì”.

Ngược lại, cách đánh giá hình thành xảy ra trong suốt chương trình,

khóa học hoặc đơn vị học trình và dựa vào sự tiến bộ của người học đối với

việc nhận ra các mục tiêu học tập. Loại đánh giá này được thực hiện xuyên

suốt quá trình học tập và gọi là quá trình đánh giá “cái gì” và “cái có thể”. Nó

dựa vào nguyên tắc thông tin phản hồi để hướng dẫn người dạy và người học

đến các mặt học tập cần sự quan tâm sâu sát khi người học tiếp cận đến việc

thành thạo các hành động học tập. Các phương pháp được sử dụng gồm các

ghi chép nhỏ, các tình huống giải quyết vấn đề, hồ sơ theo dõi, quan sát các

hành vi thực tiễn, các cuộc họp và ghi hình.

Loại đánh giá này không được soạn thảo để thu thập số liệu như là một

cơ sở để cho điểm. Nó được dùng để lượng giá sự tiến bộ của người học, để

chẩn đoán các nhu cầu học tập, các biện pháp sửa chữa có thể được thiết lập

một cách nhanh chóng và bắt kịp việc học tập của người học tùy theo nhu cầu

và khả năng riêng của người ấy.

Cách tiếp cận hệ thống đến việc đánh giá học tập về mặt tình cảm, phối

hợp các quá trình đánh giá tổng kết và hình thành, thì cần thiết. Các mục tiêu

được đưa ra trong các thuật ngữ tâm lý giáo dục được xác định như là các

kết quả thống nhất với mức độ học tập mong đợi. Các dữ liệu được thu thập

và các chiến lược được soạn thảo được các kết quả này xác định. Việc đánh

giá tổng kết có thể đạt đến được và cách đánh giá hình thành nhận ra các

mặt phát triển của việc học tập mang tính chất tình cảm.

Tài liệu tham khảo:

1. Dorothy E. Reilly, 1982, Teaching and Evaluating the Affective,

Domain in Nursing Programs, USA: Charles B. Slk, Inc. (p.p 52-57).

2. Louise C. Johnson, 1989, Social work pratice - A generalist

Approach, Boston. Allyn and B on (p.p 383-402).

Bài 2. ĐÁNH GIÁ

1. CÁC ĐẶC TRƯNG CỦA QUÁ TRÌNH ĐÁNH GIÁ

Quá trình đánh giá có các đặc trưng sau đây:

- Quá trình đánh giá xem xét tình hình giáo dục trong khuôn khổ sự

phát triển về xã hội, kinh tế và văn hóa, có nghĩa là nó đo lường những thay

đổi diễn ra trong giáo dục theo các mục tiêu phát triển tổng thể của quốc gia.

- Quá trình đánh giá sử dụng một ngôn ngữ chung bất kể mức độ chi

tiết của thông tin là như thế nào, sao cho các kết quả, các điều chỉnh là tương

thích và đồng bộ trong các cấp giáo dục.

- Quá trình đánh giá tạo ra các cơ chế để các có sự tham gia của các

cấp thẩm quyền vào hệ thống giáo dục nhằm tăng cường quá trình này.

- Quá trình đánh giá sử dụng các nghiên cứu cụ thể để cải thiện các kết

quả đánh giá.

- Quá trình đánh giá mang lại những thông tin đáng tin cậy, thích hợp

và đầy đủ, có ý nghĩa quan trọng khi sự phù hợp gắn với các vấn đề cần giải

quyết: tin cậy bởi được dựa trên các tiêu chí khách quan; thích hợp cho việc

đưa ra các quyết định kịp thời; đầy đủ về mặt loại hình và khối lượng thông tin

cần thiết.

2. CÁC CẤP ĐỘ ĐÁNH GIÁ

Việc đánh giá các kế hoạch, chương trình, dự án và hệ thống giáo dục

nói chung có thể tiến hành theo các cấp độ khác nhau: cấp quốc gia, cấp

vùng, cấp khu vực, cấp địa phương và cấp cơ sở.

Các cấp độ đánh giá phần lớn được xác định bởi mức độ địa phương

hóa của quá trình lập kế hoạch giáo dục. Ở mỗi cấp độ nêu trên thì mục tiêu

giáo dục cũng khác nhau.

Ví dụ: Ở cấp quốc gia thì khuôn khổ nhận thức, các tiêu chí và thông số

đánh giá đặt trọng tâm vào mối quan hệ giữa việc thực hiện chức năng của

hệ thống giáo dục và sự phát triển chung về xã hội, kinh tế và văn hóa, cũng

như chú trọng vào việc thực hiện kế hoạch quốc gia, các chương trình và các

dự án, trong đó có xét đến các mục tiêu một cách thỏa đáng.

Còn ở cấp thấp nhất, người ta sử dụng đánh giá cấp cơ sở và cấp địa

phương. Cấp đánh giá này liên quan đến quá trình thực hiện cụ thể của các

hoạt động đã được lên chương trình và việc sử dụng các nguồn lực theo các

mục tiêu đã dự kiến. Các kết quả có thể được diễn đạt theo cả hai mặt lượng

và chất, bao gồm cả những báo cáo nghiên cứu đối tượng cụ thể.

Cần lưu ý rằng các thông số đánh giá đã cho có thể có khuynh hướng

nội tại nghiêng về đánh giá cấp tỉnh, thành và cấp quốc gia. Với mục đích

quản lý và kế hoạch hóa giáo dục cấp vi mô, việc đánh giá đồng thời chương

trình từ góc độ cộng đồng, môi trường địa phương và các nguyện vọng của

cộng đồng có ý nghĩa rất quan trọng.

3. CÁC HÌNH THỨC ĐÁNH GIÁ

Căn cứ theo giai đoạn tiến hành đánh giá và quan hệ của nó tới quá

trình thực hiện, có thể chia đánh giá thành ba loại sau:

- Đánh giá khả thi ban đầu.

- Đánh giá song song.

- Đánh giá cuối kỳ.

3.1. Đánh giá khả thi ban đầu

Đây là sự phân tích về tính nhất quán, tính đồng bộ trong việc xây dựng

kế hoạch và là nội dung kiểm tra tính khả thi của kế hoạch. Ở cấp vi mô cần

kiểm tra xem các mục tiêu có được xây dựng đúng không và các mục tiêu này

có góp phần vào việc giải quyết các vấn đề phát sinh trong quá trình chẩn

đoán cục bộ không. Bên cạnh đó, cần kiểm tra xem các mục tiêu cụ thể, các

chương trình, dự án có đúng với các mục tiêu của kế hoạch hay không và liệu

kế hoạch có thể thực hiện được với các nguồn lực đã cho, với năng lực quản

lý hiện hành hay không, trong đó có xem xét đến cả các yếu tố bên trong và

bên ngoài.

Trong các yếu tố bên ngoài được xem xét có các vấn đề về nhân khẩu

học, văn hóa - xã hội, chính trị, quản lý nhà nước, kinh tế và sinh thái, tùy

theo mức độ mà chúng có thể ảnh hưởng đến sự phát triển của hệ thống giáo

dục. Cần chú ý rằng những yếu tố này thường được xem xét khi chẩn đoán

hệ thống giáo dục ở cấp vi mô trong phạm vi của nó. Bằng cách sử dụng đến

mức tối đa những thông tin trong chẩn đoán, có thể phân tích các yếu tố bên

ngoài khi tiến hành đánh giá ban đầu phòng trường hợp có thể phát sinh

những trở ngại trong khi kế hoạch được triển khai đúng.

Các yếu tố bên trong liên quan đến các nội dung của kế hoạch. Vấn đề

ở đây là việc phân tích tính nhất quán bên trong của kế hoạch, tức là xem xét

các mục tiêu chung có được xây dựng một cách phù hợp không, và các mục

tiêu, chiến lược, chương trình cũng như dự án cụ thể đã được nhất trí có giúp

cho việc đạt được các mục tiêu chung không.

Nhìn chung, việc phân tích tính nhất quán bên trong đặt trọng tâm vào

luồng lưu chuyển học sinh trong các cấp học và trong các loại hình giáo dục;

vào những thay đổi đã được dự kiến trước trong kế họach và vào những tiền

đề của các thay đổi này. Việc phân tích cũng đặt trọng tâm vào tính sẵn có

của các nguồn nhân lực và tài chính, cũng như năng lực điều hành để thực

hiện kế hoạch.

3.2. Đánh giá song song

Kiểu đánh giá này được tiến hành song song với quá trình triển khai dự

án. Xét về mặt thực hiện, đó là sự quan sát quá trình triển khai kế hoạch trên

góc độ khảo sát quá trình thực hiện các hoạt động được lên chương trình

nhằm có thông tin cho việc điều chỉnh bất cứ sự chệch hướng hay phân tán

nào, sao cho các mục tiêu đều có thể đạt được.

Kiểu đánh giá này cần phải được thực hiện liên tục và thể hiện kết quả

qua các báo cáo định kỳ, trong đó bao hàm mọi khía cạnh của kế hoạch. Ý

nghĩa chính của loại đánh giá này là có thể thực hiện kịp thời các bước điều

chỉnh để bảo đảm cho kế hoạch được thực hiện tốt hơn.

Nhìn chung, trong đánh giá song song, mức độ thực hiện chương trình

được xem xét trên các góc độ về tài chính, quản lý, các vấn đề về cơ sở vật

chất, văn hóa, kỹ thuật. Việc xem xét có thể tiến hành một cách tổng thể đối

với toàn bộ kế hoạch hoặc dưới dạng chi tiết, ứng với các chương trình, dự

án hoặc hoạt động khác nhau.

3.3. Đánh giá cuối kỳ

Đánh giá cuối kỳ, hay còn gọi là đánh giá tổng kết, có hai khía cạnh.

Thứ nhất, nó diễn ra đồng thời với giai đoạn cuối của quá trình đánh giá song

song và với mục đích cải thiện các kế hoạch sau này, nó phân tích một cách

nhất quán các kết quả vấn đề, những mặt khó khăn và tồn tại trong quá trình

thực hiện kế hoạch. Thứ hai, nó hướng vào sự phát triển của hệ thống giáo

dục ở cấp vi mô để nhận diện những vấn đề cần giải quyết. Nói một cách

khác, đánh giá cuối kỳ tập trung vào các kết quả triển khai kế hoạch phát triển

giáo dục và tác động của giáo dục đối với sự phát triển về kinh tế, xã hội, văn

hóa.

4. ĐÁNH GIÁ TẬP TRUNG VÀO CẤP VI MÔ

Trong thực tế, mặt thứ nhất đánh giá cuối kỳ đã được dành sự lưu tâm

trong giai đoạn cuối của quá trình đánh giá song song bởi đây là việc đối

chiếu những gì đã lên chương trình với những gì đã thực hiện. Đối với mặt

thứ hai, mặc dù không bị phủ nhận tầm quan trọng, song nó thực sự ít được

xem xét thường xuyên. Vì vậy, cần nghiên cứu các đánh giá tiếp theo sâu

hơn, hướng vào việc phân tích, đo đạc và đánh giá sự phát triển của giáo

dục. Đặc biệt, ở cấp vi mô, việc đánh giá này có thể tiến hành theo:

- Tác động của giáo dục đối với tình hình kinh tế - xã hội - văn hóa.

- Hiệu quả của hệ thống giáo dục.

- Các nguồn lực được sử dụng cho giáo dục.

4.1. Đánh giá tác động của giáo dục lên hệ thống xã hội - kinh tế - văn hóa

Đánh giá này tập trung vào việc thoả mãn các nhu cầu về giáo dục và

nhu cầu phát triển xã hội, kinh tế, văn hóa. Thứ nhất, việc phân tích được tiến

hành trên nhu cầu về giáo dục, các bậc tuyển sinh, khuynh hướng trẻ em ở

độ tuổi giáo dục phổ cập không đến trường, sự mất cân đối giữa về giới tính,

mất cân đối giữa các cộng đồng dân có điều kiện khó khăn, cộng đồng dân

tộc thiểu số… Thứ hai, xét về sự đóng góp của giáo dục vào phát triển kinh

tế, xã hội, văn hóa, người ta cho rằng, hệ thống giáo dục cần thỏa mãn các

nhu cầu về nguồn nhân lực có trình độ cao đã được nêu ra trong các kế

hoạch phát triển xã hội, kinh tế và văn hóa. Về vấn đề này, quá trình đánh giá

song song đặt trọng tâm vào mối quan hệ giữa giáo dục và sản xuất, vào tác

động của giáo dục đối với sự thay đổi dân trí của người lao động và vào nghề

nghiệp của những người đã hoàn thành các bậc học hoặc loại hình đào tạo

khác nhau.

Một khía cạnh khác của việc đánh giá này là sự đóng góp trực tiếp của

hệ thống giáo dục vào các mục tiêu phát triển xã hội và văn hóa. Việc đánh

giá theo hướng này gặp phải một số khó khăn, một mặt là do sự đa nghĩa của

khái niệm “phát triển xã hội và văn hóa”, mặt khác là vì sự phức tạp trong việc

đo đạc kết quả đóng góp của hệ thống giáo dục vào sự phát triển xã hội và

văn hóa. Với mục đích này, việc đánh giá cần đặt trọng tâm vào nội dung thực

tế của giáo dục để xác định xem nó đã ảnh hưởng như thế nào đến việc tạo

nên các thói quen, thái độ và nguyên tắc có lợi cho sự phát triển về xã hội và

văn hóa, nhờ đó tạo ra những lợi ích từ nội dung này.

4.2. Đánh giá hiệu quả của hệ thống giáo dục

Đánh giá này hướng vào đối tượng là việc thực hiện chức năng thực tế

của hệ thống giáo dục. Với mục đích như vậy, quá trình phân tích cần xem

xét các thông số khác nhau, cả về lượng lẫn về chất và có tính đến các

khuynh hướng đánh giá trong tuyển sinh theo các cấp học, loại hình đào tạo

cả trong và ngoài nhà trường.

Theo hướng phân tích về chất lượng giáo dục được cung cấp và các

yếu tố ảnh hưởng, việc đánh giá cần hướng vào đối tượng là giáo viên, nội

dung chương trình giảng dạy, sách giáo khoa và tư liệu giảng dạy, quản lý

giáo dục, chi phí và nguồn tài chính.

4.3. Đánh giá các nguồn lực được sử dụng trong hệ thống giáo dục

Việc đánh giá này có ý nghĩa đặc biệt quan trọng bởi các nguồn lực này

chiếm một phần khá lớn trong ngân sách quốc gia. Trong khuôn khổ của đánh

giá cuối kỳ, việc phân tích về sử dụng nhân lực và các nguồn lực tài chính,

vật chất cần đảm bảo rằng có thể xác định được ra các phương án phát triển

giáo dục có lợi nhất.

5. QUÁ TRÌNH ĐÁNH GIÁ

Một cách chung, có thể chia quá trình đánh giá thành tám giai đoạn:

(1) Định hình hoặc tái định hình các chính sách, kế hoạch, chương

trình, dự án và ngân sách giáo dục.

(2) Xác định các mục tiêu và cấp độ đánh giá.

(3) Lựa chọn các thông số.

(4) Lựa chọn các tiêu chí đánh giá.

(5) Chuẩn bị các thông số.

(6) Đo đạc và phân tích.

(7) Khuyến nghị.

(8) Đưa ra quyết định.

6. SỬ DỤNG CÁC THÔNG SỐ

Để lựa chọn các thông số, chỉ cần chọn trong số này những thông số

đã được sử dụng trong quá trình chẩn đoán và chuẩn bị kế hoạch ứng với

những vấn đề cần đánh giá. Cần lập ra một nhóm các tiêu chí đánh giá bởi

chính khái niệm đánh giá đã hàm ý việc đối chiếu với các cấp độ tối thiểu,

trung bình và tối ưu thông qua các thông số.

Để chuẩn bị các thông số, cần tuân thủ một số tiêu chí về tính chính

xác, khách quan, tính có thể đối chiếu được và tính sẵn có. Theo các vấn đề

được đánh giá, có thể chia các thông số thành hai nhóm.

Nhóm các thông số mang tính nội dung là nhóm sử dụng các thông tin

thống kê, thông tin tư liệu, thông tin khoa học và công nghệ về mối quan hệ

giữa giáo dục và sự phát triển xã hội - kinh tế - văn hóa hoặc về hiệu quả bên

trong của hệ thống.

Nhóm các thông số về quản lý là nhóm dùng để đánh giá việc thực

hiện.

Giai đoạn tiếp theo của quá trình đánh giá, giai đoạn đo đạc và phân

tích, sử dụng các thông số và chỉ tiêu. Giai đoạn này dẫn tới viện đưa ra các

khuyến nghị được sử dụng làm cơ sở cho những người có trách nhiệm ra

quyết định để điều chỉnh háy tái định hình kế hoạch sẽ thực hiện. Điều đó cho

phép giải quyết các vấn đề đã phát hiện và điều chỉnh lại các nhận xét đã rút

ra trong quá trình đánh giá.

Do đó, chu trình đánh giá kết thúc với việc bắt đầu một chu trình mới.

Đương nhiên, các kết luận và khuyến nghị chính yếu đều được đưa vào trong

các báo cáo.

7. QUÁ TRÌNH ĐÁNH GIÁ CÓ HIỆU QUẢ

Một quá trình đánh giá có hiệu quả của một kế hoạch hay chương trình

cần có tính liên quan, tin cậy, kịp thời và có tính hiệu quả.

- Tính liên quan: việc đánh giá phải áp dụng những tiêu chí có giá trị

vào việc đo đạc các mục tiêu của kế hoạch.

- Tính tin cậy: việc đánh giá phải được thực hiện một cách khách quan

để không gây nghi ngờ đối với các ý kiến đưa ra.

- Kịp thời: việc đánh giá cần được tiến hành trong suốt quá trình khai kế

hoạch và các kết quả phải sẵn sàng khi cần đưa ra quyết định.

- Hiệu quả: việc đánh giá phải hướng vào mục tiêu tối thiểu hóa chi phí

và tối đa hóa kết quả.

8. MỘT SỐ NGUYÊN TẮC ĐÁNH GIÁ

Quá trình đánh giá được coi là một quá trình cung cấp các thông tin có

giá trị và phù hợp với việc đưa ra các quyết định có liên quan. Từ định nghĩa

này có thể rút ra rất nhiều ý.

- Đánh giá phải được coi là một quá trình chứ không phải là một sản

phẩm để mối quan hệ tương tác giữa các thành phần của hệ thống đánh giá

cũng có vai trò quan trọng như các kết quả đưa ra.

- Đánh giá không chí là một sự việc bị hạn chế diễn ra trong một thời

điểm nhất định. Do các nội dung giáo dục đặt trọng tâm vào sự thay đổi nên

việc đánh gia bắt buộc phải được tiến hành đều đặn sau những khoảng thời

gian nhất định.

- Giai đoạn đầu tiên của mọi quá trình đánh giá đều cần phải có sự xác

định kỹ lưỡng các loại dữ liệu cần thiết nhất và khả thi nhất.

- Người tiến hành đánh giá cần nhận thức rằng chính quá trình thu thập

dữ liệu là quá trình đòi hỏi độ tin cậy và tính giá trị cao.

- Một nguy cơ cố hữu của quá trình phân tích dữ liệu là khuynh hướng

xử lý dữ liệu theo các kỹ thuật phân tích mà người thực hiện ưa thích nhất.

- Điều quan trọng hơn là cần kiểm tra tính giá trị của dữ liệu, ít nhất là

bên trong nếu không thể xác định bên ngoài, bởi làm đúng việc có ý nghĩa

quan trọng hơn là làm các việc trở thành đứng.

- Không được bỏ qua việc mô tả các cá nhân và tình huống đã được

lấy làm mẫu đánh giá.

- Không được coi thường tầm quan trọng của việc tìm hiểu lý do “tại

sao” của các kết quả.

- Bởi các kế hoạch đều hướng tới tương lai nên các dữ liệu đánh giá sẽ

đặc biệt có ích nếu nó giúp cho việc dự báo tình hình trong tương lai.

- Những người đưa ra quyết định quan trọng có thể không thạo về đánh

giá và thậm chí trong một số trường hợp còn không nắm rõ lắm về giáo dục.

Bởi vậy, các báo cáo đánh giá cần được diễn đạt theo ngôn ngữ dễ hiểu.

- Do quá trình ra quyết định đòi hỏi phải có những nhận xét liên quan

đến những hành động mang tính lựa chọn nên người thực hiện đánh giá

ngoài trách nhiệm đề xuất các phương án lựa chọn còn phải cố gắng tối đa

để cung cấp tiêu chí khác nhau cho người ra quyết định.

- Để các quyết định có ý nghĩa, cần có sự rõ ràng.

- Ngay cả khi việc đánh giá hướng vào các kết quả giáo dục thì các tiêu

chí nhận xét cũng phải đề cập tới các kế hoạch ban đầu để đảm bảo tính

hoàn thiện.

- Việc đánh giá các kế hoạch giáo dục không nên đứng ở chỗ kế hoạch

đã hoàn thành mà cần quan tâm đến cả việc kế hoạch đã triển khai tốt ở mức

độ nào.

9. AI LÀ NGƯỜI ĐÁNH GIÁ?

Trong rất nhiều trường hợp, những người đánh giá hay nhóm đánh giá

là những người nằm ngoài chương trình hoặc tổ chức được đánh giá. Song

có một vấn đề quan trọng hiện nay là bât cứ quá trình đánh giá nào cũng cần

chú trọng đến thành viên tham gia chương trình. Vì vậy, trong khi các chuyên

gia bên ngoài vẫn có thể được mời đến do năng lực và sự khách quan của

họ, các quyết định liên quan đến việc mời các chuyên gia này vẫn là những

quyết định có ý thức của các thành viên nằm trong hệ thống hay chương trình

được đánh giá.

Thực ra, những người đã tham gia vào giai đoạn lập kế hoạach thì

cũng cần tham gia càng nhiều càng tốt vào giai đoạn triển khai cũng như giai

đoạn đánh giá đi liền với giai đoạn triển khai đó.

Việc đánh giá có thể được coi là một phần của chu trình phát triển và

thực hiện. Và những quá trình đánh giá có sự tham gia của những người làm

nên kế hoạch tổng thể như người thiết kế, người thực hiện hoặc người thụ

hưởng có thể xem như là ít phải lo ngại hơn; do đó, cũng dễ đạt được những

kết luận có giá trị cũng như những kết luận dễ chấp nhận hơn so vói đánh giá

của những người “ngoại đạo”.

Bài 3. TỔ CHỨC MỘT CHƯƠNG TRÌNH ĐÁNH GIÁ

Ngày nay, hầu như tất cả các tổ chức từ giáo dục, dạy nghề, tư vấn…

và các dịch vụ đều tạo ra các phương pháp giúp cho con người đạt đến mục

đích của họ. Mặc dù, những vấn đề khoa học và kỹ thuật là những vấn đề

quan trọng trong môi trường kinh doanh, nhưng việc thành công trong hoạt

động thường là vấn đề của việc quản lý thành công nguồn nhân lực. Các cố

gắng để cải tiến năng suất, nâng cao tinh thần của nhân viên hoặc hoàn thiện

chất lượng sản phẩm, tất cả đều tùy thuộc vào các kỹ thuật được hoạch định

tốt, thông tin phản hồi chính xác về các ảnh hưởng của kế hoạch được áp

dụng và cách sử dụng thông tin phản hồi đó. Do đó, việc tổ chức đánh giá

chương trình hoạt động trong các lĩnh vực là việc làm cần thiết để đạt đến

hiệu quả cao hơn, hoặc cải tiến các phương pháp, cách thức cần thiết cho

chương trình hoạt động đó. Đặc biệt trong giáo dục, các trường học cần đánh

giá tính hiệu quả của các giáo viên, các chương trình chuyên môn và tính

hiệu quả của một chương trình học mói cũng cần được đánh giá trước khi

phổ biến rộng rãi sang các trường học khác.

Các chương trình giáo dục tạo thành một bộ phận chính của ngành

dịch vụ mang tính nhân văn. Các sản phẩm và mục đích của các chương

trình này khó mô tả đầy đủ được. Con người tham gia vào các chương trình

giáo dục để đạt được một trình độ học vấn hoặc để được cho phép làm các

nghề nghiệp hoặc công việc khác nhau, để học một tay nghề chuyên môn với

mục đích đạt được sự thoải mái, hoặc tự hoàn thiện, hoặc để củng cố vị thế

xã hội và để đạt đến sự phát triển trí tuệ và tâm lý.

Lý do để đánh giá các chương trình.

Có nhiều lý do để tiến hành các đánh giá chương trình. Trong số những

lý do này là:

- Thực hiện các yêu cần chứng nhận.

- Tính toán các chi phí.

- Trả lời các câu hỏi về thông tin.

- Lựa chọn các chương trình khả thi.

- Giúp các thành viên soạn thảo và cải tiến chương trình.

- Nghiên cứu các ảnh hưởng không dự kiến của chương trình.

Thông thường, các chương trình được nhà nước hay các tổ chức tài

trợ cần những đánh giá sau mỗi dự án và căn cứ trên các đánh giá, dự án đó

có được tiếp tục hay không, ở đây, trong khuôn khổ đánh giá một giáo trình,

ta xem xét đến lý do thứ năm là: “Mục đích của đánh giá là để đạt được các

thông tin để cải tiến thực tiễn và cấu trúc chương trình. Người thực hiện các

dịch vụ mang tính nhân văn cần thông tin có liên quan đến việc họ đã thực

hiện công việc tốt ở mức độ nào. Đồng thời, người đánh giá có thể cung cấp

thông tin phản hồi về người thụ hưởng dịch vụ đó xem xét những người thực

hiện. Các mối quan hệ liên cá nhân thì quan trọng đối với các nhà thực hiện

các dịch vụ mang tính nhân văn hơn là đối với con người làm công việc chỉ

đòi hỏi các tiếp xúc hời hợt với con người”.

Các loại đánh giá thông thường:

Một chương trình đánh giá có thể được tiến hành từ một số quan điểm.

Bài viết này chia đánh giá theo hai quan điểm: (1) theo loại vấn đề được đặt

ra về chương trình và (2) theo mục đích của đánh giá.

Các loại vấn đề do các người đánh giá đặt ra về chương trình được

phân làm bốn loại tổng quát: nhu cầu, quá trình, kết quả và tính hiệu quả.

1. ĐÁNH GIÁ NHU CẦU

Một đánh giá nhu cầu trả lời những câu hỏi:

- Những nét chính mang tính kinh tế xã hội của cộng đồng là gì?

- Những nhu cầu cụ thể của cộng đồng đối với loại chương trình đang

được xem xét.

- Các hình thức dịch vụ nào thu hút cộng đồng này?

Việc đo lường nhu cầu là điều kiện tiên quyết đối với việc hoạch định

chương trình hiệu quả. Ngày nay, các nhà đánh giá coi việc lập kế hoạch có

liên quan chặt chẽ với đánh giá. Thực ra, lập kế hoạch là một hình thức đánh

giá - việc đánh giá xảy ra trước khi chương trình được thực hiện.

2. ĐÁNH GIÁ QUÁ TRÌNH

Khi một chương trình được soạn thảo và bắt đầu, các nhà đánh giá sẽ

quay sang việc soạn thảo tài liệu ở mức độ chương trình được thực hiện như

đã dự thảo và sẽ phục vụ cho dân số dự kiến. Một người có thể nghĩ về quá

trình đánh giá như là việc xem xét các cố gắng được đưa vào chương trình.

Loại câu hỏi mà đánh giá quá trình cần trả lời là:

- Chương trình có hấp dẫn đủ số người tham gia?

- Số người tham gia có đại diện cho dân số dự kiến không?

- Nhân viên thực sự liên hệ với số người tham gia ở mức độ nào?

- Số công việc của nhân viên có phù hợp với những gì đã vạch ra

không?

- Có sự khác biệt giữa các thành viên trong nhóm nhân viên với cố

gắng được mở rộng không?

Trong khi các câu trả lời cho những câu hỏi này không chỉ ra là chương

trình thành công hay không, chúng vẫn quan trọng và bất cứ ai có trách nhiệm

điều hành, tài trợ hoặc mở rộng chương trình cần nghe các câu trả lời đó. Có

thể hiểu được là một kế hoạch tốt được thực hiện không phù hợp hoặc là một

chương trình thành công không phục vụ cho dân số dự kiến (dân số đó được

ủy thác và tài trợ). Các lưu ý sớm về những vấn đề như thế được việc đánh

giá quá trình cung cấp tạo cho các nhà quản lý cơ hội để điều khiển lại

chương trình và tạo cho nó cơ hội thành công.

3. ĐÁNH GIÁ KẾT QUẢ

Nếu một nghiên cứu việc thực hiện thực sự chỉ ra rằng chương trình

được đưa vào đúng nơi một cách thành công, việc đánh giá kết do người

trong chưong trình đạt được có thể trở thành trọng điểm của người đánh giá.

Ví dụ: Trong khóa học đọc tốc độ:

- Người tham gia vào khóa học cách đọc tốc độ có đọc nhanh không?

- Họ có đọc nhanh hơn những người không tham gia khóa học không?

- Có thể tìm thấy bằng chứng là việc tham gia vào khóa học tạo ra tốc

độ đọc tăng lên không?

Mặc dù hỏi những câu này là hợp lý, nhưng rõ ràng chỉ thông qua độ

dài của biện pháp đánh giá kết quả thì rõ ràng khó xác định các nguyên nhân

của sự thay đổi hành vi quan sát được ở những người tham gia.

Khi thiết kế và tiến hành đánh giá kết quả, các nhà đánh giá cần định

nghĩa các cách thức đo lường sự thành công. Các định nghĩa về các kết quả

thành công có thể thay đổi tốt nếu chúng ta so sánh các ý kiến của các nhóm

quan tâm khác nhau, như cơ quan tài trợ, nhân viên trực tiếp thực hiện

chương trình, và những người tham gia.

4. ĐÁNH GIÁ TÍNH HIỆU QUẢ

Trong chương trình có thể giúp những người tham gia, các nhà quản lý

và các nhà lập pháp cũng cần phải đáp ứng vấn đề đặt ra về chi phí. Đánh giá

tính hiệu quả đặt ra những câu hỏi sau đây:

- Chương trình có đạt được sự thành công ở một chi phí hợp lý?

- Đồng tiền có được phân phối đến các kết quả đạt được không?

- Chương trình có đạt được mức thành công tốt hơn các chương trình

khác có chi phí bằng hoặc thấp hơn trong điều hành không?

Hai tiêu chí quan trọng được sử dụng để so sánh các chương trình là

tính hiệu quả và chi phí. Nếu hai chương trình hiệu quả ngang nhau, thì

chương trình ít chi phí hơn đạt được kết quả tốt hơn tính theo tiền. Nếu một

chương trình chi phí cao hơn, hiệu quả hơn, thì vấn đề trở nên khó khăn hơn.

Có phải sự cải thiện hơn đáng giá với chi phí cộng thêm? Sự phức tạp khác

được thêm vào do hầu hết các chương trình tìm được sự thay đổi có nhiều

đặc tính. Một chương trình có thể khích lệ sự cải tiến trong nhiều lĩnh vực và

chương trình khác có thể ảnh hưởng những đặc tính khác nhau.

Hãy lưu ý rằng có một quy trình logic trong các câu hỏi đánh giá này.

Không có đo lường nhu cầu, các chương trình không thể hoạch định một

cách hợp lý, không thực hiện hiệu quả, không thể có các kết quả có ý nghĩa

từ chương trình và không có các kết quả có giá trị, không có lý do gì để lo

lắng về hiệu quả, chi phí. Sự tập trung vào vấn đề đánh giá không phù hợp

dường như tạo ra một cách đánh giá không có giá trị (Wholey, 1983).

Trên đây là những thông tin về việc đánh giá tổng quát. Tuy nhiên,

chúng ta có thể áp dụng chúng vào việc đánh giá việc giảng dạy các chương

trình cốt lõi của chúng ta để đạt mức độ hiệu quả nhăm cải tiến việc giảng dạy

một cách có kết quả hơn.

Một cách phân loại khác

Tất cả các quyết định của giáo viên và mục đích đánh giá vừa mô tả ở

trên có thể được chia thành ba loại chung (Airasian, 1997). Bảng 1.1 mô tả và

so sánh ba loại hình đánh giá này. Một số đánh giá trong lớp học giúp giáo

viên thực hiện trách nhiệm chính của mình là thành viên của nhà trường về

mặt cơ chế. Các quyết định như xếp hạng, phân nhóm, đánh giá tiến bộ, diễn

giải kết quả kiểm tra, họp phụ huynh, nhận biết các nhu cầu cần phân loại đặc

biệt của học sinh và đề nghị lên lớp là tất cả những trách nhiệm chính mà

giáo viên phải thực hiện khi đã là viên chức của hệ thống nhà trường. Đây

được gọi là đánh giá chính thức (official assessment). Các đánh giá khác

được sử dụng để lên kế hoạch và tiến hành giảng dạy bao gồm quyết định sẽ

dạy cái gì, khi nào dạy và dạy như thế nào, sử dụng tài liệu gì, bài học sẽ phát

triển ra sao và cần phải thay đổi gì trong các hoạt động lên kế hoạch sẵn. Đây

là đánh giá giảng dạy (instructional assessment).

Một loại đánh giá thứ ba được giáo viên sử dụng vào đầu năm học là

tìm hiểu đặc điểm và nhu cầu về xã hội, tri thức và hành vi của học sinh để

nâng cao việc giảng dạy, giao tiếp và hợp tác trong lớp học. Những đánh giá

này cho phép giáo viên tạo sự bình ổn trong lớp học. Chúng được gọi là đánh

giá sơ khởi. Các chương tiếp theo sẽ mô tả chi tiết hơn ba loại đánh giá tổng

quát này. Còn bây giờ điều quan trọng là nhận thức được kiểm tra đánh giá

phục vụ rất nhiều mục đích trong lớp học.

BẢNG 1.1. SO SÁNH BA LOẠI ĐÁNH GIÁ TRONG LỚP HỌC

Chính thức Giảng dạy Sơ khởi

Mục đích

Thực hiện các khía

cạnh mang tính thủ tục

hành chánh được quy

định của việc dạy học,

như là chấm điểm,

phân nhóm, và xếp

hạng.

Lên kế hoạch các

hoạt động giảng dạy

và đi theo sự tiến bộ

của việc giảng dạy.

Giúp giáo viên

nhận thức

nhanh vốn kiến

thức thực tế và

đặc điểm của

học sinh.

Kế hoạch thời gian

Định kỳ trong suốt năm

học.

Hàng ngày trong

suốt năm học.

Trong tuần đầu

hay hai tuần

đầu của năm

học.

Phương pháp thu

thập chứng cứ

Các bài thi, bài kiểm

tra, báo cáo, thi vấn

đáp và bài tập chính

thức.

Quan sát chính thức

và cho học sinh làm

bài kiểm tra viết để

lên kế hoạch; quan

sát không chính

thức để giám sát.

Phần lớn là

quan sát không

chính thức.

Loại chứng cứ thu thập

được

Chủ yếu liên quan đến

nhận thức.

Phần lớn liên quan

đến nhận thức và

tình cảm.

Liên quan đến

nhận thức, tình

cảm và hành vi

tâm vận động.

Lưu trữ dữ liệu

Các dữ liệu hình thức

được giữ trong sổ điểm

của giáo viên hoặc hồ

sơ của nhà trường.

Giáo án được viết

tay còn thông tin do

quan sát không

được viết ra.

Thông tin được

lưu giữ trong

đầu giáo viên,

một số ít được

viết ra.

Nguồn:

1. Emil I. Posavac et al, 1989, Program Evaluation - Methods and Case

Studies, New Jersey: Prentice Hall. Inc. (p. p1 - 14).

2. Airasian, P.W. 1997, Kiểm tra đánh giá trong lớp học (Classroom

Assessment (tái bản lần thứ 3). New York McGraw - Hill.

Bài 4. MỤC ĐÍCH, Ý NGHĨA CỦA VIỆC ĐO LƯỜNG KIỂM TRA ĐÁNH GIÁ TRONG GIÁO DỤC

1. MỤC ĐÍCH

Kiểm tra là công cụ hay phương tiện đo lường kiến thức, kỹ năng, kỹ

xảo của người học.

Đánh giá nhằm xác định mức độ, trình độ của người học, cụ thể là điểm

số.

Đo lường là quá trình thực hiện một lối mô tả mức độ mà một cá nhân

đã đạt được (hay đã có) một đặc điểm nào đó chẳng hạn như khá năng, thái

độ…

Kiểm tra là phương tiện của đánh giá. Còn đánh giá là mục đích của

kiểm tra. Và mục đích đánh giá quyết định nội dung và hình thức của kiểm tra.

Mục đích cơ bản nhất là phải xác định chất lượng, số lượng của giáo

dục và học tập nhằm khuyến khích trò học tốt, thầy dạy tốt. Người học học

tập và nâng cao tinh thần trách nhiệm của bản thân đối với việc học tập của

mình. Giáo viên phải kiểm tra đánh giá vì nhiều mục đích khác nhau bởi họ

phải ra nhiều quyết định. Nếu chúng ta xem lại các quyết định của giáo viên

trong suốt ngày dạy của mình, chúng ta sẽ thấy được mục đích để đánh giá

của giáo viên có ý nghĩa như thế nào. Phần còn lại của chương này tập trung

vào vấn đề và chiến lược kiểm tra đánh giá vì các mục đích sau: tạo sự bình

ổn trong lớp học, lên kế hoạch và tiến hành giảng dạy, phân loại người học,

phản hồi và khích lệ, phán đoán, xếp hạng việc học tập và mức tiến bộ.

Tạo sự bình ổn trong lớp học

Một mục đích thường bị bỏ sót của kiểm tra đánh giá là tạo sự bình ổn

trong lớp học. Lớp học là một môi trường xã hội phức tạp mà ở đó mọi người

tương tác với nhau theo muôn vàn cách. Để lớp học trở thành một môi trường

học tập và xã hội tích cực, cần phải có trật tự, kỷ luật và hợp tác. Vì vậy, giúp

đỡ người học học tập và duy trì trật tự trong lớp học có quan hệ mật thiết với

nhau. Đồng thời, để việc dạy và học thành công cũng phải cần đến việc chấp

hành kỷ luật.

Lên kế hoạch và tiến hành giảng dạy

Các quyết định về giảng dạy có thể chia thành hai loại: quyết định lên

kế hoạch và quyết định quá trình (hoặc dạy học). Khi giáo viên chọn chủ đề

cho bài học ngày mai, xem trước và chọn ra một đoạn phim ngắn cho môn

khoa học vào tuần tới, quyết định dành thêm hai ngày cho bộ sưu tập bài làm

môn thơ ca và giao bài tập về nhà chỉ một môn chứ không học thêm môn

khác. Như vậy, giáo viên đã lên kế hoạch cho các hoạt động giảng dạy cho

tương lai.

Cùng với quyết định lên kế hoạch, quá trình giảng dạy một lớp học thực

sự đòi hỏi việc đánh giá và ra quyết định thường xuyên. Vào hai thời điểm

trong ngày, giáo viên đã thay đổi cách dạy của mình vào giữa bài học vì lớp

học bắt đầu mất trật tự. Lần đầu, giáo viên ngưng bài học ngôn ngữ để ôn lại

bài của ngày hôm trước vì các câu trả lời của người học cho thấy rằng cả lớp

không nắm chắc bài. Lần khác, cô thay đổi cách dạy từ thảo luận sang làm

việc tại chỗ khi người học bắt đầu chán và mất trật tự. Rất nhiều đánh giá của

giáo viên nhằm mục đích lên kế hoạch và kiểm soát việc giảng dạy.

Phân loại người học

Hầu hết giáo viên phải ra quyết định phân loại người học. Bất cứ khi

nào giáo viên chia người học thành nhóm môn Tập đọc hoặc môn Toán, hay

tổ chức nhóm cùng nhau học tập, các cặp hay nhóm làm bài trong lớp, hoặc

đề nghị cho một người học cụ thể nào đó được học với một giáo viên cụ thể

vào năm tới, thì khi đó giáo viên sẽ đưa ra các đánh giá vì mục đích phân loại.

Đưa ra thông tin phản hồi và khích lệ

Một lý do quan trọng khác của kiểm tra đánh giá trong lớp học là đưa ra

phản hồi và khích lệ người học. Trong mỗi trường hợp, giáo viên đã sử dụng

các thông tin về sự thể hiện kỹ năng trong học tập để đưa ra phản hồi cho

người học về việc làm của các em. Thuật ngữ dùng để miêu tả ý kiến nhằm

thay đổi và cải thiện việc học tập trong khi giảng dạy được gọi là đánh giá

hình thành. Để đưa ra được các ý kiến như thế này, giáo viên phải thường

xuyên kiểm tra đánh giá việc học hành và hành vi của người học.

Chẩn đoán các vấn đề của người học

Giáo viên phải luôn luôn giám sát những người học có vấn đề về học

tập, tình cảm hoặc vấn đề xã hội trong lớp mình. Xác định được những vấn

đề này, giáo viên thính thoảng có thể tiến hành hoạt động giúp đỡ cần thiết,

nhưng đôi khi có những người học cần phải được chẩn đoán và giúp đỡ đặc

biệt ngoài lớp học. Phần nhiều dữ liệu kiểm đánh giá do giáo viên thu thập

được dùng để nhận biết, hiểu và khắc phục các vấn đề và khó khăn trong học

tập của người học.

Phán đoán giá trị, xếp loại học tập và mức tiến bộ

Một số quyết định của giáo viên liên quan đến phán đoán giá trị, xếp

loại học tập và mức tiến bộ trong nhà trường. Giáo viên chấm điểm bài kiểm

tra khoa học của người học, hoàn thành bản báo cáo tiến bộ hàng tháng của

mỗi em, quyết định tự soạn bài kiểm tra cho môn khoa học hơn là sử dụng bài

kiểm tra có sẵn trong sách giáo khoa, sửa bài tập của người học và họp với

phụ huynh. Phần lớn thời gian của giáo viên được dùng để thu thập thông tin

nhằm phán đoán giá trị người học hoặc xếp loại mức tiến bộ trong học tập

của các em. Thuật ngữ chỉ việc xếp loại hay phán đoán việc học hành của

người học sau khi dạy được gọi là đánh giá tổng kết (summative evaluation).

- Đối với người học:

Thông tin kiểm tra đánh giá sẽ giúp cho người học đào sâu kiến thức,

hệ thống hóa các kiến thức cũ. Khái quát hóa những tri thức đã được tiếp thu

và giúp họ phát triển tư duy, trí nhớ.

Giúp người học tránh được những lỗ hổng trong tri thức để kịp thời bổ

sung.

Giúp người học nâng cao tính độc lập và tích cực trong học tập, rèn

luyện thói quen tìm hiểu sâu tài liệu học tập, tham gia tích cực vào việc học

tập, thảo luận, phân tích, phê phán, rèn luyện khả năng giải quyết vấn đề

trong học tập.

- Đối với giáo viên:

Hiểu rõ kết quả của công tác giảng dạy dẫn đến hoàn thiện kết quả học

tập của người học.

Hoàn chỉnh các hình thức tổ chức và phương pháp giảng dạy để tăng

phần hữu hiệu.

Hiểu rõ trình độ học tập của người học nên hay không nên tiếp tục

nâng cao chất lượng giảng dạy cũng như lập kế hoạch cụ thể.

- Đối với nhà trường, phụ huynh và các cơ quan quản lý giáo dục:

Giúp nhà trường theo dõi được tình hình học tập của người học qua đó

đánh giá được công việc giảng dạy của giáo viên.

Giúp phụ huynh hiểu rõ về con em họ, nhờ đó tăng cường mối quan hệ

giữa nhà trường với gia đình.

Giúp các cơ quan lãnh đạo giáo dục nắm chính xác tình hình học tập

của người học để từ đó sửa chữa điều chỉnh lại chương trình và có những

biện pháp bổ sung cho thích hợp.

Trong trường học, việc đánh giá kết quả học tập của người học được

thực hiện chủ yếu thông qua việc tổ chức kiểm tra và thi cử một cách có hệ

thống với nhiều hình thức khác nhau theo những quy định chặt chẽ.

2. Ý NGHĨA

- Đối với người học:

Đối với người học, việc kiểm tra đánh giá có hệ thống và thường xuyên,

cung cấp kịp thời những thông tin “phản hồi” giúp cho người học tự điều chỉnh

hoạt động học.

- Đối với giáo viên:

Đối với giáo viên, việc kiểm tra đánh giá người học nhằm cung cấp cho

giáo viên những thông tin “phản hồi bên ngoài” giúp người dạy điều chỉnh

hoạt động dạy.

- Đối với các cấp cán bộ quản lý giáo dục:

Kiểm tra đánh giá người học cung cấp cho các cán bộ quản lý giáo dục

các cấp những thông tin cơ bản về thực trạng dạy và học trong một đơn vị

giáo dục để có những chỉ đạo, kịp thời uốn nắn những lệch lạc, khuyến khích

hỗ trợ nhằm đảm bảo thực hiện tốt mục tiêu giáo dục.

3. TIÊU CHUẨN VIỆC KIỂM TRA ĐÁNH GIÁ

Trong nhà trường, kiểm tra được xem là một phương tiện thường dùng

để đánh giá kết quả của người học, vì thế việc kiểm tra cần có ba tiêu chuẩn

đó là có giá trị, đáng tin cậy và dễ sử dụng:

* Có giá trị:

Bài kiểm tra phải thực hiện được nội dung muốn có gồm ba mặt:

- Nội dung kiểm tra phải phù hợp và bao gồm các phần quan trọng của

giáo trình sách giáo khoa và bài giảng của giáo viên.

- Sự nhất trí nội tại của bài kiểm tra phải thể hiện sự liên hệ nhất quán

trong các câu hỏi. Câu hỏi có giá trị là phải phân biệt được người học giỏi và

người học kém.

- Sự so sánh tiêu chuẩn ngoại lai: cho thấy kết quả kiểm tra phải phù

hợp với kết quả đánh giá khác có đối tượng tương tự.

* Đáng tin cậy:

Bài kiểm tra đáng tin cậy nói lên tính vững chắc của điểm số. Mức tin

cậy của bài kiểm tra tùy thuộc vào ba yếu tố:

- Vừa sức với trình độ người học.

- Không có các ảnh hưởng ngoại lai khi người học làm bài.

- Sự khách quan của người chấm thể hiện ở điểm số ổn định.

* Dễ sử dụng:

Bài kiểm tra dễ sử dụng thể hiện ở ba khía cạnh:

- Hình thức tổ chức kiểm tra: Bài kiểm tra phải soạn kỹ lưỡng, tránh các

trở ngại khi người học làm bài, phải có hướng dẫn rõ ràng, ghi thời gian làm

bài, các điểm số và tài liệu sử dụng (nếu có).

- Dễ chấm: Bài kiểm tra phải có thang điểm rõ ràng để việc chấm bài dễ

dàng và để nâng cao mức tin cậy của bài kiểm tra.

- Ít tốn kém: Để thực hiện một bài kiểm tra, các yếu tố như thời gian làm

bài, chấm bài cũng như thời gian soạn đề và phương tiện liên hệ phải được

giảm thiểu. Tuy nhiên, việc tiết kiệm này không làm thiệt hại đến tính chất

đáng tin cậy và có giá trị của bài kiểm tra. Sự tiết kiệm đúng đắn không rời

mức độ thỏa mãn mục đích của bài kiểm tra.

4. NGUYÊN TẮC VIỆC ĐÁNH GIÁ

Để việc đánh giá được chính xác và công bằng phải thể hiện các

nguyên tắc sau:

* Khách quan:

- Việc đánh giá không có tình cảm và tác nhân ngoại lai xen vào kết quả

điểm số.

- Phù hợp với trình độ thực tế kết quả học tập của người học.

- Để đạt được nguyên tắc khách quan trong đánh giá thì ta phải xác

định đúng đắn đối tượng đánh giá. Bài kiểm tra nhằm mục đích khảo sát kiến

thức, kỹ năng, kỹ xảo của người học thì việc đánh giá phải theo sát mục đích

đó.

* Dựa vào mục tiêu giáo dục:

- Mục tiêu giáo dục là khởi điểm của chương trình giảng dạy và học tập.

- Việc đánh giá là xem xét mục tiêu đã đạt được đến mức độ nào, do đó

đánh giá phải lấy mục tiêu giáo dục làm chuẩn.

* Toàn diện:

Đánh giá kiến thức, kỹ năng, kỹ xảo của người học phải bao gồm nội

dung đã được xác định.

Đánh giá không chỉ chú trọng vào kiến thức của người học mà còn cả

về tư tưởng chính trị, tác phong, thái độ.

* Đánh giá phải thường xuyên và có kế hoạch:

Kiến thức, kỹ năng, kỹ xảo cũng như với mọi hoạt động thường xuyên

của con người đều vận động và phát triển không ngừng. Do đó, kết quả đánh

giá chỉ có giá trị thực sự ngay trong thời điểm đánh giá. Chính vì vậy, việc

đánh giá chính xác phải thực hiện thường xuyên trong suốt quá trình học tập

với nhiều dạng khác nhau.

Việc đánh giá phải có kế hoạch, phải nghiên cứu thời gian và hình thức

kiểm tra thích hợp.

* Đánh giá nhằm cải tiến phương pháp giảng dạy hoàn chỉnh chương trình học:

Dựa vào cơ sở kết quả của kiểm tra và thi, giáo viên và cán bộ quản lý

giáo dục phải tìm hiểu tác nhân đưa đến kết quả để phát hiện những ưu điểm,

sửa chữa nhược điểm nhằm cải tiến phương pháp giảng dạy và sửa đổi

chương trình học cho thích hợp.

5. ƯU VÀ NHƯỢC ĐIỂM CỦA CÁC PHƯƠNG PHÁP KIỂM TRA ĐÁNH GIÁ CHỦ YẾU HIỆN NAY

* Kiểm tra vấn đáp:

- Kiểm tra vấn đáp được sử dụng bất cứ lúc nào trong quá trình dạy

học. Loại kiểm tra vấn đáp có:

- Kiểm tra cá nhân: là hình thức kiểm tra mà từng người học có nội

dung riêng.

- Kiểm tra đồng loạt: là hình thức đặt câu hỏi chung và tất cả người học

đều có thể tham gia trả lời được.

- Kiểm tra phối hợp: là hình thức tiến hành kiểm tra cá nhân và kiểm tra

đồng loạt.

+ Ưu điểm của kiểm tra vấn đáp:

- Kiểm tra vấn đáp giúp giáo viên dễ dàng nắm được tư tưởng và cách

suy luận của người học để kịp thời uốn nắn những sai sót trong nói, đồng thời

giúp người học sử dụng đúng những thuật ngữ và diễn đạt ý một cách logic.

- Người học sẽ hiểu rõ bài hơn và nhớ lâu tài liệu nhờ trình bày bằng

ngôn ngữ của mình.

- Giúp giáo viên có thể nhận định được ngay và xác định đúng trình độ

của người học nhờ hỏi thêm những câu phụ và các chi tiết bổ sung.

- Giúp giáo viên hiểu rõ trình độ của người học nhờ đó theo dõi việc

học tập của người học, dễ dàng và kịp thời phụ đạo người học kém.

- Giúp người học tích cực tham gia vào bài học tạo không khí sinh động

cho lớp học.

- Kiểm tra vấn đáp là phương tiện giúp người học mạnh dạn phát biểu ý

kiến luyện tập khả năng đối đáp, diễn đạt ý tưởng chính xác và tập cho người

học quan sát, suy nghĩ phán đoán nhanh chóng.

+ Nhược điểm của kiểm tra vấn đáp:

- Kết quả trả lời của một số người học không thể coi là đại diện cho cả

lớp. Điểm số của một vài người học không giúp cho giáo viên đánh giá đúng

mức trình độ chung của cả lớp.

- Áp dụng kiểm tra vấn đáp cho cả lớp mất nhiều thời gian.

- Các câu hỏi phân phối cho người học có độ khó không đều nhau.

- Những yếu tố ngoại lai có thể dẫn đến sự chủ quan của giáo viên.

* Kiểm tra thực hành:

Kiểm tra thực hành rất hạn chế chỉ dùng đối với kỹ năng, kỹ xảo nghề

nghiệp: cách thức thao tác, sử dụng công cụ lao động. Kiểm tra quá trình thực

hiện một sản phẩm hay các bước tiến hành một thao tác.

- Đối với kiểm tra thành phẩm thực hành thì mục đích kiểm tra là đánh

giá sản phẩm làm ra của người học dựa vào các tiêu chuẩn kỹ thuật đã được

phổ biến trước. Các tiêu chuẩn kỹ thuật bao gồm các yêu cầu về hình dáng

kích thước, phẩm chất, thời gian thực hiện, số lượng, những sai số cho phép.

- Đối với kiểm tra thao tác thực hành thì trong thời gian kiểm tra, giáo

viên phải theo dõi, quan sát người học thực hành từ đầu đến cuối. Trong việc

kiểm tra thao tác thực hành, giáo viên căn cứ vào tiêu chuẩn để đánh giá cụ

thể là tiêu chuẩn thao tác, tiêu chuẩn kỹ thuật và tiêu chuẩn nội quy.

+ Ưu điểm của kiểm tra thực hành:

Có thể nói đây là phương pháp kiểm tra hữu hiệu nhất và không loại

kiểm tra nào có thể thay thế được để đánh giá kỹ năng, kỹ xảo tay nghề.

+ Nhược điểm của kiểm tra thực hành:

- Đòi hỏi thời gian để thực hiện và đòi hỏi giáo viên phải theo dõi suốt

quá trình.

- Vì phải theo dõi cùng một lúc nhiều người học nên giáo viên không

thể theo dõi một cách cẩn thận. Để hạn chế điểm này việc theo dõi thực hành

cần từ 2 đến 6 người cùng một lúc.

- Kiểm tra thực hành chỉ khảo sát nội dung giới hạn ở phạm vi thực

hành thôi.

- Để kiểm tra và đánh giá kỹ năng, kỹ xảo của người học được khách

quan chính xác thì các phương tiện, dụng cụ, trang thiết bị, máy móc, phải

được chuẩn bị đầy đủ và đạt tiêu chuẩn.

* Kiểm tra viết:

Có trắc nghiệm chủ quan (loại luận đề, tự luận, loại câu hỏi ngắn và

trắc nghiệm khách quan.

Loại trắc nghiệm chủ quan

Thường kiểm tra định kỳ sau khi học xong một chương trình hay một

phần, hoặc học kỳ, thời gian kiểm tra là một tiết trở lên. Loại kiểm tra này đòi

hỏi người học diễn đạt kiến thức, kỹ năng bằng cách viết ra giấy trong thời

gian nhất định. Thời gian ấn định tùy thuộc tầm quan trọng và mục đích của

bài kiểm tra viết.

+ Ưu điểm của kiểm tra chủ quan:

- Trong một thời gian ngắn có thể kiểm tra toàn thể người học trong lớp

về một số nội dung nhất định.

- Người học có đủ thời gian để suy nghĩ, vận dụng kiến thức và trình

bày đầy đủ hiểu biết của mình, đồng thời phát huy được năng lực sáng tạo.

- Qua bài kiểm tra viết nắm được tình hình trình độ chung của lớp và

của từng người học, giúp giáo viên hoàn thiện nội dung bài giảng, phương

pháp dạy học để từ đó có kế hoạch bồi dưỡng người học khá và phụ đạo

người học kém.

+ Nhược điểm của kiểm tra chủ quan:

- Nội dung kiểm tra mặc dầu rộng nhưng cũng không bao trùm nội dung

toàn bộ chương trình ấn định mà thường tập trung vào một số nội dung quan

trọng nhất định. Chính vì vậy người học sẽ dễ học tủ.

- Nếu đề bài quá rộng đòi hỏi thang điểm phức tạp thì việc đánh giá sẽ

khó khăn.

- Kết quả kiểm tra thường chịu ảnh hưởng qua cách trình bày, chữ viết

và cách hành văn của người học.

Lọai trắc nghiệm khách quan:

+ Ưu điểm loại trắc nghiệm khách quan:

- Độ tin cậy cao (điểm số không phụ thuộc vào người chấm).

- Bài chấm nhanh, chính xác, có thể kết hợp chấm bằng máy.

- Khảo sát được toàn bộ nội dung chương trình môn học, tránh việc học

tủ, yếu tố may rủi trong thi cử.

+ Nhược điểm loại trắc nghiệm khách quan:

- Không khảo sát được diễn biến tư duy của người học khi làm bài.

- Đòi hỏi giáo viên làm chủ chuyên môn và có kiến thức soạn thảo câu

hỏi trắc nghiệm.

- Tốn công sức, tiền của, thời gian.

- Người học có khuynh hướng đoán mò khi làm bài trắc nghiệm.

- Khó soạn những câu có giá trị đồng đều.

- Kiểm tra bằng trắc nghiệm thì đề thi phải in sẵn, phải tổ chức chặt chẽ

tránh sự thông đồng (cử chỉ - tiếng nói) tiêu cực trong thi.

6. CÁC VẤN ĐỀ ĐẠO ĐỨC VÀ TRÁCH NHIỆM

Cho đến hiện nay chúng ta đã xem xét nhiều khía cạnh kỹ thuật của

kiểm tra đánh giá trong lớp học. Tuy nhiên, kiểm tra đánh giá không chỉ là một

hoạt động kỹ thuật; nó còn là một hoạt động nhân bản có ảnh hưởng và tác

động đến nhiều người trong đó bao gồm người học, phụ huynh, thầy cô giáo,

huấn luyện viên, những người tư vấn tuyển sinh và các nhân viên khác nữa.

Hãy suy nghĩ về nhiều loại hình và mục đích kiểm tra đánh giá khác nhau đã

được miêu tả trong chương này, và sau đó nghĩ về tất cả mặt ảnh hưởng mà

chúng tác động lên con người. Điều này giúp bạn nhận thức được phương

diện nhân bản của kiểm tra đánh giá.

Dạy học là một nghề đòi hỏi nền tảng về kiến thức lẫn đạo đức. Giống

như những người có chuyên môn sâu như bác sĩ chẳng hạn, họ có kiến thức

và chuyên môn mà bệnh nhân không có và những hành vi và xét đoán của họ

ít nhiều ảnh hưởng đến bệnh nhân của mình theo nhiều cách khác nhau,

người thầy giáo đứng lớp có trách nhiệm cư xử theo một khuôn mẫu đạo đức.

Trách nhiệm này đặc biệt quan trọng trong quá trình giáo dục bởi vì không

giống như hầu hết các ngành nghề khác, người học không được lựa chọn sẽ

hoặc không đi học. So với thầy giáo, người học cũng ít kinh nghiệm và

thường dễ bị ảnh hưởng hơn. Trong số các tiêu chuẩn đạo đức xuyên suốt

mọi phạm vi giảng dạy là nhu cầu đối xử với người học như một cá thể để

tránh xúc phạm thể chất và tình cảm của người học, để tôn trọng tính đa

dạng, trung thực về mặt trí tuệ với người học, tránh tình trạng thiên vị và quấy

rối, đưa ra một quan điểm cân bằng về các vấn đề nêu ra trong khi dạy học,

và truyền đạt những kiến thức tốt nhất có thể cho tất cả người học

(Fenstermacher, 1990; Clark, 1990; Strike và Soltis, 1991).

Nói một cách đơn giản, mỗi tiêu chuẩn đạo đức này đều đề cập đến

một số khía cạnh về sự công bằng của giáo viên trong cách đối xử với người

học của mình. Rõ ràng việc thu thập và diễn giải dữ liệu đáng tin cậy và có giá

trị để ra quyết định là cơ sở cho sự công bằng trong các đánh giá của giáo

viên. Các khía cạnh khác của tính công bằng này bao gồm:

(1) Thông báo với người học về các yêu cầu của giáo viên trước khi bắt

đầu dạy học và kiểm tra đánh giá;

(2) Dạy cho người học những gì các em sẽ được kiểm tra trước khi

đánh giá;

(3) Không đưa ra những ý kiến vội vàng và “chỉ mặt đặt tên” người học

theo lối “dán nhãn hiệu” do cảm tính ví dụ như “hay lo ra”, “liều mạng”, “chậm

tiêu”,… trước khi bạn dành thời gian với những người học đó;

(4) Tránh rập khuôn người học theo kiểu “Thằng đó đần lắm”, “Mấy đứa

đến từ vùng đó hay gây rối lắm”, hoặc “Học trò mà ăn mặc kiểu đó chẳng

quan tâm gì đến học hành hết”;

(5) Tránh dùng các từ ngữ và ví dụ có thể xúc phạm đến những người

học khác giới, chủng tộc, tôn giáo, văn hóa hoặc quốc tịch;

(6) Tránh thành kiến với người học có vốn ngoại ngữ hạn chế hoặc kinh

nghiệm văn hóa khác nhau khi dạy học và đánh giá (Airasian, 1997; McMillan,

1997). Có nhiều phương diện về tính công bằng trong lớp học.

Thêm vào đó còn có các lưu ý về đạo đức có thể áp dụng riêng cho

kiểm tra đánh giá. Giáo viên trực tiếp giảng dạy luôn ở vị trí có thể thu thập

được rất nhiều thông tin về vấn đề học hành, cá nhân, xã hội và gia đình của

người học. Nhưng ngoài việc tiếp cận được các thông tin như thế, người giáo

viên còn sử dụng thông tin đó để ra quyết định có thể có tầm ảnh hưởng ngắn

hoặc dài hạn đối với người học. Ví dụ, cơ hội vào đại học và nghề nghiệp

tương lai, ở đây không tính đến lòng tự trọng của người học, thường lơ lửng

theo các quyết định từ kiểm tra đánh giá của giáo viên. Kết quả là có những

vấn đề trách nhiệm liên quan đến việc thu thập và sử dụng thông tin đánh giá.

Giáo viên phải luôn cố gắng thu thập được những thông tin có giá trị và đáng

tin cậy khi đưa ra quyết định quan trọng có thể ảnh hưởng đến người học.

Hơn nữa, một khi thu thập được thông tin đánh giá, giáo viên có trách nhiệm

bảo đảm tính riêng tư, nhận biết các hạn chế của việc ra quyết định và không

bao giờ sử dụng thông tin đó để hạ thấp hoặc nhạo báng bất kỳ một người

học nào.

Chương này chỉ ra rằng lớp học là một môi trường phức tạp đòi hỏi

giáo viên phải ra quyết định trong nhiều lĩnh vực. Trong một môi trường như

thế, chúng ta không trông đợi giáo viên phải luôn chính xác trong mọi quyết

định. Điều này có thể là một tiêu chuẩn không thực tế, nhất là trong bối cảnh

lớp học hay thay đổi, cần phải ra nhiều quyết định và xảy ra nhiều tình huống

khó xác định. Tuy nhiên, chúng ta nên mong đợi giáo viên có thể đạt được độ

chính xác cao và luôn gắn với đạo đức khi đưa ra những chứng cứ đánh giá

chắc chắn nhằm hỗ trợ cho các quyết định và hành động trong lớp học. Đây

là điều tối thiểu chúng ta có thể trông đợi trong một môi trường mà hành vi

của giáo viên có ảnh hưởng vô cùng quan trọng đến người học.

BẢNG 1.2: NHỮNG TIÊU CHUẨN ĐẠO ĐỨC TRONG MỐI QUAN HỆ THẦY - TRÒ

Cam kết với người học

Nhà giáo dục phải cố gắng giúp từng người học nhận thức được rằng

mình có khả năng trả thành một thành viên xứng đáng và có ích cho xã hội.

Do đó, người thầy phải làm việc để động viên tinh thần học hỏi lĩnh hội tri

thức, hiểu biết và sự cân nhắc hình thành các mục tiêu thích hợp của người

học. Để hoàn thành nghĩa vụ đối với người học người thầy phải:

1. Không cản trở vô lý những hành động độc lập của người học trong

quá trình học tập.

2. Không phủ nhận vô lý cách tiếp cận các quan điểm khác nhau của

người học.

3. Không cố tình lấp liếm hoặc bóp méo những vấn đề liên quan đến sự

tiến bộ của người học.

3. Luôn nỗ lực để bảo vệ người học tránh khỏi những điều kiện tác hại

đến việc học hành hay sức khỏe và sự an toàn cá nhân.

4. Không cố ý đặt người học vào những tình huống lúng túng hoặc mất

thể diện.

5. Không vì chủng tộc, giới tính, tín ngưỡng, xuất xứ, tình trạng hôn

nhân, quan điểm chính trị hoặc tôn giáo, nền tảng gia đình, xã hội hoặc văn

hóa, hay định hướng giới tính mà:

a. Không cho người học tham gia vào một chương trình nào đó.

b. Từ chối không giúp đỡ một người học nào đó.

c. Thiên vị một người học nào đó.

6. Không dùng các mối quan hệ nghề nghiệp với người học để vụ lợi.

7. Không được tiết lộ thông tin về người học mà người thầy có được

trong quá trình giảng dạy, trừ khi bắt buộc phục vụ cho một mục đích nghề

nghiệp nào đó hoặc do luật pháp yêu cầu.

Nguồn:

1. Arasian, P.W. (1997), Kiểm tra đánh giá trong lớp học (Classroom

Assessment; tái bản lần thứ 3, New York: McGraw-Hill.

2. Từ NEA Handbook, 1992-1993, Tái bản với sự cho phép của Hiệp

hội Giáo dục quốc gia (NEA).

3. Dương Thiệu Tống (1995), Trắc nghiệm và đo lường thành quả học

tập, Bộ Giáo Dục - Đào Tạo: Trường ĐH Tổng Hợp Tp. HCM.

Bài 5. MỘT SỐ TÁC DỤNG CỦA VIỆC ĐÁNH GIÁ

Việc đánh giá nói chung, đánh giá trong trường học nói riêng từ trước

đến nay được thực hiện theo một quy trình nhất định trong xã hội cũng như

trong nhà trường.

Hiện nay, công việc đánh giá trong nhà trường được xem xét một cách

nghiêm túc hơn và được đưa vào chương trình đào tạo giáo viên. Sau đây,

chúng ta cùng nhau xét một số tác dụng của việc đánh giá trong giáo dục.

1. KHÁI NIỆM ĐÁNH GIÁ

Kỹ thuật dùng để đánh giá hành vi của con người có một lịch sử lâu dài.

Các trắc nghiệm thể hiện sức mạnh và sức chịu đựng thể chất, như các trắc

nghiệm thông thường trong xã hội tiền sử, chắc chắn cần phải đi ngược dòng

lịch sử nhiều ngàn năm. Ngay cả phương pháp trắc nghiệm chính thức như

các trắc nghiệm viết xuất hiện từ khi lịch sử được ghi lại. Vì thế, người Trung

Quốc đã có hệ thống thi cử được tổ chức cao trước Công nguyên.

Ngược lại, khái niệm đánh giá là một khái niệm xuất hiện không lâu

lắm. Mầm mống của khái niệm được nói đến trong tác phẩm của Rice, vào

thập kỷ cuối của thế kỷ XIX, đã tìm thấy các dữ kiện thực nghiệm để đưa ra

đề xuất giảng dạy và học tập theo phương pháp 3R (Rice nhận thấy số lượng

bài tập luyện tập dùng vào môn học như chính tả thì quá nhiều, thời gian bị

lãng phí nên dùng vào những mục tiêu khác. Kết quả đạt được là ông đã nghĩ

ra một bài trắc nghiệm và cho người học làm bài rộng rãi để so sánh thành

tích của người học đã dùng khối lượng tri thức khác nhau làm bài tập luyện

tập. Trên cơ sở của các dữ kiện trắc nghiệm, ông kết luận rằng thời gian thực

sự được dùng để luyện tập là yếu tố ít quan trọng nhất trong việc xác định kỹ

năng viết chính tả của người học).

Rice đã đi trước thời đại và mãi cho đến nhiều thập niên sau phong trào

đánh giá bắt đầu ảnh hưởng đến nền giáo dục nhà trường. Kể từ đó đến nay

có nhiều nghiên cứu về đánh giá ở phạm vi rộng rãi trong giáo dục và hàng

ngàn nghiên cứu về giảng dạy và học tập. Hơn nữa, những người đi đầu

trong phong trào này đã làm rõ việc hình thành mục đích và các giả định làm

nền tảng cho việc đánh giá, nghiên cứu giáo dục. Có nhiều quan điểm tuyệt

vời về đánh giá mà không cần thiết phải phát triển quan điểm này rộng rãi

hơn.

Theo một quan điểm, đánh giá là nhiệm vụ căn bản của nhà giáo. Đó là

một trong bốn nhiệm vụ căn bản trong việc soạn thảo chương trình học hoặc

vạch kế hoạch giảng dạy mà chúng ta có thể phân biệt. Đây là bốn nhiệm vụ:

(1) Xác định các mục tiêu của một khóa học hoặc chương trình muốn

đạt đến.

(2) Lựa chọn các nội dung học tập giúp đạt đến các mục tiêu này.

(3) Tổ chức những nội dung học tập để nó mang tính liên tục, nối tiếp

cho người học và giúp người học thống nhất những nội dung học tập có vẻ

riêng biệt đó.

(4) Xác định mức độ đạt được của các mục tiêu.

Quan điểm này đặt trên giả định rằng giáo dục là một quá trình để thay

đổi kiểu loại hành vi của con người. Kết quả của quá trình này, ta hy vọng

rằng các cá nhân sẽ thâu nhận những ý tưởng trước đây họ không có, hoàn

thiện các phương pháp suy nghĩ, phát triển óc thẩm mỹ và tính nhạy cảm, bổ

sung thái độ của họ, đồng thời hoàn chỉnh các phương pháp nảy sinh khác.

Nó tuân theo khái niệm giáo dục là các loại thay đổi mà một nhà dục

tìm cách thực hiện các mục tiêu giáo dục của mình. Những mục tiêu căn bản

của nền giáo dục là ảnh hưởng đến sự thay đổi theo cách một cá nhân suy

nghĩ, cảm nhận và hành động.

Quá trình đánh giá là quá trình xác định tính hiệu quả của khóa học

hoặc chương trình trong việc thực hiện sự thay đổi cần thiết như thế. Theo

quan điểm ở trên, đánh giá là mặt thống nhất của việc soạn thảo chương trình

học và giảng dạy. Điều này được minh họa một cách sơ lược trong hình dưới

đây, tạo ra mối quan hệ hỗ tương giữa các yếu tố chính trong một chương

trình giáo dục được hoạch định tốt.

Vì thế, các mục tiêu được coi là cơ sở để soạn thảo cả nội dung học

tập lẫn các phương pháp đánh giá. Đến lượt, nội dung học tập và phương

pháp đánh giá giúp làm rõ các mục tiêu. Hơn nữa, các hoàn cảnh được dùng

để giảng dạy tạo ra sự so sánh cho việc đánh giá và thật ra có thể đưa ra

những hướng dẫn tốt cho việc đánh giá. Vì thế, các phương pháp đánh giá

đưa ra bằng chứng về tính hiệu quả của nội dung học tập, về việc đạt được

chính các mục tiêu. Vì thế, có khả năng của mối tác động giữa những yếu tố

khác nhau này, mỗi yếu tố có ảnh hưởng tiềm tàng trên các yếu tố khác.

2. SO SÁNH QUÁ TRÌNH GIẢNG DẠY VÀ ĐÁNH GIÁ

Giảng dạy

(1) Giảng dạy mang tính hiệu quả khi nó dẫn đến các thay đổi cần có ở

người học.

(2) Các kiểu loại hành vi mới được người học học tập tốt nhất khi họ

nhận ra tính không phù hợp của hành vi hiện có và tầm quan trọng của việc

làm rõ kiểu hành vi mới.

(3) Các kiểu hành vi mới có thể được phát triển một cách hiệu quả hơn

khi các thầy giáo hiểu biết các loại hành vi hiện có của các người học cụ thể

và các lý do để giải thích các hành vi đó.

(4) Việc học tập được khuyến khích bằng các vấn đề và các hoạt động

đòi hỏi sự suy nghĩ hoặc và hành động của mỗi người học.

(5) Các hoạt động cung cấp nền tảng cho việc giảng dạy và học tập của

hành vi chuyên biệt nào đó cũng là những hoạt động phù hợp nhất cho việc

gợi lại và đánh giá sự phù hợp của hành vi đó.

Đánh giá

(1) Đánh giá mang tính hiệu quả khi nó cung cấp các bằng chứng về

mức độ thay đổi ở người học.

(2) Đánh giá giúp cho việc học tập tốt khi nó cung cấp và khuyến khích

việc tự đánh giá.

(3) Đánh giá đóng góp vào việc dạy tốt khi nó làm bộc lộ các loại hành

vi không phù hợp chính và các nguyên nhân phụ.

(4) Đánh giá quan trọng nhất trong học tập khi nó cho phép và khuyến

khích việc thực hiện các sáng kiến cá nhân.

(5) Các hoạt động hoặc luyện tập được phát triển cho các mục đích

đánh giá hành vi chuyên biệt cũng rất hữu ích trong việc giảng dạy và học tập

hành vi đó.

Như vậy, đánh giá không khác việc giảng dạy về mục tiêu, về phương

pháp hoặc về tài liệu và có thể phân biệt với giảng dạy chỉ khi mục tiêu chính

yếu là đưa ra quvết định thành tích của một người học ở cuối thời điểm của

việc giảng dạy.

3. CÁC MỤC ĐÍCH CỦA ĐO LƯỜNG VÀ ĐÁNH GIÁ

Đánh giá có thể dùng với nhiều mục đích, một số mục đích trung tâm

và những mục đích khác chỉ mang tính bên ngoài hoặc không quan trọng.

Các mục đích trung tâm là xác định tính hiệu quả của khóa học, các chương

trình giáo dục và cung cấp cơ sở để hoàn thiện chúng. Nhưng những kỹ thuật

được soạn thảo để phục vụ cho các mục đích trung tâm, các dữ kiện được

thu thập, thực ra là quá trình trọn vẹn, tự đưa chúng vào các sử dụng quan

trọng khác. Tuy nhiên, trong thực tế, một số nhiệm vụ chúng ta sắp xem xét

thường được thực hiện một cách độc lập với các nhiệm vụ của bất cứ

chương trình đánh giá chính thức nào.

3.1. Xác định tính hiệu quả của khóa học và chương trình

Nhu cầu đánh giá chưa bao giờ khẩn thiết như ngày nay. Một số sức

ép đã tạo ra sự thúc đẩy cho nhu cầu này: sự tiến công vào nền giáo dục hiện

đại, việc ghi danh gia tăng và sự gia tăng chi phí. Những sức ép này sẽ bắt

buộc nhà giáo dục tìm kiếm các bằng chứng về tính hiệu quả của các chương

trình hiện có và các phương pháp mới để thực hiện công việc đó.

Nhu cầu đánh giá đặc biệt cao hơn khi trường phổ thông hoặc một

trường đại học đưa ra một chương trình mới. Vào lúc đó có nhiều điều không

chắc chắn - và một số điều nhầm lẫn - về tính hiệu quả tiềm ẩn của chương

trình mới này.

3.2. Kiểm nghiệm giả định về các thực hành cho sẵn

Mỗi chương trình, thực ra mỗi khóa học, khi được giảng dạy, đều được

đặt trên một số giả định nào đó. Mục đích chính của đánh giá là kiểm nghiệm

tính giá trị của những giả định này để việc làm đúng đắn có thể được tiếp tục

và những việc làm không đúng được bỏ đi.

Phạm vi của những giả định như thế thay đổi nhiều và được liệt kê

trong danh sách như các ví dụ dưới đây:

- Người học sẽ phát triển thói quen và kỹ năng viết một cách hiệu quả

nếu nhiệm vụ này được đặt hoàn toàn trên các giờ Tập làm văn.

- Một giáo trình dạy khoa học trong phòng thí nghiệm mang tính giới

thiệu sẽ phát triển sự hiểu biết tốt và đưa đến việc đánh giá cao phương pháp

khoa học.

- Việc đọc các tiểu sử của các nhân vật lịch sử xuất sắc sẽ khắc sâu

vào tâm trí người học các giá trị xã hội có trong cuộc sống của những nhân

vật này.

- Một khi người học đọc được một thứ tiếng nước ngoài, ta có thể dễ

dàng dạy chúng nói.

- Người học nào có nhu cầu lưu trữ thông tin tốt về các hiện tượng tự

nhiên hàng ngày sẽ phát triển khả năng giải thích những hiện tượng này nhờ

các nguyên tắc khoa học.

- Một giáo trình cung cấp thông tin cho việc định hướng nghề nghiệp

dành cho ngưòi học năm cuối ở trung học và sinh viên đại học năm thứ nhất

sẽ củng cố việc chọn nghề đúng đắn.

- Các giáo trình nhấn mạnh trên việc giải thích và phân tích các tác

phẩm gốc trong một lĩnh vực cũng giúp cho người học có nhu cầu lưu trữ khối

lượng lớn tri thức về lĩnh vực đó.

Các giả định giống như thế này đã được kiểm nghiệm qua các nghiên

cứu chính thức và có những dữ liệu về tính giá trị của chúng. Bằng chứng cho

thấy hầu hết những giả định nêu trên không thể chấp nhận được; giả định

cuối cùng là một ngoại lệ. Tuy nhiên, điều quan trọng không phải là những kết

quả về danh sách các giả định riêng biệt này. Tốt hơn là những niềm tin như

thế cần được kiểm nghiệm trong các hoàn cảnh ở trường do các nhà giáo

dục, người có thể và sẵn sàng bỏ thời gian ra thu thập các chứng cứ phù

hợp.

Ý tưởng ban đầu của nhà giáo dục cho rằng yêu cầu loại này không

phải là việc của họ, mang tính kỹ thuật cao quá họ không thể tiến hành được

và các kết quả của việc họ làm khó có giá trị. Không có gì hơn sự thật, nếu

chúng ta nhìn vào những kinh nghiệm của các nhà thực hành đã làm việc với

“công việc nghiên cứu”. Nhà giáo dục có thể kiểm nghiệm nhiều việc làm của

họ bằng các phương pháp như thế, và mặc dù những việc làm này có thể

thiếu sự chính xác của các phương pháp nghiên cứu, chúng có thể giúp các

nhà giáo dục cải tiến các việc làm riêng của họ.

3.3. Làm rõ các mục tiêu

Sự thật là việc giảng dạy tốt có thể tiến hành mà không cần sự xác định

một cách rõ ràng mục đích của người thầy dựa vào hành vi của người học.

Các mục đích đó làm rõ những hoạt động được thực hiện nhưng không được

viết ra. Hoặc các hoạt động được viết ra bằng các thuật ngữ tổng quát. Cả hai

điều kiện này đều không thỏa mãn mục đích đánh giá.

Để đánh giá bất cứ khóa học hoặc chương trình nào hoặc để nghĩ ra

bất cứ phương pháp đánh giá nào, điều quan trọng là định nghĩa các mục

đích bằng hành vi của người học. Ngược lại, hiểu đúng đắn bằng chứng nào

cần tìm là điều không thể được. Vì vậy, đánh giá tạo ra cả sự thử thách lẫn

cơ hội để làm rõ các mục tiêu giáo dục.

3.4. Lựa chọn và cân nhắc các mục tiêu

Một trong những nhiệm vụ chính của nhà giáo dục là xác định các mục

tiêu giáo dục. Đánh giá có thể giúp nhà giáo dục ở đây là cung cấp các dữ

kiện về tình trạng hoặc tiến bộ của người học.

Trắc nghiệm thành tích học tập được cho người học làm trước một

khóa học có thể làm bộc lộ các thiếu sót cần phải bổ sung. Ví dụ, có thể xảy

ra tình trạng người học có khái niệm sai lầm về một loại tri thức hoặc có tình

trạng hứng thú đọc của người học thường thường hẹp. Những “lỗ hổng” như

thế được phát triển sẽ đưa ra các đề xuất cho các đích giáo dục.

Vào cuối mỗi khóa học hoặc chương trình, người ta thu thập các dữ

kiện, mà khi so sánh với các dữ kiện trước đó, sẽ đưa ra chỉ số về sự tiến bộ

của nhóm. Các dữ kiện về mức độ hoàn chỉnh giúp chỉ ra rằng các thay đổi

(mục tiêu) cần thiết có thực hay không. Khả năng có thể đạt được là một tiêu

chuẩn quan trọng cần phải được xem xét trong việc lựa chọn hoặc đánh giá

một mục đích giáo dục.

3.5. Phát hiện và hiểu các khó khăn trong học tập

Gần như bất cứ phương thức đánh giá nào cũng có thể giúp phát hiện

những khó khăn trong học tập và một số phương thức có thể giúp ngay cả

việc chẩn đoán các khó khăn nữa. Đánh giá, nếu được thực hiện thường

xuyên, có thể cung cấp các dữ kiện về các điểm yếu của các cá nhân người

học và cả nhóm. Ví dụ, nó có thể làm bộc lộ ra rằng người học đang theo học

gặp khó khăn trong việc phát hiện ra các giả định căn bản trong việc thảo luận

và rằng nhiều người học nhầm lẫn giữa ý kiến với sự kiện được coi là bằng

chứng cho việc kết luận. Từ đó, những mục tiêu riêng biệt này không được

nhận ra.

Việc khám phá những khó khăn riêng biệt như thế làm cho quá trình

phản hồi thông tin có thể xảy ra ở cả người học lẫn giáo viên. Việc phản hồi

thông tin đó đến người học cung cấp cho họ những ý tưởng về việc học tập

của mình, để những người học nào chưa đạt được trình độ có thể biết những

khiếm khuyết nào cần sửa đổi. Tương ứng với điều này, việc phản hồi thông

tin đến các thầy giáo cung cấp cho họ một nền tảng đúng đắn hơn cho việc

bổ sung giảng dạy.

Quá trình khám phá những khó khăn riêng biệt này có những gợi ý

trong việc lựa chọn mục tiêu, có sự kiện một số đông người học gặp khó khăn

trong việc đạt đến những mục tiêu nào đó không nhất thiết có nghĩa là những

mục tiêu đó không thể đạt được và vì thế không phù hợp với những người

học đó. Nó chỉ có nghĩa là dưới điều kiện đặc biệt của việc giảng dạy những

mục tiêu đó không đạt được một cách đầy đủ. Khả năng đạt được một mục

tiêu luôn luôn có liên quan đến phương pháp giảng dạy cũng như tiềm lực

của nhóm. Cũng có thể là việc bổ sung giảng dạy sau đó sẽ đưa các mục tiêu

để hầu hết người học có thể đạt được.

3.6. Vạch kế hoạch giảng dạy

Mặc dù mối tác động qua lại giữa đánh giá và giảng dạy vừa được bàn

thảo, chúng cần được nhấn mạnh hơn và minh họa rõ hơn.

Việc thu thập dữ liệu với mục đích vạch kế hoạch giảng dạy có thể ra ở

bất cứ lúc nào trong giảng dạy, ngay cả trước và đôi lúc sau việc giảng dạy.

Lợi điểm to tát của việc cho làm trắc nghiệm trước là nó cho phép giáo

viên biết bắt đầu dạy ở trình độ nào (hoặc thực ra trình độ của khóa học mình

bắt đầu). Nó nói lên thực trạng của người học - phạm vi sự chính xác của tri

thức về môn học, sự hiểu nhầm các khái niệm, việc nắm vững các kỹ năng

cần thiết ban đầu,… Bằng những thông tin được tùy nghi sử dụng như thế,

giáo viên ở một vị thế tốt để hoạch định việc giảng dạy hơn là trong hoàn

cảnh không có thông tin.

Trong quá trình giảng dạy, việc đánh giá cẩn thận sẽ làm bộc lộ nhóm

tiến bộ mức nào và điểm nào người học còn kém. Trong một khóa học căn

bản về vật tư và quá trình cơ khí, một giảng viên nhận thấy rằng sinh viên có

khuynh hướng suy nghĩ là luôn luôn có một lời giải “đúng” cho mỗi bài toán.

Có lẽ thái độ này có từ những năm đầu đi học là có các bài tập về môn Toán

hoặc Khoa học thực sự một lời giải. Sinh viên cơ khí cần phải nhận thấy rằng,

một cách tương tự, nhiều yếu tố chính xác định cách giải một bài toán cơ khí,

chứ không phải đáp án ít tốn kém nhất và rằng có nhiều cách giải có thể chấp

nhận được. Việc nhận ra thái độ ở trên thúc đẩy giảng viên đặt nặng nghệ

thuật vào cơ khí. Quan điểm này được giảng viên nhấn mạnh qua các bài

giảng, thảo luận và qua việc phân tích những cách giải khác nhau cho các bài

toán tương tự làm tại lớp.

Đánh giá cũng cung cấp những dữ kiện hữu ích để vạch kế hoạch vào

cuối khóa học. Lợi điểm của trắc nghiệm sau khóa học được nói lên ở chỗ

khác. Trong giáo trình ở trường trung học về các vấn đề xã hội cần giải quyết

hiện nay, người ta nhận thấy rằng, sau một năm, người học đòi hỏi có nhiều

thông tin hơn về những vấn đề này và các vấn đề này đã làm thay đổi một ít

thái độ hướng về xã hội rộng lớn hơn và ích kỷ hơn; nhưng thái độ của người

học thì nhầm lẫn và không nhất quán hơn trước đó; người học chưa đạt được

kỹ năng phân tích vấn đề xã hội, khả năng giải thích các dữ kiện xã hội thì tệ

hơn, bởi người học rút ra những kết luận thiếu cơ sở hơn trước đây. Sau khi

xem xét những kết quả này, hội đồng giáo viên kết luận rằng có quá nhiều tài

liệu được viết ra (trên 6000 trang) và không có đủ thời gian để giải thích, phân

tích và áp dụng một cách có phê phán. Vì vậy, đối với năm học sau, hội đồng

giáo viên quyết định giảm số lượng những vấn đề chính từ 21 xuống còn 7 và

giảm khối lượng tài liệu đọc xuống hơn một nửa để sử dụng nhiều thời gian

hơn trong việc phân tích và để xử lý các tài liệu liên quan. Một cuộc đánh giá

được tiến hành vào cuối năm học sau cho thấy rằng, mặc dù người học chưa

đạt toàn bộ thông tin đòi hỏi, chúng đã đạt được tính nhất quán hơn trong các

thái độ xã hội kỹ năng tốt hơn trong việc phân tích các vấn đề xã hội, và có

thể rút ra những khái quát tốt hơn từ các dữ kiện được trình bày cho chúng.

Những kết quả này ủng hộ giả thuyết khóa học năm trước đã dạy quá nhiều

điều không cần thiết. Ví dụ có phần mang kịch tính này nói lên một cách rõ

ràng cách đánh giá có thể giúp cải tiến chương trình và giảng dạy.

3.7. Kích thích học tập

Có thể lặp lại rằng từ trước người ta đã chứng tỏ rằng trắc nghiệm có

ảnh hưởng đến học tập. Không còn nghi ngờ gì những điều người học đặt

trọng tâm học tập tùy thuộc nhiều vào điều chúng mong đợi ở kỳ thi hơn là tùy

thuộc vào bất cứ sự xác định chính thức về các mục tiêu khóa học. Vì vậy,

trong một trường học người ta đã nhận thấy rằng ở các kỳ thi tổng hợp gồm

những câu hỏi thuộc tri thức trong khi việc giảng dạy đặt trọng tâm trên kỹ

năng giải quyết vấn đề, thì người học có khuynh hướng học thuộc lòng các tri

thức (và bỏ qua nhiều điều trong giảng dạy) để thi đậu. Ngược lại, khi các kỳ

thi là các kỳ thi thuộc loại cho tham khảo tài liệu, thì người học không cố gắng

để nhồi nhét, nhưng trong khi học thi người học tìm cách áp dụng các

phương pháp và nguyên tắc của khóa học vào tình huống và vấn đề mới.

Rõ ràng là trắc nghiệm có thể có những ảnh hưởng xấu không mong

muốn trên học tập. Để trắc nghiệm là một trong những ảnh hưởng quan trọng

nhất thì các kỳ thi nên nhất quán với các mục tiêu, phương pháp giảng dạy và

tài liệu. Vì thế, khi nhất quán, các kỳ thi và các phương pháp đánh giá khác có

thể giúp kích thích người học theo hướng đúng đắn.

Quá trình đánh giá có thể giúp kích thích học tập ít nhất bằng hai cách

quan trọng:

(1) Qua việc khuyến khích giáo viên làm rõ các mục tiêu để người học

biết sử dụng thời gian học cái gì. Người học có vẻ chấp nhận và học tập đạt

đến mục tiêu rõ ràng đối với chúng hơn là đạt đến các mục tiêu mơ hồ. Mục

tiêu rõ ràng tạo ra ý nghĩ và phương hướng học tập.

(2) Qua việc đưa ra cho người học bằng chứng thường xuyên về sự

tiến bộ của bản thân để họ biết cách thức học tập. Tri thức về sự tiến bộ chỉ

ra cho người học mức độ hoàn thiện của chúng và khuyến khích họ tiến lên

một cách tự tin đến các mục tiêu cao hơn. Do vậy, khi người học khám phá

sự không phù hợp trong hành vi của bản thân, họ cảm thấy phải vượt qua

chúng.

3.8. Hướng dẫn

Một trong những mục đích quan trọng nhất của việc đánh giá là cung

cấp những dữ kiện hữu ích cho việc hướng dẫn mỗi cá nhân người học. Việc

khám phá ra các khó khăn trong học tập, việc làm rõ các mục đích giáo dục

và việc phản hồi các bằng chứng về sự tiến bộ đến các mục tiêu ngắn hạn, tất

cả tạo thành các hình thức hướng dẫn. Nhưng ngoài những dịch vụ này vẫn

còn những thứ khác giúp cho cá nhân người học qua các quá trình liên tục,

mang tính thuyết phục của sự điều chỉnh và trưởng thành. Loại soạn thảo này

là điểm chủ yếu của hướng dẫn được nhận thấy ở đây.

Dưới quan điểm này, hướng dẫn là một quá trình giúp người học làm rõ

hứng thú và các mục tiêu dài hạn của họ, để vượt qua các khó khăn hoặc để

thỏa mãn nhu cầu riêng và một cách tổng quát đạt được mức độ tự bộc lộ

hợp lý. Ở mỗi mức độ, điều này có nghĩa là giúp người học vạch kế hoạch

giáo dục của bản thân trong mối quan hệ với nhu cầu riêng, lựa chọn lĩnh vực

chuyên môn và học tập đạt đến các mục tiêu giáo dục quan trọng.

Một chương trình đánh giá liên tục tự nó sẽ thâm nhập vào những

phương diện phát triển rộng lớn hơn này - rộng lớn hơn theo ý nghĩa là vượt

hoơn bất cứ lĩnh vực hoặc trọng tâm trong việc giáo dục người học. Nó có thể

soi sáng kiểu phát triển của người học và làm rõ các yếu tố, đặc biệt là các

yếu tố xúc cảm có thể ngăn cản sự phát triển tốt: Một chương trình như thế

có thể tìm câu trả lời cho các câu hỏi sau đây:

Người học thuộc loại người nào? Người học muốn trở thành loại người

nào? Người học muốn đóng vai trò nào trong những năm trước mắt?

Hiện nay các hứng thú và các mục tiêu người học đó thể hiện phù hợp

như thế nào với loại người của người học đó? Các khả năng có thể có của

người học có duy trì được các hứng thú và mục tiêu đó không? Những hứng

thú và mục tiêu này có chứng tỏ đủ mạnh để kích thích sự trưởng thành của

người học đó? Mặt nào của nhân cách người học cần được xem xét để làm

cho người học đó theo đuổi được những mục tiêu này và mặt nào làm trở lực

mà người học đó phải đối đầu?

Trường hợp này có thể đóng góp gì vào sự phát triển đầy đủ nhất các

điểm mạnh và khắc phục các yếu điểm của người học đó? Tài liệu nào, hoạt

động nào và kiểu nhân cách nào trong trường sẽ hữu ích nhất cho sự phát

triển của người học?

Các câu trả lời cho những câu hỏi rộng lớn như thế phải từ các thông

tin khác riêng biệt về từng người học. Những thông tin này không thể có được

từ các điểm số cho theo mẫu tự như quy định hoặc từ các hướng dẫn tóm tắt

tương tự như thế. Chỉ có một chương trình đánh giá liên tục, tổng hợp có thể

cung cấp các dữ liệu cần thiết cho các loại hướng dẫn được nêu ra ở đây.

3.9. Lựa chọn

Ở một phạm vi nào đó, mỗi trường học đều phải thực hiện việc lựa

chọn người học. Trong các trường đại học, việc lựa chọn có lẽ được quan

tâm nhiều hơn vì các trường nhận thức được vai trò cung cấp một trình độ

học vấn cao cấp cho một số lượng những người học có khả năng hơn trình

độ hiện có ở các trường trung học. Triết lý giáo dục hiện có ở trình độ tiểu học

và trung học tương phản rất rõ với triết lý này, bởi vì việc lựa chọn ở các

trường tiểu học và trung học bị từ chối khi nó không phù hợp với niềm tin cho

rằng mỗi đứa trẻ hoặc mọi thanh niên đều có quyền đòi hỏi cơ hội để phát

triển tốt nhất các năng khiếu của mình. Tuy nhiên, nhiều trường trung học,

đặc biệt là trường tư, thực hiện việc lựa chọn bởi vì các trường này thích thỏa

mãn các nhu cầu của những người học có khả năng về mặt học thuật có

khuynh hướng về mặt kỹ thuật hoặc có tài năng về mặt nghệ thuật. Trong một

xã hội dân chủ không nên có những chống đối với loại mục đích đặc biệt này.

Cũng không chống đối việc thực hiện việc lựa chọn người học cho những

khóa học đòi hỏi các phẩm chất cao, ngay cả trong những trường cố gắng

đáp ứng nhu cầu của tất cả thanh niên.

Đánh giá có thể đóng góp vào việc lựa chọn qua việc cung cấp các dữ

kiện về các kiểu loại trưởng thành mong đợi ở người học và các mức độ khả

năng hay tiềm năng khác nhau và bằng các kiểu nhân cách khác nhau. Để

thực hiện mục tiêu này, việc đánh giá đòi hỏi nhiều dữ kiện về các cách hình

thành nhân cách và khả năng phân biệt của người học. Cần thiết phải biết

được các loại thay đổi xảy ra trong các loại người học đặc thù, để trường học

có thể phân biệt loại người học học tập được với loại người học không học

tập được. Chắc chắn là một trường có đầy đủ lý do trong việc lựa chọn những

người học có thể đạt được mục tiêu của trường đó.

3.10. Sắp xếp người học vào lớp

Ngay cả khi người học được lựa chọn để theo học một trường học

hoặc một chương trình đặc biệt, theo từng nhóm, các người học này có

khuynh hướng thể hiện các mức độ khác biệt cá nhân rộng lớn trong các đặc

điểm của tính tiêu biểu giáo dục. Mức độ này sẽ biện hộ cho việc điều chỉnh

trong các loại khóa học và ở mức độ các người học có tiến bộ được. Theo

một ý nghĩa nào đó, sự điều chỉnh như thế là một hình thức của sự hướng

dẫn và theo ý nghĩa khác, chúng là hình thức của việc lựa chọn. Do tính quan

trọng của chúng, chúng xứng đáng quan tâm riêng biệt ở đây.

Việc sắp xếp người học vào lớp là một quá trình bắt đầu đưa người học

vào một điểm trong một chương trình hay sự nối tiếp các khóa học ở đó khả

năng tiềm tàng hoặc khả năng được chứng minh thể hiện được. Có lẽ, quá

trình này thông thường nhất ở cấp đại học. Nhiều trường sắp xếp người học

thi vào theo học các lớp như viết luận tiếng Anh, Toán học, Hóa học… Phần

lớn người học sẽ được xếp vào các phần thông thường của giáo trình nhập

môn, nhưng một số sẽ được sắp xếp vào các phần nâng cao hoặc được miễn

theo yêu cầu. Những người học kém chất lượng được sắp xếp ngay cả vào

các phần ôn tập.

Có hai cách tiếp cận hơi khác nhau. Một cách tiếp cận nhấn mạnh khả

năng học tập và cách khác nhấn mạnh trên quá trình học tập. Tính phù hợp

của cả hai lối tiếp cận này tùy thuộc vào khóa học hoặc tính liên tục. Trong

môn Toán của năm thứ nhất, cách tiếp cận đầu thì thông thường. Sinh viên

có thể đến học với những căn bản Toán học khác nhau, để một trắc nghiệm

tổng quát về sự hiểu biết và kỹ năng Toán học đưa ra một chỉ số tốt về khả

năng học tập Toán năm thứ nhất. Điểm số trắc nghiệm chỉ ra mức độ học tập

có thể. Trong ngoại ngữ cách tiếp cận khác thì thông thường. Nó đặt cơ sở

trên một chuẩn mực được thiết lập một cách cẩn thận nói lên mức độ khả

năng mong đợi của người học ở cuối nhiều khóa học theo trình tự. Ở đây,

bằng chứng về sự thành thạo (quá trình học tập) xác định mức độ nào người

học sắp xếp vào.

Thông qua các dữ liệu tích lũy về các mức độ của khả năng thường

thường đạt được ở các mức khác nhau theo trình tự, một chương trình đánh

giá có thể cung cấp một cơ sở vững vàng cho các phương pháp sắp xếp

người học. Đến lượt nó, sự sắp xếp có thể đóng góp vào việc nối kết tốt hơn

của trường trung học và đại học bằng cách làm nhanh quá trình học cho

người học nào đạt được một số mục tiêu chính của chương trình ở đại học.

Việc tăng quá trình học của người học học giỏi là một trong những nhu cầu

cấp bách của đại học Hoa Kỳ.

3.11. Cấp giấy chứng nhận

Công bình mà nói, công tác chứng nhận việc hoàn thành khóa học cho

người học không phải là mục đích chính của việc đánh giá được định nghĩa ở

đây. Tuy nhiên có điều đúng là các dữ liệu thu thập được trong việc làm như

thế có thể phục vụ cho nhiều mục đích quản lý khác nhau như: cho điểm,

khen thưởng, tốt nghiệp, báo cáo cho cha mẹ, báo cáo cho các trường khác

và cho các nơi làm việc trong tương lai.

Ngay cả ở đây, cơ sở lý thuyết của đánh giá có thể dẫn đến việc cải

tiến việc cấp giấy chứng nhận theo truyền thống. Trong ví dụ đầu tiên nó có

thể khuyến khích việc tường trình điểm số nói lên mức độ khả năng có được

hơn là vị trí tương đối trong một nhóm. Qua việc liên quan của nó đến nhiều

phương diện của sự phát triển người học đánh giá cũng có thể khuyến khích

các báo cáo mang tính phân tích về sự hoàn thành nhiệm vụ học của người

học, hoặc bổ sung vào các điểm chữ điểm số thông thường.

3.12. Đào tạo và phát triển nhân viên của tổ chức

Trong khi theo đuổi các mục đích như thế như được nêu ra làm lợi cho

cá nhân ngưòi học, đánh giá cũng có thể làm lợi cho giảng viên. Đánh giá

cung cấp một phương tiện mạnh mẽ để phát triển nhân viên tại chức liên tục.

Các hoạt động do việc tiếp cận đánh giá đòi hỏi cung cấp những cơ hội

tuyệt vời cho một giảng viên trưởng thành về nghề nghiệp. Đó là sự thách

thức thực sự khi cần phải xác định các mục đích giảng dạy của một giảng

viên như các thay đổi mong đợi ở hành vi của người học, khi cân đối giá trị

của những mục tiêu này với các khả năng khác, liên hệ việc giảng dạy của

giảng viên với các mục đích được xác định càng chặt chẽ càng tốt, tìm ra các

hoàn cảnh sẽ đưa ra các bằng chứng có giá trị về việc đạt được các mục đích

của người học và tìm cách cải tiến giáo trình hoặc chương trình. Những giải

đáp mà một giảng viên trả lời cho các thách thức này tạo ra kinh nghiệm

chính cho sự trưởng thành.

Lợi điểm thực sự của cách tiếp cận đánh giá là nó củng cố cách tiếp

cận khách quan, sáng tạo việc giảng dạy. Sự thách thức nói trên đây bây giờ

trở thành tiêu điểm của việc chú ý, chứ không phải là giảng viên và nhân cách

của bản thân ông. Bằng cách này chúng giúp ngăn chặn sự phòng thủ về

phía giảng viên và củng cố sự suy nghĩ sáng tạo về công việc của mình. Khi

một giảng viên tiếp tục đặt các vấn đề hay về việc giảng dạy và ảnh hưởng

của nó trên người học và khi giảng viên đó tiếp tục tìm kiếm các câu trả lời

hay cho những vấn đề này, anh ta đã áp dụng việc đánh giá như là phương

pháp suy nghĩ, hành động. Và khi anh ta thực hiện điều này, anh ta đã giải

phóng sức lực trong bản thân mình bảo đảm cho sự trưởng thành được tiếp

tục.

4. CÁC KỸ THUẬT ĐỂ THỰC HIỆN CÁC MỤC ĐÍCH

Sự đa dạng các kỹ thuật thì cần thiết để phục vụ rất rộng rãi các mức

độ mục tiêu như các mục tiêu vừa được tóm lược. Việc dựa trên một số

phương thức đã được tôn vinh một thời như trắc nghiệm dùng giấy và viết chì

sẽ khó thực hiện. Một bức tranh mang nhiều mặt của sự phát triển người học

đòi hỏi việc sử dụng nhiều loại kỹ thuật thu thập bằng chứng. Ví dụ, để đạt

được các bằng chứng về các phương pháp suy nghĩ đòi hỏi không những các

trắc nghiệm về khả năng bằng giấy và viết chì để đánh giá đúng những kỹ

thuật khác được thiết kế để phát hiện các phương pháp đặc trưng tiến đến sự

đánh giá của sinh viên. Các kỹ thuật bổ trợ có thể là kỹ thuật phỏng vấn và

qua kỹ thuật này người học cố gắng vạch lại suy nghĩ của mình hoặc ghi nhận

sâu sắc lời nói của mình khi anh ta cố gắng giải quyết vấn đề hoặc trả lòi các

câu hỏi thành lời. Những kỹ thuật bổ sung này thì cần thiết để đạt đến quá

trình tư duy được bộc lộ một cách không hoàn toàn bằng trăc nghiệm giấy và

viết chì.

Trong số những loại kỹ thuật quan trọng hơn như các kỹ thuật dưới

đây: trắc nghiệm giấy và viết chì, trắc nghiệm hoạt động (của kỹ năng cơ

động và các thứ cùng loại), trắc nghiệm bằng cách chiếu phim, quan sát hành

vi trong các tình huống đời thường, quan sát hành vi trong tình huống trắc

nghiệm và các phương pháp phỏng vấn và bút vấn. Đây không phải là một

danh sách đầy đủ nhưng nó chỉ đưa ra một sôố ý tưởng về phạm vi các khả

năng.

5. CÁC VẤN ĐỀ CẦN GIẢI QUYẾT LÀM CƠ SỞ CHO CÁC LOẠI KỸ THUẬT

Mặc dù có sự khác nhau giữa các kỹ thuật khác nhau được sử dụng,

các kỹ thuật có nhiều điểm chung. Không kể đến hình thức hay các mục đích

dự định của chúng, các kỹ thuật được dùng để đo lường, mô tả, hoặc đánh

giá hành vi của con người cần phải giải quyết một số vấn đề cơ bản. Những

vấn đề này là:

(1) Xác định đánh giá cái gì - có nghĩa là các đặc tính, đặc điểm của

hành vi con người và các ảnh hưởng của nó.

(2) Định nghĩa các đặc điểm hành vi đó.

(3) Lựa chọn các tình huống phù hợp để phát huy hết các loại hành vi

này

(4) Nghĩ ra một số phương pháp để ghi lại loại hành vi này.

(5) Nghĩ ra một số phương pháp để tóm tắt hoặc đánh giá hành vi đã

được ghi lại.

Nói tóm lại, việc đánh giá trong trường học là một việc làm mang lại

nhiều lợi ích cho việc học tập, giảng dạy và giáo dục. Tuy nhiên, công việc

đánh giá không thể thực hiện băng một phương pháp đơn lẻ nào mà là tập

hợp các phương pháp và kỹ thuật theo những thông số được quy định chặt

chẽ. Đặc biệt, qua trình bày trên đây, chúng ta cũng dễ dàng nhận thấy rằng

đánh giá được thực hiện ở tất cả các giai đoạn hoạch định kế hoạch, soạn

thảo chương trình, biên soạn nội dung và kiểm tra kiểm soát,… và muốn thực

hiện các giai đoạn này một cách hiệu quả ta phải đặt trên cơ sở mục tiêu giáo

dục.


1. Edward J. Furst (1961), Constructing Evaluation Instruments, New

York, Longmans, Green and Co.

2. Trần Bá Hoành (1995), Đánh giá trong giáo dục, Hà Nội.

3. Louis C. Johnson (1989), Social work Practice: A Generalist

Approach Boston, Allyn and Bacon.

4. Emil J. Posavae et al (1989), Program Evaluation, New Jersey,

Prentice Hall.

Bài 6. MỤC TIÊU, NỘI DUNG VÀ CHỨC NĂNG CỦA VIỆC ĐÁNH GIÁ HOẠT ĐỘNG GIẢNG DẠY

Về mặt từ nguyên, “đánh giá” có nghĩa là ước lượng giá trị, xác định giá

trị. Như vậy, đánh giá bao hàm sự phán xét giá trị. Áp dụng giáo dục, chúng

ta có thể định nghĩa một cách tổng quát đánh giá là việc xác định giá trị hoặc

ước lượng giá trị của quá trình giảng dạy - học tập.

1. HAI HÌNH THỨC CHÍNH CỦA ĐÁNH GIÁ

Đánh giá một sự vật (ví dụ một dụng cụ, một hoạt động, một quá trình)

có thể được tiến hành bằng hai phương pháp khác nhau.

- Nhận xét sự vật qua kết quả của nó tùy theo một mục tiêu đã xác

định;

- Nhận xét bản thân sự vật tùy thuộc vào các chỉ tiêu đã xác định mà sự

vật đó cần đáp ứng.

Cả hai cách làm này có thể coi như cách làm bổ sung. Thật vậy, một sự

vật nào đó có hiệu suất kém, ta có thể đưa bản thân sự vật ra xem xét một

cách chính xác hơn để tìm ra lời giải thích cho tình trạng kém hiệu suất đó.

Cả hai hình thức đánh giá này cũng được áp dụng trong hoạt động

giảng dạy.

- Người ta có thể xem xét những gì là kết quả, tác động, hiệu suất hoạt

động này sinh ra ở người học, nhất là trong khi phải xác định người học đạt

được mục tiêu giảng dạy tới mức độ nào. Cách này gọi là đánh giá sản phẩm

hoặc đánh giá hiệu suất.

- Ta có thể đánh giá trực tiếp hoạt động giảng dạy theo các bộ phận

cấu thành khác nhau của nó, như bản thân các mục tiêu, các nội dung, các

hình thức của công việc giảng dạy và các công cụ nhờ chúng mà ta thu được

kết quả, cũng như các điều kiện mà trong đó ta đã đạt được hiệu suất; cách

đánh giá này gọi là cách đánh giá quá trình; khi xem xét ghi nhận này, ta nhận

thức được tính chất bổ sung của nó so với cách đánh giá sản phẩm.

Đánh giá quá trình giảng dạy là một cách làm tương đối mới thu hút

được sự chú ý nhất là trong thập kỷ vừa qua. Trước đây, người ta đánh giá

việc giảng dạy hầu như chỉ bằng một cách duy nhất là căn cứ vào kết quả đạt

được của người học. Mô hình đầu tiên có tính hệ thống để đánh giá hiệu suất

đã được Taylor, người Mỹ, soạn thảo vào những năm ba mươi của thế kỷ XX.

Thành tựu này định hướng cho phần lớn các nghiên cứu về đánh giá giảng

dạy thời gian sau đó.

Trong những năm năm mươi của thế kỷ XX, phong trào đổi mới các

chương trình giảng dạy, ở Mỹ bắt đầu với các môn Toán và Khoa học sau đó,

với các ngành Văn học và các môn Nghiên cứu xã họi. Cố gắng này đã làm

nảy sinh đồng thời nhu cầu đánh giá kết quả của việc đổi mới chương trình

giảng dạy này. Do đó, đánh giá đã được lồng ghép vào khuôn khổ của việc

xây dựng các chương trình giảng dạy. Mục tiêu của việc làm này là đóng góp

vào hoạt động sửa đổi, bổ sung các chương trình giảng dạy. Khi thực hiện ý

định này, người ta nhanh chóng nhận ra rằng khái niệm đánh giá của Taylor

là quá hẹp và không đủ sức để cải tiến nền giáo dục một cách trực tiếp được.

Đồng ý là, việc xác định kết quả học tập cho phép vạch ra những điểm yếu

trong giáo dục, nhưng bằng cách đó, người ta vẫn chưa tìm ra biện pháp then

chốt để giải thích các thiếu sót này, một điều kiện tiên quyết cho một sự thay

đổi có hiệu quả. Để đạt tới mục tiêu đó, cần thiết phải tiến hành việc điều tra

trực tiếp đối với hoạt động giảng dạy, tức là tiến hành đánh giá quá trình.

2. MỤC ĐÍCH CỦA ĐÁNH GIÁ GIẢNG DẠY

Đánh giá hoạt động giảng dạy rõ ràng không phải là mục đích tự nó.

Như chúng ta đã thấy, mục tiêu của nó là để giúp đỡ tiến hành những thay

đổi, nghĩa là đóng góp vào cải tiến hoặc tối ưu hóa quá trình giảng dạy.

Thay đổi giáo dục bao giờ cũng đi đôi với sự lựa chọn giữa những

phương án sẵn có, nghĩa là thay đổi và thích ứng các phương tiện giảng dạy

đã được sử dụng, hay nói một cách khác, việc này bao gồm một quá trình để

quyết định. Sự đóng góp của việc đánh giá được xem xét như là một hoạt

động nằm trong khuôn khổ của quá trình để quyết định này. Nó bao gồm việc

thu thập thông tin làm cơ sở để đưa ra các quyết định có liên quan đến những

thay đổi phải tiến hành vì từ những thay đổi này, người ta chờ đợi chúng sẽ

cải tiến được việc giảng dạy.

Những quyết định nhằm cải tiến một quá trình hoặc một hệ thống được

xác định phần lớn bởi những dữ liệu có liên quan đến những chất lượng và

những thiếu sót của các yếu tố, các thành phần của quá trình hoặc hệ thống

đang được bàn đến. Việc này cũng có ý nghĩa cả đối với các quyết định giảng

dạy. Đồng thời, chúng cũng đã chỉ ra bản chất của các thông tin mà việc đánh

giá cần được thu thập, đặc biệt là những dữ liệu có giá trị về giảng dạy, tính

hữu ích từ hiệu suất của các khía cạnh hoặc các biến đổi khác nhau trong

quá trình giảng dạy - học tập và những dữ liệu về những tác động qua lại của

các biến đổi đó. Ví dụ, những mục tiêu ta cố đạt tới có đáng để ta theo đuổi

không? những tình huống của hoạt động giảng dạy có thỏa đáng để thực hiện

những mục tiêu đề ra hay không? Những tình huống giảng dạy này liệu có

thỏa đáng với trình độ xuất phát của người học hay không?

Từ các nguyên tắc trên, người ta có thể suy ra những vấn đề mấu chốt

của công tác đánh giá giảng dạy:

- Xác định các đối tượng đánh giá, hay nói một cách khác, xác định

những khía cạnh của hoạt động giảng dạy và các mối tác động lẫn nhau của

chúng, những khía cạnh này là đối tượng của đánh giá. Tất nhiên, việc vạch

ra giới hạn này cần dựa trên sự phân tích về hoạt động giảng dạy.

- Xây dựng các phương pháp đánh giá, nghĩa là các phương pháp và

các phương tiện kỹ thuật cho phép thu thập một cách khách quan và đầy đủ,

những dữ liệu mô tả về các thay đổi môn học.

- Xác định các tiêu chuẩn đánh giá, nghĩa là các tiêu chuẩn để ta cũng

có thể nhận định được giá trị và tính hiệu quả của các thay đổi trong giảng

dạy.

3. NHỮNG CHỨC NĂNG KHÁC NHAU CỦA VIỆC ĐÁNH GIÁ

Mục đích của đánh giá bao giờ cũng như nhau, đặc biệt là để tập hợp

các thông tin có tính chất đánh giá về chủ đề các thay đổi trong giảng dạy,

những thông tin mà ta có thể dựa vào đấy để ra những quyết định nhằm tối

ưu hóa việc giảng dạy. Tuy nhiên, những quyết định nhằm cải tiến giáo dục

và các tình huống xung quanh những quyết định đó có thể khác nhau về bản

chất. Như vậy, chức năng và vai trò của việc đánh giá sẽ khác nhau tùy theo

tình huống ra quyết định đánh giá. Sau đây một vài chức năng quan trọng của

đánh giá:

3.1. Đánh giá và xây dựng chương trình giảng dạy

Hiện nay đánh giá chiếm một vị trí quan trọng trong việc xây dựng các

chương trình giảng dạy. Việc xây dựng chương trình giảng dạy là một việc

quan trọng và lâu dài. Để đảm bảo đến mức tối đa có thể của chất lượng sản

phẩm cuối cùng của hoạt động này, nên đánh giá thường xuyên, nếu không

thì cũng nên định kỳ đánh giá sản phẩm này trong giai đoạn xây dựng để có

thể tạo ra những điều chỉnh và thích ứng. Việc đánh giá này, được hoàn

thành trong quá trình xây dựng chương trình giảng dạy gọi là đánh giá hình

thành. Như vậy người ta thực hiện (và đánh giá) dự án thử nghiệm về một

chương trong những chương trình giảng dạy lớp thí điểm. Việc đánh giá này

có thể bao gồm những hoạt động sau: quan sát giáo viên và người học trong

quá trình giảng dạy; ghi chép các kinh nghiệm và phê phán của thầy và trò;

đánh giá hiệu suất bằng một bài kiểm tra viết… Những thông tin thu thập

được có thể cung cấp những dấu hiệu về những khó khăn gặp phải trong việc

áp dụng chương trình giảng dạy và cả những thiếu sót và điểm yếu của

chương trình. Như vậy, những dữ liệu tập hợp lại có thể cung cấp được

những dấu hiệu quý báu để xem xét lại và sửa đổi bổ sung dự án.

Đánh giá một chương trình giảng dạy đã được thực hiện gọi là đánh giá

tổng kết. Ngay cả khi một chương trình giảng dạy xác định đã được đánh giá

một cách đầy đủ, nhằm mục đích xem xét lại mục tiêu và tính hiệu quả, ta nên

đánh giá sản phẩm cuối cùng trước khi phổ biến trong cộng đồng. Việc đánh

giá này thu thập những thông tin mà những người sử dụng chương trình

giảng dạy trong tương lai có thể dựa vào đó để làm cơ sở cho quyết định là

họ có nên hay không nên đưa nó vào trong trường học của mình.

Ngoài các chức năng hình thành và tổng kết, việc đánh giá còn có thêm

một chức năng thứ ba nữa phù hợp với việc soạn thảo và áp dụng các

chương trình giảng dạy. Thật vậy, việc đánh giá chương trình dạy vẫn còn

cần thiết, sau khi nó đã được chấp nhận đưa ra áp dụng trong giáo dục. Ở

đây, chúng tôi muốn nói đến sự đánh giá liên tục. Sở dĩ phải làm việc đánh

giá thường xuyên này là nhằm kiểm tra lại xem chương trình giảng dạy áp

dụng trong thực tế liệu có được thỏa đáng hay không và dựa trên những dữ

liệu thu thập được để có thể nhận được sự hỗ trợ và góp ý kiến của các nhà

thực hành. Nhưng dữ liệu của sự đánh giá liên tục này đồng thời có thể là

hữu ích đối với các nhà biên soạn các chương trình giảng dạy. Thật vậy, khi

chương trình giảng dạy được sử dụng trong thực tế không gạt bỏ khả năng

sẽ được sửa đổi bổ sung sau đó.

Các đánh giá hình thành, tổng kết và liên tục đối với chúng ta cũng

quan trọng để soạn thảo sách giáo khoa và làm ra những công cụ giảng dạy.

Một sự thật ở thời đại hiện nay là tư liệu học tập được sản xuất thừa thải,

nhưng về giá trị giảng dạy người ta còn đang mò mẫm vì thiếu những điều tra

đánh giá có giá trị.

3.2. Đánh giá liên trường và đánh giá ở trường hoặc ở trong lớp

Việc đánh giá công tác giáo dục được chỉ định theo một chương trình

nào đó, có thể nằm trong phạm vi liên trường: một số trường học cũng tham

gia vào một công trình nghiên cứu có tính chất đánh giá, được thiết kế và

soạn thảo chi tiết bởi những cấp cán bộ có thẩm quyền trong công tác trong

các trường tham gia đánh giá.

Các mục tiêu đặc thù của những nghiên cứu có tính chất đánh giá, ta

có thể kể ra như sau: xác định hiệu suất học tập và nhất là những điểm yếu

của công tác giáo dục; phản ánh những góp ý cho giảng viên về áp dụng

chương trình dạy học; thu thập những thông tin để soát lại chương trình; thu

được những kết quả học tập dễ so sánh hơn bằng cách trình bày những cơ

sở vững vàng nhằm phổ biến những hướng dẫn về giảng dạy cho người học,

đặc biệt là trong khuôn khổ lãnh đạo và định hướng.

Ngay cả khi đã có đánh giá liên trường kiểu này, mỗi thầy giáo (môi

trường) đánh giá việc giáo dục của mình vẫn là việc cần phải làm. Vả lại,

thông thường việc đánh giá liên trường có liên quan không phải đến toàn bộ

công tác giáo dục, mà chỉ một phần của công tác này mà thôi. Vì vậy, bản

thân giáo viên phải liên tục tiến hành việc đánh giá để: 1) Kiểm tra và phân

tích chất lượng và hiệu quả giảng dạy của mình để cải tiến nó; (2) Phát hiện

trở ngại và thiếu sót trong mỗi người học để khắc phục, đóng góp để xây

dựng và phát triển ở người học một thái độ có tính chất đánh giá (tự đánh giá

bản thân).

Các khái niệm đánh giá hình thành và đánh giá tổng kết được bàn trên

đây đã được Benjamin S. Bloom áp dụng để đánh giá quá trình giảng dạy -

học tập cụ thể được thực hiện ngay trong lớp học. Trong trường hợp này,

đánh giá tổng kết có nghĩa là đánh giá một kết quả học tập đạt được bởi các

người học khi kết thúc một lớp học, một kỳ dạy học hoặc toàn bộ chương

trình. Đánh giá định hình có liên quan đến việc sử dụng “các trắc nghiệm nhỏ

chuyên dùng để chẩn đoán tiến bộ có thể được áp dụng cho những loạt

những nhiệm vụ học tập tương đối ngắn”. Vì vậy, cần phải bàn đến một hệ

thống nghiên cứu chẩn đoán được lồng ghép vào trong tình huống giảng dạy.

3.3. Đánh giá hiệu suất của một nhóm và đánh giá hiệu suất của một cá nhân

Khi thực hiện đánh giá có thể trước tiên nhằm vào tác dụng và hiệu

suất của giáo dục đối với một cá nhân người học. Ví dụ: Người học thực hiện

được các mục tiêu ở mức độ nào? Trả lời cho câu hỏi này đồng thời là việc

xác định yếu tố nào quyết định có liên quan đến sự tiến bộ (hoặc phương

hướng) của các cá nhân người học. Một khía cạnh chủ yếu thứ hai của việc

đánh giá hướng về cá nhân người học là phát hiện những yếu kém và khó

khăn ở người học cũng như nguyên nhân gây nên những trở ngại đó; từ đó,

tạo điều kiện thuận lợi để giúp đỡ và hướng dẫn họ một cách thỏa đáng.

Như vậy, ta có thể nhận thấy có sự chồng chéo về những chức năng

khác nhau của đánh giá. Đánh giá liên trường có thể áp dụng cho cả một

nhóm cũng như cho các cá nhân người học; đánh giá trong một trường học

cụ thể có thể làm theo nhóm, nhưng phần lớn là làm theo cá nhân. Đánh giá

trong khuôn khổ xây dựng chương trình giảng dạy (định hình, tổng hợp, tiếp

tục) sẽ được áp dụng để nhận xét một nhóm.

3.4. Đánh giá và đo lường

Các từ ngữ đánh giá (dùng trong ý nghĩa đánh giá sản phẩm) và đo

lường thường gây nên sự nhầm lẫn hoặc ít nhất là người ta không phân biệt

được hai từ ngữ này một cách đầy đủ.

Một số đo của những cách đáp ứng hoặc của những hành vi là một sự

mô tả về lượng của những thái độ đó. Người ta sử dụng các con số để thể

hiện những quan sát có liên quan đến kinh nghiệm chủ nghĩa nghĩa là các

cách đáp ứng. Nội hàm của từ ngữ đánh giá rộng hơn nội hàm của đo lường

và cũng bao gồm cả đo lường.

- Đánh giá không chỉ có nghĩa là mô tả các cách cư xử, mà còn đưa ra

một nhận định về giá trị có liên quan đến chúng, tùy thuộc vào một chuẩn

mực hoặc một tiêu chuẩn nào đó.

- Đối với mô tả, việc đánh giá bao gồm cả mô tả về chất cũng như về

lượng của các cách cư xử.

Ví dụ sau đây là một minh họa cụ thể để phân biệt giữa đánh giá và đo

lường.

- Những kết quả của một trắc nghiệm nghiên cứu cho chúng ta biết

rằng một nhiệm vụ có liên quan đến mục tiêu nào đó để được thực hiện một

cách đúng đắn bởi 55% của một nhóm người học đã tham dự nhiệm vụ đó.

Cái đó là một kết quả của việc đo, một sự mô tả về số lượng của hành động.

- Giả thuyết rằng theo nhận định của một nhóm chuyên gia, mục tiêu có

thể đạt được bởi 75% của nhóm người học nói trên, nếu việc giáo dục được

phục vụ trong những điều kiện tối ưu.

- Tác dụng của chương trình như đã được đo thông qua nhiệm vụ (mà

chúng ta đã chấp nhận rằng nhiệm vụ đó là thích hợp để kiểm tra mục tiêu

tương ứng) rõ ràng là đã ở dưới mức tiêu chuẩn. Nếu ta giả thuyết rằng tiêu

chuẩn này là phù hợp với thực tế, ta có thể kết luận rằng hiệu suất hoặc tác

dụng của việc giáo dục, đối với mục tiêu học tập này là thấp kém (= nhận định

về giá trị).

Dĩ nhiên, trong việc đánh giá hiệu suất học tập, cần phải tận dụng hết

khả năng căn cứ vào những kết quả khách quan, nhưng ta vẫn hoàn toàn

đúng khi nói rằng nhận định về giá trị bao giờ cũng là một kết quả suy nghĩ

của một nhân vật có thẩm quyền đang đánh giá hoặc là của một nhóm

chuyên gia có khả năng tính đến các yếu tố khác ngoài “con số”, chẳng hạn

như những hoàn cảnh một trường học nào đó phải hoàn thành nhiệm vụ của

mình, trình độ học vấn và xã hội cùng văn hóa của người học. Hơn nữa, cũng

không chắc là người ta đã có thể thể hiện được bằng những kết quả về lượng

tất cả mọi mục tiêu đề ra để thực hiện ở người học bằng biện pháp giảng dạy.

Chẳng hạn việc đánh giá một vài kỹ năng như nói năng lưu loát và chính xác,

đánh giá những thái độ, sở thích và phương pháp làm việc.

Bài 7. ĐO LƯỜNG, LƯỢNG GIÁ VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

Nhiều sinh viên ngành giáo dục học những môn cần thiết về “trắc

nghiệm và đo lường trong giáo dục” hoặc một giáo trình tương tự như là một

phần cho việc chuẩn bị nghề nghiệp không có ý tưởng về sự khác biệt căn

bản về những thuật ngữ như đo lường, lượng giá và đánh giá được sử dụng

trong giáo dục. Khi đặt câu hỏi: Sự khác biệt giữa lượng giá và đánh giá là

gì?”, giảng viên nhận được những cái nhìn chằm chằm trống rỗng. Việc hiểu

sự khác biệt giữa đo lường, lượng giá và đánh giá là cơ sở của tri thức căn

bản trong giảng dạy và các quá trình được sử dụng trong giáo dục của những

giáo viên tương lai.

Sinh viên thường phấn đấu bằng việc mô tả hoặc giải thích “hiểu” điều

họ hiểu nghĩa là gì. Trong nhiều giáo trình trắc nghiệm và đo lường giáo dục

hiểu được suy ra từ những câu trả lời về trắc nghiệm câu nhiều lựa chọn

hoặc giải những bài toán thống kê. Kết quả là trong học kỳ tiếp theo, khi được

hỏi về những ý tưởng rất căn bản trong thống kê, đo lường, lượng giá và

đánh giá, sinh viên gần như quên hết, nếu không nói là toàn bộ điều họ đã

“học”.

Đo lường, lượng giá và đánh giá có nhiều nghĩa rất khác nhau và hầu

hết sinh viên không thể giải thích đúng sự khác biệt đó. Vì thế, cách tiếp cận

đến việc giải thích sự việc bằng cách càng trực tiếp và có ý nghĩa càng tốt là

nhưng mô tả có ích cho ba thuật ngữ căn bản này.

Đo lường nói đến quá trình qua đó những đặc điểm hoặc chiều hướng

của một sự vật được xác định. Một ngoại lệ là việc sử dụng từ đo lường trong

việc xác định thương số trí tuệ của một người (IQ) Câu: “Trắc nghiệm này đo

lường IQ” thường được sử dụng. Đo lường những thứ như thái độ hoặc sở

thích cũng được áp dụng. Tuy nhiên, khi chúng ta đo lường, chúng ta thường

dùng một số dụng cụ tiêu chuẩn để quyết định một thứ nào đó thực sự lớn,

cao, nặng, đồ sộ, nóng, lạnh, nhanh hoặc thẳng bao nhiêu. Những dụng cụ

tiêu chuẩn nói đến những dụng cụ như thước, thang đo, nhiệt kế, máy đo sức

ép… - Chúng ta đo lường để thu thập thông tin về những thứ đó. Những

thông tin như thế có thể hữu ích hoặc không hữu ích, tùy thuộc vào tính chính

xác của dụng cụ chúng ta dùng và những kỹ năng khi sử dụng chúng. Có ít

dụng cụ như thế trong khoa học xã hội đạt đến tính giá trị và tính tin cậy của

thước đo bằng mét. Chúng ta đo lường độ lớn của căn phòng dựa vào mét

vuông, nhiệt độ của phòng bằng nhiệt kế, và máy đo Ohm để đo volt, am-père

và điện trở của dòng điện. Trong tất cả những thí dụ này, đơn giản chúng ta

chỉ thu thập dữ liệu có liên quan đến một số thước đo hoặc tiêu chuẩn đã

được thiết lập. Vì thế, lượng giá rất khác với đo lường và có cách sử dụng

đưa ra những mục đích hoàn toàn khác nhau. Khi được sử dụng trong mục

tiêu học tập, định nghĩa được đưa ra cho động từ chỉ hành vi đo lường là: Áp

dụng thang đo tiêu chuẩn hoặc cách thức đo lường trên một sự vật, một loạt

sự vật, sự kiện hoặc điều kiện phù hợp với thực tế được những người sử

dụng thành thạo cách thức hoặc thang đo.

Lượng giá là quá trình thông tin nhận được có liên quan đến mục tiêu

hoặc mục đích đã biết. Chúng ta lượng giá ở cuối giờ học hoặc đơn vị học

tập. Chúng ta lượng giá sự tiến bộ ở cuối năm học thông qua trắc nghiệm và

chúng ta lượng giá những kỹ năng lời nói, định lượng thông qua những công

cụ như các trắc nghiệm về khả năng chuyên biệt hoặc trắc nghiệm khả năng

toán học tổng quát. Cho dù rõ ràng hoặc chưa rõ ràng, lượng giá được nối kết

một cách hữu ích nhất với mục đích hoặc mục tiêu để cho việc lượng giá

được thiết kế. Lượng giá là cách nói khác của trắc nghiệm. Trắc nghiệm hoặc

lượng giá đưa ra thông tin có liên quan đến mục tiêu hoặc mục đích. Theo ý

nghĩa đó, chúng ta trắc nghiệm hoặc lượng giá để xác định có đạt được mục

tiêu hoặc mục đích hay không. Lượng giá việc đạt được kỹ năng thì khá trực

tiếp. Cho dù kỹ năng đó có hiện hữu ở mức độ chấp nhận được hay không.

Những kỹ năng sẵn sàng có thể chứng minh. Lượng giá thông hiểu thì khó

khăn và phức tạp hơn nhiều. Kỹ năng có thể thực hành, còn thông hiểu thì

không. Chúng ta có thể lượng giá tri thức của một người bằng nhiều cách,

nhưng luôn luôn có một bước nhảy, một sự suy luận về việc một người làm

trong mối quan hệ với những điều mà người đó chứng tỏ những thứ mình

hiểu biết. Trong phần này về phía động từ chỉ hành vi, lượng giá là quy định

điều kiện qua đó hành vi được chuyên môn hóa trong một mục tiêu có thể

được khẳng định lại. Việc quy định đó thường dưới hình thích mô tả bằng văn

viết.

Kiểm tra đánh giá là quá trình thu thập, tổng hợp và diễn giải thông tin

hỗ trợ cho việc ra quyết định. Khi nghe đến từ “kiểm tra”, nhiều người hình

dung rằng người học phải làm bài kiểm tra viết để xem các em đã học đến

đâu. Mặc dù, kiểm tra viết là phần quan trọng của kiểm tra đánh giá, bảng

danh sách các quyết định của giáo viên cho thấy rằng kiểm tra đánh giá trong

lớp học không chỉ là cho làm bài kiểm tra để đánh giá người học. Kiểm tra

đánh giá, theo cách chúng ta sẽ sử dụng thuật ngữ này, bao gồm nhiều loại

thông tin giáo viên thu thập được trong lớp học: các thông tin giúp họ hiểu

người học hơn, lên kế hoạch và theo dõi việc giảng dạy của mình và thiết lập

một nền văn hóa học tập bền vững bên cạnh việc kiểm tra và xếp loại. Có

nhiều sự khác nhau giữa kiểm tra, đo lường đánh giá và định giá. Kiểm tra

đánh giá là một thuật ngữ chung bao gồm tất cả các cách giáo viên thu thập

và sử dụng thông tin trong lớp của mình.

Kiểm tra là quá trình dùng giấy bút chì có hệ thống và hình thức được

sử dụng để thu thập thông tin về sự thể hiện kỹ năng của người học. Bài kiểm

tra chỉ là một trong những loại thông tin kiểm tra đánh giá mà giáo viên gặp

phải, thế cho nên cho làm bài kiểm tra cũng chỉ là một cách đánh giá. Các

cách kiểm tra quan trọng khác là quan sát, hỏi vấn đáp, ra bài tập và sưu tập

bài làm của người học.

BẢNG 1. ĐỊNH NGHĨA CÁC THUẬT NGỮ KIỂM TRA ĐÁNH GIÁ PHỔ BIẾN

Kiểm tra đánh giá: thu thập, tổng hợp và diễn giải thông tin nhằm hỗ trợ

giáo viên trong việc ra quyết định

Kiểm tra: quá trình dùng giấy bút một cách hệ thống và hình thức để thu

thập thông tin.

Đo lường: Áp dụng thang đo tiêu chuẩn hoặc cách thức đo lường trên

một sự vật một loạt sự vật, sự kiện, hoặc điều kiện phù hợp với thực tế được

những người sử dụng thành thạo cách thức hoặc thang đo.

Lượng giá: quy định điều kiện qua đó hành vi được chuyên môn hóa

trong một mục tiêu có thể được khẳng định lại. Việc quy định đó thường dưới

hình thức mô tả bằng văn viết.

Nguồn:

1. Dr. Bob Kizlik, Updated September 12, 2004.

2. Airasian P.W. (1997), Kiểm tra đánh giá trong lớp học (Classroom

Assessmer), tái bản lần thứ 3, New York: McGraw-Hill.

Bài 8. ĐÁNH GIÁ SẢN PHẨM CỦA GIẢNG DẠY

Đánh giá sản phẩm nghĩa là kiểm tra và nhận xét những mục tiêu giảng

dạy đạt được ở mức độ nào bởi các người học theo học.

Cũng như mọi xí nghiệp theo đuổi những mục tiêu xác định, việc giảng

dạy cần thường xuyên tự hỏi liệu những phương tiện sử dụng có đang thực

sự dẫn tới các mục tiêu hay không. Liên hệ với mục đích của đánh giá nói

chung, việc nghiên cứu kết quả giảng dạy này cần góp phần - qua thông tin

phản hồi - vào việc tối ưu hóa hoạt động giảng dạy.

Từ định nghĩa của đánh giá sản phẩm, tiếp theo sẽ có:

1. Những mục tiêu giảng dạy đồng thời là những tiêu chuẩn cho phép

có được nhận xét hiệu suất.

2. Để xây dựng các công cụ đánh giá, người ta cần có sẵn, từ lúc đầu,

một danh sách có tính chất hệ thống của các mục tiêu đó.

Đánh giá sản phẩm có mục đích là xác định xem các mục tiêu đã được

thực hiện đến mức độ nào. Ở đây, mục tiêu là những thay đổi cần có trong

cách giải quyết vấn đề của người học. Như vậy, việc đánh giá sản phẩm phải

được quan niệm rõ ràng như là một sự xác định về số đo, trong đó những

hành vi đề ra đã được thừa nhận. Trong nhiều trường hợp, người ta sẽ không

thực hiện trực tiếp việc kiểm tra mà sử dụng vai trò gián tiếp của tác dụng

hoặc của kết quả do hành vi tạo ra. Trong những trường hợp khác, việc kiểm

tra lại trực tiếp hành vi cần thiết. Việc này diễn ra trong trường hợp khi người

ta có thể thu được cùng một kết quả như vậy bằng nhiều cách làm, ví dụ

bằng các phương pháp khác nhau hoặc bằng cách dựa vào các cấu trúc đáp

ứng đa dạng và trong trường hợp đã được quy định từ trước, trong các mục

tiêu, phải sử dụng một biện pháp hoặc một kết cấu hành vi đã được xác định.

Việc nghiên cứu bản thân các hành vi đặc biệt quan trọng đối với các mục

tiêu về năng lực - cảm xúc, ví dụ như thái độ.

Về loại các mục tiêu cuối cùng này, điều quan trọng là phải phân biệt

được hai loại tình huống đánh giá sau đây: đánh giá cụ thể và đánh giá thông

thường. Trong tình huống đánh giá cụ thể, cả giảng viên lẫn người học đều

có ý thức đối với việc tiến hành đánh giá; chẳng hạn, người ta yêu cầu người

học phải làm một bài kiểm tra hoặc một bài thi để một môn đã học ở lớp.

Trong việc đánh giá thông thường, thầy giáo thu thập những thông tin về

người học mà không cho người học biết trước. Khá nhiều mục tiêu có tính

chất năng lực - tình cảm chỉ có thể đánh giá được một cách thỏa đáng trong

tình huống thứ hai này, bởi vì trong một tình huống cụ thể, người học thường

sẽ không hành động một cách tự nhiên. Điều này có thể dẫn đến thái độ giả

tạo.

1. CÁC KHÍA CẠNH CỦA ĐÁNH GIÁ SẢN PHẨM

Trong đánh giá sản phẩm, người ta còn có thể đi sâu hơn nữa việc cá

biệt hóa. Chúng ta phân biệt các loại đánh giá tổng thể và đánh giá phân tích

với đánh giá chẩn đoán.

1.1. Đánh giá tổng thể và đánh giá phân tích

Đánh giá tổng thể nghĩa là định nghĩa và nhận xét hiệu quả dạy học

trong một lĩnh vực nhất định của toàn bộ các mục tiêu giảng dạy hoặc ở một

nhóm người học xác định hoặc ở trong một lớp học, một trường học hay ở

một nhóm người học nào đó. Ví dụ, việc đánh giá hiệu quả dạy học đối với

một ngành xác định; bằng cách sử dụng kết quả của một bài luận đề hoặc

của một bài trắc nghiệm khách quan, trong đó các nội dung đều có tính chất

đại diện cho các mục tiêu của việc dạy toán, người ta có thể phát biểu ý kiến

về hiệu suất của giảng dạy này trong một lớp nhất định

Đánh giá phân tích có nghĩa là mô tả và nhận xét hiệu suất của việc

giảng dạy đối với từng mục tiêu riêng biệt của một lĩnh vực nhất định. Ví dụ,

một nhóm người học xác định đã đạt đến mức nào một mục tiêu nào đó của

việc dạy Toán (có thể làm tất cả các trường hợp cách chia số thường và số

thập phân)? Người ta đồng thời bàn bạc cả việc đánh giá tổng thể lẫn đánh

giá phân tích bởi vì, nói chung, thông qua cùng một bài thi đó, người ta có thể

thu thập những thông tin có liên quan đến hai hình thức đánh giá này. Thật

vậy, các dữ liệu được tập hợp lại qua sử dụng một trắc nghiệm về đánh giá

kết quả học tập tổng thể một ngành học cũng có thể được xem xét từ quan

điểm phân tích. Số đo lường mà trong đó các nội dung riêng biệt đã được tính

toán thỏa đáng bởi một nhóm người học cho ta biết rằng các mục tiêu có liên

quan đến các nội dung này đã đạt được hay chưa đạt được.

1.2. Đánh giá chẩn đoán

Nhờ đánh giá tổng hợp và phân tích, người ta có một ranh giới và một

nhận xét đối với hiệu suất của một lĩnh vực mục tiêu xác định. Nhưng điều

này không nhất thiết phải đi đôi với việc giải thích những thiếu sót có thể xảy

ra sau này của hiệu suất; nói một cách khác, việc đánh giá này không nêu lên

nguyên nhân các mặt yếu kém. Tuy nhiên, vẫn cần phải biết được những

nguyên nhân đó để tiến một cách có giá trị các chương trình giảng dạy hoặc

để ngăn ngừa những khuyết điểm về giảng dạy trong lớp học. Đó là lý do tại

sao phải tiến hành đánh giá chẩn đoán và người ta sẽ định hướng việc đánh

giá này chủ yếu vào những mục tiêu mang dấu hiệu có những nhược điểm về

hiệu suất.

Trong đánh giá chẩn đoán, người ta có thể xem xét hai giai đoạn: chẩn

đoán mô tả và chẩn đoán căn nguyên.

Chẩn đoán mô tả có nghĩa là khoanh lại một cách chính xác những

thiếu sót trong các kiến thức và trong các kỹ năng và những lệch lạc trong

quá trình học tập xảy ra vào thời điểm nào? Để xác minh điều này, người ta

có thể dùng những bài kiểm tra chẩn đoán; đối với từng mục tiêu, chúng sẽ

thể hiện những bước đi kế tiếp (những khó khăn); còn ẩn náu khi vươn tới

những mục tiêu đó. Chẳng hạn, khi quan sát người học ở lớp Sáu, thấy có kết

quả kém về thực hiện các phép chia đánh giá chẩn đoán: xem ví dụ trên đây),

thì người ta có thể xem xét quá trình học tập của chủ đề đó là không hữu hiệu

ở thời điểm nào (ví dụ: cảm thấy lúng túng về dấu phẩy của số thập phân, về

các số không trong số chia và/hoặc số bị chia).

Việc chẩn đoán căn nguyên nhằm mục đích tìm ra nguyên nhân các

mặt yếu kém và khó khăn. Nói một cách khác, ở đây muốn nói đến việc chẩn

đoán theo nghĩa hẹp. Có hai loại yếu tố có ảnh hưởng ở đây: một là các yếu

tố có liên quan đến người học, như năng lực yếu kém, rối loạn hành vi cùng

như những yếu tố quyết định về mặt văn hóa và xã hội; thứ hai là các yếu tố

nảy sinh từ bản thân hoạt động giảng dạy, như các mục tiêu có thể về sau

này không thích hợp đối với tình huống xuất phát của người học, việc sử

dụng các phương tiện không hiệu quả và ứng dụng không thỏa đáng để thực

hiện các mục tiêu. Rõ ràng là chỉ có thể tìm ra nhóm thứ hai này thông qua

việc nghiên cứu trực tiếp bản thân hoạt động giảng dạy, khía cạnh phán đoán

căn nguyên này trên thực tế là bộ phận hợp thành của đánh giá quá trình, mà

việc đó ở đây hình như là bổ sung rất rõ ràng cho việc đánh giá sản phẩm.

2. CÁC PHƯƠNG PHÁP ĐÁNH GIÁ SẢN PHẨM

Đối với việc đánh giá sản phẩm, các công cụ được ưa chuộng nhất là

những bài kiểm tra viết hoặc những trắc nghiệm (được biểu thị hay không

được biểu thị bằng một điểm số khách quan). Các bài kiểm tra viết này (bài

kiểm tra “giấy - bút chì”) tuy vậy cũng không phải là những phương pháp kỹ

thuật duy nhất có thể có của đánh giá sản phẩm. Thật vậy, mọi phương pháp

đều có thể được áp dụng để cung cấp những thông tin có giá trị về mức độ

đạt được của các người học trong việc thực hiện các mục tiêu. Vấn đề là phải

chọn ra phương pháp thỏa đáng nhất đối với khía cạnh của hành vi dự định

đánh giá. Tiêu chuẩn này, tuy mang tính quan trọng hàng đầu, thường làm

chúng ta lúng túng, vì cũng có những tiêu chuẩn khác, tuy là thứ yếu, ảnh

hưởng rất nhiều đến việc lựa chọn các phương pháp đánh giá. Chẳng hạn,

khả năng thực hiện việc mô tả về định lượng và khách quan đối với hành vi,

việc dễ dàng xây dựng và áp dụng các công cụ xác định… Khi nói đến tiêu

chuẩn vừa mới mô tả, chúng tôi có thể kết luận rằng một phương pháp kỹ

thuật đánh giá này có thể thích hợp với một vài mục tiêu này, nhưng lại không

thỏa đáng với những mục tiêu khác, về vấn đề các phương pháp kỹ thuật có

thể sử dụng được, câu hỏi nên đặt ra chắc hẳn không phải là: “Liệu phương

pháp kỹ thuật này có thích hợp để đánh giá sản phẩm không?”, mà sẽ là:

“Trong những trường hợp nào và trong những tình huống nào thì phương

pháp kỹ thuật này là thích hợp?”.

Tóm lại, ta có thể có được những thông tin mô tả liên quan đến các

hành vi của người học bằng ba cách:

(1) Đặt ra cho người học những công việc phải hoàn thành;

(2) Đặt cho người học những câu hỏi liên quan đến bản thân công việc;

(3) Yêu cầu những người khác quan sát và nhận xét hành vi của người

học.

Cả ba phương pháp xử lý vấn đề này đồng thời cũng là những phạm

trù cho phép ta xếp loại các phương pháp kỹ thuật đánh giá sản phẩm: các

bài kiểm tra về thành tích, các phương pháp kỹ thuật tự mô tả và các phương

pháp quan sát.

2.1. Những bài trắc nghiệm về thành quả học tập (“Achievement Tests”).

Có hai cách kiểm tra: kiểm tra miệng và kiểm tra viết. Ta có thể chia

những bài kiểm tra viết bằng những cách khác nhau:

- Các trắc nghiệm mang tính chủ quan (essay tests);

- Các trắc nghiệm khách quan (objective tests): trắc nghiệm do thầy

giáo soạn (teacher made tests hoặc informal tests), trắc nghiệm chuẩn hóa

(standardized tests).

2.2. Các phương pháp kỹ thuật tự mô tả

Các phương pháp kỹ thuật mô tả chủ yếu là:

- Phỏng vấn,

- Bút vấn (questionnaires hoặc inventories),

- Thang thái độ (attitude scales).

2.3. Các kỹ thuật quan sát

Trong loại này, người ta có thể xếp những kỹ thuật sau: các phiếu kiểm

tra, các thang đánh giá và các phương pháp trắc đạt xã hội.

- Phiếu kiểm tra (checklist) là bảng kê những lời diễn đạt về hành vi;

người quan sát hoặc người nhận xét cần chỉ ra, đối với từng phiếu diễn đạt,

liệu loại hành vi đang nói đến có hay không có ở trong người học được quan

sát.

- Trong các thang đánh giá (rating scales), người quan sát cần ghi rõ

người học được quan sát có một đặc điểm nào đó ở một mức độ nào.

- Đối với các phương pháp trắc đạt xã hội, người ta xác định những mối

quan hệ xã hội trong một nhóm nào đó. Mỗi thành viên trong nhóm cho biết,

trong một tình huống xác định, người đó ưa thích những thành viên nào khác

trong nhóm, như bạn ngồi bên cạnh trong lớp, bạn cùng chơi trò chơi, bạn

cùng lao động của nhóm. Qua phân tích các dữ liệu, ta có thể tìm ra mối quan

hệ xã hội của các thành viên trong nhóm và phát hiện ra cấu trúc của nhóm.

Ở đây không bàn về việc soạn thảo các trắc nghiệm chuẩn hóa, vì hiện

nay vấn đề này được nhiều sách đề cập. Phần lớn các tác giả khẳng định một

cách rõ ràng rằng, đối với việc soạn thảo các trắc nghiệm chuẩn hóa, cần

phải dựa vào các mục tiêu.

Về các phương pháp tự mô tả và các phưong pháp quan sát, hiện nay

có những giới thiệu tổng quát mang tính giá trị trong nhiều công trình về cách

đo lường và đánh giá trong giáo dục.

Việc đánh giá thái độ bằng cách quan sát hiện đang được nhiều người

quan tâm, nên mục sau đây dành cho việc nghiên cứu vấn đề này.

3. ĐÁNH GIÁ THÁI ĐỘ

Những năm gần đây, việc chú ý ngày càng nhiều đến tầm quan trọng

của việc đánh giá thái độ của người học. Tuy nhiên, việc thực hiện này gặp

phải những khó khăn. Hơn nữa, hiện nay vẫn chưa một phương pháp nào có

cơ sở lý luận vững chắc được trình bày, theo quan điểm sư phạm học. Dựa

vào lý luận về các mục tiêu và cách đánh giá, có thể phác thảo một vài nét

chính, có liên quan đến đánh giá thái độ bằng biện pháp gián tiếp là quan sát.

Việc xây dựng thái độ được triển khai như một mục tiêu giảng dạy. Vì

thế, vấn đề đánh giá thái độ đang trở thành mối quan tâm mang tính thời sự

của các nhà giáo dục. Điều này có nghĩa đây là một bước tiến triển thuận lợi

để hình thành nhân cách một cách đầy đủ hơn thông qua công tác giảng dạy

và là sự cần thiết phải xác định, với một mức độ chính xác hơn, loại thái độ

nào người ta muốn phát triển ở người học. Trong một loạt những mục tiêu

này, ta có thể sử dụng những tiêu chuẩn sau đây:

- Quan niệm về kiểu phát triển cần có của nhân cách, phù hợp với tình

hình xã hội hiện tại;

- Trình độ phát triển của các người học;

- Tính chất của giảng dạy (chẳng hạn trong các bộ phận dạy nghề hoặc

đào tạo ngắn ngày của ngành giáo dục kỹ thuật, nên bồi dưỡng nhiều hơn về

thái độ tích cực đối với học tập trong các bộ phận chuyển tiếp hoặc học tập

lâu dài ở bậc giáo dục trung học phổ thông tổng hợp);

- Những khả năng có sẵn của trường học có thể phát triển được những

thái độ xác định.

Trên đây nhấn mạnh đến tầm quan trọng của việc cụ thể hóa các mục

tiêu giảng dạy. Điều này cũng được áp dụng đối với những thái độ mà ta

muốn hình thành trong giảng dạy. Thật vậy, người ta chỉ có thể hình thành

thái độ này bằng cách xác định rõ những thái độ này bằng những từ ngữ về

hành vi cụ thể có thể diễn ra trong tình huống giảng dạy. Thông qua quan sát,

ta có thể nhận thấy người học có bộc lộ những hành vi báo hiệu một thái độ

xác định hay không. Hơn nữa, việc cụ thể hóa đó có những điểm lợi như sau:

(1) Các thái độ được xác định sát với thực tế hơn đối với các giáo viên

khác nhau.

(2) Nêu được những tình huống trong đó người ta có thể quan sát tùy

theo sở thích một thái độ xác định. Để minh họa, một vài ví dụ về hành vi có

liên quan đến thái độ “tinh thần hợp tác”: xử sự độc lập trong nhóm, tham gia

tích cực vào hoạt động của nhóm, sẵn sàng giúp đỡ khi thầy giáo yêu cầu, tự

giác cộng tác vào hoạt động học tập, có sáng kiến trong hoạt động tập thể.

Khi các mục tiêu giảng dạy được cụ thể hóa như vậy, ta có thể bằng

quan sát, chứng minh được một người học nào đó có hay không có hành vi

biểu thị của một thái độ xác định. Tuy nhiên, điều này hãy còn chưa đủ để có

một đánh giá đầy đủ. Thật vậy, những hành vi đa dạng phụ thuộc vào cùng

một thái độ có thể khác nhau ở cách biểu hiện, xét về mức độ hoặc về chất

lượng đối với thái độ đó. Ví dụ, về tinh thần hợp tác: sáng kiến trong hoạt

động của nhóm có thể được xem xét như một mức độ cao hơn của tinh thần

hợp tác so với sẵn sàng giúp đỡ khi có yêu cầu của thầy giáo. Nhận xét đó

đồng thời chỉ ra phương hướng ta cần tìm để tiến tới xây dựng một công cụ

thích hợp cho đánh giá thái độ. Đặc biệt cần phải có sẵn bậc thang mô tả theo

kiểu kết câu, những mức độ khác nhau trong việc xây dựng được một thái độ.

Nguyên tắc phân loại các mục tiêu cảm xúc của Krathwohl cho chúng ta bậc

thang như vậy. Trong nguyên tắc phân loại này, các hành vi cảm xúc đều

được sắp xếp có thứ bậc và theo một mức độ tăng dần trong kết cấu của

nhân cách. Ở đây, chúng tôi chỉ liệt kê những phạm trù của phép phân loại

này.

Thứ bậc tiến triển

1.0 NHẬN BIẾT

1.1 Ý thức

1.2 Sẵn sàng chấp nhận

1.3 Chú ý có kiểm soát hoặc lựa chọn

2.0 ĐÁP ỨNG

2.1 Bằng lòng đáp ứng

2.2 Sẵn sàng đáp ứng

2.3 Thỏa mãn khi đáp ứng

3.0 ĐỊNH GIÁ TRỊ ĐẠO ĐỨC

3.1 Chấp nhận một giá trị

3.2 Lựa chọn một giá trị đạo đức

3.3 Sự chấp nhận một giá trị đạo đức

4.0 CẤU TRÚC GIÁ TRỊ ĐẠO ĐỨC

4.1 Khái niệm hóa một giá trị

4.2 Cấu trúc một hệ thống giá trị

5.0 TÍNH CÁCH HÓA MỘT GIÁ TRỊ ĐẠO ĐỨC HOẶC MỘT PHÚC

HỢP CÁC GIÁ TRỊ ĐẠO ĐỨC

5.1 Tập hợp được khái quát hóa

5.2 Tính cách hóa

Khi sắp xếp theo chuỗi liên tục này thành hành vi cụ thể biểu hiện của

một thái độ, ta có một dụng cụ đánh giá. Thật vậy, một người học thể hiện

cách cư xử nào đó bộc lộ cho chúng ta biết người đó đã có được một mức độ

xác định của thái độ đang bàn đến. Dựa trên chuỗi liên tục cảm xúc của

Krathwohl, Bellemans đã xây dựng được một sơ đồ đánh giá bốn thái độ ở

các người học thuộc quá trình quan sát của bậc giáo dục trung học phổ thông

đổi mới ở Bỉ: tự quản trong học tập, tinh thần ham hiểu biết tri thức, thái độ

phê phán và tinh thần hợp tác. Có xem xét đến trình độ phát triển của những

người học 12 - 13 tuổi này, các tác giả chỉ lấy hạn chế bảy phạm trù đầu tiên

của Krathwohl. Để minh họa, mỗi một trong bảy phạm trù này được đặt tên

như thế nào cho hợp với tinh thần hợp tác và mỗi loại về một hành vi cụ thể

sẽ được đưa ra một ví dụ về mức phát triển.

Mức 1

- Giải thể nhóm (đối lập với hoạt động của nhóm bằng một hành vi hung

hăng).

- Hợp tác thụ động (vai trò của người tham gia thụ động: dựa dẫm vào

những người khác khi phân công phân nhiệm).

- Chọn nhóm (khi phải đứng trước sự lựa chọn là làm việc cho nhóm

hoặc làm việc cho cá nhân, người học đó sẽ chọn làm việc cho nhóm).

Mức 2

- Hợp tác theo thỏa thuận (sẵn sàng giúp đỡ khi có yêu cầu của thầy

giáo).

- Hợp tác theo ý muốn (tự giác tham gia hoạt động của giờ học).

Mức 3

- Đoàn kết (có những sáng kiến phù hợp với hoạt động của tập thể,

nhưng không áp đặt tình cảm cá nhân của mình).

- Hợp tác động viên (khuyến khích những người khác tham gia bằng

cách yêu cầu họ hợp tác với tập thể).

De Block cũng đã xây dựng sơ đồ để đánh giá thái độ cũng dựa trên

những nguyên tắc như thế. Ông dùng bốn giai đoạn của quá trình học tập của

“phương pháp phân loại các mục tiêu giảng dạy” của mình làm thang đánh

giá. Những thái độ được bàn đến trong sơ đồ này chủ yếu là thuộc bản chất

trí tuệ như xu hướng về thấu hiểu, về năng suất, về tinh thần phê bình, về tính

khách quan…

4. CÁC TIÊU CHUẨN ĐỂ ĐÁNH GIÁ HIỆU SUẤT HỌC TẬP

Chúng ta đã bàn đến vấn đề các tiêu chuẩn đánh giá hiệu suất học tập

một khi nói đến sự khác biệt giữa đánh giá và đo lường. Ở đây có một vài ghi

chú ngoài lề về vấn đề tế nhị và gây nhiều tranh cãi này.

Ngoài bảng tổng kết tình hình kết quả học tập, việc đánh giá sản phẩm

còn bao gồm cả việc nhận xét hiệu suất. Ví dụ, ta có được bảng tổng kết tình

hình kết quả học tập bằng cách áp dụng một trắc nghiệm đo hiệu suất học tập

cho một nhóm người học, nhưng không nhất thiết phải làm sáng tỏ tính “giá

trị” của giảng dạy. Để làm được điều này, chúng ta cần có những tiêu chuẩn

cho phép so sánh những kết quả quan sát được. Dựa trên sự so sánh này,

người ta có thể trả lời câu hỏi sau đây: liệu các kết quả có đầy đủ không, liệu

chúng có đáp ứng mong đợi về hiệu suất giảng dạy hay không, hay nói một

cách khác, liệu chúng ta có thể kết luận rằng người học đã đạt được một cách

đầy đủ mục tiêu giảng dạy hay chưa.

Đề cập đến vấn đề này, người ta cho rằng vấn đề ở đây là các chuẩn

mực dùng để định giá những kết quả của một cá nhân qua một trắc nghiệm

tâm lý. Những chuẩn mực này được suy diễn về mặt thống kê học từ phân bố

các kết quả thực tế của một trắc nghiệm và sự phân bố đó có được bằng một

mẫu đại diện cho các cá nhân trong dân số mà trắc nghiệm đó được soạn

thảo. Muốn đánh giá những kết quả của một cá nhân qua một trắc nghiệm,

người ta đối chiếu kết quả của người học đó với các chuẩn mực có sẵn để

xác định bằng cách định vị trí tương đối hoặc trình độ của người đó trong dân

số người học.

Những chuẩn mực thống kê học loại này có thể rất hữu ích so với mục

đích tìm kiếm của các nhà tâm lý học học tập sử dụng các trắc nghiệm đó,

trong đó phần lớn có nghĩa là lập ra những dự báo phù hợp với những hành

vi sau này của cá nhân trong những tình huống nhất định. Những chuẩn mực

như vậy không phải là những tiêu chuẩn thích hợp đối với những nơi cần phải

đưa ra một nhận định có giá trị về kết quả học tập. Thật vậy, chuẩn mực về

hiệu suất được vận dụng như thế phản ánh những thành tích thật sự của

người học và những thành tích này lại không nhất thiết phải tương xứng với

những kết quả mong đợi một cách hợp lý trong một nền giáo dục. Ngoài ra,

việc sử dụng những chuẩn mực thống kê học che đậy một nguy cơ mà

Stellwag gọi là giáo dục « bị đóng băng”, nghĩa là mặt tiến triển của giáo dục

có thể bị tiêu tan, bởi vì người ta đang cố gắng thực hiện những chuẩn mực

có trong các trắc nghiệm.

Người ta không hài lòng về sự kiện của các chuẩn mực thống kê học

trong các sách của Mỹ, gồm cả tác phẩm của nhà sư phạm học nổi tiếng

Glaser. Năm 1963, ông đưa ra sự phân biệt giữa “những số đo so chuẩn mực

cho những thông tin về », « việc xếp loại tương đối các cá nhân có liên quan

đến hành vi của họ” với “các số đo dựa trên một tiêu chuẩn được tập trung

vào việc xác định vào kết quả mà người học đạt được so với tiêu chuẩn”.

Những năm gần đây, những “trắc nghiệm tiêu chuẩn” này được nghiên cứu

nhiều ở Mỹ. Người ta dùng trắc nghiệm đó không những để chẩn đoán cá

nhân mà còn để đánh giá chẩn đoán sản phẩm.

Những ý tưởng này của Glaser dựa vào sự phân biệt mà Flanagan đã

phát biểu năm 1951 với một bên là các “chuẩn mực” (“norms”) thống kê học

và một bên khác là các “tiêu chuẩn” (“standards”). Khái niệm sau cùng này có

nghĩa là “các mức độ cần đạt tới hoặc các mức độ mong đợi của thực tiễn

được diễn đạt bằng từ ngữ kết quả học tập”.

Bloom trình bày khái niệm sau cùng này bằng cụm từ “các chuẩn kỹ

năng thành thạo hoặc các chuẩn hiệu suất”.

Khái niệm “các chuẩn” gợi lên một ý cho rằng vấn đề ở đây là những

“tiêu chuẩn” tuyệt đối gắn liền với những giá trị, những tiêu chuẩn tuyệt đối đó

được áp đặt từ trên xuống và không có một cơ sở khoa học nào cả. Thế

nhưng, tính chất tuyệt đối, theo nghĩa hẹp, cũng không gắn liền với khái niệm

“các chuẩn của mức độ đạt được” hoặc là các tiêu chuẩn của hiệu suất. Vì

thế, có thể gán cho nó một cách giải thích để chứng minh theo quan điểm sư

phạm và, đồng thời, cách giải thích đó làm cho việc xác định các tiêu chuẩn

trở thành một cách xử lý đúng đắn có thể tiến hành được.

Đối với bản chất của các loại tiêu chuẩn này, chúng cần thỏa mãn hai

điều kiện trái ngược nhau sau đây:

- Các tiêu chuẩn cần biểu thị một mức độ hiện thực của hiệu suất mong

đợi, trong một lĩnh vực mục tiêu xác định, nghĩa là chúng phải tính đến mức

độ phát triển của người học và của các khả năng thực tế của trường học hiện

nay, đối với các giáo viên, các công cụ dạy học và thời gian có thể sử dụng

được.

- Các tiêu chuẩn cần phản ánh một mức độ có thể đạt tới về mặt lý

thuyết, nghĩa là mức độ cao nhất của hiệu suất được nhận định là có thể đạt

tới được bởi dân số người học đang nói đến, với giả thiết là việc giảng dạy đã

được phục vụ đến mức tối ưu, nghĩa là tốt nhất có thể được, có tính đến các

hoàn cảnh hiện hữu. Định đề cuối cùng này đồng thời chỉ rõ rằng cả hai yêu

cầu này cần gập nhau ở một điểm.

Tùy theo phương pháp xây dựng các loại tiêu chuẩn hiệu suất này,

người ta có thể gợi ý cách làm sau:

- Trong giai đoạn đầu, người ta kêu gọi một nhóm chuyên gia và yêu

cầu họ nhận định về khả năng có thể đạt tới về mặt lý thuyết của các nội dung

của một cuộc kiểm tra đánh giá. Việc xây dựng một phương pháp kỹ thuật để

thu thập và viết những nhận xét của các người đánh giá là một nhiệm vụ của

khảo sát giáo dục học.

- Trong giai đoạn thứ hai, cần có những đánh giá cúa các chuyên gia

được kiểm tra lại theo kinh nghiệm thực tế, song việc này đến bây giờ lại rất

khó thực hiện. Một biện pháp có thể làm được là đi sâu vào các nội dung mà

khả năng thành công về mặt lý thuyết đã được các chuyên gia xác định, trong

các lớp học, nơi việc giảng dạy đã được tiến hành trong những điều kiện tối

ưu. Dựa vào mức độ khó khăn được quan sát cả trong các lớp học, người ta

còn cải biên cả những tiêu chuẩn đã được chấp nhận từ lúc xuất phát. Đó rõ

ràng là những tiêu chuẩn hiệu suất không phải là những tiêu chuẩn tuyệt đối.

4. CÁC TIÊU CHUẨN ĐỂ ĐÁNH GIÁ HIỆU QUẢ HỌC TẬP

Chúng ta đã đụng đến vấn đề các tiêu chuẩn đánh giá hiệu quả học tập

một khi nói đến sự khác biệt giữa đánh giá và đo lường. Sau đây một vài điều

đáng chú ý ngoài lề về vấn đề tế nhị và gây nhiều tranh cãi này.

Ngoài bảng tổng kết tình hình kết quả học tập, việc đánh giá sản phẩm

còn bao gồm cả việc nhận xét hiệu quả. Ta có được bảng tổng kết tình hình,

chẳng hạn, bằng cách áp dụng một trắc nghiệm học tập cho một nhóm người

học. Nhưng những kết quả không nhất thiết phải làm sáng tỏ cái “giá trị” của

giảng dạy. Để làm được điều này, rõ ràng chúng ta cần có những tiêu chuẩn

cho phép so sánh những kết quả quan sát được. Dựa trên sự so sánh này,

người ta có thể trả lời câu hỏi sau đây: Liệu các kết quả có đầy đủ không?

Liệu chúng có đáp ứng mong đợi của chúng ta về hiệu quả giảng dạy hay

không? Hay nói một cách khác, liệu chúng ta có thể kết luận rằng người học

đã đạt được một cách đầy đủ mục tiêu giảng dạy hay chưa?

Đề cập đến vấn đề này, người ta cho rằng ở đây có vấn đề về các

chuẩn mực dùng để định giá những kết quả của một cá nhân qua một trắc

nghiệm tâm lý học. Những chuẩn mực này được suy diễn về mặt thống kê

học từ chỗ phân bổ các kết quả thực tế thành một trắc nghiệm và sự phân bổ

đó có được bằng một mẫu đại diện cho các cá nhân trong dân số mà trắc

nghiệm đó được xây dựng. Muốn đánh giá những kết quả của một cá nhân

qua một trắc nghiệm, người ta đối chiếu kết quả của người đó với các chuẩn

mực đó để xác định bằng các vị trí tương đối hoặc trình độ của người đó

trong dân số.

Chúng ta không nghi ngờ rằng những chuẩn mực thống kê học loại này

có thể rất hữu ích so với mục đích nghiên cứu của nhà tâm lý học tập học là

người sử dụng các trắc nghiệm đó, việc đó phần lớn có nghĩa là lập ra những

dự báo hợp thức đối với những cách giải quyết về sau này của cá nhân trong

những tình huống nhất định. Những chuẩn mực như vậy, với chúng ta hình

như không phải là những tiêu chuẩn thích hợp đối với những nơi cần phải

đưa ra một nhận định có giá trị về kết quả học tập. Thật vậy, chuẩn mực về

hiệu quả mà người ta vận dụng như thế phản ánh những thành tích thật sự

của người học, những thành tích này lại không nhất thiết phải tương xứng với

những kết quả người ta có thể mong đợi một cách hợp lý/đúng đắn ở một nền

giáo dục có giá trị. Ngoài ra, việc sử dụng những chuẩn mực thống kê học

che đậy một nguy cơ mà Stellwag gọi là giáo dục “bị đóng băng”, nghĩa là mặt

tiến hóa của giáo dục có thể bị tiêu tan, bởi vì người ta đang cố gắng thực

hiện những chuẩn mực bao hàm trong các trắc nghiệm.

Người ta tìm thấy sự không hài lòng này vốn là một sự kiện của các

chuẩn mực thống kê học, trong các sách của Mỹ, trong đó có cả tác phẩm

của nhà sư phạm học nổi tiếng Glaser. Năm 1963, ông đưa ra sự phân biệt

giữa những số đo so với một chuẩn mực cho những thông tin về “sự xếp loại

tương đối các cá nhân có liên quan đến hành vi của họ” với các số đo dựa

trên một tiêu chuẩn được tập trung vào việc xác định vào “kết quả mà người

học đã đạt được so với tiêu chuẩn”. Những năm gần đây, những “trắc nghiệm

dẫn chứng - tiêu chuẩn” này được nghiên cứu rất nhiều ở Mỹ. Người ta

thường dùng những trắc nghiệm đó để chẩn đoán cá nhân nhưng còn dùng

chúng để đánh giá mô tả chẩn đoán sản phẩm.

Những ý tưởng này của Glaser dựa vào sự phân biệt mà Flanagan đã

phát biểu năm 1951 với một bên là các “chuẩn mực” (“norms”) thống kê học

và một bên khác là các “tiêu chuẩn” (“standards”). Khái niệm sau cùng này có

nghĩa là “các mức độ nên đạt tới hoặc các mức độ mong đợi của thực hành

thường được diễn đạt bằng từ ngữ kết quả học tập”.

Bloom trình bày khái niệm sau cùng này bằng cụm từ “các chuẩn kỹ

năng thành thạo hoặc các chuẩn hiệu quả”.

Khái niệm “các chuẩn mực” gợi lên một ý rằng vấn đề ở đây là những

“tiêu chuẩn tuyệt đối gắn liền với những giá trị, những tiêu chuẩn tuyệt đối đo

được áp đặt từ trên xuống và không có một cơ sở khoa học nào cả. Nếu như

vậy, khái niệm không còn là khái niệm của thời đại chúng ta. Thế nhưng, tính

chất tuyệt đối, theo nghĩa hẹp, cũng không gắn liền với khái niệm “các chuẩn

của mức độ thu được” hoặc là các tiêu chuẩn của hiệu quả. Có thể gán cho

nó một cách giải thích để chứng minh theo quan điểm sư phạm và, đồng thời,

cách giải thích đó làm cho việc xác định các tiêu chuẩn trả thành một cách xử

lý đứúg đắn có thể tiến hành được.

Đối với bản chất của các loại tiêu chuẩn này, chúng cần thỏa mãn hai

điều kiện trái ngược nhau sau đây:

- Các tiêu chuẩn cần biểu thị một mức độ hiện thực của hiệu quả mong

đợi, trong một lĩnh vực mục tiêu xác định, nghĩa là chúng phái tính đến mức

độ phát triển của các người học và của các khả năng thực tế của trường học

hiện nay, đối với các giáo viên, các công cụ dạy học và thời gian có thể sử

dụng được.

- Mặt khác, các tiêu chuẩn cần phản ánh một mức độ hiệu quả có thể

đạt tới về mặt lý thuyết, nghĩa là mức độ cao nhất có thể có của hiệu quả

được nhận định là có thể đạt tới được bởi nhóm các người học đang nói đến,

trong giả thiết là việc giảng dạy đã được phục vụ đến mức tối ưu, nghĩa là tốt

nhất có thể được, có tính đến các hoàn cảnh hiện nay. Định đề cuối cùng này

đồng thời chỉ rõ rằng cả hai yêu cầu này cần gặp nhau ở một điểm.

Tùy theo phương pháp xây dựng các loại tiêu chuẩn hiệu quả này,

người ta có thể gợi ý cách làm sau:

- Trong giai đoạn đầu, người ta mời một nhóm chuyên gia và yêu cầu

họ nhận định về khả năng có thể đạt tới về mặt lý thuyết của các nội dung có

thể xảy ra sau này của một cuộc kiểm tra đánh giá. Việc xây dựng một

phương pháp kỹ thuật để thu thập và viết những nhận xét của các định giá

viên là một nhiệm vụ điều tra sư phạm học.

- Trong giai đoạn thứ hai, nên có những đánh giá của các chuyên gia

được kiểm tra lại theo kinh nghiệm thực tế, song việc này đến bây giờ lại rất

khó thực hiện. Một biện pháp có thể làm được là đi sâu vào các nội dung mà

khả năng thành công về mặt lý thuyết đã được các chuyên gia xác định, trong

các lớp học, nơi người ta chấp nhận rằng việc giảng dạy đã được tiến hành

trong những điều kiện tối ưu. Dựa vào mức độ khó khăn được quan sát ở

trong các lớp học, người ta còn cải biên cả những tiêu chuẩn đã được chấp

nhận từ lúc xuất phát. Đó rõ ràng là những tiêu chuẩn hiệu quả không phải là

những tiêu chuẩn tuyệt đối.

Bài 9. ĐÁNH GIÁ VÀ CHO ĐIỂM

Trước khi làm rõ khái niệm quá trình đánh giá, điều quan trọng là giải

quyết một vấn đề thường ngăn cản khả năng khám phá tính năng động của

đánh giá. Vấn đề này có liên quan đến việc sử dụng các thuật ngữ “đánh giá”

và “cho điểm” một cách đồng nghĩa.

Có phải đánh giá và cho điểm giống nhau? Có thể nói, có hai mặt giống

nhau trong hai thuật ngữ này là chúng cùng quá trình và đều nói đến hoạt

động của một cá nhân. Tuy nhiên, chúng không phải là những quá trình giống

nhau. Đánh giá là một quá trình xét đoán. Giáo viên xét đoán về chất lượng

đạt được của các mục tiêu học tập dự kiến của ngưòi học. Cho điểm là quá

trình định hướng qua đó giáo viên định hướng những dữ kiện đánh giá và

đưa ra những ký hiệu thể hiện mức độ đạt được về mặt học thuật của người

học. Cho điểm, một quá trình định lượng, tùy thuộc vào dữ liệu được cung

cấp do quá trình và đánh giá định tính. Đánh giá có thể hiện diện như một

hiện tượng độc lập trong khi đó cho điểm luôn luôn phải tùy thuộc vào đánh

giá.

Mặc dù, như được trình bày ở đây, đánh giá và cho điểm là hai quá

trình riêng biệt lần lượt diễn ra, trong thực tế, chúng ta biết rằng sự phân biệt

này không được thực hiện. Cho điểm và đánh giá thường được coi như là

các thuật ngữ đồng nghĩa. Những điểm số chính thức từ trước đến nay trở

thành phương tiện dễ thấy nhất trong việc lượng giá việc thực hiện nhiệm vụ

học tập của người học mặc dù có việc cần xem xét lại là tính tin cậy của việc

đánh giá hoạt động của người học.

Cách giải thích theo lối phân đôi của thuật ngữ đánh giá là (1) nó là một

quá trình trưởng thành hoặc (2) nó là một quá trình kiểm soát. Ý nghĩa của hai

cách giải quyết hoàn toàn khác nhau này cần được chú ý. Nếu chúng ta chấp

nhận khái niệm đánh giá là một quá trình hay một loạt quá trình qua đó việc

phán đoán giá trị về hoạt động của một người được thực hiện, thì chúng ta có

thể nhận thấy rằng đánh giá thực sự có thể được sử dụng tùy theo nhu cầu

của người đánh giá.

Chúng ta hãy xem xét thuật ngữ đánh giá. Trên đây, ý tưởng phán

đoán giá trị đã được sử dụng. Thuật ngữ giá trị (value) là một phần thống nhất

của từ đánh giá (e-valuation). Vì giá trị là niềm tin tạo lập mà người đó chấp

nhận như cái riêng của mình và sử dụng như một yếu tố quyết định hành vi

của người đó. Chúng ta có thể nhận thấy ngay rằng không có một quá trình

nào như thế là quá trình đánh giá khách quan, đặc biệt trong lâm sàng y khoa,

sự tìm kiếm mang tính mông lung, vì không có hiện tượng như thế hiện hữu.

Tuy nhiên, mặc dù việc đánh giá có thể không khách quan, việc đánh giá vẫn

có thể công bằng. Chất lượng của tính công bằng này phải là mục tiêu của

chúng ta.

Thái độ của người đánh giá đối với việc đánh giá là một trong những

yếu tố quyết định có liên quan đến việc sử dụng hướng đến quá trình nào.

Thái độ của chúng ta xác định việc sẽ hỏi đúng câu hỏi và có xem xét hành vi

đúng hay không.

Việc tìm kiếm tri thức của người học bị ngăn chặn bởi các thông tin

nhận được từ người đánh giá các em. Việc đánh giá không được coi là một

quá trình tăng nhanh sự tự phát triển, mà là một quá trình soát xét qua đó

người học có thể được ghi nhận bằng một số danh xưng trong cuộc sống.

Việc tiếp cận của người học liên quan đến việc đánh giá là sự tư duy trì chứ

không phải là tự khẳng định.

Thực ra, việc giải thích ý nghĩa của thuật ngữ đánh giá mà bạn sử dụng

với tư cách của một nhà đánh giá sẽ quyết định cách tiếp cận mà bạn sử

dụng và hoàn cảnh bạn tạo ra. Tất cả các nghề nghiệp mang tính giúp đỡ lôi

cuốn các cá nhân nào đó bằng một nhu cầu kiểm soát những ngưòi khác.

Những “người điều khiển con người này” tìm thấy trong các lĩnh vực dịch vụ

một phạm vi màu mỡ đặc biệt, vì khách hàng thường là những cá nhân hay

nhóm đang ở trạng thái phụ thuộc. Các nhà kiểm soát dựa trên các luật lệ,

quy định và phương pháp để tìm ra những phán đoán mang tính chất đánh

giá và tìm cách vận động người học vào một trạng thái hành vi được chấp

nhận. Sau đó, người học hướng năng lực của họ vào việc duy trì sự sống

trong một hệ thống hơn là vào các kinh nghiệm đóng góp vào sự tăng trưởng

và trưởng thành.

Việc đánh giá thường phản ánh kỹ năng của người học, vào tài làm cho

đối thủ lãng trí để thắng cuộc, hơn là khả năng của người ấy đáp ứng các

mục tiêu hoạt động học tập được đưa ra. Trong ngành giáo dục, gồm cả yếu

tố thực hành, thì đặc biệt nhạy cảm với tài làm cho đối thủ lãng trí để thắng

cuộc này và được người đánh giá cũng là người kiểm soát khuyến khích. Đặc

điểm thực của quá trình giám sát làm nảy sinh nhiều mối lo ngại làm cho có

sự khác nhau giữa việc đánh giá trong lâm sàng khác với tình huống học

thuật thông thường. Thẩm quyền trong lâm sàng có liên quan đến tất cả các

lãnh vực học tập: nhận thức, tình cảm, và tâm lý cơ động. Sự thay đổi trong

hành vi trong tất cả các lãnh vực này xảy ra trong phạm vi của mối quan hệ

gần gũi với giáo viên và thường được bạn bè, bệnh nhân và những nhà

chuyên môn hoặc những nhà thực hành nhân ra một cách đầy đủ. Cảm giác

về sự không phù hợp làm cho người học phải sợ phê bình, xấu hổ và bị loại

ra. Nếu thầy giáo trong tình huống lâm sàng đặt giá trị trước tiên trên các luật

lệ và phương pháp, người học thường phải lựa chọn lại cách làm cho đối thủ

lãng trí để thắng cuộc để tự bảo vệ mình khỏi sự kiểm soát có ác cảm đo

lường.

Những điều nào của người đánh giá nhận thấy được về việc đánh giá

để giúp cho sự trưởng thành? Những cá nhân này chấp nhận khái niệm là

hầu hết những người học đều có khả năng thông thạo các nhiệm vụ học tập

và dùng đánh giá như là một quá trình chẩn đoán qua đó các chiến lược dạy

học được đưa ra để kích thích người học tìm kiếm tri thức, giá trị và khả năng

thực hành. Bầu không khí dành cho việc đánh giá manh tính ủng hộ, đặt cơ

sở trên sự tin tưởng và tôn trọng đối với người học. Quá trình phát triển cũng

như kết quả sau cùng là mối quan tâm của các nhà đánh giá này. Trò chơi

được giảm thiểu, bởi vì quá trình dạy - học là một việc làm khó khăn được

chia sẻ. Đánh giá là phần thống nhất của một quá trình giáo dục hoàn chỉnh.

Niềm tin của giáo viên về đặc điểm của con người và quá trình dạy -

học có liên quan trực tiếp đến niềm tin về quá trình đánh giá và đặc điểm của

các chiến lược đánh giá được soạn thảo.

Cách tiếp cận tâm lý giáo dục đến giảng dạy sử dụng đánh giá như là

một phương tiện để kiểm soát. Các kết quả mong đợi cũng như các điều kiện

học tập và các tiêu chuẩn được sử dụng để xác định thành tích học tập được

phác họa cụ thể. Đó là cách tiếp cận đánh giá kết quả. Tất cả người học và

giáo viên đều được yêu cầu theo “cùng nhịp điệu”. Mặc dù các kỹ thuật không

được ưa chuộng vì thất bại để đạt đến kết quả học tập không được coi như

một phần của lý thuyết này thực sự được sử dụng. Trong nhiều trường hợp,

việc không khen thưởng có thể được coi là phương pháp chống đối.

Cách tiếp cận nhân văn sử dụng đánh giá là sự lượng giá giúp trưởng

thành. Nó là một quá trình mở cơ động đan kết chặt chẽ với quá trình dạy -

học. Nó nhấn mạnh quá trình cũng như kết quả. Đánh giá giúp trưởng thành

là một phương tiện, chứ không phải là mục đích. Nó đề cao sự phát triển cá

nhân.

Cách ghi lại việc đánh giá được hướng tới sự trưởng thành của người

học gồm cả việc đánh giá tổng kết và đánh giá hình thành. Việc đánh giá tổng

kết xảy ra ở cuối một chương trình, một khóa học hay một đơn vị học trình và

dựa vào mức độ người học nhận biết các mục tiêu đã được xác định. Đây là

hình thức đánh giá trong thực tế thông thường nhất và được sử dụng như là

một cơ sở để quyết định điểm số. Trắc nghiệm, bài tập và các công trình

nghiên cứu là các cách thức thông thường. Cách đánh giá này được gọi là

cách đánh giá “cái gì”.

Ngược lại, cách đánh giá hình thành xảy ra trong suốt chương trình,

khóa học hoặc đơn vị học trình và dựa vào sự tiến bộ của người học đối với

việc nhận ra các mục tiêu học tập. Loại đánh giá này được thực hiện xuyên

suốt quá trình học tập và gọi là quá trình đánh giá “cái gì” và “cái có thể”. Nó

dựa vào nguyên tắc thông tin phản hồi để hướng dẫn người dạy và người học

đến các mặt học tập cần sự quan tâm sâu sắc khi người học tiếp cận đến việc

thành thạo các hành động học tập. Các phương pháp được sử dụng gồm các

ghi chép nhỏ, các tình huống giải quyết vấn đề, hồ sơ theo dõi, quan sát các

hành vi thực tiễn, các cuộc họp và ghi hình.

Loại đánh giá này không được soạn thảo để thu thập số liệu như là một

cơ sở để cho điểm. Nó được dùng để lượng giá sự tiến bộ của người học, để

chẩn đoán các nhu cầu học tập để các biện pháp sửa chữa có thể được thiết

lập một cách nhanh chóng, và bắt kịp việc học tập của người học tùy theo nhu

cầu và khả năng riêng của người đó.

Cách tiếp cận hệ thống đến việc đánh giá học tập về mặt tình cảm, phối

hợp các quá trình đánh giá tổng kết và hình thành, thì cần thiết. Các mục tiêu

được đưa ra trong các thuật ngữ tâm lý giáo dục được xác định như là các

kết quả thống nhất với mức độ học tập mong đợi. Các dữ liệu được thu thập

và các chiến lược được soạn thảo được các kết quả này xác định. Việc đánh

giá tổng kết có thể đạt đến được và cách đánh giá hình thành nhận ra các

mặt phát triển của việc học tập mang tính chất tình cảm.


Dorothy E. Reilly (1982), Teaching and Evaluating the Affective,

Domain in Nursing Programs, USA: Charles B. Slack, Inc. (p.p 52-57).

Bài 10. CÁCH CHO ĐIỂM

Không có một quy luật chặt chẽ nào về phương pháp cho điểm tốt nhất.

Thực ra, như Erickson và Strommer (1991) chỉ ra rằng, bạn cho điểm như thế

nào tùy thuộc nhiều vào việc đánh giá, giả định và triết lý giáo dục của bạn:

nếu bạn coi những lớp học nhập môn là những lớp học “hạt giống” - để phân

biệt người học không có tiềm năng cho sự học thành công trong tương lai về

lĩnh vực đó - bạn sẽ chấp nhận cách tiếp cận việc cho điểm khác với giáo viên

xem các lớp học nhập môn là giảng dạy những kỹ năng quan trọng mà tất cả

các người học phải thông thạo.

Tuy nhiên, tất cả các giáo viên đều đồng ý rằng điểm số cung cấp thông

tin về việc người học học tập như thế nào (Erickson và Strommer, 1991).

Nhưng điểm số cũng được dùng cho những mục đích khác. Scriven (1974) đã

xác định ít nhất việc cho điểm có sáu chức năng:

- Mô tả rõ ràng giá trị, niềm vui hoặc cách đánh giá công việc thực hiện.

- Cải thiện năng lực của người học để xác định công việc tốt, có nghĩa

là, cải tiến việc tự đánh giá hoặc những kỹ năng phân biệt của người học dựa

vào công việc được giao.

- Kích thích và khuyến khích việc người học học giỏi.

- Trao đổi cách đánh giá của giáo viên về tiến bộ của người học.

- Thông báo cho giáo viên về những điều người học đã học được và

chưa học được.

- Chọn lựa người để phát thưởng hoặc tiếp tục học.

Đối với một số người học, điểm số cũng là dấu hiệu của sự chấp nhận

hoặc không chấp nhận; nên họ xem xét chúng theo cách riêng của cá nhân.

Do tầm quan trọng của điểm số, giáo viên cần thông tin cho người học lý do

và phương thức cho điểm rõ ràng.

Nếu bạn soạn những hướng dẫn rõ ràng làm căn cứ cho việc đánh giá

hoạt động, bạn sẽ nhận thấy quá trình cho điểm hiệu quả hơn và chức năng

quan trọng của việc cho điểm - thông báo mức độ hiểu của người học - sẽ dễ

dàng hơn. Hơn nữa, nếu bạn cho điểm một cách cẩn thận và nhất quán, bạn

có thể giảm số người học khiếu nại và yêu cầu bạn cho điểm lại. Những đề

xuất dưới đây giúp bạn thiết kế phương thức cho điểm rõ ràng và công bằng.

Đối với hướng dẫn tính điểm cuối khóa, hãy đọc “Tính toán và cho điểm.”

Dưới đây là bảng so sánh giữa đánh giá và cho điểm:

Đánh giá Cho điểm

Mang tính hình thành Mang tính tổng kết

Mang tính chẩn đoán Mang tính cuối cùng

Không mang tính đánh giá Mang tính đánh giá

Mang tính riêng tư Mang tính quản lý

Thường không nêu danh tính Xác định rõ ràng

Từng phần Tổng thể

Riêng biệt Toàn diện

Chủ yếu là từng phần giáo trình Hầu như toàn bộ giáo trình

Mang tính đề xuất Mang tính cứng

Thường được định hướng theo mục

tiêu

Thường được hướng dẫn theo nội

dung

Chiến lược tổng quát

(1) Cho điểm căn cứ trên việc thành thạo tri thức và kỹ năng của người

học. Hãy giới hạn cách đánh giá của bạn với kết quả học thuật. Loại bỏ

những xem xét như hành vi trong lớp, sự cố gắng, việc tham gia trong lớp,

chuyên cần, đúng giờ, thái độ tốt, đặc điểm nhân cách, hoặc hứng thú của

người học vào tài liệu khóa học, như là cơ sở để cho điểm khóa học. Nếu bạn

xem xét những yếu tố không mang tính học thuật này, bạn sẽ mơ hồ ý nghĩa

ban đầu của điểm số, như là một chỉ số về những điều người học đã học. Để

thảo luận về việc tại sao không tính việc tham gia trong lớp học vào việc cho

điểm, hãy đọc “Khuyến khích người học tham gia vào việc thảo luận.” (Nguồn:

Jacobs và Chase, 1992)

(2) Tránh hệ thống cho điểm đưa người học vào sự thi đua với bạn

cùng lớp và giới hạn điểm số cao. Hệ thống quy chuẩn này, như cho điểm

theo đường cong, một việc chống lại chiến lược học tập hợp tác được chỉ ra

rằng là có hiệu quả trong việc nâng cao việc học của người học. Chấm điểm

theo hệ thống quy chuẩn tạo ra những kết quả không cần thiết đối với nhiều

người học, như làm giảm động cơ học tập, làm tăng sự lo lắng về đánh giá,

làm giảm khả năng sử dụng thông tin phản hồi để cải tiến học tập, và làm làm

cho các mối quan hệ xã hội tồi tệ. (Nguồn: Crooks, 1988; McKeachie, 1986).

(3) Cố gắng đừng quá nhấn mạnh trên điểm số. Giải thích cho lớp của

bạn ý nghĩa và căn bản của điểm số và cách thức bạn dùng khi cho điểm.

Vào đầu học kỳ, hãy thông báo cho người học bằng văn bản (đọc “The

Course Syllabus”) có bao nhiêu bài kiểm tra, bài viết, bài tập ở nhà và bài thi

cuối khóa để tính vào điểm môn học. Một khi bạn đã giải thích xong cách cho

điểm, tránh nhấn mạnh điểm số hoặc bài tập có liên quan đến điểm số, một

việc chỉ làm tăng thêm sự lo lắng của người học và làm giảm động cơ học tập

của họ chứ không phải để nhận được phần thưởng bên ngoài như điểm số.

(Nguồn: Allen and Rueter, 1990; Fuhrmann và Grasha, 1983).

(4) Thông báo cho người học về tiến bộ của họ trong suốt học kỳ. Đối

với mỗi bài làm, bài phân về nhà, bài kiểm tra giữa học kỳ hoặc dự án mà bạn

cho điểm, hãy cho ngưòi học biết ý nghĩa về điểm số của họ. Hãy cho điểm

tổng số điểm hơn là một điểm bằng chữ. Điểm bằng chữ có khuynh hướng

tạo ra sự liên kết về mặt xúc cảm mà điểm tổng số không có. Hãy chỉ ra mức

độ và phân bố điểm chỉ ra mức độ kết quả nào là được. Thông tin như thế có

thể tạo động cơ cho người học cải tiến học tập nếu họ đang học kém hoặc

duy trì hoạt động của họ nếu họ đang học tốt. Bằng việc thông báo cho người

học trong suốt học kỳ, bạn cũng ngăn chặn được những ngạc nhiên không

thoải mái vào cuối học kỳ. (Nguồn: Lowman, 1984; Shea, 1990).

Giảm thiểu khiếu nại của người học về cách cho điểm

(1) Xác định rõ ràng cách cho điểm trong nội dung giáo trình của bạn

và thông báo thông tin này trong lớp. Người học muốn biết điểm số của họ

được cho như thế nào, trọng số của những bài làm và những bài cho về nhà

và mô hình cho điểm của bạn sẽ sử dụng để tính điểm của họ: lớp học sẽ

được cho điểm theo đường cong bình thường hoặc theo tiêu chuẩn tuyệt đối?

Nếu bạn có ý định cho phép học vào những học kỳ không chính thức, nộp bài

tập phân về nhà chậm, hoặc sửa bài làm, hãy nói rõ ý định đó.

(2) Hãy nói cách thức về những bài làm trễ. Bạn sẽ từ chối hoặc chấp

nhận bài làm trễ? Có bớt điểm theo thời gian nộp bài trễ không? Giải quyết

những bài làm trễ trên cơ sở cụ thể không? Có thời gian chiếu cố không? Hãy

đọc “Preparing or Revising a Course.”

(3) Tránh bổ sung cách cho điểm trong học kỳ. Sự thay đổi cách cho

điểm giữa khóa học có thể làm xói mòn lòng tin của người học vào tính công

bằng, nhất quán, khách quan và kỹ năng tổ chức của bạn. Nếu bạn cần thay

đổi, hãy giải thích đầy đủ cho người học của bạn. (Nguồn: Frisbie, Diamond

và Ory, 1979).

(4) Hãy tạo nhiều cơ hội cho học sinh bày tỏ họ hiểu điều gì. Bằng cách

tạo nhiều cơ hội cho học sinh bày tỏ họ hiểu điều gì, bạn sẽ có một hình ảnh

chính xác hơn về khả năng của họ và tránh phạt một người học nghỉ vào

ngày làm bài thi. Vì thế, ngoài bài thi cuối khóa, hãy cho một hoặc hai bài giữa

học kỳ và một hoặc hai bài viết ngắn. Đối với những khóa học chia nhỏ hơn,

Erickson và Strommer (1991) đề nghị cho những bài làm hoặc những bài viết

ngắn hơn và lập kế hoạch một số hình thức đánh giá mỗi hai hoặc ba tuần.

(5) Xem xét cho người học lựa chọn những bài tập phân về nhà thay

thế. Giáo viên trình bày một danh sách những hoạt động có cho điểm theo

từng hoạt động xem xét giá trị về giáo dục và động cơ của bài phân về nhà,

độ khó, sức cố gắng có thể cần. Hãy nói cho người học họ cần bao nhiêu

điểm để họ đạt được mức A, B hoặc C và họ chọn sự kết hợp những bài

phân về nhà đáp ứng được điểm họ cần cho phần của khóa học. Đây là một

số hoạt động khả thi:

- Viết một nghiên cứu tình huống.

- Tham gia vào việc báo cáo về những kinh nghiệm thực địa.

- Lãnh đạo nhóm tham gia hội thảo.

- Phục vụ cho nhóm tham gia hội thảo.

- Ghi nhật ký hoặc ghi những ý tưởng có liên quan đến khóa học.

- Viết đánh giá tổng kết sâu sắc về những bài giảng.

- Làm ra tài liệu giảng dạy cho khóa học (hướng dẫn giảng dạy, câu hỏi

thi, hoặc những tài liệu nghe nhìn) về một khái niệm hoặc chủ đề cụ thể.

- Tham gia dự án nghiên cứu hoặc bài tập nghiên cứu ban đầu.

- Tổng quan tài liệu nghiên cứu hiện nay về chủ đề có liên quan đến

khóa học.

- Ghi chép những bài đọc gồm những bài tóm tắt ngắn của các bài đọc

và bài góp ý, áp dụng hoặc những lời phê bình.

- Hoàn thành bài tập phân về nhà giải quyết vấn đề (như lập mô hình

nghiên cứu để kiểm nghiệm một giả thuyết hoặc tạo ra một trắc nghiệm để đo

lường thứ gì đó) (Nguồn: Davis, Wood, và Wilson, 1983).

(6) Nhấn mạnh cho người học biết rằng điểm số phản ánh việc học về

một nhiệm vụ cụ thể chứ không phải là đánh giá về con người. Nhắc người

học rằng giáo viên cho điểm chỉ trên một tờ giấy. Bạn cũng có thể cho người

học biết, nếu phù hợp, kết quả nghiên cứu cho thấy rằng điểm số có ít hoặc

không có mối liên hệ để đo lường thành quả của người lớn (Eble, 1988, trang

156).

(7) Khuyến khích người học học tập kém. Nếu người học gặp khó khăn,

hãy làm những điều bạn có thể để giúp họ cải tiến hơn vào bài tập hoặc bài

thi sắp tới. Nếu họ thực sự học tốt, hãy xem xét điều này khi tính trung bình

bài điểm thấp ban đầu với bài lần sau có điểm cao hơn. (Nguồn: Lowman,

1984).

(8) Liên hệ trực tiếp với người học nổi giận hoặc buồn về điểm số của

họ. Bảo người học buồn này cần một ngày hoặc nhiều hơn để khuây khỏa.

Việc này cũng hữu ích khi bảo một người học chuẩn bị viết đơn khiếu nại

hoặc yêu cầu xem xét lại điểm. Khi bạn gặp người học này tại văn phòng, hãy

chuẩn bị sẵn mọi tài liệu phù hợp: câu hỏi kiểm tra, câu trả lời hoặc tiêu chí,

những mẫu của câu trả lời hay.

- Hãy lắng nghe mối quan tâm của người học hoặc đọc lời thông báo

với tinh thần mở rộng và trả lời một cách bình tĩnh. Đừng tự cho phép mình

gây ra chống đối và đừng chống đối người học.

- Hãy mô tả những yếu tố chính của câu trả lời hay và chỉ ra câu trả lời

chưa hoàn chỉnh hoặc chưa đúng như thế nào.

- Hãy giúp cho người học hiểu những lý do mà bạn cho điểm, cần có

thời gian để suy nghĩ về yêu cầu của người học hoặc đọc lại bài thi nếu bạn

cần, nhưng chống lại sức ép để thay đổi một điểm số do nhu cầu cá nhân của

người học (để tiếp tục học sau đại học hoặc duy trì tên trong danh sách của

chủ nhiệm khoa). Nếu phù hợp, đề nghị viết thư cho cố vấn người học hoặc

người khác, mô tả bài làm của người học một cách chi tiết và chỉ ra những

tình tiết giảm khinh đã làm cho điểm số thấp. (Nguồn: Allen and Rueter, 1990;

McKeachie, 1986).

(9) Lưu giữ điểm chính xác của người học. Khoa của bạn có thể lưu

một bản báo cáo điểm cuối khóa, nhưng điều quan trọng đối với bạn là lưu

toàn bộ điểm đã cho trong suốt học kỳ, phòng khi một người học muốn tranh

luận về điểm số, trả nợ môn học hoặc xin thư giới thiệu.

Sử dụng hiệu quả chiến thuật cho điểm

Đánh giá cách cho điểm của bạn

(1) So sánh phân bố điểm số của bạn với những phân bố điểm số của

những khóa học tương tự trong khoa của bạn. Sự khác biệt giữa phân bố

điểm số của bạn với phân bố điểm số của đồng nghiệp không nhất thiết có

nghĩa là phương pháp của bạn là sai. Nhưng khi thấy sự khác biệt có thể gợi

ý cho bạn xem xét lại cách làm của mình. (Nguồn: Frisbie, Diamond và Ory,

1979).

(2) Hỏi người học về cách cho điểm các bạn trong bản thăm dò ý kiến

vào cuối khóa học. Đây là một số câu hỏi mẫu (được cải biên từ Frisbie,

Diamond và Ory, 1979, trang 22):

Ở mức độ nào:

- Cách cho điểm trong khoa học công bằng không?

- Cách cho điểm trong khoa học có được giải thích rõ ràng không?

- Bạn có nhận được thông tin phản hồi phù hợp về kết quả của bạn

không?

- Những yêu cầu để chấm lại điểm hoặc việc xem xét có diễn ra công

bằng không?

- Giáo viên có đánh giá việc học tập của bạn một cách có ý nghĩa và có

ý thức không?

Barbara Gross Davis, University of California, Berkeley.

(Từ Tools for Teaching, bản quyền của Jossey-Bass.

Muốn tìm hiểu thông tin về mua bản quyền hoặc in lại, hãy liên hệ với

Jossey-Bass. Được phép in lại September 1,1999).


1. Allen R. R. and RueterT. (1990), Teaching Assistant Strategies,

Dubuque, Iowa: Kendall / Hunt.

2. Crooks T. J. (1988), “The Impact of Classroom Evaluation Practices

on Students” Review of Educational Research, 58(4), 438-481.

Phần 2. TRẲC NGHIỆM KHÁCH QUAN

Bài 1. LƯỢC SỬ TRẮC NGHIỆM

1. NHỮNG THÀNH TỰU ĐẠT ĐƯỢC VIỆC ỨNG DỤNG PHƯƠNG PHÁP TRẮC NGHIỆM Ở MỘT SỐ NƯỚC TRÊN THẾ GIỚI

Tại một số nước, việc áp dụng trắc nghiệm trong trường học còn tùy

thuộc vào mức độ khác nhau.

Ở Pháp, nơi phát xuất trắc nghiệm trí tuệ Binet nhưng lại phổ biến

chậm. Khi Hoa Kỳ cải biến trắc nghiệm Binet thành trắc nghiệm Stanford-

Binet sử dụng rộng rãi thì sau chiến tranh thế giới lần thứ nhất, Pháp mới để ý

trắc nghiệm. Sau chiến tranh thế giới thứ hai, trắc nghiệm thành quả học tập

phổ biến rộng rãi ở Pháp không những ở nhà trường phổ thông mà còn ở các

trường đại học nữa.

Ở Mỹ, vào đầu thế kỷ XX đã bắt đầu sử dụng phương pháp trắc nghiệm

trong dạy học. Đến năm 1940 đã xuất hiện nhiều hệ thống trắc nghiệm đánh

giá kết quả học tập của học sinh. Năm 1961 đã có 2126 mẫu trắc nghiệm tiêu

chuẩn. Năm 1963 đã xuất hiện công trình của Gedevik dùng máy tính điện tử

xử lý các kết quả trắc nghiệm trên diện rộng.

Ở Liên Xô, việc nghiên cứu kết quả của phương pháp trắc nghiệm trở

thành một đề tài kín của viện Hàn lâm khoa học Liên Xô. Tuy nhiên do kỹ

thuật trắc nghiệm chưa hoàn chỉnh, người áp dụng trắc nghiệm chưa thấy hết

nhược điểm của nó nên gây ra nhiều sai sót, sau đó trắc nghiệm không còn

được sử dụng ở Nga. Cho đến năm 1962, các nhà giáo dục ở Nga mới quay

trở lại nghiên cứu và sử dụng trắc nghiệm, các trường đại học cũng nghiên

cứu trắc nghiệm thành tích học tập như là một bộ phận trong nghiên cứu dạy

học chương trình hoá. Đến thập niên 70, trắc nghiệm thành tích học tập mới

phát triển rộng rãi, nhất là trắc nghiệm môn tiếng nước ngoài. Một số tài liệu

nước ngoài về Test cũng được dịch ra sang tiếng Nga để tham khảo.

Ở Anh, năm 1963 đã có hội đồng Hoàng Gia hàng năm quyết định các

trắc nghiệm chuẩn cho trường trung học.

Những năm gần đây, nhiều nước trên thế giới cũng đã sử dụng trắc

nghiệm ngày càng phổ biến và rộng sâu trong quá trình giảng dạy ở phổ

thông cũng như việc thi tuyển ở đại học như: ở Anh, Mỹ, Úc, Hà Lan, Bỉ,

Pháp, Nhật Bản, Trung Quốc, Thái Lan, Hàn Quốc đã phát triển mạnh.

2. VIỆC ỨNG DỤNG TRẮC NGHIỆM THÀNH TÍCH HỌC TẬP Ở VIỆT NAM

Việc sử dụng trắc nghiệm đã có một lịch sử lâu dài gần một thế kỷ thì

tại Việt Nam, cụ thể:

Ở miền Nam từ năm 1950 một số học sinh đã làm quen với trắc nghiệm

qua các cuộc khảo sát khả năng ngoại ngữ do các cơ quan quốc tế tổ chức

tại Việt Nam. Năm 1964 đã có một số tài liệu hướng dẫn soạn trắc nghiệm do

trung tâm trắc nghiệm và hướng dẫn phổ biến nhưng rất sơ lược bằng những

tài liệu mỏng ra định kỳ.

Ở miền Bắc từ những năm 1960 các nhà nghiên cứu giáo dục tìm hiểu

qua các tài liệu về tâm lý học và giáo dục học của Liên Xô.

Việc áp dụng trắc nghiệm trong các kỳ thi được thực hiện ở miền Nam

từ năm 1966, ở các môn Sử, Địa, Công dân cho kỳ thi lấy bằng trung học đệ

nhất cấp. Tại trường trung học kiểu mẫu Thủ Đức, trắc nghiệm cũng được

dùng để sát hạch khả năng của các học sinh trong các đợt tuyển sinh vào

trường cũng như kiểm tra, đánh giá học tập của học sinh.

Từ khoá thi Tú tài I, Tú tài II năm 1971 về sau các môn Triết học, Sử,

Địa, Công dân đều được đánh giá bằng trắc nghiệm với hình thức câu nhiều

lựa chọn. Đến kỳ thi Tú Tài II khoá 1974, tất cả các môn thi (trừ môn Thể dục)

đều được đưa ra đề bằng trắc nghiệm và bài thi được chấm bằng máy tính

điện tử IBM 360 nhập từ Mỹ.

Cũng từ năm 1970 - 1971 trong các kỳ thi tuyển sinh Đại học như các

trường Đại học Sư phạm, Đại học Y dược, Đại học Bách khoa đều áp dụng

cả hai loại đề là trắc nghiệm (Test) và luận đề cho những môn Toán, Lý,

Hoá…

Cũng từ năm 1970, môn trắc nghiệm được giảng dạy ở các lớp Cao

học Giáo dục tại trường Đại học Sư phạm Sài Gòn, đều được huấn luyện kỹ

lưỡng về Test. Họ đã biên soạn các câu trắc nghiệm, trên các lớp học tại

trường phổ thông trong nhiều năm và nhiều người đã hoàn tất luận văn tốt

nghiệp theo hướng ứng dụng Test để đo lường thành tích của học sinh về

các môn như Anh, Pháp,Toán, Lý, Sinh, Sử, Địa…

Năm 1972, tác giả Dương Thiệu Tống đã viết “Trắc nghiệm và đo

lường thành tích học tập”, Đại học Sư phạm Sài Gòn, dùng làm tài liệu học

tập cho các lớp này. Một số người trong lớp này, sau giải phóng còn ở lại

trong nước tiếp tục ứng dụng Test trong phạm vi lĩnh vực mình giảng dạy:

như ông Châu Kim Lang, giảng viên trường ĐH Sư phạm Kỹ thuật TP. Hồ Chí

Minh, sau năm 1975 vẫn tiếp tục nghiên cứu tìm tòi tham khảo nhiều sách về

Test do Liên Xô (cũ) và các nước Đông Âu (như Rumani, Bungari, Tiệp…)

xuất bản và viết cuốn “Trắc nghiệm kiến thức kỹ thuật Nông Nghiệp ở trường

phổ thông trung học” được nhà xuất bản Giáo dục in và phát hành năm 1988.

Nhìn chung, từ năm 1975 đến 1993 việc hình thức trắc nghiệm áp dụng

trong thi, kiểm tra việc học tập của học sinh rất ít phổ biến, chỉ trừ các môn

ngoại ngữ như: Anh, Pháp (do đặc điểm của môn học này, trắc nghiệm vẫn

thường được dùng trong các kỳ thi xếp lớp, cuối khoá, thi chứng chỉ quốc gia.

Việc nghiên cứu trắc nghiệm còn hạn chế trong phạm vi quan tâm của từng

cá nhân. Cả hai miền Nam, Bắc đều có những người nghiên cứu tìm hiểu về

trắc nghiệm.

Sau một thời gian dài phương pháp kiểm tra đánh giá bằng trắc nghiệm

hầu như không được đề cập tới trên các tài liệu tạp chí về giáo dục ở cả hai

miền Nam, Bắc. Cho đến hội thảo về đổi mới đại học do Bộ Giáo dục và Đào

tạo tổ chức năm 1994 gồm đại biểu các trường đại học trong và ngoài nước,

qua kết quả thăm dò ý kiến về các chủ trương đổi mới đại học. Và cũng từ

đầu năm 1994 Bộ Giáo dục và Đào tạo đã ra các văn bản khuyến khích sử

dụng trắc nghiệm trong kiểm tra đánh giá kết quả học tập. Đồng thời, có

những hoạt động cụ thể như tập huấn hội thảo về Test thì tại nhiều trường đại

học (Y khoa, Kinh tế, Bách khoa, Tổng hợp Sư phạm) đã áp dụng hình thức

trắc nghiệm vào việc đánh giá, kiểm tra tri thức của sinh viên.

Cũng trong năm đó Vụ Đại học cho in cuốn “Những cơ sở của kỹ thuật

trắc nghiệm” (tài liệu sử dụng nội bộ) của tác giả Lâm Quang Thiệp.

Theo xu hướng đổi mới việc kiểm tra đánh giá, Bộ Giáo dục và Đào tạo

đã giới thiệu phương pháp trắc nghiệm trong các trường đại học và bắt đầu

những công trình thử nghiệm (Phan Tuấn Nghĩa, Những vấn đề giảng dạy

Sinh học, Hà Nội, 1994).

Tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan ở Việt Nam

Theo Báo Sài Gòn Giải Phóng ra ngày 20.04.1996 thì Bộ Giáo dục và

Đào tạo cho phép trường Đại học Đà Lạt là trường đại học đầu tiên ở Việt

Nam áp dụng phương thức thi trắc nghiệm khách quan vào kỳ thi tuyển sinh

năm 1996 của trường này. Và trường Đại học Đà Lạt đã tổ chức được kỳ thi

này.

Đại học Quốc gia Thành phố Hồ Chí Minh đã nhiều lần có ý định tổ

chức tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan cho các

môn Toán, Hoá, Sinh và Anh Văn. Chủ trương này đã được Đại học Quốc gia

Thành phố chuẩn bị từ nhiều năm qua nhưng chưa thực hiện được bởi nhiều

nguyên nhân, nhưng Đại học Quốc gia Thành phố Hồ Chí Minh vẫn quyết tâm

thực hiện việc thi tuyển sinh bằng phương pháp trắc nghiệm vì nó có những

ưu điểm của phương pháp này.

Trước đây, trong cả nước chỉ mới có hai trường Đại học Đà Lạt và Đại

học Tây Nguyên tổ chức được việc thi tuyển sinh bằng phương pháp trắc

nghiệm.

Cho đến nay, kể từ năm học 2006-2007, Đại học Quốc gia Thành phố

Hồ Chí Minh và nhiều trường đại học ở Thành phố Hồ Chí Minh sẽ chính thức

áp dụng thi tuyển sinh đại học bằng hình thức thi trắc nghiệm. Thêm vào đó là

kể từ năm học này kỳ thi tốt nghiệp trung học phổ thông sẽ áp dụng hình thức

thi trắc nghiệm, trước tiên cho môn ngoại ngữ.

Bài 2. SO SÁNH CÁCH ĐÁNH GIÁ BẰNG TRẮC NGHIỆM VÀ LUẬN ĐỀ

1. ĐỊNH NGHĨA TRẮC NGHIỆM

Trắc nghiệm được dịch từ chữ “Test” ngày nay trắc nghiệm được hiểu

theo nghĩa rộng là dụng cụ, phương tiện, cách thức để khảo sát, đo lường.

Trắc nghiệm thành quả học tập có nghĩa là khảo sát đo lường các

thành quả đạt được của người học trong quá trình học tập.

Trắc nghiệm thành quả học tập với tính cách là một công cụ để khảo

sát trình độ của người học, có hai đặc điểm cơ bản là tính tin cậy và tính giá

trị:

(1) Tính tin cậy của trắc nghiệm đòi hỏi sự rõ ràng, trong sáng của câu

hỏi trắc nghiệm, đó là các yếu tố: từ ngữ sử dụng chính xác, không mơ hồ,

không gây nhầm lẫn, không thể hiểu nhiều nghĩa. Đặc trưng tin cậy của trắc

nghiệm làm cơ sở cho đặc trưng giá trị.

(2) Tính giá trị: một bài trắc nghiệm có giá trị khi nó đáp ứng được mục

đích đề ra.

2. MỘT VÀI SỰ KHÁC BIỆT GIỮA KIỂM TRA TRẮC NGHIỆM KHÁCH QUAN VÀ VIỆC KIỂM TRA BẰNG LUẬN ĐỀ

* Kiểm tra bằng luận đề

Là dạng dùng những câu hỏi tự luận đòi hỏi người học tự xây dựng câu

trả lời và diễn tả nó bằng ngôn ngữ của chính mình. Mặt khác, dạng này được

xem như là chủ quan, vì việc đánh giá cho điểm câu trả lời có thể tùy thuộc

rất nhiều vào chủ quan của người chấm, từ khâu xây dựng đáp án, biểu điểm,

xác định các tiêu chí đánh giá đến khâu đối chiếu bài trả lời với đáp án, tất cả

đều là các tiêu chí đã định.

* Kiểm tra bằng trắc nghiệm khách quan:

Là dạng Test trong đó mỗi câu hỏi có kèm những câu trả lời sẵn. Loại

dạng câu hỏi này cung cấp cho người học một phần hay tât cả những thông

tin cần thiết và đòi hỏi người học phải chọn một câu để trả lời hoặc chỉ cần

điền thêm một vài từ. Dạng này được xem là khách quan vì chúng đảm bảo

tính khách quan khi chấm điểm, bên cạnh đó phải xây dựng sao cho mỗi câu

hỏi chỉ có một câu trả lời đúng nhất.

3. SỰ KHÁC BIỆT GIỮA KIỂM TRA BẰNG TRẮC NGHIỆM KHÁCH QUAN VÀ LUẬN ĐỀ

Bảng 1. Sự khác biệt giữa kiểm tra bằng trắc nghiệm khách quan và luận đề

TRẮC NGHIỆM KHÁCH QUAN LUẬN ĐỀ

- Số câu hỏi trong một bài (đề) gồm

nhiều câu mang tính cách chuyên

biệt.

- Số câu hỏi trong một bài (đề) thì

tương đối ít, mang tính cách tổng

quát.

- Không đánh giá được khả năng diễn

đạt mà chỉ đòi hỏi những câu trả lời

ngắn gọn.

- Đánh giá được khả năng diễn đạt,

đặc biệt là diễn đạt tư duy, cách lập

luận một vấn đề.

- Thời gian kiểm tra trong một bài (đề)

ngắn, kiểm tra được nhiều kiến thức,

bao trùm toàn bộ nội dung.

- Thời gian kiểm tra tương đối dài,

nhưng chỉ ở trong phạm vi kiến thức

hẹp.

- Tránh được khuynh hướng học tập

trung (học tủ) một chỗ.

- Khuynh hướng chỉ học tập trung vào

một số kiến thức trọng tâm rất cao.

- Người học phải độc lập trong cách

nghĩ, phải biết nhìn nhận sự vật hiện

tượng một cách đúng nhất.

- Người học thuần túy chỉ dựa vào nội

dung ghi chép, tài liệu là chính.

- Khách quan trong khi chấm và kết

quả điểm số có độ tin cậy và chính

xác cao.

- Kết quả điểm số phụ thuộc vào chủ

quan của người chấm.

- Người học có thể tự đánh giá được

kết quả bài làm của mình.

- Người học không tự mình đánh giá

được chính xác qua kết quả bài làm

của mình.

- Trong thời gian ngắn, hạn chế được

tình trạng trao đổi, dùng tài liệu quay

cóp.

- Người học có thể dễ trao đổi bài, sử

dụng tài liệu, quay cóp.

- Áp dựng được công nghệ hiện đại - Khó áp dụng được vào trong công

trong quá trình chấm bài và phân tích kết quả.

nghệ, phải đọc kỹ từng bài, chấm rất công phu và phân tích kết quả thi.

Thực tế, qua hai phương pháp trên phương pháp được sử dụng phổ

biến nhất trong thi cử, kiểm tra, đánh giá ở nước ta từ bấy lâu nay vẫn là

phương pháp tự luận. Phương pháp trắc nghiệm, nói chung cũng còn mới,

chưa được áp dụng rộng rãi trong các trường học về thi cử cũng như trong

tuyển sinh. Tuv nhiên, với hai phương pháp trên chưa hẳn phương pháp nào

hoàn toàn tốt hơn, mỗi phương pháp đều có ưu, nhược điểm nhất định của

nó.

Theo ý kiến của các chuyên gia về trắc nghiệm, ta nên sử dụng luận đề

để khảo sát thành quả học tập trong những trường hợp dưới đây:

(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ

được sử dụng một lần, không dùng lại nữa.

(2) Khi thầy giáo cố gắng để khuyến khích và khen thưởng sự phát triển

kỹ năng diễn tả bằng văn viết của học sinh.

(3) Khi thầy giáo muốn tìm hiểu thêm về quá trình tư duy và diễn biến

tư tưởng của học sinh về một vấn đề nào đó ngoài việc khảo sát kết quả học

tập của các em.

(4) Khi thầy giáo tin tưởng vào khả năng phê phán và chấm bài luận đề

một cách vô tư và chính xác hơn.

(5) Khi không có nhiều thời gian soạn thảo bài khảo sát nhưng lại có

thời gian để chấm bài.

Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trường

hợp như sau:

(1) Khi ta cần khảo sát kết quả học tập của một số đông học sinh, hay

muốn sử dụng lại bài khảo sát ấy vào một lúc khác.

(2) Khi ta muốn có những điểm số đáng tin cậy, không phụ thuộc phần

lớn vào chủ quan của người chấm bài.

(3) Khi các yếu tố công bằng, vô tư, chính xác được coi là những yếu tố

quan trọng nhất của việc thi cử.

(4) Khi ta có nhiều câu trắc nghiệm tốt đã được dự trữ sẵn để có thể

lựa chọn và cấu trúc lại một bài trắc nghiệm mới. Đặc biệt, ta muốn chấm

nhanh và công bố kết quả sớm.

(5) Khi ta muốn ngăn ngừa nạn học tủ, học vẹt và gian lận thi cử của

học sinh.

Cả trắc nghiệm lẫn luận đề đều có thể sử dụng để:

(1) Đo lường tất cả các kết quả học tập mà một bài khảo sát viết có thể

đo lường được.

(2) Khảo sát các khả năng nhận thức ở các mức độ từ thấp đến cao, từ

đơn giản đến phức tạp như:

- Khả năng hiểu và áp dụng các nguyên lý.

- Khả năng suy nghĩ có phê phán.

- Khả năng giải quyết các vấn đề.

- Khả năng lựa chọn những sự kiện thích hợp và các nguyên tắc để

phối hợp chúng lại với nhau nhằm giải quyết những vấn đề phức tạp.

(3) Khuyến khích học tập để nắm vững kiến thức.

MỘT SỐ SUY NGHĨ VỀ VIỆC CHO HỌC SINH THI TRẮC NGHIỆM

Đối với học sinh, vấn đề thi trắc nghiệm chỉ là kỹ thuật làm bài. Ngoài

ra, học sinh có thể cảm thấy thoải mái hơn khi thi trắc nghiệm vì:

(1) Các bài thi trước không ảnh hưởng đến bài thi tiếp theo.

(2) Không phải lo lắng khi chưa làm đúng hoàn chỉnh bài.

Đối với giáo viên có một số ngộ nhận sau:

(1) Lo sợ vì không biết phải dạy làm sao cho các em có thể làm bài

được, nhưng đây là một suy nghĩ theo chiều ngược vì:

* Trắc nghiệm phục vụ giảng dạy chứ không phải giảng dạy phục vụ

trắc nghiệm nên giáo viên phải:

- Nắm được mục tiêu giảng dạy của bộ môn.

- Giảng dạy tốt hơn, từ đó học sinh học tốt hơn.

* Người soạn thảo trắc nghiệm sẽ phải đưa ra những bài để đánh giá:

- Những gì đã giảng dạy.

- Những gì phải giảng dạy.

- Những gì giảng dạy đuợc.

* Giáo viên sẽ là người bị tố cáo gian lận chứ không phải là học sinh vì:

- Giáo viên sẽ dạy tủ (tương tự đề thi đã ra trước đó).

- Giáo viên chỉ chú trọng những ý tưởng quan trọng chính mà bỏ qua

những ý tưởng quan trọng thứ yếu trong chương trình.

* Trong phòng thi, giám thị có thể gian lận như:

- Kéo dài thời gian thi.

- Gợi ý cho học sinh trong phòng thi câu trả lời.

- Nói bóng nói gió cho học sinh sửa câu làm sai.

Bài 3. CÁC LOẠI MỤC TIÊU

Có nhiều thuật ngữ để diễn đạt cái “đích” như tôn chỉ, mục đích mục

tiêu tùy theo thời gian và tính khái quát của nó.

1. CÁC ĐẶC ĐIỂM CỦA MỤC TIÊU NÓI CHUNG

Mục tiêu phải gồm các mẫu tự đầu của tiếng Anh là SMART điều này

có nghĩa rằng mục đích của bạn phải:

S - Specific (cụ thể)

M - Measurable (có thể đo được)

A - Achievable (có thể đạt được)

R - Result - oriented (hướng vào kết quả)

T - Time - bound (giới hạn thời gian)

* Mục tiêu cần phải cụ thể. Nó cần phải nêu ra kết quả mà nó nhằm đạt

được. Liệu điều đó có phải nhằm xác định các vấn đề của dự án hay không?

Nhằm thu thập thông tin phản hồi hay nó nhằm xác định xem các mục đích đã

đạt được hay chưa?

Các mục tiêu cụ thể sẽ giúp cho việc làm sáng tỏ các mục đích định

hướng cho các hoạt động, hướng dẫn thu thập số liệu và các phương tiện đo

đạc, cung cấp cơ sở cho việc kiểm tra tính hiệu quả của đánh giá.

* Mục tiêu phải có thể đo được. Để có thể đo được, thì các mục tiêu

nếu có thể cần nhằm vào các kết quả có thể quan sát được hoặc thể hiện

được, ví dụ kiến thức về lịch sử của một người nào đó có thể được thể hiện

thông qua điểm số của anh ta trong bài kiểm tra môn Lịch sư… Thái độ của

anh ta đối với một chương trình có thể được thể hiện qua mức độ mà anh ta

đạt được trong thang đo thái độ. Ta có thể thấy những tiến bộ trong môn

Toán thông qua điểm số mà học sinh đạt được từ bản đánh giá ban đầu so

với bản đánh giá cuối cùng. Tính có thể đo được có nghĩa rằng ta có thể xác

định được số lượng.

Nếu như có khó khăn trong việc đo kết quả thái độ hoặc hiệu quả của

chương trình, bạn có thể lựa chọn việc đo những nhân tố liên quan như là sự

chú ý và tham gia của học sinh trong những buổi học trên lớp. Đối với những

mục đích dài hạn như là tính trách nhiệm của người trưởng thành, việc tự

học, hoặc quyền công dân thì bạn không thể đo kết quả của chúng một cách

trực tiếp được. Trong những trường hợp như vậy, bạn nên đo phạm vi tiến

hành các hoạt động mà ít nhất sẽ đạt được các kết quả dài hạn.

Liệu mục tiêu sau có thể đo được hay không? Hãy giải thích câu trả lời

của bạn.

Sau một học kỳ áp dụng phương pháp giảng dạy mới, giáo viên sẽ

nâng tỷ lệ học sinh khá, giỏi lên 90%.

1. ………………………………………………………………………………

* Tính có thể đo được có nghĩa rằng ta có thể xác định được số lượng.

Vì các mục tiêu đánh giá, liệu bạn có thể xác định được số lượng đối với tình

yêu đất nước hay không? Bạn làm cách nào?

………………………………………………………………………………

* Mục tiêu cần có thể đạt được, cần đạt được mục tiêu đánh giá trên cơ

sở các nguồn tài chính và vật chất có sẵn, yêu cầu kỹ thuật của các phương

pháp được sử dụng, năng lực của đội ngũ nhân viên và thời gian cần thiết để

tiến hành các hoạt động.

* Mục tiêu cần phải hướng vào kết quả. Chỉ số giá trị của phần lớn các

chương trình giáo dục là loại kết quả mà chúng đạt được. Vì vậy, các mục

đích đánh giá càng cần phải tập trung vào các kết quả dự kiến hơn là các quá

trình, các hoạt động hoặc lượng các nguồn được đầu tư. Trong bản phân tích

cuối cùng, ta sẽ đánh giá tính hiệu quả của đầu vào xem chúng đã đóng góp

như thế nào cho các kết quả dự kiến. Thậm chí nếu việc đánh giá có mục

đích định hình hay chẩn đoán thì người đánh giá cũng không nên bỏ qua yếu

tố quan trọng nhất, đó là việc đạt được các mục tiêu của chương trình.

Liệu mục tiêu đánh giá này có hướng đến kết quả hay không? Mục tiêu

này nhằm đạt được kết quả gì?

Bài tập điền vào ô trống có thể nâng cao khả năng đọc hiểu của các

học sinh hay không?

* Mục tiêu cần phải có giới hạn thời gian. Điều này có nghĩa rằng việc

đánh giá cần có một khung thời gian. Phải xác định được khoảng thời gian

theo đó việc đánh giá sẽ đạt được mục tiêu của nó hay có thể đưa ra được

các đầu ra cần có. Liệu khoảng thời gian này nên là hai tháng hay một năm

sau khi đã bắt đầu chương trình? Cần phải cân nhắc kỹ nhiều biến cố xảy ra

khi quyết định khung thời gian và phần lớn các biến cố này có liên quan có

liên quan đến loại hình và lượng số liệu sẽ được thu thập, các nguồn có sẵn,

các phương pháp xử lý sẽ được tiến hành và dĩ nhiên phạm vi của chương

trình được đánh giá.

Không kể đến tôn chỉ và mục đích, ở mức độ trường học chúng ta có

những loại mục tiêu sau đây:

Mục tiêu chương trình:

Mục tiêu chương trình xuất phát từ các mục đích của trường hoặc của

địa phương nơi trường đóng được viết ra ở mức độ môn học và lớp. Mặc dù,

nó thường không xác định nội dung hoặc khả năng cụ thể, nhưng nó nhấn

mạnh trên nội dung và hành vi. Giống như mục đích, chúng nói đến sự hoàn

thành nhiệm vụ học tập của tất cả học sinh, chứ không phải của những cá

nhân học sinh nào.

Mục tiêu khóa học:

Mục tiêu khóa học nảy sinh từ mục tiêu chương trình và được hình

thành ở mức độ môn học và khoa. Nó xếp vào phạm trù, kết cấu nội dung và

đôi khi khái niệm, vấn đề hoặc hành vi, nhưng không cụ thể hóa nội dung

chính xác để xem xét hoặc phương pháp giảng dạy và nội dung chính xác để

sử dụng. Mục tiêu khóa học được xác định dưới hình thức chủ đề, khái niệm

hoặc hành vi tổng quát.

Mục tiêu giờ học:

Mục tiêu giờ học thường được giáo viên hình thành. Mục tiêu giờ học

chia mục tiêu khóa học thành nhiều đơn vị học tập. Các mục tiêu kế hoạch

đơn vị học tập thường gồm từ một đến ba tuần giảng dạy, được cấu trúc theo

một chuỗi và phù hợp đối với toàn bộ lớp học, chứ không phải đối với cá nhân

nào hoặc nhóm cụ thể nào. Các mục tiêu kế hoạch đơn vị học tập sau đó

được chia ra để hình thành các mục tiêu kế hoạch giờ học, một cách lý

tưởng, được cấu trúc khoảng trong một ngày giảng dạy về một chủ đề chuyên

biệt.

* Các đặc điểm của mục tiêu giảng dạy ở mức độ giờ học:

- Xác định mục tiêu cần mô tả cả loại hành vi mong đợi lẫn nội dung

hoặc ngữ cảnh mà hành vi đó áp dụng.

- Những mục tiêu phức tạp cần được xác định mang tính phân tích và

cụ thể để hành vi mong đợi và những thứ hành vi đó áp dụng có thể thực hiện

được.

- Các mục tiêu cần được xác định để phân biệt rõ ràng khả năng người

học khi họ đạt đến những kết quả khác nhau.

- Các mục tiêu mang tính phát triển, tạo ra con đường mở chứ không

phải là điểm kết thúc.

- Phạm vi các mục tiêu cần rộng rãi đủ để bao gồm tất cả các loại kết

quả mà nhà trường (hoặc giáo viên) có trách nhiệm tạo ra.

Nói tóm lại:

- Mục tiêu giảng dạy là hành vi của người học mang tính cụ thể, đo

lường được, ngắn hạn và có thể quan sát được.

- Mục tiêu không phải là tổng số kết quả của giáo dục, mà là điều kiện

tiên quyết, hoặc nền tảng, để đạt mục đích cao hơn có liên quan với lĩnh vực

học thuật. Mục tiêu tạo ra một quá trình được cấu trúc sẵn làm cho việc đáp

ứng các mục tiêu cao hơn khả thi.

2. TẦM QUAN TRỌNG CỦA VIỆC XÂY DỰNG MỤC TIÊU

Xác định mục tiêu cụ thể cho từng môn học/chương trình học là phải

xác định những tiêu chí, kỹ năng, kiến thức sinh viên cần đạt khi kết thúc

chương trình đào tạo và sau đó xây dựng quy trình và công cụ đánh giá nhằm

đo lường xem sinh viên có đạt được các tiêu chí đó không.

Việc xác định rõ ràng các mục tiêu cần đạt có những lợi điểm sau đây:

- Tạo điều kiện dễ dàng cho việc kiểm tra và chấm điểm công bằng.

- Mục đích của môn học, nội dung môn học và quy trình đánh giá vừa

nhất quán vừa quan hệ chặt chẽ với nhau.

- Mục tiêu cho phép các nhà đánh giá xác định hoạt động giảng dạy và

tài liệu học tập nào có hiệu quả.

- Cho thấy rõ ràng sự đối chiếu kết quả đào tạo giữa nội dung giảng

viên truyền đạt với nội dung sinh viên tiếp thu và có thể thực hành được.

- Mô hình giảng dạy hợp lý phải xác định được trình tự giữa mục tiêu và

nội dung - nghĩa là sinh viên phải làm được A trước khi có thể làm B.

- Cải tiến mối quan hệ trong ban giảng huấn.

- Khuyến khích sinh viên tự đánh giá vì họ biết họ phải đạt cái gì.

- Hỗ trợ hiệu quả việc học của sinh viên và giảm bớt lo lắng vì có

hướng dẫn và xác định rõ các ưu tiên trong giảng dạy.

- Sinh viên hiểu rõ các môn học có liên thông với nhau và gắn với mục

đích đào tạo.

* Cách viết mục tiêu

Một cách tổng quát, khi ta viết mục tiêu cho bài giảng hoặc mục tiêu

cho bài kiểm tra, ta cần đặt hai câu hỏi:

- Người học sẽ học được gì sau bài giảng hoặc đơn vị học tập này?

- Người học sẽ làm được gì sau bài giảng hoặc đơn vị học tập này?

Cụ thể, một mục tiêu giảng dạy gồm ba yếu tố:

(1) Xác định rõ loại hoạt động trong đó năng lực nào cần (Ví dụ: giải

phẫu ếch).

(2) Cụ thể hóa các tiêu chí hoặc tiêu chuẩn qua đó năng lực trong hoạt

động được đánh giá (Ví dụ: một con ếch để các bộ phận sau đây được trình

bày một cách rõ ràng)

(3) Lập danh mục những điều kiện hoặc hoàn cảnh cần thiết cho người

học đạt được mục tiêu (Ví dụ: “…trong thòi gian hai tiết làm việc với vật liệu

tại phòng thí nghiệm “).

Như vậy, ta cần xem xét:

- Mục tiêu cần cụ thể và chi tiết đến mức độ nào? Nó tùy thuộc vào việc

chúng được sử dụng để làm gì. Ví dụ, các mục tiêu cho chuỗi một giáo án

của đơn vị học tập sẽ tổng quát hơn việc cụ thể một giáo án của bài học.

- Đừng làm cho việc viết mục tiêu dài dòng, manh mún, tốn thời gian,

hoặc mang tính máy móc. Hãy viết các mục tiêu đơn giản, không mơ hồ và

tập trung rõ ràng như là một bảng hướng dẫn học tập.

- Mục đích của mục tiêu không giới hạn tính tự phát hoặc hạn chế trong

tầm nhìn giáo dục về môn học; nhưng bảo đảm rằng học tập được tập trung

một cách rõ ràng đủ để cho cả người học lẫn người dạy biết việc gì sẽ diễn

ra.

- Diễn đạt các mục tiêu dựa vào các hoạt động, hành vi và kết quả của

người học, chứ không phải dựa vào hoạt động của giáo viên.

* Cần phát biểu mục tiêu như thế nào?

Để nhằm mục đích đo lường, các mục tiêu thường thấy trong chương

trình các môn học cần phải được phát biểu lại sao cho rõ ràng, cụ thể. Một số

các mục tiêu sẽ được lựa chọn để làm căn bản cho việc soạn thảo trắc

nghiệm, một số khác có thể được khảo sát bằng các phương tiện khác. Các

câu phát biểu:

(1) Phải rõ ràng, cụ thể.

(2) Phải đạt tới được trong khóa học hay trong đơn vị học tập.

(3) Phải bao gồm nội dung học tập thiết yếu của môn học.

(4) Phải quy định rõ kết quả của việc học tập, nghĩa là các khả năng mà

người học sẽ có được khi họ đã đạt đến mục tiêu.

(5) Phải đo lường được.

(6) Phải chỉ rõ những gì người học có thể làm được vào cuối giai đoạn

học tập.

Trong khi viết mục tiêu, người soạn trắc nghiệm có thể tự đặt cho mình

những câu hỏi đại loại như sau: “Học sinh có thể làm được những gì sau khi

hoàn tất khóa học hay bài học này?”. “Học sinh có thể chứng minh rằng họ đã

đạt được mục tiêu bằng cách nào với một bài khảo sát viết?”

* Xây dựng mục tiêu từ chung nhất đến cụ thể.

Nhằm đạt được hiệu quả, các mục tiêu đưa ra bao gồm ba yếu tố cơ

bản sau:

- Một động từ mô tả cho một hành động quan sát.

- Một mô tả về các điều kiện, qua đó một hành động xảy ra: “Khi đạt

được X, bạn sẽ có thể…”

- Mức độ thành công có thể chấp nhận được - tỷ lệ phần trăm các câu

trả lời đúng, số lỗi được phép sai và các ví dụ nào phải có…

Thêm vào đó, trước khi bắt đầu công việc này, cần xác định đối tượng

người học là ai và các môn tiếp đến là gì. Khó khăn thường gặp ở giảng viên

là sự hiểu biết chưa đầy đủ về kinh nghiệm và khả năng có sẵn của sinh viên

trước khi vào học.

Cần dùng những từ rõ ràng, cô đọng để mô tả động thái của người học

trong các mục tiêu này. Mager (1975) thống kê các thuật ngữ sử dụng như

sau:

Những từ có thể có nhiều cách hiểu

Những từ có cách hiểu giới hạn hơn

Biết Viết

Hiểu Liệt kê ra

Thật sự hiểu Xác định

Tán thành Sắp xếp

Hoàn toàn tán thành Giải quyết

Hiểu được tầm quan trọng Xây dựng

Thích thú Tương phản

Tin tưởng So sánh

Có niềm tin vào

Mặc dù sử dụng được hơn 50 năm, nhiều người vẫn xem nó là cách để

phân loại các mục tiêu, mặc dù việc sắp xếp tuỳ thuộc vào cách chúng ta cảm

thấy thoải mái nhất.

NGUYÊN TẮC PHÂN LOẠI MỤC TIÊU GIÁO DỤC - LĨNH VỰC NHẬN THỨC

Hiện nay, thuật ngữ “mục tiêu” được sử dụng khá rộng rãi trong nhiều

lĩnh vực khác nhau, vì thế có một số nhà giáo dục hiểu nhầm mục tiêu là việc

đạt đến nội dung tri thức cần truyền đạt hoặc họ nhấn mạnh trên việc tiếp số

số lượng tri thức chứ không phải nói đến chất lượng tiếp thu tri thức. Do việc

phân biệt mức độ chất lượng tiếp thu tri thức cần có những tình huống cụ thể,

nên chúng ta cần tham khảo thêm tác phẩm của Benjamin S. Bloom.

Như đã trình bày ở trên, vào cuối thập niên 60 của thế kỷ XX, một

nhóm giáo sư ở các trường đại học Mỹ do Ông Benjamin S. Bloom chủ trì đã

soạn thảo cuốn “Taxonomy of Educational Objectives - Cognitive Domain”

(Nguyên tắc phân loại mục tiêu giáo dục - Lĩnh vực nhận thức). Các tác giả đã

trình bày cơ sở lý thuyết của việc phân loại và sắp xếp quá trình nhận thức

của người học theo các thang bậc từ đơn giản đến phức tạp, từ cụ thể đến

trừu tượng để đánh giá quá trình tiếp thu của người học theo sáu mức độ từ

thấp đến cao như sau: biết, thông hiểu, áp dụng, phân tích, tổng hợp và đánh

giá. Nói cách khác, các tác giả nhấn mạnh đến quá trình trí tuệ của việc tiếp

thu tri thức ở những mức độ khác nhau của quá trình đánh giá nhận thức của

học sinh. Mỗi mức độ này được định nghĩa cụ thể bằng những tiêu chí cần

đạt được. Sách đã được các nhà giáo dục trên thế giới sử dụng rộng rãi.

Dưới đây là tóm tắt các mức độ phân loại lĩnh vực nhận thức:

(1) Biết

Mức độ này gồm các mục tiêu có liên quan đến:

(a) Tri thức cụ thể như thuật ngữ và sự kiện.

(b) Tri thức về cách thức và phương tiện để giải quyết những điều cụ

thể như quy ước, khuynh hướng và quy trình, sự phân loại và sắp xếp phạm

trù, tiêu chí và phương pháp luận.

(c) Tri thức về tổng quát và trừu tượng như những nguyên tắc, khái

quát hóa, lý thuyết và cấu trúc.

(2) Thông hiểu

Các mục tiêu ở mức độ này có liên quan đến

(a) Chuyển dịch.

(b) Giải thích.

(c) Ngoại suy các tài liệu.

(3) Ứng dụng

Các mục tiêu ở mức độ này có liên quan đến việc sử dụng tính trừu

tượng trong những tình huống cụ thể

(4) Phân tích:

Các mục tiêu ở mức độ này có liên quan đến việc chia tổng thể thành

các bộ phận và phân biệt:

(a) Các yếu tố.

(b) Các mối quan hệ.

(c) Nguyên tắc cấu trúc.

(5) Tổng hợp:

Các mục tiêu ở mức độ này có liên quan đến kết hợp các bộ phận dưới

một hình thức mới như:

(a) Thông tin độc đáo.

(b) Kế hoạch vận hành.

(c) Tập hợp những mối quan hệ trừu tượng.

(6) Đánh giá:

Đây là mức độ phức tạp cao nhất và gồm các mục tiêu có liên quan đến

sự đánh giá nhờ vào:

(a) Bằng chứng bên trong hoặc sự thống nhất về logic.

(b) Bằng chứng bên ngoài hoặc sự thống nhât có các sự kiện được

phát triển nơi khác.

Những từ gợi ý sử dụng cho cách phân loại mục tiêu giáo dục - Lĩnh

vực nhận thức

Ở đây có hai phần trong mỗi mức độ phân loại (phạm trù): động từ và

túc từ sử dụng trong câu hỏi. Khi muốn đặt câu hỏi cho phạm trù đó, độc giả

hãy nối một động từ với một túc từ phù hợp với ý định của mình.

(1) Biết:

- Động từ sử dụng trong câu hỏi: định nghĩa, phân biệt, đạt được, xác

định, nhớ lại, nhận ra.

- Túc từ sử dụng trong câu hỏi: thuật ngữ, từ vựng, nghĩa của từ, định

nghĩa, vật ám chỉ, yếu tố, sự kiện, nguồn, tên, ngày tháng, con người, nơi

chốn, thời gian, đặc điểm, ví dụ, các hình thức, hiện tượng, quy ước, cách sử

dụng, quy luật, cách thức, phương sách, biểu tượng, tượng trưng, kiểu, quy

định, hành động, quá trình, sự phát triển, khuynh hướng nguyên nhân, mối

quan hệ, ảnh hưởng, loại, nét đặc trưng, lớp, tập hợp, sự sắp xếp, sự phân

loại, phạm trù, tiêu chí, phương pháp, kỹ thuật, cách sử dụng, cách thức, cấu

trúc, cách tạo thành.

(2) Thông hiểu:

- Động từ sử dụng trong câu hỏi: dịch, chuyển di, minh họa, chuẩn bị,

đọc, trình bày, thay đổi, chuyển đoạn văn, xác định lại, giải thích, sắp xếp lại,

phân biệt, tìm sự khác nhau, tạo thành, giải thích, chứng minh, đánh giá, suy

ra, đưa vào, tiên đoán, quyết định, mở rộng, nội suy.

- Túc từ sử dụng trong câu hỏi: ý nghĩa, mẫu, định nghĩa, tóm tắt,

tượng trưng, từ, đoạn ngữ, sự phù hợp, mối quan hệ, cơ sở, các mặt, phẩm

chất, kết luận, phương pháp, lý thuyết, tóm tắt, kết quả, giải thích, yếu tố, sự

phân nhánh, hệ luận, ảnh hưởng, xác suất.

(3) Áp dụng:

- Động từ sử dụng trong câu hỏi: áp dụng, khái quát hóa, liên hệ, lựa

chọn, phát triển, kết cấu, sử dụng, khai thác, chuyển di, cấu trúc lại, phân loại.

- Túc từ sử dụng trong câu hỏi: nguyên tắc, quy luật, kết luận, ảnh

hưởng, phương pháp, lý thuyết, tóm tắt, tình huống, sự khái quát hóa, quá

trình, sự kiện, cách thức.

(4) Phân tích:

- Động từ sử dụng trong câu hỏi: phân biệt, khám phá, xác định, tìm sự

khác biệt, nhận ra, xếp vào phạm trù, phân tích, đối chiếu, so sánh, suy luận.

- Túc từ sử dụng trong câu hỏi: yếu tố, giả thuyết, kết luận, giả định, lý

lẽ, điều cụ thể, mối quan hệ, liện hệ bên trong, sự phù hợp, chủ đề, bằng

chứng, ngụy biện, quy luật nhân quả, tính kiên định, bộ phận, ý tưởng, giả

định, hình thức, kiểu loại, mục đích, quan điểm, kỹ thuật, sự thiên vị, cấu trúc,

sự sắp xếp, cách tổ chức.

(5) Tổng hợp:

- Động từ sử dụng trong câu hỏi: viết, kể lại, liên hệ, tạo ra, chuyển,

hình thành, bổ sung, lập hồ sơ, đề xuất, lập kế hoạch, thiết kế, phận loại,

chuyển hóa từ, phát triển, kết hợp, tổ chức, tổng hợp, phân loại, suy luận, lập

công thức.

- Túc từ sử dụng trong câu hỏi: cấu trúc, kiểu loại, sản phẩm, hiệu suất,

thiết kế, tác phẩm, giao tiếp, cố gắng, bài sáng tác, kế hoạch, mục tiêu, phân

loại, thao tác, cách thức, giải pháp, phương tiện, hiện tượng, cách phân loại,

khái niệm, kế hoạch, lý thuyết, mối quan hệ, tóm tắt, sự khái quát hóa, giả

thuyết, sự khám phá.

(6) Đánh giá:

- Động từ sử dụng trong câu hỏi: đánh giá, tranh luận, làm cho hợp lệ,

đánh giá, quyết định, xem xét, so sánh, đối chiếu, tiêu chuẩn hóa, khen

thưởng.

- Túc từ sử dụng trong câu hỏi: sự chính xác, tính kiên định, ngụy biện,

tính tin cậy, thiếu sót, sai lầm, tính chính xác, điểm chính xác, phương tiện,

hiệu quả, nền kinh tế, cách sử dụng, phương án thay thế, quá trình hành

động, tiêu chuẩn, lý thuyết, sự khái quát hóa.

Câu hỏi trắc nghiệm gợi ý dựa trên cách phân loại của B.S. Bloom

Bloom và cộng sự, 1956

Là giáo viên, chúng ta có khuynh hướng hỏi những câu thuộc phạm trù

“biết” từ 80% đến 90%. Lọai câu hỏi thuộc phạm trù này không phải là không

hay, nhưng việc dùng chúng thường xuyên thì trở thành không hay. Hãy cố

gắng sử dụng những câu hỏi ở mức độ cao hơn. Những câu hỏi ở mức độ

cao đòi hỏi “năng lực trí tuệ nhiều hơn và câu trả lời mở rộng và trau chuốt

hơn. Dưới đây là sáu loại phạm trù câu hỏi do Bloom định nghĩa.

Biết

Nhớ lại

Hồi tưởng

Nhận ra

Nhớ lại đặc điểm

Nhớ lại thông tin

Ai, cái gì, khi nào, ở đâu, cách nào…?

Mô tả

Thông hiểu

Giải thích

Chuyển dịch từ một thông tin này qua một thông tin khác

Diễn tả bằng từ ngữ riêng

Cấu trúc và lựa chọn các sự kiện và ý tưởng

Kể lại…

Áp dụng

Giải quyết vấn đề

Áp dụng thông tin để tạo ra một số kết quả

Sử dụng sự kiện, quy luật và nguyên tắc

Thế nào là… một ví dụ của…?

… liên hệ thế nào với…?

Tại sao… là quan trọng?

Phân tích

Phân chia sự việc để cho thấy nó kết hợp như thế nào

Tìm cấu trúc có liên hệ của một thông tin

Xác định động lực

Tách biệt toàn thể thành những phần yêu tố

Các phần hoặc đặc điểm của… là gì?

Phân loại… theo…

Lập dàn bài/hình vẽ…

… so sánh/đối chiếu với… như thế nào?

Sự kiện nào bạn có thể lập danh mục cho…?

Tổng hợp

Tạo ra một sản phẩm độc đáo, mới mẻ dưới dạng ngôn ngữ hoặc là

một vật thể

Kết hợp các ý tưởng để tạo thành một tổng thể mới

Điều gì bạn có thể tiên đoán/suy ra từ…?

Ý tưởng nào bạn có thể thêm vào…?

Bạn có thể tạo ra/thiết kế một… mới như thế nào?

Điều gì sẽ diễn ra khi bạn kết hợp…?

Giải pháp nào bạn sẽ đề xuất cho…?

Đánh giá

Đưa ra quyết định có giá trị cho vấn đề

Giải quyết những xung đột hoặc khác biệt về ý kiến

Phát triển ý kiến, đánh giá hoặc quyết định

Bạn có đồng ý rằng…?

Bạn nghĩ như thế nào về…?

Điều gì là quan trọng nhất…?

Hãy sắp đặt những thứ dưới đây theo thứ tự ưu tiên…

Bạn sẽ quyết định như thế nào về…?

Bạn sẽ dùng tiêu chí nào để đánh giá…?

Đến năm 2001, Anderson và Krathwohl cải tiến nguyên tắc phân loại

nhận thức của Benjamin S. Bloom theo các mức độ từ đơn giản đến phức tạp

như sau:

(1) Nhớ lại

(2) Thông hiểu

(3) Ứng dụng

(4) Phân tích

(5) Đánh giá

(6) Sáng tạo

Bài 4. NHỮNG CÂU HỎI ĐỂ CHUẨN BỊ CHO BÀI TRẮC NGHIỆM TRONG LỚP HỌC

Những trắc nghiệm do thầy giáo soạn thảo thường là căn bản chính

cho việc đánh giá sự tiến bộ của người học trong nhà trường. Những bài trắc

nghiệm tốt không xuất hiện ngẫu nhiên! Chúng đòi hỏi việc lập kế hoạch phù

hợp để mục tiêu giảng dạy, nội dung chương trình và tài liệu giảng dạy có liên

hệ một cách có ý nghĩa. Dưới đây là bảng kiểm tra cần xem xét khi chuẩn bị

trắc nghiệm trong lớp học:

1. Mục tiêu của trắc nghiệm là gì? Tại sao tôi đưa nó ra?

2. Kỹ năng, tri thức, thái độ,… nào tôi muốn đo lường?

3. Tôi có xác định rõ ràng mục tiêu giảng dạy của tôi dựa vào động thái

của người học chưa?

4. Các câu trắc nghiệm có phù hợp với các mục tiêu không?

5. Loại trắc nghiệm nào (hình thức câu trắc nghiệm nào) tôi muốn sử

dụng? Tại sao?

6. Trắc nghiệm kéo dài trong bao lâu?

7. Mức độ khó của bài trắc nghiệm?

8. Độ phân cách của những câu trắc nghiệm của tôi cần như thế nào?

9. Tôi sẽ sắp xếp những hình thức câu trắc nghiệm như thế nào?

10. Tôi sẽ sắp xếp những câu trắc nghiệm trong mỗi hình thức câu trắc

nghiệm như thế nào?

11. Tôi cần phải làm gì để chuẩn bị người học của tôi làm trắc nghiệm?

12. Cách người học tôi ghi lại các câu trả lời cho các câu trắc nghiệm

khách quan như thế nào? Trên tờ trả lời riêng? Ngay trên bài trắc nghiệm?

13. Các phần khách quan được chấm điểm như thế nào?

14. Các phần luận đề được chấm điểm như thế nào?

15. Đối với các câu trắc nghiệm khách quan, có cần những chỉ dẫn về

đoán mò không? Có cần sử dụng công thức sửa chữa đoán mò không?

16. Các điểm số của trắc nghiệm cần được lập thành bảng như thế

nào?

17. Các điểm số (thứ bậc hoặc mức độ giỏi) cần được phân như thế

nào?

18. Kết quả trắc nghiệm cần được báo cáo như thế nào?

Bài 5. HÌNH THỨC CÂU TRẮC NGHIỆM KHÁCH QUAN

Trắc nghiệm thành quả học tập bao gồm các loại thông dụng nhất như

sau:

1. LOẠI ĐÚNG - SAI (TRUE - FALSE)

Loại này được trình bày dưới dạng một câu phát biểu (nhận định), đòi

hỏi người học phải xác định xem nội dung của câu ấy là đúng hay sai. Và

người học trả lời bằng cách lựa chọn câu thích hợp với chữ Đ (Đúng) hay S

(Sai). Đối với câu đúng mọi chi tiết trong câu phải phù hợp với tri thức khoa

học, còn đối với câu sai thì chỉ cần một trong những chi tiết là sai.

Loại câu trắc nghiệm này là một loại hình đặc biệt của loại câu trắc

nghiệm nhiều lựa chọn, nhưng chỉ có hai cách lựa chọn.

Loại trắc nghiệm này phù hợp cho việc kiểm tra kiến thức bằng các

định nghĩa, khái niệm, công thức, các sự kiện (như mốc lịch sử, địa danh, tên

nhân vật…). Với loại này thường đòi hỏi trí nhớ nhiều hơn, ít kích thích sự suy

nghĩ.

1.1. Ưu, nhược điểm của loại đúng - sai:

* Ưu điểm:

- Loại đúng - sai được dùng rộng rãi vì hình thức đơn giản, có thể soạn

nhiều câu trắc nghiệm cho từng bài học, khảo sát bất kỳ nội dung nào nên

người học không thể học “tủ” được.

- Hình thức trắc nghiệm gọn gàng, ít tốn giấy, ngoại trừ hình vẽ.

- Thời gian trả lời của người học khá nhanh. Một phút có thể trả lời ba

đến bốn câu trắc nghiệm.

* Nhược điểm:

- Xác suất may rủi của từng câu trắc nghiệm Đ - S là 50%, người học

không nắm vững bài cũng hy vọng trả lời đúng 50% cho mỗi câu trắc nghiệm.

- Giáo viên thường có xu hướng trích nguyên văn trong sách để soạn

câu Đ và sửa một vài chữ để trở thành câu S, vì thế người học dễ dàng nhận

ra.

- Dễ có các câu trắc nghiệm không có giá trị. Vì câu văn gây nhiều cách

giải thích và có thể hiểu là Đ mà cũng có thể hiểu là S, đều được cả.

- Dễ có một số từ tiết lộ kết quả trong câu trắc nghiệm.

2.2. Cách thức soạn thảo:

Tránh trích ra những câu có sẵn trong sách giáo khoa hoặc chép

nguyên văn trong sách, tài liệu. Khi đó người học sẽ dễ dàng phát hiện.

Nội dung xác định câu Đ hoặc S phải chắc chắn, chính xác, rõ ràng,

dựa vào cơ sở khoa học chớ không phụ thuộc vào quan niệm riêng của người

soạn thảo.

Tránh dùng các từ, cụm từ như: “tất cả”, không bao giờ, “không một ai”,

“không thể nào”, khi đó người học sẽ nhận rõ là những câu sai. Bên cạnh đó

tránh dùng từ “thường thường”, “đôi khi”, “có khi”, “một số người”, đó là

những từ thường dùng cho câu Đ. Nói chung, nếu dùng các từ trên trong câu

trắc nghiệm sẽ làm cho người học, dè dặt, ung dung, lúng túng không rõ ràng.

Nội dung câu trắc nghiệm có thể gồm nhiều yếu tố nhưng theo mệnh đề

kéo theo (Toán học), các yếu tố đều đúng thì kết quả mới đúng và chỉ cần một

yếu tố sai thì kết quả sẽ là sai, do đó ta không nên có nhiều yếu tố sai, như

vậy sẽ làm cho người học dễ dàng phát hiện ra câu S.

2. LOẠI NHIỀU LỰA CHỌN (MULTIPLE CHOICE)

Loại này gồm có hai phần là phần gốc và phần giải đáp (hay phần lựa

chọn):

Phần gốc: là một câu hỏi (hay một câu chưa hoàn tất), chúng phải tạo

căn bản cho sự lựa chọn.

Phần lựa chọn: gồm một số kết quả trả lời trong đó có một trả lời đúng

nhất mà người học phải chọn, còn những phần còn lại là những “mồi nhử”.

Khi đó người học phải nắm vững kiến thức thì mới phân biệt được. Các câu

mồi nhử (hay câu nhiễu) trông bề ngoài sẽ ngang nhau đối với câu đúng nhất,

bề ngoài có thể là đúng nhưng thực ra là sai hoặc chỉ đúng một phần.

2.1. Ưu, nhược của loại nhiều lựa chọn:

* Ưu điểm:

- Loại nhiều lựa chọn có xác suất may rủi thấp hơn so với loại đúng -

sai. Nếu câu trắc nghiệm có bốn lựa chọn thì tỉ lệ là 25%, nếu có năm lựa

chọn thì tỉ lệ may rủi là 20%.

- Có thể đo lường sự hiểu biết, sự xem xét và khả năng lý luận.

- Thích hợp với mọi trình độ.

- Loại nhiều lựa chọn là cơ sở để soạn thảo nội dung dạy học chương

trình theo kiểu phân nhánh.

* Nhược điểm:

- Đòi hỏi tốn nhiều công soạn thảo, vì phải tìm những yếu tố trả lời có

sức hấp dẫn tương đương.

- Tốn giấy và mất nhiều thời gian trả lời so với trắc nghiệm đúng - sai.

- Kết quả trắc nghiệm nằm sẵn ở phần trả lời người học có thể nhận ra.


Phần trả lời lựa chọn chỉ có một câu đúng hoặc đúng nhất, các câu

khác là đúng nhưng chưa được hoàn hảo hoặc là sai, không nên chọn những

câu quá xa so với câu hỏi đặt ra, khi đó người học sẽ dễ dàng nhận dạng

ngay, làm cho câu kém hiệu quả.

Trong một bài các câu trắc nghiệm phải độc lập với nhau, kết quả câu

trắc nghiệm này không ảnh hưởng đến kết quả câu trắc nghiệm khác.

Phần trả lời các câu trắc nghiệm phải đồng nhất về mặt nội dung và

hình thức như từ ngữ, con số, mệnh đề…

Đặt các mồi nhử (hay câu nhiễu) phải làm sao cho khả năng phân tích

câu trả lời của từng trình độ người học rơi vào đúng từng tình huống các mồi

nhử đặt ra, để khi đó người học nào nắm vững vấn đề thì mới chọn được câu

trả lời đúng nhất.

3. LOẠI GHÉP HỢP (ĐỐI CHIẾU CẶP ĐÔI) (MATCHING)

Loại này là một dạng đặc biệt của trắc nghiệm nhiều lựa chọn. Đòi hỏi

người học phải ghép đúng từng cặp nhóm từ ở hai cột với nhau sao cho phù

hợp về nội dung.

Hai tập hợp dữ kiện xếp thành hai cột có số lượng các phần tử không

bằng nhau. Các phần tử ở cột bên trái là những phần tử để hỏi, còn các phần

tử ở cột bên phải là yếu tố để lựa chọn. Thông thường số lượng ở phần tử cột

bên phải bao giờ cũng nhiều hơn số lượng phần tử ở cột bên trái.

Loại trắc nghiệm này thường dùng để kiểm tra sự hiểu biết của người

học về thuật ngữ, định nghĩa, ký hiệu, hình dáng…

3.1. Ưu, nhược điểm của loại ghép hợp:

* Ưu điểm:

- Loại ghép hợp có thể xem là một dạng đặc biệt của trắc nghiệm lựa

chọn. Trắc nghiệm lựa chọn có yếu tố hỏi tương ứng với yếu tố trả lời. Còn

loại ghép hợp có nhiều yếu tố hỏi tương ứng với nhiểu yếu tố trả lời.

- Dùng để khảo sát sự hiểu biết của người học về các thuật ngữ, khả

năng quan sát, các khái niệm và hình ảnh.

- Đánh giá khả năng liên kết các tập hợp kiến thức của người học về

mối liên hệ giữa các sự kiện.

- Xác suất may rủi để trả lời loại câu ghép hợp là 50%.

* Nhược điểm:

- Chỉ khảo sát được những vấn đề lẻ tẻ, đòi hỏi người học vận dụng trí

nhớ nhiều.

- Khảo sát bằng trắc nghiệm ghép hợp phải có nhiều nội dung và nhiều

bài học kế tiếp nhau.


Một phần tử ở cột bên trái chỉ ghép với một phần tử ở cột bên phải.

Tránh một phần tử ở cột bên trái ghép được với nhiều phần tử ở cột bên phải

hay ngược lại.

Nội dung của cột câu hỏi cũng như cột lựa chọn không nên quá dài,

nên thuộc cùng một loại và có liên quan với nhau.

Các phần tử ở cột lựa chọn bên phải có số lượng nhiều hơn các phần

tử ở cột bên trái để tránh sự đoán mò.

4. LOẠI ĐIỀN KHUYẾT (COMPLETION)

Loại này có thể có hai dạng, chúng có thể là những câu hỏi với giải đáp

ngắn, hay cũng có thể gồm những câu phát biểu với một hay nhiều chỗ để

trống mà người học phải điền vào bằng một từ hay một nhóm từ ngắn hay

công thức hay số… cho đúng với nội dung câu hỏi.

Loại này thường được dùng để kiểm tra khả năng ghi nhớ các khái

niệm, thuật ngữ, tên người, công thức…

4.1. Ưu, nhược điểm của trắc nghiệm điền khuyết:

* Ưu điểm:

- Loại điền khuyết đòi hỏi mức độ tái hiện cao, người học không thể

đoán mò. Tỉ lệ may rủi trả lời đúng không có.

- Loại điền khuyết thường dùng để kiểm tra trí nhớ các khái niệm, thuật

ngữ, tên người, địa danh, ký hiệu, công thức, số liệu, dữ kiện, hiện tượng…

- Dễ soạn.

- Đôi khi trắc nghiệm điền khuyết là biến thể của câu hỏi ngắn hoặc là

phần gốc của trắc nghiệm lựa chọn, có dạng câu lửng.

* Nhược điểm:

- Chỉ kiểm tra được những kiến thức rời rạc, không khảo sát được khả

năng tổng hợp của người học.

- Khó chấm bài hơn và tốn thời gian chấm hơn.

- Không thể khảo sát hết chương trình học.

- Không thể dùng bảng đục lỗ hoặc dùng máy để chấm.


Không nên chừa nhiều khoảng trống trong một câu và khoảng trống

nên đặt ở cuối câu.

Mỗi khoảng trống chỉ có một câu trả lời đúng nhất thôi.

Chỗ điền khuyết phải là yếu tố chính, không nên hỏi, điền những chi tiết

vụn vặt.

Câu trả lời điền vào rất ngắn và tiêu chuẩn đúng hay sai rõ ràng.

Bài 6. SOẠN THẢO BÀI TRẮC NGHIỆM KHÁCH QUAN

CÁC BƯỚC CẦN THỰC HIỆN

1. Lập kế hoạch cho bài trắc nghiệm:

- Phác thảo nội dung môn học được xem xét như là cơ sở để viết bài

trắc nghiệm.

- Xác định kết quả học tập cần được đo bằng trắc nghiệm.

- Chuẩn bị bảng quy định (nội dung và mục tiêu) của bài trắc nghiệm.

- Chọn loại câu hỏi trắc nghiệm thích hợp cho việc đánh giá kết quả học

tập được tóm tắt trong bảng quy định.

2. Chuẩn bị viết các bài trắc nghiệm:

- Viết câu trắc nghiệm theo các nguyên tắc xây dựng các loại được

chọn.

- Chọn câu hỏi được đưa vào bài trắc nghiệm theo bảng quy định.

- Xem xét và chỉnh sửa các câu hỏi theo hướng dẫn.

- Sắp xếp các câu hỏi quyết định: a) sắp theo nhóm các câu hỏi, b) thứ

tự độ khó các câu hỏi theo nhóm, c) thứ tự theo nội dung các câu hỏi theo

nhóm.

- Chuẩn bị các hướng dẫn cho các bài trắc nghiệm, nếu cần thiết,

chuẩn bị các hướng dẫn cho những loại câu hỏi khác nhau (ví dụ như, loại

câu đối chiếu cặp đôi), hoặc cho các phần của bài trắc nghiệm (ví dụ như,

hình thức phủ định của loại câu trả lời đúng nhất).

- Quyết định phương pháp cho điểm.

3. Phân tích và sửa các bài trắc nghiệm:

- Thực hiện việc phân tích trắc nghiệm để xác định độ khó, độ phân

cách và tính tin cậy.

- Lưu trữ, sửa đổi khi cần thiết, hoặc hủy bỏ câu hỏi trên cơ sở kết quả

phân tích.

- Chỉnh sửa bài trắc nghiệm như một tổng thể, nếu cần thiết.

Chuẩn bị trắc nghiệm

Các bước đầu tiên trong trắc nghiệm là cần phải xác định bạn đang cố

gắng để đo lường cái gì. Khi quyết định này được thực hiện và ngay sau khi

nó được đưa ra bạn có thể quyết định những loại trắc nghiệm sử dụng.

A. NHỮNG QUY ĐỊNH CHO VIỆC SOẠN THẢO CÂU HỎI NHIỀU LỰA CHỌN

1. Thiết kế mỗi câu hỏi để đo kết quả học tập quan trọng.

2. Trình bày từng vấn đề, theo quy định rõ ràng trong phần gốc của câu

hỏi.

3. Viết phần gốc của câu hỏi bằng ngôn ngữ đơn giản, rõ ràng.

4. Dùng từ càng chính xác càng tốt trong phần gốc của câu trắc

nghiệm.

5. Viết phần gốc của câu hỏi dưới thể xác định ở bất cứ nơi nào trong

bài trắc nghiệm.

6. Làm rõ việc sử dụng từ phủ định khi nó được sử dụng trong phần

gốc của câu hỏi.

7. Hãy làm cho người học biết rằng trả lời theo dự định là đúng hay câu

đúng nhất.

8. Làm cho tất cả các lựa chọn ở phần trả lời phù hợp về mặt ngữ pháp

với phần gốc của câu hỏi và tương đương về mặt hình thức.

9. Tránh những gợi ý bằng lời giúp cho người học lựa chọn câu trả lời

đúng hoặc để loại bỏ trả lời khác không đúng như:

- Tính tương tự của cách dùng từ ở cả phần gốc và những câu trả lời

đúng là một trong những gợi ý rõ ràng. Những từ chính trong phần gốc có thể

được lặp đi lặp lại theo nguyên văn một cách vô ý trong câu trả lời đúng, từ

đồng nghĩa có thể được sử dụng, hoặc các từ đơn giản đồng âm hoặc trông

giống nhau.

- Viết câu trả lời đúng bằng ngôn ngữ sách giáo khoa hay đoạn ngữ

tương tự có thể làm cho người học lựa chọn trả lời đó bởi vì nó trông có vẻ

hay hơn so với các lựa chọn khác, hoặc bởi vì người học nhớ man mán đã

nhìn thấy nó trước đây.

- Viết câu trả lời đúng với nhiều chi tiết hơn có thể cung cấp một gợi ý.

Ngoài ra, khi các câu trả lời được bổ sung bằng nhiều từ có liên quan với câu

thường là câu đúng (ví dụ: đôi khi, có thể, thông thường), nó có nhiều khả

năng được chọn.

- Đưa các thuật ngữ mang tính tuyệt đối trong mồi nhử giúp người học

loại bỏ chúng như câu trả lời có thể được chọn, bởi vì những thuật ngữ như

thế thông thường có liên quan với các câu sai (ví dụ như luôn luôn, không

bao giờ, tất cả, không một ai, chỉ). Điều này làm cho các câu trả lời đúng rõ

ràng hơn hoặc ít nhất là làm tăng cơ may đoán ra nó.

- Đưa hai trả lời hoàn toàn có ý giống nhau, làm cho khả năng loại bỏ

những trả lời khác, do một trong hai trả lời rõ ràng chắc chắn là câu trả lời

đúng.

- Đưa hai trả lời có cùng một ý nghĩa làm cho khả năng loại bỏ chúng

như là câu trả lời có thể được chọn. Nếu hai lựa chọn trả lời có cùng một ý

nghĩa và chỉ có một trả lời được lựa chọn, điều này khá rõ ràng rằng cả hai

câu đó là không đúng.

10. Làm cho các mồi nhử hợp lý và hấp dẫn đối với dạng tương tự

- Sử dụng khái niệm thông thường sai hoặc các lỗi phổ biến của người

học như là những mồi nhử.

- Viết các lựa chọn bằng ngôn ngữ của người học.

- Sử dụng các từ nghe có vẻ hay (ví dụ, chính xác, quan trọng,…) trong

mồi nhử, cũng như trong các câu trả lời đúng.

- Viết các mồi nhử tương tự với câu trả lời đúng với cách dùng từ dài

bằng nhau phức tạp ngang nhau.

11. Thay đổi độ dài tương đối của câu trả lời đúng để loại bỏ độ dài như

là một gợi ý.

12. Tránh sử dụng đáp án “tất cả các trả lời trên đều” và “không có

trường hợp nào ở trên” một cách thận trọng.

13. Sắp xếp vị trí của các câu trả lời đúng một cách ngẫu nhiên.

14. Kiểm soát độ khó của câu trắc nghiệm bằng cách thay đổi các vấn

đề trong các phần gốc hoặc bằng cách thay đổi các lựa chọn.

15. Hãy chắc chắn mỗi câu hỏi độc lập với câu hỏi khác trong bài trắc

nghiệm.

16. Sử dụng ước tính thời gian hiệu quả.

B. MỘT SỐ Ý KIẾN VỀ CÂU TRẮC NGHIỆM NHIỀU LỰA CHỌN

1. Ưu điểm

* Về định lượng

- Các câu nhiều lựa chọn đóng góp vào việc cải thiện tính tin cậy và

tính giá trị của một bài kiểm tra.

- Các câu nhiều lựa chọn này là phương tiện để thu thập và sửa chữa

một khối lượng tri thức lớn trong khoảng thời gian ngắn.

* Về định tính

- Các câu nhiều lựa chọn cho phép đánh giá kết quả học tập một cách

hệ thống, chính xác ở mức cao.

- Câu hỏi nhiều lựa chọn cho phép đưa ra các yêu cầu chính xác về

học thuật.

Thực tế, người học không thể che dấu được các lỗ hổng trong kiến

thức khi trả lời các câu hỏi mang tính chất học thuộc lòng. Đối với các câu hỏi

luận đề về tri thức học thuộc lòng, người học có thể tránh nói những phần

mình chưa nắm kỹ bằng cách nói sâu những phần mình biết rõ nhất.

- Các câu nhiều lựa chọn đảm bảo tính khách quan, rõ ràng trong việc

chấm bài.

Thực tế, cũng như các quy trình đánh giá được định nghĩa ở phần

trước, sự không minh bạch trong quá trình chấm bài sẽ bị loại bỏ.

Tính xúc tích của các số thứ tự của các lựa chon cho phép phân tích

kết quả học tập một cách khái quát và mang tính tự điều chỉnh.

Một chữ hoặc con số được mã hóa cho phép giáo viên nhận ra một

cách khái quát câu trả lời của từng người học đối với một câu hỏi nhiều lựa

chọn hỏi về tri thức được mở rộng trong bài giảng.

2. Nhược điểm cơ bản của các câu hỏi nhiều lựa chọn

- Các câu nhiều lựa chọn không thể đánh giá một số kỹ năng như là

trình bày bài một cách sáng tạo, khả năng trình bày và viết ra những điều

người học suy nghĩ, tìm ra những lựa chọn trả lời mới và thậm chí khả năng

tự viết lại những điều trong trí nhớ có liên quan đến bài kiểm tra.

- Đưa ra những lựa chọn sai sẽ ảnh hưởng không tích cực đến người

học trong tương lai do các lỗi sẽ đọng lại trong trí nhớ của các người học.

(Hiện nay những nghiên cứu khoa học đã chứng minh e ngại này không có cơ

sở).

- Tầm nhận thức bị hạn chế:

Chúng ta có thể lo ngại rằng các câu nhiều lựa chọn sẽ làm đơn giản

hoá “thế giới quan” của người học, thu về ở dạng như một sơ đồ, và do đó

đồng nhất hóa các cá thể với nhau.

Các nhược điểm khác:

- Công việc thực hiện một câu hỏi nhiều lựa chọn:

Để xây dựng một câu nhiều lựa chọn, giáo viên sử dụng những lỗi mà

các người học thường mắc phải. Việc xây dựng một câu nhiều lựa chọn đòi

hỏi phải có một khả năng thực sự dựa trên sự dày dạn kinh nghiệm sư phạm.

Một câu hỏi nhiều lựa chọn khi biên soạn lần đầu tiên cần phải được

thử nghiệm trước khi đem ra sử dụng. Trong quá trình thử nghiệm này, các

câu trả lời được phân tích theo các mô hình, các công thức và các quy trình

nghiêm ngặt. Tuy nhiên, trong các kỳ thi đòi hỏi phải giữ bí mật bài thi thì việc

thử nghiệm các câu nhiều lựa chọn sẽ gặp trở ngại. Đây là một nhược điểm

khi sử dụng loại câu hỏi này.

- Không thể truyền đạt bằng lời cho người học nội dung một câu hỏi

nhiều lựa chọn:

Về nguyên tắc, một câu hỏi nhiều lựa chọn gồm có phần hỏi và các lựa

chọn đề ra đôi khi chỉ sai khác nhau một hoặc hai yếu tố nào đó. Người học

phải có khả năng phân tích các dữ kiện này theo ý của mình. Hơn nữa, các

số ký hiệu các lựa chọn trả lời có tính chất hoàn toàn ước lệ và do đó sẽ trở

nên vô lý nếu bắt người học phải nhớ những con số này. Chính vì hai lý do

trên mà không thể trình bày bằng lời câu nhiều lựa chọn ngoại trừ những

trường hợp đặt biệt.

- Xu hướng đưa ra các câu hỏi chi tiết:

Noizet và Caverni (1978, tr.155) cho rằng các câu hỏi phải có tính “chắc

chắn” tức là không dành chỗ cho nhiều ý kiến khác nhau.

Người viết câu nhiều lựa chọn theo cách chia nhỏ kiến thức nhằm mục

đích để tránh các yếu tố không chắc chắn. Việc đặt câu hỏi như vậy sẽ có tác

dụng gián tiếp khiến cho người học phải vận dụng trí nhớ nhiều hơn là suy

luận logic và ảnh hưởng này sẽ không thể tránh khỏi

- Người học dễ tham khảo câu trả lời của người bên cạnh:

Hai người học dưới đây quy ước với nhau từ trước khi vào phòng thi là

sẽ trao đổi với nhau qua cử chỉ: chỉ vào mũi = 1, má = 2, tóc = 3, tai = 4. Để

tránh sự gian lận này, chúng ta tìm cách “gây nhiễu” số thứ tự câu hỏi và số

thứ tự các lựa chọn trả lời. Tất cả người học đều nhận được một nội dung

các câu và các câu trả lời như nhau nhưng các câu đó đánh số khác nhau.

Sau đó chuyển các câu trả lời vào máy tính, máy tính sẽ sắp xếp lại theo một

trình tự nhất định và việc chữa các câu sẽ được thực hiện thuận lợi cho tất cả

các bài thi. Ngoài ra, còn có các phương pháp khác để “gây nhiễu”.

- Các người học có thể trả lời đúng một cách ngẫu nhiên:

Việc chọn các câu trả lời đúng một cách ngẫu nhiên rất khó phân biệt

với việc chọn câu trả lời đúng bằng thực lực. Ngược lại, ta cũng khó có thể

phân biệt được việc chọn các câu trả lời sai là do xác suất hay là lỗi cố ý.

Những quy ước cho việc soạn thảo câu hỏi “đối chiếu cặp đôi”

1. Đưa tài liệu tương tự vào câu hỏi đối chiếu cặp đôi.

2. Đặt các câu hỏi ngắn ở cột bên trái và đặt các câu trả lời về bên phải.

3. Viết số lượng các trả lời nhiều hơn hoặc ít hơn, so với câu hỏi, và đặt

câu hỏi cho phép được sử dụng nhiều lần một câu trả lời.

4. Xác định trong các hướng dẫn loại “câu đối chiếu cặp đôi” rằng mỗi

câu trả lời có thể được sử dụng một lần, nhiều lần hoặc không được dùng.

Những quy ước cho việc soạn thảo câu hỏi Đúng - Sai

1. Chỉ đưa một ý tưởng trọng tâm quan trọng vào mỗi câu.

2. Từ sử dụng trong câu cần chính xác để người đọc đánh giá được

đúng hoặc sai.

3. Nên sử dụng câu phủ định đơn và tránh sử dụng phủ định kép.

4. Câu hỏi về quan điểm cần được bổ sung nguồn của nó.

5. Hay sử dụng câu hỏi ngắn về cấu trúc ngôn ngữ đơn giản.

C. CÁC HƯỚNG DẪN ĐỂ XEM XÉT BẢN THẢO BI TRẮC NGHIỆM LẦN CUỐI CÙNG, LỰA CHỌN VÀ CHỈNH SỬA CÂU TRẮC NGHIỆM

1. Mỗi câu hỏi trắc nghiệm có đo lường một kết quả học tập quan trọng

được ghi trong bảng quy định không?

2. Mỗi câu hỏi trắc nghiệm có thích hợp với một kết quả học tập cụ thể

được đo lường không?

3. Mỗi câu hỏi trắc nghiệm có trình bày một nhiệm vụ rõ ràng không?

4. Câu hỏi trắc nghiệm có được nêu bằng ngôn ngữ đơn giản, rõ ràng

không?

5. Câu hỏi trắc nghiệm có những gợi ý không liên quan không?

6. Độ khó của câu trắc nghiệm có thích hợp đối với trình độ người học

được kiểm tra không?

7. Mỗi câu hỏi trắc nghiệm có độc lập và các câu, trong một nhóm, có

chồng chéo không?

8. Những câu hỏi trắc nghiệm trong bài kiểm tra có bao trùm nội dung

của bảng quy định hai chiều không?

Sắp xếp câu trắc nghiệm

1. Các câu hỏi trong bài trắc nghiệm cần được sắp xếp để tất cả các

câu trắc nghiệm cùng loại ở cùng nhóm với nhau.

2. Các câu hỏi trong bài trắc nghiệm cần được sắp xếp theo thứ tự khó

dần lên.

3. Đối với một số mục đích, cần phân nhóm các câu trắc nghiệm đo

lường cùng một kết quả học tập hoặc trong cùng nội dung môn học lại với

nhau.

Viết lời hướng dẫn

Các hướng dẫn cho một trắc nghiệm thành tích cần đơn giản và chính

xác nhưng chứa đựng thông tin có liên quan đến các điểm sau đây:

1. Mục đích của bài trắc nghiệm.

2. Thời gian cho phép để làm xong bài trắc nghiệm.

3. Cách ghi lại các câu trả lời.

4. Có cho phép đoán mò khi chưa chắc về câu trả lời không?

Nguồn: Giáo sư Marjorie Devine & Nevart Yaghlian

Bài 7. MỘT CÁCH VIẾT CÂU TRẮC NGHIỆM NHIỀU LỰA CHỌN

Mối quan tâm đáng trân trọng của nhiều giáo viên là họ thường nhận

nhiệm vụ soạn thảo câu trắc nghiệm nhưng họ tương đối ít được đào tạo

hoặc ít thông tin để tham khảo khi thực hiện nhiệm vụ này. Mục tiêu của bài

viết này là trình bày một số kinh nghiệm truyền thống cho việc soạn thảo các

trắc nghiệm nhiều lựa chọn, một trong những hình thức thông thường nhất

của trắc nghiệm do giáo viên soạn. Những ý kiến dưới đây có thể áp dụng

được chủ yếu cho trắc nghiệm nhiều lựa chọn đánh giá các lĩnh vực chủ đề

tương đối rộng rãi.

Trước khi tiến hành, việc thiết lập những thuật ngữ của chúng ta để

thảo luận câu trắc nghiệm nhiều lựa chọn là hữu ích. Phần gốc là câu hỏi giới

thiệu hoặc một câu chưa hoàn chỉnh bắt đầu mỗi câu và được theo sau bằng

những lựa chọn. Phần lựa chọn gồm câu trả lời - lựa chọn đúng - và mồi nhử,

câu không đúng nhưng (chúng ta hy vọng) là những lựa chọn hấp dẫn.

Mục tiêu tổng quát

Theo quy định, người ta quan tâm đến việc viết phần gốc rõ ràng và chi

li, các câu trả lời thì không lập lờ và được người học làm bài trắc nghiệm tốt

nhất chọn, và các mồi nhử là những cạnh tranh đáng tin cậy của câu trả lời

khi được chứng minh bằng tần số mà người học chọn. Sau cùng, và có lẽ là

quan trọng nhất, chúng ta cần thái độ là những câu trắc nghiệm soạn thảo

cần đuợc thử nghiệm bằng những số thống kê tiêu biểu từ các dữ liệu thực

tiễn.

Lập kế hoạch

Mục tiêu đầu tiên trong việc lập kế hoạch một bài trắc nghiệm là tóm tắt

nội dung khóa học thực sự mà trắc nghiệm đó sẽ đánh giá. Cách thuận tiện

của việc hoàn thành việc này là dành 10 phút sau giờ học để lập thành thẻ

danh mục những khái niệm quan trọng được giảng dạy trong lớp và trong bài

đọc được phân về nhà trong ngày đó. Sau này, những thẻ đó được sử dụng

như là nguồn của các câu trắc nghiệm. Dĩ nhiên, một cách tiếp cận có ý thức

hơn nhiều là việc xây dựng chính những câu trắc nghiệm sau mỗi giờ học. Ưu

điểm của cả hai cách tiếp cận này là kết quả trắc nghiệm có lẽ là cách trình

bày hoạt động khoá học tốt hơn khi trắc nghiệm được soạn thảo trước khóa

học hoặc sau khoá học, lúc chúng ta có chỉ một trí nhớ ưa thích hoặc chương

trình lạc quan để rút ra. Khi chúng ta thỏa mãn rằng chúng ta có một mô tả

chính xác lĩnh vực nội dung, thì tất cả điều còn lại là soạn thảo những câu trắc

nghiệm đại diện cho lĩnh vực nội dung cụ thể. Để soạn thảo những câu trắc

nghiệm nhiều lựa chọn hay, có ba nhiệm vụ cần được xem xét: viết phần gốc,

viết phần lựa chọn và soạn thảo câu tiếp theo. Hai nhiệm vụ đầu được bàn

luận trong bài này.

Viết phần gốc

Trước hết chúng tôi sẽ mô tả một số quy định căn bản cho việc soạn

thảo phần gốc câu trắc nghiệm nhiều lựa chọn vì mặc dù không cần thiết, một

cách tiêu biểu chúng được viết trước phần lựa chọn.

1. Trước khi viết phần gốc, hãy xác định một điểm chính cần trắc

nghiệm trong câu đó. Một cách tổng quát, phần gốc nên trình bày một vấn đề,

mặc dù giải quyết vấn đề đó có thể đòi hỏi nhiều bước.

2. Xây dựng phần gốc là câu chưa hoàn chỉnh hoặc là một câu hỏi trực

tiếp, tránh những câu rập khuôn để không những câu trả lời theo lối học vẹt.

Ví dụ:

- Cách mạng tháng Tám của Việt Nam diễn ra vào ngày nào?

Hãy sửa cách trả lời những câu hỏi này để chúng được trả lời ít nhiều

dựa trên sự hiểu biết chứ không phải dựa vào việc nhận ra câu quen thuộc.

3. Tránh đưa những từ không diễn đạt gì thêm để giúp cho việc lựa

chọn câu trả lời. Thường một câu giới thiệu được thêm vào để làm rõ hơn

tính phù hợp hoặc tính ý nghĩa của một câu trắc nghiệm nhưng không ảnh

hưởng ý nghĩa của vấn đề giải quyết trong câu trắc nghiệm. Thông thường,

những đoạn ngữ dư thừa cần phải bỏ đi. Ví dụ, hãy xem xét câu:

- Cờ của nước Mỹ có ba màu. Một trong những màu đó là (1) đỏ (2)

xanh (đen).

Với câu:

- Một trong những màu của cờ nước Mỹ là (1) đỏ (2) xanh (đen).

Đặc biệt, tài liệu không phù hợp không được sử dụng để làm cho câu

trả lời kém rõ ràng. Điều này có khuynh hướng đặt quá cao tầm quan trọng

của việc đọc hiểu như là yếu tố quyết định câu lựa chọn đúng.

4. Hãy đưa càng nhiều thông tin vào phần gốc và càng ít thông tin vào

phần lựa chọn càng tốt. Ví dụ: Nếu điểm chính của câu trắc nghiệm có liên

quan đến thuật ngữ có định nghĩa, cách thức phù hợp hơn là trình bày định

nghĩa bằng phần gốc và nhiều thuật ngữ trong phần lựa chọn hơn là trình bày

thuật ngữ trong phần gốc và nhiều định nghĩa trong phần lựa chọn.

5. Hạn chế sử dụng phủ định trong phần gốc. Phủ định trong phần gốc

thường đòi hỏi câu trả lời là một câu sai. Do người học dường như có thói

quen tìm câu đúng, điều này có thể đưa ra một sai lệch không mong muốn.

6. Tránh những gợi ý không phù hợp với lựa chọn đúng. Ví dụ: Cấu trúc

nghữ pháp có thể dẫn người học bỏ những lựa chọn sai về mặt ngữ pháp khi

phần gốc xác định. Có lẽ thông thường và tế nhị hơn là vấn đề của những

yếu tố chung trong phần gốc và trong phần trả lời.

Cách viết phần lựa chọn

Theo sau phần hướng dẫn viết phần gốc câu trắc nghiệm, nhiệm vụ

khó khăn hơn của việc trình bày bản thân những lựa chọn. Những quy tắc

dưới đây không phải là đơn giản hóa công việc này càng nhiều càng tốt mà

chúng là hướng dẫn những cố gắng sáng tạo của chúng ta.

1. Hãy thỏa mãn với ba hoặc bốn lựa chọn có cấu trúc tốt. Thông

thường, việc cải tiến nhỏ đối với một câu trắc nghiệm do lựa chọn thứ năm

khó soạn không tương xứng với công sức để soạn thảo nó. Thật ra, những

câu khác đều giống nhau, một trắc nghiệm gồm mười câu mỗi câu bốn lựa

chọn có vẻ tốt hơn một trắc nghiệm có chín câu mỗi câu năm lựa chọn.

2. Soạn thảo mồi nhử cần cân đối theo chiều dài, tính phức tạp và hình

thức ngữ pháp đối với câu trả lời, tránh sử dụng từ luôn luôn”, “không bao

giớ” và “tất cả”. Kết hợp với quy tắc này tránh một số nguồn thông thường

của gợi ý gây sai lệch. Ví dụ, đôi khi bản thân chúng ta nhận thấy việc tăng

chiều dài và tính cụ thể của một trả lời (tương đối với mồi nhử) để bảo đảm

tính trung thực của nó. Tuy nhiên, điều này trở thành một gợi ý dễ xác định

câu đúng hoặc sai đối với người học thông thái khi làm trắc nghiệm. Liên

quan với vấn đề này là câu hỏi có hay không việc người soạn trắc nghiệm

nên lợi dụng những loại gợi ý này để soạn thảo những mồi nhử hấp dẫn hơn.

Cắc chắn là không! Số người học chọn một mồi nhử chỉ tùy thuộc vào sự

khiếm khuyết trong lĩnh vực nội dung mà câu trắc nghiệm nhằm đến và không

phải tùy thuộc vào sự sai lệch của gợi ý hoặc sự khác biệt về đọc hiểu “ủng

hộ” mồi nhử.

3. Cần tránh những lựa chọn như “không có câu nào ở trên”, “cả A và B

ở trên”, “tất cả các câu trên”,. khi người học được hướng dẫn để lựa chọn

“câu trả lời đúng nhất” ngầm hiểu rằng những lựa chọn thay đổi theo mức độ

đúng. Nói cách khác, “không có câu nào ở trên” thì chấp nhận được khi câu

hỏi mang tính sự kiện và có lẽ cần thiết khi sự tính toán đưa ra câu trả lời. “tất

cả các câu trên” không bao giờ cần, khi một mồi nhử được nhận ra xóa bỏ nó

và hai trả lời được nhận ra xác định nó.

4. Sau khi các lựa chọn được soạn thảo, hãy thay đổi vị trí câu trả lời

theo lối ngẫu nhiên. Có nhiều phương pháp để thực hiện việc này như tung

đồng xu, dùng bảng số ngẫu nhiên,… Hơn nữa, khi người soạn thảo trắc

nghiệm có ý thức ngẫu nhiên hóa vị trí câu trả lời đúng, cần thông báo cho

người học biết điều đó. (Những học viên làm trắc nghiệm thành thạo hiểu

rằng, đối với một số giáo viên, những lựa chọn đầu tiên hiếm khi là câu trả

lời).

5. Nếu có thể, hãy nhờ đồng nghiệp có chuyên môn trong lĩnh vực nội

dung của bài thi coi lại những câu trắc nghiệm để tìm ra những chỗ mơ hồ, dư

thừa hoặc cấu trúc câu khó. Sau khi hoàn chỉnh câu trắc nghiệm chúng ta

thường cảm thấy nhẹ nhỏm cho đến nỗi chúng ta bị mê hoặc để coi công việc

đã hoàn chỉnh và mỗi câu trắc nghiệm dưới dạng hoàn chỉnh tuyệt đối. Tuy

nhiên, việc cải tiến nguồn câu trắc nghiệm và bài trắc nghiệm thì có sẵn, có

nghĩa là, phân tích thống kê câu trả lời của thí sinh.

Tác giả: Jerard Kehoe Viện Bách khoa và Đại học tiểu Bang Virginia.

Bài này được soạn lại từ cuốn “Testing Memo 4: Constructing Multiple -

Choice Tests - Part I, “Office of Measurement and Research Services,

Virginia Polytechnic Institute and State University, Blacksburg, VA 24060.

Tài liệu tham khảo

Airasian P. (1994), Classroom Assessment, Second Edition, NY:

McGraw-Hill.

Cangelosi J. (1990), Designing Tests for Evaluating student

Achievement, NY: Addison Wellesley.

Grunlund N (1993), How to make achievementtests and assessments,

5th edition, NY: Allen and Bacon.

Haladyna T.M. & Downing, S.M. (1989), Validity of a Taxonomy of

Multiple - Choice Item-Writing Rules, Applied Measurement in Education, 2

(1), 51-78.

Bài 8. PHÂN TÍCH CÂU TRẮC NGHIỆM

1. ĐÁNH GIÁ ĐO LƯỜNG THÀNH QUẢ HỌC TẬP

Khi đánh giá một bài trắc nghiệm thì có hai yếu tố quan trọng được xét

đến là độ tin cậy và tính giá trị của bài trắc nghiệm. Sự ước lượng về đặc

trưng này thường được nêu ra như là các hệ số tương quan.

1.1. Độ tin cậy của bài trắc nghiệm (Reliability)

Trong lĩnh vực đo lường thành quả học tập, khái niệm tính tin cậy được

nêu ra đầu tiên, bởi vì người ta rất cần biết về mức độ tin tưởng vào dụng cụ

để đo. Trong học tập khi dùng một bài trắc nghiệm để đo sự tiếp thu bài học

của học sinh, trước hết ta cần xem bài trắc nghiệm ấy có đáng tin cậy hay

không.

Theo tác giả Dương Thiệu Tống: “Một bài trắc nghiệm được xem là

đáng tin cậy khi nó cho ra những kết quả có tính vững chãi, ổn định”(1). Điều

này có nghĩa là, nếu làm bài trắc nghiệm ấy nhiều lần, mỗi học sinh vẫn sẽ

giữ được thứ hạng tương đối của mình trong nhóm. Thực chất, có thể hiểu về

tính tin cậy của bài trắc nghiệm như sau: với cùng một bài trắc nghiệm, điểm

số của học sinh qua mỗi lần làm bài ấy có thể thay đổi: tăng lên hay giảm đi.

Nhưng nếu là một bài trắc nghiệm đáng tin cậy thì sự thay đổi ấy không

nhiều, đến nỗi gây ra những xáo trộn về thứ bậc của mỗi học sinh đã được

xác lập sau lần làm bài đầu tiên (nghĩa là một học sinh đã đạt được điểm cao

bây giờ lại có điểm thấp hoặc một học sinh đã đạt trung bình thì bây giờ lại có

điểm cao…)

Nói chung, tính tin cậy được hiểu là sự ổn định thứ bậc các điểm số

của học sinh, nếu cho thực hiện trắc nghiệm nhiều lần.

Tính tin cậy được đo bằng hệ số tin cậy. Theo tác giả Dương Thiệu

Tống, hệ số tin cậy là một “định nghĩa vận toán”(2) của tính tin cậy.

Hệ số tin cậy: đối với một bài trắc nghiệm, được tính theo hệ số tương

quan giữa điểm số của học sinh và các điểm số khác cũng của những học

sinh ấy thu được độc lập từ một bài trắc nghiệm khác tương đương.

Đối với một bài trắc nghiệm, hệ số tin cậy được tính theo phương pháp

phân đôi bài trắc nghiệm (phân đôi thành hai bài trắc nghiệm ngắn) mang

những câu hỏi số chẵn Y và những câu hỏi số lẻ X. Cụ thể công thức tính hệ

số tương quan Pearson giữa hai đại lượng X và Y như sau:

Trong đó:

X: là điểm các câu lẻ của bài trắc nghiệm của mỗi học sinh.

Tổng X: là tổng điểm các câu lẻ của tất cả các bài trắc nghiệm của học

sinh.

Y: là điểm các câu chẵn của bài trắc nghiệm của mỗi học sinh.

Tổng Y: là tổng điểm các câu chẵn của tất cả các bài trắc nghiệm của

học sinh.

N: là số học sinh làm bài trắc nghiệm.

Từ rxy của SPEARMAN-BROWN đưa ra công thức tính hệ số tin cậy r

của bài trắc nghiệm như sau:

r = (2rXY) / (1 + rXY)

Với: rXY là hệ số tương quan Pearson của bài trắc nghiệm chia đôi.

Tuy nhiên, với sự hỗ trợ của máy tính ta còn có thể dùng công thức

Kuder - Richardson 20 được sử dụng khá phổ biến để tính hệ số tin cậy của

bài trắc nghiệm là:

r = [K / (K – 1)][1 – (pq / s2)]

Với:

K: là số câu hỏi trong bài trắc nghiệm.

p: là tỉ lệ các câu trả lời đúng cho một câu hỏi.

q:là tỉ lệ các câu trả lòi sai cho một câu hỏi q =1- p.

xích ma: biến lượng của điểm số trên bài trắc nghiệm.

Công thức trên tính mức tin cậy căn cứ vào độ khó của câu hỏi hay là tỉ

lệ trả lời đúng cho từng câu hỏi. Công thức này chỉ áp dụng với những bài

trắc nghiệm trong mỗi câu đúng được tính 1 điểm và các câu sai là 0 điểm.

* Ý nghĩa của độ tin cậy trong bài trắc nghiệm:

Chiều dài của bài trắc nghiệm (số lượng câu hỏi) cũng ảnh hưởng đến

tính tin cậy. Theo các chuyên gia về trắc nghiệm thì một bài trắc nghiệm càng

dài thì tính tin cậy của nó càng được nâng cao và ngược lại.

Tính tin cậy của một bài trắc nghiệm tùy thuộc vào các yếu tố như sự

may rủi do phỏng đoán, độ khó của bài trắc nghiệm, việc chọn mẫu và độ dài

các câu hỏi.

Độ khó của một bài trắc nghiệm sẽ ảnh hưởng đến độ tin cậy của nó.

Nếu ta cho học sinh làm một bài trắc nghiệm dễ, các điểm số có khuynh

hướng tập trung vào đầu mút cao của thang điểm, khi đó sẽ khó phân biệt

được trình độ khác nhau của học sinh. Ngược lại, nếu đưa ra một bài trắc

nghiệm quá khó, các điểm số lại tập trung vào đầu mút thấp của thang điểm,

khi đó, sẽ không thấy được tính chất về trình độ hiểu biết của học sinh.

* Các biện pháp để có thể tăng hệ số tin cậy cho một bài trắc nghiệm:

Chọn những câu trắc nghiệm đồng đều về nội dung.

Tăng số lượng câu hỏi của bài trắc nghiệm, khi đó có thể khảo sát

được lượng kiến thức lớn của học sinh.

Chọn những câu trắc nghiệm có độ phân cách lớn.

Nên chọn những câu trắc nghiệm có độ khó trung bình từ 0.25 - 0.75.

Bài thi trắc nghiệm được ra cho các học sinh ở nhiều mức độ khác

nhau về trình độ. Mức phân tán điểm số (độ lệch tiêu chuẩn) càng lớn thì hệ

số tin cậy càng cao.

1.2. Tính giá trị của bài trắc nghiệm:

Một đặc tính quan trọng thứ hai của trắc nghiệm là giá trị của bài trắc

nghiệm. Vì một bài trắc nghiệm có giá trị thì thường đáng tin cậy nhưng không

phải bài trắc nghiệm nào đáng tin cậy cũng có giá trị.

Tính tin cậy và giá trị khác nhau ở chỗ tính tin cậy liên quan đến tính

vững chãi của điểm, còn tính giá trị liên quan đến mục đích của sự đo lường.

Tính giá trị liên quan đến mức độ đo lường của bài trắc nghiệm theo

mục đích mà ta muốn khảo sát trên một nhóm người. Khái niệm giá trị có ý

nghĩa khi ta xác định rõ: “ta muốn đo lường cái gì và với nhóm người nào”.

Tóm lại, một bài trắc nghiệm có giá trị khi nó đáp ứng được mục đích

đề ra, nó phải đo lường đúng loại thành quả học tập mà ta muốn khảo sát.

Tính giá trị của bài trắc nghiệm thành quả học tập thông thường được

phân loại như sau:

Giá trị nội dung:

Là mức độ “bao trùm” được nội dung môn học, bài học. Một bài luận đề

nhằm đo lường kiến thức môn học có thể kém giá trị nội dung vì nó giới hạn

bởi số câu hỏi quá ít. Một bài trắc nghiệm có thể “bao trùm” nhiều nội dung

môn học vì có nhiều câu hỏi, nhưng nó vẫn có thể kém giá trị vì chỉ chú trọng

vào một phần nội dung nào đó mà bỏ qua các phần nội dung khác.

Để đảm bảo cho giá trị nội dung của bài trắc nghiêm, người soạn thảo

cần phác họa trước một dàn bài trắc nghiệm trong đó quy định một cách khá

chi tiết nội dung của giáo trình và các mục tiêu. (Xem Phụ Lục 3, [t.10]).

Giá trị tiên đoán:

Giá trị tiên đoán nói lên mối quan hệ giữa điểm số bài trắc nghiệm với

một tiêu chí khác căn cứ vào khả năng (hay thành quả học tập) ở thời điểm

tương lai.

Giá trị mục tiêu:

Bài trắc nghiệm có giá trị mục tiêu khi khảo sát mức độ và năng lực

nhận thức của học sinh về nội dung học tập. Năng lực nhận thức đó chính là

hiểu, nhớ, vận dụng, phân tích, tổng hợp, so sánh…

Trong các loại giá trị trên, người nghiên cứu đề cập trong đề tài là giá trị

nội dung (Content Validity) là mức độ bao trùm được nội dung bài học và môn

học. Để đảm bảo cho giá trị nội dung bài trắc nghiệm, người nghiên cứu lập

ra một dàn bài trắc nghiệm trong đó có quy định khá chi tiết nội dung của

chương trình và các mục tiêu.

(Xem Phụ lục 3: Bảng phân tích nội dung, xác lập mục tiêu, kiểm tra

đánh giá).

1.3. Phân tích câu trắc nghiệm:

Phân tích câu trắc nghiệm trong một bài trắc nghiệm là một việc làm rất

cần thiết giúp người xây dựng bài trắc nghiệm:

Xác định được độ khó của câu trắc nghiệm.

Xác định được độ phân cách của câu trắc nghiệm.

Tính mồi nhử (câu nhiễu) trong câu trắc nghiệm.

Từ đó, người xây dựng bài trắc nghiệm mới biết được lý do vì sao câu

trắc nghiệm này khó, câu kia dễ, không hiệu quả để khi đó cần sửa đổi như

thế nào cho tốt hơn.

* Độ khó của câu trắc nghiệm:

Độ khó của câu trắc nghiệm là tỉ lệ phần trăm số học sinh trả lời đúng

câu trắc nghiệm ấy.

Công thức tính độ khó của câu trắc nghiệm:

Độ khó p của câu trắc nghiệm thứ

i = (Tổng số người trả lời đúng câu i) / (Tổng số người làm bài

trắc nghiệm)

Hoặc nếu gọi Mean (câu i) là điểm trung bình của câu thứ I, ta có:

Tổng số người trả lời đúng câu i = tổng điểm câu i

Tổng số người làm bài trắc nghiệm = số bài trắc nghiệm

Vậy Mean (câu i) = (Tổng điểm câu i) / (Số bài trắc nghiệm)

Theo cách tính này, giá trị độ khó có ý nghĩa như sau:

+ Độ khó = 1: câu trắc nghiệm quá dễ.

+ Độ khó = 0: câu trắc nghiệm quá khó.

+ Độ khó câu trắc nghiệm thay đổi theo trình độ của lớp học sinh.

Sau khi tính được độ khó câu trắc nghiệm, ta phải xét đến câu trắc

nghiệm này là khó hay dễ đối với học sinh và với tiêu chuẩn nào thì câu thứ i

vừa sức với học sinh.

Nếu độ khó của từng câu nằm trong khoảng:

Mean 0.19 thì kết luận: câu trắc nghiệm quá khó.

[0.20 - 0.40] thì kết luận: câu trắc nghiệm khó.

[0.41 - 0.70] thì kết luận: câu trắc nghiệm trung bình.

[0.71 - 0.90] thì kết luận: câu trắc nghiệm dễ.

Mean > 0.9 thì kết luận: câu trắc nghiệm quá dễ.

Độ khó vừa phải của câu trắc nghiệm:

Mỗi câu trắc nghiệm có độ khó vừa phải là câu có 50% số học sinh làm

đúng câu ấy và 50% làm sai, nhưng còn tùy thuộc vào từng loại câu trắc

nghiệm.

Một câu trắc nghiệm có độ khó vừa phải bằng số trung bình cộng của tỷ

lệ may rủi kỳ vọng (Expected Chance Proportion) và 100%. Tỉ lệ may rủi kỳ

vọng này thay đổi theo loại câu trắc nghiệm.

Cụ thể với các loại trắc nghiệm như sau:

Độ khó vừa phải của câu trắc nghiệm loại đúng - sai là trung điểm giữa

tỷ lệ may rủi kỳ vọng và 100%.

Loại này có tỷ lệ may rủi kỳ vọng là 50%.

Tức là: (100 + 50)/2 x% = 75%.

Vậy nếu có 75% học sinh trả lời đúng câu ấy thì câu ấy có độ khó vừa

phải.

Độ khó vừa phải của câu trắc nghiệm loại nhiều lựa chọn:

Với năm lựa chọn có tỷ lệ may rủi kỳ vọng là 20% thì:

Độ khó vừa phải là: (100 + 20)/2 X% = 60%.

Với bốn lựa chọn có tỷ lệ may rủi kỳ vọng là 25% thì:

Độ khó vừa phải là: (100 + 25)/ X2% = 62.5%.

Độ khó vừa phải của câu trắc nghiệm loại điền khuyết và đối chiếu cặp

đôi là trung điểm giữa tỷ lệ may rủi kỳ vọng và 100%.

Loại này có tỷ lệ may rủi kỳ vọng là 50%.

Tức là: (100 + 50)/2 x% = 75%.

Vậy nếu có 75% học sinh trả lời đúng câu ấy thì câu ấy có độ khó vừa

phải

Tóm lại, một bài trắc nghiệm được gọi là tốt không phải là bài trắc

nghiệm gồm toàn những câu khó hay câu dễ mà là bài trắc nghiệm gồm

những câu có mức độ khó trung bình hay là mức độ khó vừa phải.

Một bài trắc nghiệm có giá trị và đáng tin cậy thường là những bài gồm

những câu trắc nghiệm có độ khó xấp xỉ hay bằng độ khó vừa phải.

* Độ khó của bài trắc nghiệm:

Độ khó của bài trắc nghiệm phụ thuộc vào rất nhiều về trình độ kiến

thức của học sinh. Một bài trắc nghiệm có thể là dễ đối với học sinh khá giỏi,

nhưng ngược lại là khó đối với học sinh trung bình, yếu. Do đó, độ khó của

bài trắc nghiệm là tỷ lệ số giữa điểm trung bình của bài trắc nghiệm với tổng

số câu trắc nghiệm (mỗi câu trắc nghiệm được tính là 1 điểm) tỷ số này được

tính ra tỷ lệ % như sau:

Độ khó p của bài trắc nghiệm = trung bình X / K x 100%.

Vói X: điểm trung bình thực tế của bài trắc nghiệm.

K: tổng số câu trắc nghiệm (bằng điểm tối đa của bài).

Độ khó vừa phải của bài trắc nghiệm: là tỷ số giữa điểm trung bình lý

thuyết (TBLT) với điểm tối đa của bài trắc nghiệm K.

Độ khó vừa phải p của bài trắc nghiệm:

= (Trung bình lý thuyết / K) x 100%

Trong đó: Trung bình lý thuyết = (K + T) / 2

Vói K: tổng số câu trắc nghiệm.

T: điểm có được do may rủi.

Với hai thông số trên, ta có thể đánh giá độ khó của bài trắc nghiệm với

trình độ của học sinh như sau:

Nếu p = p’: bài trắc nghiệm phù hợp với trình độ học sinh,

p > p’: bài trắc nghiệm dễ so với trình độ học sinh,

p < p’: bài trắc nghiệm khó so với trình độ học sinh.

* Độ phân cách của câu trắc nghiệm:

Đó là khả năng phân biệt nhóm học sinh giỏi và nhóm học sinh kém khi

trả lời câu trắc nghiệm. Nếu một câu trắc nghiệm mà tất cả học sinh đều trả

lời đúng hoặc đều không trả lời đúng thì câu trắc nghiệm ấy không có khả

năng phân cách. Vì vậy, câu trắc nghiệm cần có độ phân cách cao.

Công thức tính độ phân cách:

Độ phân cách D = (Dg – Dk) / n

Vói: Dg: Số học sinh của nhóm giỏi trả lời đúng câu trắc nghiệm.

Dk: Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.

n: Tổng số học sinh làm bài trắc nghiệm.

Nhóm giỏi và nhóm kém được lựa chọn như sau:

Xếp đặt các bảng trả lời (phiếu làm bài) đã được chấm thứ tự các điểm

số từ cao đến thấp.

Phân chia bảng trả lời theo hai nhóm, nhóm cao gồm có xấp xỉ 27%

của nhóm có số điểm cao nhất, được gọi là nhóm giỏi và nhóm thấp gồm có

số bài tương đương 27% có điểm số thấp nhất gọi là nhóm kém.

Với cách tính theo phương pháp này là ta chỉ chọn ra 54% học sinh

trong hai nhóm, còn lại 46% học sinh có điểm ở mức trung bình không được

xét điểm.

Do đó, ngoài cách tính trên, người ta còn tính độ phân cách bằng hệ số

tương quan điểm nhị phân (Rpoint-biserial correlsion, viết tắt là Rpbis) như

sau:

Pbis = (Mp-Mq/xích ma t) x căn bậc hai pxq

Vói Mp: trung bình tổng điểm các bài làm đúng câu trắc nghiệm thứ i.

Mq: trung bình tổng điểm các bài làm sai câu trắc nghiệm thứ i.

p: tỷ lệ học sinh làm đúng câu i.

q: tỷ lệ học sinh làm sai câu i.

xích ma t: độ lệch tiêu chuẩn điểm bài trắc nghiệm.

Hai Tiến sĩ Giáo dục người Mỹ Quentin Stodola và Kalmer Stordahl

trong cuốn “Trắc nghiệm và đo lường cơ bản trong giáo dục” đã đưa ra một

thang đánh giá chỉ số phân cách như bảng dưới đây để giúp chúng ta lựa

chọn tốt các câu trắc nghiệm dùng ở lớp học.

Bảng 2: Thang đánh giá chỉ số phân cách

CHỈ SỐ D ĐÁNH GIÁ CÂU TRẮC NGHIỆM

Từ 0.4 trở lên

Từ 0.30 - 0.39

Từ 0.20 - 0.29

Dưới 0.19

Rất tốt

Khá tốt, nhưng có thể chỉnh sửa câu cho tốt hơn

Tạm được, nên hoàn chỉnh cho tốt hơn

Rất kém, cần phải chỉnh sửa

* Phân tích mồi nhử trong câu trắc nghiệm:

Ngoài việc đánh giá độ khó và độ phân cách của câu trắc nghiệm, ta có

thể làm cho câu trắc nghiệm tốt hơn bằng cách xem xét tần số của đáp án sai

trong mỗi câu hỏi.

Trở lại với phương pháp đơn giản để tính độ phân cách của trắc

nghiệm, ta chọn ra hai nhóm: 27% nhóm cao, 27% nhóm thấp, ghi tần số đáp

ứng của học sinh trong mỗi nhóm cho mỗi lựa chọn (A, B, C…) trong mỗi câu

trắc nghiệm, đồng thời ghi chỉ số khó và chỉ số phân cách cho mỗi câu trắc

nghiệm.

Chính chỉ số khó và chỉ số phân cách là những chỉ dẫn đầu tiên cho ta

biết câu trắc nghiệm nào là tốt, câu nào kém. Căn cứ vào chỉ số ấy, ta có thể

lựa chọn ra những câu trắc nghiệm để sử dụng cho bài trắc nghiệm chính

thức. Còn những câu có chỉ số khó quá thấp hay quá cao, đồng thời chỉ số

phân cách âm hoặc quá thấp là những câu kém cần phải xem xét sửa đi sửa

lại hoặc loại đi cho tốt hơn. Trong công việc xét lại này, ta cần phải xét lại toàn

bộ câu trắc nghiệm, nhất là những câu trắc nghiệm trả lời lựa chọn, trong đó

có những câu trả lời đúng và số còn lại là những mồi nhử.

Nguyên tắc cơ bản để xét tính mồi nhử là:

Với câu đúng thì số học sinh trả lời đúng của nhóm cao phải nhiều hơn

nhóm thấp.

Với mỗi câu sai thì số học sinh nhóm cao chọn phải ít hơn số học sinh

nhóm thấp.

Bảng 3: Ví dụ phân tích 1 câu trắc nghiệm số 16 trong bài TN lần I như sau:

Đáp án A B C D Tổng cộng

Nhóm cao 2 0 1 41 44

Nhóm thấp 6 0 5 33 44

Trong đó:

D: là đáp án đúng

A, B, C,: là các mồi nhử

Độ khó của câu là 0.79, độ phân cách là 0.108, vậy, đây là câu trắc

nghiệm dễ nhưng có độ phân cách rất thấp, do đó ta phải điều chỉnh lại câu

trắc nghiệm này.

Việc chọn đáp án đúng D tương quan thuận với tiêu chí như mong đợi

(nghĩa là theo nguyên tắc: số học sinh trả lời đúng trong nhóm cao phải nhiều

hơn số học sinh trả lời đúng trong nhóm thấp).

Về các mồi nhử A, C tương quan nghịch với tiêu chí như mong đợi

(nghĩa là theo nguyên tắc: số học sinh trong nhóm cao lựa chọn câu này phải

ít hơn số học sinh lựa chọn câu này trong nhóm thấp). Riêng mồi nhử B

không có sự phân biệt giữa nhóm cao và nhóm thấp, trái với sự mong đợi.

Kết kuận: ta cần xem xét sửa lại mồi nhử B

1.4. Đánh giá bài trắc nghiệm:

Sau khi chấm điểm cho từng bài trắc nghiệm, ta sử dụng điểm này để

tính toán các thông số của bài trắc nghiệm. Việc đánh giá bài trắc nghiệm dựa

trên bảy thông số sau đây:

- Điểm trung bình lý thuyết (TBLT) và điểm trung bình thực tế (TBTT)

của bài trắc nghiệm.

- Độ lệch tiêu chuẩn của bài trắc nghiệm.

- Độ khó của câu trắc nghiệm, bài trắc nghiệm.

- Độ phân cách của câu trắc nghiệm.

- Độ tin cậy của bài trắc nghiệm.

- Tính giá trị của bài trắc nghiệm.

- Sai số đo lường tiêu chuẩn xích ma ss.

* Điểm trung bình lý thuyết (TBLT):

Là trung bình cộng của điểm tối đa có thể đạt được với điểm may rủi

của bài trắc nghiệm:

TBLT = (K + T)/2

Vói K: là số điểm tối đa bằng số câu trắc nghiệm (điểm thô)

T: là điểm may rủi của bài trắc nghiệm (T được tính bằng cách lấy tổng

điểm may rủi của mỗi loại trắc nghiệm có trong bài)

* Điểm trung bình thực tế (X) của bài trắc nghiệm:

Là trung bình cộng của tất cả các điểm trắc nghiệm của học sinh:

Trung bình X = Tổng f.x/N

Với x: Điểm trung bình của mỗi học sinh.

f: Tần số của mỗi điểm trắc nghiệm.

N: Tổng số học sinh làm bài trắc nghiệm.

* So sánh điểm TBLT với điểm TBTT của bài trắc nghiệm:

TBLT > trung bình X: Bài trắc nghiệm khó đối với học sinh.

TBLT < trung bình X: Bài trắc nghiệm dễ đối với học sinh.

TBLT = trung bình X: Bài trắc nghiệm vừa sức với học sinh.

Ngoài ra còn có điểm trung vị và điểm Mod của bài trắc nghiệm nhưng

cách tính khó hơn. Trong thực tế, khi đánh giá bài trắc nghiệm, người soạn

thảo không cần phải tính toán chính xác điểm trung vị, chỉ so sánh trung vị

hơn hay kém điểm trung bình của bài trắc nghiệm.

* Độ lệch tiêu chuẩn xích ma t

Sau khi chấm điểm bài trắc nghiệm, các điểm này được sắp xếp từ

thấp đến cao thành một hàng số. Nếu ta chỉ dựa vào hàng số của bài trắc

nghiệm thì chưa thể xác định chính xác về sự cách biệt về trình độ của học

sinh, mà ta phải dùng đến độ lệch tiêu chuẩn.

Độ lệch tiêu chuẩn là số đo lường sự phân tán của các điểm trắc

nghiệm. Nếu trình độ học sinh đồng đều, thì độ lệch tiêu chuẩn sẽ thấp tức là

sự phân tán của các điểm trắc nghiệm rất ít so với điểm trung bình. Còn nếu

trình độ học sinh quá chênh lệch thì độ lệch tiêu chuẩn sẽ cao.

Công thức tính độ lệch tiêu chuẩn:

Xích ma t = Căn bậc hai của N nhân tổng fx2-(tổng fx)2/ N(N-1)

Trong đó:

N: Tổng số học sinh làm bài trắc nghiệm.

f: Tần số xuất hiện mỗi điểm số.

x: Điểm số của mỗi bài trắc nghiệm (điểm thô).

* Sai số đo lường tiêu chuẩn: xích ma ss

Sai số đo lường tiêu chuẩn của bài trắc nghiệm được tính theo công

thức:

Xích ma ss = xích ma căn bậc hai (1-r)

Trong đó:

Xích ma: Độ lệch tiêu chuẩn của bài trắc nghiệm.

r: Hệ số tin cậy.

Sai số đo lường tiêu chuẩn phụ thuộc vào mức phân tán của điểm số

trắc nghiệm và hệ số tin cậy. Nếu trình độ kiến thức của học sinh đồng đều thì

xích ma ss nhỏ. Ngược lại, nếu trình độ kiến thức của học simh quá cách biệt

thì xích ma ss sẽ tăng. Mặt khác, nếu bài trắc nghiệm có độ tin cậy cao thì

xích ma thấp.

Bài 9. CÁCH BIẾN CẢI ĐIỂM TRẮC NGHIỆM THÀNH ĐIỂM LỚP

1. BIẾN CẢI ĐIỂM TRẮC NGHIỆM RA ĐIỂM LỚP

Điểm của bài trắc nghiệm chấm được gọi là điểm thô. Với điểm thô, ta

không thể nào đánh giá được trình độ của học sinh giữa các môn học khác

nhau và giữa những bài trắc nghiệm có số câu khác nhau. Do đó, ta phải biến

cải điểm thô sang điểm lớp:

Có nhiều cách biến cải, một trong những cách đó là dùng công thức:

An pha = 10 / (K-T)x(X-T)

Trong đó:

K: Là điểm tối đa của bài trắc nghiệm.

T: Là điểm may rủi của bài trắc nghiệm.

X: Là điểm trắc nghiệm của từng học sinh.

Do đó mỗi điểm trắc nghiệm phải trừ đi T.

Ta có:

K - T là điểm tối đa tương ứng với điểm 10.

X -T sẽ tương ứng với điểm a của điểm lớp.

2. THỨ HẠNG BÁCH PHÂN (PERCENTILE RANKS) VÀ ĐIỂM BÁCH PHÂN (CENTILES)

Các điểm thô bắt đầu có ý nghĩa khi ta xếp hạng chúng từ điểm cao

nhất đến điểm thấp nhất. Tuy nhiên, lối xếp hạng này lại không để ý đến cỡ

của mẫu (Sample size), tức là số người trong mẫu, do đó giải pháp thuận tiện

thường được áp dụng là biến cải các điểm số ra thành các trị số phần trăm.

Có hai loại thống kê được sử dụng cho mục đích này là:

Thứ hạng bách phân PR (Percentile Ranks) của bất kỳ điểm số nào:

Thứ hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao

nhiêu phần trăm trường hợp trong một nhóm chuẩn mực rơi vào chính điểm

số ấy hay ở dưới nó.

Điểm bách phân (Centiles):

Điểm bách phân là một điểm (point) trên thang điểm số mà ở đó có một

số phần trăm trường hợp nào đó rơi vào chính điểm số ấy hay ở dưới nó.

Do cách giải thích của thứ hạng bách phân và điểm bách phân gần

giống nhau, nên trong đề tài, người nghiên cứu quan tâm đến việc tính thứ

hạng bách phân.

Sau đây là cách để biến cải một phân bố điểm thô ra thứ hạng bách phân PR, ta thực hiện các bước sau đây:

Liệt kê tất cả các điểm thô có thể có được.

Tính tần số f của mỗi điểm số.

Tính tần số tích lũy cf (cumulative frequency) từ dưới lên trên cho đến

mỗi điểm số bằng cách cộng điểm số ấy với các tần số của tât cả các điểm số

thấp hơn.

Tính tần số tích lũy cho đến trung điểm của mỗi điểm số (cf/mp) bằng

cách cộng 1/2 tần số f của điểm số ấy với tần số tích lũy của điểm số ngay

dưới nó.

Biến cải ra thành số phần trăm tích lũy (Cumulative Percentage -

cp/mp) bằng công thức:

cp/mp = 100(cf/mp).

Với cp/mp và cf/mp được xác định như trên và N là số học sinh tham

gia làm bài trắc nghiệm (tức số người mẫu) hoặc dùng 100/N như một hằng

số rồi nhân với nó với các trị số của cf/mp kế tiếp nhau.

Tìm ra thứ hạng bách phân bằng cách làm tròn các trị số cp/mp cho

đến các số nguyên gần nhất, riêng các trị số dưới 1 và trên 99 thì được xem

là 0 và 99.

3. ĐIỂM TIÊU CHUẨN (STANDARD SCORES)

Khi cải biến các điểm thô của bài trắc nghiệm ra một loại điểm khác

điểm này gọi là điểm tiêu chuẩn. Điểm chuẩn này được đặt trên cơ sở độ lệch

tiêu chuẩn của phân bố điểm số.

Có nhiều loại điểm tiêu chuẩn khác nhau thông dụng nhất là:

3.1. Điểm Z (Z Score):

Là loại điểm tiêu chuẩn căn bản mà tất cả các loại điểm tiêu chuẩn khác

được thiết lập từ đó, nó cho ta biết hiệu số điểm hay khoảng cách giữa một trị

số điểm thô nào đó và điểm trung bình của nhóm làm bài trắc nghiệm.

Công thức tính điểm Z là:

Z = X-x/ xích ma

Với

X: Là điểm trung bình lý thuyết của nhóm làm bài trắc nghiệm.

x: Là một điểm thô nào đó của bài trắc nghiệm.

xích ma t: Là độ lệch tiêu chuẩn của bài trắc nghiệm.

Như vậy, điểm Z có thể là điểm âm, điểm dương và có một hoặc nhiều

số lẻ. Để khắc phục nhược điểm này, có các loại điểm tiêu chuẩn khác.

3.2. Điểm tiêu chuẩn V:

Đổi điểm thô ra điểm đánh giá được mức độ nhận thức của học sinh,

sau khi khảo sát kết quả bài trắc nghiệm ta cần phải đổi điểm thô ra điểm lớp

và quy chung về một thang điểm nhất định.

Có nhiều hệ thống thang điểm biến cải điểm trắc nghiệm, ở đây ta chỉ

sử dụng thang điểm 11 bậc (từ 0 -> 10) cho phù hợp với thang điểm hiện nay

của nước ta. Điểm tiêu chuẩn V là điểm tiêu chuẩn được áp dụng hiện nay

trong các kỳ thi trắc nghiệm, cũng dựa trên cơ sở điểm Z nhưng loại trừ điểm

âm cho phù hợp với thang điểm Việt Nam.

Công thức tính điểm V là: V = 2Z + 5.

Trong công thức này ta chọn điểm trung bình là 5 và độ lệch tiêu chuẩn

bằng 2. Điểm tính ra theo thang điểm 10 của hệ thống thang điểm Việt Nam

hiện nay.

Điểm V cũng có thể có giá trị lẻ do Z lẻ nên phải làm tròn số.

Ngoài điểm Z và điểm V, còn có một số loại điểm khác được áp dụng

trên thế giới, cách tính toán phức tạp hơn, nhưng lại không thông dụng ở Việt

Nam.

Tóm lại:

Thông qua việc xử lý, tính toán, phân tích các thông số trên của câu

trắc nghiệm, bài trắc nghiệm là nhằm để tìm ra những câu đạt tiêu chuẩn (về

độ tin cậy, tính giá trị) cao và loại đi những câu không đạt tiêu chuẩn nhằm

tạo ra ngân hàng câu hỏi trắc nghiệm hoàn chỉnh có chất lượng cao.

Bên cạnh đó, thông qua việc xử lý các thông số trên cũng giúp cho giáo

viên phát hiện ra mức độ nhận thức của học sinh như thế nào để kịp thời điều

chỉnh những sai sót trong quá trình giảng dạy, chương trình môn học…

Việc đổi điểm thi ra điểm thứ hạng bách phân và điểm lớp nhằm qui về

một thang điểm chuẩn để thuận lợi cho việc so sánh đánh giá bài trắc nghiệm

của học sinh.

PHỤ LỤC

Sử dụng phần mềm Excel để xử lý bộ đề thi trắc nghiệm

1. GIỚI THIỆU CHUNG VỀ PHẦN MỀM EXCEL

Nếu ta chỉ sử dụng phần mềm thống kê SPSS 11.5 để xử lý thì vẫn cho

những kết quả tin cậy. Tuy nhiên, để cho việc xử lý số liệu được phổ biến,

đơn giản, tiện ích và được nhanh hơn, người nghiên cứu sử dụng kết hợp với

phần mềm Excel.

Phần mềm Excel rất thông dụng cho mọi người sử dụng nó trong bất kỳ

sử dụng máy tính nào (không phải cài đặt như SPSS).

Excel là phần mềm bảng tính điện tử dùng trong văn phòng quản lý do

hãng Microsoft sản xuất. Đây là một phần mềm có nhiều chức năng trong đó

chủ yếu xử lý số liệu dưới dạng bảng biểu. Bên cạnh những hàm trang bị sẵn,

Excel còn cho phép người sử dụng tự thành lập những công thức để tính toán

cho những lĩnh vực riêng biệt. Chính vì vậy, người xử lý trắc nghiệm nếu biết

về Excel có thể xử lý câu và bài trắc nghiệm hoàn toàn bằng phần mềm này.

Cụ thể Excel có một số chức năng cơ bản như sau:

- Lập và xử lý bảng tính về:

Thống kê, tổng hợp dữ liệu Phân tích, dự báo

Giải các bài toán qui hoạch, tài chính…

- Vẽ biểu đồ, đồ thị

- Quản trị cơ sở dữ liệu

- Lập trình với ngôn ngữ VBA (Visual Basic for Application)

2. DÙNG PHẦN MỀM EXCEL ĐỂ XỬ LÝ VÀ PHÂN TÍCH BÀI VÀ CÂU TRẮC NGHIỆM

Để đánh giá bài trắc nghiệm qua hai lần khảo sát, ta phải tính toán trên

hàng loạt các công thức phức tạp với một bảng dữ liệu khá lớn. Để thực hiện

nhanh chóng và chính xác, phần mềm Excel đã có những hàm chuyên dùng

để ta tính toán các thông số đánh giá trắc nghiệm đó. Khi đó, ta có thể thực

hiện đánh giá bài trắc nghiệm như sau:

Nhập dữ liệu của từng học sinh vào máy, sau đó tiến hành xử lý trên

bảng dữ liệu này.

- Chấm điểm từng học sinh trên máy tính, để được điểm trắc nghiệm

(điểm thô)

- Sau đó thực hiện việc phân tích đánh giá.

Cụ thể cách tính trên như sau:

Giả sử bảng điểm trắc nghiệm của toàn bài có tọa độ từ DA2 đến

DA163, ta có:

2. Điểm trung bình của bài trắc nghiệm

=AVERAGE(DA2:DA163)

2. Độ lệch tiêu chuẩn

=STDEV(DA2:DA163)

3. Điểm trung vị

=MEDIAN (DA2:DA163)

Điểm trung vị là điểm trong một phân bố điểm số phân chia phân bố ấy

ra thành hai nửa, mỗi nữa có số dữ kiện bằng nhau.

4. Điểm yếu vị

=MODE (DA2:DA163)

Điểm yếu vị là điểm số ở đó có tần số lớn nhất, nghĩa là tại điểm đó có

nhiều người đạt tới nhất.

5. Khoảng tin cậy

Khoảng tin cậy của điểm trung bình bài trắc nghiệm đó là khoảng biến

thiên của trị số trung bình:

=CONFIDENCE(an pha, độ lệch tiêu chuẩn t, n)

Với

An pha: Mức ý nghĩa thường chọn 0.05.

S: Độ lệch tiêu chuẩn.

n: Số bài trắc nghiệm.

Công thức cụ thể được lập như sau:

=CONFIDENCE(0.05,DF3,DA2:DA163)

6. Điểm tiêu chuẩn Z: ta phải căn cứ vào:

Điểm trắc nghiệm của từng học sinh.

Trị số trung bình của điểm bài trắc nghiệm.

Độ lệch tiêu chuẩn của bài trắc nghiệm.

Nếu Z > 0: điểm trên trung bình,

Nếu Z < 0: điểm dưới trung bình.


=(DA2-$DF$2) / $DF$3

Trong đó, DA2: Tọa độ điểm bài trắc nghiệm của học sinh thứ nhất.

DF2: Tọa độ điểm trung bình bài trắc nghiệm (được tính bởi hàm

AVERAGE).

DF3: tọa độ của độ lệch tiêu chuẩn (được tính bởi hàm STDEV).

(Các dấu $ để chỉ địa chỉ cố định, nó sẽ không đổi khi ta chép công

thức vừa lập để tính điểm Z cho các học sinh còn lại).

Sau đó, rê chuột ta sẽ được kết quả cho những bài còn lại.

7. Điểm lớp từ điểm Z:

Điểm lớp = 2Z + 5 (Giả sử điểm Z có tọa độ là DB2).


=2* DB2+5


8. Độ khó của câu trắc nghiệm:

Độ khó của câu trắc nghiệm thứ

i = Tổng số người trả lời đúng câu I / Tổng số người làm bài trắc

nghiệm


=ROUND(COUNTIF(B2:B163/T)/COUNT(B2:B163),3)

Trong đó, (B2:B163,”1”): Là tổng số người làm đúng.

(B2:B163): Là tổng số người làm bài trắc nghiệm.

Số (3):Là làm tròn lấy 3 số thập phân ở hàm ROUND.

8. Độ phân cách của câu trắc nghiệm:

Độ phân cách D = (Dg – Dk)/n

Với:

Dg: Số học sinh của nhóm giỏi trả lời đúng câu trắc nghiệm.

Dk: Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.

n: Tổng số học sinh làm bài trắc nghiệm.

Hình thức lựa chọn nhóm giỏi và nhóm kém đã được trình bày [t.34].

Với bài TN khảo sát lần I là 162 bài thì 27% là 44 bài.

Với bài TN khảo sát lần II là 412 bài thì 27% là 111 bài.

(Ở đây, người nghiên cứu đặt 27% toàn nhóm có điểm số cao nhất là

“giỏi”, 27% toàn nhóm có điểm số thấp nhất là “kém”).

Công thức cụ thể được lập cho nhóm giỏi và nhóm kém như sau:

=ROUND(27%* COUNT(A2:A163),0)

Công thức cụ thể được lập cho độ phân cách của câu như sau:

=B177/B179-B178/B180

Trong đó, (B177): Số học sinh của nhóm giỏi trả lời đúng câu trắc

nghiệm.

(B179): Tổng số học sinh làm bài TN của 27%.

(B178): Số học sinh nhóm kém trả lời đúng câu trắc nghiệm.

(B180): Tổng số học sinh làm bài TN của 27%.


10. Mồi nhử:

Sau khi có độ phân cách và độ khó của câu, ta tiếp tục phân tích các

mồi nhử của câu.

Phần phụ lục này do Anh Nguyễn Hồng Phụng (Lớp Cao học - Khóa 12

ngành Giáo dục học trường Đại học Sư phạm Kỹ thuật Tp. Hồ Chí Minh) viết

trong luận văn tốt nghiệp cao học và tác giả cho phép trích lại.

MỤC LỤC

Lời nói đầu

Phần 1. Một số lý thuyết về đánh giá trong giảng dạy và học tập

Bài 1. Một số quan điểm về đánh giá

Bài 2. Đánh giá

Bài 3. Tổ chức một chương trình đánh giá

Bài 4. Mục đích, ý nghĩa của việc đo lường kiểm tra đánh giá trong giáo

dục

Bài 5. Một số tác dụng của đánh giá

Bài 6. Mục tiêu, nội dung và chức năng của việc đánh giá hoạt động

giảng dạy

Bài 7. Đo lường, lượng giá và đánh giá trong giáo dục

Bài 8. Đánh giá sản phẩm của giảng dạy

Bài 9. Đánh giá và cho điểm

Bài 10. Cách cho điểm

Phần 2. Trắc nghiệm khách quan

Bài 1. Lược sử trắc nghiệm

Bài 2. So sánh cách đánh giá bằng trắc nghiệm và luận đề

Bài 3. Các loại mục tiêu

Bài 4. Những câu hỏi để chuẩn bị cho bài trắc nghiệm trong lớp học

Bài 5. Hình thức câu trắc nghiệm khách quan

Bài 6. Soạn thảo bài trắc nghiệm khách quan

Bài 7. Một cách khác viết câu trắc nghiệm nhiều lựa chọn.

Bài 8. Phân tích câu

Bài 9. Cải biến cải điểm trắc nghiệm thành điểm lớp

Phụ lục. Sử dụng phần mềm Excel để xử lý bộ đề thi trắc nghiệm

-//-

ĐÁNH GIÁ & TRẮC NGHIỆMKẾT QUẢ HỌC TẬP

Tác giả: ĐOÀN VĂN ĐIỀU

NHÀ XUẤT BẢN ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

280 An Dương Vương, Phường 4, Quận 5, TP.HCM

Điện thoại: (08) 38 301 303 - Fax: (08) 39 381 382

Email: [email protected] - http://nxb.hcmup.edu.vn

Chịu trách nhiệm xuất bản:

Giám đốc – Tổng biên tập: PGS.TS. NGUYỄN KIM HỒNG

Biên tập: NGÔ THỊ THU NGỌC

Tổ chức nội dung: ĐOÀN VĂN ĐIỀU

Trình bày bìa & Sửa bản in: DIỆP QUANG PHƯỚC

In 500 cuốn khổ 16 x 24cm tại Cty TNHH MTV In Kinh Tế. Số 279 Nguyễn Tri

Phương, Phường 5, Quận 10, TP.HCM. Số đăng ký kế hoạch xuất bản 190-

2011/CXB/11-07/ĐHSPTPHCM. Quyết định xuất bản số: 152/QĐ-NXBĐHSP,

cấp ngày 15/03/2012. In xong và nộp lưu chiểu Quý II năm 2012.

http://nxb.hcmup.edu.vn/

mailto:[email protected]

Đanh giá và trắc nghiệm kết quả học tậpsaomaidata.org/library/431... · web...

Documents