Tải bản đầy đủ

Nghiên cứu, xây dựng ngân hàng câu hỏi trắc nghiệm khách quan dùng để kiểm tra đánh giá kết quả học tập môn toán lớp 12 tại trường THPT bến TRe, vĩnh phúc

Ket-noi.com kho tài liệu miễn phí

MỤC LỤC
MỞ ĐẦU
1
1. Lý do chọn đề tài
1
2. Mục đích nghiên cứu của đề tài
6
3. Giới hạn, phạm vi nghiên cứu đề tài
6
4. Câu hỏi nghiên cứu và giả thiết nghiên cứu của đề tài
6
5. Khách thể và đối tượng nghiên cứu
6
6. Phương pháp nghiên cứu
6
7. Nhiệm vụ nghiên cứu
7
8. Cấu trúc của luận văn
8

CHƯƠNG 1. CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN
9
9
1.1. Đo lường và đánh giá trong giáo dục
1.1.1. Khái niệm về đo lường và đánh giá trong giáo dục
9
1.1.2. Phân loại các mục tiêu giáo dục và các mức độ của lĩnh vực nhận thức
10
1.1.2.1. Mục tiêu dạy học
10
1.1.2.2. Các mức độ của lĩnh vực nhận thức
10
1.1.3. Đánh giá kết quả học tập của học sinh
12
1.1.3.1. Kết quả học tập của học sinh
12
12
1.1.3.2. Mục đích của việc đánh giá kết quả học tập
1.1.3.3. Cơ sở của việc đánh giá kết quả học tập
13
1.1.4. Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh
14
1.1.5. Công cụ đo lường kết quả học tập
15
1.1.5.1. Phân loại công cụ đo
15
1.1.5.2. So sánh phương pháp trắc nghiệm khách quan và tự luận
16
18
1.1.6. Yêu cầu của công cụ đo lường và đánh giá trong giáo dục
1.1.7. Đánh giá câu hỏi trắc nghiệm khách quan
18
1.1.7.1. Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan
18
1.1.7.2. Phân tích câu hỏi trắc nghiệm khách quan
19
1.1.8. Đánh giá bài trắc nghiệm khách quan
21
1.1.9. Lý thuyết khảo thí hiện đại
21


1.1.10. Ngân hàng câu hỏi trắc nghiệm khách quan
24
1.1.11. Quy trình thiết kế câu hỏi trắc nghiệm khách quan
25
1.1.12. Quy trình chuẩn bị và triển khai một kỳ thi trắc nghiệm
khách quan tiêu chuẩn hoá
26
1.2. Tình hình nghiên cứu về khoa học đo lường đánh giá trên thế giới và Việt Nam 28
1.3. Công tác đánh giá trong trường THPT hiện nay
30

1


1.3.1. Những bất cập trong đo lường và đánh giá ở trường THPT
1.3.2. Một số giải pháp cho những bất cập
1.4. Đổi mới kiểm tra đánh giá trong trường THPT
1.4.1. Mục đích đánh giá
1.4.2. Quá trình đánh giá
1.4.3. Kỹ thuật đánh giá
1.4.3.1. Biện pháp đánh giá
1.4.3.2. Công cụ đánh giá
1.5. Tình hình công tác kiểm tra đánh giá tại trường THPT Bến Tre tỉnh Vĩnh Phúc
Kết luận chương 1
CHƯƠNG 2. XÂY DỰNG NGÂN HÀNG CÂU HỎI
TRẮC NGHIỆM KHÁCH QUAN MÔN TOÁN 12
2.1. Chương trình Toán 12
2.1.1. Nội dung chương trình
2.1.2. Phân phối chương trình
2.2. Thực hiện quy trình thiết kế câu hỏi trắc nghiệm khách quan
2.2.1. Mục đích đánh giá
2.2.2. Mức độ kiến thức dùng để đo lường
2.2.3. Xác định nội dung chi tiết bài kiểm tra. Lập bảng trọng số
2.2.4. Thiết kế câu hỏi trắc nghiệm khách quan
2.2.4.1. Lựa chọn dạng câu hỏi thi
2.2.4.2. Viết câu hỏi thi
2.2.4.3. Rà soát, chỉnh sửa câu hỏi
2.2.5. Lập đề thi
2.2.6. Thử nghiệm
2.2.6.1. Chọn mẫu
2.2.6.2. Tổ chức thi-kiểm tra
2.2.7. Nhập số liệu. Phân tích câu hỏi
Kết luận chương 2
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU
3.1. Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán 12
3.2. Sử dụng ngân hàng câu hỏi trắc nghiệm khách quan
3.3. Nâng cao kỹ năng ra đề kiểm tra của giáo viên
3.4. Đổi mới công tác đánh giá
KẾT LUẬN VÀ KHUYẾN NGHỊ
TÀI LIỆU THAM KHẢO
PHỤ LỤC

2

30
31
32
32
32
33
33
33
34
36
37
37
37
37
39
39
41
42
48
48
49
49
50
50
50
51
51
61
62
62
76
76
77
78
80
82


CÁC CHỮ VIẾT TẮT

HH:

Hình học

HK:

Học kỳ

IRT:

Lý thuyết hồi đáp

GT:

Giải tích

GTLN:

Giá trị lớn nhất

GTNN:

Giá trị nhỏ nhất

NHCH:

Ngân hàng câu hỏi

TNKQ:

Trắc nghiệm khách quan

TL:

Tự luận

THPT:

Trung học phổ thông

3


Ket-noi.com kho tài liệu miễn phí

MỞ ĐẦU
1. Lý do chọn đề tài
Một trong những mục tiêu của công cuộc cải cách giáo dục ở nước ta là đổi
mới giáo dục phổ thông trong đó có đổi mới giáo dục trung học phổ thông. “Mục
tiêu của việc đổi mới chương trình giáo dục phổ thông là xây dựng nội dung chương
trình, phương pháp giáo dục, sách giáo khoa phổ thông mới nhằm nâng cao chất
lượng giáo dục toàn diện thế hệ trẻ, đáp ứng yêu cầu phát triển nguồn nhân lực phục
vụ công nghiệp hóa, hiện đại hóa đất nước, phù hợp với thực tiễn và truyền thống
Việt Nam; tiếp cận trình độ giáo dục phổ thông ở các nước phát triển trong khu vực
và thế giới” (Nghị quyết số 40/2000/Quốc hội 10, ngày 9/12/2000). Đổi mới chương
trình giáo dục phổ thông phải là một quá trình từ đổi mới mục tiêu, nội dung,
phương pháp đến phương tiện giáo dục, đánh giá chất lượng giáo dục. Điều này
được thể hiện trong Luật giáo dục: “Chương trình giáo dục phổ thông thể hiện mục
tiêu giáo dục; quy định chuẩn kiến thức, kỹ năng, phạm vi và cấu trúc nội dung giáo
dục phổ thông; phương pháp và hình thức tổ chức hoạt động giáo dục, cách thức
đánh giá kết quả giáo dục đối với mỗi môn học ở mỗi lớp và mỗi cấp học của giáo
dục phổ thông” (Điều 29, mục II - Luật Giáo dục - 2005). Vai trò của kiểm tra đánh
giá trong tiến trình đổi mới nền giáo dục nhằm nâng cao chất lượng đào tạo đã được
khẳng định như một chiến lược, một chính sách giáo dục quốc gia.
Thực tiễn công tác kiểm tra, đánh giá ở trường phổ thông hiện nay cho ta
thấy tình trạng đánh đồng việc cho điểm với đánh giá năng lực học sinh; có xu
hướng chú trọng kiến thức ghi nhớ hơn là rèn kỹ năng và năng lực học sinh; công
tác kiểm tra, đánh giá chịu sức ép của thi cử và bệnh thành tích; các kết quả kiểm tra
thường để xếp loại học sinh hơn là tìm ra điểm mạnh yếu của học sinh để giúp học
sinh tiến bộ và định hướng cho giáo viên trong việc cải tiến nội dung và phương
pháp giảng dạy; giáo viên và nhà quản lý còn yếu về năng lực đánh giá trong giáo
dục.
Các giải pháp cải tiến thực trạng trên đang được tập trung vào các vấn đề lớn
là: xây dựng cơ chế đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi
dưỡng năng lực đánh giá cho giáo viên; tạo sự thay đổi mạnh mẽ về nhận thức đối
với công tác kiểm tra đánh giá; cải tiến phương pháp kiểm tra đánh giá phù hợp với
những định hướng của giáo dục Việt Nam.

4


Đánh giá trong giáo dục là công cụ để xác định năng lực nhận thức người
học, điều chỉnh quá trình dạy học. Đổi mới phương pháp dạy học được chú trọng để
đáp ứng những yêu cầu mới của mục tiêu giáo dục nên việc kiểm tra, đánh giá phải
chuyển biến mạnh theo hướng phát triển trí thông minh, sáng tạo của học sinh,
khuyến khích vận dụng linh hoạt các kiến thức, kỹ năng đã học vào những tình
huống thực tế, làm bộc lộ khả năng của học sinh. Đánh giá không chỉ thực hiện ở
thời điểm cuối cùng của mỗi giai đoạn giáo dục mà trong cả quá trình giáo dục.
Hướng tới yêu cầu kiểm tra đánh giá công bằng, khách quan kết quả học tập
của học sinh, ngoài phương pháp đánh giá bằng quan sát và vấn đáp, trong phương
pháp viết người ta bổ sung các hình thức đánh giá khác như đưa thêm các dạng câu
hỏi trắc nghiệm khách quan; chú ý hơn tới việc đánh giá cả quá trình lĩnh hội tri
thức của học sinh, quan tâm tới việc tích cực hoá hoạt động học tập của học sinh.
Trên cơ sở nắm chắc kiến thức đo lường và đánh giá trong giáo dục, cần tiến hành
xây dựng ngân hàng câu hỏi trắc nghiệm (gồm cả câu hỏi TNKQ và TL) chuẩn hoá
cho từng môn học của mỗi cấp học hay bậc học. Sử dụng ngân hàng này, học sinh
có thể tự ôn tập kiểm tra kiến thức, giáo viên có thể sử dụng để kiểm tra đánh giá
học sinh. Để làm được điều này, phải bắt đầu từ việc đào tạo đội ngũ chuyên gia về
đánh giá trong giáo dục và bồi dưỡng các kiến thức về khoa học đo lường đánh giá
trong giáo dục cho giáo viên ở mọi cấp học, bậc học.
Công cuộc đổi mới công tác kiểm tra đánh giá ở THPT hiện nay đang được
ngành giáo dục đặc biệt quan tâm, các giáo viên THPT được tập huấn về đổi mới
phương pháp kiểm tra đánh giá, tuy nhiên hiệu quả chưa cao. Đa số giáo viên chưa
có nhận thức đúng đắn về công tác kiểm tra đánh giá, phần lớn vẫn quan niệm rằng
kiểm tra chỉ để cho điểm và xếp hạng học sinh. Các câu hỏi trắc nghiệm khách quan
do giáo viên soạn không được phân tích, đánh giá nên các đề kiểm tra do giáo viên
soạn cũng chưa có hiệu quả. Các trường THPT có đội ngũ giáo viên đông đảo giảng
dạy ở từng bộ môn, nếu có kiến thức chuyên môn sâu sắc cộng với kiến thức về đo
lường đánh giá, chắc chắn việc cùng nhau góp phần thành lập ngân hàng câu hỏi
trắc nghiệm dùng để kiểm tra đánh giá kết quả học tập của học sinh là việc làm
không khó, nhưng sẽ mất nhiều thời gian và công sức.
Trước tình hình như vậy, là một giáo viên dạy Toán THPT, tôi chọn đề tài
luận văn: “Nghiên cứu, xây dựng ngân hàng câu hỏi trắc nghiệm khách quan
dùng để kiểm tra đánh giá kết quả học tập môn Toán lớp 12 tại trường THPT
Bến Tre, Vĩnh Phúc”. Kết quả nghiên cứu của luận văn sẽ là tài liệu cần thiết góp

5


phần vào quá trình đổi mới phương pháp kiểm tra đánh giá kết quả học tập của học
sinh ở bậc THPT, đồng thời nâng cao kỹ năng của giáo viên trong việc thiết kế câu
hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của học sinh.
2. Mục đích nghiên cứu của đề tài
• Nghiên cứu để xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn
Toán lớp 12 dùng trong kiểm tra đánh giá kết quả học tập của học sinh.
3. Giới hạn, phạm vi nghiên cứu
• Đề tài nghiên cứu, xây dựng khoảng 400 câu hỏi TNKQ nhiều lựa chọn đưa
vào ngân hàng câu hỏi TNKQ dùng để kiểm tra, đánh giá kết quả học tập
môn Toán 12 tại trường THPT Bến Tre - Tỉnh Vĩnh Phúc.
• Nghiên cứu thử nghiệm sử dụng câu hỏi TNKQ vào kiểm tra đánh giá kết
quả học tập môn Toán cho học sinh lớp 12A1 trường THPT Bến Tre, Tỉnh
Vĩnh Phúc.
4. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài.
4.1. Câu hỏi nghiên cứu
• Làm thế nào để xây dựng ngân hàng câu hỏi TNKQ cho môn Toán 12?
• Định hướng sử dụng ngân hàng câu hỏi TNKQ trong kiểm tra đánh giá kết
quả học tập của học sinh như thế nào?
4.2. Giả thuyết nghiên cứu
• Việc xây dựng, thử nghiệm và phân tích câu hỏi trong ngân hàng câu hỏi trắc
nghiệm khách quan môn Toán dựa trên cơ sở khoa học đo lường đánh giá sẽ
góp phần xây dựng được bộ câu hỏi trắc nghiệm khách quan phục vụ hiệu
quả cho công tác kiểm tra đánh giá kết quả học tập môn Toán của học sinh.
• Có thể sử dụng các câu hỏi trong ngân hàng câu hỏi TNKQ môn Toán để
thiết kế các đề kiểm tra đánh giá kết quả học tập của học sinh.
5. Khách thể và đối tượng nghiên cứu
5.1. Khách thể nghiên cứu
• Học sinh lớp 12A1 trường THPT Bến Tre thuộc Sở GD – ĐT Vĩnh Phúc.
5.2 . Đối tượng nghiên cứu
• Nghiên cứu xây dựng ngân hàng câu hỏi trắc TNKQ môn Toán 12.
6. Phương pháp nghiên cứu
6.1. Nghiên cứu lý thuyết

6


• Nghiên cứu các tài liệu về đường lối giáo dục, phương hướng phát triển
giáo dục, các Nghị quyết, chỉ thị của Bộ GD&ĐT về đổi mới chương
trình giáo dục phổ thông.
• Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục.
• Nghiên cứu bộ sách giáo khoa môn Toán bậc trung học phổ thông
chương trình phân ban và không phân ban.
6.2. Nghiên cứu thực nghiệm
• Quan sát: quan sát quá trình thực hiện đổi mới kiểm tra đánh giá của
giáo viên và học sinh, quá trình thử nghiệm xây dựng ngân hàng câu hỏi
TNKQ.
• Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu ý kiến của học sinh về
môn học và các hình thức kiểm tra đánh giá mà giáo viên đang sử dụng
giúp giáo viên kịp thời điều chỉnh phương pháp dạy học và kiểm tra
đánh giá.
• Thực nghiệm: góp phần đổi mới phương pháp đánh giá ở bậc THPT
thông qua việc thiết kế và thử nghiệm công cụ đánh giá: thiết kế câu hỏi
TNKQ, đề kiểm tra TNKQ; tổ chức thi-kiểm tra; đánh giá câu hỏi
TNKQ, đề TNKQ; thiết lập ngân hàng câu hỏi TNKQ.
• Phân tích và tổng kết kinh nghiệm.
• Phương pháp chuyên gia: tiếp thu ý kiến của các chuyên gia, đồng
nghiệp, học sinh trong quá trình thiết kế, thử nghiệm, phân tích đánh giá
câu hỏi TNKQ.
6.3. Phương pháp Toán học
• Sử dụng phần mềm SPSS phân tích số liệu thống kê.
• Sử dụng phần mềm chuyên dụng Quest, ConQuest.
• Sử dụng phần mềm trộn câu hỏi trắc nghiệm McMIX .
7. Nhiệm vụ nghiên cứu
• Nghiên cứu cơ sở lý luận để lựa chọn phương pháp xây dựng ngân hàng
câu TNKQ dùng trong việc kiểm tra đánh giá kết quả học tập của học
sinh.
• Xây dựng ngân hàng câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả
học tập của học sinh trường THPT Bến Tre - Vĩnh Phúc.

7


• Thử nghiệm các câu hỏi TNKQ đã xây dựng để phân tích chọn lựa các
câu hỏi có chất lượng.
• Đánh giá câu hỏi TNKQ để bổ sung vào ngân hàng câu hỏi TNKQ.
8. Cấu trúc của luận văn
Mở đầu
Chương 1. Cơ sở lý luận và thực tiễn
Chương 2. Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn
Toán 12
Chương 3. Kết quả nghiên cứu
Kết luận và khuyến nghị
Tài liệu tham khảo
Phụ lục

8


CHƯƠNG 1. CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN
1.1. Đo lường và đánh giá trong giáo dục
1.1.1. Khái niệm về đo lường và đánh giá trong giáo dục
Đánh giá là một khâu quan trọng trong quá trình giáo dục. Quá trình giáo dục
nào mà một con người tham gia cũng nhằm tạo ra những biến đổi nhất định trong
con người đó. Muốn biết những biến đổi đó xảy ra ở mức độ nào phải đánh giá hành
vi của người đó trong một tình huống nhất định. Sự đánh giá cho phép chúng ta xác
định mục tiêu giáo dục được đặt ra có phù hợp hay không và có đạt được hay không,
việc giảng dạy có thành công hay không, người học có tiến bộ hay không [16].
- Đo lường (Measurement) là quá trình thu thập thông tin một cách định lượng (số
đo) về các đại lượng đặc trưng của đào tạo năng lực (nhận thức, tư duy, kỹ năng và
phẩm chất nhân văn) trong quá trình giáo dục [12].
- Kiểm tra/Lượng giá (Assessment) là việc đánh giá năng lực hoặc phẩm chất của
sản phẩm đào tạo trong quá trình giáo dục theo các hệ thống quy tắc hoặc tiêu chuẩn
nào đó, căn cứ vào các thông tin định tính hoặc định lượng (số đo). Lượng giá có thể
thực hiện đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán (diagnostic) về đối
tượng giảng dạy, có thể triển khai trong tiến trình (formative) giảng dạy để tạo
những thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực
hiện lúc kết thúc (summative) để tổng kết. Trong giảng dạy ở nhà trường, các đo
lường trong tiến trình thường gắn chặt với người dạy, tuy nhiên các đo lường kết
thúc thường bám sát vào mục tiêu dạy học đã được đề ra, và có thể tách khỏi người
dạy.
- Đánh giá (Evaluation) là việc căn cứ vào các số đo và các tiêu chí xác định, đánh
giá năng lực và phẩm chất của sản phẩm đào tạo để nhận định, phán đoán và đề xuất
các quyết định nhằm nâng cao không ngừng chất lượng đào tạo. Đánh giá có thể là
định lượng dựa vào các con số hoặc định tính dựa vào các ý kiến và giá trị [16].
Trong giáo dục, có 6 loại đánh giá chính [12]:
1- Đánh giá mục tiêu đào tạo đáp ứng với yêu cầu của kinh tế-xã hội.
2- Đánh giá chương trình/nội dung đào tạo.
3- Đánh giá sản phẩm đào tạo đáp ứng mục tiêu đào tạo.
4- Đánh giá quá trình đào tạo (bao gồm đánh giá chuẩn đoán, đánh giá hình
thành, đánh giá tổng kết).
5- Đánh giá tuyển dụng.

9


6- Đánh giá kiểm định công nhận cơ sở đào tạo.
1.1.2. Phân loại các mục tiêu dạy học và các mức độ của lĩnh vực nhận thức
1.1.2.1. Mục tiêu dạy học
Benjamin S. Bloom và các cộng tác viên đã xây dựng một hệ thống phân loại
các mục tiêu của quá trình giáo dục. Ba lĩnh vực của các hoạt động giáo dục đã được
xác định đó là:
+ Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc
thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh
giá có phê phán.
+ Lĩnh vực hành động liên quan đến những kỹ năng đòi hỏi sự khéo léo về
chân tay, sự phối hợp các cơ bắp từ đơn giản đến phức tạp.
+ Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm
cả những mối quan hệ như yêu ghét, thái độ nhiệt tình, thờ ơ, cũng như sự cam kết
với một nguyên tắc và sự tiếp thu các ý tưởng [16].
Mục tiêu dạy học là những gì học sinh cần đạt được sau khi học xong môn
học, bao gồm:
- Hệ thống kiến thức khoa học và cả phương pháp nhận thức chung.
- Hệ thống các kĩ năng.
- Khả năng vận dụng vào thực tế.
- Thái độ, tình cảm đối với khoa học và xã hội.
1.1.2.2. Các mức độ của lĩnh vực nhận thức
Bloom cũng xây dựng nên các cấp độ của các mục tiêu giáo dục trong lĩnh
vực nhận thức được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp
nhất như sau:
- Biết (Knowledge): là sự nhớ lại các dữ liệu đã học được trước đây. Điều đó có
nghĩa là một người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các
lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ
thấp nhất của kết quả học tập trong lĩnh vực nhận thức.
- Hiểu (Comprehension): là khả năng nắm được ý nghĩa của tài liệu. Điều đó có thể
thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác (từ các từ sang số
liệu), bằng cách giải thích tài liệu (giải thích hoặc tóm tắt) và bằng cách ước lượng
xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng). Kết quả học tập ở cấp độ
này cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật.

10


- Vận dụng (Application): là khả năng sử dụng các tài liệu đã học vào một hoàn
cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp,
khái niệm, nguyên lý, định luật và lý thuyết. Kết quả học tập trong lĩnh vực này đòi
hỏi cấp độ thấu hiểu cao hơn so với cấp độ hiểu trên đây.
- Phân tích (Analysis): là khả năng phân chia một tài liệu ra thành các phần của nó
sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao gồm việc
chỉ ra đúng các bộ phận, phân tích mối quan hệ giữa các bộ phận, và nhận biết được
các nguyên lý tổ chức được bao hàm. Kết quả học tập ở đây thể hiện một mức độ trí
tuệ cao hơn so với mức hiểu và áp dụng vì nó đòi hỏi một sự thấu hiểu cả nội dung
và hình thái cấu trúc của tài liệu.
- Tổng hợp (Synthesis): là khả năng sắp xếp các bộ phận lại với nhau để hình thành
một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất
(chủ đề hoặc bài phát biểu), một kế hoạch hành động (dự án nghiên cứu), hoặc một
mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin). Kết quả học tập
trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào
việc hình thành các mô hình hoặc cấu trúc mới.
- Đánh giá (Evaluation): là khả năng xác định giá trị của tài liệu (tuyên bố, tiểu
thuyết, thơ, báo cáo nghiên cứu). Việc đánh giá dựa trên các tiêu chí nhất định. Đó
có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp
với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí
[16].
Bảng tóm tắt dưới đây cho biết các mức độ của mục tiêu giáo dục trong lĩnh
vực nhận thức. Giáo dục có thể nhằm vào các mục tiêu rất thấp như giúp người học
nhận biết sự vật hiện tượng cho đến đánh giá tức là có năng lực phán xét, phê phán...
Bảng 1.1. Bảng tóm tắt các mức nhận thức theo quan niệm của Bloom
Các mức
Đánh giá

Nội dung của các mức
Phán xét, phê phán, so sánh, phân biệt, biện luận, đưa ra
kết luận, hỗ trợ.

Tổng hợp

Kết hợp, sáng tạo, công thức hoá, thiết kế, sáng tác, xây
dựng, sắp xếp lại, sửa chữa.

Phân tích

Phân biêt, biểu đồ hoá, ước lượng, phân chia, suy luận,
sắp xếp trật tự, chia nhỏ ra.

Áp dụng

Trình diễn, tính toán, giải quyết, điều chỉnh nhỏ, sắp

11

Nhận thức cao


xếp đơn giản, thao tác, liên hệ.
Hiểu

Phân loại, giải thích, tổng hợp lại, biến đổi, dự đoán,
phân biệt sự khác nhau giữa hai sự vật, hiện tượng hay
vấn đề.

Nhận biết

Định dạng, gọi tên, xác định, mô tả, liệt kê, kết nối, lựa
Nhận thức thấp

chọn, phác thảo.

Ngày nay, nhiều nhà khoa học còn đề nghị bổ sung hai mức nhận thức là khả
năng chuyển giao và khả năng sáng tạo. Tuy nhiên, đối với giáo dục Việt Nam thì 6
mức nhận thức trên đủ để đánh giá nhận thức của học sinh [14].
Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập ở
mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người được
đánh giá về chuyên môn liên quan.
1.1.3. Đánh giá kết quả học tập của học sinh
1.1.3.1. Kết quả học tập của học sinh
Có thể được hiểu theo hai cách khác nhau về kết quả học tập của học sinh tuỳ
theo mục đích của việc đánh giá.
• Kết quả học tập được coi là mức độ thành công trong học tập của học sinh,
được xem xét trong mối quan hệ với mục tiêu đã xác định, chuẩn kiến thức
và kĩ năng cần đạt được và thời gian bỏ ra.
• Kết quả học tập cũng được coi là mức độ thành tích đã đạt được của một
học sinh so với các bạn cùng học.
Đánh giá kết quả học tập là quá trình thu thập và xử lí thông tin về trình độ,
khả năng thực hiện mục tiêu học tập của học sinh, về tác động và nguyên nhân của
tình hình đó nhằm tạo cơ sở cho những quyết định sư phạm của giáo viên và nhà
trường, cho bản thân học sinh để họ học tập ngày một tiến bộ hơn.
1.1.3.2. Mục đích của việc đánh giá kết quả học tập
Theo Popham (1999), đánh giá kết quả học tập của học sinh nhằm các mục
đích sau:
Đối với giáo viên:
- Dự đoán những điểm mạnh và điểm yếu của học sinh nhằm để giáo viên có
cơ hội giúp học sinh khắc phục những yếu kém của họ và tránh giảng dạy lại hoặc
giảng dạy quá kỹ những điều học sinh đã biết.

12


- Giám sát quá trình tiến bộ của học sinh và giúp giáo viên thấy được sự tiến
bộ đó có tương xứng với mục tiêu đề ra hay không.
- Giúp giáo viên có cơ sở cho điểm hay xếp loại học sinh.
Đối với học sinh:
- Làm cho học sinh hiểu rõ mục tiêu cụ thể của việc học tập.
- Giúp học sinh phát huy điểm mạnh và khắc phục những điểm yếu.
- Phát huy tính tích cực trong học tập.
Đối với nhà quản lý:
- Xác định tính hiệu quả của chương trình học tập và cung cấp thông tin phản
hồi cho nhà quản lý và những người thiết kế chương trình.
- Khẳng định với xã hội về chất lượng hiệu quả giáo dục.
- Hỗ trợ việc đánh giá giáo viên thông qua kết quả giảng dạy [29].
1.1.3.3. Cơ sở của việc đánh giá kết quả học tập
Đánh giá kết quả học tập là quá trình đo lường mức độ đạt được của học sinh
về các mục tiêu và nhiệm vụ của quá trình dạy học, là mô tả một cách định tính và
định lượng: tính đầy đủ, tính đúng đắn, tính chính xác, tính vững chắc của kiến thức,
mối liên hệ của kiến thức với đời sống, các khả năng vận dụng kiến thức vào thực
tiễn, mức độ thông hiểu, khả năng diễn đạt bằng lời nói, bằng văn viết, bằng chính
ngôn ngữ chuyên môn của học sinh v.v và cả thái độ của học sinh trên cơ sở phân
tích các thông tin phản hồi từ việc quan sát, kiểm tra, đánh giá mức độ hoàn thành
nhiệm vụ được giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong muốn đạt
được của môn học.
Quy trình đánh giá gồm những công đoạn sau:
1- Phân tích mục tiêu học tập qua các kiến thức, kĩ năng trang bị cho người
học.
2- Đặt ra các yêu cầu về mức độ đạt được các kiến thức, kĩ năng dựa trên
những dấu hiệu có thể đo lường hoặc quan sát được.
3- Tiến hành đo lường các dấu hiệu đó để đánh giá mức độ đạt được về các
yêu cầu đặt ra, biểu thị bằng điểm số.
4- Phân tích, so sánh các thông tin nhận được với các yêu cầu đặt ra rồi đánh
giá, xem xét kết quả học tập của học sinh, xem xét mức độ thành công của phương
pháp giảng dạy của giáo viên để từ đó cải tiến, khắc phục những nhược điểm.
Điều quan trọng trong đánh giá là quán triệt nguyên tắc vừa sức, bám sát yêu
cầu của chương trình. Đánh giá kết quả học tập dựa trên tiêu chí của mục tiêu dạy

13


học sẽ nhận những thông tin phản hồi chính xác nhằm bổ sung, hoàn thiện quá trình
dạy học.
1.1.4. Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh
Trắc nghiệm là một loại công cụ đo lường, là phép lượng giá cụ thể mức độ
khả năng thể hiện hành vi của một người nào đó, trong một lĩnh vực nào đó. Theo
tác giả Lâm Quang Thiệp [16], có thể phân chia các phương pháp trắc nghiệm theo
các hình thức sau:
Về cách thực hiện trắc nghiệm, có thể phân chia các phương pháp trắc
nghiệm ra làm ba loại lớn: loại quan sát, loại vấn đáp và loại viết.
- Loại quan sát giúp đánh giá các thao tác, các hành vi, các phản ứng vô thức,
các kỹ năng thực hành và cả một số kỹ năng về nhận thức, chẳng hạn cách giải
quyết vấn đề trong một tình huống đang được nghiên cứu.
- Loại vấn đáp có tác dụng tốt để đánh giá khả năng đáp ứng các câu hỏi được
nêu một cách tự phát trong một tình huống cần kiểm tra, cũng thường được sử dụng
khi sự tương tác giữa người hỏi và người đối thoại là quan trọng, chẳng hạn để xác
định thái độ người đối thoại.
- Loại viết thường được sử dụng nhiều nhất. Trắc nghiệm viết lại được chia
thành hai nhóm chính:
+ Nhóm các câu hỏi tự luận (essay test): Các câu hỏi buộc phải trả lời
theo dạng mở, thí sinh phải tự mình trình bày ý kiến, đưa ra câu trả lời trong một bài
viết để giải quyết vấn đề mà câu hỏi nêu ra.
+ Nhóm các câu hỏi trắc nghiệm khách quan (objective test): Đề thi
thường bao gồm rất nhiều câu hỏi, mỗi câu nêu lên vấn đề và những thông tin cần
thiết để thí sinh có thể lựa chọn câu trả lời cho từng câu một cách ngắn gọn.
Về cách chuẩn bị đề trắc nghiệm, có thể phân chia trắc nghiệm tiêu chuẩn
hoá và trắc nghiệm dùng ở lớp học.
- Trắc nghiệm tiêu chuẩn hoá thường do các chuyên gia trắc nghiệm soạn thảo,
thử nghiệm, tu chỉnh, do đó mỗi câu trắc nghiệm được gắn với các chỉ số cho biết
thuộc tính và chất lượng của nó (độ khó, độ phân biệt, phản ánh nội dung và mức độ
kỹ năng nào), mỗi đề thi trắc nghiệm có gắn với một độ tin cậy xác định, ngoài ra có
những chỉ dẫn cụ thể về cách triển khai trắc nghiệm và giải thích kết quả trắc
nghiệm.
- Trắc nghiệm dùng ở lớp học (hoặc trắc nghiệm do giáo viên soạn) là trắc
nghiệm do giáo viên tự viết để sử dụng trong quá trình giảng dạy, có thể chưa được

14


thử nghiệm và tu chỉnh công phu, thường chỉ sử dụng trong các kỳ kiểm tra với số
lượng học sinh không lớn và không thật quan trọng.
Về việc đảm bảo thời gian để làm trắc nghiệm, có thể phân chia loại trắc
nghiệm theo tốc độ và trắc nghiệm không theo tốc độ.
- Trắc nghiệm theo tốc độ thường hạn chế thời gian, chỉ một ít thí sinh làm
nhanh mới có thể làm hết số câu của bài trắc nghiệm, nhằm đánh giá khả năng làm
nhanh của thí sinh.
- Trắc nghiệm không theo tốc độ thường cung cấp đủ thời gian cho phần lớn
sinh có thể kịp suy nghĩ để làm hết bài trắc nghiệm.
Về phương hướng sử dụng kết quả trắc nghiệm, có thể phân chia ra trắc
nghiệm theo chuẩn (norm-referrenced test) và trắc nghiệm theo tiêu chí (criterionreferrenced test).
- Trắc nghiệm theo chuẩn: là trắc nghiệm được sử dụng để xác định mức độ
thực hiện của một cá nhân nào đó so với các các nhân khác cùng làm một bài trắc
nghiệm.
- Trắc nghiệm theo tiêu chí: là trắc nghiệm được sử dụng để xác định mức độ
thực hiện của một cá nhân nào đó so với tiêu chí xác định cho trước.
1.1.5. Công cụ đo lường kết quả học tập
1.1.5.1. Phân loại công cụ đo
Các nhà giáo dục phân chia câu hỏi kiểm tra thành hai dạng:
- Dạng câu hỏi yêu cầu lựa chọn câu trả lời có sẵn gọi là câu hỏi TNKQ,
thường gọi tắt là câu hỏi trắc nghiệm. TNKQ là phương pháp kiểm tra đánh giá kết
quả học tập của học sinh bằng hệ thống câu hỏi TNKQ, gọi là “khách quan” vì cách
cho điểm khách quan không phụ thuộc vào người chấm. Đề thi sử dụng toàn câu hỏi
TNKQ được gọi là đề TNKQ hoặc gọi tắt là đề trắc nghiệm.
- Dạng câu hỏi yêu cầu trả lời theo cấu trúc, câu trả lời không có sẵn thí sinh
phải viết câu trả lời gọi là câu hỏi trắc nghiệm tự luận, thường gọi tắt là câu hỏi tự
luận. Trắc nghiệm tự luận là phương pháp đánh giá kết quả học tập bằng việc sử
dụng công cụ đo lường là các câu hỏi đóng hoặc mở, học sinh trả lời dưới dạng bài
viết bằng chính ngôn ngữ của học sinh trong một khoảng thời gian đã định trước. Đề
thi sử dụng toàn câu hỏi tự luận được gọi là đề trắc nghiệm tự luận hay gọi tắt là đề
TL.
Trong thực tế ngoài việc sử dụng đề TNKQ và đề TL, người ta còn sử dụng
dạng đề hỗn hợp gồm cả câu hỏi TNKQ và câu hỏi tự luận.

15


Tuỳ theo mục đích sử dụng mà các câu hỏi cũng được phân chia thành hai
nhóm:
- Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kiến thức.
- Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kỹ năng [14].
Bảng 1.2. Bảng phân loại câu hỏi trắc nghiệm dùng để đo lường và
đánh giá trong giáo dục
Dạng câu hỏi TNKQ
Câu hỏi nhằm

Dạng câu hỏi TL

1. Nhiều lựa chọn.

1. Điền câu trả lời:

2. Ghép đôi.

+ Tự luận trả lời ngắn.

mục đích đo lường, 3. Lựa chọn đúng sai.

+ Tự luận trả lời dài.

4. Bộ câu hỏi dựa vào hoàn

2. Tự luận miệng.

cảnh cụ thể.

3. Tự luận làm ở nhà.

Câu hỏi nhằm

Bộ câu hỏi dựa vào hoàn

Câu hỏi yêu cầu thao tác hay

mục đích đo lường,

cảnh cụ thể.

trình diễn.

đánh giá kiến thức

đánh giá kỹ năng

1.1.5.2. So sánh phương pháp trắc nghiệm khách quan và tự luận
Cả hai phương pháp, TNKQ và TL, đều là những phương pháp hữu hiệu để
đánh giá kết quả học tập. Cần nắm vững bản chất từng phương pháp và công nghệ
triển khai cụ thể để có thể sử dụng mỗi phương pháp đúng lúc, đúng chỗ [14].
Bảng 1.3. So sánh phương pháp TNKQ và TL
Đề thi TNKQ

Đề thi TL

Hình thức

- Một bộ câu hỏi trong đó mỗi câu

- Một bộ câu hỏi trong đó mỗi câu

câu hỏi / đề

hỏi đều kèm theo các phương án trả

hỏi không kèm theo các phương án

thi

lời cho sẵn để học sinh lựa chọn

trả lời mà học sinh phải tự luận để

phương án trả lời.

đưa ra câu trả lời.

- Khó soạn câu hỏi.

- Dễ soạn câu hỏi.

- Dễ sai về diễn đạt, nội dung câu hỏi - Ít bị sai sót về diễn đạt, nội dung
Mức độ

thiếu chính xác (vì có nhiều câu hỏi

rõ ràng.

phức tạp khi nên khó rà soát).
viết câu hỏi

- Dễ chuẩn bị đáp án, hướng dẫn

và tổ hợp đề chấm.

- Khó xây dựng đáp án, hướng dẫn
chấm, xây dựng đáp án phức tạp.

16


- Có nhiều câu hỏi nên khó nhớ, dễ

- Khó bảo mật đề thi do có ít câu

bảo mật.

hỏi.

- Tốn ít thời gian làm bài, đề kiểm

- Phải dành nhiều thời gian cho học

tra có thể phủ toàn bộ chương trình.

sinh làm bài, khó kiểm tra toàn bộ

Mức độ

chương trình.

phức tạp khi - Tốn nhiều thời gian cho việc in ấn,

- Không tốn nhiều công sức in ấn

tổ chức thi-

nhân đề.

đề.

kiểm tra

- Học sinh khó sử dụng tài liệu, loại

- Học sinh dễ quay cóp sử dụng tài

trừ tiêu cực trong thi cử.

liệu, tiêu cực trong thi cử.

Vấn đề đoán - Học sinh có thể đoán mò.

- Học sinh không đoán được câu

mò phương

trả lời đúng.

án trả lời
đúng
- Độ tin cậy cao hơn.

- Độ tin cậy thấp.

- Có thể đánh giá đầy đủ các mức

- Dễ đánh giá được các mức nhận

nhận thức nếu các câu hỏi được soạn

thức cao (phân tích, tổng hợp, đánh

Tính giá trị

kỹ.

giá).

của đề thi

- Bao quát toàn bộ chương trình nên

- Không bao quát toàn bộ chương

đánh giá chính xác hơn, có thể có độ

trình nên độ giá trị có thể không

giá trị cao hơn.

cao.

Độ tin cậy
của đề thi

Sự phức tạp - Chấm điểm khách quan, công bằng. - Chấm điểm phụ thuộc vào ý chủ
quan của người chấm.

của việc
chấm điểm
Mức độ

- Có nhiều phần mềm để phân tích,

phức tạp khi đánh giá câu hỏi, lựa chọn những câu
phân tích,

hỏi có chất lượng.

đánh giá
câu hỏi thi

17

- Khó phân tích, đánh giá câu hỏi.


1.1.6. Yêu cầu của công cụ đo lường và đánh giá trong giáo dục
Các đề thi-kiểm tra là công cụ để đo lường thành quả học tập của học sinh.
Theo Gronlund (1998) và Linn & Gronlund (1995), bộ công cụ để đo lường đánh
giá trong giáo dục cần phải đảm bảo các yêu cầu sau:
- Có các khái niệm rõ ràng về các kết quả học tập dự định đánh giá (mong
muốn học sinh đạt được mức kiến thức kỹ năng nào, phân bậc các kiến thức
và kỹ năng đó, các tiêu chí đánh giá).
- Đề thi-kiểm tra đáp ứng được mục tiêu của kỳ thi-kiểm tra.
- Sử dụng các dạng thức thi-kiểm tra khác nhau để loại trừ được nhược điểm
của từng dạng thức.
- Dạng thức thi-kiểm tra phải phù hợp với các kết quả học tập dự định đo
lường, với các thông tin dự định phản hồi với học sinh.
- Có số lượng câu hỏi – bài tập thích hợp để đánh giá đầy đủ và chính xác
nhận thức của học sinh.
- Quy trình thi-kiểm tra phải công bằng với học sinh.
- Có các tiêu chí cụ thể để phân tích, lý giải các kết quả đạt được của học sinh.
- Có thông tin phản hồi kịp thời cho học sinh, nhấn mạnh những điểm mạnh
cần phát huy và điểm yếu cần khắc phục.
- Kết quả đo lường phải hỗ trợ cho việc chấm điểm (đối với người học) và hỗ
trợ hệ thống báo cáo của nhà trường.
1.1.7. Đánh giá câu hỏi trắc nghiệm khách quan
1.1.7.1. Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan
Để có thể đo được chính xác kết quả học tập của học sinh thì cần phải có bộ
công cụ đo lường - các đề thi đảm bảo độ tin cậy và có tính giá trị, điều đó chỉ có thể
thực hiện được khi các câu hỏi trắc nghiệm được thiết kế, thử nghiệm và đánh giá
bằng khoa học đo lường. Đánh giá câu hỏi trắc nghiệm dựa trên các tiêu chí sau:
- Mục đích chính của kỳ thi - kiểm tra và mục tiêu kiểm tra của từng câu hỏi
cần được xác định rõ.
- Mỗi câu hỏi phải nhằm đạt được mục đích chính của kỳ thi - kiểm tra.
- Dạng thức của câu hỏi phải phù hợp với kỳ thi - kiểm tra.
- Mỗi câu hỏi phải đảm bảo tính đồng nhất (sự ổn định) và tính độc lập cục bộ
(độ phân biệt).
- Các câu hỏi phải được diễn đạt rõ ràng, đúng chính tả.
- Mỗi câu hỏi phải đảm bảo tính hợp pháp và phù hợp với văn hoá, đạo đức.

18


1.1.7.2. Phân tích câu hỏi trắc nghiệm khách quan
Phân tích câu hỏi thi là một quá trình xem xét chúng một cách kỹ lưỡng có
phê phán. Phân tích câu hỏi thi nhằm làm tăng chất lượng của chúng, loại bỏ những
câu quá tồi, sửa chữa những câu hỏi có thể sửa được và giữ lại những câu đáp ứng
yêu cầu.
Phân tích câu hỏi thi có thể thực hiện theo hai phương pháp: phương pháp
chuyên gia và phương pháp định lượng (phân tích số liệu) [14].
Một số thống kê có thể chỉ ra những thuộc tính của câu hỏi thi, qua đó chúng
ta biết được câu hỏi tốt và chưa tốt. Các nhà nghiên cứu (Crocker & Algina, 1986)
đã phân loại các chỉ số thường được sử dụng trong phân tích định lượng như sau:
1- Những chỉ số mô tả sự phân bố trả lời của các thí sinh về một câu hỏi cụ
thể (trung bình cộng và phương sai).
2- Những chỉ số mô tả mức độ của mối quan hệ giữa sự trả lời của học sinh
về một câu hỏi và những tiêu chí cụ thể đang được quan tâm.
3- Những chỉ số liên quan đến phương sai của câu hỏi thi kiểm tra và mối
liên hệ với những tiêu chí cụ thể.
Một thống kê thường được sử dụng để mô tả các thông số trên câu hỏi thi
kiểm tra là giá trị p (độ khó của câu hỏi), phương sai, một số chỉ số phân biệt như hệ
số tương quan poin-biserial, hệ số tương quan biserial, hệ số tương quan phi. Mỗi
chỉ số thống kê này đều quan trọng với những mục tiêu cụ thể khi phân tích câu hỏi
thi kiểm tra.
Trong những bài kiểm tra TNKQ dùng trong lớp học, giáo viên thường quan
tâm đánh giá câu hỏi qua hai đại lượng độ khó và độ phân biệt của câu trắc nghiệm.
Khi soạn xong một câu hoặc một bài trắc nghiệm người soạn chỉ có thể ước lượng
độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có
thể tính được cụ thể bằng phương pháp thống kê sau lần trắc nghiệm thử trên một
mẫu thí sinh, dựa vào kết quả thu được từ các câu trắc nghiệm và bài làm của thí
sinh.
Để xác định độ khó, độ phân biệt thường được tiến hành như sau: chia mẫu
học sinh tham gia làm bài kiểm tra thành 3 nhóm :
+ Nhóm điểm cao H: Từ 25% đến 27% số học sinh đạt điểm cao nhất.
+ Nhóm điểm thấp L: Từ 25% đến 27% số học sinh đạt điểm thấp nhất.
+ Nhóm điểm trung bình M: Từ 46% đến 50% số học sinh còn lại.

19


Tuy nhiên, nếu trong lớp học với số lượng học sinh không đông, có thể chỉ
chia thành hai nhóm: nhóm điểm thấp (50%) và nhóm điểm cao (50%).
Thống kê độ khó:
Độ khó của câu hỏi (giá trị p) bằng tỷ số phần trăm thí sinh làm đúng câu trắc
nghiệm đó trên tổng số thí sinh tham gia trả lời câu hỏi.
p=

NH + NM + NL
× 100(%)
N

Trong đó:
N: tổng số học sinh tham gia làm bài kiểm tra
NH: tổng số học sinh ở nhóm giỏi trả lời đúng câu hỏi.
NL: tổng số học sinh ở nhóm kém trả lời đúng câu hỏi.
NM : tổng số học sinh ở nhóm trung bình trả lời đúng câu hỏi.
Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số p
với 0,25 ≤ p ≤ 0,75 đối với các bài trắc nghiệm dùng trong lớp học.
Thống kê độ phân biệt:
Khi ra một câu hoặc một bài trắc nghiệm cho một nhóm thí sinh nào đó,
người ta thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau
(giỏi, trung bình, kém v.v), khả năng của câu trắc nghiệm thực hiện được sự phân
biệt ấy được gọi là độ phân biệt.
Độ phân biệt của một câu hỏi được tính bằng công thức:
D=

NH − NL
N

D: độ phân biệt. ( -1 ≤ D ≤ 1)
Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số
phân biệt D với 0,25 ≤ D ≤ 0,75, tuy nhiên cũng có thể xem xét các câu hỏi có
D ≥ 0,2.
Độ phân biệt của một câu liên quan đến độ khó. Thật vậy, nếu một câu trắc
nghiệm dễ đến mức mọi thí sinh đều làm tốt, thì độ phân biệt của nó rất kém, vì mọi
thí sinh đều có phản ứng như nhau đối với câu trắc nghiệm đó. Cũng vậy, nếu một
câu trắc nghiệm khó đến mức mọi thí sinh đều làm không được, các điểm số đạt
được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Muốn có độ
phân biệt tốt thì câu trắc nghiệm nên có độ khó ở mức trung bình.

20


1.1.8. Đánh giá bài trắc nghiệm khách quan
Hai đại lượng đặc trưng rất quan trọng để đánh giá chất lượng bài trắc
nghiệm đó là độ tin cậy và độ giá trị của bài trắc nghiệm.
Độ tin cậy:
Trắc nghiệm là một phép đo mà thước đo là bài trắc nghiệm dùng để đo lường
một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng
biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm [6].
Các phương pháp ước lượng độ tin cậy là: phương pháp thi hai lần; dùng các
bài trắc nghiệm tương đương; phương pháp dùng phép tính phương sai; phương
pháp phân đôi bài trắc nghiệm; phương pháp Kuder – Richardson [6].
Độ giá trị:
Yêu cầu quan trọng nhất của bài trắc nghiệm với tư cách là một phép đo
lường trong giáo dục là phép đo ấy đo được cái cần đo. Nói cách khác, phép đo ấy
cần phải đạt được mục tiêu đề ra cho nó. Độ giá trị của bài trắc nghiệm là đại lượng
biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài trắc nghiệm.
Các loại tính chất giá trị: giá trị tiên đoán; giá trị so với tiêu chí cho sẵn; giá
trị nội dung.
Để bài trắc nghiệm có độ giá trị cao, cần phải xác định tỉ mỉ mục tiêu cần đo
qua bài trắc nghiệm và bám sát mục tiêu đó trong quá trình xây dựng ngân hàng câu
hỏi trắc nghiệm cũng như khi tổ chức triển khai kỳ thi. Nếu thực hiện các quá trình
nói trên không đúng thì có khả năng kết quả của phép đo sẽ phản ánh một cái gì
khác chứ không phải cái mà ta muốn đo nhờ bài trắc nghiệm.
Qua định nghĩa về độ tin cậy và độ giá trị ta có thể thấy rõ mối tương quan
giữa chúng. Khi bài trắc nghiệm không có độ thi cậy, tức là phép đo nhờ bài trắc
nghiệm rất kém chính xác, thì chúng ta không thể nói đến độ giá trị của nó. Nói cách
khác, khi bài trắc nghiệm không có độ tin cậy thì nó cũng không thể có độ giá trị.
Đôi khi phép đo nhờ bài trắc nghiệm có thể đo chính xác, nhưng nó đo một cái gì
khác chứ không phải cái nó cần đo, trong trường hợp đó thì bài trắc nghiệm có độ
tin cậy cao nhưng độ giá trị rất thấp [16].
1.1.9. Lý thuyết khảo thí hiện đại
Người ta thường phân chia lý thuyết trắc nghiệm ra làm hai loại, lý thuyết
khảo thí cổ điển và lý thuyết khảo thí hiện đại với việc sử dụng lý thuyết hồi đáp
IRT (viết tắt của Item Response Theory). Trong luận văn này, ta quan tâm đến các
vấn đề về lý thuyết khảo thí hiện đại. Lý thuyết hồi đáp được xây dựng trên khoa

21


học về xác suất và thống kê. Các công trình quan trọng của lý thuyết này ra đời vào
3 thập niên cuối của thế kỷ vừa qua và đạt được nhiều thành tựu quan trọng, được
công nhận và áp dụng phổ biến trong thực tiễn. IRT đã đạt những thành tựu quan
trọng nâng cao độ chính xác của trắc nghiệm
Lý thuyết hồi đáp bao gồm một hệ thống các định đề liên quan đến từng cá
nhân trả lời câu hỏi:
1- Đại lượng cần đo được hình dung như một đường nào đó (thẳng hoặc cong) và
kết quả đo lường được mô tả như một điểm đặt trên đường đó. Do đó, đại lượng cần
đo được giả thiết là phân bố liên tục. Tuy nhiên, chưa có một dạng phân bố cụ thể
nào được chỉ ra.
2- Điều kiện cốt yếu để thí sinh trả lời được câu hỏi được xem xét qua hai đại lượng:
- Năng lực của thí sinh (tham biến năng lực hay tham biến thí sinh).
- Độ khó của câu hỏi (tham biến độ khó hay tham biến câu hỏi).
Năng lực của thí sinh và độ khó của câu hỏi là những đại lượng được phân bố
trên đường đặc trưng có tính liên tục bao gồm các giá trị của đại lượng cần đo.
Thông thường, với các câu hỏi được sử dụng để định cỡ, thì độ khó của các câu hỏi
giữ vai trò thang giá trị thể hiện dọc theo đường đặc trưng của đại lượng cần đo.
3- Lý thuyết hồi đáp quan tâm đến xác suất trả lời đúng đối với một câu hỏi. Xác
suất đó được thể hiện là một hàm số của năng lực thí sinh và độ khó câu hỏi và có
thể có thêm một số tham biến khác (ví dụ: mức độ đoán mò).
Những hàm số xác suất khác nhau (thể hiện mối quan hệ giữa năng lực thí
sinh và độ khó câu hỏi) dẫn đến những mô hình lý thuyết hồi đáp khác nhau, ví dụ:
mô hình logistic đơn giản – mô hình Rasch một thông số, mô hình Rasch hai thông
số, mô hình Rasch ba thông số, mô hình Partial credit.
4- Xác suất trả lời đúng một câu hỏi được biểu thị bằng một hàm số liên quan đến
năng lực của thí sinh θ là hàm P( θ ) – một đường cong đặc trưng của câu hỏi (Item
Characteristic Curves - ICC).
- Đường cong đi lên khi θ tăng (năng lực của thí sinh θ tăng thì xác
suất trả lời đúng P( θ ) tăng).
- Đường cong nằm giữa hai đường thẳng y=0 và y=1.
- Đường cong nhận hai đường thẳng y=0 và y=1 làm tiệm cận ngang.
P( θ ) tiến đến 0 khi θ → - ∞ và P( θ ) tiến đến 1 khi θ → + ∞
5- Xác suất biểu thị hàm số độ khó câu hỏi cho đường cong đặc trưng thí sinh là
P( δ ) (Person Characteristic Curves - PCC).

22


6- Ở trên đã giả thiết xác suất trả lời là một hàm số đặc trưng đơn giản cho năng lực
thí sinh. Để IRT có thể áp dụng được với các bài test, các câu hỏi phải là các đơn
thứ nguyên (unidimensional).
7- Nếu năng lực θ của thí sinh i đã được xác định, khi đó sự hiểu biết của thí sinh i
để trả lời câu hỏi j không ảnh hưởng đến khả năng có được câu trả lời đúng đối với
câu hỏi khác.
P[ xij = 1 | θ , xik = 1 ] = P[ xij = 1 | θ ]
Nếu điều đó sai, nghĩa là câu trả lời đối với câu hỏi j phụ thuộc vào điều gì
đó ngoài năng lực θ . Sự không phụ thuộc này được gọi là sự độc lập cục bộ hay sự
độc lập có điều kiện, và là kết quả của tính đơn thứ nguyên. Điều đó có nghĩa là:

P[ xij = 1, i=1,2,…,I | θ ] =

I

∏ P[ x

ij

= 1|θ ]

i =1

8- Hầu hết các mô hình lý thuyết hồi đáp sử dụng xác suất như một hàm số của sự
khác nhau giữa tham số năng lực θ và tham số độ khó δ , tức là
θ - δ . Trong mô hình logistic đơn giản (mô hình Rasch):

Xác suất để thí sinh i trả lời đúng câu j là:
exp(θ − δ )
P[ xij = 1 | θ ] =
1 + exp(θ − δ )
9- Các kết quả làm bài của thí sinh (kết quả trả lời câu hỏi) có được sau khi tổ chức
làm một bài kiểm tra được sử dụng để tính tham biến năng lực và độ khó. Phương
pháp sử dụng để tính các tham biến đó là phương pháp có khả năng tối đa
(Maximum likelihood).
10- Sự tính toán đã cố định những vị trí tương đối của các tham số, nhưng đó không
phải là những vị trí thực
( θ - δ ) = ( θ + c ) – ( δ + c)
Sai số của sự tính toán này có thể tính được.
So với lý thuyết khảo thí cổ điển, lý thuyết khảo thí hiện đại với IRT có
những ưu việt quan trọng. Trong lý thuyết trắc nghiệm cổ điển, độ khó và độ phân
biệt của các câu hỏi tính được sẽ phụ thuộc vào mẫu thí sinh được chọn để thử
nghiệm, và năng lực xác định được của thí sinh phụ thuộc vào đề trắc nghiệm mà thí
sinh làm [14].
Với IRT, các tham số đặc trưng của câu hỏi (liên quan đến độ khó, độ phân
biệt, mức độ đoán mò) không phụ thuộc mẫu thử để định cỡ câu hỏi (sample-free)

23


và năng lực đo được của thí sinh không phụ thuộc vào bài trắc nghiệm cụ thể (itemfree) được lấy từ NHCH đã được định cỡ.
Theo IRT, mỗi câu hỏi có các thuộc tính đặc trưng cho nó, và mỗi thí sinh ở
một trình độ nào đó có một năng lực tiềm ẩn xác định, các thuộc tính và đặc trưng
này không phụ thuộc vào phép đo, hoặc nói cách khác, chúng là các bất biến
(invariance).
IRT cho phép tính các hàm thông tin của từng câu hỏi và của cả đề trắc
nghiệm và sai số chuẩn của phép đo theo các mức năng lực tiềm ẩn chứ không phải
một sai số chuẩn trung bình chung cho cả phép đo như trắc nghiệm cổ điển. Từ đó
có thể thiết kế một đề trắc nghiệm cho phép đo chính xác khoảng năng lực nào mà ta
mong muốn.
Hơn nữa, IRT cho phép thiết kế các đề trắc nghiệm với mức độ tương đương
rất cao để đảm bảo các đề trắc nghiệm khác nhau có thể cho cùng một kết quả như
nhau khi đánh giá năng lực của một thí sinh nào đó.
Áp dụng lý thuyết khảo thí hiện đại, ứng dụng công nghệ thông tin, hiện nay
có rất nhiều các phần mềm toán học có thể giúp ta nhanh chóng phân tích câu hỏi
trắc nghiệm. Hiện nay chúng ta thường sử dụng phần mềm Quest (phiên bản mới có
tên ConQuest) được soạn thảo ở Úc. Phần mềm này có thể tính toán cho ra kết quả
về độ khó, độ phân biệt của câu trắc nghiệm và khả năng của người làm trắc
nghiệm, phân tích sự phù hợp của câu trắc nghiệm và của người làm trắc nghiệm,
đồng thời cũng có thể chỉ ra kết quả bất thường của người làm câu trắc nghiệm nếu
có. Hiện nay ở Việt Nam có chương trình VITESTA là một chương trình hỗ trợ
phương pháp trắc nghiệm được phát triển bởi Công ty trách nhiệm hữu hạn
EDTECHDP. Đây là một chương trình phân tích đánh giá câu hỏi thi, soạn đề thi,
chấm thi trắc nghiệm v.v được xây dựng dựa trên lý thuyết hồi đáp IRT.
Các thành tựu quan trọng đó của IRT đã nâng độ chính xác của phép đo
lường trong giáo dục lên một tầm cao mới về chất so với các lý thuyết đo lường cổ
điển. Từ thành tựu tổng quát đó của IRT, người ta có thể đưa ra các quy trình để xây
dựng NHCH (item banking), phân tích các kết quả TNKQ để hiệu chỉnh NHCH, chủ
động thiết kế các đề trắc nghiệm theo các mục đích đặt ra [16].
1.1.10. Ngân hàng câu hỏi trắc nghiệm khách quan
Ngân hàng câu hỏi TNKQ là một tập hợp các câu hỏi TNKQ và đáp án. Nó
sẽ là một công cụ để đổi mới phương pháp dạy học, kiểm tra đánh giá và quản lý
chất lượng đào tạo.

24


- Trong giảng dạy: giáo viên căn cứ vào NHCH để thực hiện phương pháp
dạy học tích cực trong quá trình dạy thu thập thông tin, dạy năng lực xử lý thông tin
và năng lực giải quyết vấn đề.
- Trong học tập: giúp học sinh xác định kiến thức chuẩn môn học mình cần
phải nắm; giúp học sinh tự học và tự kiểm tra nhận thức của mình, mở rộng kiến
thức qua các tài liệu tham khảo khác nhau; giúp học sinh có thể học nhóm, trao đổi
thảo luận trên cơ sở các câu hỏi có sẵn trong ngân hàng.
- Trong kiểm tra đánh giá: sử dụng ngân hàng câu hỏi TNKQ có sẵn giúp tiện
lợi cho việc ra đề thi kiểm tra; hạn chế tiêu cực trong thi cử.
- Sử dụng ngân hàng câu hỏi TNKQ cũng là giải pháp đa dạng hoá các loại
hình đào tạo (tại chức, từ xa, e-learning v.v), nhằm mở rộng quy mô đào tạo mà vẫn
giữ vững và từng bước nâng cao chất lượng đào tạo [12].
1.1.11. Quy trình thiết kế câu hỏi trắc nghiệm khách quan
Bước 1: Xác định mục đích sử dụng đề thi-kiểm tra
- Sử dụng vào việc theo dõi, giám sát kết quả học tập.
- Để phân loại học sinh.
- Để tuyển sinh v.v.
Bước 2: Xác định cấu trúc đo
- Cấu trúc kết quả học tập.
- Cấu trúc năng lực.
Bước 3: Chọn mẫu
- Đánh giá tất cả học sinh.
- Đánh giá một mẫu đại diện (kỹ thuật chọn mẫu: ngẫu nhiên đơn giản, phân
nhóm, phân tầng v.v).
Bước 4: Xác định nội dung chi tiết của bài thi-kiểm tra
STT

Các nội dung
cần đánh giá

Biết

Vận
dụng

Hiểu

1
2
...

25

Phân
tích

Tổng
hợp

Đánh
giá


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×