Vì sao điểm thi TSA phản ánh chính xác năng lực tư duy của thí sinh?

Thứ tư - 25/03/2026 05:26
Vì sao điểm thi TSA phản ánh chính xác năng lực tư duy của thí sinh?
Sau khi công bố kết quả đợt 2 kỳ thi Đánh giá tư duy (TSA) 2026, PGS. Vũ Duy Hải - Trưởng Ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội - đã chia sẻ bài viết giải mã quy trình 4 bước chấm điểm hiện đại, làm rõ cách thức mà độ khó và độ phân biệt của từng câu hỏi trở thành "thước đo" quyết định kết quả cuối cùng. Đây là bước tiến quan trọng giúp TSA tiệm cận với các chuẩn mực khảo thí quốc tế như SAT hay ACT, đồng thời đảm bảo tính công bằng và tin cậy tuyệt đối cho mọi thí sinh qua các đợt thi khác nhau.

Mục tiêu của Kỳ thi TSA


Với mong muốn mang Kỳ thi Đánh giá tư duy của các nước phát triển trên thế giới về với học sinh Việt Nam, từ năm 2020, Đại học Bách khoa Hà Nội đã tiến hành nghiên cứu, thiết kế và triển khai tổ chức Kỳ thi Đánh giá tư duy (TSA - Thinking Skills Assessment) để mở rộng các phương thức tuyển sinh đại học.

Mục tiêu của bài thi là đánh giá năng lực tư duy tổng quát của thí sinh, được thể hiện qua ba nội dung về tư duy toán học, tư  duy đọc hiểu và tư duy khoa học/giải quyết vấn đề để có thể lựa chọn được những sinh viên có thể học tập tốt nhất tại môi trường giáo dục đại học, đặc biệt trong các lĩnh vực khoa học kỹ thuật, công nghệ, kinh tế, tài chính, ngân hàng, thương mại... và tiệm cận với các kỳ thi đánh giá tư duy hiện đại trên thế giới, như SAT hay ACT.
 
z7656471447504 61e9f6017d1d8da5b8511947b0bf3aca
PGS. Vũ Duy Hải - Trưởng Ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội
Phương pháp chấm điểm trong TSA

Từ trước đến nay, hầu hết các kỳ đánh giá tại Việt Nam, trong đó có các kỳ thi quan trọng đều sử dụng điểm thô để làm kết quả đánh giá cuối cùng. Theo lý thuyết trắc nghiệm cổ điển, điểm thô của một bài thi là tổng điểm của các câu hỏi trong đề thi đó.

Ví dụ như với đề kiểm tra có 100 câu hỏi, và mỗi câu hỏi trả lời đúng đạt được 1 điểm thì nếu thí sinh làm đúng được 70 câu, thí sinh đó sẽ được 70 điểm.

Một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của các thí sinh có cùng điểm thô khi làm cùng một đề thi ở cùng một thời điểm. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở cùng một thời điểm.

Ví dụ, trong một đợt thi, các thí sinh làm đúng 70 câu hỏi bất kì sẽ có cùng điểm thô là 70 điểm. Trong thực tế, các thí sinh này có thể trả lời đúng tập hợp các câu hỏi khác nhau và độ khó của các câu hỏi này trong đề thi cũng khác nhau. Vì vậy, 70 điểm không phản ánh đúng năng lực của các thí sinh này.

Để giải quyết vấn đề này, các kì thi quan trọng ở các nước trên thế giới, đặc biệt là sử dụng trong công tác tuyển sinh đã sử dụng các lý thuyết đo lường giáo dục hiện đại hơn để có thể ước lượng được năng lực của thí sinh một cách chính xác và tin cậy. Một trong số chúng là mô hình lý thuyết ứng đáp câu hỏi IRT (Item Response Theory). Mô hình lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề kiểm tra có một mức năng lực nhất định và thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kì cao hơn so với thí sinh có năng lực thấp.

Dựa vào mô hình lý thuyết này, có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi cũng như năng lực của thí sinh. Các yếu tố này độc lập với nhau và điều này có nghĩa là các tham số là đặc trưng của câu hỏi, không phụ thuộc vào mẫu thí sinh trả lời câu hỏi đó và ngược lại, năng lực của thí sinh là bất biến đối với các câu hỏi mà các em trả lời. Do đó, việc ước lượng năng lực của thí sinh sẽ tin cậy hơn so với cách tính bằng điểm thô.

Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết IRT 2 tham số (độ khó và độ phân biệt) này trong việc chấm điểm bài thi TSA cho thí sinh.

Hiểu một cách đơn giản, với việc chấm thi theo mô hình lý thuyết IRT 2 tham số, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp. Điều này dẫn đến việc các thí sinh có thể có điểm thô giống nhau hay nói cách khác là trả lời đúng được số câu hỏi như nhau nhưng sẽ đạt được điểm TSA khác nhau.

Tuy nhiên để đảm bảo yếu tố chính xác và công bằng giữa các đợt thi khác nhau, thuật toán chấm điểm theo mô hình lý thuyết IRT 2 tham số được thực hiện theo nhiều công đoạn, xử lý trên dữ liệu thi chung trước đó để ước lượng các tham số, sau đó mới tính toán ra điểm số TSA cho từng thí sinh.

image 20260325163348 1
Quy trình 4 bước chấm điểm IRT hai tham số trong TSA

Bước 1
: Căn cứ theo kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ thực hiện ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.

Bước 2: Phần mềm chấm thi thực hiện ước lượng điểm năng lực tư duy của từng thí sinh dựa theo kết quả làm bài thi và thang đo của đề thi hiện tại.

Bước 3: Phần mềm chấm thi thực hiện quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước để đưa điểm năng lực tư duy của thí sinh về cùng một thang đo.

Bước 4: Phần mềm chấm thi thực hiện quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA.
z7657115017040 9c5e110684bf17da379e781552c329e4

Như vậy, với quy trình chấm điểm IRT hai tham số như trên, điểm TSA không chỉ được xác định từ số câu trả lời đúng của thí sinh, mà là từ toàn bộ kết quả trả lời của thí sinh đó trên bài thi. Kết quả này trước hết được tính trên thang đo của cùng kíp thi, sau đó được quy đổi về thang tham chiếu chung với các đợt thi trước để tạo sự công bằng. Trên cơ sở đó, phần mềm chấm thi sẽ ước lượng điểm năng lực tư duy của từng thí sinh, sau đó thực hiện cân bằng điểm năng lực này về thang chung giữa các đợt thi. Cuối cùng là thực hiện quy đổi sang điểm TSA tương ứng cho thí sinh.

Chính vì vậy, điểm TSA không phải được tính bằng cách cộng điểm của từng câu hỏi thi, mà là kết quả của quá trình ước lượng năng lực tư duy từ toàn bộ bài thi của thí sinh. Theo đó, nếu thí sinh làm đúng nhiều câu hỏi ở dải khó và có độ phân biệt cao thì điểm năng lực tư duy của thí sinh được ước lượng sẽ cao và điểm TSA cũng sẽ cao.

Ngược lại, nếu thí sinh chủ yếu làm đúng các câu dễ và trung bình thì điểm TSA sẽ thấp. Bên cạnh đó, với phương pháp chấm này, điểm TSA không phải là điểm thô bị cộng thêm hoặc trừ bớt đi, và cũng không phụ thuộc vào điểm số của thí sinh đạt mức cao nhất trong đợt thi.
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây