Hệ số tải nhân tố nội bộ lên nhân tố g của Bài kiểm tra IQ Quốc tế
Xuất bản bởi: International IQ Test
Cập nhật lần cuối:
Đối với một bài kiểm tra IQ được xây dựng theo mô hình
Ma trận tiến triển của Raven,
nhân tố g là một chỉ báo hữu ích về tính giá trị cấu trúc nội tại.
Nói cách khác, nó giúp xác định liệu thuật toán chấm điểm của bài test có tạo ra một điểm IQ thực sự phản ánh một năng lực nhận thức chung, đơn nhất hay không—thể hiện qua cách người tham gia phản hồi các mục.
Dữ liệu được phân tích
Chúng tôi thực hiện cùng một phân tích trên hai mẫu độc lập từ
International IQ Test, theo các tiêu chí dưới đây:
- Khoảng thời gian lấy mẫu
- 2024: 01/01/2024 đến 01/01/2025
- 2025: 01/01/2025 đến 01/01/2026
- Bộ lọc chống bot nội bộ
- Mỗi người tham gia sử dụng một địa chỉ email duy nhất
- 50,000 người tham gia mỗi năm
Phương pháp
- Chúng tôi chuyển đổi câu trả lời của mỗi người tham gia thành 40 biến nhị phân (0 = sai, 1 = đúng).
-
Chúng tôi ước lượng điểm g của từng cá nhân trực tiếp từ phản hồi các mục bằng cách trích xuất thành phần chính thứ nhất
(PC1) từ ma trận phản hồi gồm 40 mục.
-
Chúng tôi tính hệ số tải g của điểm IQ cuối cùng bằng tương quan giữa g (rút trích từ 40 phản hồi mục)
và điểm cuối cùng do thuật toán của bài test tạo ra.
Hệ số tải g càng cao cho thấy điểm cuối cùng càng ăn khớp chặt chẽ với nhân tố chung mà bài test đo lường.
Kết quả
2024 (N = 50,000)
- Hệ số tải g (corr(g, score)): 0.9437
- Khoảng tin cậy 95%: [0.9428, 0.9447]
- Kiểm tra nhất quán: corr(g, total raw score) = 0.9874
- Tỷ lệ phương sai do PC1 giải thích: ≈ 15.23% (các mục nhị phân)
2025 (N = 50,000)
- Hệ số tải g (corr(g, score)): 0.9429
- Khoảng tin cậy 95%: [0.9419, 0.9439]
- Kiểm tra nhất quán: corr(g, total raw score) = 0.9871
- Tỷ lệ phương sai do PC1 giải thích: ≈ 15.08% (các mục nhị phân)
Diễn giải
- Hệ số tải g rất cao (~0.943) và hầu như không thay đổi từ 2024 sang 2025.
- Khoảng tin cậy rất hẹp, cho thấy ước lượng có độ chính xác cao.
-
Về mặt thực tiễn, điều này có nghĩa là điểm IQ cuối cùng hoạt động như một thước đo có mức bão hòa g rất mạnh:
nó bám sát năng lực nhận thức chung được thể hiện qua các phản hồi mục.
Kết luận
Trên hai mẫu độc lập theo từng năm (mỗi mẫu 50,000 người tham gia), điểm cuối cùng có mức độ phù hợp rất cao với nhân tố g
được trích xuất từ các phản hồi mục thô.
Minh bạch
- Điều kết quả này cho thấy
- Tính giá trị cấu trúc nội tại: trong phạm vi bài test này, điểm cuối cùng phản ánh một chiều kích nhận thức chung rộng.
- Kết quả được lặp lại nhất quán qua hai năm độc lập.
- Điều này không thay thế
- Việc thẩm định bên ngoài dưới sự giám sát lâm sàng (ví dụ WAIS/WISC), được tiến hành trong điều kiện kiểm soát chặt chẽ.