国际IQ测试的内部g因子载荷
发布方: International IQ Test
最后更新:
对于一项以
瑞文渐进矩阵
为蓝本的 IQ 测验而言,g 因子是评估内部结构效度的一个有用指标。换言之,它有助于判断该测验的计分算法所生成的 IQ 分数是否真正反映了单一的、一般性的认知能力——这一点会体现在参与者对各题目的作答模式之中。
所分析的数据
我们依据下列标准,对
International IQ Test
的两个相互独立样本进行了同样的分析:
- 采样时间窗口
- 2024:01/01/2024 至 01/01/2025
- 2025:01/01/2025 至 01/01/2026
- 内部反机器人过滤
- 每位参与者仅允许使用一个唯一的电子邮箱地址
- 每年 50,000 名参与者
方法
- 我们将每位参与者的作答转换为 40 个二元变量(0 = 答错,1 = 答对)。
-
我们从这 40 题的作答矩阵中提取第一主成分(PC1),并据此直接由题目反应估计每位参与者的个体 g 得分。
-
我们将最终 IQ 得分的 g 载荷定义为:由 40 题作答提取的 g 与测试算法输出的最终得分之间的相关系数。
g 载荷越高,表明最终得分与该测验所测得的一般因素越一致。
结果
2024(N = 50,000)
- g 载荷(corr(g, score)):0.9437
- 95% 置信区间:[0.9428, 0.9447]
- 一致性检验:corr(g, total raw score) = 0.9874
- PC1 解释的方差:≈ 15.23%(二元题目)
2025(N = 50,000)
- g 载荷(corr(g, score)):0.9429
- 95% 置信区间:[0.9419, 0.9439]
- 一致性检验:corr(g, total raw score) = 0.9871
- PC1 解释的方差:≈ 15.08%(二元题目)
解读
- g 载荷非常高(约 0.943),且从 2024 年到 2025 年几乎没有变化。
- 置信区间极为狭窄,表明估计精度非常高。
-
从实际意义看,这意味着最终 IQ 得分表现为一种高度“g 饱和”的测量:它与题目反应所捕捉的一般认知能力高度同步。
结论
在两个相互独立的年度样本(每年 50,000 名参与者)中,最终得分与由原始题目反应提取的 g 因子高度一致。
透明说明
- 这表明什么
- 内部结构效度:就该测验而言,最终得分反映了一个广泛的一般认知维度。
- 该结果在两个相互独立的年度样本中得到重复验证。
- 这不能替代什么
- 在受控条件下实施的外部、临床监督式效度验证(例如 WAIS/WISC)。