国际IQ测试的内部g因子载荷

发布方： International IQ Test
最后更新： 2025年12月28日

对于一项以瑞文渐进矩阵为蓝本的 IQ 测验而言，g 因子是评估内部结构效度的一个有用指标。换言之，它有助于判断该测验的计分算法所生成的 IQ 分数是否真正反映了单一的、一般性的认知能力——这一点会体现在参与者对各题目的作答模式之中。

所分析的数据

我们依据下列标准，对 International IQ Test 的两个相互独立样本进行了同样的分析：

采样时间窗口
- 2024：01/01/2024 至 01/01/2025
- 2025：01/01/2025 至 01/01/2026
内部反机器人过滤
每位参与者仅允许使用一个唯一的电子邮箱地址
每年 50,000 名参与者

方法

我们将每位参与者的作答转换为 40 个二元变量（0 = 答错，1 = 答对）。
我们从这 40 题的作答矩阵中提取第一主成分（PC1），并据此直接由题目反应估计每位参与者的个体 g 得分。
我们将最终 IQ 得分的 g 载荷定义为：由 40 题作答提取的 g 与测试算法输出的最终得分之间的相关系数。

g 载荷越高，表明最终得分与该测验所测得的一般因素越一致。

结果

2024（N = 50,000）

g 载荷（corr(g, score)）：0.9437
95% 置信区间：[0.9428, 0.9447]
一致性检验：corr(g, total raw score) = 0.9874
PC1 解释的方差：≈ 15.23%（二元题目）

2025（N = 50,000）

g 载荷（corr(g, score)）：0.9429
95% 置信区间：[0.9419, 0.9439]
一致性检验：corr(g, total raw score) = 0.9871
PC1 解释的方差：≈ 15.08%（二元题目）

解读

g 载荷非常高（约 0.943），且从 2024 年到 2025 年几乎没有变化。
置信区间极为狭窄，表明估计精度非常高。
从实际意义看，这意味着最终 IQ 得分表现为一种高度“g 饱和”的测量：它与题目反应所捕捉的一般认知能力高度同步。

结论

在两个相互独立的年度样本（每年 50,000 名参与者）中，最终得分与由原始题目反应提取的 g 因子高度一致。

透明说明

这表明什么
- 内部结构效度：就该测验而言，最终得分反映了一个广泛的一般认知维度。
- 该结果在两个相互独立的年度样本中得到重复验证。
这不能替代什么
- 在受控条件下实施的外部、临床监督式效度验证（例如 WAIS/WISC）。

参加 IQ 测试