国际IQ测试的内部g因子载荷

发布方: International IQ Test
最后更新:

对于一项以 瑞文渐进矩阵 为蓝本的 IQ 测验而言,g 因子是评估内部结构效度的一个有用指标。换言之,它有助于判断该测验的计分算法所生成的 IQ 分数是否真正反映了单一的、一般性的认知能力——这一点会体现在参与者对各题目的作答模式之中。

所分析的数据

我们依据下列标准,对 International IQ Test 的两个相互独立样本进行了同样的分析:

  • 采样时间窗口
    • 2024:01/01/2024 至 01/01/2025
    • 2025:01/01/2025 至 01/01/2026
  • 内部反机器人过滤
  • 每位参与者仅允许使用一个唯一的电子邮箱地址
  • 每年 50,000 名参与者

方法

  1. 我们将每位参与者的作答转换为 40 个二元变量(0 = 答错,1 = 答对)。
  2. 我们从这 40 题的作答矩阵中提取第一主成分(PC1),并据此直接由题目反应估计每位参与者的个体 g 得分。
  3. 我们将最终 IQ 得分的 g 载荷定义为:由 40 题作答提取的 g 与测试算法输出的最终得分之间的相关系数。

g 载荷越高,表明最终得分与该测验所测得的一般因素越一致。

结果

2024(N = 50,000)

  • g 载荷(corr(g, score)):0.9437
  • 95% 置信区间:[0.9428, 0.9447]
  • 一致性检验:corr(g, total raw score) = 0.9874
  • PC1 解释的方差:≈ 15.23%(二元题目)

2025(N = 50,000)

  • g 载荷(corr(g, score)):0.9429
  • 95% 置信区间:[0.9419, 0.9439]
  • 一致性检验:corr(g, total raw score) = 0.9871
  • PC1 解释的方差:≈ 15.08%(二元题目)

解读

  • g 载荷非常高(约 0.943),且从 2024 年到 2025 年几乎没有变化。
  • 置信区间极为狭窄,表明估计精度非常高。
  • 从实际意义看,这意味着最终 IQ 得分表现为一种高度“g 饱和”的测量:它与题目反应所捕捉的一般认知能力高度同步。

结论

在两个相互独立的年度样本(每年 50,000 名参与者)中,最终得分与由原始题目反应提取的 g 因子高度一致。

透明说明

  • 这表明什么
    • 内部结构效度:就该测验而言,最终得分反映了一个广泛的一般认知维度。
    • 该结果在两个相互独立的年度样本中得到重复验证。
  • 这不能替代什么
    • 在受控条件下实施的外部、临床监督式效度验证(例如 WAIS/WISC)。