International IQ Test 的可靠性如何?

发布方: International IQ Test
最后更新:

Raven 渐进矩阵 启发的 IQ 测试,会动用多种智力维度——抽象与类比推理、模式识别、逻辑思维,以及解决新颖问题的能力。 但一项测试若要被认为“可靠”,还应满足若干附加标准:

  1. 采用稳定且标准化的量表(IQ 均值 = 100,标准差 = 15),并通过按国家加权的归一化校准,使之尽可能贴近全球总体分布。
  2. 有证据表明该分数反映了有意义的认知结构——具体而言,它能够捕捉一般认知能力,并可通过 g 因子加以验证。

International IQ Test(国际 IQ 测试)已发布两份技术报告——分别对应上述两个议题——在阐明测试可靠性的同时,也如实说明其局限。

1. 量表可靠性:标准化且稳定的分数

IQ 分数通常以标准化量表呈现,该量表近似钟形曲线(正态分布),总体均值为 100,标准差(SD)为 15。

在我们的报告《 International IQ Test 的标准化与校准 》中,我们展示:在完成以下处理后:

  • 国家层面的加权
  • 反机器人(anti-bot)筛查
  • 重复作答过滤

最终得到的分数分布在三个相互独立的年度中都与 IQ 式量表保持一致:

  • 2020:均值 ≈ 100.86,SD ≈ 15.12
  • 2021:均值 ≈ 99.75,SD ≈ 15.15
  • 2022:均值 ≈ 99.82,SD ≈ 15.49

解读:你获得的分数会被一致地校准到 IQ 式量表上;并且这种校准在逐年比较时保持稳定(在现有数据覆盖范围所允许的前提下)。

2. 认知可靠性:分数是否反映一般能力?

从理论上说,一项测试即便在统计意义上完全标准化(均值 IQ = 100,SD = 15),也仍可能无法测量通常与“一般智力”相关的认知能力。

因此,我们发布了第二项分析,重点检验该分数所对应的认知结构。

本报告 中,我们根据原始题目作答估计个人的 g 分数,并通过相关系数量化该估计与最终 IQ 分数之间的一致程度。

在两份相互独立的样本(2024 年与 2025 年)中,在完成以下处理后:

  • 反机器人(anti-bot)筛查
  • 重复作答过滤
  • 每年 N = 50,000

我们得到:

  • 2024:corr(g, score) = 0.9437(95% CI [0.9428, 0.9447])
  • 2025:corr(g, score) = 0.9429(95% CI [0.9419, 0.9439])

结论

基于已发布的分析结果:

  • IQ 分数被标准化到 IQ 式量表(均值 IQ ≈ 100,SD ≈ 15)上,并在多个年度中保持稳定。
  • IQ 分数主要反映一般认知能力(与 g 的关联度很高),且在 2024–2025 年间呈现可复现的结果。

解读:综合来看,International IQ Test 可被视为一项结构一致的在线测量工具:其分数既经过良好校准,也得到稳定的底层认知结构支持。

它无法替代的内容

与任何在线 IQ 测试一样:

  • 它无法替代在受控环境中由临床专业人员实施的评估(如 WAIS/WISC),
  • 结果应被视为提示性信息——而非诊断结论或官方认证。