International IQ Test 的可靠性如何?
发布方: International IQ Test
最后更新:
受
Raven 渐进矩阵
启发的 IQ 测试,会动用多种智力维度——抽象与类比推理、模式识别、逻辑思维,以及解决新颖问题的能力。
但一项测试若要被认为“可靠”,还应满足若干附加标准:
-
采用稳定且标准化的量表(IQ 均值 = 100,标准差 = 15),并通过按国家加权的归一化校准,使之尽可能贴近全球总体分布。
-
有证据表明该分数反映了有意义的认知结构——具体而言,它能够捕捉一般认知能力,并可通过 g 因子加以验证。
International IQ Test(国际 IQ 测试)已发布两份技术报告——分别对应上述两个议题——在阐明测试可靠性的同时,也如实说明其局限。
1. 量表可靠性:标准化且稳定的分数
IQ 分数通常以标准化量表呈现,该量表近似钟形曲线(正态分布),总体均值为 100,标准差(SD)为 15。
在我们的报告《
International IQ Test 的标准化与校准
》中,我们展示:在完成以下处理后:
- 国家层面的加权
- 反机器人(anti-bot)筛查
- 重复作答过滤
最终得到的分数分布在三个相互独立的年度中都与 IQ 式量表保持一致:
- 2020:均值 ≈ 100.86,SD ≈ 15.12
- 2021:均值 ≈ 99.75,SD ≈ 15.15
- 2022:均值 ≈ 99.82,SD ≈ 15.49
解读:你获得的分数会被一致地校准到 IQ 式量表上;并且这种校准在逐年比较时保持稳定(在现有数据覆盖范围所允许的前提下)。
2. 认知可靠性:分数是否反映一般能力?
从理论上说,一项测试即便在统计意义上完全标准化(均值 IQ = 100,SD = 15),也仍可能无法测量通常与“一般智力”相关的认知能力。
因此,我们发布了第二项分析,重点检验该分数所对应的认知结构。
在 本报告 中,我们根据原始题目作答估计个人的 g 分数,并通过相关系数量化该估计与最终 IQ 分数之间的一致程度。
在两份相互独立的样本(2024 年与 2025 年)中,在完成以下处理后:
- 反机器人(anti-bot)筛查
- 重复作答过滤
- 每年 N = 50,000
我们得到:
- 2024:corr(g, score) = 0.9437(95% CI [0.9428, 0.9447])
- 2025:corr(g, score) = 0.9429(95% CI [0.9419, 0.9439])
结论
基于已发布的分析结果:
-
IQ 分数被标准化到 IQ 式量表(均值 IQ ≈ 100,SD ≈ 15)上,并在多个年度中保持稳定。
-
IQ 分数主要反映一般认知能力(与 g 的关联度很高),且在 2024–2025 年间呈现可复现的结果。
解读:综合来看,International IQ Test 可被视为一项结构一致的在线测量工具:其分数既经过良好校准,也得到稳定的底层认知结构支持。
它无法替代的内容
与任何在线 IQ 测试一样:
- 它无法替代在受控环境中由临床专业人员实施的评估(如 WAIS/WISC),
- 结果应被视为提示性信息——而非诊断结论或官方认证。