International IQ Test 的可靠性如何？

发布方： International IQ Test
最后更新： 2025年12月26日

受 Raven 渐进矩阵启发的 IQ 测试，会动用多种智力维度——抽象与类比推理、模式识别、逻辑思维，以及解决新颖问题的能力。但一项测试若要被认为“可靠”，还应满足若干附加标准：

International IQ Test（国际 IQ 测试）已发布两份技术报告——分别对应上述两个议题——在阐明测试可靠性的同时，也如实说明其局限。

1. 量表可靠性：标准化且稳定的分数

IQ 分数通常以标准化量表呈现，该量表近似钟形曲线（正态分布），总体均值为 100，标准差（SD）为 15。

在我们的报告《 International IQ Test 的标准化与校准》中，我们展示：在完成以下处理后：

最终得到的分数分布在三个相互独立的年度中都与 IQ 式量表保持一致：

解读：你获得的分数会被一致地校准到 IQ 式量表上；并且这种校准在逐年比较时保持稳定（在现有数据覆盖范围所允许的前提下）。

从理论上说，一项测试即便在统计意义上完全标准化（均值 IQ = 100，SD = 15），也仍可能无法测量通常与“一般智力”相关的认知能力。

因此，我们发布了第二项分析，重点检验该分数所对应的认知结构。

在本报告中，我们根据原始题目作答估计个人的 g 分数，并通过相关系数量化该估计与最终 IQ 分数之间的一致程度。

在两份相互独立的样本（2024 年与 2025 年）中，在完成以下处理后：

我们得到：

基于已发布的分析结果：

解读：综合来看，International IQ Test 可被视为一项结构一致的在线测量工具：其分数既经过良好校准，也得到稳定的底层认知结构支持。

与任何在线 IQ 测试一样：