国际IQ测试的可靠性

在本研究中,研究人员从国际IQ测试数据库中随机选择了三组不同的测试结果,每组包含66,032条记录,这些记录分别来自2020年、2021年和2022年三个不同年份。这样做的目的是在假设世界人口为80,000的情境下,保证每次都能代表世界人口,从而评估该测试及其IQ分数计算算法的有效性。每个组都根据2023年各国人口占世界人口的百分比,从世界各国的结果中按比例选取样本。

例如,2023年中国约占世界人口的18.89%。因此,在每个年度的组里,都包含来自中国用户的15,112条测试结果(80,000的18.89%)。

在最终选定之前,这些结果都经过了过滤,以确保只保留真实结果(没有重复或机器人提交)。该过滤标准对所有国家一视同仁,并且也同样用于每年编制各国IQ排名的过程(各国IQ排名)。

在这三年当中,每个组所获得的数据都足以代表世界人口的82.54%(66,032 / 80,000)。

对于剩余的17.46%,由于缺乏足够的数据,如果要将这些国家纳入研究,则需要大幅降低每个国家的最少参与者要求并缩减总体规模(80,000),因此这些国家被排除在外。但它们不太可能对整体结果造成显著影响。

三年总体结果(取整数)对应的标准差大约为15,平均IQ则大约是100。

从统计上看,这表明国际IQ测试在使用瑞文矩阵的情况下,可能在一定程度上(相差几个点)为个人的IQ得分提供具有参考意义的指标。但需要注意的是,该测试结果仅作参考,不可替代心理学专业咨询。

2020年、2021年和2022年国际智商测试中世界人口的标准偏差和平均智商