國際IQ測試的可靠性

在本研究中,研究人員從國際IQ測試資料庫中,針對2020年、2021年及2022年三個不同年度,隨機選取了三組不同的測試結果,每組包含66,032筆數據。如此設計的目的是在假設全球人口為80,000的情境下,每次都能代表世界人口,以評估該測驗及其IQ分數計算演算法的有效性。每個組別根據2023年各國人口占世界人口的比例,從全球各國的結果中等比例抽樣。

例如,2023年中國約占全球人口的18.89%,因此在每個年度的組別中,都包含來自中國用戶的15,112條測試結果(80,000的18.89%)。

在最終選定之前,這些結果都經過了濾除重複及機器人提交的真實性篩選。此相同的篩選標準對所有國家皆一視同仁,並且也同樣用於每年製作各國IQ排名的程序(各國IQ排名)。

在這三年間的每個組別中,可用資料足以代表全球82.54%的人口(66,032 / 80,000)。

對於佔餘下17.46%的人口所屬的國家而言,其可用數據不足,若要納入研究便需要大幅降低國家最少參與者門檻並縮減總體規模(80,000)。因此,這些國家被排除於研究之外,但應該不會對整體結果造成顯著影響。

三年的整體結果(四捨五入後)對應的標準差約為15,平均IQ約為100。

從統計角度來看,這顯示國際IQ測試在使用瑞文矩陣的情況下,或許能在一定程度上(差距數分上下)為個人的IQ得分提供具參考意義的指標。然而,此測試結果僅供參考,並無法取代專業的心理諮詢。

2020年、2021年和2022年國際智商測試中世界人口的標準偏差和平均智商