International IQ Test 的信度如何?
發布者: International IQ Test
最後更新:
受
瑞文漸進矩陣(Raven’s Progressive Matrices)
啟發的 IQ 測驗,會動用多個智能面向——包含抽象與類比推理、模式辨識、邏輯思考,以及解決新穎問題的能力。然而,要讓一項測驗被視為「可靠」,還必須同時符合若干額外條件:
-
一套穩定且標準化的量尺(平均 IQ=100、標準差=15),並以國別加權常模化進行校準,以近似全球人口分布。
-
有證據表明該分數反映具意義的認知結構——尤其是能捕捉一般認知能力,並可透過 g 因子加以驗證。
International IQ Test 已發布兩份技術報告——各自對應上述兩項主題——用以說明本測驗的信度,同時也坦承其侷限。
1. 量尺信度:標準化且穩定的分數
IQ 分數通常以一套近似鐘形曲線(常態分配)的標準化量尺呈現,其母群平均數為 100、標準差為 15。
在我們的報告〈International IQ Test 的標準化與校準〉中,我們指出,在完成下列處理後:
所得分數分布在三個彼此獨立的年度資料中,皆與 IQ 式量尺相符:
- 2020:平均 ≈ 100.86,標準差 ≈ 15.12
- 2021:平均 ≈ 99.75,標準差 ≈ 15.15
- 2022:平均 ≈ 99.82,標準差 ≈ 15.49
解讀:您所得到的分數會一貫地校準至 IQ 式量尺,而此校準在年度之間保持穩定(在可得資料覆蓋範圍的限制內)。
2. 認知信度:分數是否反映一般能力?
在理論上,一項測驗即使在統計上完美標準化(平均 IQ=100、標準差=15),仍可能無法測得通常與「一般智力」相關的認知能力。
因此,我們發布第二份分析,聚焦於分數的認知結構。
在 這份報告 中,我們根據各題原始作答推估個體的 g 分數,並以相關係數量化該推估值與最終 IQ 分數的一致程度。
在兩個彼此獨立的樣本(2024 與 2025 年)中,於完成以下處理後:
- 反機器人篩檢
- 重複作答過濾
- 每年 N = 50,000
我們觀察到:
- 2024:corr(g, score) = 0.9437(95% 信賴區間 [0.9428, 0.9447])
- 2025:corr(g, score) = 0.9429(95% 信賴區間 [0.9419, 0.9439])
結論
根據已發布的分析結果:
-
IQ 分數已在 IQ 式量尺(平均 IQ ≈ 100、標準差 ≈ 15)上完成標準化,且在多個年度間維持穩定。
-
IQ 分數主要反映一般認知能力(與 g 的關聯度高),並在 2024–2025 年間得到可重現的結果。
解讀:綜合而言,International IQ Test 可視為一項結構一致的線上量測工具;其分數不僅校準良好,亦由一致的底層認知結構所支撐。
本測驗無法取代的事項
如同任何線上 IQ 測驗:
- 它無法取代在受控情境下由臨床專業人員施測的評估(例如 WAIS/WISC)。
- 結果應視為參考指標,而非診斷、認證或具正式效力的結論。