International IQ Test 的信度如何?

發布者: International IQ Test
最後更新:

瑞文漸進矩陣(Raven’s Progressive Matrices) 啟發的 IQ 測驗,會動用多個智能面向——包含抽象與類比推理、模式辨識、邏輯思考,以及解決新穎問題的能力。然而,要讓一項測驗被視為「可靠」,還必須同時符合若干額外條件:

  1. 一套穩定且標準化的量尺(平均 IQ=100、標準差=15),並以國別加權常模化進行校準,以近似全球人口分布。
  2. 有證據表明該分數反映具意義的認知結構——尤其是能捕捉一般認知能力,並可透過 g 因子加以驗證。

International IQ Test 已發布兩份技術報告——各自對應上述兩項主題——用以說明本測驗的信度,同時也坦承其侷限。

1. 量尺信度:標準化且穩定的分數

IQ 分數通常以一套近似鐘形曲線(常態分配)的標準化量尺呈現,其母群平均數為 100、標準差為 15。

在我們的報告〈International IQ Test 的標準化與校準〉中,我們指出,在完成下列處理後:

  • 國別加權
  • 反機器人篩檢
  • 重複作答過濾

所得分數分布在三個彼此獨立的年度資料中,皆與 IQ 式量尺相符:

  • 2020:平均 ≈ 100.86,標準差 ≈ 15.12
  • 2021:平均 ≈ 99.75,標準差 ≈ 15.15
  • 2022:平均 ≈ 99.82,標準差 ≈ 15.49

解讀:您所得到的分數會一貫地校準至 IQ 式量尺,而此校準在年度之間保持穩定(在可得資料覆蓋範圍的限制內)。

2. 認知信度:分數是否反映一般能力?

在理論上,一項測驗即使在統計上完美標準化(平均 IQ=100、標準差=15),仍可能無法測得通常與「一般智力」相關的認知能力。

因此,我們發布第二份分析,聚焦於分數的認知結構。

這份報告 中,我們根據各題原始作答推估個體的 g 分數,並以相關係數量化該推估值與最終 IQ 分數的一致程度。

在兩個彼此獨立的樣本(2024 與 2025 年)中,於完成以下處理後:

  • 反機器人篩檢
  • 重複作答過濾
  • 每年 N = 50,000

我們觀察到:

  • 2024:corr(g, score) = 0.9437(95% 信賴區間 [0.9428, 0.9447])
  • 2025:corr(g, score) = 0.9429(95% 信賴區間 [0.9419, 0.9439])

結論

根據已發布的分析結果:

  • IQ 分數已在 IQ 式量尺(平均 IQ ≈ 100、標準差 ≈ 15)上完成標準化,且在多個年度間維持穩定。
  • IQ 分數主要反映一般認知能力(與 g 的關聯度高),並在 2024–2025 年間得到可重現的結果。

解讀:綜合而言,International IQ Test 可視為一項結構一致的線上量測工具;其分數不僅校準良好,亦由一致的底層認知結構所支撐。

本測驗無法取代的事項

如同任何線上 IQ 測驗:

  • 它無法取代在受控情境下由臨床專業人員施測的評估(例如 WAIS/WISC)。
  • 結果應視為參考指標,而非診斷、認證或具正式效力的結論。