國際IQ測驗的內部g因子載荷

發布單位: International IQ Test
最後更新:

對於一份以 瑞文漸進矩陣 為藍本的 IQ 測驗而言, g 因素 是檢驗其內部結構效度的一項有用指標。換言之,它可用來判斷:測驗的計分演算法所產生的 IQ 分數,是否確實反映單一且廣泛的一般認知能力——此能力會透過受試者對各題項的作答反應表現出來。

分析資料

我們依照下列準則,對 International IQ Test 的兩個相互獨立樣本進行同一套分析:

  • 抽樣期間
    • 2024:01/01/2024 至 01/01/2025
    • 2025:01/01/2025 至 01/01/2026
  • 內部反機器人篩選機制
  • 每位參與者僅限一個唯一的電子郵件地址
  • 每年 50,000 名參與者

方法

  1. 我們將每位參與者的作答轉換為 40 個二元變項(0=答錯,1=答對)。
  2. 我們直接從題項作答中估計個別的 g 分數:從 40 題作答矩陣中萃取第一主成分(PC1)。
  3. 我們以 g(由 40 題作答估計而得)與測驗演算法所產生之最終分數之相關係數,計算最終 IQ 分數的 g-負荷量。

g-負荷量越高,表示最終分數與測驗所測得的一般因素越貼近。

結果

2024(N = 50,000)

  • g-負荷量(corr(g, score)):0.9437
  • 95% 信賴區間: [0.9428, 0.9447]
  • 一致性檢查: corr(g, total raw score) = 0.9874
  • PC1 解釋的變異比例: ≈ 15.23%(二元題項)

2025(N = 50,000)

  • g-負荷量(corr(g, score)):0.9429
  • 95% 信賴區間: [0.9419, 0.9439]
  • 一致性檢查: corr(g, total raw score) = 0.9871
  • PC1 解釋的變異比例: ≈ 15.08%(二元題項)

解讀

  • g-負荷量非常高(約 0.943),且從 2024 到 2025 基本上沒有變化。
  • 信賴區間極為狹窄,顯示估計相當精確。
  • 就實務層面而言,這表示最終 IQ 分數可視為高度「g 飽和」的測量指標:它緊密追蹤由題項作答所捕捉的一般認知能力。

結論

在兩個相互獨立的年度樣本(每年各 50,000 名參與者)中,測驗演算法所產生的最終分數與由原始題項作答萃取出的 g 因素高度一致。

透明性

  • 本分析顯示
    • 內部結構效度:在此測驗內部,最終分數反映一個廣泛的一般認知向度。
    • 此結果可在兩個相互獨立的年度樣本中重現。
  • 本分析無法取代
    • 在受控條件下施測、且由臨床專業人員監督的外部效度驗證(例如 WAIS/WISC)。