國際IQ測驗的內部g因子載荷
發布單位: International IQ Test
最後更新:
對於一份以
瑞文漸進矩陣
為藍本的 IQ 測驗而言,
g 因素
是檢驗其內部結構效度的一項有用指標。換言之,它可用來判斷:測驗的計分演算法所產生的 IQ 分數,是否確實反映單一且廣泛的一般認知能力——此能力會透過受試者對各題項的作答反應表現出來。
分析資料
我們依照下列準則,對
International IQ Test
的兩個相互獨立樣本進行同一套分析:
- 抽樣期間
- 2024:01/01/2024 至 01/01/2025
- 2025:01/01/2025 至 01/01/2026
- 內部反機器人篩選機制
- 每位參與者僅限一個唯一的電子郵件地址
- 每年 50,000 名參與者
方法
- 我們將每位參與者的作答轉換為 40 個二元變項(0=答錯,1=答對)。
-
我們直接從題項作答中估計個別的 g 分數:從 40 題作答矩陣中萃取第一主成分(PC1)。
-
我們以 g(由 40 題作答估計而得)與測驗演算法所產生之最終分數之相關係數,計算最終 IQ 分數的 g-負荷量。
g-負荷量越高,表示最終分數與測驗所測得的一般因素越貼近。
結果
2024(N = 50,000)
- g-負荷量(corr(g, score)):0.9437
- 95% 信賴區間: [0.9428, 0.9447]
- 一致性檢查: corr(g, total raw score) = 0.9874
- PC1 解釋的變異比例: ≈ 15.23%(二元題項)
2025(N = 50,000)
- g-負荷量(corr(g, score)):0.9429
- 95% 信賴區間: [0.9419, 0.9439]
- 一致性檢查: corr(g, total raw score) = 0.9871
- PC1 解釋的變異比例: ≈ 15.08%(二元題項)
解讀
- g-負荷量非常高(約 0.943),且從 2024 到 2025 基本上沒有變化。
- 信賴區間極為狹窄,顯示估計相當精確。
-
就實務層面而言,這表示最終 IQ 分數可視為高度「g 飽和」的測量指標:它緊密追蹤由題項作答所捕捉的一般認知能力。
結論
在兩個相互獨立的年度樣本(每年各 50,000 名參與者)中,測驗演算法所產生的最終分數與由原始題項作答萃取出的 g 因素高度一致。
透明性
- 本分析顯示
- 內部結構效度:在此測驗內部,最終分數反映一個廣泛的一般認知向度。
- 此結果可在兩個相互獨立的年度樣本中重現。
- 本分析無法取代
- 在受控條件下施測、且由臨床專業人員監督的外部效度驗證(例如 WAIS/WISC)。