国際IQテストにおける内部g因子負荷量
公開元: International IQ Test
最終更新:
レーヴン漸進的マトリックス(Raven’s Progressive Matrices)
に準拠して設計されたIQテストにおいて、
g因子
は内部構造妥当性を評価する上で有用な指標となります。言い換えれば、受検者が各項目にどのように反応したかという応答パターンに照らして、
テストの得点化アルゴリズムが、単一の一般的認知能力を真に反映したIQスコアを算出しているかどうかを判断する助けになります。
分析対象データ
以下の基準に基づき、
International IQ Test
の2つの独立サンプルに対して同一の分析を実施しました:
- サンプリング期間
- 2024:01/01/2024 〜 01/01/2025
- 2025:01/01/2025 〜 01/01/2026
- 内部のボット対策フィルタ
- 受検者1名につきユニークなメールアドレス1件
- 各年50,000名
方法
- 各受検者の回答を40個の二値変数(0=不正解、1=正解)に変換しました。
-
40項目の応答行列から第1主成分(PC1)を抽出し、項目応答から直接、個人別のgスコアを推定しました。
-
項目応答(40項目)から得たgと、テストのアルゴリズムが算出する最終得点との相関係数として、最終IQスコアのg負荷(g-loading)を算出しました。
g負荷が高いほど、最終得点がテストで測定される一般因子とより密接に整合していることを示します。
結果
2024(N = 50,000)
- g負荷(corr(g, score)):0.9437
- 95%信頼区間: [0.9428, 0.9447]
- 整合性確認: corr(g, total raw score) = 0.9874
- PC1の説明分散(寄与率): ≈ 15.23%(二値項目)
2025(N = 50,000)
- g負荷(corr(g, score)):0.9429
- 95%信頼区間: [0.9419, 0.9439]
- 整合性確認: corr(g, total raw score) = 0.9871
- PC1の説明分散(寄与率): ≈ 15.08%(二値項目)
解釈
- g負荷は非常に高く(約0.943)、2024年から2025年にかけてほぼ変化していません。
- 信頼区間がきわめて狭く、推定が非常に精密であることを示唆します。
-
実務的には、最終IQスコアはg飽和度の高い指標として振る舞い、項目応答から捉えられる一般的認知能力をきわめて忠実に追跡していることを意味します。
結論
2つの独立した年次サンプル(各50,000名)において、最終得点は生の項目応答から抽出されたg因子と高度に整合していました。
透明性
- 本結果が示すこと
- 内部構造妥当性:本テストの範囲内では、最終得点が幅広い一般的認知次元を反映しています。
- この結果は、独立した2年にわたって再現されています。
- 本結果で代替できないこと
- 統制環境下で臨床家の監督のもと実施される外的・臨床的妥当化(例:WAIS/WISC)。