Interne g-factorlading van de internationale IQ-test

Gepubliceerd door: International IQ Test
Laatst bijgewerkt:

Voor een IQ-test die is gemodelleerd naar Raven’s Progressive Matrices is de g-factor een bruikbare indicator van interne structurele validiteit. Met andere woorden: ze helpt vaststellen of het scoringsalgoritme van de test een IQ-score oplevert die daadwerkelijk één enkele, algemene cognitieve vaardigheid weerspiegelt—zoals die tot uitdrukking komt in de manier waarop deelnemers de items beantwoorden.

Geanalyseerde gegevens

We voerden dezelfde analyse uit op twee onafhankelijke steekproeven van de International IQ Test, volgens onderstaande criteria:

  • Steekproefvensters
    • 2024: 01/01/2024 tot 01/01/2025
    • 2025: 01/01/2025 tot 01/01/2026
  • Interne anti-botfilters
  • Eén uniek e-mailadres per deelnemer
  • 50,000 deelnemers per jaar

Methode

  1. We zetten de antwoorden van elke deelnemer om in 40 binaire variabelen (0 = onjuist, 1 = juist).
  2. We schatten een individuele g-score rechtstreeks uit de itemantwoorden door uit de responsmatrix van 40 items de eerste principale component (PC1) te extraheren.
  3. We berekenden de g-lading van de uiteindelijke IQ-score als de correlatie tussen g (afgeleid uit de 40 itemantwoorden) en de eindscore die door het algoritme van de test wordt geproduceerd.

Een hogere g-lading duidt erop dat de eindscore nauwer aansluit bij de algemene factor die door de test wordt gemeten.

Resultaten

2024 (N = 50,000)

  • g-lading (corr(g, score)): 0.9437
  • 95% BI: [0.9428, 0.9447]
  • Consistentiecontrole: corr(g, total raw score) = 0.9874
  • Door PC1 verklaarde variantie: ≈ 15.23% (binaire items)

2025 (N = 50,000)

  • g-lading (corr(g, score)): 0.9429
  • 95% BI: [0.9419, 0.9439]
  • Consistentiecontrole: corr(g, total raw score) = 0.9871
  • Door PC1 verklaarde variantie: ≈ 15.08% (binaire items)

Interpretatie

  • De g-lading is zeer hoog (~0.943) en blijft van 2024 naar 2025 in essentie onveranderd.
  • De betrouwbaarheidsintervallen zijn uitzonderlijk smal, wat wijst op een zeer precieze schatting.
  • In praktische termen betekent dit dat de uiteindelijke IQ-score zich gedraagt als een sterk g-verzadigde maat: zij volgt nauwgezet de algemene cognitieve vaardigheid die in de itemantwoorden besloten ligt.

Conclusie

Over twee onafhankelijke jaargangen (50,000 deelnemers per jaar) sluit de eindscore zeer sterk aan bij de g-factor die uit de ruwe itemantwoorden is geëxtraheerd.

Transparantie

  • Wat dit laat zien
    • Interne structurele validiteit: binnen deze test weerspiegelt de eindscore een brede, algemene cognitieve dimensie.
    • Het resultaat repliceert over twee onafhankelijke jaren.
  • Wat dit niet vervangt
    • Externe, klinisch begeleide validatie (bijv. WAIS/WISC), afgenomen onder gecontroleerde omstandigheden.