Intern g-faktorladning i den internationale IQ-test

Udgivet af: International IQ Test
Senest opdateret:

For en IQ-test modelleret efter Raven’s Progressive Matrices er g-faktoren en nyttig indikator for intern strukturel validitet. Med andre ord hjælper den med at afgøre, om testens scoringsalgoritme frembringer en IQ-score, der faktisk afspejler én samlet, generel kognitiv evne—sådan som den kommer til udtryk i den måde, deltagerne besvarer items på.

Analyserede data

Vi gennemførte den samme analyse på to uafhængige stikprøver fra International IQ Test ud fra nedenstående kriterier:

  • Udtræksperioder
    • 2024: 01/01/2024 til 01/01/2025
    • 2025: 01/01/2025 til 01/01/2026
  • Interne anti-bot-filtre
  • Én unik e-mailadresse pr. deltager
  • 50.000 deltagere pr. år

Metode

  1. Vi omkodede hver deltagers svar til 40 binære variabler (0 = forkert, 1 = korrekt).
  2. Vi estimerede en individuel g-score direkte ud fra itembesvarelserne ved at udtrække den første hovedkomponent (PC1) fra responsmatricen for de 40 items.
  3. Vi beregnede g-belastningen for den endelige IQ-score som korrelationen mellem g (udledt af de 40 itembesvarelser) og den endelige score, som testens algoritme producerer.

En højere g-belastning indikerer, at den endelige score er tættere koblet til den generelle faktor, som testen måler.

Resultater

2024 (N = 50.000)

  • g-belastning (corr(g, score)): 0.9437
  • 95 % KI: [0.9428, 0.9447]
  • Konsistenskontrol: corr(g, samlet råscore) = 0.9874
  • Forklaret varians ved PC1: ≈ 15.23% (binære items)

2025 (N = 50.000)

  • g-belastning (corr(g, score)): 0.9429
  • 95 % KI: [0.9419, 0.9439]
  • Konsistenskontrol: corr(g, samlet råscore) = 0.9871
  • Forklaret varians ved PC1: ≈ 15.08% (binære items)

Fortolkning

  • g-belastningen er meget høj (~0.943) og er i praksis uændret fra 2024 til 2025.
  • Konfidensintervallerne er ekstremt snævre, hvilket peger på et meget præcist estimat.
  • I praksis betyder det, at den endelige IQ-score fungerer som et stærkt g-mættet mål: den afspejler tæt den generelle kognitive evne, som itembesvarelserne indfanger.

Konklusion

På tværs af to uafhængige årlige stikprøver (50.000 deltagere i hver) er den endelige score i høj grad i overensstemmelse med den g-faktor, der er udtrukket fra de rå itembesvarelser.

Gennemsigtighed

  • Hvad dette viser
    • Intern strukturel validitet: inden for denne test afspejler den endelige score en bred, generel kognitiv dimension.
    • Resultatet replikeres på tværs af to uafhængige år.
  • Hvad dette ikke erstatter
    • Ekstern, klinisk superviseret validering (fx WAIS/WISC) gennemført under kontrollerede forhold.