국제 IQ 테스트의 내부 g 요인부하량

게시자: International IQ Test
최종 업데이트:

레이븐의 점진적 행렬(Raven’s Progressive Matrices)을 본떠 설계된 IQ 검사에서, g 요인은 검사 내부의 구조적 타당도(internal structural validity)를 가늠하는 데 유용한 지표다. 다시 말해, 문항에 대한 응답 양상에 비추어 볼 때 채점 알고리즘이 하나의 단일한 일반 인지 능력을 실제로 반영하는 IQ 점수를 산출하는지 판단하는 데 도움이 된다.

분석한 데이터

아래 기준에 따라 International IQ Test의 서로 독립적인 두 표본을 대상으로 동일한 분석을 수행했다:

  • 표집 기간
    • 2024: 01/01/2024 to 01/01/2025
    • 2025: 01/01/2025 to 01/01/2026
  • 내부 봇 차단(anti-bot) 필터 적용
  • 참가자 1인당 고유 이메일 주소 1개
  • 연간 참가자 50,000명

방법

  1. 각 참가자의 응답을 40개의 이진 변수로 변환했다(0 = 오답, 1 = 정답).
  2. 40문항 응답 행렬에서 첫 번째 주성분(PC1)을 추출하여, 문항 응답으로부터 개인별 g 점수를 직접 추정했다.
  3. 40문항 응답에서 산출한 g와 검사 알고리즘이 생성한 최종 점수 간의 상관을 계산하여, 최종 IQ 점수의 g-적재량(g-loading)을 구했다.

g-적재량이 높을수록 최종 점수가 검사에서 측정되는 일반 요인과 더 밀접하게 정렬되어 있음을 의미한다.

결과

2024 (N = 50,000)

  • g-적재량 (corr(g, score)): 0.9437
  • 95% 신뢰구간: [0.9428, 0.9447]
  • 일관성 점검: corr(g, total raw score) = 0.9874
  • PC1이 설명하는 분산: ≈ 15.23% (이진 문항)

2025 (N = 50,000)

  • g-적재량 (corr(g, score)): 0.9429
  • 95% 신뢰구간: [0.9419, 0.9439]
  • 일관성 점검: corr(g, total raw score) = 0.9871
  • PC1이 설명하는 분산: ≈ 15.08% (이진 문항)

해석

  • g-적재량은 매우 높으며(약 0.943), 2024년과 2025년 사이에 사실상 변화가 없다.
  • 신뢰구간이 매우 좁아 추정치의 정밀도가 매우 높음을 시사한다.
  • 실질적으로 이는 최종 IQ 점수가 g 포화도가 매우 높은 측정치로 작동한다는 뜻이다. 즉, 문항 응답이 포착한 일반 인지 능력을 매우 밀접하게 추적한다.

결론

서로 독립적인 두 연도 표본(각 50,000명) 전반에서, 최종 점수는 원자료(문항 응답)로부터 추출된 g 요인과 매우 높은 수준으로 일치한다.

투명성

  • 이 결과가 보여 주는 것
    • 내부 구조적 타당도: 이 검사 내에서 최종 점수는 광범위한 일반 인지 차원을 반영한다.
    • 이 결과는 서로 독립적인 두 연도에서 재현된다.
  • 이 결과가 대체하지 못하는 것
    • 통제된 조건에서 시행되는 외부의 임상적·감독 하 검증(예: WAIS/WISC).