72. 카이제곱 검정 (Chi-square Test) - 범주형 데이터 독립성/적합성 — Brain Science

April 10, 2026 studynote data engineering

핵심 인사이트 (3줄 요약)

본질: 카이제곱 검정은 범주형 데이터가 기대 분포와 맞는지 또는 두 범주가 독립인지 검사한다.

가치: 교차표 기반으로 범주형 관계를 정량화한다.

판단: 기대도수와 자유도를 이해해야 한다.

Ⅰ. 개요 및 필요성

범주형 데이터는 평균이 아니라 빈도로 봐야 한다.

카이제곱 검정이 그 역할을 한다.

📢 섹션 요약 비유: 색깔별 사탕 개수를 세어 고르게 나뉘었는지 보는 일이다.

Ⅱ. 아키텍처 및 핵심 원리

Observed Counts
  ↓ compare
Expected Counts
  ↓
Chi-square Statistic

종류	의미
Independence	독립성 검정
Goodness-of-fit	적합성 검정
Expected Count	기대도수

관측도수와 기대도수의 차이가 크면 독립이 아니거나 분포가 다르다고 본다.

📢 섹션 요약 비유: 예상한 사탕 수와 실제 수를 비교하는 것이다.

Ⅲ. 비교 및 연결

검정	대상	차이
Chi-square	범주형	빈도
t-Test	연속형	평균

요소	의미
Degrees of Freedom	자유도
Contingency Table	교차표

카이제곱 검정은 범주형 분석의 기본 도구다.

📢 섹션 요약 비유: 색별 개수를 비교하는 통계 시험이다.

Ⅳ. 실무 적용 및 기술사 판단

체크리스트

범주형 데이터인가?
기대도수를 계산했는가?
자유도를 이해하는가?
독립성과 적합성을 구분하는가?
교차표 해석이 가능한가?

안티패턴

연속형 데이터에 무분별하게 쓰는 설계
기대도수를 무시하는 설계
독립성과 적합성을 혼동하는 설계
p-value만 보고 결론내는 설계

기술사 관점에서는 카이제곱 검정을 "범주형 빈도 기반 통계 검정"으로 설명해야 한다.

📢 섹션 요약 비유: 색깔별 개수가 맞는지 확인하는 계산이다.

Ⅴ. 기대효과 및 결론

카이제곱 검정은 범주형 관계와 적합도를 판단한다.

결론적으로 카이제곱 검정은 범주형 데이터의 독립성과 적합성을 본다.

📢 섹션 요약 비유: 그룹별 개수가 예상과 맞는지 보는 것이다.

관련 개념 맵

Categorical Data
  ↓
Chi-square Test
  ↓
Contingency Table
  ↓
Decision

관련 키워드 및 발전 흐름도

Observed / Expected
  ↓
Chi-square
  ↓
Independence / Goodness-of-fit

어린이를 위한 3줄 비유 설명

사탕 개수를 세어요.
예상한 수와 비교해요.
카이제곱 검정은 그런 계산이에요.