핵심 인사이트 (3줄 요약)
- 본질: 카이제곱 검정은 범주형 데이터가 기대 분포와 맞는지 또는 두 범주가 독립인지 검사한다.
- 가치: 교차표 기반으로 범주형 관계를 정량화한다.
- 판단: 기대도수와 자유도를 이해해야 한다.
Ⅰ. 개요 및 필요성
범주형 데이터는 평균이 아니라 빈도로 봐야 한다.
카이제곱 검정이 그 역할을 한다.
- 📢 섹션 요약 비유: 색깔별 사탕 개수를 세어 고르게 나뉘었는지 보는 일이다.
Ⅱ. 아키텍처 및 핵심 원리
Observed Counts
↓ compare
Expected Counts
↓
Chi-square Statistic
| 종류 | 의미 |
|---|---|
| Independence | 독립성 검정 |
| Goodness-of-fit | 적합성 검정 |
| Expected Count | 기대도수 |
관측도수와 기대도수의 차이가 크면 독립이 아니거나 분포가 다르다고 본다.
- 📢 섹션 요약 비유: 예상한 사탕 수와 실제 수를 비교하는 것이다.
Ⅲ. 비교 및 연결
| 검정 | 대상 | 차이 |
|---|---|---|
| Chi-square | 범주형 | 빈도 |
| t-Test | 연속형 | 평균 |
| 요소 | 의미 |
|---|---|
| Degrees of Freedom | 자유도 |
| Contingency Table | 교차표 |
카이제곱 검정은 범주형 분석의 기본 도구다.
- 📢 섹션 요약 비유: 색별 개수를 비교하는 통계 시험이다.
Ⅳ. 실무 적용 및 기술사 판단
체크리스트
- 범주형 데이터인가?
- 기대도수를 계산했는가?
- 자유도를 이해하는가?
- 독립성과 적합성을 구분하는가?
- 교차표 해석이 가능한가?
안티패턴
- 연속형 데이터에 무분별하게 쓰는 설계
- 기대도수를 무시하는 설계
- 독립성과 적합성을 혼동하는 설계
- p-value만 보고 결론내는 설계
기술사 관점에서는 카이제곱 검정을 "범주형 빈도 기반 통계 검정"으로 설명해야 한다.
- 📢 섹션 요약 비유: 색깔별 개수가 맞는지 확인하는 계산이다.
Ⅴ. 기대효과 및 결론
카이제곱 검정은 범주형 관계와 적합도를 판단한다.
결론적으로 카이제곱 검정은 범주형 데이터의 독립성과 적합성을 본다.
- 📢 섹션 요약 비유: 그룹별 개수가 예상과 맞는지 보는 것이다.
관련 개념 맵
Categorical Data
↓
Chi-square Test
↓
Contingency Table
↓
Decision
관련 키워드 및 발전 흐름도
Observed / Expected
↓
Chi-square
↓
Independence / Goodness-of-fit
어린이를 위한 3줄 비유 설명
사탕 개수를 세어요.
예상한 수와 비교해요.
카이제곱 검정은 그런 계산이에요.