핵심 인사이트 (3줄 요약)
- 본질: 비교 대상 집단 수(2개 vs 3개 이상)와 데이터 유형(연속형 vs 범주형)에 따라 t-검정, ANOVA, 카이제곱 검정 중 적절한 도구를 선택해야 한다.
- 가치: ANOVA(Analysis of Variance)는 F-통계량으로 집단 간 분산/집단 내 분산 비를 계산해, 다중 비교 문제 없이 3개 이상 집단을 한 번에 비교한다.
- 판단 포인트: 정규성·등분산성 가정이 위배되면 비모수 대안(Kruskal-Wallis, Mann-Whitney)으로 전환하고, 사후 검정(Post-hoc)으로 어느 집단 쌍이 다른지 특정한다.
Ⅰ. 개요 및 필요성
"두 마케팅 채널의 전환율이 다른가?", "세 가지 처리법 중 가장 효과적인 것은?" 같은 질문에 답하려면 집단 비교 검정이 필요하다. 잘못된 검정 선택은 틀린 결론으로 이어진다.
검정 선택 기준
| 데이터 유형 | 집단 수 | 대응 여부 | 검정 방법 |
|---|---|---|---|
| 연속형 | 2 | 독립 | 독립 표본 t-검정 |
| 연속형 | 2 | 대응 | 대응 표본 t-검정 (Paired) |
| 연속형 | 3+ | 독립 | One-way ANOVA |
| 범주형 | - | - | 카이제곱 검정 (Chi-Square) |
| 연속형 (비모수) | 3+ | 독립 | Kruskal-Wallis |
- 📢 섹션 요약 비유: 검정 방법은 도구 선택과 같아. 나사를 조일 때 드라이버 종류(일자, 십자, 육각)를 맞춰야 하듯, 데이터 종류와 집단 수에 맞는 검정을 골라야 해.
Ⅱ. 아키텍처 및 핵심 원리
검정 통계량 흐름
데이터 입력
│
├─ 연속형 ──┬─ 2집단 ──┬─ 독립 → t = (X̄₁-X̄₂) / SE
│ │ └─ 대응 → t = d̄ / (s_d/√n)
│ └─ 3집단+ → F = MS_between / MS_within (ANOVA)
│
└─ 범주형 ─────────────→ χ² = Σ(O-E)²/E (Chi-Square)
ANOVA F-통계량
- 집단 간 평균 제곱 (MS_between): 집단 평균들이 전체 평균에서 얼마나 떨어졌는가.
- 집단 내 평균 제곱 (MS_within): 각 집단 내부의 분산.
- F = MS_between / MS_within: 이 비가 클수록 집단 간 차이가 집단 내 변동보다 크다 → H₀ 기각.
| 검정 | 통계량 | 귀무가설 |
|---|---|---|
| t-검정 | t 통계량 | 두 집단 평균 동일 |
| ANOVA | F 통계량 | 모든 집단 평균 동일 |
| 카이제곱 | χ² 통계량 | 두 변수 독립 (기대빈도 vs 관측빈도) |
- 📢 섹션 요약 비유: ANOVA는 여러 식당의 음식 맛을 비교할 때, 각 식당 안에서 메뉴별 맛 차이 대비 식당 간 맛 차이가 크면 "식당마다 다르다"고 결론 내리는 방식이야.
Ⅲ. 비교 및 연결
사후 검정 (Post-hoc Test)
ANOVA가 "적어도 하나의 집단 평균이 다르다"는 것만 알려주면, 어느 쌍이 다른지를 사후 검정으로 찾는다.
| 방법 | 특징 | 활용 |
|---|---|---|
| Tukey HSD | 모든 쌍 비교, 균형적 | 일반적 상황 |
| Bonferroni | 보수적(α 분할) | 적은 비교 수 |
| Scheffé | 가장 보수적 | 불균형 집단 |
카이제곱 검정 적용 조건
-
기대빈도(Expected Frequency) ≥ 5 (셀 당) — 미충족 시 Fisher's Exact Test 사용.
-
독립성 검정 외에도 적합도 검정(Goodness of Fit): 관측 분포가 이론 분포와 일치하는지 검정.
-
📢 섹션 요약 비유: ANOVA 사후 검정은 반에서 국어 점수가 다 같지 않다는 것(ANOVA)을 확인한 후, 어느 조가 어느 조보다 높은지(사후 검정)를 구체적으로 확인하는 두 번째 단계야.
Ⅳ. 실무 적용 및 기술사 판단
시나리오 1 - 마케팅 채널 비교 (t-검정):
- 이메일 vs SNS 광고의 클릭률(CTR) 차이 검정.
- Levene's Test로 등분산성 확인 → 분산 동일하지 않으면 Welch's t-test 적용.
- p = 0.02 < 0.05 → SNS 광고 CTR이 통계적으로 유의미하게 높음.
시나리오 2 - 처리법 비교 (ANOVA):
- A/B/C 3가지 UI 디자인의 체류 시간 비교.
- One-way ANOVA: F=6.3, p=0.003 → H₀ 기각.
- Tukey HSD: A-C 간 유의미한 차이 (p=0.002), B-C 차이 없음.
시나리오 3 - 성별 × 구매 여부 (카이제곱):
- 성별(남/여)과 구매 여부(Yes/No) 독립성 검정.
- χ²=8.7, df=1, p=0.003 → 성별과 구매 여부는 독립이 아님(연관성 있음).
기술사 판단 포인트:
-
정규성 검정: Shapiro-Wilk Test (n<50) 또는 Kolmogorov-Smirnov (n≥50).
-
비모수 대안: Kruskal-Wallis(ANOVA 대응), Mann-Whitney U(독립 t-검정 대응).
-
📢 섹션 요약 비유: 카이제곱 검정은 "남성이 아이스크림을 더 많이 사는 건 우연인가, 아니면 진짜 선호도 차이인가?"를 확인하는 것처럼, 범주형 변수 간 관계가 우연인지 판단해.
Ⅴ. 기대효과 및 결론
집단 비교 검정을 올바르게 선택하고 가정 조건을 확인하면 데이터 기반 의사 결정의 오류를 최소화한다.
-
의사 결정 신뢰성: 다중 비교 문제를 사후 검정으로 적절히 통제.
-
실험 설계 최적화: 올바른 검정 선택으로 표본 크기와 비용 최소화.
-
가정 위배 대응: 비모수 방법으로 정규성 가정 없이도 유효한 추론.
-
📢 섹션 요약 비유: t-검정은 두 선수 실력 비교, ANOVA는 리그 전체 팀 실력 비교, 카이제곱은 팬 취향과 지역 간의 관계 분석이야 — 질문에 맞는 도구를 쓰는 게 핵심이야.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
|---|---|
| t-검정 | t-분포, Welch's t · 2집단 평균 비교 |
| ANOVA | F-분포, 사후 검정 · 3+ 집단 비교 |
| 카이제곱 | 기대빈도, Fisher's Test · 범주형 독립성 |
| Kruskal-Wallis | 비모수, 순위 기반 · ANOVA 비모수 대안 |
| Tukey HSD | 사후 검정, FWER 통제 · ANOVA 후 쌍 비교 |
📈 관련 키워드 및 발전 흐름도
[t-분포 · Welch's t] → [t-검정 · ANOVA] → [사후 검정 · FWER 통제]
👶 어린이를 위한 3줄 비유 설명
- t-검정은 두 반의 평균 점수가 다른지 비교하는 거고, ANOVA는 세 반 이상을 한 번에 비교하는 방법이야.
- 카이제곱 검정은 숫자가 아니라 종류(색깔, 성별, 예/아니오)로 나뉜 데이터들이 서로 관련 있는지 알아보는 거야.
- 가장 중요한 건 데이터 종류와 집단 수에 맞는 도구를 골라 쓰는 것이야!