핵심 인사이트
t-검정(t-Test)은 두 집단의 평균 비교에서 모표준편차 σ 미지(未知) 상황을 다루는 핵심 도구이며, F-검정(F-Test)은 두 집단의 분산 비교를, ANOVA(Analysis of Variance, 분산 분석)는 3개 이상 집단의 평균 비교를 하나의 검정으로 처리한다. ANOVA의 F-통계량 = 집단 간 분산 / 집단 내 분산이라는 직관적 비율로, 집단 간 차이가 집단 내 자연 변동보다 크면 귀무 가설을 기각한다 — 신호 대 잡음비(SNR) 개념이다. 이원 분산 분석(Two-Way ANOVA)에서 교호작용(Interaction Effect)의 유무를 먼저 확인하는 것이 올바른 분석 순서다 — 교호작용이 있으면 주효과(Main Effect)만으로는 결과를 해석할 수 없다.
Ⅰ. t-검정의 세 가지 유형
학생 t-분포 (Student t-Distribution):
T = (x̄ - μ) / (s/√n) ~ t(n-1)
단일 표본 t-검정 (One-Sample t-Test):
- H₀: μ = μ₀
- T = (x̄ - μ₀) / (s/√n), df = n-1
독립 이표본 t-검정 (Independent Two-Sample t-Test):
- H₀: μ₁ = μ₂ (두 독립 집단의 평균이 같다)
- T = (x̄₁ - x̄₂) / SE_pooled
등분산 가정 시: SE_pooled = s_p · √(1/n₁ + 1/n₂)
s_p² = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2) (합동 분산, Pooled Variance)
df = n₁ + n₂ - 2
등분산 불가정 시 (Welch's t-Test):
df ≈ (s₁²/n₁ + s₂²/n₂)² / [...] (Welch-Satterthwaite)
대응 표본 t-검정 (Paired t-Test):
- 동일 대상을 두 번 측정 (사전-사후, 왼쪽-오른쪽)
- d_i = x_{i,before} - x_{i,after}로 변환 후 단일 표본 t-검정
- T = d̄ / (s_d/√n), df = n-1
- 짝 지어진 데이터의 개체 간 변동을 제거 → 더 강력한 검정
📢 섹션 요약 비유: t-검정의 세 유형은 "비교의 단위"에 따라 구분된다. 단일 표본은 "우리 반 vs 전국 평균", 독립 이표본은 "A반 vs B반", 대응 표본은 "수업 전 vs 수업 후 같은 학생들" — 누구를 비교하느냐가 다르다.
Ⅱ. F-검정과 등분산 가정
F-검정 (F-Test): 두 집단의 분산 비교
F = s₁² / s₂² ~ F(n₁-1, n₂-1)
H₀: σ₁² = σ₂² (두 집단의 모분산이 같다)
F-분포 (F-Distribution):
- 두 카이제곱 분포의 비율: F = (χ₁²/df₁) / (χ₂²/df₂)
- 비대칭, 오른쪽 꼬리 (항상 > 0)
- F(df₁, df₂) ≠ F(df₂, df₁) — 분자·분모 순서 중요
등분산 검정의 필요성:
- 독립 이표본 t-검정에서 등분산 가정(Homoscedasticity) 필요
- Levene's Test: F-검정보다 정규성 이탈에 견고한 대안
| 검정 | 목적 | 분포 | df |
|---|---|---|---|
| t-검정 | 평균 비교 (2집단) | t-분포 | n-1 또는 n₁+n₂-2 |
| F-검정 | 분산 비교 (2집단) | F-분포 | (n₁-1, n₂-1) |
| ANOVA F | 평균 비교 (k집단) | F-분포 | (k-1, N-k) |
📢 섹션 요약 비유: F-검정은 "두 공장의 제품 일관성 비교"와 같다. 평균 품질이 같아도(t-검정 통과), 한 공장은 편차가 크고 다른 공장은 일정하다면 분산 차이(F-검정)가 중요한 품질 지표가 된다.
Ⅲ. 일원 분산 분석 (One-Way ANOVA)
일원 ANOVA(One-Way ANOVA, Analysis of Variance): k개 집단(k ≥ 3)의 평균이 같은지 검정
H₀: μ₁ = μ₂ = ... = μ_k (모든 집단 평균이 같다)
H₁: 적어도 하나의 평균이 다르다
분산 분해 (Variance Decomposition):
SS_Total = SS_Between + SS_Within
↑총 변동 ↑집단 간 ↑집단 내(오차)
SS_Between = Σ_k n_k (x̄_k - x̄)² (집단 간 제곱합)
SS_Within = Σ_k Σᵢ (x_ki - x̄_k)² (집단 내 제곱합)
F-통계량 (ANOVA):
F = MS_Between / MS_Within
= (SS_Between / (k-1)) / (SS_Within / (N-k))
= 집단 간 평균 제곱 / 집단 내 평균 제곱
ANOVA 표 (ANOVA Table):
| 변동 원인 | SS | df | MS | F |
|---|---|---|---|---|
| 집단 간 (Between) | SS_B | k-1 | MS_B = SS_B/(k-1) | MS_B/MS_W |
| 집단 내 (Within) | SS_W | N-k | MS_W = SS_W/(N-k) | — |
| 전체 (Total) | SS_T | N-1 | — | — |
박스 플롯으로 ANOVA 시각화:
성적
▲
100│ ┌──────┐
90│ │ B │ ┌──────┐
80│ ┌───┤ ├──┤ C │
70│ │ A │ │ │ │
60│ └───┘ └──┘ └
└────────────────────────▶ 그룹
A B C
F = 집단 간 차이 / 집단 내 흩어짐
크면 → H₀ 기각 (집단 평균 다름)
📢 섹션 요약 비유: ANOVA의 F-통계량은 "방송 신호 대 잡음비(SNR)"와 같다. 집단 간 차이(신호)가 집단 내 변동(잡음)보다 충분히 크면, "이 차이는 의미 있는 신호다"라고 결론 내린다.
Ⅳ. 사후 검정 (Post-Hoc Test)
ANOVA에서 H₀ 기각 → "어느 집단 간에 차이가 있는가?" → 사후 검정 필요
터키 HSD (Tukey HSD, Honestly Significant Difference):
- 모든 가능한 쌍(pair) 비교
- 다중 비교 오류율(Family-Wise Error Rate)을 동시에 α로 제어
- 집단 크기가 같을 때 최적
본페로니 보정 (Bonferroni Correction):
- 보정 유의 수준: α/m (m = 비교 쌍 수)
- 매우 보수적, 적은 비교 수에서 적합
기타 사후 검정:
- Scheffé: 모든 가능한 대비(Contrast), 가장 보수적
- Dunnett: 대조군(Control) vs 각 처리군 비교에 특화
📢 섹션 요약 비유: 사후 검정은 "집단 간 일대일 결투"와 같다. ANOVA가 "누군가 다르다!"를 발견하면, 사후 검정은 "A vs B", "A vs C", "B vs C"를 차례로 확인해 정확히 누가 다른지 밝힌다 — 단, 여러 번 비교하는 만큼 기준을 엄격히 한다.
Ⅴ. 이원 분산 분석 (Two-Way ANOVA)
이원 ANOVA(Two-Way ANOVA): 두 요인(Factor)의 효과 동시 분석
반응변수 = 요인 A 주효과 + 요인 B 주효과 + 교호작용 (A×B) + 오차
분산 분해:
SS_Total = SS_A + SS_B + SS_A×B + SS_Error
교호작용 (Interaction Effect):
- 교호작용 있음: 요인 A의 효과가 요인 B 수준에 따라 달라짐
- 교호작용 없음: 두 요인이 독립적으로 반응변수에 영향
응용 분야 비교:
| 검정 방법 | 적합 상황 | 예시 |
|---|---|---|
| 단일 t-검정 | 1집단 vs 기준값 | 공장 제품 규격 검사 |
| 독립 t-검정 | 2집단 평균 비교 | A/B 테스트 |
| 대응 t-검정 | 동일 대상 전후 | 약물 투여 전후 |
| F-검정 | 2집단 분산 비교 | 두 기계 정밀도 비교 |
| 일원 ANOVA | 3+ 집단 평균 | 4가지 광고 전환율 |
| 이원 ANOVA | 2요인 + 교호작용 | 약물×투여량 실험 |
📢 섹션 요약 비유: 이원 ANOVA의 교호작용은 "비 오는 날은 우산 광고가 효과 있지만, 맑은 날은 선글라스 광고가 효과 있다"는 것처럼 — "날씨(A)"와 "광고 종류(B)" 단독 효과가 아닌, 두 요인의 조합이 결과를 결정하는 것이다.
📌 관련 개념 맵
| 개념 | 연결 개념 | 관계 |
|---|---|---|
| t-검정 | 학생 t-분포 | 검정 통계량 분포 |
| F-검정 | F-분포 | 검정 통계량 분포 |
| ANOVA | F-검정 | ANOVA F-통계량 사용 |
| 일원 ANOVA | 사후 검정 (Tukey HSD) | H₀ 기각 후 쌍 비교 |
| 이원 ANOVA | 교호작용 | 두 요인의 결합 효과 |
| 대응 t-검정 | 반복 측정 | 동일 대상 전후 비교 |
📈 관련 키워드 및 발전 흐름도
[z-검정 (Z-Test) — 모분산 알고 있을 때 평균 비교]
│
▼
[t-검정 (t-Test) — 모분산 미지, 1·2 표본 평균 비교]
│
▼
[F-검정 (F-Test) — 두 집단 분산 비교, ANOVA의 기반]
│
▼
[ANOVA (분산 분석) — 3개 이상 집단 평균 동시 비교]
│
▼
[사후 검정 (Post-hoc) — 어느 집단 쌍이 다른지 Tukey·Scheffe로 판별]
t-검정에서 출발한 가설 검정 체계는 F-검정과 ANOVA로 다집단 비교로 확장되고, 사후 검정으로 구체적 차이를 밝혀낸다.
👶 어린이를 위한 3줄 비유 설명
t-검정은 "두 반의 평균 시험 점수가 정말 다른가?"를 수학으로 확인하는 것이야 — 선생님 두 분의 교육 방식 중 어느 쪽이 더 효과적인지 알 수 있어. ANOVA는 "세 식당의 만족도가 정말 다른가?"처럼 3개 이상을 한 번에 비교해 — F값이 크면 "분명히 차이가 있다!", 작으면 "그냥 우연이야"라고 판단해. 이원 ANOVA에서 교호작용은 "커피+우유가 따로 마실 때보다 함께 마실 때 더 맛있는 현상"이야 — 두 가지 요소가 서로 영향을 주는 거라 따로따로 분석하면 놓치는 부분이 있어!