19. t-검정 / F-검정 / ANOVA — 평균 비교 검정

핵심 인사이트

t-검정(t-Test)은 두 집단의 평균 비교에서 모표준편차 σ 미지(未知) 상황을 다루는 핵심 도구이며, F-검정(F-Test)은 두 집단의 분산 비교를, ANOVA(Analysis of Variance, 분산 분석)는 3개 이상 집단의 평균 비교를 하나의 검정으로 처리한다. ANOVA의 F-통계량 = 집단 간 분산 / 집단 내 분산이라는 직관적 비율로, 집단 간 차이가 집단 내 자연 변동보다 크면 귀무 가설을 기각한다 — 신호 대 잡음비(SNR) 개념이다. 이원 분산 분석(Two-Way ANOVA)에서 교호작용(Interaction Effect)의 유무를 먼저 확인하는 것이 올바른 분석 순서다 — 교호작용이 있으면 주효과(Main Effect)만으로는 결과를 해석할 수 없다.

Ⅰ. t-검정의 세 가지 유형

학생 t-분포 (Student t-Distribution):

T = (x̄ - μ) / (s/√n)   ~ t(n-1)

단일 표본 t-검정 (One-Sample t-Test):

H₀: μ = μ₀
T = (x̄ - μ₀) / (s/√n), df = n-1

독립 이표본 t-검정 (Independent Two-Sample t-Test):

H₀: μ₁ = μ₂ (두 독립 집단의 평균이 같다)
T = (x̄₁ - x̄₂) / SE_pooled

등분산 가정 시: SE_pooled = s_p · √(1/n₁ + 1/n₂)
s_p² = [(n₁-1)s₁² + (n₂-1)s₂²] / (n₁+n₂-2)   (합동 분산, Pooled Variance)
df = n₁ + n₂ - 2

등분산 불가정 시 (Welch's t-Test):
df ≈ (s₁²/n₁ + s₂²/n₂)² / [...]   (Welch-Satterthwaite)

대응 표본 t-검정 (Paired t-Test):

동일 대상을 두 번 측정 (사전-사후, 왼쪽-오른쪽)
d_i = x_{i,before} - x_{i,after}로 변환 후 단일 표본 t-검정
T = d̄ / (s_d/√n), df = n-1
짝 지어진 데이터의 개체 간 변동을 제거 → 더 강력한 검정

📢 섹션 요약 비유: t-검정의 세 유형은 "비교의 단위"에 따라 구분된다. 단일 표본은 "우리 반 vs 전국 평균", 독립 이표본은 "A반 vs B반", 대응 표본은 "수업 전 vs 수업 후 같은 학생들" — 누구를 비교하느냐가 다르다.

Ⅱ. F-검정과 등분산 가정

F-검정 (F-Test): 두 집단의 분산 비교

F = s₁² / s₂²   ~   F(n₁-1, n₂-1)

H₀: σ₁² = σ₂²   (두 집단의 모분산이 같다)

F-분포 (F-Distribution):

두 카이제곱 분포의 비율: F = (χ₁²/df₁) / (χ₂²/df₂)
비대칭, 오른쪽 꼬리 (항상 > 0)
F(df₁, df₂) ≠ F(df₂, df₁) — 분자·분모 순서 중요

등분산 검정의 필요성:

독립 이표본 t-검정에서 등분산 가정(Homoscedasticity) 필요
Levene's Test: F-검정보다 정규성 이탈에 견고한 대안

검정	목적	분포	df
t-검정	평균 비교 (2집단)	t-분포	n-1 또는 n₁+n₂-2
F-검정	분산 비교 (2집단)	F-분포	(n₁-1, n₂-1)
ANOVA F	평균 비교 (k집단)	F-분포	(k-1, N-k)

📢 섹션 요약 비유: F-검정은 "두 공장의 제품 일관성 비교"와 같다. 평균 품질이 같아도(t-검정 통과), 한 공장은 편차가 크고 다른 공장은 일정하다면 분산 차이(F-검정)가 중요한 품질 지표가 된다.

Ⅲ. 일원 분산 분석 (One-Way ANOVA)

일원 ANOVA(One-Way ANOVA, Analysis of Variance): k개 집단(k ≥ 3)의 평균이 같은지 검정

H₀: μ₁ = μ₂ = ... = μ_k (모든 집단 평균이 같다)
H₁: 적어도 하나의 평균이 다르다

분산 분해 (Variance Decomposition):

SS_Total = SS_Between + SS_Within
  ↑총 변동      ↑집단 간       ↑집단 내(오차)

SS_Between = Σ_k n_k (x̄_k - x̄)²   (집단 간 제곱합)
SS_Within  = Σ_k Σᵢ (x_ki - x̄_k)² (집단 내 제곱합)

F-통계량 (ANOVA):

F = MS_Between / MS_Within
  = (SS_Between / (k-1)) / (SS_Within / (N-k))
  = 집단 간 평균 제곱 / 집단 내 평균 제곱

ANOVA 표 (ANOVA Table):

변동 원인	SS	df	MS	F
집단 간 (Between)	SS_B	k-1	MS_B = SS_B/(k-1)	MS_B/MS_W
집단 내 (Within)	SS_W	N-k	MS_W = SS_W/(N-k)	—
전체 (Total)	SS_T	N-1	—	—

박스 플롯으로 ANOVA 시각화:

   성적
    ▲
 100│     ┌──────┐
  90│     │  B   │  ┌──────┐
  80│ ┌───┤      ├──┤  C   │
  70│ │ A │      │  │      │
  60│ └───┘      └──┘      └
    └────────────────────────▶ 그룹
         A         B        C
   
  F = 집단 간 차이 / 집단 내 흩어짐
      크면 → H₀ 기각 (집단 평균 다름)

📢 섹션 요약 비유: ANOVA의 F-통계량은 "방송 신호 대 잡음비(SNR)"와 같다. 집단 간 차이(신호)가 집단 내 변동(잡음)보다 충분히 크면, "이 차이는 의미 있는 신호다"라고 결론 내린다.

Ⅳ. 사후 검정 (Post-Hoc Test)

ANOVA에서 H₀ 기각 → "어느 집단 간에 차이가 있는가?" → 사후 검정 필요

터키 HSD (Tukey HSD, Honestly Significant Difference):

모든 가능한 쌍(pair) 비교
다중 비교 오류율(Family-Wise Error Rate)을 동시에 α로 제어
집단 크기가 같을 때 최적

본페로니 보정 (Bonferroni Correction):

보정 유의 수준: α/m (m = 비교 쌍 수)
매우 보수적, 적은 비교 수에서 적합

기타 사후 검정:

Scheffé: 모든 가능한 대비(Contrast), 가장 보수적
Dunnett: 대조군(Control) vs 각 처리군 비교에 특화

📢 섹션 요약 비유: 사후 검정은 "집단 간 일대일 결투"와 같다. ANOVA가 "누군가 다르다!"를 발견하면, 사후 검정은 "A vs B", "A vs C", "B vs C"를 차례로 확인해 정확히 누가 다른지 밝힌다 — 단, 여러 번 비교하는 만큼 기준을 엄격히 한다.

Ⅴ. 이원 분산 분석 (Two-Way ANOVA)

이원 ANOVA(Two-Way ANOVA): 두 요인(Factor)의 효과 동시 분석

반응변수 = 요인 A 주효과 + 요인 B 주효과 + 교호작용 (A×B) + 오차

분산 분해:

SS_Total = SS_A + SS_B + SS_A×B + SS_Error

교호작용 (Interaction Effect):

교호작용 있음: 요인 A의 효과가 요인 B 수준에 따라 달라짐
교호작용 없음: 두 요인이 독립적으로 반응변수에 영향

응용 분야 비교:

검정 방법	적합 상황	예시
단일 t-검정	1집단 vs 기준값	공장 제품 규격 검사
독립 t-검정	2집단 평균 비교	A/B 테스트
대응 t-검정	동일 대상 전후	약물 투여 전후
F-검정	2집단 분산 비교	두 기계 정밀도 비교
일원 ANOVA	3+ 집단 평균	4가지 광고 전환율
이원 ANOVA	2요인 + 교호작용	약물×투여량 실험

📢 섹션 요약 비유: 이원 ANOVA의 교호작용은 "비 오는 날은 우산 광고가 효과 있지만, 맑은 날은 선글라스 광고가 효과 있다"는 것처럼 — "날씨(A)"와 "광고 종류(B)" 단독 효과가 아닌, 두 요인의 조합이 결과를 결정하는 것이다.

📌 관련 개념 맵

개념	연결 개념	관계
t-검정	학생 t-분포	검정 통계량 분포
F-검정	F-분포	검정 통계량 분포
ANOVA	F-검정	ANOVA F-통계량 사용
일원 ANOVA	사후 검정 (Tukey HSD)	H₀ 기각 후 쌍 비교
이원 ANOVA	교호작용	두 요인의 결합 효과
대응 t-검정	반복 측정	동일 대상 전후 비교

📈 관련 키워드 및 발전 흐름도

[z-검정 (Z-Test) — 모분산 알고 있을 때 평균 비교]
    │
    ▼
[t-검정 (t-Test) — 모분산 미지, 1·2 표본 평균 비교]
    │
    ▼
[F-검정 (F-Test) — 두 집단 분산 비교, ANOVA의 기반]
    │
    ▼
[ANOVA (분산 분석) — 3개 이상 집단 평균 동시 비교]
    │
    ▼
[사후 검정 (Post-hoc) — 어느 집단 쌍이 다른지 Tukey·Scheffe로 판별]

t-검정에서 출발한 가설 검정 체계는 F-검정과 ANOVA로 다집단 비교로 확장되고, 사후 검정으로 구체적 차이를 밝혀낸다.

👶 어린이를 위한 3줄 비유 설명

t-검정은 "두 반의 평균 시험 점수가 정말 다른가?"를 수학으로 확인하는 것이야 — 선생님 두 분의 교육 방식 중 어느 쪽이 더 효과적인지 알 수 있어. ANOVA는 "세 식당의 만족도가 정말 다른가?"처럼 3개 이상을 한 번에 비교해 — F값이 크면 "분명히 차이가 있다!", 작으면 "그냥 우연이야"라고 판단해. 이원 ANOVA에서 교호작용은 "커피+우유가 따로 마실 때보다 함께 마실 때 더 맛있는 현상"이야 — 두 가지 요소가 서로 영향을 주는 거라 따로따로 분석하면 놓치는 부분이 있어!