10. 중심 극한 정리 (CLT, Central Limit Theorem) — 표본 평균의 정규성

핵심 인사이트

CLT (Central Limit Theorem, 중심 극한 정리) 는 "원래 분포가 어떻든 간에, 독립 확률 변수를 많이 더하면 합(또는 평균)은 정규 분포로 수렴한다"는 통계학의 가장 경이로운 정리다. n≥30이면 실용적으로 성립하는 근사 기준이 통계 검정·여론 조사·A/B 테스트 설계의 수학적 토대가 되며, 표준 오차 (Standard Error) SE=σ/√n 는 샘플 크기의 효과를 정량화한다. 베리-에센 정리 (Berry-Esseen Theorem) 는 CLT 수렴 속도를 O(1/√n) 으로 정량화하여, "얼마나 많이 모아야 정규 분포에 가까워지는가"에 답한다.

Ⅰ. CLT의 정확한 진술

공식

X₁, X₂, ..., Xₙ이 i.i.d. (independent and identically distributed)
  — 독립이고 동일 분포를 따름
  E[Xᵢ] = μ,   Var[Xᵢ] = σ² < ∞

표본 합: Sₙ = X₁ + X₂ + ... + Xₙ
표본 평균: X̄ₙ = Sₙ / n

표준화된 합:
  Zₙ = (Sₙ - nμ) / (σ√n) = (X̄ₙ - μ) / (σ/√n)

CLT 결론:
  Zₙ →^d N(0, 1)   as n → ∞

즉: X̄ₙ ~ N(μ, σ²/n)   (근사적으로)

핵심 메시지

원래 분포 무관: Xᵢ가 균등, 이항, 지수, 베르누이 어떤 분포든 상관없음
유한 분산만 필요: σ² < ∞ 조건만 만족하면 됨
n→∞: 표본 크기가 커질수록 정규 근사 정확도 향상

┌──────────────────────────────────────────────────────────────┐
│  CLT 수렴 시각화 — 다양한 원래 분포 → 정규로 수렴             │
│                                                              │
│  균등 U(0,1)           이항 B(1,0.3)           지수 Exp(1)  │
│  ┌────────────┐        ┌────────────┐          ┌──────────┐ │
│  │ ─────────  │        │  ■  ■      │          │ \        │ │
│  │            │        │  │  │      │          │  \       │ │
│  └────────────┘        └────────────┘          └──────────┘ │
│        ↓ n=5                ↓ n=5                   ↓ n=5   │
│  ┌────────────┐        ┌────────────┐          ┌──────────┐ │
│  │   ╭─╮      │        │   ╭─╮      │          │   ╭─╮    │ │
│  │  ╭╯ ╰╮     │        │  ╭╯ ╰╮     │          │  ╭╯ ╰╮   │ │
│  └────────────┘        └────────────┘          └──────────┘ │
│        ↓ n=30               ↓ n=30                  ↓ n=30  │
│  ┌────────────┐        ┌────────────┐          ┌──────────┐ │
│  │    ╭──╮    │        │    ╭──╮    │          │   ╭──╮   │ │
│  │  ╭─╯  ╰─╮  │        │  ╭─╯  ╰─╮  │          │ ╭─╯  ╰─╮ │ │
│  └────────────┘        └────────────┘          └──────────┘ │
│                                                              │
│  어떤 분포로 시작하든 n=30 이상이면 종 모양(정규)으로 수렴!  │
└──────────────────────────────────────────────────────────────┘

📢 섹션 요약 비유: 어떤 나라 사람들의 키 분포가 이상하게 생겼어도, "500명씩 무작위로 묶어 평균 키를 반복 측정"하면 그 평균들은 자연스럽게 정규 분포를 그린다 — 이것이 CLT의 마법이다.

Ⅱ. 표준 오차 — 표본 크기의 효과

표준 오차 (Standard Error, SE)

SE = σ / √n

해석:
  - n개의 표본 평균 X̄의 표준편차
  - n이 4배 증가 → SE가 2배 감소 (정밀도 2배 향상)
  - n이 100배 증가 → SE가 10배 감소

표본 평균의 분포:
  X̄ ~ N(μ, σ²/n) = N(μ, SE²)

n에 따른 SE 변화:

n	SE (σ=1 가정)	정밀도 향상
1	1.000	기준
4	0.500	2배
25	0.200	5배
100	0.100	10배
400	0.050	20배
10,000	0.010	100배

핵심: 정밀도를 2배 높이려면 4배 더 많은 데이터가 필요하다 — 비용 대비 효과 체감 법칙.

┌──────────────────────────────────────────────────────────────┐
│  표본 크기 n과 표본 평균 분포 변화                            │
│                                                              │
│         n=1 (원래 분포)                                      │
│  ╭──────────────────────╮   폭이 넓음 (불확실)               │
│  ╯                      ╰                                    │
│                                                              │
│         n=10                                                 │
│      ╭──────────╮           폭이 좁아짐                      │
│      ╯          ╰                                            │
│                                                              │
│         n=100                                                │
│         ╭────╮              훨씬 좁음 (정밀)                  │
│         ╯    ╰                                               │
│                                                              │
│  SE = σ/√n — 샘플이 많을수록 X̄는 μ에 집중됨                 │
└──────────────────────────────────────────────────────────────┘

📢 섹션 요약 비유: 표준 오차는 "여론 조사를 1,000명 대신 4,000명에게 물어보면 오차 범위가 절반으로 준다"는 원리다 — 더 많이 물을수록 더 확실해지지만, 비용은 4배가 든다.

Ⅲ. 증명 스케치 — 특성 함수 활용

특성 함수 (Characteristic Function)

특성 함수: φ_X(t) = E[e^{itX}]   (푸리에 변환 형태)

덧셈 특성:
  X₁+X₂ 독립이면: φ_{X₁+X₂}(t) = φ_{X₁}(t) · φ_{X₂}(t)

N(0,1)의 특성 함수: φ_Z(t) = e^{-t²/2}

CLT 증명 아이디어

1. Xᵢ의 특성 함수를 t=0 주변 테일러 전개:
   φ_X(t/σ√n) = 1 - t²/2n + O(1/n²)

2. n개 독립 변수의 표준화된 합의 특성 함수:
   φ_{Zₙ}(t) = [φ_X(t/σ√n)]ⁿ
              = [1 - t²/2n + O(1/n²)]ⁿ

3. n→∞ 극한:
   → [1 - t²/2n]ⁿ → e^{-t²/2}   (e의 정의)

4. e^{-t²/2} = N(0,1)의 특성 함수  □

이 증명은 (1+x/n)ⁿ → eˣ 의 극한을 활용한 우아한 구조다.

📢 섹션 요약 비유: CLT 증명은 "n개의 작은 기여가 쌓이면 마지막에는 항상 같은 형태(e^{-t²/2})로 수렴한다"는 수학적 필연성을 보여준다.

Ⅳ. 베리-에센 정리 — 수렴 속도 정량화

Berry-Esseen 정리

|P(Zₙ ≤ x) - Φ(x)| ≤ C · E[|X-μ|³] / (σ³√n)
                   = O(1/√n)

여기서:
  Φ(x): 표준 정규 분포의 CDF
  C: 상수 (약 0.4748)
  E[|X-μ|³]: 3차 절대 중심 모멘트 (비대칭 정도 반영)

실용적 의미:

분포 특성	필요한 n (5% 오차 수준)
대칭 (균등 분포 등)	n ≈ 10~20
약간 비대칭	n ≈ 30
심한 비대칭 (지수 분포 등)	n ≈ 100+

n≥30 규칙의 근거: 대부분의 실용적 분포에서 30개면 CLT 근사가 충분히 정확함.

📢 섹션 요약 비유: 베리-에센 정리는 "얼마나 기다리면 정규 분포처럼 될까"에 대한 수학적 답이다 — O(1/√n) 이므로, 비대칭 분포일수록 더 오래 기다려야 한다.

Ⅴ. CLT의 실무 응용

A/B 테스팅

A그룹 전환율: X̄_A ~ N(p_A, p_A(1-p_A)/n_A)
B그룹 전환율: X̄_B ~ N(p_B, p_B(1-p_B)/n_B)

검정 통계량 (CLT 기반):
  Z = (X̄_A - X̄_B) / SE_diff ~ N(0,1)

→ 샘플 크기 n이 충분하면 (n≥30) 전환율 분포에 무관하게 Z-test 사용 가능

여론 조사 (Election Polling)

모집단 지지율 p, 표본 크기 n

표본 지지율 p̂ ~ N(p, p(1-p)/n)   (CLT)

95% 신뢰 구간:
  p̂ ± 1.96 · √(p̂(1-p̂)/n)

n=1,000이면 오차 범위 ≈ ±3.1%
n=4,000이면 오차 범위 ≈ ±1.5%

품질 관리와 CLT

생산 공정 n개 측정의 평균 X̄ ~ N(μ, σ²/n)

→ 개별 제품은 다양한 분포를 가져도,
  배치(Batch) 평균은 정규 분포를 따름
→ 관리도(Control Chart) 설계의 이론적 근거

CLT 조건·수렴 속도·응용 분야 요약

항목	내용
조건	i.i.d., 유한 분산 σ² < ∞
수렴 속도	O(1/√n) (베리-에센 정리)
실용 기준	n ≥ 30 (대칭 분포), n ≥ 100 (비대칭)
수렴 대상	N(μ, σ²/n)
주요 응용	A/B 테스팅, 여론 조사, 품질 관리, 가설 검정
한계	무한 분산 분포 (코시 분포 등) 에는 미적용

📢 섹션 요약 비유: CLT는 "10개 주사위를 동시에 던져 합계를 구하는 실험을 수천 번 반복하면, 주사위 개수에 관계없이 합계 분포가 종 모양이 된다"는 자연의 법칙이다.

📌 관련 개념 맵

개념	연결 개념	관계
CLT	정규 분포	극한 수렴 대상
표준 오차	신뢰 구간	SE = σ/√n
베리-에센 정리	수렴 속도	O(1/√n) 정량화
i.i.d.	독립 사건, 동일 분포	CLT 적용 조건
A/B 테스팅	가설 검정	CLT 기반 Z-test
대수의 법칙	X̄→μ 수렴	CLT의 약한 버전

📈 관련 키워드 및 발전 흐름도

[비정규 원시 분포 — 균등·이항·지수 등]
    │
    ▼
[i.i.d. 독립 동일 분포 표본 — 반복 관측]
    │
    ▼
[표본 합/평균 — 누적 중심화]
    │
    ▼
[중심 극한 정리 (CLT) — 정규 분포 근사]
    │
    ├─▶ [표준 오차 (SE) — σ/√n로 정밀도 측정]
    │
    └─▶ [Berry-Esseen 정리 — 수렴 속도 O(1/√n)]
                │
                ▼
            [A/B 테스트·여론조사·신뢰구간 — 실무 추론]

CLT는 다양한 원시 분포의 표본 평균을 정규 근사로 바꾸어, 표준 오차와 통계적 추론의 공통 언어를 제공한다.

👶 어린이를 위한 3줄 비유 설명

CLT는 "동전을 100번 던져 앞면 나온 비율을 수천 번 기록하면, 그 비율들이 종 모양을 그린다"는 놀라운 규칙이야 — 동전이 어떻게 생겼든 상관없이!
표준 오차는 "더 많이 물어볼수록 여론 조사 오차가 줄어든다"는 것인데, n을 4배 늘려야 오차가 절반이 돼.
CLT 덕분에 통계학자들은 "어떤 분포인지 몰라도, 충분히 많이 모으면 정규 분포로 다룰 수 있다"는 강력한 도구를 갖게 됐어.