17. 신뢰 구간 (Confidence Interval) — 모수 추정의 불확실성

핵심 인사이트

신뢰 구간(Confidence Interval)의 올바른 해석은 "이 구간이 모수를 포함할 확률이 95%"가 아니라, "이 방법을 반복 사용하면 구간들의 95%가 모수를 포함한다"는 절차적 보장이다 — 모수는 고정값이므로 확률 대상이 될 수 없다. 신뢰 구간 폭은 표본 크기 n의 제곱근에 반비례(∝ 1/√n)하므로, 정밀도를 2배로 높이려면 표본을 4배 늘려야 한다 — 데이터 수집 비용과 정밀도의 트레이드오프다. 학생 t-분포(Student t-Distribution)는 모표준편차를 모를 때 소표본(Small Sample)에서 정규 분포 대신 사용하며, 자유도(Degrees of Freedom)가 증가할수록 표준 정규 분포에 수렴한다.

Ⅰ. 신뢰 구간의 정의와 구성

신뢰 구간 (Confidence Interval, CI): 모수 θ의 추정치와 불확실성을 구간으로 표현.

95% CI 공식 (σ 알 때):

CI = x̄ ± z_{α/2} · (σ/√n)

z_{0.025} = 1.96 (양측 95% CI)
z_{0.005} = 2.576 (양측 99% CI)

95% CI 공식 (σ 모를 때, t-분포 사용):

CI = x̄ ± t_{α/2, n-1} · (s/√n)

s = 표본 표준편차, df = n-1 (자유도)

오차 한계 (Margin of Error, MoE):

MoE = z_{α/2} · (σ/√n) = CI 반폭

95% CI의 올바른 해석 예시:

100번 반복 실험 시 신뢰 구간 시각화:

실험  1: ├────────•────────┤ ← 모수 포함 ✅
실험  2:     ├────────•────────┤ ✅
실험  3: ├──────•──────┤ ✅
실험  4:               ├────•────┤ ❌ (모수 미포함)
실험  5:         ├────────•────────┤ ✅
...
약 95개의 구간이 모수 μ를 포함 ─────│──────
                                    ↑ 모수 μ (고정값)

📢 섹션 요약 비유: 신뢰 구간은 "낚시 그물의 크기"와 같다. 그물을 100번 던지면 약 95번은 물고기(모수)를 잡는다 — 물고기가 그물 안에 있을 확률이 95%가 아니라, 그물을 던지는 방법이 95% 성공률을 보장하는 것이다.

Ⅱ. 학생 t-분포와 소표본 보정

**학생 t-분포 (Student t-Distribution)**는 영국 통계학자 윌리엄 고셋(W.S. Gosset)이 맥주 품질 관리를 위해 개발 (필명 "Student").

t-분포 vs 정규 분포:

특성	정규 분포 N(0,1)	t-분포 t(df)
사용 조건	σ 알 때, 또는 n 클 때	σ 모를 때, 소표본
꼬리 두께	얇음	두꺼움 (Heavy Tail)
df = ∞	—	정규 분포로 수렴
df = 1	—	코시 분포 (가장 두꺼운 꼬리)

꼬리가 두꺼운 이유: σ를 모르고 s로 추정하는 추가적 불확실성을 반영.

자유도 (Degrees of Freedom, df):

단일 표본: df = n - 1
독립 이표본: df ≈ n₁ + n₂ - 2 (등분산 가정)
대응 표본: df = n - 1 (차이값 기준)

df가 커질수록 t-분포는 정규 분포에 수렴:

df = 30 이상이면 실용적으로 정규 분포와 거의 동일

📢 섹션 요약 비유: t-분포는 "작은 마을의 선거 여론 조사"와 같다. 주민이 1,000만 명인 도시(대표본)에선 표준 정규 분포로 충분하지만, 주민 30명의 작은 마을(소표본)에선 더 두꺼운 오차 범위(t-분포)가 필요하다.

Ⅲ. 신뢰 구간 폭과 표본 크기

신뢰 구간 폭과 표본 크기의 관계:

폭 = 2 × z_{α/2} × σ/√n

폭 ∝ 1/√n

필요 표본 크기 계산 (원하는 MoE 달성):

n = (z_{α/2} · σ / MoE)²

표본 크기별 95% CI 폭 변화:

n	상대적 CI 폭	설명
25	100% (기준)
100	50%	n 4배 → 폭 2배 감소
400	25%	n 16배 → 폭 4배 감소
900	16.7%	n 36배 → 폭 6배 감소

핵심 법칙: 정밀도(폭)를 k배 높이려면 표본 크기를 k²배 늘려야 한다.

┌──────────────────────────────────────────────┐
│         표본 크기와 CI 폭의 관계               │
├──────┬───────────────────────────────────────┤
│ n=10 │ ├──────────────────────────────────┤  │
│ n=25 │     ├──────────────────────┤         │
│ n=100│          ├──────────┤                │
│ n=400│               ├─────┤               │
└──────┴───────────────────────────────────────┘
              x̄ 중심

📢 섹션 요약 비유: CI 폭과 표본 크기는 "확성기 음량과 거리"와 같다. 거리를 4배 늘리면 소리가 반으로 줄듯, 표본을 4배 늘려야 CI 폭이 반으로 줄어 — 정밀도 향상에는 제곱 비용이 든다.

Ⅳ. 부트스트랩 신뢰 구간

**부트스트랩 신뢰 구간 (Bootstrap Confidence Interval)**은 비모수적(Non-Parametric) 방법으로, 분포 가정 없이 CI를 추정한다.

절차:

원본 데이터(n개)에서 복원 추출(Sampling with Replacement)로 B개 부트스트랩 표본 생성
각 표본에서 통계량(평균, 중앙값 등) 계산 → {θ̂₁, ..., θ̂_B}
이 B개 통계량의 경험적 분포로 CI 구성

방법별 부트스트랩 CI:

백분위수(Percentile) 방법: θ̂*의 2.5%, 97.5% 분위수
BCa (Bias-Corrected and Accelerated): 편향과 왜도 보정, 가장 정확

사용 시점: 이론적 분포 유도가 어려운 중앙값, 상관계수, 복잡한 모델의 CI 추정에 활용.

📢 섹션 요약 비유: 부트스트랩은 "내가 가진 데이터로 가상 실험 수천 번 하기"와 같다. 실제로 새 데이터를 수집하는 대신, 기존 데이터를 섞고 뽑아 "만약 이런 표본이었다면?"을 무수히 반복해 불확실성을 추정한다.

Ⅴ. 응용: A/B 테스팅과 임상 시험

A/B 테스팅: 두 버전(A, B)의 전환율 차이의 CI

CI for (p_B - p_A):
(p̂_B - p̂_A) ± z_{α/2} · √[p̂_A(1-p̂_A)/n_A + p̂_B(1-p̂_B)/n_B]

CI가 0을 포함하면 → 통계적으로 유의미한 차이 없음
CI가 0을 포함하지 않으면 → 유의미한 차이 있음

임상 시험 (Clinical Trial): 새 약품의 효과 크기 CI

규제 기관(FDA)은 단순 p-값이 아닌 효과 크기의 CI 요구
CI 하한이 최소 임상 유의 차이(MCID)를 초과해야 승인

선거 여론 조사:

"A 후보 지지율 48% ± 3.5% (95% CI)"
MoE = 3.5%이면 n ≈ 784명 (σ_p = 0.5 가정)

z-분포 vs t-분포 CI 비교:

조건	사용 분포	95% CI 임계값
σ 알고, n 큼	N(0,1)	±1.96
σ 모름, n=10	t(9)	±2.262
σ 모름, n=30	t(29)	±2.045
σ 모름, n=100	t(99)	±1.984

📢 섹션 요약 비유: A/B 테스팅의 CI는 "저울로 재는 체중 차이"와 같다. 체중 차이가 1kg인데 저울 오차가 ±3kg이면 의미 없듯, 전환율 차이가 CI 안에 있으면 "그냥 우연의 차이"라고 봐야 한다.

📌 관련 개념 맵

개념	연결 개념	관계
신뢰 구간	표본 크기 n	CI 폭 ∝ 1/√n
신뢰 구간	유의 수준 α	α 낮으면 CI 넓어짐
학생 t-분포	자유도 df	df → ∞이면 정규 분포
부트스트랩 CI	비모수 방법	분포 가정 불필요
신뢰 구간	가설 검정	CI에 귀무값 포함 여부 = p > α
베이즈 Credible Interval	CI와 비교	해석 차이 (θ를 확률 변수 취급)

📈 관련 키워드 및 발전 흐름도

[점 추정 (Point Estimation) — 표본 통계량 하나로 모수 추정, 불확실성 미표현]
    │
    ▼
[신뢰 구간 (Confidence Interval) — 표본 분포 기반 모수의 범위 추정]
    │
    ▼
[t-분포 (Student's t-Distribution) — 소표본 신뢰 구간, 자유도에 따른 폭 조정]
    │
    ▼
[부트스트랩 신뢰 구간 (Bootstrap CI) — 재표본 시뮬레이션, 분포 가정 없이 구간 추정]
    │
    ▼
[베이즈 신용 구간 (Bayesian Credible Interval) — 사전 분포 반영, 사후 확률 직접 해석]
    │
    ▼
[A/B 테스트 신뢰 구간 — 실험 설계·표본 크기 계산·통계적 유의성 판단의 실무 표준]

이 흐름은 단일 점 추정의 한계를 보완하기 위해 신뢰 구간이 도입되고, 소표본·비정규·사전 정보 반영 요건에 따라 다양한 구간 추정 기법으로 확장되는 통계적 추론 방법론의 발전을 보여준다.

👶 어린이를 위한 3줄 비유 설명

낚시 그물을 100번 던지면 95번쯤은 물고기를 잡아 — 95% 신뢰 구간은 "이 방법을 쓰면 100번 중 95번은 정답 범위 안에 들어온다"는 보장이야. 표본을 4배 많이 모아야 오차가 반으로 줄어 — 더 정확하게 알고 싶을수록 훨씬 더 많은 데이터가 필요해! 작은 반(소표본)에서 여론 조사하면 t-분포를 써야 해 — 정규분포보다 오차 범위를 더 넓게 잡아야 "혹시 모를 실수"를 보완할 수 있거든.