핵심 인사이트 (3줄 요약)
- 본질: 조건부 확률은 "B를 알았을 때 A의 확률"이고, 베이즈 정리 (Bayes' theorem)는 그 조건을 뒤집어 관측 후의 믿음, 즉 posterior를 계산한다.
- 가치: prior와 likelihood를 분리하면 적은 데이터에서도 기존 지식을 반영한 추론이 가능해져 진단·추천·이상탐지에 강해진다.
- 판단 포인트: P(test|disease)와 P(disease|test)를 혼동하면 base rate fallacy에 빠지므로, posterior 해석 전에 evidence를 확인해야 한다.
Ⅰ. 개요 및 필요성
데이터 과학과 AI에서 핵심은 불확실성을 업데이트하는 일이다. 어떤 사건의 확률은 새 증거가 들어오면 달라지며, 조건부 확률은 바로 그 갱신을 수학으로 적은 것이다.
Bayes' theorem은 prior와 likelihood를 결합해 posterior를 만든다. 즉 과거의 믿음과 현재의 증거를 합쳐, 다음 판단을 더 나은 방향으로 옮긴다.
P(A|B) = P(B|A) P(A) / P(B)
Posterior ∝ Likelihood × Prior
이 식은 복잡해 보여도 메시지는 단순하다. 새로운 정보를 보면 믿음을 갱신하라는 뜻이다.
- 📢 섹션 요약 비유: 새 소식을 들으면 생각도 다시 계산해야 한다.
Ⅱ. 아키텍처 및 핵심 원리
Bayes 사고의 구성 요소는 prior, likelihood, evidence, posterior다. prior는 시작 믿음이고, likelihood는 증거가 주어졌을 때의 설명력이며, evidence는 전체 정규화 항이다.
| 요소 | 의미 | 질문 |
|---|---|---|
| Prior | 사전 믿음 | 시작점은 무엇인가 |
| Likelihood | 증거의 설명력 | 이 증거가 얼마나 그럴듯한가 |
| Evidence | 정규화 항 | 전체 확률은 얼마인가 |
| Posterior | 갱신된 믿음 | 증거 후 무엇이 더 그럴듯한가 |
이 구조 덕분에 적은 샘플에도 과거 지식을 넣을 수 있다. 그래서 의료 진단, 스팸 필터, 이상탐지처럼 데이터가 불완전한 문제에서 강하다.
- 📢 섹션 요약 비유: 퍼즐의 조각과 상자의 덮개를 함께 봐야 그림이 맞는다.
Ⅲ. 비교 및 연결
조건부 확률은 사건 공간을 좁히는 개념이고, joint probability는 둘이 함께 일어날 확률이다. 또한 독립이면 조건이 붙어도 확률이 바뀌지 않는다.
| 비교 축 | Conditional | Joint | Independence |
|---|---|---|---|
| 의미 | 조건 아래 확률 | 동시 발생 확률 | 서로 영향 없음 |
| 핵심 | 정보 반영 | 결합 | 변화 없음 |
Bayes는 likelihood와 posterior의 방향을 바꿔 생각하게 한다. 그래서 진단 문제에서 P(질병|검사양성)을 구할 때 특히 유용하다.
- 📢 섹션 요약 비유: 같은 퍼즐도 단서를 하나 더 알면 다른 그림이 된다.
Ⅳ. 실무 적용 및 기술사 판단
실무에서는 base rate를 먼저 본다. 드문 사건일수록 검사가 꽤 정확해도 양성 후 실제 확률은 낮을 수 있다.
체크 포인트는 다음과 같다.
- prior를 어디서 가져오는가.
- likelihood가 독립 가정을 잘 만족하는가.
- posterior를 임계값으로 바꿀 때 비용이 균형적인가.
안티패턴은 P(test|disease)를 P(disease|test)처럼 읽는 것이다. 또 하나는 prior를 아무 근거 없이 강하게 두는 것이다. 둘 다 결과를 왜곡한다.
- 📢 섹션 요약 비유: 스티커가 진짜인지 보려면 전체 확률을 같이 봐야 한다.
Ⅴ. 기대효과 및 결론
Bayes는 "확률은 고정값이 아니라 갱신되는 믿음"이라는 점을 보여 준다. 그래서 데이터가 늘수록 추론이 더 정교해진다.
결론적으로 posterior는 답이 아니라 업데이트된 판단이다. 이 관점을 잡아야 통계, 머신러닝, 운영 의사결정이 한 방향으로 이어진다.
- 📢 섹션 요약 비유: 구름을 보면 우산 생각을 다시 해야 한다.
관련 개념 맵
| 개념 | 연결 포인트 |
|---|---|
| Prior | 사전 믿음 |
| Likelihood | 증거의 설명력 |
| Evidence | 정규화 |
| Posterior | 갱신된 확률 |
| Base Rate | 희귀 사건 해석의 핵심 |
관련 키워드 및 발전 흐름도
prior
│
▼
evidence
│
▼
likelihood
│
▼
normalization
│
▼
posterior
어린이를 위한 3줄 비유 설명
- 하늘이 어두우면 우산 생각이 더 커져요.
- 새로운 단서를 보면 생각도 바뀌어요.
- 그래서 컴퓨터도 힌트를 보며 다시 계산해요.