516. 마르코프 체인: 흡수, 에르고딕, 전이 상태 (Markov Chain Absorbing Ergodic Transition)

핵심 인사이트 (3줄 요약)

본질: 마르코프 성질(Markov Property)은 "미래 상태는 오직 현재 상태에만 의존하고, 과거 이력은 무관하다"는 메모리 없음(Memoryless) 가정이다.

가치: 에르고딕 체인(Ergodic Chain)은 시간이 충분히 지나면 초기 상태와 무관하게 고유한 정상 분포(Stationary Distribution)에 수렴 — PageRank와 MCMC 샘플링의 이론적 토대.

판단 포인트: 흡수 상태(Absorbing State) 존재 여부가 체인 거동을 결정한다 — 흡수 상태 있으면 결국 흡수, 없고 에르고딕이면 정상 분포 수렴.

Ⅰ. 개요 및 필요성

현실의 많은 시스템 — 날씨, 주가, 고객 상태, 웹 탐색 — 은 이전 상태에서 다음 상태로 확률적으로 이행한다. 마르코프 체인은 이런 확률적 동역학을 수학적으로 모델링한다.

마르코프 체인 기본 요소

상태 공간 S: {S₁, S₂, ..., Sₙ} — 시스템이 취할 수 있는 모든 상태.
전이 확률 P(i→j): 상태 i에서 j로 이동할 확률 (각 행의 합 = 1).
전이 행렬 (Transition Matrix): n×n 행렬, Pᵢⱼ = P(Xₜ₊₁=j | Xₜ=i).
📢 섹션 요약 비유: 마르코프 체인은 기억상실증 여행자 같아. 오늘 어디 있는지는 알지만, 어제 어디서 왔는지는 신경 쓰지 않고 오늘 위치에서만 다음 목적지를 정해.

Ⅱ. 아키텍처 및 핵심 원리

상태 분류와 체인 구조

마르코프 체인 상태 유형
┌───────────────────────────────────────┐
│  일시적 상태 (Transient)              │
│  한 번 떠나면 돌아올 보장 없음         │
├───────────────────────────────────────┤
│  재귀적 상태 (Recurrent)              │
│  언제나 반드시 다시 방문              │
│  ├─ 양성 재귀 (Positive Recurrent)   │
│  │  평균 재방문 시간 유한 → 정상분포  │
│  └─ 영 재귀 (Null Recurrent)         │
│     평균 재방문 시간 무한             │
├───────────────────────────────────────┤
│  흡수 상태 (Absorbing)               │
│  진입 후 탈출 불가: P(i→i) = 1       │
└───────────────────────────────────────┘

정상 분포 (Stationary Distribution)

전이 행렬 P의 정상 분포 π는 π = πP를 만족하는 확률 벡터.

에르고딕 체인(Ergodic Chain): 모든 상태가 도달 가능(Irreducible) + 비주기적(Aperiodic) → 유일한 정상 분포 존재.
수렴 속도: 혼합 시간(Mixing Time) = 초기 분포가 정상 분포의 ε-근방에 도달하는 시간.

체인 유형	조건	장기 거동
에르고딕 (Ergodic)	기약 + 비주기	정상 분포 수렴
흡수 체인 (Absorbing)	흡수 상태 ≥ 1개	흡수 상태로 진입
주기적 (Periodic)	주기 d ≥ 2	정상 분포 없음

📢 섹션 요약 비유: 에르고딕 체인은 완전히 섞인 카드 덱처럼, 어떤 순서로 시작해도 충분히 섞으면 결국 같은 확률 분포로 수렴해. 흡수 상태는 블랙홀 같아서 한 번 빠지면 절대 못 나와.

Ⅲ. 비교 및 연결

PageRank와 마르코프 체인

Google PageRank:

웹 페이지 = 상태, 하이퍼링크 = 전이 확률.
랜덤 서퍼(Random Surfer)가 링크를 따라 이동하는 마르코프 체인.
댐핑 팩터(Damping Factor) α=0.85: 85% 확률로 링크 클릭, 15%는 임의 페이지 이동 → 에르고딕성 보장.
정상 분포 π = PageRank 점수.

MCMC (Markov Chain Monte Carlo)

직접 샘플링이 어려운 복잡한 분포에서 마르코프 체인을 이용해 샘플링.
Metropolis-Hastings: 제안 분포에서 후보 생성 → 수락/기각 결정.
Gibbs Sampling: 조건부 분포를 순환적으로 샘플링.
수렴 후 체인의 상태 시퀀스 = 목표 분포의 샘플.
📢 섹션 요약 비유: MCMC는 지도 없이 산을 탐험하면서 높이 비례 확률로 각 위치에 머무는 방법이야. 오래 걸으면 결국 높은 봉우리 근처에 자주 머물게 되어 지형도(목표 분포)를 자동으로 그릴 수 있어.

Ⅳ. 실무 적용 및 기술사 판단

시나리오 1 - 고객 이탈 분석:

상태: {활성, 휴면, 이탈(흡수)}.
전이 행렬로 각 상태에서 이탈까지의 기대 전환 횟수 계산.
흡수 체인 분석: 기본 행렬(Fundamental Matrix) N = (I−Q)⁻¹ → 흡수 전 평균 방문 횟수 계산.
활성 고객의 평균 이탈까지 기간 = 8.3개월 → 4개월차 이전 재활성화 캠페인 집중.

시나리오 2 - 날씨 예측:

상태: {맑음, 흐림, 비}.
전이 행렬: 맑음 → 맑음 0.7, 맑음 → 흐림 0.2, 맑음 → 비 0.1.
5일 후 날씨 분포 = 초기 분포 × P⁵.
정상 분포 수렴 후 맑음 45%, 흐림 35%, 비 20%.

기술사 판단 포인트:

전이 행렬 구축: 충분한 관측 데이터 → 최대 가능도 추정(MLE).
비정상성(Non-Stationarity): 시간에 따라 전이 확률이 변하면 숨겨진 마르코프 모델(HMM, Hidden Markov Model) 적용.
📢 섹션 요약 비유: 고객 이탈 분석에서 "지금 이 고객이 휴면 상태야. 이탈까지 평균 몇 개월이나 남았어?"를 마르코프 체인이 계산해줘. 흡수 상태(이탈)에 빠지기 전 개입 타이밍을 잡는 거야.

Ⅴ. 기대효과 및 결론

마르코프 체인은 확률 동역학의 범용 프레임워크로 PageRank부터 강화 학습(RL)의 MDP(Markov Decision Process)까지 광범위하게 활용된다.

예측 정밀화: 장기 거동(정상 분포)과 단기 거동(k단계 전이) 모두 계산 가능.
알고리즘 기반: RL의 MDP는 마르코프 체인에 행동(Action)과 보상(Reward)을 추가한 확장.
베이즈 추론 실용화: MCMC로 해석적으로 풀기 어려운 사후 분포(Posterior) 샘플링.
📢 섹션 요약 비유: 마르코프 체인은 미래를 예측하는 데 현재 순간만 필요하다는 간단하지만 강력한 원칙이야. 이 원칙 하나로 구글 검색 순위, 게임 AI, 유전자 분석까지 다 연결돼 있어.

📌 관련 개념 맵

개념	연결 포인트
마르코프 성질	메모리 없음, MDP · RL, 시계열
정상 분포	에르고딕, 고유벡터 · PageRank
흡수 상태	기본 행렬 · 고객 이탈 분석
MCMC	Metropolis-Hastings, Gibbs · 베이즈 추론
HMM	숨겨진 상태, Viterbi · 음성 인식, 생물정보학

📈 관련 키워드 및 발전 흐름도

[메모리 없음 · MDP] → [마르코프 체인: 흡수 · 에르고딕] → [숨겨진 상태 · Viterbi]

👶 어린이를 위한 3줄 비유 설명

마르코프 체인은 기억상실 개구리가 연못에서 수련잎을 뛰어다니는 것처럼, 지금 어느 잎에 있는지만 보고 다음 잎으로 점프하는 방식이야.
흡수 상태는 개구리가 빠지면 절대 못 나오는 함정 잎이야 — 한 번 빠지면 끝!
에르고딕 체인은 계속 뛰다 보면 결국 어느 잎에 제일 많이 있게 되는지 알 수 있어 — 그게 바로 정상 분포야!