334. 마르코프 체인 (Markov Chain)

핵심 인사이트 (3줄 요약)

본질: 마르코프 체인(Markov Chain)은 "내일의 날씨는 오직 오늘의 날씨에만 영향을 받고, 어제나 그제 날씨는 알 필요가 없다"는 극단적인 '무기억성(Memorylessness)'을 가정한 상태 전이 확률 모델이다.

가치: 세상의 복잡한 연속된 사건(시간의 흐름, 문장의 단어 순서 등)을 예측할 때, 과거의 모든 역사를 추적하는 방대한 연산량을 포기하는 대신 오직 '현재 상태'만으로 미래를 빠르고 가볍게 예측할 수 있게 해준다.

판단 포인트: 과거의 맥락이 중요한 데이터(예: 긴 소설책 쓰기)에는 마르코프 체인을 쓰면 말이 안 되는 문장이 나오므로 한계가 명확하지만, 구글의 페이지랭크(PageRank)나 강화학습의 마르코프 결정 과정(MDP)처럼 현재 상태만이 행동을 결정하는 아키텍처에서는 절대적인 수학적 뼈대가 된다.

Ⅰ. 개요 및 필요성

만약 내일 비가 올 확률을 예측해야 한다면, 기상청은 지난 100년간의 날씨 데이터를 모두 수퍼컴퓨터에 넣고 계산하려 할 것이다. 하지만 연산 비용이 너무 비싸다. 러시아의 수학자 안드레이 마르코프(Andrey Markov)는 생각했다. "과거의 날씨를 다 알 필요가 있을까? 사실 내일 날씨를 결정하는 가장 중요한 단서는 그냥 '오늘 날씨' 하나 아닐까?"

이 아이디어에서 출발하여, **"미래 상태의 확률은 오직 현재 상태에 의해서만 결정되며, 과거의 역사는 무시한다"**는 대담한 가정을 세운 것이 마르코프 체인이다. 복잡한 현실 세계를 단순한 '현재와 다음 단계 간의 확률 징검다리'로 쪼개어 버림으로써, 확률적 시뮬레이션의 난이도를 혁신적으로 낮춘 천재적인 모델이다.

📢 섹션 요약 비유: 다음 턴에 윷놀이 말이 어디로 갈지 계산할 때, 이전에 말이 어떻게 움직였는지(과거)는 전혀 알 필요가 없고, 오직 '지금 말이 어느 칸에 서 있는지(현재)'만 보면 확률을 계산할 수 있다는 법칙이다.

Ⅱ. 아키텍처 및 핵심 원리

마르코프 체인의 세계는 **상태(State)**와 그 상태 사이를 옮겨 다니는 **전이 확률(Transition Probability)**로만 구성된다.

┌────────────────────────────────────────────────────────┐
│             [ 마르코프 체인의 상태 전이 다이어그램 ]           │
├────────────────────────────────────────────────────────┤
│                                                        │
│            0.7 (내일도 맑음)         0.4 (내일도 비)       │
│           ┌─────┐                 ┌────┐             │
│           ▼     │                 ▼    │             │
│        [ 상태 1: 맑음 ] ◀──0.6── [ 상태 2: 비 ]          │
│           │                       ▲                    │
│           └───────────0.3─────────┘                    │
│           (오늘 맑은데 내일 비 옴)                         │
│                                                        │
│ [ 전이 확률 행렬 (Transition Matrix, P) ]               │
│        맑음    비                                      │
│ 맑음 [ 0.7    0.3 ]  ◀ 오늘 맑을 때 내일의 확률 합은 1.0     │
│ 비   [ 0.6    0.4 ]  ◀ 오늘 비 올 때 내일의 확률 합은 1.0     │
└────────────────────────────────────────────────────────┘

상태 (State Space): 시스템이 가질 수 있는 모든 상황(예: 맑음, 비)이다.
마르코프 성질 (Markov Property): $P(X_{n+1} | X_n, X_{n-1}, ..., X_1) = P(X_{n+1} | X_n)$. 즉, 내일($n+1$)의 확률은 오직 오늘($n$)의 상태만 보면 되지, 어제나 그제($n-1, 1$)는 조건에서 지워버려도 된다는 수학 공식이다.
전이 확률 행렬: 현재 상태에서 다음 상태로 변할 모든 확률을 표(Matrix)로 만든 것이다. 이 행렬을 계속 곱해 나가면($P^2, P^3, \dots, P^\infty$), 결국 날씨가 어느 한쪽으로 쏠리지 않고 일정한 확률로 굳어지는 '안정 상태(Stationary Distribution)'에 도달하게 된다.

📢 섹션 요약 비유: 이 행렬은 개구리가 연잎(상태) 사이를 뛰어다닐 확률을 적어놓은 지도다. 개구리가 수만 번을 뛰어다녀도, 이 지도 행렬만 계속 곱해보면 "결국 개구리는 1번 연잎에 70%의 시간 동안 머문다"는 우주의 섭리(안정 상태)를 알아낼 수 있다.

Ⅲ. 비교 및 연결

마르코프 체인에서 파생된 다양한 상태 예측 알고리즘들을 비교해 보자.

알고리즘	핵심 특징 및 가정	주요 활용 분야
마르코프 체인 (Markov Chain)	현재 상태만으로 미래를 확률적으로 예측 (보상이나 행동이 없음)	날씨 예측, 텍스트 자동 완성 (자동완성 키보드)
HMM (Hidden Markov Model)	진짜 상태는 훔쳐볼 수 없으며(Hidden), 겉으로 드러난 증거(관측치)를 통해 진짜 상태를 역추적	초기 음성 인식(음소 추적), 형태소 분석기
MDP (마르코프 결정 과정)	마르코프 체인에 행동(Action)과 보상(Reward)의 개념을 추가	강화학습 (알파고, 자율주행 알고리즘의 뼈대)

특히 구글(Google)의 핵심 검색 알고리즘인 **페이지랭크(PageRank)**가 완벽한 마르코프 체인의 응용이다. "인터넷 사용자가 A웹페이지에서 링크를 클릭해 B웹페이지로 무작위로 이동한다"는 행위를 전이 확률 행렬로 만들고, 이를 무한히 반복했을 때 가장 높은 확률로 머물게 되는 웹페이지(안정 상태 확률이 가장 높은 노드)가 바로 검색어 1순위 페이지가 되는 원리다.

📢 섹션 요약 비유: 마르코프 체인이 "개구리가 어디로 뛸까?"를 관찰만 하는 것이라면, HMM은 "발자국만 보고 개구리 위치를 때려 맞추는 것"이고, MDP는 "개구리가 뛸 때마다 먹이를 줘서 내가 원하는 쪽으로 뛰게 조종하는 것"이다.

Ⅳ. 실무 적용 및 기술사 판단

실무 적용 시나리오: 쇼핑몰의 '고객 여정(Customer Journey) 예측 모델'을 짠다. 고객이 앱을 켠 상태(시작) $\rightarrow$ 상품 조회 $\rightarrow$ 장바구니 $\rightarrow$ 결제완료(상태)로 넘어가는 확률을 마르코프 행렬로 만든다. 이 모델을 돌려보면, "장바구니에 물건을 담은 고객이 결제하지 않고 이탈할 확률이 60%로 고착화(안정 상태)되어 있다"는 것을 발견하고, 장바구니 페이지의 UI를 뜯어고치는 의사결정을 내릴 수 있다.

기술사 판단 포인트 (Trade-off): 데이터 예측 모델링 시 **'마르코프 가정의 비현실성'**을 극복하는 것이 아키텍트의 과제다.

인간의 언어는 "오늘 아침에 나는 밥을 먹고, 커피를 마셨다"처럼 문장 맨 앞의 단어가 맨 뒤에 영향을 주는 '장기 기억(Long-term Memory)'이 필수적이다. 이런 데이터에 1차 마르코프 체인을 쓰면 "밥을 $\rightarrow$ 커피를"처럼 이상한 문맥이 생성된다.
따라서 과거 데이터의 맥락이 중요한 시계열이나 자연어 처리(NLP) 도메인에서는, 마르코프 체인의 무기억성을 버리고 과거를 기억하는 RNN(LSTM)이나 트랜스포머(Transformer) 아키텍처로 넘어가야 한다. 마르코프 체인은 오직 '확률적 최적 제어(강화학습)'와 '단기 상태 분석'에만 가성비가 좋다는 한계를 명심해야 한다.

📢 섹션 요약 비유: 마르코프 체인은 어제 일은 다 잊어버리는 금붕어와 같다. 오늘 하루의 날씨나 주식의 틱(Tick) 변화를 맞추는 단기전에는 계산이 빨라 천재적이지만, 긴 역사 소설을 쓰게 하면 앞뒤가 안 맞는 엉터리 글을 쓴다.

Ⅴ. 기대효과 및 결론

마르코프 체인은 20세기 초반에 등장하여 확률론을 '정적인 세계'에서 '시간에 따라 변하는 동적인 세계(확률 과정, Stochastic Process)'로 한 차원 끌어올린 혁명적 도구다. 컴퓨팅 파워가 부족했던 시절, 복잡한 세상을 오직 현재 상태의 행렬 곱셈만으로 시뮬레이션할 수 있게 해준 구원자였다.

결론적으로 마르코프 체인은 현대 인공지능, 특히 강화학습의 우주를 떠받치는 물리 법칙이다. 로봇이 한 발짝을 뗄 때마다 우주의 모든 역사를 계산하지 않고, "지금 내 관절의 각도(상태)에서 가장 안 넘어질 행동을 한다"는 철학은 모두 마르코프의 무기억성 가정에서 출발했다. 기술사는 이 직관적인 상태 전이 모델을 바탕으로 비즈니스의 병목(Bottleneck) 상태를 찾아내는 모델링 역량을 갖추어야 한다.

📢 섹션 요약 비유: 마르코프 체인은 과거에 대한 후회(오버헤드)를 완벽하게 지워버리고, 오직 '지금 이 순간'에 집중하여 가장 합리적인 다음 발걸음을 내디딜 수 있게 해주는 데이터 과학의 불교 철학이다.

📌 관련 개념 맵

상위 개념: 통계학, 확률 과정 (Stochastic Process)
하위 개념: 상태 (State), 전이 행렬 (Transition Matrix), 마르코프 성질 (무기억성)
연결 개념: MDP (마르코프 결정 과정), HMM (은닉 마르코프 모델), 강화학습 (RL), 페이지랭크 (PageRank)

👶 어린이를 위한 3줄 비유 설명

주사위 게임을 할 때, 내가 다음 턴에 어디로 갈지는 오직 '지금 내 말이 어디 있는지'에만 달려 있죠? 어제 던진 주사위 눈은 쓸모가 없어요.
마르코프 체인은 이렇게 "과거는 잊고, 오직 지금 상태만 보고 다음 행동을 예측하자!"는 똑똑하고 빠른 계산법이에요.
이 방법 덕분에 컴퓨터는 너무 많은 과거를 기억하느라 머리 아플 필요 없이, 바둑이나 게임을 아주 빠르게 배울 수 있답니다!