133. 역전파 & 연쇄 법칙 (Backpropagation & Chain Rule)

핵심 인사이트 (3줄 요약)

본질: 역전파(Backpropagation)는 출력층에서 입력층 방향으로 손실의 기울기(Gradient)를 전파하여 각 가중치가 손실에 기여하는 정도를 계산하는 알고리즘이며, 미적분의 연쇄 법칙(Chain Rule)이 핵심 수학이다.

가치: 역전파 없이는 수백만 파라미터의 최적 가중치를 찾는 것이 불가능하며, 1986년 Rumelhart의 역전파 논문이 신경망 학습의 실용적 돌파구였다.

판단 포인트: 역전파의 Vanishing/Exploding Gradient 문제를 이해하고, ReLU·BatchNorm·Residual Connection·Gradient Clipping이 해결 기법이다.

Ⅰ. 개요 및 필요성

순전파: x → 은닉층 → 출력 → 손실(L)
역전파: ∂L/∂W = ∂L/∂y · ∂y/∂h · ∂h/∂W  (연쇄 법칙)
  → 각 가중치가 손실에 기여하는 정도 → 가중치 업데이트

📢 섹션 요약 비유: 역전파는 "왜 시험 점수가 낮은지" 거꾸로 추적하는 것이다. 출력(점수)→공부법→교재 순으로 원인을 찾는다.

Ⅱ. 아키텍처 및 핵심 원리

문제	현상	해결
Vanishing	기울기→0	ReLU, ResNet
Exploding	기울기→∞	Gradient Clipping

Ⅲ~Ⅴ. 결론

역전파는 딥러닝 학습의 유일한 실용적 알고리즘이며, 연쇄 법칙의 효율적 구현(Computational Graph)이 PyTorch·TensorFlow의 핵심이다.

📌 관련 개념 맵

개념	연결 포인트
역전파	기울기 역방향 전파
연쇄 법칙	합성 함수 미분
Vanishing Gradient	깊은 층에서 기울기 소실
AutoGrad	자동 미분 (PyTorch)
Computational Graph	연산 그래프 기반 역전파

📈 관련 키워드 및 발전 흐름도

[역전파 이론 (Werbos, 1974)] → [실용화 (Rumelhart, 1986)]
    → [Vanishing 문제 인식 (1990s)]
    → [ReLU+BatchNorm+ResNet (2010s) — 해결]
    → [현재: AutoGrad (PyTorch) — 자동 역전파]

👶 어린이를 위한 3줄 비유 설명

역전파는 시험에서 "왜 틀렸지?" 거꾸로 추적하는 거예요.
정답(출력)→풀이(은닉층)→공식(가중치) 순으로 원인을 찾아요.
원인을 알면 공식(가중치)을 고쳐서 다음 시험에 점수가 올라요!