핵심 인사이트 (3줄 요약)

  1. 본질: 역전파(Backpropagation)는 출력층에서 입력층 방향으로 손실의 기울기(Gradient)를 전파하여 각 가중치가 손실에 기여하는 정도를 계산하는 알고리즘이며, 미적분의 연쇄 법칙(Chain Rule)이 핵심 수학이다.
  2. 가치: 역전파 없이는 수백만 파라미터의 최적 가중치를 찾는 것이 불가능하며, 1986년 Rumelhart의 역전파 논문이 신경망 학습의 실용적 돌파구였다.
  3. 판단 포인트: 역전파의 Vanishing/Exploding Gradient 문제를 이해하고, ReLU·BatchNorm·Residual Connection·Gradient Clipping이 해결 기법이다.

Ⅰ. 개요 및 필요성

순전파: x → 은닉층 → 출력 → 손실(L)
역전파: ∂L/∂W = ∂L/∂y · ∂y/∂h · ∂h/∂W  (연쇄 법칙)
  → 각 가중치가 손실에 기여하는 정도 → 가중치 업데이트
  • 📢 섹션 요약 비유: 역전파는 "왜 시험 점수가 낮은지" 거꾸로 추적하는 것이다. 출력(점수)→공부법→교재 순으로 원인을 찾는다.

Ⅱ. 아키텍처 및 핵심 원리

문제현상해결
Vanishing기울기→0ReLU, ResNet
Exploding기울기→∞Gradient Clipping

Ⅲ~Ⅴ. 결론

역전파는 딥러닝 학습의 유일한 실용적 알고리즘이며, 연쇄 법칙의 효율적 구현(Computational Graph)이 PyTorch·TensorFlow의 핵심이다.


📌 관련 개념 맵

개념연결 포인트
역전파기울기 역방향 전파
연쇄 법칙합성 함수 미분
Vanishing Gradient깊은 층에서 기울기 소실
AutoGrad자동 미분 (PyTorch)
Computational Graph연산 그래프 기반 역전파

📈 관련 키워드 및 발전 흐름도

[역전파 이론 (Werbos, 1974)] → [실용화 (Rumelhart, 1986)]
    → [Vanishing 문제 인식 (1990s)]
    → [ReLU+BatchNorm+ResNet (2010s) — 해결]
    → [현재: AutoGrad (PyTorch) — 자동 역전파]

👶 어린이를 위한 3줄 비유 설명

  1. 역전파는 시험에서 "왜 틀렸지?" 거꾸로 추적하는 거예요.
  2. 정답(출력)→풀이(은닉층)→공식(가중치) 순으로 원인을 찾아요.
  3. 원인을 알면 공식(가중치)을 고쳐서 다음 시험에 점수가 올라요!