핵심 인사이트 (3줄 요약)

  1. 본질: RNN은 은닉 상태(Hidden State)를 이전 시점에서 현재 시점으로 순환(Recurrence)하여 시퀀스 데이터(텍스트·시계열·음성)의 순서 의존성을 학습하는 신경망이다.
  2. 가치: CNN은 공간 패턴, RNN은 시간 패턴을 처리하며, 기계 번역·음성 인식·시계열 예측의 초기 핵심 아키텍처였다. 단, 장기 의존성(Long-term Dependency)에 취약하다.
  3. 판단 포인트: Vanilla RNN의 Vanishing Gradient → LSTM/GRU가 해결 → 현재는 Transformer가 RNN을 거의 대체했으나, 시계열·온디바이스에서는 여전히 사용된다.

Ⅰ. 개요 및 필요성

RNN: h_t = f(W·h_{t-1} + U·x_t)
  h_t: 현재 은닉 상태 (이전 정보 보유)
  장점: 가변 길이 시퀀스 처리
  단점: 장기 의존성 학습 어려움 (Vanishing Gradient)
  • 📢 섹션 요약 비유: RNN은 일기장을 읽으며 기억하는 것이다. 과거 일기(은닉 상태)를 참고하여 오늘을 이해한다.

Ⅱ~Ⅴ. 결론

RNN은 시퀀스 처리의 기초 아키텍처이며, LSTM/GRU를 거쳐 Transformer로 진화했다.


📌 관련 개념 맵

개념연결 포인트
RNN순환 은닉 상태
LSTM장기 의존성 해결
GRULSTM 경량화
TransformerRNN 대체 (병렬)
시계열RNN 여전히 활용

📈 관련 키워드 및 발전 흐름도

[Vanilla RNN (1986)] → [LSTM (1997)] → [GRU (2014)]
    → [Seq2Seq + Attention (2014)]
    → [Transformer (2017) — RNN 대체]
    → [현재: Mamba/RWKV — RNN 르네상스 (선형)]

👶 어린이를 위한 3줄 비유 설명

  1. RNN은 일기장을 읽는 것이에요. 어제 일기(은닉 상태)를 참고해서 오늘을 이해해요.
  2. 하지만 **오래된 일기(장기 기억)**는 잘 기억 못 해요(Vanishing).
  3. LSTM은 중요한 일기에 포스트잇을 붙여서 잊지 않게 해줘요!