핵심 인사이트 (3줄 요약)
- 본질: 정규화(Regularization)는 모델이 학습 데이터에 과적합(Overfitting)하는 것을 방지하는 기법의 총칭이며, Dropout·BatchNorm·L1/L2·Data Augmentation·Early Stopping이 대표이다.
- 가치: 과적합 없이는 학습 정확도 99%인데 테스트 60%인 상황이 발생하며, 정규화로 **일반화 성능(Generalization)**을 확보해야 실제 데이터에서도 높은 성능을 발휘한다.
- 판단 포인트: Dropout(뉴런 랜덤 비활성화)·BatchNorm(층별 정규화)·Weight Decay(L2)가 현대 딥러닝의 3대 정규화이며, Transformer에서는 LayerNorm을 사용한다.
Ⅰ. 개요 및 필요성
Dropout: 학습 시 뉴런 랜덤 50% 비활성화
BatchNorm: 미니배치 단위로 평균 0·분산 1 정규화
L2 (Weight Decay): 가중치 크기 패널티
LayerNorm: Transformer 표준 (배치 무관)
- 📢 섹션 요약 비유: 정규화는 시험 전 다양한 문제집으로 연습하는 것이다. 한 문제집만 외우면(과적합) 새 시험에서 틀린다.
Ⅱ~Ⅴ. 결론
정규화는 딥러닝 일반화 성능의 핵심이며, Dropout+BatchNorm/LayerNorm+Weight Decay가 표준 조합이다.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
|---|---|
| Dropout | 뉴런 랜덤 비활성화 |
| BatchNorm | 미니배치 정규화 |
| LayerNorm | Transformer 정규화 |
| Weight Decay | L2 정규화 |
| 과적합 | 정규화가 방지하는 대상 |
📈 관련 키워드 및 발전 흐름도
[L1/L2 정규화 (전통)] → [Dropout (2012, Hinton)]
→ [BatchNorm (2015)] → [LayerNorm (2016, Transformer)]
→ [현재: RMSNorm (Llama) — 더 효율적 정규화]
👶 어린이를 위한 3줄 비유 설명
- 과적합은 한 문제집만 외우는 거예요. 새 시험에서 틀려요.
- 정규화는 다양한 문제집으로 연습하는 거예요. 어떤 시험이든 잘 봐요.
- Dropout은 일부러 어려운 환경(뉴런 꺼짐)에서 연습해서 더 강해져요!