LLM 파인튜닝 & PEFT (효율적 학습)
별점: ★★★★★ | ★136회 기출
답안.
Ⅰ. 개요
파운데이션 모델: 범용 지식 (GPT-4, Claude) 파인튜닝: 특정 태스크/도메인에 최적화 모든 가중치 업데이트 (비용 최고)
Ⅱ. 핵심 구성요소
[파인튜닝 필요성]
파운데이션 모델: 범용 지식 (GPT-4, Claude)
파인튜닝: 특정 태스크/도메인에 최적화
[파인튜닝 유형]
Full Fine-tuning:
모든 가중치 업데이트 (비용 최고)
GPU 메모리: 100B 모델 = 수백 GB
PEFT (Parameter Efficient Fine-Tuning):
소수 파라미터만 업데이트
전체 성능 유지, 비용 대폭 절감
[LoRA (Low-Rank Adaptation)]
가중치 행렬을 저랭크 분해로 근사
W' = W + ΔW = W + A×B
A: (d × r) 행렬, r << d (랭크)
B: (r × k) 행렬
업데이트할 파라미터: r × (d+k) << d × k
장점: 메모리 10배 절감, 원본 가중치 고정
여러 LoRA를 전환하여 다중 태스크
QLoRA:
4bit 양자화 + LoRA 결합
70B 모델을 48GB GPU에서 학습 가능
[Prefix Tuning]
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
### Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
### Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
### Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.