LLM 파인튜닝 & PEFT (효율적 학습)

별점: ★★★★★ | ★136회 기출

답안.

Ⅰ. 개요

파운데이션 모델: 범용 지식 (GPT-4, Claude) 파인튜닝: 특정 태스크/도메인에 최적화 모든 가중치 업데이트 (비용 최고)

Ⅱ. 핵심 구성요소

[파인튜닝 필요성]
파운데이션 모델: 범용 지식 (GPT-4, Claude)
파인튜닝: 특정 태스크/도메인에 최적화

[파인튜닝 유형]
Full Fine-tuning:
  모든 가중치 업데이트 (비용 최고)
  GPU 메모리: 100B 모델 = 수백 GB

PEFT (Parameter Efficient Fine-Tuning):
  소수 파라미터만 업데이트
  전체 성능 유지, 비용 대폭 절감

[LoRA (Low-Rank Adaptation)]
가중치 행렬을 저랭크 분해로 근사
W' = W + ΔW = W + A×B
  A: (d × r) 행렬, r << d (랭크)
  B: (r × k) 행렬
업데이트할 파라미터: r × (d+k) << d × k

장점: 메모리 10배 절감, 원본 가중치 고정
     여러 LoRA를 전환하여 다중 태스크

QLoRA:
  4bit 양자화 + LoRA 결합
  70B 모델을 48GB GPU에서 학습 가능

[Prefix Tuning]


해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.

### Ⅲ. 특징 및 비교

핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.

### Ⅳ. 적용 사례

실무 환경에서의 적용 사례와 기대효과를 제시한다.

### Ⅴ. 전망

최신 기술 동향과 향후 발전 방향을 서술한다.