프롬프트 튜닝 (Prompt Tuning / P-Tuning)

핵심 인사이트 (3줄 요약)

가상 토큰 최적화: 모델의 모든 가중치를 고정한 채, 입력 앞에 붙는 '소프트 프롬프트(Soft Prompt)' 벡터값만 학습시키는 효율적 기법임.
파라미터 효율성: 거대 언어 모델(LLM) 전체를 미세조정(Fine-tuning)하는 것보다 약 1,000배에서 10,000배 적은 파라미터만 업데이트함.
태스크 간 간섭 방지: 모델 본체는 변하지 않으므로, 하나의 거대 모델로 수많은 서로 다른 작업(Task)을 동시에 서빙할 수 있음.

Ⅰ. 개요 (Context & Background)

프롬프트 튜닝(Prompt Tuning)은 모델의 규모가 커짐에 따라 모든 가중치를 재학습시키는 것이 불가능해진 시대에 등장한 **PEFT(Parameter-Efficient Fine-Tuning)**의 핵심 기법이다. 인간이 이해할 수 있는 단어를 넣는 '하드 프롬프팅'과 달리, AI가 학습할 수 있는 연속적인 벡터 공간상의 '가상 토큰'을 최적화하여 모델의 출력을 제어한다.

Ⅱ. 아키텍처 및 핵심 원리 (Deep Dive)

프롬프트 튜닝은 입력 시퀀스 앞에 학습 가능한 연속적 벡터열(Continuous Vectors)을 추가한다. 이를 **소프트 프롬프트(Soft Prompt)**라고 하며, 역전파 과정에서 오직 이 벡터값들만 업데이트된다.

[ Prompt Tuning Architecture - 프롬프트 튜닝 아키텍처 ]

    Input Tokens: [ "The", "movie", "was", "great" ]
          |
    Embedding Layer
          |
    Combined Input: [ P1, P2, P3, P4 ] + [ E1, E2, E3, E4 ]
                    (Learnable)         (Fixed)
          |
+-----------------------------------+
|    Frozen Large Language Model    |
|      (Pre-trained Weights)        |
+-----------------------------------+
          |
    Output Label: [ "Positive" ]

주요 특징:

Frozen Backbones: 모델의 수십억 개 파라미터는 고정(Freeze)되어 메모리 사용량을 획기적으로 줄임.
Soft Prompts: 사람이 읽을 수 있는 단어에 국한되지 않고, 특정 태스크에 가장 적합한 수학적 위치를 찾아냄.
태스크 전환 속도: 새로운 작업으로 전환할 때 모델 전체를 로드할 필요 없이, 몇 KB 수준의 소프트 프롬프트 벡터만 교체하면 됨.

Ⅲ. 융합 비교 및 다각도 분석 (Comparison & Synergy)

비교 항목	전체 미세조정 (Full Fine-tuning)	프롬프트 튜닝 (Prompt Tuning)	LoRA (Low-Rank Adaptation)
업데이트 대상	모든 레이어 가중치	입력부의 가상 토큰 벡터	가중치 행렬 사이의 어댑터
파라미터 비중	100%	< 0.01%	~ 0.1%
학습 자원	매우 높음 (H100 다수 필요)	매우 낮음	낮음
성능 (대규모 모델)	최고 수준	모델이 클수록 Fine-tuning에 근접	매우 뛰어남 (범용적)

Ⅳ. 실무 적용 및 기술사적 판단 (Strategy & Decision)

대규모 모델의 효율성: Google의 연구에 따르면, 모델 파라미터가 100억 개 이상이 될 때 프롬프트 튜닝의 성능이 모델 전체를 튜닝한 것과 거의 동등해진다.
기술사적 판단: 멀티-태스크 서빙(Multi-task Serving) 환경에서 하나의 백본 모델로 수만 명의 사용자에게 각각 최적화된 태스크를 제공해야 하는 SaaS 인프라 설계 시 최적의 선택지이다.

Ⅴ. 기대효과 및 결론 (Future & Standard)

프롬프트 튜닝은 하드웨어 자원의 한계를 넘어서는 LLM 활용의 문을 열었다. 향후에는 여러 소프트 프롬프트를 조합하여 복합적인 사고를 수행하게 하거나, 실시간으로 프롬프트 벡터를 생성하는 하이퍼네트워크 연구로 발전할 것으로 보인다.

📌 관련 개념 맵 (Knowledge Graph)

상위: PEFT, 전이 학습 (Transfer Learning)
하위: Prefix Tuning, P-Tuning v2
연관: LoRA, 프롬프트 엔지니어링, In-Context Learning

👶 어린이를 위한 3줄 비유 설명

아주 똑똑한 거대한 로봇(LLM)이 있는데, 이 로봇의 성격을 바꾸는 건 너무 힘들어요.
대신 로봇의 귀에 대고 "너는 지금부터 요리사야!"라고 적힌 아주 작은 메모리칩 하나만 꽂아주는 거예요.
로봇 본체는 그대로지만, 칩 덕분에 로봇은 아주 훌륭한 요리사로 변신하게 된답니다.