RAG, 벡터 DB, 임베딩, 환각(Hallucination) 감소

출제 빈도: ★★★★★ | 기출: ★135회

답안.

Ⅰ. 개요

RAG(Retrieval Augmented Generation)는 LLM이 응답 생성 시 외부 지식베이스를 실시간 검색하여 최신 정보와 맥락을 활용하는 기법이다. LLM의 학습 데이터 컷오프 문제와 환각(Hallucination) 문제를 해결한다.

Ⅱ. 핵심 구성요소

I. RAG 정의 및 필요성
   
   LLM 한계:
   - 학습 데이터 컷오프: 최신 정보 부재
   - 환각(Hallucination): 존재하지 않는 정보 생성
   - 기업 내부 문서 미학습
   
   RAG 해결: 외부 지식베이스 + 실시간 검색 + LLM 결합

II. RAG 파이프라인 아키텍처
   
   [오프라인: 인덱싱]
   문서 수집 → 청크 분할 → 임베딩 모델 → 벡터 DB 저장
   
   [온라인: 검색+생성]
   사용자 질문
      ↓ 임베딩 변환
   벡터 DB 유사도 검색 (Top-K 문서 검색)
      ↓
   ┌──────────────────────────────┐
   │ 프롬프트 = 질문 + 검색된 컨텍스트 │
   └──────────────────────────────┘
      ↓ LLM 생성
   최종 답변 (근거 문서 포함)

III. 벡터 DB & 임베딩
   - 임베딩 모델: text-embedding-ada, BGE, E5
   - 유사도 검색: 코사인 유사도, L2 거리, 내적
   - 벡터 DB: Pinecone, Weaviate, Chroma, pgvector


해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.

### Ⅲ. 특징 및 비교

핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.

### Ⅳ. 적용 사례

실무 환경에서의 적용 사례와 기대효과를 제시한다.

### Ⅴ. 전망

최신 기술 동향과 향후 발전 방향을 서술한다.