RAG, 벡터 DB, 임베딩, 환각(Hallucination) 감소
출제 빈도: ★★★★★ | 기출: ★135회
답안.
Ⅰ. 개요
RAG(Retrieval Augmented Generation)는 LLM이 응답 생성 시 외부 지식베이스를 실시간 검색하여 최신 정보와 맥락을 활용하는 기법이다. LLM의 학습 데이터 컷오프 문제와 환각(Hallucination) 문제를 해결한다.
Ⅱ. 핵심 구성요소
I. RAG 정의 및 필요성
LLM 한계:
- 학습 데이터 컷오프: 최신 정보 부재
- 환각(Hallucination): 존재하지 않는 정보 생성
- 기업 내부 문서 미학습
RAG 해결: 외부 지식베이스 + 실시간 검색 + LLM 결합
II. RAG 파이프라인 아키텍처
[오프라인: 인덱싱]
문서 수집 → 청크 분할 → 임베딩 모델 → 벡터 DB 저장
[온라인: 검색+생성]
사용자 질문
↓ 임베딩 변환
벡터 DB 유사도 검색 (Top-K 문서 검색)
↓
┌──────────────────────────────┐
│ 프롬프트 = 질문 + 검색된 컨텍스트 │
└──────────────────────────────┘
↓ LLM 생성
최종 답변 (근거 문서 포함)
III. 벡터 DB & 임베딩
- 임베딩 모델: text-embedding-ada, BGE, E5
- 유사도 검색: 코사인 유사도, L2 거리, 내적
- 벡터 DB: Pinecone, Weaviate, Chroma, pgvector
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
### Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
### Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
### Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.