345. LLM 파운데이션 모델 환각 (Hallucination) 방어 검증

핵심 인사이트 (3줄 요약)

본질: 환각(Hallucination)은 LLM이 학습되지 않은 사실에 대해 마치 진실인 것처럼 그럴싸하게 거짓말을 하는 현상으로, 확률적인 다음 단어 예측 방식의 근본적 한계에서 기인한다.

가치: 비즈니스 현장에서 AI의 잘못된 정보 제공으로 인한 신뢰도 하락과 법적 리스크를 방어하며, AI의 답변을 믿고 쓸 수 있는 '안전 장치'를 구축한다.

판단 포인트: 감리 시에는 외부 지식을 참조하는 RAG(검색 증강 생성), 답변의 사실 여부를 검증하는 셀프 체크(Self-Correction), 그리고 프롬프트 엔지니어링을 통한 제어 로직을 검증한다.

Ⅰ. 개요 및 필요성

"세종대왕이 맥북을 던진 사건에 대해 알려줘"라고 물으면, LLM은 아주 진지하게 "세종실록에 기록된 바에 따르면..."이라며 있지도 않은 역사를 지어낸다. 이를 환각(Hallucination)이라 한다. AI는 '진실'을 아는 것이 아니라 '다음에 올 확률이 높은 단어'를 고르기 때문이다. 챗봇이 고객에게 가짜 환불 규정을 안내한다면 큰 문제가 된다. 따라서 LLM을 실무에 도입할 때는 이 '뻥쟁이 AI'를 어떻게 길들이고 감시할지가 가장 큰 숙제다.

📢 섹션 요약 비유: 환각은 '아는 척하기 좋아하는 이야기꾼'과 같다. 모르는 질문을 받아도 "모른다"고 말하기보다, 자기가 아는 단어들을 조합해 그럴싸한 소설을 써버리는 버릇이다.

Ⅱ. 아키텍처 및 핵심 원리

1. 환각의 주요 원인

데이터 부족/오류: 학습 데이터에 없는 내용을 물어볼 때.
확률적 생성: 사실 관계보다 문장의 자연스러움을 우선시할 때.
최신성 부재: 학습 이후에 벌어진 사건에 대해 물어볼 때.

2. 환각 방어 3대 전략

RAG (Retrieval Augmented Generation): 답변 전 내부 문서를 먼저 찾아보고(검색), 그 근거를 바탕으로만 답변하게 함.
Few-shot Prompting: "모르면 모른다고 말해"라는 예시를 몇 개 주어 답변의 범위를 제한함.
Self-Correction (자기 수정): AI가 답변을 쓴 뒤, 다른 AI(또는 본인)에게 "이 답변에 거짓이 없는지 다시 확인해"라고 한 번 더 검증하게 함.

📢 섹션 요약 비유: RAG는 시험을 볼 때 '컨닝 페이퍼(참고 문헌)'를 주는 것과 같다. 머릿속 기억(학습 데이터)에만 의존하지 않고, 책을 보고 답하게 하니 훨씬 정확해진다.

Ⅲ. 비교 및 연결

일반 생성 vs RAG 기반 생성 (방어 전략)

비교 항목	일반 LLM 생성	RAG 기반 생성
지식 원천	학습된 과거 데이터 (기억)	외부 최신 문서 (참조)
답변 근거	모호함 (출처 알 수 없음)	명확함 (참조 문서 링크 제공 가능)
환각 발생률	높음 (기억을 지어냄)	매우 낮음 (문서 내 내용만 말함)
업데이트	전체 재학습 필요 (비쌈)	문서만 교체하면 됨 (저렴/빠름)

📢 섹션 요약 비유: 일반 생성은 '천재적인 암기력만 믿고 시험 보는 것'이고, RAG는 '오픈북 테스트'를 치르는 것과 같다. 당연히 오픈북이 훨씬 정확하다.

Ⅳ. 실무 적용 및 기술사 판단

기술사 핵심 포인트 (방어 검증):

Fact-checking 지표: 답변이 실제 문서와 얼마나 일치하는지 측정하는 Faithfulness, 질문에 적절한지 보는 Relevancy 등의 지표(RAGAS 프레임워크 등)를 활용해 정량적으로 진단해야 한다.
Grounding (접지): AI의 답변이 반드시 제공된 데이터(Ground Truth)에 뿌리를 두고 있는지 검증하는 아키텍처를 제시한다.
감리인의 시각: "AI가 답변을 잘하나요?"라고 묻지 말고, "AI가 거짓말을 했을 때 이를 필터링하는 '가드레일(Guardrail)' 소프트웨어가 작동하나요?"라고 물어야 함을 강조한다.

📢 섹션 요약 비유: LLM 가드레일은 '거짓말 탐지기'다. AI가 내뱉는 문장 하나하나를 실시간으로 체크해서, 근거 없는 소리가 섞이면 사용자에게 전달되기 전에 삐- 소리를 내며 차단하기 때문이다.

Ⅴ. 기대효과 및 결론

환각 방어는 LLM이 '장난감'을 넘어 '비즈니스 도구'가 되기 위한 필수 관문이다. 완벽한 AI는 없지만, 완벽에 가까운 시스템(RAG + 검증 로직)은 만들 수 있다. 기술사 시험에서는 환각의 기술적 원인을 확률적 생성 모델의 특성과 연결해 설명하고, RAG와 퓨샷 프롬프팅을 통한 실무적 방어 체계를 도식화하여 제시하는 것이 핵심이다.

📢 섹션 요약 비유: 환각 방어는 AI에게 '정직함이라는 안경'을 씌워주는 것이다. 흐릿한 기억 속의 환상 대신, 눈앞의 진실(데이터)을 똑바로 보고 말하게 만들기 때문이다.

📌 관련 개념 맵

개념	연관 키워드	관계
RAG	검색 증강 생성, 출처	환각을 줄이는 가장 강력한 실무적 기술
Grounding	근거 중심 답변	AI 답변을 실제 데이터에 고정시키는 기법
RAGAS	평가 지표, 프레임워크	환각 방어 성능을 측정하는 표준 지표
NeMo Guardrails	보안 필터, 가이드라인	부적절하거나 거짓된 답변을 막는 가드 솔루션

👶 어린이를 위한 3줄 비유 설명

인공지능 로봇이 모르는 문제인데도 아는 척하며 지어낸 이야기를 하는 걸 '환각'이라고 해요.
로봇에게 "꼭 이 백과사전을 보고 대답해"라고 명령하면 거짓말을 훨씬 덜 하게 된답니다.
대답을 한 뒤에 다른 로봇 친구가 "이거 진짜 맞아?"라고 한 번 더 확인하면 더 믿을 수 있어요.