Zenn Stark's Sovereign Narratives Archive

007_RAG(Retrieval-Augmented Generation)

RAG (검색 증강 생성)
Posted on: February 15, 2026

RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 거대 언어 모델(LLM)이 가진 지식의 한계를 극복하기 위해, 외부의 신뢰할 수 있는 데이터베이스에서 관련 정보를 검색(Retrieval)한 뒤 그 내용을 바탕으로 답변을 생성(Generation)하는 기술
‘신뢰(Trust)’의 핵심
- 환각 현상 방지 (Hallucination Control): AI가 모르는 것을 지어내는 대신, 제공된 문서 안에서만 답하도록 강제합니다.
- 최신성 유지 (Up-to-date Information): 모델을 새로 학습(Fine-tuning)시키지 않아도, 데이터베이스의 문서만 바꾸면 즉시 최신 정보를 반영합니다.
- 데이터 보안 (Data Privacy): 민감한 내부 문서를 모델 학습에 쓰지 않고도, 필요할 때만 검색해서 활용할 수 있습니다.
- 근거 제시 (Explainability),Traceability (추적 가능성): “어떤 문서의 몇 페이지를 참고했는지” 출처를 밝힐 수 있어 신뢰도가 높아집니다.

과정	설명 및 기술 용어 주석
1. Indexing (인덱싱)	데이터를 잘게 쪼개(Chunking) 벡터 DB에 저장하는 과정
2. Retrieval (검색)	질문과 관련된 문서를 벡터 DB(Vector Database)에서 찾아내는 과정 (질문과 가장 의미가 유사한 데이터 조각을 찾아냄)
3. Augmentation (증강)	검색된 정보를 질문(Prompt)에 합쳐서 AI가 읽을 수 있게 전달하는 과정
4. Generation (생성)	주입된 정보를 근거로 AI가 최종 답변을 작성하는 과정

벡터DB?
- 비정형 데이터를 고차원 공간에 저장할 수 있는 벡터DB
- https://www.nvidia.com/ko-kr/glossary/vector-database/

학습하기 좋은 루트
- https://nvdam.widen.net/s/brxsxxtskb/dli-learning-journey-2009000-r5-web
  - 엔비디아에서 무료-유료 강의 제공함
  - 링크는 certi받거나 카테고리별 학습하기 좋은 루트(콘텐츠 클릭 시 해당 강의페이지로 랜딩)