RAG (검색 증강 생성)
Posted on: February 15, 2026
1. RAG의 정의 및 존재이유
- RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 거대 언어 모델(LLM)이 가진 지식의 한계를 극복하기 위해, 외부의 신뢰할 수 있는 데이터베이스에서 관련 정보를 검색(Retrieval)한 뒤 그 내용을 바탕으로 답변을 생성(Generation)하는 기술
- ‘신뢰(Trust)’의 핵심
- 환각 현상 방지 (Hallucination Control): AI가 모르는 것을 지어내는 대신, 제공된 문서 안에서만 답하도록 강제합니다.
- 최신성 유지 (Up-to-date Information): 모델을 새로 학습(Fine-tuning)시키지 않아도, 데이터베이스의 문서만 바꾸면 즉시 최신 정보를 반영합니다.
- 데이터 보안 (Data Privacy): 민감한 내부 문서를 모델 학습에 쓰지 않고도, 필요할 때만 검색해서 활용할 수 있습니다.
- 근거 제시 (Explainability),Traceability (추적 가능성): “어떤 문서의 몇 페이지를 참고했는지” 출처를 밝힐 수 있어 신뢰도가 높아집니다.
2. 활용 방식
- 4단계 프로세스 (The Workflow)
| 과정 | 설명 및 기술 용어 주석 |
| 1. Indexing (인덱싱) | 데이터를 잘게 쪼개(Chunking) 벡터 DB에 저장하는 과정 |
| 2. Retrieval (검색) | 질문과 관련된 문서를 벡터 DB(Vector Database)에서 찾아내는 과정 (질문과 가장 의미가 유사한 데이터 조각을 찾아냄) |
| 3. Augmentation (증강) | 검색된 정보를 질문(Prompt)에 합쳐서 AI가 읽을 수 있게 전달하는 과정 |
| 4. Generation (생성) | 주입된 정보를 근거로 AI가 최종 답변을 작성하는 과정 |
- 벡터DB?
- 비정형 데이터를 고차원 공간에 저장할 수 있는 벡터DB
- https://www.nvidia.com/ko-kr/glossary/vector-database/

- 학습하기 좋은 루트
- https://nvdam.widen.net/s/brxsxxtskb/dli-learning-journey-2009000-r5-web
- 엔비디아에서 무료-유료 강의 제공함
- 링크는 certi받거나 카테고리별 학습하기 좋은 루트(콘텐츠 클릭 시 해당 강의페이지로 랜딩)
- https://nvdam.widen.net/s/brxsxxtskb/dli-learning-journey-2009000-r5-web
Augment your LLM Using Retrieval Augmented Generation
Build a Deep Research Agent
https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-FX-40+V1)

댓글 남기기