007_RAG(Retrieval-Augmented Generation)

RAG (검색 증강 생성)
Posted on: February 15, 2026


1. RAG의 정의 및 존재이유

  • RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 거대 언어 모델(LLM)이 가진 지식의 한계를 극복하기 위해, 외부의 신뢰할 수 있는 데이터베이스에서 관련 정보를 검색(Retrieval)한 뒤 그 내용을 바탕으로 답변을 생성(Generation)하는 기술
  • ‘신뢰(Trust)’의 핵심
    • 환각 현상 방지 (Hallucination Control): AI가 모르는 것을 지어내는 대신, 제공된 문서 안에서만 답하도록 강제합니다.
    • 최신성 유지 (Up-to-date Information): 모델을 새로 학습(Fine-tuning)시키지 않아도, 데이터베이스의 문서만 바꾸면 즉시 최신 정보를 반영합니다.
    • 데이터 보안 (Data Privacy): 민감한 내부 문서를 모델 학습에 쓰지 않고도, 필요할 때만 검색해서 활용할 수 있습니다.
    • 근거 제시 (Explainability),Traceability (추적 가능성): “어떤 문서의 몇 페이지를 참고했는지” 출처를 밝힐 수 있어 신뢰도가 높아집니다.

2. 활용 방식

  • 4단계 프로세스 (The Workflow)
과정설명 및 기술 용어 주석
1. Indexing (인덱싱)데이터를 잘게 쪼개(Chunking) 벡터 DB에 저장하는 과정
2. Retrieval (검색)질문과 관련된 문서를 벡터 DB(Vector Database)에서 찾아내는 과정 (질문과 가장 의미가 유사한 데이터 조각을 찾아냄)
3. Augmentation (증강)검색된 정보를 질문(Prompt)에 합쳐서 AI가 읽을 수 있게 전달하는 과정
4. Generation (생성)주입된 정보를 근거로 AI가 최종 답변을 작성하는 과정

Augment your LLM Using Retrieval Augmented Generation


Build a Deep Research Agent

https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-FX-40+V1)

3. 활용 사례

댓글 남기기