✅ RAG = Retrieval + Generation
즉, “찾아보고 → 생성한다”는 뜻이에요.
RAG는 대규모 언어 모델(LLM)이 자신의 파라미터만으로 답을 생성하는 것이 아니라,
외부 지식(문서, 데이터, 웹 등)을 검색해서 활용한 후 더 정확한 응답을 생성하는 구조입니다.

📚 왜 RAG가 필요할까?
GPT처럼 대형 모델들은 많은 정보를 학습했지만, 다음과 같은 한계가 있습니다:
한계설명
| 지식 갱신 불가 | 학습 이후의 최신 정보 반영 어려움 (예: 뉴스, 법률 변경 등) |
| 세부 정보 부족 | 특정 문서/규정/회사 문서 등은 훈련에 포함 안됨 |
| 기억 비용 큼 | 모든 정보를 파라미터로 학습시키기엔 비용이 너무 큼 |
👉 그래서, 필요한 정보는 그때그때 검색해서 모델에 제공하자!
이게 바로 RAG입니다.
🧠 RAG의 핵심 구성 요소
📌 1. Retriever (검색기)
- 사용자 질문과 관련된 정보를 문서, 웹, DB 등에서 검색
- 벡터 DB(Pinecone, FAISS, Weaviate 등)로 구현하는 경우 많음
- 사용된 기술: 텍스트 임베딩 + 유사도 검색
📌 2. Generator (생성기)
- 검색된 정보를 바탕으로 자연스러운 답변을 생성
- 일반적으로 GPT, Claude, Mistral 등 LLM 사용
요약:
사용자의 질문을 받아 → 관련 정보를 찾아서 → 그걸 바탕으로 정확하고 풍부한 답을 만듭니다.
🎯 RAG 작동 흐름
[사용자 질문]
↓
[Retriever]
→ 관련 문서 검색
↓
[Generator (LLM)]
→ 검색된 내용을 보고 답변 생성
↓
[최종 응답]
예: “LangChain이 뭐야?” → 사내 위키 문서 검색 → GPT가 내용을 요약하여 자연스럽게 설명
💬 비유로 이해하기
🧠 기존 GPT = 모든 걸 암기한 사람
🔍 RAG = 필요한 건 찾아보고 말해주는 사람
예: "한국의 헌법 제1조는?"
- GPT: 틀릴 수 있음
- RAG: 헌법 전문 검색 → "대한민국은 민주공화국이다..."
🧩 실전 예시
| 분야 | RAG 활용 사례 |
| 사내 검색봇 | 사내 문서 기반으로 직원 질문에 답변 |
| 법률 AI | 판례/조례/법령 기반으로 질문에 정확히 응답 |
| 고객지원 | FAQ 문서 기반으로 정확한 제품 지원 응답 |
| 교육/학습 | 교재/논문을 검색해 질문에 맞는 답변 생성 |
✅ RAG의 장점
항목설명
| 항목 | 설명 |
| 📚 정확성 향상 | 생성 모델이 관련 문서를 참고해서 헛소리를 줄임 (Hallucination 감소) |
| 🔄 지식 갱신 가능 | 모델을 다시 학습하지 않아도 문서만 교체하면 최신화 가능 |
| 🔍 근거 제공 | 답변의 근거로 사용된 문서를 함께 보여줄 수 있음 |
| 🧠 대용량 지식 활용 | GPT가 기억하지 못하는 정보도 필요할 때마다 검색해서 사용 가능 |
❗ 주의할 점
| 단점/주의 | 설명 |
| Retriever 성능 중요 | 관련 없는 문서를 가져오면 아무리 좋은 GPT라도 엉뚱한 답변 |
| 프롬프트 설계 필요 | 검색된 내용을 효과적으로 사용하도록 prompt tuning 필요 |
| 벡터화 품질 | 임베딩 모델의 품질에 따라 검색 정확도 차이 발생 |
🔧 RAG 구현 기술
| 구성 요소 | 기술 예시 |
| 임베딩 모델 | OpenAI Embedding, HuggingFace BGE, Cohere 등 |
| 벡터 DB | FAISS, Pinecone, Weaviate, Chroma |
| 생성 모델 | GPT-3.5, GPT-4, Claude, Mistral 등 |
| 프레임워크 | LangChain, LlamaIndex, Haystack |
🔄 GPT vs RAG vs Fine-tuning
| 항목 | GPT 단독 | Fine-tuning | RAG |
| 지식 최신화 | ❌ 어려움 | 🔁 재학습 필요 | ✅ 문서 교체만 하면 됨 |
| 도입 난이도 | 쉬움 | 어렵고 비쌈 | 중간 |
| 출력 근거 제시 | ❌ 없음 | ❌ 없음 | ✅ 문서와 함께 제공 가능 |
| 실행 속도 | 빠름 | 느림 (학습 포함) | 중간 |
🧠 요약 정리
| 항목 | 내용 |
| RAG란? | LLM이 외부 문서를 검색해서 답변에 활용하는 구조 |
| 구성 | Retriever + Generator (GPT 등) |
| 장점 | 정확성, 최신성, 근거 제공, 재학습 불필요 |
| 활용 | 검색봇, 고객지원, 법률/교육 AI, QA 시스템 등 |
| 구현 도구 | LangChain, Pinecone, GPT, Chroma 등 |
'인공지능' 카테고리의 다른 글
| PEFT란? Parameter-Efficient Fine-Tuning (0) | 2025.05.26 |
|---|---|
| LLM Fine-Tuning이란? (0) | 2025.05.26 |
| 🧠 LangChain이란? (0) | 2025.05.26 |
| 🔠 GPT란? (0) | 2025.05.26 |
| 디코더만 사용하는 GPT (0) | 2025.05.26 |