[ AI & Robot ] 7-1. RAG & Long Context

2026년 04월 16일
공개 Hanyang Univ 26-01

1. RAG의 기본: "도서관 사서" 방식 (Traditional RAG)

기존의 RAG는 LLM의 부족한 기억력을 보완하기 위해 외부 저장소(Vector DB)에서 필요한 조각만을 찾아 전달하는 방식입니다.

  1. 동작 원리: 문서를 조각(Chunk) 내어 벡터 DB에 저장 → 질문과 가장 유사한 조각만 검색 → LLM에게 전달.
  2. 장점: 수억 개의 문서 중 필요한 것만 골라내므로 비용 효율적임.
  3. 단점: 문서를 잘게 쪼개는 과정에서 앞뒤 맥락이 잘리거나, 비정형 데이터(코드, 복잡한 표)의 논리 구조를 놓칠 위험이 있음.

2. 새로운 흐름: "Long-Context" 접근법 (File-based Context)

최신 LLM(Gemini 1.5 Pro, Claude 3.5 등)의 컨텍스트 윈도우가 수백만 토큰으로 확장되면서, "굳이 쪼개지 말고 다 넣어주자"는 방식이 가능해졌습니다. OpenClaw나 Cursor가 채택하는 방식이기도 합니다.

왜 MD(Markdown) 파일을 직접 쓰는가?

  1. 논리 구조의 보존: MD 파일은 헤더(#), 리스트(-), 코드 블록(```) 등을 통해 문서의 위계를 명확히 보여줍니다. LLM은 이 구조를 읽어 문서 전체의 흐름을 완벽히 파악합니다.
  2. In-Context Learning의 극대화: 검색된 '조각'이 아니라 '전체 문서'를 읽은 모델은 문서 내의 미묘한 관계나 프로젝트 전체의 코딩 스타일을 훨씬 더 잘 반영합니다.
  3. 검색 성능의 역전: 인덱싱된 DB에서 검색하는 것보다, 똑똑해진 LLM이 수만 줄의 텍스트 안에서 직접 정보를 찾는 것이 더 정확한 경우가 많습니다.

3. RAG vs. Long-Context 비교 요약

비교 항목전통적 RAG (Vector DB)Long-Context (File Injection)
비유필요한 페이지만 발췌독하는 사서책 한 권을 통째로 머릿속에 넣은 천재
핵심 기술임베딩 & 코사인 유사도 검색거대 컨텍스트 윈도우 (Long-Context)
데이터 형태정형화된 데이터 조각 (Chunks)구조화된 MD, 코드 파일 전체
주요 도구Pinecone, FAISS, LangChainOpenClaw, Cursor, NotebookLM
적합한 사례수만 권의 책, 기업 전체 위키특정 프로젝트 코드, 논문 몇 권, 매뉴얼