brunch

[서평] 랭체인으로 RAG개발하기

VectorRAG와 GraphRAG의 개념과 원리

by 홍창수
22222222.jpg


VectorRAG와 GraphRAG, 그리고 OpenAI와 DeepSeek까지


주말에 가장 따끈한 LLM RAG책이 도착했습니다. 서지영님의 LLM책 중 첫 번째 책인, 지난해 출간된 ‘랭체인으로 LLM기반의 AI서비스 개발하기’는 LLM 일반 총서에 해당된다면 그다음 나온 ‘랭체인 & 랭그래프로 AI 에이전트 개발하기’가 에이전트 특화 입문서, 금번에 나온 ‘랭체인으로 RAG 개발하기: VectorRAG & GraphRAG’는 RAG 특화 입문서라 할 수 있겠습니다. 아시다시피, 요즘 LLM 시대의 화두 중 하나는 'RAG(검색 증강 생성)'입니다. 하지만, RAG라고 다 같은 RAG는 아닙니다. 이 책은 일반적인 임베딩 기반의 빠른 유사도 검색인 벡터 기반 RAG(VectorRAG)에서 좀 더 심화된 데이터 간 관계를 고려한 구조적 검색인 지식 그래프 기반 RAG(GraphRAG)라는 두 가지 주요 RAG 방식을 비교하고, 직접 실습을 통해 구현해볼 수 있게 구성된 실용적인 입문서입니다.(입문을 할 수 있게끔 이제까지 나온 오픈AI의 모든 제품과 AI 원리도 한 챕터 소개하고 있습니다.)


아울러, 이 책은 개인적으로도 많은 관심사인 딥시크(DeepSeek) 모델을 소개하고 딥시크과 오픈AI의 실습을 비교하고 있습니다.(OpenAI API와 딥씨크 모델을 모두 사용해 VectorRAG를 구현하면서, 두 모델 간 성능 차이를 스스로 체험해볼 수 있게 했습니다.) 실습 부분은 초보자라도 어렵지 않게 랭체인을 활용해 기본적인 RAG 시스템을 구현해볼 수 있게 자동차 데이터, 웹 데이터, PDF 파일, 영화 데이터 등의 예제를 단계별로 따라 하면서 VectorRAG와 GraphRAG를 모두 경험할 수 있도록 설계되어 있습니다. 마지막 파트에는, 코파일럿(Copilot)에서 사용하는 그래프 검색과 비교하면서, VectorRAG와 GraphRAG의 차이를 이해할 수 있도록 한 점도 인상적이라 할 수 있겠습니다. 전반적으로 좀 다양하게 RAG방식을 체득하게끔 한 저자의 노력이 엿보이는 책입니다.


한줄 평: RAG 개념부터 실습까지 짧은 시간 안에 쉽게 배우고 싶은 사람에게 훌륭한 길잡이(VectorRAG와 GraphRAG 비교, OpenAI와 DeepSeek의 성능 체험, 기초 예제를 통한 RAG 실습)

keyword
작가의 이전글[나의 논문 2편] 내재변동성과 LMM 논문