brunch

You can make anything
by writing

C.S.Lewis

by 최재철 Apr 01. 2024

RAG 와 기존 AI 분류모델과의 차이점

미래 AI 도시 이미지

RAG와 기존 방법의 차이점


분류에 기초한 전통적인 모델

전통적인 자연어 모델은 입력 쿼리를 기반으로 미리 정의된 응답 집합중에서 적절한 응답을 선택하도록 설계되었습니다. 이러한 모델은 입력 텍스트(질문 또는 쿼리)를 사전 정의된 답변의 분류 세트와 비교합니다. 시스템은 지도 학습 알고리즘과 같은 기술을 사용하여 입력과 레이블(label)이 지정된 응답 간의 유사성을 측정하여 가장 적절한 응답을 결정합니다. 이러한 분류 기반 모델은 답변이 정적 응답 유형을 기반으로 하는 경우가 많고 구조화된 형식의 질문/답변 세트에서 효과적입니다.


RAG 기반 차세대 모델

기존 방식과 달리 생성형 AI 모델은 기존 콘텐츠를 매칭하는 대신 처음부터 답변이나 콘텐츠를 생성합니다. 이러한 모델은 종종 신경망을 기반으로 하는 보다 복잡한 알고리즘을 사용하여 인간과 유사한 텍스트나 응답을 생성합니다. 우리가 익숙한 방법과 달리 새로운 콘텐츠를 생성하기 때문에 기존 클래스와 연결할 필요가 없습니다. 이러한 이유로 비지도 학습 알고리즘과 비슷합니다. 비지도 학습을 기반으로 하는 이러한 모델을 사용하면 쿼리에서 제공되는 콘텐츠를 기반으로 다음 단어 또는 단어 시퀀스를 예측하여 답변을 생성하는 방법을 학습합니다. 새로운 상황에 맞는 응답을 생성하는 이러한 능력은 창의적 글쓰기, 번역, 대화와 같은 작업에 적합합니다.


전통적인 AI 모델 vs 생성형 AI 모델 비교표


RAG 사용의 장점

RAG의 주요 장점은 다음과 같습니다.


1. 상황적 관련성: RAG 모델은 상황적으로 더욱 관련성이 높은 동적 응답을 생성할 수 있습니다. 외부 소스의 정보를 결합하여 생성된 텍스트는 현재의 실제 정보에 더 가까우므로 정확하고 상황에 맞는 답변을 얻을 수 있습니다.


2. 사실 확인 및 검증: RAG 모델은 신뢰할 수 있는 외부 소스로부터 정보를 받기 때문에 생산 과정에서 사실 확인 및 검증을 수행할 수 있습니다. 이는 허위 또는 오해의 소지가 있는 정보의 생성을 줄이고 생성된 콘텐츠의 정확성을 보장하는 데 도움이 됩니다.


3. 향상된 지식 통합: RAG 모델은 답변을 개선하기 위해 외부 지식 기반이나 문서를 효과적으로 사용할 수 있습니다. 이는 모델이 다양한 소스의 관련 정보에 액세스하여 정보가 풍부하고 정확한 답변을 제공할 수 있는 질문/답변 작업에 특히 유용합니다.


4. 유연성 및 적응성: 다양한 소스에서 정보를 얻을 수 있는 능력은 RAG 모델을 더욱 유연하고 적응 가능하게 만듭니다. 검색 메커니즘이 관련 정보를 검색하도록 설계된 경우 각 특정 시나리오에 대한 명시적인 미세 조정 없이 광범위한 주제와 작업을 처리할 수 있습니다.


5. 분포를 벗어난 입력 처리: 전통적인 텍스트 생성 모델은 분포를 벗어난 입력이나 훈련 데이터에 없는 비정상적인 입력에 직면할 때 어려움을 겪을 수 있습니다. 반면, RAG 모델은 벡터 데이터베이스를 통해 문서 스택을 활용하여 보이지 않거나 덜 일반적인 입력에 대해서도 관련 정보를 찾을 수 있습니다.


6. 통제된 콘텐츠 제작: RAG 모델은 통제된 콘텐츠 제작에도 사용될 수 있습니다. 문서 검색 프로세스를 안내하고 소스를 지정함으로써 개발자는 모델이 응답을 생성하는 데 사용하는 정보의 유형과 품질을 제어할 수 있습니다.


7. 편견 감소: 문서 검색 메커니즘은 생성된 콘텐츠의 편견을 줄이는 데 도움이 될 수 있습니다. 다양한 정보 소스를 사용함으로써 모델은 훈련 데이터에 존재하는 편향의 영향을 받을 수 있는 기존 모델에 비해 더 균형있고 편향되지 않은 응답을 제공할 수 있습니다.


RAG는 상당한 이점을 제공하지만 다양한 소스의 복잡한 정보를 처리하고 문서 검색 결과의 정확성과 효율성의 균형을 맞추는 별도의 작업은 필요합니다.


다음은, 생성형AI 의 각 기법들에 대해서 간단하게 설명하겠습니다. 

각 기법에 대한 목적 설명

비용과 난이도 측면에서는 다음과 같습니다:  

프롬프트엔지니어링(Prompt Engineering): 비교적 낮은 비용과 쉬움 정도의 난이도. 명확한 지시와 샘플 데이터를 작성하는 데 시간이 소요됩니다.

RAG: 외부 소스를 통합하는 데 추가 비용이 발생할 수 있으며, 중간 정도의 난이도입니다.

파인튜닝(Fine Tuning): 특정 작업에 맞게 모델을 훈련시키는 데 비용과 시간이 많이 들 수 있습니다. 난이도 상

사전학습(Pre-Train): 처음부터 모델을 만드는 데 많은 비용과 노력이 필요합니다. 난이도 상


이 기법들은 각각 다른 목적과 방법을 가지고 있으며, 프로젝트의 요구 사항에 따라 선택할 수 있습니다.

작가의 이전글 LLM RAG 란
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari