AWS 48탄-10. 아마존 베드락과 어드밴스 RAG

QnA Chatbot 서비스

by Master Seo

Mar 26. 2024

문제를 정의하고 해결해보자~

<1> 문제점 = 필요한것

<2> 해결책

<3> 하이브리드 퓨전, Reranker , 페어런츠 다큐멘트를 동시에 활용하는 방법

<1> 문제점 = 필요한것

고객특화 데이터에 대한 대응

주기적 업데이트에 대한 대응

거짓이 없어야 한다 (No hallucination)

<2> 해결책

문제점1

고객특화 데이터에 대한 대응 - 파인 튜닝으로 대응가능

주기적 업데이트에 대한 대응 - RAG 로 대응가능

해결책1

종합

잦은 업데이트 주기로 인해 파인 튜닝보다 RAG가 적합하다고 판단.

RAG = 데이터 베이스 확보 필요.

고객특화 데이터에 대한 대응

LLM에 학습 과정에서 활용 되지 않았던 정보에 대해서도 대답해야 한다.

이슈는?

어떻게하면 한번도 보지 못한 정보에 대해서도 LLM이 답을 할수 있을까?

해결은 컨텍스트로 할수 있다.

질문에 대한 답변 정보를 컨텍스트형태로 LLM에게 제공함으로써 학습을 하지 않은 정보에 대해서도

답변을 하도록 한다.

질문에 대한 컨텍스트를 어떻게 선택할수 있나?

질문과 다큐멘트간의 임베딩 벡터 유사도를 통해 질문과 연관성이 높은 다큐멘트를 선택할수 있다.

이 방법을 RAG라고 한다.

문제점2

거짓이 없어야 한다 (No hallucination)

해결책2

Hybrid-Fusion - 시맨틱 서비와 Lexical search를 동시에 활용. 부족한 부분을 보완= 검색 향상

RAG Fusion - 유저로 받은 입력 받은 쿼리를 다양한 형태로 변경하여 시맨틱 서치로 변경. 질의 과정의 다양화로 성능 향상.

HyDE - 질의에 대한 가상 답변으로 기반으로 시맨틱 서치 진행, 질의와 답변 사이의 시맨틱 갭을 줄임으로써 성능 향상.

Parent Document - 검색은 청크 사이즈가 짧은 차일드를 대상으로 함으로써 시맨틱서치 성능을 올리고, 결과느 매핑되는 페어런츠를 리턴 함으로써 정보 손실을 줄이는 방법.

Reranker - 리턴된 Documents들에 대해 쿼리와의 관련성을 다시한번 측정하여 컨텍스트에 들어갈 Documents으 rank를 바꿔 주는 기법.

<3> 하이브리드 퓨전, Reranker , 페어런츠 다큐멘트를 동시에 활용하는 방법

다음 AI

https://brunch.co.kr/@topasvga/3685

AWS 48탄-11. 기업을 위한 생성형 AI

AWS Innovate AI/ML and Data Edition | <1> 생성형 AI = Generative AI 란? <2> 생성형 AI를 위한 클라우드 서비스 계층 <3> Amazon Titan Image Generator <4> 생성형 AI 문제와 개선 <5> 베드락의 앱놀이터 = PartyRock <6>

https://brunch.co.kr/@topasvga/3685

감사합니다.

keyword

매거진의 이전글AWS 48탄-9. MLOpsAWS 48탄-11.기업 생성형 AI-2024-02매거진의 다음글