brunch

You can make anything
by writing

C.S.Lewis

by 김도환 Sep 25. 2024

MRC 모델 기술, 생성형 AI 환각 극복의 새로운 길

안녕하세요.

기업을 위한 인공지능 지식 코치, 디피니트입니다.


오늘은 생성형 AI의 환각현상에 대해 이야기해 보려고 합니다. 



나아가, 이러한 환각현상을 방지할 수 있는 새로운 해법인
MRC 모델에 대해서도 자세히 소개하겠습니다.

이 정보를 통해 AI 기술의 이해도를 높이고, 더 효과적으로 활용할 수 있기를 바랍니다. 



오늘의 목차입니다.  




01. 생성형 AI의 환각 현상

생성형 AI의 환각현상은 간단히 말해 사실과 다른 정보를 생성하는 현상입니다. 주로 "외재적 환각"이라고 하는데요. 이는 콘텐츠의 출처를 확인할 수 없는 결과물을 만들어내는 경우를 의미합니다.



이러한 현상이 발생하면 사용자는 사실에 맞지 않는 정보를 받을 수 있으므로, 생성형 AI 사용 시 주의가 필요합니다.




생성형 AI의 환각현상을 일으키는 원인은 다음과 같습니다.


1. 훈련 데이터의 한계  

AI는 방대한 데이터를 학습하여 작동하지만, 만약 학습 데이터에 오류나 편향을 포함하고 있다면 잘못된 결과물 생성에 영향을 미칠 수 있습니다.


2. 맥락 이해 부족  

AI는 문맥을 완벽하게 이해하지 못할 수 있습니다. 각 문화에서의 관용구나 표현, 비유적 표현이나 뉘앙스 등 AI가 파악하는데에는 한계가 있습니다. 이로 인해 부적절한 답변이나 정보 왜곡이 발생할 가능성이 있으며 길게 대화를 이어가기 힘듭니다.


3. 추론 과정의 오류  

입력된 정보를 기반으로 새로운 정보를 생성하는 과정에서 잘못된 추론이 생길 수 있으며 이러한 요소들은 생성형 AI 사용 시 고려해야 할 중요한 사항이니 주의가 필요합니다. 







01-1. 환각 현상을 극복하기 위한 방법


1) RAG모델


RAG 모델의 개요  

RAG(Recall-Augmented Generation) 모델은 정보를 검색하고 생성하는 기능을 통합한 모델입니다.


사용자가 질문을 입력하면, 외부 데이터베이스나 문서에서 관련 정보를 검색한 후, 이를 바탕으로 응답을 생성합니다.



2) MRC 모델


MRC 모델의 활용  

 이 모델은 주어진 텍스트를 이해하고, 질문에 대한 답변을 보다 정확하게 생성하는 데 초점을 맞추고 있습니다.



다시말해 RAG모델은 검색 능력에 초점이 맞춰진 모델이며, MRC 모델은 주어진 문서를 이해하는데 초점이 맞춰진 모델입니다. 





02. MRC 기술과 장점


MRC 모델은 기계가 주어진 텍스트를 이해하고 해석하는 기능을 갖춘 기계 독해 시스템입니다.

이 모델을 개발하는 과정은 우리가 고등학교 시절 언어영역에서 복잡한 비문학 지문을 읽고 이해하는 능력을 키우는 과정과 유사합니다. 즉, MRC는 텍스트의 의미를 파악하고 이에 대한 질문에 정확히 답변하는 데 초점을 맞추고 있습니다.


그럼 실제 사례를 보여드리며 설명드릴게요.



02-1. MRC 기술 사례




가장 대표적인 예로는 구글이나 네이버에서 키워드를 검색했을때 가장먼저 상단에 보여지는 지식 스페닛입니다. 아래 이미지를 보시면 제가 GPU에 대해 검색했을때 추천 스페닛 정보로 뜨는 텍스트입니다.


인공지능이 문서에 대한 이해를 바탕으로 가장 정확한 정보를 제공해주는 것입니다.


다음으로 실제 문서를 이해하여 답변을 생성해내는 과정을 보여드릴게요.


준비물은 뤼튼 사이트와 PDF 파일입니다.


KCA 한국방송통신전파진흥원에서 발행한 생성형 AI에 관한 리포트입니다. 

이 문서를 뤼튼에서 AI 에게 업로드 시키고 질문을 해보려합니다.

출처 : KCA 한국방송통신전파진흥원


그럼 뤼튼으로 이동해볼게요.

아래와 같이 첨부파일을 업로드하고 질문을 생성해볼게요.


그랬더니 답변으로 사용자는 하루에 최대 50곡까지 생성하여 다운로드가 가능하다고 합니다.



그럼 문서에서 관련내용이 맞나 찾아볼게요!


정말 개인 요금제 이용자는 하루 최대 50곡을 다운로드가 가능하네요.




MRC 모델 기술로 챗봇은 주어진 문서를 이해하여 사용자 질문에 대해 답변을 신속하고 정확하게 생성해 낼 수 있는 것입니다. 


현재 생성형 AI 챗봇은 RAG(문서 검색 및 생성) 모델과 MRC(기계 독해) 모델, 그리고 sLLM(특화된 대형 언어 모델)을 결합하여 더욱 정확한 답변을 제공하는 진화된 솔루션으로 발전하고 있습니다.


이러한 환각 현상을 극복해내는 기술로 기업에서는 더욱 정확도가 높은 챗봇을 구축할 수 있게 되었습니다. 위 내용 참고하시면 유용할 것입니다!


감사합니다. 

궁금한 점이 있으면 언제든지 물어보세요! 



디피니트의 기업용 챗봇, 엑시

https://www.dfinite.ai/


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari