brunch

라이킷 6 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 안영회 습작 Jan 10. 2024

배경 지식이 부족해도 AI 논문을 빠르게 읽는 법

보고 듣고 배워 지금 써먹기

ChatGPT 이후에 딱히 쓰지 않았던 생성형 AI를 조금 실용적으로 써 볼 대상이 생겼습니다. 최근 구글 Bard를 써 보고 받은 인상이 제 어깨를 두드렸습니다.[1]

DeepL과 구글 Bard 도움으로 AI 논문 대충 훑기

페벗 님의 논문 소개와 요약을 보고 직접 읽어 보고 싶다는 생각이 난 데에서 출발합니다. AI에 대한 배경 지식도 없으니 막상 마음먹었지만 실행을 미루게 됩니다. 그래서, 익숙한 DeepL 도움을 받아야겠다 싶었습니다. 그런데 영어보다는 AI에 대한 배경 지식 부족이 중요한데 DeepL이 그 문제를 해결해 줄 수는 없습니다. 그래서 구글 Gemini로 한번 시도해 보고 구글 Bard에게 어찌 도움을 받을지 생각해 냈습니다.

1차 시도는 동동주와 막걸리 차이를 Bard와 ChatGPT에 묻기와 거의 같은 식으로 했습니다. 차이가 있다면 일단 초록(Abstract)을 DeepL 한 결과를 Bard에게 '보기'로 주는 정도만 추가했습니다.

간편한 정리를 봤더니 글자가 점점 읽기 싫어서 일단 표로 만들어 달라고 요청했습니다.

내 지식수준에서 주어진 내용으로 차려 보기

<오픈AI의 노선 투쟁과 MS의 승리>를 쓰면서 손때를 묻힌 보람을 느낍니다. AI 전문가들의 교양 일부가 표의 첫 줄에 나열된 듯합니다.

그런 문제들에 대한 해결책으로 논문이 제시된 듯합니다. 그렇게 추정하는 배경은 논문 제목이 바로 '

Retrieval-Augmented Generation for Large Language Models...'이기 때문입니다. 이렇게 단서를 잡고 보니 기대하지 않았던 행운을 만난 듯합니다.

그래서 RAG가 무언데?

대개 배경 지식이 없는 초보자의 문제는 뭘 물어야 할지 모른다는 점입니다. 그래서, 처음부터 내용을 읽어야 하죠. 그걸 피하려고 (큰 손해 볼 것 없는) 소소한 모험을 시도했는데, 기대 이상의 경험입니다. 그 이유는 그냥 하는데 질문이 만들어졌기 때문입니다. 표로 요약된 내용으로 뭘 물어야 할지 알게 된 것이죠. 요약으로만 보긴 불편해서 논문에서 RAG를 설명하는 내용을 찾아보았습니다.[2]

To address the limitations of purely parameterized models, lan- guage models can adopt a semi-parameterized approach by integrating a non-parameterized corpus database with pa- rameterized models. This approach is known as Retrieval- Augmented Generation (RAG).

여기서 제가 배운 바는 'RAG가 뭔데?'라는 질문을 30분 가까운 시도에서 찾은 것입니다. 대강 답을 얻은 다음에 다시 표로 돌아갔습니다. 그랬더니 논문이 주장하는 효과가 보였습니다. '그렇구나' 하고 넘겼습니다. 특별히 질문이 생기지 않았습니다. 그다음 주요 구성 요소는 알고 싶었습니다.