환각 문제를 해결해 가며 추론 능력을 갖춰가는 챗GPT
이제 사회에 관심이 있는 사람이라면 모를 수가 없는 챗GPT(ChatGPT)의 아버지, 샘 알트만 오픈AI의 CEO를 비롯한 경영진이 9일 방한하였습니다. 챗GPT가 단순 인기를 넘어 엄청난 사회적 파급효과를 낳은 것을 방증이라도 하듯, 대통령과의 만남, 중소벤처기업부장관 주관 간담회 등 많은 행사가 열렸는데요.
이날 행사에서는 모두는 샘 알트만의 입에 귀를 기울였으며, 최근 이슈가 되고 있는 생성형 인공지능에 대한 규제 등 현안에 대한 토론부터, 챗GPT가 등장하면서부터 논란이 되었던 환각(hallucination)에 대한 기술적인 얘기까지 들어볼 수 있었습니다.
그중 저의 이목을 끌었던 꼭지 중 하나는 바로 환각 문제!
환각 문제에 대해서는 다음과 같은 논의가 있었습니다.
오픈AI 경영진은 자사 서비스와 기술에 관해서도 발언을 했다. 브로크먼 사장은 스켈터랩스 조원규 CEO가 ‘할루시네이션(AI가 사실이 틀린 정보를 사실인 것처럼 말하는 현상)’ 해결을 위해 어떤 노력을 하는지 묻자 “아직 해결 지점에 도달하진 못했지만 열심히 해답을 찾기 위해 노력 중”이라면서 “한 예로 할루시네이션을 일으킬 수 있는 데이터는 사용하지 않도록 하는 모델도 테스트 과정에 있다”라고 말했다.
(출처 하단 명기)
챗GPT가 처음 등장하고 사람과 비슷한 언변에 전문가 뺨치는 전문지식으로 엄청난 주목을 받았죠. 특히나 우리가 궁금한 걸 물어보면 거침없이 답변해 주는 모습에 초기 사용자 증가가 어마어마했고요.
하지만 챗GPT를 조금 써보면서 느낀 점.
얘가 거짓말을 하네?
과거에 축적해 놓은 텍스트들에서 가장 의미 있는 표현을 생성하는 생성형 인공지능의 일종인 챗GPT는 과거에 습득한 데이터의 참과 거짓에 상관없이, 챗GPT가 계산했을 때 가장 확률이 높은 텍스트를 사람의 프롬프트에 맞춰서 반환을 해줍니다. 이 과정에서 진실이 아닌 틀린 정보를 사실인 것처럼 말하는 할루시네이션, 환각 현상이 자주 발생을 했던 거죠.
그 과정에서 우리나라에서 가장 많이 언급된 할루시네이션 사례.
바로 세종대왕이 맥북을 던진 사건일 겁니다.
세종대왕이 맥북을, 그것도 에어가 아닌 프로를 최환이라는 관료에게 던졌다고 하는 챗GPT의 답변은 많은 이들에게 실소를 자아냈습니다. 인터넷상에서 세종대왕 맥북 던짐 사건으로 밈(Meme)화 되었고, 언론에도 다수 보도가 된 사건이죠.
사실 환각 문제는 심각할 수 있습니다. 전문분야에서 챗GPT의 의견을 곧이곧대로 믿고 업무를 진행하였다가 피해를 본 사례들이 종종 들리곤 하는데요. 이는 해당 분야에 대한 전문성을 완벽하게 갖추지 않은 사람이 챗GPT의 의견에 전적으로 의존했을 때 발생할 수 있는 것입니다. 거짓을 너무나 자연스럽게 이야기하는 챗GPT의 의견을 전문가가 검증하지 않으면 앞으로 다양한 분야에서 이러한 환각 이슈는 발생할 수밖에 없습니다. 세종대왕이 맥북을 던졌다고 하는 것은 누가 봐도 진실이 아님을 알 수 있기에 해프닝으로 넘어가지만 잘 모르는 분야에서 나오는 챗GPT의 뻔뻔한 거짓말은 향후 큰 문제를 일으킬 수 있는 잠재력을 가지고 있는 거죠.
하지만 이런 챗GPT가 조금씩 달라지고 있습니다.
현재의 챗GPT는 GPT-4 버전을 쓰고 있습니다. 처음 출시되었을 때 많은 사람들이 체험해 본 3.5 버전에서 업그레이드가 된 것이죠. GPT-4를 활용한 챗GPT를 출시하면서 샘 알트만은 ABC와 인터뷰를 하였습니다. 여기에서 많은 인상적인 얘기들이 있었지만, 챗GPT가 추론을 시작했다는 점이 저의 이목을 가장 끌었습니다.
이제 챗GPT는 데이터베이스에서 필요한 문장을 뽑아내는 것이 아니라 추론을 하고 있다는 것인데요.
실제로 최근 컨퍼런스 등을 가보면 생성형 인공지능이 사람들이 얘기하는 추론을 시작했다는 의견을 말씀하시는 분들이 많았습니다. 불과 몇 달 전까지만 해도 아직 추론의 단계에는 오지 않았다는 의견이 더 많았었는데 말이죠.
그럼 이제 챗GPT에게 다시 한번 물어봅니다. 세종대왕이 맥북프로를 던졌는지.
위 사례가 추론을 근거로 했는지, 혹은 이슈가 되었던 사건에 대해 별개로 학습을 했는지는 알 수 없지만 조금씩 나아지는 모습을 보이고 있는 것만은 분명합니다. 불과 몇 달 전에 문제가 되었던 것들을 이미 상당수가 극복이 되었고, 학회나 행사를 가보면 갈 때마다 기술의 진보가 체감이 될 정도입니다.
인공지능 프로그램들을 사용해 보고, 얘는 이것도 못하던데 하고 넘어간 다음 몇 달이 지나면 그 문제는 이미 해결이 되어있고 훌쩍 기존 수준을 넘어가 있는 것을 우리는 현재 경험하고 있습니다. 앞으로 또 몇 달 뒤에는 어떠한 모습을 보여줄지 기대도 되면서 약간의 두려움도 드는 것이 사실입니다.
딥러닝의 아버지 제프리 힌턴 교수가 구글을 떠나며 남긴 말이 계속해서 뇌리 한켠에 남아있는 요즘입니다.
https://www.bbc.com/korean/articles/crgm8d787l7o
출처