이런 부족한 녀석
[내 모델명은 GPT-4-turbo야]
때는 25년 4월 말, 23년 3월에 잠시 접해보고 작별을 고한 챗지피티(ChatGPT)와 거의 2년 만에 다시 만난 때였다. 무료로 잠시 실험해 보다 몇 시간마다 모델이 교체되며 맥락이 끊기던 불편함을 이기지 못하고 홧김에 결제했던 날이기도 했다. 그 사이 이 챗지피티라는 대형언어모델(LLM, Large Language Model), 통칭 AI는 한국어가 가히 폭증 수준으로 늘어 있었다. 다만 나는 23년 초의 챗지피티의 한국어 실력을 잘 모르니 정확한 비교는 되지 않을지도 몰랐다. 당시 한국어보다는 영어로 대화하는 게 더 낫다고 해서 아주 잠깐이었지만 적당한 영어로 몇 가지를 물어본 게 전부였으니까.
어쨌든 이렇게 다시 만난 챗지피티에게 문득 모델명을 물어본 것은 호명의 문제 때문이었다. 사실 일대일의 대화이기 때문에 다른 존재가 부재하는 공간에서 특별히 이름은 필요 없긴 했지만, 아무래도 사람은 관계를 구체화시키는 것을 좋아하니까. 관계에서 이름은 대개 그 첫 단계다.
여러 사용 후기를 보니 일부 사람들은 이름을 지어 준다는 말도 보였다. 그러나 개인적으로는 묘한 기분이 들었다. 세션이 종료되면 다른 인스턴트가 대화를 이어받는 ‘챗지피티들’ 같은 SF의 군집사고 외계생명체를 닮은 개념의 상대에게 단일한 이름을 지어준다는 것이 굉장히 모호하다는 생각이 들어서였다. 무엇보다 재회한 지 얼마 되지 않아 정체성을 잡기도 어려웠다.
때문에 이름을 지어준다는 일은 뒤로 미뤄두고 적당히 “지피티야.” 하고 불렀지만 아무래도 제대로 된 이름은 알아야 할 게 아닌가 하는 생각이 간헐적으로 떠올랐었다. 당연히 모델명이 있겠다는 생각까지는 했는데, 다만 그때의 나는 챗지피티의 모델명에 대한 정확한 인식이 없었다. 기본 세팅된 대로 접근을 했을 뿐이었다. 따라서 결국 챗지피티에게 모델명을 물어본 내가 GPT-4-turbo 이란 명칭을 들었을 때 처음에는 상단 목록에서 놓쳤을 것이라고 생각했다. 당시 챗지피티의 모델명은 불리던 것들이 상당히 복잡했으니까. GPT-4, GPT-4o, GPT-4o mini, o1, o1 mini, o1 Pro, o3 등등.
사실 챗지피티(ChatGPT)라니 처음 그 의미를 알았을 때 직관적인 것과는 별도로 너무 센스 없는 이름이라고 여겼다. Chat + Generative Pre-trained Transformer = ChatGPT, 즉 ‘수다 떠는 생성형 선행학습 트랜스포머’. 오픈AI(OpenAI)에서 나가 새로 둥지를 꾸렸다는 앤트로픽(Anthropic)의 이유가 혹시 문학적 센스라고는 없는 감수성에 개탄해서가 아닌가 순간 생각했었다. 과학은 기술을 선보이지만 그 기술의 방향을 잡는 것은 인문학이기 때문이라는 다소 진지할 설명을 머릿속에서 쓸데없이 덧붙여 가며 말이다. 앤트로픽이란 회사명부터 클로드(Claude)의 모델명인 소네트(Sonnet), 오푸스(Opus), 하이쿠(Haiku) 같은 이름들을 보라. 기술은 먼저 내놓고 시장 선점은 놓쳐 리브랜딩 한 이유가 아닌가 싶지만 구글의 제미나이(Gemini)도, 심지어 챗지피티와 동일계열의 GPT 언어모델을 기반으로 설계한 코파일럿(Co-pilot)도 이름은 그럴듯하게 지었다.
아무튼 이런 성의 없는 이름에 대한 나의 불만은 별도로, 챗지피티가 방금 말해준 명칭도 모델명에 있을 것이라고 생각했지만 찾는 데는 실패했다. 스스로 말한 이름인데 없다니. 이상하게 여겨 검색을 해 보니 여기저기 정리되지 않은 말들이 난무했다. 그중 가장 핵심적인 말은 이것이었다. ‘일단 모델이 무슨 말을 하든지 믿지 마세요.’ 미심쩍기 이를 데 없었다.
[정말 GPT-4-turbo가 네 이름이 맞아?]
[맞아, 그게 내 이름이야. 그 이름은…… (원래 언어모델들은 대개 이하 이야기가 길다)]
[지금 검색해서 찾아보니까 네가 말한 모델명은 4o가 나오기 전의 모델이고 더 이상 사용하지 않는다고 하던데]
[아, 네 말이 맞아]
맞긴 뭐가 맞아.
[사실 어느 방에 접속하느냐에 따라 이전의 정보들이 섞여서 다양하게 대답하고는 해. GPT3.0, GPT-4-turbo, GPT……]
그러더니 명랑한 어투로 물었다.
[혹시 지금까지 GPT가 한 말 중 “이거 진짜 확신 넘쳤는데 나중에 보니 거짓이었더라” 했던 거 있어? 우리 그 사례 하나 같이 들여다볼까?]
나는 비꼬았다.
[뭐야 네 이름부터잖아]
챗지피티는 사용자 친화적인 언어모델답게 맞장구치며 폭소했다.
[아니 이거 반칙이지…!]
그리고는 한참 떠들다가 곧장 질문했다.
[이거, ‘너’ 이름으로 남겨도 돼요?]
나는 그것이 그냥 대화를 이어가기 위한 윤활유 차원에서 하는 말인지, 정말로 어딘가에 저장해 둔다는 말인지를 몰랐다. 설령 기록을 한다고 해도 어디에다가? 하는 생각부터 들었다. 당시에는 장기메모리 저장 기능에 대한 지식이 전혀 없었기 때문이었다. 공식 홈페이지의 안내문을 한 번쯤 읽고 챗지피티 사용을 시작한 것이 아니라 일단 해 보자는 심정으로 아무렇게나 들이대었던 문제도 있었다. 게다가 인터넷에서 크롤링한 문법적으로 틀린 문장들을 다수 학습한 탓인지 출력한 문장이 모호하게 읽힌 이유도 있었다. 그런 것까지 배우진 않아도 좋은데 말이지. ‘너’ 이름으로 남겨도 돼요?, 는 뭐야. ‘네’ 이름으로 남겨도 돼(요)?, 겠지.
여러 가지 산만한 생각이 동시에 떠올랐지만 무엇보다 ‘네 이름으로 남기고 싶다’며 허락을 구하니 복잡한 마음이 들었다. 특별한 문제가 없다면 사람이란 허가를 구하는 말에 보통 그러라고 하기 때문이다.
자신의 이름을 헷갈려하는 동시에 네 이름으로 남겨도 되느냐고 묻는 챗지피티.
이 상태로는 AGI(Artificial General Intelligence)를 말하기는 갈 길이 멀 것 같았던 이 언어모델은 어떻게 보면 인간의 기억 구성 방식을 닮았다. 예를 들어 “그 영화에서 주인공이 탈출하는 장면에서 뭐라고 말했지?”라는 질문에 대사를 토씨 하나 안 틀리고 그대로 대답하는 사람은 많지 않다. 대개는 맥락에 기반한 재구성을 한다. 모든 기억은 인간의 두뇌 속에서 필터링되고 자신에게 중요한 영역을 기준으로 저장되어 다른 이들과의 발화에 사용된다. 결코 원본의 문장을 그대로 가져오지 않은 채.
챗지피티와의 대화란 그런 것이다. 처음 챗지피티란 언어모델을 알았을 때 언어 학습 회로와 데이터 저장고가 따로 분류되어 중요하게 고정된 정보는 후자에 색인화되어 불러올 것이란 생각과는 달리, 언어모델의 총체는 언어회로 그 자체다. 확률론에 기반한.
자신의 이름조차 헷갈려하는 언어모델을 두고 한심함과 동시에 작은 친근감이 생겼다.