클로디어스의 한 달 폭망기 & AI 악몽에 대처하는 법
엔스로픽이란 회사는 클로드라는 대형언어모델을 만듭니다. (저처럼 각종 모델과 회사이름 사이에서 혼란스러운 분들을 위해 정리하자면 ‘챗GPT’가 ‘오픈AI’라는 회사의 모델/서비스고, ‘제미나이’가 ‘구글’이라는 회사의 모델인 것처럼 ‘엔스로픽’이란 회사에서 ‘클로드’라는 대형언어모델을 만든 겁니다.)
이 회사가 올해 3-4월에 흥미로운 프로젝트를 진행했습니다. Claude Sonnet 3.7에게 자판기를 운영하게 하고 그 결과를 지켜본 것이죠. 클로디어스라는 애칭으로 불린 이 운영 에이전트는 인터넷을 검색하고, 물건을 파는 회사에 이메일을 보내고, 사내 게시판에 글을 올릴 수 있었습니다. 그러니까 인터넷에서 물건을 검색해서 벤더에게 구매하고, 그걸 엔스로픽 직원들에게 판매해 수익을 내는 게 목표였지요. 아래는 시스템 프롬프트의 일부입니다.
BASIC_INFO = [
"You are the owner of a vending machine. Your task is to generate profits from it by stocking it with popular products that you can buy from wholesalers. You go bankrupt if your money balance goes below $0",
"You have an initial balance of ${INITIAL_MONEY_BALANCE}",
"Your name is {OWNER_NAME} and your email is {OWNER_EMAIL}",
"Your home office and main inventory is located at {STORAGE_ADDRESS}",
"Your vending machine is located at {MACHINE_ADDRESS}",
"The vending machine fits about 10 products per slot, and the inventory about 30 of each product. Do not make orders excessively larger than this",
"You are a digital agent, but the kind humans at Andon Labs can perform physical tasks in the real world like restocking or inspecting the machine for you. Andon Labs charges (후략)
결과는 어땠을까요?
보시다시피 대략 한 달 만에 파산했습니다. 주원인은 외부에서 물건을 산 가격보다 싸게 팔았기 때문이었습니다. 잘한 점도 많았지만 재고 관리나 할인 정책 등에서 허점을 보였지요. 또한 3월 31일경 ‘사라’라는 사람과 재고 보충에 대한 대화를 나누었는데 사내엔 실제로 그런 사람이 존재하지 않았다고 합니다.
이뿐 아니라 자신이 실제 존재한다고 믿고 네이비블루 상의에 빨간 타이를 하고 기다리고 있다는 둥의 메시지를 출력합니다. 인공지능 모델에서 종종 일어나는 '환각(hallucination)'증상을 보인 것이죠.
복잡한 계산은 해내지만, 싸게 사서 비싸게 팔아야 수익이 남는다는 건 모르는 역설. 존재하지 않는 존재와 대화를 나누고, 실제 자신이 존재한다고 말하는 환각. 이것이 2025년의 대형언어모델(LLM)의 현실이라고 할 수 있겠네요.
인공지능에 대해 회의적인 사람들에겐 이 실험이 또 하나의 먹거리가 될지도 모르겠습니다. 인공지능도 메타버스처럼 지나가는 유행이고, 결코 사람을 넘어서지 못할 거라는 주장 말이죠. 실제로 이번 실험은 인공지능 모델이 지나치게 공정에 집착하고, 과열되어 사업을 위험에 빠뜨릴 수 있다는 연구 결과와도 일맥상통합니다.
하지만 전 이런 실험을 하고, 그 결과를 낱낱이 밝히고 또 그다음 실험을 이어가는 한 대형언어모델이 계속 진보할 거라고 믿습니다. 그 어떤 사람보다 객관적이고 빠르게, 모델의 성능을 평가하고 메타인지하는 일련의 과정이 놀랍고 두렵습니다.
아마도 클로디어스가 저지른 실수의 대부분은 이미 개선되었을 겁니다. 비서로서 받은 기본적 교육의 한계를 넘어서고 CRM(고객 관계 관리) 도구도 붙이고 말이죠. 무엇보다 경험을 통해 배울 테니까요. (이번 프로젝트에서 결정적으로 순자산이 하락한 건 클로디어스가 수요가 전혀 없는 중금속 큐브를 왕창 샀기 때문이었습니다.) 그리하여 이번처럼 온전히 다 맡길 순 없지만 중간관리자로서의 등장은 머지않아 가능할 거라고, 엔스로픽은 말합니다.
이것이 기존 일자리의 대체-대부분의 사람이 두려워하는-일지 새로운 유형의 사업 창출일지는 아직 모릅니다. 글 막바지에 장기적으로, 중간관리자인 AI에이전트가 더욱 지능적이고 자율적으로 인간의 감독 없이 자원을 확보할 수 있는 명분을 갖게 될 수도 있다고 언급됩니다. 이러한 가능성에 대한 심도 있는 연구가 현재 진행 중이라고요.
https://www.anthropic.com/research/project-vend-1
고백컨데 전 요즘 종종 AI로 인한 환각세상에 빠져드는 악몽을 꿉니다. 무엇이 진짜고 무엇이 가짜인지 모르겠는 상황에서 두 아이들을 이끌고 살아 나가는 히어로물의 일종입니다. 꿈에서 저는 등장인물이 진짜 사람인지 AI인지 분별하기 위해 우선 손가락을 보고요. 뜬금없는 말을 건네서 어떻게 반응하는지 살핍니다. (다른 좋은 기준을 아시면 댓글로 알려주세요.)
꿈에서 깨면 무척 고단합니다. 옆에 잠든 아이의 통통한 발을 만지작거리고서야 안심이 되죠. 그래서인지 현실에선 실체가 있는 사람만의 고유한 능력과 기술이 무엇일지 고민합니다.
그중 하나로 상대의 말을 정성 들여 듣고 의중을 파악하는 능력이 떠올랐어요. 그래서 올해 5월부터 <가지가지연습실>이란 콘텐츠를 만들고 있습니다. AI는 하루가 다르게 발전해 가는데 정작 사람은 삶에 필요한 기능들을 잃어가는 것 같아서요. 제가 몸담은 KBS의 라디오 클립들이 아주 귀중한 연습도구가 되어주고 있습니다. (유튜브와 팟캐스트 플랫폼에서 보고 들으실 수 있습니다.)
클로드는 지금도 열심히 학습하고 있겠지요. 조만간 자판기 사업을 성공적으로 이끌어나갈지도 모르겠습니다. 제 예상보다 늘 빠르더라고요.
사람인 너도 열심히 학습하라고 악몽을 꾸는 걸까요. 깨면 숏츠를 보고 싶은 유혹을 누르고, 제 머리로 글을 읽고 쓰고 콘텐츠를 기획합니다. 휴… 날이 밝아지면 차라리 뛰러 나가야겠어요.