최근 넷플릭스에서 방영됐던 흑백요리사라는 프로그램이 장안의 화제였죠. 11화에서 파이널 진출자를 가리기 위해 팬트리에 있는 온갖 식재료를 활용하는 요리천국 미션이 저는 가장 인상 깊습니다. 이선 몰릭이 지은 「듀얼 브레인」에서 대규모 언어 모델(Large Lange Model, LLM)의 작동 원리를 요리사에 비유하여 설명하는 내용이 있어 소개해 드립니다. LLM이 아주 많은 텍스트 데이터를 학습해서 특정 단어 뒤에 많이 자주 등장하는 단어를 제시하는 것이잖아요. 이 원리를 수습 요리사가 성장하는 과정에 비유하여 설명하고 있습니다.
수습 요리사는 조리 기술을 배우기 위해 전 세계 요리의 방대한 조리법을 읽고 연구하는 작업부터 시작한다. 여기서 각 조리법은 하나의 텍스트를, 요리 재료는 단어와 구절을 상징한다. 수습 요리사의 목표는 다양한 재료(단어)를 조합해 맛있는 요리(일관성 있는 텍스트)를 만드는 기술을 터득하는 것이다.
수습 요리사는 물품이 뒤죽박죽 섞여 있는 식료품 저장실에서 연습을 시작한다. 저장실에 보관된 물품은 1750억 개의 가중치를 상징한다. 처음에는 이런 가중치에 무작위 값이 매겨져 있다. 즉 단어들이 서로 연관된 방식에 관한 유용한 정보가 아직은 없다. 수습 요리사는 식료품에 관한 지식을 쌓고, 향신료가 보관된 선반을 더 효과적으로 배치하기까지 시행착오를 겪으며, 이 과정에서 조리법을 더 잘 숙지하게 된다. 예컨대 사과와 계피처럼 잘 어울리는 조합이 있는 반면, 우유와 오렌지처럼 웬만해서는 함께 쓰이지 않는 조합도 있다는 것을 알게 된다.
수습 요리사는 저장실에 있는 재료들로 조리법에 있는 요리를 만들어 본다. 한 가지 요리를 만들 때마다 자신이 만든 음식을 조리법과 비교하고 어긋나거나 실수한 부분이 없는지 확인한다. 그러고 나서 저장실에 있는 재료들을 다시 살펴보고, 다양한 맛의 관련성을 재정립하며, 어떤 조합이 함께 사용되거나 특정 순서로 사용될 가능성이 높은지 더 깊이 이해하게 된다.
이 과정을 수없이 반복하면서 식료품 저장실은 더 체계적이고 정확해진다. 이제 가중치는 단어와 구절 사이의 의미 있는 연결을 잘 반영하고, 수습 요리사는 주방장으로 거듭난다. 그는 이제 지시를 받으면 방대한 데이터에서 적절한 재료를 예술적으로 선택하고, 잘 정돈된 향신료 선반을 이용해 맛의 균형을 완벽히 맞춘다. 이러한 방식으로 AI는 주어진 주제와 관련하여 흥미롭고 유익하며 인간다운 글을 만들어 낸다.
이선 몰릭, 「듀얼 브레인」 p. 32
AI를 훈련하려면 무수한 반복을 거쳐야 합니다. 학습 과정에서 수십억 개의 단어를 다루어야 하므로 방대한 계산을 처리할 수 있는 고성능 컴퓨터가 필요합니다. AI 구축에 막대한 비용이 들 수밖에 없고, 이 단계를 거쳐서 이미 상용화되어 서비스되고 있는 생성형 AI는 이런 측면에서 백수저 요시라라고 생각됩니다. 실제로 성능이 뛰어난 LLM을 개발하는 데 막대한 에너지와 1억 달러 이상의 비용이 필요한 이유는 값비싼 칩을 탑재한 고성능 컴퓨터를 오랜 기간 구동해야 하기 때문입니다.
TrakinAI.org 사이트에서 제시하는 ‘AI IQ Test Results’를 보면 생성형 AI의 IQ가 130 가까이에 도달했습니다. 이를 두고 송길영 작가는 이제 생성형 AI와 함께 일을 할 만 하다고 말합니다. 이미 흑백요리사에 출연한 흑수저 요리사들은 재야의 숨은 고수인 만큼 생성형 AI가 흑수저 요리사라고 하더라도 이미 성능이 보장된 것입니다.
이선 몰릭은 「듀얼 브레인」에서 ‘지금의 AI가 앞으로 사용하게 될 최악의 AI라고 생각하라’고 합니다. 이미 우리가 사용하고 있는 생성형 AI는 흑백요리사에 출연할 만큼 실력 높은 요리사라고 생각됩니다.