Pruning

알맹이 찾기

by 닥터브룩스

이상한 일이다. 불과 몇 달 전만 해도 인공지능 언어 모델은 변덕스럽고 창의적인 아이 같은 모습이었다. 열정적으로 수다를 떨긴 했지만, 어딘가 모르게 믿을 수 없는, ‘환각(hallucination)’이라 부르는, 사실이 아닌 것들을 지어내기 일쑤였다. 일단 사용하면서도 신뢰하긴 좀 힘들었다. 그런데 갑자기 모든 것이 변하기 시작했다. 오늘날 대화하는 AI는 놀라울 정도로 신뢰할 수 있는 동료처럼 느껴지기도 한다. 모르는 것은 모른다고 인정한다. ‘검색 증강 생성(RAG)’이라는 기술을 통해 전 세계의 정보를 검색하며 사실을 재차 확인한다. 신뢰할 수 없는 몽상가에서 신뢰할 수 있을만한 조수로의 빠른 변화에 한 가지 근본적인 질문을 가직게 된다.




기술은 어떻게 이토록 빠르게 진화했을까?


단지 규모의 확장뿐 아니라, '적합성'의 측면에서 말이다. 단순히 ‘더 커진’ 것이 아니라, ‘더 똑똑해진’ 것 같은 느낌이다. 그 해답이 단순히 더 많은 데이터를 추가하는 데 있지 않다는 것을 알게 되었다. 역설적이게도, 그 답은 무언가를 ‘덜어내는’ 정교한 기술에 있을 것이라고 생각한다.

이 지점에서 ‘가지치기(Pruning)’라는 개념을 만나게 된다. 이 단어 자체는 아름다울 정도로 농업적이다. 우리는 본능적으로 이를 이해한다. 농부가 사과나무를 돌볼 때, 그저 물을 주고 잘 자라기만을 바라지 않는다. 과수원을 거닐며 가지치기 가위를 들고, 신중하고 의도적으로 가지들을 잘라낸다. 굵고 중심이 되는 가지가 아니라, 중복되거나, 약하거나, 잘못된 위치에 난 가지들 말이다. 외부인이 보기엔 이 행위가 파괴처럼 보일 수도 있다. 살아있는 것의 일부를 왜 제거하는 것일까? 하지만 농부는 자연의 중요한 비밀을 알고 있다. 식물은 유한한 에너지를 가지고 있다. 그대로 내버려 두면, 그 에너지는 무수히 경쟁하는 가지들에 낭비되어, 결국 평범한 잎사귀와 작고 신 열매만을 맺게 된다. 농부의 가지치기는 집중된 사랑의 행위이자, 전략적인 ‘덜어내기’이다. 불필요한 것을 제거함으로써, 나무의 모든 에너지는 남겨진 가지들로 재분배되고, 그 결과 농부가 원하는 크고 건강하며 달콤한 과실을 맺게 된다. 이는 비단 나무에만 해당되는 이야기가 아니다. 성장에 관한 보편적인 법칙이다. 진정한 잠재력은 단순한 덧셈만으로는 거의 발현되지 않는다. 그것은 불필요한 것을 과감히 제거하는 용기를 통해 비로소 발현된다.


Gemini_Generated_Image_n1mgmmn1mgmmn1mg.png


이 정확한 농업의 지혜가 지금 지구상 가장 진보된 기술의 원동력이 되고 있다. 수년간 인공지능 분야의 경쟁은 더 많은 매개변수를 가진 가장 큰 모델을 구축하려는, 크기를 앞세운 무자비한 경쟁이었다. 하지만 이는 문제를 야기했다. 이 거대한 모델들은 비효율적이고 느렸으며, 거대한 데이터 센터에 갇혀있었다. 새로운 혁명은 바로 ‘소형화’의 혁명이다. Meta의 Llama, Google의 Gemma, DeepSeek의 R1과 Alibaba의 Qwen 같은 모델들은 이제 로컬 PC에서도 작동할 만큼 작아졌고, 프라이버시를 존중하며 즉각적으로 반응한다. 이러한 효율성은 처음부터 작게 시작해서 얻어진 것이 아니다. 거대한 것을 ‘작게 만듦으로써’ 달성된 것이다. 그 기술이 바로, 문자 그대로의 ‘가지치기’이지 않을까 추측해 본다. 엔지니어들은 수십억 개의 연결고리를 가진 거대한 신경망, 즉 디지털 두뇌를 훈련시킨다. 그런 다음, 최종 답변에 거의 또는 전혀 기여하지 않는 연결고리, 즉 디지털 ‘가지’들을 세심하게 분석하고 잘라낸다. 개별적이고 약한 연결을 잘라내는 ‘비구조적 가지치기’와, 마치 하나의 가지 전체처럼 뉴런 그룹 전체를 제거하는 ‘구조적 가지치기’가 있다. 모델에서 이 ‘군살을 빼는’ 작업은 지능을 크게 손상시키지 않으면서도 모델을 더 가볍고, 더 빠르고, 더 효율적으로 만든다.


더욱 흥미로운 점은 이것이 단순히 영리한 공학적 속임수가 아니라는 것이다. 이것은 ‘생체 모방’이다. 우리 자신의 뇌가 바로 이 원리를 보여주는 궁극적인 예이다. 흔히 성인의 뇌가 아이의 뇌보다 더 많은 연결고리를 가지고 있어서 더 똑똑할 것이라 가정하지만, 사실은 그 반대이다. 세 살배기 아이의 뇌는 성인의 뇌보다 훨씬 더 촘촘한 시냅스 연결망을 가지고 있다고 한다. 유년기와 청소년기를 거치면서, 우리 뇌는 ‘시냅스 가지치기’라는 거대하고 자연스러운 과정을 겪는다. 사용하지 않는 연결은 체계적으로 삭제하고, 자주 사용하는 연결은 강화한다. 우리는 말 그대로 잊고, 삭제하고, 가지치기를 함으로써 우리의 지능을 조각하고 있다. 효율적이고 지적인 성인의 마음은 모든 것을 붙들고 있는 마음이 아니라, 무엇이 유지할 만큼 중요한지 ‘배웠고’ 나머지는 과감히 놓아버리는 규율을 가진 마음이다. 효율성을 추구하던 AI 엔지니어들은, 자연이 이미 수천 년간 알고 있던 이 심오한 교훈을 재발견할 수밖에 없었다.


‘적은 것이 더 낫다’는 이 원리는 너무도 근본적이어서, 우리 지성사의 기반을 형성한다. 14세기 철학자 오컴의 윌리엄은 이를 위한 도구, 즉 정신적 ‘면도날’을 우리에게 물려주었다. ‘오컴의 면도날’로 알려진 이 원칙은 "필요 없이 실체(가정)를 늘려서는 안 된다"라고 말한다. 현대적인 용어로 바꾸자면, 어떤 현상에 대해 여러 설명이 경쟁할 때, 가장 단순한 설명, 즉 가장 적은 가정을 필요로 하는 설명이 대개 옳다는 것이다. 이것은 지적인 가지치기 가위이다. 불필요한 복잡성, 가정, 그리고 ‘만약에’들을 잘라내고 그 아래 숨겨진 우아하고 단순한 진실을 찾으라고 요구한다. 이것은 나쁜 이론을 ‘가지치기’하는 도구이다. 이 원리는 과학적 발견에서부터 훌륭한 디자인에 이르기까지 모든 것을 안내한다. 가장 우아한 해결책은 복잡한 것이 아니라, 불필요한 모든 부분이 ‘면도’된, 심오할 정도로 단순한 것이다.


그리고 이 기술적 트렌드가 우리의 삶과 일, 특히 ‘기획’의 영역에 거울을 비춰준다고 믿는다. 우리는 ‘더 많이’를 숭배하는 문화 속에 산다. 제품의 기능은 ‘기능 과다(feature creep)’로 질식하고 있다. 버튼 하나, 옵션 하나, 기능 하나를 더 추가하고 싶은 끊임없는 유혹 말이다. 우리의 스케줄은 회의로 가득 차 부풀어 있다. 우리의 전략은 모든 사람에게 모든 것이 되려고 한다. 무엇을 좋아할지 몰라서 이렇게 준비해 봤다는 우스갯소리로 자신을 합리화하려 한다. 또한 성공이 덧셈의 문제라고 가정하며 살아간다. 그러나 AI 진화의 이야기, 농부의 나무 이야기, 인간의 뇌 이야기, 그리고 오컴의 면도날 이야기는 모두 직관에 반하는 동일한 진실을 외치고 있다. 명료함, 효율성, 그리고 진정한 가치는 ‘뺄셈’을 통해 성취된다는 것을 말이다. (대표적으로 피카소의 '황소' 연작을 들 수 있다.) 제품 기획에서 가장 어렵고 가장 중요한 일은 어떤 새로운 기능을 추가할지 결정하는 것이 아니다. 그것은 ‘가지치기’를 할 수 있는 용기와 명료함을 갖는 것이다. 사용자의 ‘진짜’ 문제를 해결하는 핵심 기능에 집중하기 위해 기능 목록을 가지치기하는 것. 모든 사람을 어설프게 만족시키는 대신 핵심 고객에게 완벽하게 봉사하기 위해 타깃 ‘페르소나’를 가지치기하는 것. 우아하고 단순한 효율의 길을 만들기 위해 단계, 클릭, 텍스트를 잘라내며 사용자 경험을 가지치기하는 것. RAG 기술은 정보를 ‘더하지만’, 그 정보를 효과적으로 사용하는 것은 ‘가지치기’된 모델이다. 우리에게는 둘 다 필요하지만, 덧셈에 집착한 나머지 비판적이고 훈련된 뺄셈의 기술을 잊어버렸다.


장난감에서 도구로 단숨에 도약한 AI의 새로운 능력에 경외심을 느낀다. 하지만 AI가 우리에게 가르쳐 줄 수 있는 가장 중요한 교훈은 AI가 ‘무엇을 하는지’가 아니라, ‘어떻게 그 지점에 도달했는지’에 있는지도 모른다. AI는 그저 성장함으로써 효율적이 된 것이 아니다. 자르고, 집중하고, 가지치기하는 법을 배움으로써 효율적이 되었다. 이 깨달음은 과수원에서 데이터 센터까지 울려 퍼지며, 내게 하나의 질문을 계속 던진다. 나의 일, 나의 생각, 그리고 나의 삶 속에서, 내가 지금 물을 주고 있는, 그러나 사실은 아무런 열매도 맺지 못할 가지는 과연 무엇일까?




keyword
작가의 이전글생물학과 경험이 만들어내는 개인차