5장. 마지막 0.1%의 가격

AI가 도달하지 못하는 라스트 마일, 인간 전문가가 내놓는 암묵지의 가격

by 성효경

미국외과학회 산하 수술품질개선프로그램(ACS NSQIP)에서 흥미로운 연구를 수행한 적이 있다. 일리노이 주의 56개 병원이 참여하는 수술품질개선협력체(ISQIC)에서 17명의 현직 외과의사가 대장 절제술을 시행하는 장면을 비디오로 촬영하고, 각 영상을 10명 이상의 전문 평가자가 독립적으로 시청하며 기술 점수를 매겼다. 5점 만점에 2.8점부터 4.6점까지 점수가 분포했다. 같은 수술, 같은 자격증을 가진 외과의사들 사이에서 기술 수준에 상당한 편차가 존재했다는 뜻이다.

그 다음이 중요한데, 연구팀은 이 기술 점수와 각 외과의사의 환자 3,063명의 수술 결과를 대조했다. 기술 점수 상위 그룹의 환자 합병증 발생률은 15.5%였고, 하위 그룹은 20.6%였다. 사망 또는 중증 합병증 비율은 15.9% 대 21.4%. 그리고 이 외과의사들의 기술 점수는 수술 후 합병증 변이의 약 26%를 설명했다. 수술 장비의 차이가 아니다. 병원의 수준 차이도 아니다. 이 외과의사들은 같은 교육을 받았고, 같은 도구를 쓰며, 같은 절차를 따른다. 수술 과정의 99%는 동일하다. 다른 것은 메스를 쥔 손이 조직을 다루는 미세한 방식, 봉합의 장력을 조절하는 감각, 출혈이 생겼을 때 대응하는 속도뿐이다. 과정의 1%도 되지 않는 그 차이가, 환자의 합병증률을 5%포인트 이상 갈라놓았다.

5%p라는 숫자가 작아 보일 수 있다. 하지만 수술대 위에 누운 환자에게 이 5%p는 퇴원 후 일상으로 돌아가는 것과 재수술을 받는 것의 차이이고, 경우에 따라서는 살아서 집에 가는 것과 그러지 못하는 것의 차이다.

과정의 99.9%가 같은데, 나머지 0.1% 미만의 차이가 결과의 질을 결정한다. 이 차이를 나는 "마지막 0.1%"라고 부르려 한다.




2024년 기준으로 웹에 게시되는 글의 절반 이상이 AI가 작성한 것이라는 분석이 나왔다. ChatGPT 출시 이후 12개월 만에 전체 웹 글의 39%가 AI 생성 콘텐츠가 되었고, 2024년 11월에는 AI가 만든 글의 양이 인간이 쓴 글의 양을 넘어섰다. 디자인 시안도, 보고서 초안도, 코드도, 논문의 뼈대도 AI가 만들어준다. 그리고 그 결과물들은 대부분 일정 수준 이상의 품질을 갖추고 있어서, 명백히 열등한 것을 찾기가 오히려 어렵다.

이 품질은 날이 갈수록 더 좋아지고 있다. 2026년 1월, 워싱턴 포스트가 앤쓰로픽의 내부 문서를 공개했다. 코드명 '프로젝트 파나마'. 50만에서 200만 권의 책을 사들여 등을 잘라내고, 산업용 유압 절단기로 해체한 뒤, 고속 스캐너로 읽혀 AI에게 학습시킨 프로젝트였다. 스캔이 끝난 종이는 재활용 업체가 수거했고, 물리적 책은 사라지고 디지털 잔해만 남았다. 내부 기획 문서에는 이런 문장이 있었다. "프로젝트 파나마는 전 세계의 모든 책을 파괴적으로 스캔하려는 우리의 노력이다."

왜 책이었을까. 인터넷에는 텍스트가 넘친다. 커뮤니티 댓글, 위키피디아, 뉴스 기사, 블로그. 하지만 책은 다르다. 저자가 수개월에서 수년을 들여 쓰고, 편집자가 다듬고, 출판사가 검증한 텍스트다. 논리의 흐름이 길고, 문장 사이의 연결이 촘촘하다. AI에게 "잘 쓰는 법"을 가르치려면, 잘 쓰인 텍스트가 필요했던 것이다. 그리고 그 결과, AI의 글쓰기 능력은 "편집자 수준"이라는 평가를 받게 되었다.

여기서 아이러니가 생긴다. AI가 99.9%의 품질에 도달할 수 있었던 것은, 인간이 마지막 0.1%까지 공들여 쓴 텍스트를 수백만 권 학습했기 때문이다. AI의 99.9%는 인간의 0.1%를 먹고 자란 것이다. 하지만 그렇게 학습한 AI가 쏟아내는 콘텐츠는, 정작 그 0.1%가 빠져 있다. 왜 그런 걸까. 기술적으로 불가능한 것일까, 아니면 아직 못 하는 것일까.


이 질문에 답하려면 AI가 글을 쓰는 원리를 이해해야 한다. 범용 AI, 그러니까 우리가 일상적으로 쓰는 ChatGPT나 Claude 같은 대규모 언어 모델은 기본적으로 "다음 단어 예측기"다. 수백만 권의 텍스트에서 추출한 패턴을 바탕으로 "이 단어 다음에 올 확률이 가장 높은 단어는 무엇인가"를 계산하는 방식으로 작동한다. "나는 오늘 아침에"라는 문장 뒤에 "커피를"이 올 확률과 "우주선을"이 올 확률을 비교하여, 맥락에 가장 어울리는 단어를 선택하는 것이다.

이 방식이 놀라울 정도로 잘 작동한다는 것은 이미 증명되었다. 문법도 정확하고, 논리 구조도 탄탄하며, 때로는 인간보다 유려한 문장을 만들어내기도 한다. 하지만 구조적 한계가 있다. 이 모델은 학습 데이터에 존재하는 패턴의 범위 안에서만 작동한다. 기존에 존재하는 문장들의 패턴을 재조합하여 "가장 그럴듯한" 결과물을 만들어내는 것이지, 기존 패턴에 없는 것을 새로 만들어내는 것이 아니다. 비유하자면, 이 세상에 존재하는 모든 요리의 레시피를 외운 사람이 그 레시피들을 조합하여 새로운 메뉴를 제안하는 것과 비슷하다. 조합의 결과물이 훌륭할 수 있지만, 그것은 기존 재료와 기존 기법의 범위 안에 있다. 아무도 시도하지 않았던 식재료를 발견하거나, 기존 조리법의 전제 자체를 뒤집는 것은 이 방식으로는 나오기 어렵다.


2025년, 오픈AI의 샘 올트먼이 양자컴퓨팅의 아버지로 불리는 물리학자 데이비드 도이치와 나눈 대화에서 도이치가 이 점을 정확하게 짚었다. 그는 AI가 진정한 창의성을 갖추었는지를 판단하려면, 유창하게 대화하는 능력이 아니라 "아직 풀리지 않은 문제를 풀고, 왜 그렇게 풀었는지를 설명할 수 있는지"를 봐야 한다고 했다. 기존 패턴을 재조합하는 것과 새로운 지식을 생성하는 것은 질적으로 다른 행위라는 것이다.

그렇다면 특정 영역에 특화된 버티컬 AI는 어떨까. 의료 영상 판독에 특화된 AI, 법률 문서 분석에 특화된 AI, 단백질 구조 예측에 특화된 AI처럼 하나의 전문 분야에 집중하여 설계된 시스템들이다. 이들은 범용 AI보다 훨씬 정확하고, 특정 작업에서는 인간 전문가를 넘어서기도 한다. 영상 판독 AI가 전문의보다 높은 정확도를 보이는 것이 그 예다. 하지만 여기서 역설이 생긴다. 버티컬 AI가 특정 영역에서 인간 수준에 접근하려면, 그 영역의 인간 전문가가 가진 암묵지가 뭉쳐진 지식을 시스템에 이식해야 한다. 의료 AI를 만들려면 의사들이 수십 년간 축적한 임상 경험을 데이터로 변환해야 하고, 법률 AI를 만들려면 변호사들의 판례 해석 노하우를 학습시켜야 한다.

그리고 이 이식 작업에는 엄청난 비용이 든다. 브루킹스 연구소가 MIT 연구팀과 함께 수행한 분석이 이 문제를 정확하게 보여준다. 연구팀은 AI 자동화의 기술적 가능성과 경제적 실현 가능성을 분리하여 분석했다. 결과는 충격적이었다. 컴퓨터 비전 분야에서 기술적으로 자동화가 가능한 작업은 전체의 80%에 달했다. 하지만 라스트 마일 커스터마이제이션 비용을 포함하여 경제적으로도 자동화가 매력적인 작업은 23%에 불과했다. 기술적으로는 될 수 있는 일의 3분의 2 이상이, 비용 때문에 실현되지 못하고 있다는 뜻이다.


연구팀이 든 예시가 직관적이다. 소규모 빵집에서 제빵사 5명이 일하고 있다고 하자. 이들의 업무 중 하나는 식재료의 품질을 눈으로 검수하는 것인데, 이 작업은 전체 업무의 약 6%를 차지한다. 이것을 컴퓨터 비전 AI로 대체하면 연간 약 14,000달러의 인건비를 절약할 수 있다. 하지만 이 빵집에 맞게 AI 시스템을 커스터마이즈하는 비용은 그보다 훨씬 크다. 빵의 종류, 원재료의 특성, 이 빵집 고유의 품질 기준을 AI에게 가르치는 작업이 필요하기 때문이다. 대규모 산업용 제빵 공장이라면 수백 명의 검수 인력을 대체할 수 있으니 투자 대비 효과가 나지만, 소규모 빵집에서는 경제성이 맞지 않는다.

이 구조는 컴퓨터 비전에만 해당되는 이야기가 아니다. AI가 기술적으로 해낼 수 있는 것과, 현실에서 경제적으로 작동하는 것 사이의 간극은 모든 영역에 존재한다. 그리고 그 간극을 메우려면 결국 각 영역의 특수한 맥락을 AI에게 학습시켜야 하는데, 그 학습의 원재료가 바로 해당 분야 전문가들의 경험과 판단이다. 그 경험과 판단을 데이터로 변환하는 과정 자체가, 전문가의 개입 없이는 불가능하다.

다시 말해, 버티컬 AI가 0.1%에 접근할수록, 그 0.1%를 가진 인간에 대한 의존도는 오히려 높아진다. AI가 인간의 전문성을 대체하는 것이 아니라, 인간의 전문성을 원료로 소비하는 것이다. 앤쓰로픽이 수백만 권의 책을 물리적으로 해체하면서까지 AI에게 학습시킨 것이 바로 이 원리의 극단적 사례다.

이 환경에서 99.9%의 완성도는 더 이상 경쟁력이 아니다. 누구나 만들 수 있는 것이기 때문이다. 프롬프트 한 줄이면 나오는 결과물에 프리미엄을 붙일 수는 없다. 가격을 결정하는 것은 나머지 0.1%다.


한강의 '채식주의자'를 영어로 옮긴 데보라 스미스의 번역이 좋은 예다. AI는 '채식주의자'를 정확하게 번역할 수 있다. 단어 하나 틀리지 않고, 문법도 완벽하게. 하지만 이 번역이 원작의 의미를 전달하는 것에 그쳤다면, '채식주의자'는 맨부커 국제상을 받지 못했을 것이다. 데보라 스미스가 한 것은 정확한 번역이 아니라, 원작이 가진 불안과 폭력성을 영어라는 전혀 다른 언어의 문장 구조 안에서 다시 만들어낸 것이었다. 한국어에서 작동하는 긴장이 영어에서도 작동하게 하려면, 때로는 원문에서 벗어나야 했고, 그 벗어남의 정도와 방향을 결정하는 것이 번역가의 감각이었다. 그 감각이 한강이라는 작가를 세계 문학의 무대 위에 올려놓는 데 결정적인 역할을 했고, 그 무대의 끝에 2024년 노벨 문학상이 있었다. AI가 해낸 99.9%의 정확한 번역과, 데보라 스미스가 더한 0.1%의 감각. 그 0.1%가 노벨 문학상을 만들었다.




2025년 7월, AI가 만든 밴드 벨벳 선다운(Velvet Sundown)이 스포티파이에서 100만 스트리밍을 넘겼다. 멤버도 없고, 공연도 없고, 인간이 관여한 흔적이 전혀 없는 밴드였는데, 대부분의 청취자는 그 사실을 모른 채 음악을 들었다. 프로덕션 퀄리티는 나무랄 데가 없었다. 화성 진행도, 믹싱도, 보컬도 충분히 그럴듯했다. 정체가 밝혀진 뒤 음악 산업에서는 "경고등"이라는 반응이 나왔다.

세계적인 DJ이자 프로듀서인 크리스 레이크는 이 상황을 이렇게 표현했다. "사람들이 오랫동안 내 사운드를 모방해왔지만, 이제는 누군가가 프롬프트를 입력하면 크리스 레이크처럼 들리는 곡을 만들 수 있다. 미쳤다." 그가 수십 년에 걸쳐 만들어온 사운드를, AI가 프롬프트 한 줄로 복제해버린다. 기술적으로는 구별이 안 된다. 그런데 그 복제된 사운드로 클럽을 가득 채울 수 있을까? 그 곡이 새벽 3시의 플로어에서 사람들을 울게 만들 수 있을까? 10년 뒤에도 누군가가 이 곡을 기억할까?

비스티 보이즈부터 자니 캐시, 아델, 제이지까지 장르를 가리지 않고 작업해온 전설적 프로듀서 릭 루빈은 AI가 시간은 압축할 수 있지만 취향까지 압축하지는 못한다고 보는 쪽이다. 실행을 가속할 수 있지만, 의미를 가속하지는 못한다는 것이다. 그는 AI를 "코딩의 펑크 록"에 비유하기도 했다. "과거에는 음악원에 가서 수년을 공부해야 했다. 그러다 펑크 록이 나왔고, 하루 만에 세 코드를 배우면 밴드를 할 수 있게 되었다." AI가 음악 제작의 진입 장벽을 무너뜨린 것은 펑크 록이 클래식 음악의 장벽을 무너뜨린 것과 같다는 이야기다. 하지만 펑크 록이 세 코드로 누구나 밴드를 할 수 있게 해줬다고 해서, 모든 사람이 더 클래시나 섹스 피스톨즈가 된 것은 아니었다. 진입 장벽이 사라진 뒤에야 비로소, 세 코드 위에 무엇을 얹을 수 있느냐가 진짜 차이가 되었다.


주방에서도 같은 이야기가 펼쳐진다. 스페인 엘 푸에르토 데 산타마리아에 있는 미슐랭 쓰리스타 레스토랑 아포니엔테(Aponiente)에서 일한 한 셰프가 주방의 일상을 회고한 적이 있다. 이 레스토랑의 셰프 앙헬 레온은 "바다의 셰프"라는 별명으로 불리는 인물로, 세상 어디에서도 먹을 수 없는 식재료를 요리에 쓰는 것으로 유명하다. 플랑크톤, 참치 골수 캔디, 해조류로 만든 곡물. 그런 실험적 요리의 이면에는 종이 타월의 기준이 있었다. 튀긴 토르티야에서 기름을 빼기 위해 까는 종이 타월조차 완벽한 직각으로 접어서 트레이 바닥에 빈틈 없이 깔아야 했다. 접는 각도가 틀리면 다시 해야 했다. 요리의 맛과 아무 상관이 없는 일이었지만, 그 주방에서는 그것이 기준이었다. 처음에는 의미를 몰랐지만 시간이 지나면서 그 기준이 몸에 배었고, 결국 모든 작업에서의 정밀도가 달라졌다고 그 셰프는 회상했다. "쓰리스타 주방에서의 가장 큰 배움은 레시피나 조리 기술이 아니었다"는 것이 그의 결론이었다.

조엘 로뷔숑은 이 정밀도의 화신 같은 인물이었다. 프랑스 출신의 이 셰프는 전 세계 26개 레스토랑에서 총 32개의 미슐랭 별을 보유했는데, 이는 역사상 한 사람이 가진 가장 많은 미슐랭 별이다. 36세에 자신의 레스토랑 자맹(Jamin)을 열었고, 첫해에 미슐랭 원스타를 받았다. 31세에 역대 최연소로 프랑스 최고장인(MOF) 타이틀을 획득한 그는, 자맹을 개업 3년 만에 쓰리스타에 올렸다. 군대식 규율로 주방을 운영한 것으로도 유명한데, 젊은 시절의 고든 램지에게 랑구스틴 라비올리 접시를 던진 일화는 지금도 회자된다. 하지만 그의 요리 철학은 화려함의 정반대에 있었다. "음식이 단순할수록 잘 만들기가 더 어렵다. 식재료 본연의 맛을 진정으로 느끼게 해야 하기 때문이다. 이것은 매우 일본적인 접근이다. 좋은 재료를, 재료의 맛을 방해하지 않도록 아주 단순하게 조리하는 것." 그리고 그는 생전에 이 말도 남겼다. "더 나아질 수 있는 것은 항상 있다." 32개의 별을 가진 사람이, 어떤 요리도 완성되었다고 생각하지 않았다.

미슐랭의 기준에 따르면, 원스타는 "뛰어난 요리", 투스타는 "우회할 가치가 있는 탁월한 요리", 쓰리스타는 "특별한 여행을 떠날 가치가 있는 최고의 요리"다. 투스타에서 쓰리스타로 올라가려면 "셰프의 인격과 재능이 요리에 분명하게 드러나야" 하고, "일부 요리는 클래식이 될 운명"이어야 한다. 식재료나 기술의 차이가 아니라, 셰프가 이 접시 위에 무엇을 올리고 무엇을 올리지 않을 것인지를 결정하는 관점의 차이다. AI는 원스타 수준의 레시피를 구현할 수 있을 것이다. 식재료의 최적 조합을 계산하고, 온도와 시간을 정밀하게 제어하며, 플레이팅의 구도까지 제안할 수 있다. 하지만 쓰리스타를 만드는 것은 레시피가 아니다.




여기서 짚어야 할 것은, 0.1%가 99.9%와 질적으로 다른 종류의 것이라는 점이다. 99.9%는 학습 가능하다. 데이터가 있고, 패턴이 있으며, 규칙이 있다. AI가 잘하는 영역이다. 하지만 0.1%는 축적의 산물이다. 수천 번의 시행착오, 수만 시간의 몰입, 셀 수 없는 실패에서 체화된 감각이다. 외과의사의 기술 점수 차이는 수술 매뉴얼의 차이가 아니다. 수천 건의 수술을 하면서 "이 조직은 여기서 이렇게 다뤄야 한다"고 손끝에 새겨진 감각의 차이다. 로뷔숑이 소스의 농도를 조절하면서 "여기서 멈춰야 한다"고 느끼는 순간, 그것은 레시피가 아니라 수천 번 소스를 졸이면서 실패하고 성공한 기억의 총합이 내리는 결정이다.

AI는 이 축적을 흉내 낼 수 있을까. 크리스 레이크의 말처럼 AI는 이미 그의 사운드를 프롬프트 한 줄로 복제하고 있고, 벨벳 선다운은 100만 명의 청취자를 속였다. 하지만 릭 루빈의 시각처럼 AI가 압축하는 것은 시간이지 취향이 아니다. 축적에는 시간이 필요하고, 시간에는 실패가 포함되어 있으며, 실패에는 고통이 따른다. AI는 데이터에서 패턴을 추출하지만, 고통을 겪지는 않는다. 고통 없는 축적이 고통을 겪은 축적과 같은 깊이를 가질 수 있는지는, 아직 아무도 답하지 못한 질문이다.

AI 시대의 역설이 여기에 있다. 99.9%의 가격이 0에 수렴하는 세상에서, 0.1%의 가격은 오히려 올라간다. 누구나 AI로 그럴듯한 곡을 만들 수 있게 되니, 벨벳 선다운과 구별되는 음악을 만들 수 있는 음악가의 가치는 더 높아진다. 누구나 AI로 매끄러운 글을 쓸 수 있게 되니, 독자의 몸 안에서 불편함을 일으키는 문장을 쓸 수 있는 작가의 희소성은 더 커진다. 누구나 AI로 논문 초안을 뽑을 수 있게 되니, 데이터 속에서 아무도 보지 못한 의미를 끄집어내는 연구자의 안목이 더 귀해진다.


하지만 여기서 한 가지 불편한 생각이 떠오른다. 이 0.1%의 가치가 영원히 유지될 수 있을까? 존 레논의 음악, 피카소의 그림, 한강의 소설은 AI 시대 이전에 만들어진 것들이다. 이것들은 이미 레거시로 자리를 잡았다. 하지만 지금 이 순간부터 인간이 만드는, 혹은 AI와 함께 만드는 작품들은 어떨까. 그것들도 레거시가 될 수 있을까. AI가 모든 영역에 침투한 뒤에 만들어진 것들이, AI 없이 만들어진 것들과 같은 무게로 받아들여질 수 있을까.

더 불안한 질문이 있다. 한 인간이 세계 최고 수준의 반열에 올라가는 데 걸리는 시간과, AI가 그 영역을 대체하는 데 걸리는 시간 중 어느 쪽이 더 짧을까. 로뷔숑이 36세에 원스타를 받기까지 얼마나 걸렸는가. 데보라 스미스가 한국어를 배우고 '채식주의자'를 번역할 수 있는 수준에 도달하기까지 얼마나 걸렸는가. 외과의사의 기술 점수가 4.6에 도달하기까지 수술을 몇 천 건 해야 했는가. 그 시간 동안 AI는 어디까지 와 있을까.

이것이 이 장의 핵심적인 불안이다. 마지막 0.1%의 가격은 비싸다. 그것이 없으면 나머지 99.9%는 무료에 수렴한다. 하지만 그 0.1%를 손에 넣으려면 10년이 걸리는데, AI가 5년 뒤에 그 0.1%마저 해내게 된다면? 그렇다면 지금 이 순간 할 수 있는 것은 하나뿐이다. 창이 열려 있는 동안 최대한 빨리 0.1%를 확보하는 것. AI 이전에 만들어진 레거시는 이미 자리를 잡았고, AI 이후에 만들어질 레거시의 자리는 빠르게 줄어들고 있다. 그 줄어드는 공간 사이로 자기 이름을 밀어 넣을 수 있는 시간이 얼마 남지 않았다.

일요일 연재
이전 05화4장. 결론의 독점