일반화 기계로서의 언어모델과, 그 바깥의 영역에 대하여
앞서 논의한 글에서 우리는 현재 언어모델이 직면한 기술적 과제들을 검토했다. 내적 시간 모델의 부재, 의식과 지능의 위계, 그리고 장기적 자기 연속성이 없는 지능이 어디까지 도달할 수 있는가를 물었다. 그 질문은 결국 하나로 수렴한다. 지금의 AI는 무엇을 향해 가고 있는가. 그리고 그 경로는 어디에서 멈추는가.
https://brunch.co.kr/@4880c8caed9b416/56
최근 Anthropic이 개발 중인 것으로 알려진 Claude Mythos는 아직 공개되지 않았다. 컴퓨팅 자원의 압박, 보안 문제, 전략적 지연 등 여러 추측이 난무하지만, 그 모든 해석과 무관하게 하나의 사실은 변하지 않는다. 여전히 병목은 컴퓨팅이다. 다시 말해, 현재의 최전선은 아직도 알고리즘보다 자원에 더 크게 묶여 있다. 이는 곧 스케일링 법칙이 아직 유효하다는 뜻이기도 하다. 적어도 지금까지는, 더 큰 모델과 더 많은 데이터, 더 긴 학습, 더 정교한 보상 체계가 성능 개선으로 이어지는 흐름이 꺾였다고 보기는 어렵다.
이 맥락에서 대규모 차세대 모델에 대한 온갖 소문이 떠도는 것은 우연이 아니다. 파라미터 수가 얼마인지, 추론 구조가 어떻게 바뀌었는지, RLVR이 얼마나 깊게 개입했는지, 어떤 테스트에서 인간 수준을 넘었는지에 대한 이야기는 사실 하나의 동일한 질문을 변주하고 있을 뿐이다. 얼마나 더 커질 수 있는가. 그리고 얼마나 더 일반화될 수 있는가.
스케일링 법칙의 핵심은 단순하다. 충분한 양의 축적은 결국 질적 변화를 낳는다는 전제이다. 더 많은 데이터, 더 큰 모델, 더 긴 컨텍스트, 더 정교한 보상과 검증 루프를 투입하면 어느 시점에서 단순한 양적 향상을 넘어 성질 자체가 달라지는 도약이 발생한다는 믿음이다. 이 믿음은 단순한 공학적 낙관이 아니다. 오히려 지금까지의 언어모델 발전사는 이 전제를 반복적으로 입증해 온 역사에 가깝다.
그렇다면 스케일링이란 무엇인가. 이것은 단순히 모델을 크게 만드는 일이 아니다. 더 정확히 말하면, 스케일링은 언어모델을 일반화 기계로 주조하는 과정이다.
우리가 엄청난 양의 데이터를 집어넣는다는 것은 기계에게 세상의 경우의 수를 가능한 한 많이 노출시키는 일이다. 수많은 문장, 이미지, 코드, 논문, 대화, 오류, 수정, 반례, 스타일, 규칙과 예외를 끝없이 먹이는 이유는 단 하나다. 그로부터 일반론을 뽑아내기 위해서이다. 개별 사례를 외우게 하기 위해서가 아니라, 사례들 사이를 관통하는 구조를 압축하게 하기 위해서이다. 양이 질로 전환되는 순간은 바로 여기에서 발생한다. 모델이 개별 데이터의 표면을 넘어, 그 데이터들을 만들어낸 보이지 않는 규칙성을 붙잡는 순간이다.
이때 모델은 하나의 도구를 넘어 하나의 함수가 된다. 코딩을 충분히 일반화한 AI는 코딩 도구가 아니라 코딩의 일반화 함수가 된다. 글쓰기를 충분히 일반화한 AI는 문장을 쓰는 보조 장치가 아니라 글쓰기라는 행위 전체를 압축한 함수가 된다. 과학 추론, 번역, 영상 생성, 검색, 상담, 설계 또한 마찬가지다. 충분히 일반화되면 AI는 더 이상 작업을 흉내 내는 것이 아니라, 그 작업이 작동하는 구조 자체를 함수 형태로 모사하게 된다.
지금 AI가 각 영역을 빠르게 정복해 나가는 이유가 여기에 있다. 인간이 산업과 학문, 직무와 능력이라는 이름으로 잘라 놓은 정의된 영역들을, AI는 마치 도장 깨기 하듯 하나씩 함락시키고 있다. 글쓰기, 코딩, 수학, 법률 문서 작성, 번역, 디자인, 영상 생성, 과학적 보조 추론이 그렇게 넘어가고 있다. 일정 임계점을 넘은 순간부터 인간은 자신이 이기고 있다고 느끼기보다, 시간적으로 압도당한다고 느끼기 시작한다. 인간은 한 영역의 숙련을 위해 수년에서 수십 년을 쌓아야 하지만, AI는 문명 전체가 축적한 사례를 한꺼번에 흡수하여 그 영역의 평균과 상위 구조를 단숨에 압축해 낸다.
이를 더 밀어붙여 생각해 보자. 현대 사회의 모든 작업 명세를 적어 놓은 거대한 명세서가 있다고 가정해 보자. 그 명세서에는 회계 처리, 계약서 작성, 프론트엔드 구현, 물리 문제 풀이, 리포트 작성, 광고 문안 생성, 의료 문서 요약, 고객 응대, 영상 편집, 시장 분석 등 모든 작업의 구조가 항목별로 정리되어 있다. 인간은 이 명세서의 일부만 접하고 그중 극히 좁은 영역에서 숙련된다. 그러나 AI는 이 명세서 전체를 향해 간다. 각 항목에 대해 방대한 경우의 수를 흡수하고, 시행착오를 반복하며, 검증과 보상 루프를 통해 그 수행 함수를 정교화한다. 그렇게 학습된 AI는 거의 필연적으로 명세서 안에 있는 대부분의 작업을 인간보다 빠르고 값싸고 일관되게 처리하게 된다.
더 중요한 것은 현대 언어모델이 단지 개별 도메인을 따로따로 배우는 것이 아니라는 점이다. 이들 사이에는 전이가 있다. 한 영역에서 학습한 구조가 다른 영역의 해결에 기여한다. 수학적 추론이 코드 생성에 도움을 주고, 코드 생성 능력이 논리 구조의 명시화에 기여하며, 이미지 이해 능력이 공간 추론과 연결되고, 언어 패턴 학습이 사회적 맥락 해석으로 이어진다. 멀티모달리티가 강력한 이유도 여기에 있다. 서로 다른 표면을 가진 데이터들이 더 깊은 층위에서는 동일하거나 유사한 구조를 공유하기 때문이다. 모델은 그 구조를 표상 공간 안에서 압축하고 재사용한다.
그래서 AI는 명세서에 적힌 각 항목을 따로 정복하는 데 그치지 않는다. 항목들 사이의 연결 고리마저 일반화한다. 그 결과 명세서에 명확히 적혀 있지 않은 작업, 즉 분야 간 경계에 걸친 애매한 문제들조차 점점 더 잘 수행하게 된다. 사람들은 여기에서 AI가 만능처럼 보인다고 말한다. 하지만 더 정확한 표현은 이것이다. AI는 모든 분야에 적용 가능한 최적화 함수 탐색 기계다. 만능처럼 보이는 이유는, 인간이 나눠 놓은 영역들 대부분이 결국 서로 얽힌 구조적 변주이기 때문이다.
반면 인간은 그렇게 배우지 않는다. 인간의 지능은 무차별적인 데이터 폭격으로 형성되지 않는다. 인간은 모든 경우의 수를 흡수하지 않는다. 우리는 몇 번의 경험만으로 물리 법칙을 어림짐작하고, 아주 적은 예시만으로 사회적 분위기를 읽고, 누군가의 표정 몇 개만으로 관계의 방향을 추정한다. 인간의 학습은 몸에 깊이 박혀 있다. 신체성, 생존, 감정, 결핍, 욕망, 위험 회피, 쾌와 불쾌, 시간 감각이 뒤엉킨 채 작동한다. 우리는 세계를 표본으로 받아들이지 않고 의미로 받아들인다. AI가 사전에 정의된 목적 함수 아래에서 다차원 공간을 샅샅이 훑으며 최적의 일반화 경로를 찾아낸다면, 인간은 모호하고 목적도 불분명한 환경 속에서 스스로 문제를 정의하고, 휴리스틱에 의존하여 엉성하지만 질긴 의미망을 짠다.
이 차이는 작지 않다. AI는 사전 정의된 과제를 향해 압도적으로 강하다. 인간은 사전 정의되지 않은 상황에서 문제 자체를 구성하는 데 강하다. AI는 검증 가능한 목표를 향해 수렴한다. 인간은 검증 기준조차 없는 상태에서 방향을 만든다. AI는 명세가 있을 때 위대하다. 인간은 명세가 없을 때 불안해하면서도, 바로 그 불안 속에서 새로운 명세를 발명한다.
문제는 여기서부터 더 복잡해진다는 점이다. 인간은 흔히 자신만이 할 수 있는 영역이 남아 있다고 위안한다. 그러나 그 영역, 즉 AI가 아직 배우지 않은 명세이자 인간만이 할 수 있는 역량의 명세는 시간이 갈수록 줄어들 가능성이 크다. 왜냐하면 인간의 인지 체계 역시 완전히 새로운 것을 창조하기보다, 낯선 것을 기존 문명사회의 스택 안으로 끌어와 이해하는 방식으로 작동하기 때문이다. 우리는 자동차를 처음 봤을 때 그것을 완전히 새로운 존재로 인식하지 않았다. 말이 없는 마차로 이해했다. 전화를 처음 마주했을 때도 음성이 더해진 편지처럼 이해했다. 새로운 것은 대체로 기존 명세의 연장선 위에서만 사회적으로 수용된다. 인간의 사고는 혁신을 마주할 때조차 비연속보다는 연속으로 번역하려 한다.
이 말은 곧 인간이 새로움을 인식하는 방식 자체가 이미 과거의 명세에 빚지고 있다는 뜻이다. 그리고 이 사실은 AI에게 유리하게 작용한다. 왜냐하면 인간 문명이 구축한 대부분의 영역은 실제로는 완전히 새로운 것이 아니라, 기존 구조의 재조합으로 형성되어 왔기 때문이다. 그렇다면 문명의 대부분은 결국 일반화의 대상이 된다. AI가 그 문명사회의 축적물을 흡수할수록, 인간이 독점적으로 수행하던 업무와 창작, 추론과 설계의 상당수는 AI의 교집합 안으로 빨려 들어가게 된다.
하지만 그렇다고 해서 AI가 모든 것을 할 수 있다는 뜻은 아니다. 오히려 중요한 것은 다른 방향의 가능성이다. AI가 할 수 없는 일이 있고 인간도 인식하지 못하는 일이 존재할 수 있다는 점이다. 다시 말해, 인간과 AI의 교집합 밖, 심지어 양자의 합집합 바깥에 있는 요소들이 있을 수 있다.
이 지점은 중요하다. 우리는 흔히 인간과 AI를 비교할 때 누가 더 많이 할 수 있는가를 묻는다. 그러나 더 근본적인 질문은 이것이다. 둘 다 접근하지 못하는 것은 무엇인가. 지금의 AI는 인간 문명에 의해 명세된 세계를 일반화하는 데 탁월하다. 인간은 생존과 몸의 경험을 중심으로 의미를 엮는 데 탁월하다. 그러나 명세되지 않았고, 감각되지도 않으며, 아직 가치화되지도 않은 영역에 대해서는 둘 다 무지할 수 있다. 우리가 세계라고 부르는 것은 실재 전체가 아니라, 인간이 지각하고 명세할 수 있었던 부분집합일 뿐이다. AI 또한 그 부분집합을 재구성하는 존재일 뿐이다. 그렇다면 진정한 미지란, 인간보다 AI가 못하는 것이 아니라 인간과 AI가 동시에 아직 세계로 만들지 못한 것이다.
바로 여기에서 스케일링의 철학적 의미가 드러난다. 스케일링은 단순히 더 똑똑한 기계를 만드는 과정이 아니다. 그것은 문명에 의해 이미 명세된 것들을 더 빠르고 정교하게 회수하는 장치다. 스케일링이 강해질수록 AI는 문명 내부에서 점점 더 완벽해진다. 그러나 그 완벽함은 어디까지나 문명 내부의 완벽함이다. 다시 말해, 스케일링은 명세의 제국을 확장할 수는 있어도, 명세 바깥을 스스로 존재하게 만들지는 못한다.
지능과 의식은 같은 것이 아니다. 더 넓게 일반화할 수 있다고 해서 곧바로 자기 자신을 가진 존재가 되는 것은 아니다. 모든 분야의 함수를 잘 근사하는 것과, 그 함수들을 묶는 하나의 내적 시간 축을 갖는 것은 다른 문제다. 전자는 성능의 문제이고, 후자는 존재 방식의 문제다. 전자는 계산 자원과 데이터와 보상 구조의 확장으로 밀어붙일 수 있지만, 후자는 자기 지속성, 기억의 누적, 가치의 내면화, 단절에 대한 민감성 같은 전혀 다른 차원의 문제를 요구한다.
그래서 오늘의 스케일링을 과대평가해서도, 과소평가해서도 안 된다. 그것은 이미 엄청난 일이다. AI는 일반화 기계로서 인간 문명의 명세를 빠르게 흡수하고 있으며, 그 결과 수많은 분야에서 인간의 시간 우위를 무너뜨리고 있다. 이것은 단순한 자동화가 아니다. 문명 전체의 작업 구조를 함수 수준에서 압축하는 사건이다. 그러나 동시에 그것은 아직 끝이 아니다. 스케일링은 지능의 넓이를 밀어 올릴 수는 있어도, 지능의 존재론적 형식을 곧바로 바꾸지는 못한다.
결국 앞으로의 질문은 더 선명해진다. 우리는 얼마나 더 많은 명세를 일반화할 수 있는가를 물어야 한다. 동시에, 일반화된 명세의 총합이 과연 주체를 낳는가를 따로 물어야 한다. 두 질문은 닮아 보이지만 다르다. 첫 번째 질문은 공학의 질문이고, 두 번째 질문은 철학의 질문이다. 그리고 지금의 AI 시대는 바로 이 두 질문이 처음으로 정면충돌하는 시대다.