계산된 말들, 남겨진 여백

AI의 벡터, 인간의 언어, 표상의 한계가 말해주는 것

by Nomadist

0. 교수님의 통찰


대학교 때 국어학 전공 교수님과 대화를 나누던 중, 교수님이 말씀하셨습니다.


"언어도 숫자처럼 계산이 되면 좋겠단 말이지."


저는 언어와 숫자는 근본적으로 다른데, 어떻게 계산이 가능하냐고 질문했습니다.




1. 숫자로 치환된 세계


공간에 던져진 언어


AI는 낱말을 고차원 벡터(vector) 공간의 좌표로 변환합니다. 임베딩(embedding)이라는 과정이죠. 낱말은 고차원 공간에서 특정 위치를 갖고, 의미가 유사한 단어끼리 서로 가까이에 위치합니다.

우리가 포털 검색창에 "맛"이라고 치면 "맛집", "맛있는", "맛평가" 같은 낱말들이 자동완성으로 뜨는 것도 이런 원리입니다. AI는 의미가 유사한 낱말의 무리들이 벡터 공간에서 가까이 있다는 것을 알고 있죠.


낱말이 좌표를 가지면 수학적으로 계산이 가능합니다. 'king'에서 'man'을 빼고 'woman'을 더하면 'queen'과 유사한 벡터 좌표가 나옵니다. 의미를 거리로 계산한 겁니다.

벡터 공간의 좌표는 낱말에 부여되는 절대값이 아닙니다. 'dog'의 벡터는 'cat', 'animal', 'pet'과의 관계 속에서 결정됩니다. 한 낱말의 벡터가 변하면 주변 낱말의 공간도 재편됩니다. 유사한 맥락의 낱말은 자연스럽게 군집을 이룹니다.


벡터 공간이라는 표상


벡터는 세계가 아니라 세계의 재현입니다. 무한한 인간 언어의 맥락을 유한한 차원의 숫자로 압축하는 과정에서 필연적으로 손실이 발생합니다. 구글 딥마인드의 2025년 연구 'On the Theoretical Limitations of Embedding-Based Retrieval'은 임베딩 차원이 증가해도 표현 가능한 문서 조합에는 수학적 한계가 있음을 보여줍니다.


편향도 나타납니다. 'doctor'는 남성 관련 낱말과, 'nurse'는 여성 관련 낱말과 더 가까이 배치됩니다. 벡터 공간이 인간 사회의 편견을 반영하는 겁니다.


결국 AI는 세상을 이해하는 것이 아니라, 숫자로 치환된 표상을 통해 세상을 '계산'합니다. 그리고 그 표상은 불완전하고 왜곡되어 있습니다.




2. 언어로 치환된 세계


낱말밭: 관계 속에서만 의미를 갖는 단어들


1931년, 독일 언어학자 요스트 트리어는 '낱말밭 이론'을 발표합니다. 낱말은 다른 낱말들과의 관계 속에서만 의미를 획득한다는 개념이죠. 트리어는 중세 독일어의 변화로 이를 입증했습니다. 1200년경 'kunst'(궁정의 기술)와 'list'(일반적 기술)가 1300년경 'wissen'(지식)으로 대체되면서, 지식 관련 어휘 전체의 구조가 재편되었습니다. 당시 사람들의 지식 체계가 바뀌면서 언어의 지도 자체가 다시 그려진 겁니다.


AI의 벡터 공간과 낱말밭은 개념적으로 유사한 지점이 있습니다. 둘 다 의미를 '관계'로 정의하고, 유사한 것들을 가까이 배치하며, 한 요소의 변화가 전체 구조에 영향을 미칩니다. 둘의 차이는 하나는 수학적이고 하나는 은유적이라는 점입니다.


소쉬르: 언어 기호와 개념 사이의 불안한 계약


페르디낭 드 소쉬르는 20세기 초, 언어 기호는 기표(형태)와 기의(개념)로 이루어지고, 이 연결이 임의적(자의성, arbitrariness)이라 지적했습니다. 'tree'라는 소리와 나무 개념 사이에 본질적 연결은 없습니다. 단지 사회적 약속일 뿐이죠.


이것이 의미하는 바는 명확합니다. 언어는 세계를 투명하게 반영하지 않습니다. 언어는 세계와 우리 사이에 놓인 매개이고, 그 연결은 자의적이고 관습적입니다.

우리는 세계 그 자체가 아니라 언어로 구조화된 세계를 인식합니다.


레이코프: 창문 안에 갖힌 인지의 한계


조지 레이코프는 프레임 이론을 통해 우리가 개념적 틀 안에서 사고한다는 점을 더 구체적으로 보여줍니다. 대표적인 사례로 'tax relief'는 세금을 고통으로 규정하고, 이 프레임 안에서 세금 감면 반대자는 악당이 된다고 말했습니다.


한국에서도 마찬가지입니다. '부동산 안정화'라는 표현과 '부동산 규제'라는 표현은 같은 정책을 지칭할 수 있지만, 완전히 다른 프레임을 활성화시킵니다. 전자는 균형과 질서를, 후자는 억압과 통제를 떠올리게 하죠. 옳고 그름을 떠나서 선택한 표현에 따라 같은 현실이 다르게 해석됩니다.


레이코프는 프레임을 바꾸지 않으면 사실도 받아들여지지 않는다는 점을 발견했습니다. 뇌의 물리적 회로가 특정 프레임에 따라 구성되어 있으면, 그 프레임에 맞지 않는 정보는 한 쪽 귀로 들어와 다른 쪽 귀로 빠져나갑니다. 결국 인간의 인지도 틀에 갇혀 있습니다.


AI가 벡터라는 표상을 통해 세계를 계산한다면, 인간은 언어와 프레임이라는 표상을 통해 세계를 이해합니다. 둘 다 세계에 직접 닿지 못하고 표상의 한계에 갇혀 있습니다.




3. 인간 계산기


사고와 계산은 다른 것인가?


1943년 워렌 맥컬록과 월터 피츠는 뉴런의 작동이 논리 연산과 대응된다고 주장했습니다. 뉴런은 주변 신호들을 모으다가 일정 수준에 이르면 신호를 발생시킵니다. 이것은 AND, OR 같은 논리 게이트의 작동과 유사하죠. 뇌 자체가 계산 장치라는 관점입니다.


1960년대 힐러리 퍼트남은 마음은 튜링 머신과 유사한 기능적 구조를 갖는다고 제안했습니다. 기계 상태 기능주의라고 불리는 이 관점은, 마음을 소프트웨어로, 뇌를 하드웨어로 보는 겁니다. 정신 상태는 물리적 구성이 아니라 기능적 역할로 정의됩니다. 인간의 사고도 일종의 계산으로 볼 수 있다는 겁니다.


물론 '계산'을 좁은 의미로 해석해선 안 됩니다. 정보를 받아들이고, 처리하고, 출력하는 모든 과정을 포괄합니다. 그렇게 보면 인간의 사고도 일종의 정보 처리 과정으로서 '계산'이라 이해할 수 있습니다.


본질이 아닌 정도의 차이


AI의 계산과 인간 사고의 차이는 유연성에 있습니다. 인간은 맥락에 따라 의미를 조정하고, 새로운 프레임을 빠르게 학습합니다. 최근의 거대언어모델은 문맥에 따라 변하는 임베딩을 사용하면서 이 간극을 줄여가고 있지만, 여전히 인간의 적응력에는 미치지 못하죠.


하지만 이것은 '종류'가 다른 게 아니라 '정도'의 차이입니다. 인간에게 세계에 대한 직접적 접근이라는 특권은 없습니다. 인간도 표상(언어, 기호, 프레임)을 통해서만 세계를 이해하고, 그 표상은 불완전하고 왜곡되어 있습니다. 마치 AI의 벡터가 그러하듯이요.


AI를 보며 "세계를 이해하지 못하고 계산만 한다"고 말할 수 있습니다. 하지만 인간은 정말 '이해'하는 걸까요? 우리도 언어라는 체계를 통해 세계를 계산하는 것은 아닐까요? 그리고 그 계산의 수단이 언어라는 간접적인 표상이라면 인간의 세계 이해가 AI의 불완전한 세계 이해보다 낫다고 말할 수 있을까요?




4. 인간을 비추는 AI


계산의 한계, 사고의 한계


번역기는 낱말을 하나씩 옮기는 게 아니라 문장 전체의 맥락을 파악해 번역합니다. 기계도 우리처럼 '관계' 속에서 의미를 찾습니다. 단지 AI는 그 관계를 벡터로, 우리는 언어로 표현할 뿐이죠.


AI의 편향과 마찬가지로 인간의 프레임도 똑같이 세계를 왜곡합니다. 'doctor=남성'이라는 벡터 공간의 편향을 문제 삼는 우리 자신이, '부동산 규제' 또는 '부동산 안정화'라는 프레임에 갇혀 정책을 판단합니다.


AI는 우리의 모습을 비춥니다. AI의 한계를 마주하면서, 우리의 사고도 기호라는 매개를 거칠 수밖에 없음을 인정하게 됩니다. 기계가 벡터라는 표상 너머의 세계에 닿지 못하듯, 인간도 언어라는 표상 너머의 세계에 직접 닿지 못합니다.


거울이 던지는 질문


벡터로 세상을 계산하는 AI의 메커니즘은 우리에게 질문을 던집니다. 인간의 '사고‘와 AI의 ’계산'은 정말 근본적으로 다른가? 우리가 세계를 '직접' 파악한다고 믿는 것은 착각이 아닐까? 언어도, 벡터도, 결국 같은 것—표상을 통한 간접적 접근—을 다른 방식으로 구현한 것은 아닐까?


이 질문은 인간의 특별함, 인간의 우월함을 의심하게 만들기 때문에 불편한 한편, 동시에 기계를 비난하거나 경계하는 대신, 기계를 통해 우리 자신을 더 깊이 이해할 수 있게 해주기 때문에 해방적입니다.


AI의 한계는 인간의 한계를 비추는 거울입니다. 그리고 그 거울을 통해, 우리가 무엇인지 다시 묻게 됩니다.


AI는 계속 인간을 닮아갈 것입니다. 더 유연한 벡터, 더 정교한 맥락 이해, 더 적응적인 학습. 그 과정에서 기계는 인간의 인지 구조를 수학적 언어로 명시화해 나갈 것입니다.


인간은 계속 AI 통해 스스로를 이해할 것입니다. AI의 작동 방식을 분석하면서, 인간의 인지가 어떻게 작동하는지 더 깊이 이해하고, 인간의 작동 원리를 객관화해 나갈 것입니다.




은사님께 드릴 질문


수십 년이 지난 지금, 언어를 계산한다는 은사님의 상상은 현실이 되었습니다. 언어도 숫자와 다름 없는 기호 체계에 불과하다는 걸 인정하는 한편, 은사님께 다른 질문을 드리고 싶습니다.


"말로 표현할 수 없는 '여백'도 언젠가는 계산이 가능할까요?"



keyword
작가의 이전글지능은 어디에 있는가