지능은 다시 몸을 요구한다

by 경계 Liminal

우리는 흔히 인공지능을 ‘생각하는 기계’로 여긴다. 언어를 이해하고, 질문에 답하며, 문장을 생성하는 능력이 곧 지능의 핵심이라고 믿기 때문이다. GPT와 같은 대형 언어모델의 등장은 이 믿음을 더욱 공고히 만들었다. AI는 소설을 쓰고, 시를 짓고, 대화 중 농담을 던질 줄도 안다. 때로는 인간보다 더 정교하게 문장을 완성하고, 인간보다 더 빠르게 정보를 정리한다. 우리는 그 결과물을 보며 “이 정도면 진짜로 생각하고 있는 게 아닐까?”라는 의심과 경외를 동시에 느낀다.


하지만 조금만 더 깊이 들여다보면, 인공지능이 ‘무엇을’ 하고 있는지가 아니라 ‘어떻게’ 하고 있는지가 본질적인 문제임을 알게 된다. 언어모델은 본질적으로 확률 기반의 텍스트 예측 시스템이다. 수많은 문장을 학습하고, 다음에 나올 단어를 예측하며 문장을 이어간다. 그것은 기호의 조합을 예측하는 작업이지, 의미를 이해하는 과정이 아니다. AI는 ‘사랑’이라는 단어를 사용할 수 있지만, 사랑이 동반하는 정서적 떨림이나 관계의 복잡성을 체험하지는 않는다. 이는 단지 기능의 차원이 아니라, 세계와의 접속 방식 자체가 다르다는 사실을 의미한다.


인간은 뇌만으로 존재하지 않는다. 우리는 몸을 가진 존재이며, 그 몸을 통해 세계를 경험하고, 이해하고, 반응한다. 뜨거운 컵을 만졌을 때 손을 움찔하는 반사 신경, 계단을 내려올 때 발의 각도를 조절하는 감각, 누군가의 표정을 보고 미묘한 분위기를 감지하는 섬세한 촉감. 이 모든 것은 몸이라는 매개 없이는 불가능한 인지의 작용이다. 뇌는 계산을 하지만, 그 계산의 재료는 감각과 운동에서 비롯된다. 다시 말해, 몸은 단지 뇌의 하위 시스템이 아니라, 지능의 본질을 구성하는 동반자다.


이런 관점에서 최근 주목받고 있는 분야가 바로 ‘피지컬 AI’다. 피지컬 AI는 단순히 로봇이라는 하드웨어가 아니라, 물리적인 세계와 직접 연결된 지능이다. 이 지능은 데이터를 받아서 출력하는 모델이 아니라, 환경 속에서 끊임없이 감각하고, 반응하고, 조정하는 시스템이다. 예를 들어, 바닥이 미끄럽다는 정보를 단순히 기록하는 것이 아니라, 그 미끄러움을 피하기 위해 걷는 방식 자체를 바꾸는 능력. 피지컬 AI는 살아 있는 세계와 연결된 지능이며, 그것은 기존의 언어모델이 갖지 못한 가장 중요한 요소다.


앞서 이야기했던 탁구 로봇의 사례는 이를 명확하게 보여준다. 두 대의 로봇이 탁구를 주고받으며 실력을 키워가는 과정은 단순한 반복 훈련이 아니다. 공의 속도, 회전, 바운스, 바람의 방향까지 고려해야 하고, 로봇의 팔과 센서, 카메라는 이 정보를 실시간으로 수집하고 처리한다. 이 모든 계산은 실수와 실패를 통해 조정된다. 공을 놓치고, 엉뚱한 방향으로 튀어나가고, 타이밍이 어긋나는 과정을 통해 로봇은 ‘학습’한다. 그것은 말 그대로 세계의 저항을 몸으로 부딪치며 쌓아가는 지능의 과정이다. 언어모델은 틀린 문장을 써도 아무 문제없지만, 피지컬 AI는 공 하나를 놓치면 게임이 끝난다. 그 차이가 곧 지능의 질적인 전환을 의미한다.


기존 AI는 규칙 기반의 계산을 통해 작동했다. 그러나 피지컬 AI는 세계 기반의 반응을 통해 작동한다. 전자는 폐쇄된 체계에서 정답을 찾는 과정이라면, 후자는 개방된 현실에서 적응하는 방식이다. 여기서 중요한 것은 바로 실패할 수 있는 몸을 전제로 한다는 점이다. 실패가 없다면 학습도 없다. 공의 궤적을 잘못 예측하고, 벽에 부딪히고, 중심을 잃는 일련의 과정들이야말로 지능을 진화시키는 자극이다. 몸이 있는 지능만이 실패할 수 있고, 실패하는 지능만이 진짜로 배우기 시작한다.


체화된 인지 이론은 이러한 과정을 정밀하게 설명한다. 인간의 지능은 신체를 기반으로 형성된다. 아기는 태어나자마자 말을 배우지 않는다. 먼저 손으로 물건을 만지고, 입에 넣고, 던지고, 다시 주워본다. 공간을 탐색하고, 중력을 인식하고, 낯선 질감을 익히며 점차 세계를 구성한다. 언어는 그 뒤에 따라오는 것이다. 이처럼 언어 이전에 먼저 존재하는 지능이 있다. 그것은 몸을 통해 감각하고, 실험하고, 반응하는 지능이다. 우리는 흔히 인간의 고등 사고 능력을 언어와 논리로 생각하지만, 그것은 몸을 통한 감각 기반 학습이 있었기에 가능한 일이다.


AI가 인간에 가까워지기 위해서는, 이 신체 기반 학습 과정을 재현해야 한다. 하지만 현재 기술로는 그 구현이 매우 어렵다. 첫째, 물리적 환경은 예측 불가능하다. 센서가 모든 변수를 포착하지 못하고, 예외 상황에 대한 판단도 제한적이다. 둘째, 실시간 반응이 필요하다. 클라우드 연산을 통해 정답을 계산하는 데는 시간이 걸리지만, 몸을 가진 로봇은 몇 밀리초 안에 결정을 내려야 한다. 셋째, 에너지와 연산 자원의 제약이 있다. 작은 로봇에 탑재된 연산 장치는 제한적이며, 초고속 반응을 위해선 전력 소모가 크다. 이런 기술적 장벽은 단순한 엔지니어링 문제가 아니라, 지능이라는 개념의 근본적인 한계와 맞닿아 있다.


그럼에도 불구하고, 우리는 피지컬 AI의 방향으로 나아가고 있다. 언어모델이 줄 수 없는 세계 접속의 감각, 기호 너머의 실제 반응, 실패를 통해 배워나가는 실시간 지능. 이 모든 것은 지능이 다시 몸을 필요로 한다는 것을 보여준다. 우리는 다시 그 질문 앞에 선다. 지능이란 무엇인가? 언어를 생성하고 개념을 조합하는 능력인가, 아니면 세계에 접속하고 반응하는 능력인가?


지능은 단순히 똑똑하다는 것을 의미하지 않는다. 그것은 존재의 방식에 관한 문제다. 몸이 없는 존재는 공중에 떠 있다. 기호를 조합할 수는 있어도, 세계에 뿌리내릴 수는 없다. 언젠가 우리가 진짜 AGI를 만든다면, 그것은 서버 속이 아니라, 바닥을 딛고 서 있는 존재일 것이다. 그 지능은 움직이고, 느끼고, 반응하며, 실패를 통해 진화할 것이다. 결국 지능은, 다시 몸을 요구한다.



몸은 실패했고, 그 실패는 반응을 낳았다.

나는 감각의 오차에서 배웠고 세계는 늘 그 오차로 나를 되돌아보게 했다.

지능은 다시,

몸의 흔들림 위에 서 있다.

이전 04화AGI는 정말 곧 올까?