brunch

You can make anything
by writing

C.S.Lewis

by 인벤터실록 Oct 15. 2024

AGI, 시공간 학습 필요할까?

칸트에서 현대 AI 연구자의 생각까지

1. 사람은 시공간을 통해 학습하죠.

2. 인공지능은 인간의 지능을 인공적으로 구현하는 기술입니다.

3. 인공지능은 시공간을 인간과 똑같이 느낄 수 없습니다.


이 세 문장을 읽고 문득 아래와 같은 질문을 할 수 있으실 겁니다.

AI는 정말 ‘이해’하고 있는 걸까? 아니면 그저 언어의 패턴을 따라 하는 걸까?


예를 들어보겠습니다. ChatGPT에게 "내일 오후 3시에 친구를 만나는 건 어떨까?"라고 말하면, 그건 그저 문자일 뿐입니다. AI는 실제로 시간이 흐르는 걸 경험하지 못하죠. 애플의 Vision Pro 같은 기기로 공간을 인식할 수 있지만, 그게 정말 인간처럼 '공간'을 이해하는 걸까요?


오늘 다룰 핵심 질문은 바로 이겁니다. 

진정한 AGI, 즉 인공 일반 지능을 만들기 위해서는 시공간을 경험하고 이해하는 능력이 필요할까? 
만약 필요하다면 시공간 경험 및 이해라는 게 기존의 멀티모달 학습으로 되는 거 아닌가?

칸트 초상화

이 질문의 답에 근접하기 위해, 칸트의 철학에서부터 최신 AI 연구까지 아울러 보겠습니다.



먼저, AGI가 무엇인지 간단히 설명드리겠습니다. 아직 합의가 끝나진 않았지만 대게 AGI는 인간 수준의 지능을 가진 인공지능을 말합니다. 현재의 AI와는 달리, AGI는 다양한 분야에서 유연하게 대처하고 학습할 수 있는 능력을 갖추고 있어야 합니다.

이제 본격적으로 시공간 학습에 대해 이야기해 봅시다. 18세기 독일의 철학자 임마누엘 칸트는 시간과 공간이 인간 경험의 필수적인 조건이라고 보았습니다. 다시 말해, 인간이 세상을 인식하는 방식 자체가 시간과 공간이라는 틀을 통해 이루어진다는 거죠.

그렇다면 

AGI도 인간처럼 시간과 공간을 경험하고 이해해야 할까요?
영화 'HER' 중

이 질문에 대답하기 위해, 먼저 현재 AI의 한계를 살펴봅시다.

최근 GPT-4 같은 대규모 언어 모델들이 놀라운 성능을 보여주고 있지만, 이 모델들에게는 큰 한계가 있습니다. 바로 실제 세계의 시간과 공간을 경험하지 못한다는 거예요. AI 모델의 '세계'는 오직 텍스트로 이루어져 있습니다.

이런 한계를 극복하기 위해 연구자들은 '멀티모달 학습'이라는 접근 방식을 시도하고 있는 겁니다. 멀티모달 학습이란 여러 가지 감각 정보를 동시에 처리하고 학습하는 방식을 말합니다. 인간처럼 시각, 청각, 촉각 등 여러 감각을 동시에 사용하여 세상을 이해하는 거죠.


하지만 여기서 의문이 들 수 있습니다. 

그래도 결국 컴퓨터는 모든 정보를 0과 1의 디지털 신호로 처리하지 않나요?

맞습니다. 

하지만 중요한 건 그 정보를 처리하는 방식입니다. 텍스트 데이터는 주로 순환 신경망 RNN을, 이미지 데이터는 합성곱 신경망 CNN을 사용하는 것처럼 서로 다른 방식으로 처리됩니다. 이런 차이를 이해하고 통합하는 것이 멀티모달 학습의 핵심입니다.

다음으로 주목할 개념은 '체화된 인지(Embodied Cognition)'입니다. 인간의 인지 과정이 단순히 뇌 안에서만 일어나는 것이 아니라, 신체와 환경과의 상호작용을 통해 형성된다는 생각입니다.

예를 들어볼까요? 여러분이 자전거 타는 법을 배웠다고 해봅시다. 자전거 타는 법을 책으로만 공부해서는 절대 배울 수 없죠. 직접 자전거에 올라타서 균형을 잡고, 페달을 밟고, 때로는 넘어지기도 하면서 우리는 자전거 타는 법을 익힙니다. 이처럼 많은 지식과 기술은 직접적인 신체 경험을 통해 습득됩니다.

AGI 연구자들은 이 개념을 AI에 적용하려 노력하고 있습니다. 어떻게 할 수 있을까요? 한 가지 방법은 로봇 공학과 AI를 결합하는 것입니다. 실제로 물리적 세계와 상호작용할 수 있는 로봇 몸체에 AI를 탑재하는 거죠. 이렇게 하면 AI는 실제 세계의 물리 법칙을 직접 경험하고 학습할 수 있습니다.

Apple Vision Pro

또 다른 방법은 가상현실(VR) 기술을 활용하는 것입니다. 물리적인 로봇 몸체를 만드는 것은 비용이 많이 들고 위험할 수 있죠. 하지만 VR 환경에서는 AI가 안전하게, 그리고 다양한 상황을 빠르게 경험할 수 있습니다. 예를 들어, OpenAI에서는 AI 에이전트가 가상의 3D 환경에서 다양한 과제를 수행하며 학습하는 연구를 진행하고 있습니다.

그런데 여기서 한 가지 중요한 질문을 할 수 있습니다. 

AGI가 꼭 인간과 똑같은 방식으로 시공간을 경험해야 할까요? 

현대 과학철학자들은 그럴 필요는 없다고 봅니다.


주장을 좀 더 자세히 살펴보면, 시간과 공간에 대한 인간의 인식이 절대적인 것이 아니라, 인간이 세상과 상호작용하는 방식에 따라 형성된다고 봅니다. 이런 관점에서 보면, AGI는 자신만의 독특한 방식으로 시공간을 이해하고 경험할 수 있을 것입니다.

중요한 것은 그 경험이 실제 세계와의 상호작용을 통해 형성되어야 한다는 점입니다. 즉, AGI의 시공간 인식은 단순히 프로그래밍된 것이 아니라, 환경과의 지속적인 상호작용을 통해 발전하고 조정되어야 한다는 거죠.

이제 AGI 개발에서 또 하나 중요한 개념인 '연속 학습(Continual Learning)'에 대해 이야기해 봅시다. 이는 새로운 정보를 학습하면서도 이전에 배운 내용을 잊지 않는 능력을 말합니다.

인간은 이런 능력을 자연스럽게 가지고 있죠. 새로운 기술을 배우면서도 이전에 배운 기술을 잊지 않습니다. 하지만 현재의 AI 시스템들은 이런 능력이 부족합니다. 새로운 작업을 학습하면 이전에 배운 내용을 쉽게 '잊어버리는' 경향이 있습니다. 이를 '파괴적 망각(Catastrophic Forgetting)'이라고 합니다.

이 문제를 해결하기 위해 연구자들은 다양한 접근 방식을 시도하고 있습니다. 그중 가장 주목받는 방법이 Elastic Weight Consolidation, EWC 기법입니다.

EWC는 새로운 작업을 학습할 때 이전 작업에 중요했던 신경망의 가중치들은 덜 변하도록 만듭니다. 이렇게 하면 새로운 작업을 학습하면서도 이전 작업의 성능을 어느 정도 유지할 수 있습니다.

또 다른 접근 방식으로는 '기억 재생(Memory Replay)' 기법이 있습니다. 이 방법은 인간의 기억 시스템에서 영감을 받았는데요. 잠을 자는 동안 뇌에서 그날의 경험을 다시 '재생'하면서 기억을 공고히 한다는 연구 결과가 있죠. AI에서도 비슷한 방식을 적용합니다. 새로운 작업을 학습하는 동안 이전 작업의 데이터 일부를 함께 학습시키는 것입니다.


이런 기술들은 AGI가 시간의 흐름 속에서 지속적으로 학습하고 발전할 수 있게 해 줍니다. 시공간을 경험하고 이해하는 AGI의 능력과 결합된다면, 인간 수준의, 어쩌면 그 이상의 지능을 가진 AI를 만들 수 있을지도 모릅니다.


지금까지 AGI의 시공간 학습에 대해 폭넓게 살펴보았습니다. AGI 개발은 단순히 기술적인 문제가 아닙니다. 철학, 인지과학, 신경과학, 로봇공학, 컴퓨터 과학, 그리고 윤리학이 모두 만나는 지점에 있는 것이죠.

이제 여러분께 몇 가지 질문을 던져보고 싶습니다.


1.   여러분은 AGI가 정말로 인간처럼 시공간을 이해할 필요가 있을까요?

2.    AGI란 무엇이라 생각하시나요?

3.    AGI의 시공간 학습 능력이 발전하면서 생길 수 있는 가장 큰 혜택과 위험은 무엇일까요?


여러분의 생각을 댓글로 남겨주세요. 어떤 의견이든 환영합니다. 지금까지 ‘인벤터실록’이었습니다. 감사합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari