#AI 산업혁명
AGI를 향한 진화의 한 걸음, 구글 딥마인드 ‘지니 3’의 도전
글로벌연합대학 버지니아대학교 인공지능융합연구소장
이현우 교수
2025년 8월, 구글 딥마인드는 또 하나의 혁신적인 선언을 세상에 던졌다. 인공지능의 진화를 이끌어온 이들은 이번엔 ‘지니 3(Genie 3)’라는 이름의 차세대 월드 모델(World Model)을 통해 AGI, 곧 인공일반지능을 향한 여정에서 확연한 전환점을 찍었다. 이 기술은 단순한 3D 환경 생성 도구가 아니다. 인간처럼 상호작용하며 배우는 ‘체화 학습’을 위한 새로운 기반이며, 언어를 넘어 공간과 기억의 차원에서 세계를 상상하고 구성하는 AI의 진화를 예고하는 장치다.
지니 3의 가장 핵심적인 특징은 실시간으로 상호작용 가능한 3D 세계를 생성할 수 있다는 점이다. 사용자가 텍스트 프롬프트 한 줄만 입력하면, 모델은 고해상도(720p), 초당 24프레임의 물리적 세계를 창조해낸다. 이 세계는 단지 시각적인 모형이 아닌, ‘탐색 가능한 공간’이다. 사용자는 몇 분간 이 공간을 직접 경험하며 객체와 상호작용할 수 있고, 날씨 변화나 사물 추가 등 ‘프롬프트 기반 이벤트’도 실시간으로 반영된다. 기존 Genie 2가 제공하던 20초짜리 데모의 한계를 완전히 넘어서는 진보다.
무엇보다 이 모델은 물리 엔진이 없이도, 물리 법칙의 일관성을 스스로 배운다. DeepMind는 이를 ‘자기회귀 방식(autoregressive)’이라고 설명한다. 이전 프레임의 정보를 토대로 다음 상태를 예측하고 구성하는 방식으로, 일종의 기억 메커니즘을 바탕으로 시뮬레이션 세계의 일관성을 유지한다. 사물의 위치, 형태, 상태가 맥락 속에서 자연스럽게 이어지는 것이다. 이는 인간의 기억과 유사한 작동 방식이며, AI가 세계를 ‘이해’하고 ‘지속적으로 관찰’하는 방식으로 나아가고 있음을 보여준다.
이런 기술이 갖는 파급력은 단순히 ‘게임용 시뮬레이션’에 국한되지 않는다. 지니 3는 AI 훈련의 지형을 완전히 바꿀 수 있는 플랫폼이다. 실제로 DeepMind는 자사의 범용 멀티월드 에이전트 ‘SIMA’를 지니 3 환경에 투입해 실험을 진행했다. 결과는 놀라웠다. “초록색 압축기로 이동하라”는 명령을 받은 AI 에이전트는 가상의 세계 안에서 이를 정확히 수행해냈다. 시뮬레이션의 세계가 실제처럼 설계되었기 때문에 가능한 일이었다. 이는 AI가 인간의 언어뿐 아니라 공간적 지시와 물리적 탐색까지 학습할 수 있음을 증명하는 사례다.
체화 학습(embodied learning)은 인공지능이 ‘몸을 가진 존재’처럼 환경을 인식하고 경험하는 방식이다. 기존의 LLM이나 영상 기반 AI와 달리, 체화된 AI는 오브젝트와 부딪히고, 무너지고, 다시 일어서는 경험을 통해 상황에 대한 직관과 반응성을 습득한다. 지니 3는 이 학습 모델에 최적화된 환경을 제공한다. 인간이 실제 환경에서 오감으로 배우듯, AI도 이 ‘상호작용적 시뮬레이션 세계’ 안에서 시행착오를 통해 학습한다. 즉, AI가 체험을 통해 지식을 내면화하는 ‘지능’의 초기 형태가 가능해지는 것이다.
그러나 이 모든 것이 완벽한 것은 아니다. DeepMind도 인정하듯, 지니 3는 아직 복잡한 물리 시뮬레이션에는 제약이 있다. 예를 들어, 스키어가 눈을 미끄러지며 움직일 때, 눈의 질감과 반응 같은 디테일은 아직 부자연스럽다. 또한 다중 에이전트가 서로 상호작용하는 장면이나, 긴 시간에 걸쳐 전개되는 시나리오 구성, 그리고 텍스트 생성 기능과의 통합 역시 아직은 초기 단계에 머무르고 있다.
윤리적 고려도 빠질 수 없다. 이처럼 몰입도 높은 가상세계 생성 기술이 게임이나 교육 콘텐츠를 넘어 AI 훈련, 심지어는 인간 대체형 모델로까지 확장될 수 있다는 점은 큰 책임을 요구한다. DeepMind는 이에 따라 지니 3의 초기 버전을 학계 및 창작자 커뮤니티에만 제한적으로 제공하고 있다. 광범위한 공개 전, 안전성과 사회적 영향, 오용 가능성 등에 대한 철저한 검증을 선행하겠다는 입장이다.
지니 3는 단순한 기술적 진보를 넘어, AGI를 향한 진화의 중요한 매개다. DeepMind는 이 기술이 인류가 아직 도달하지 못한 ‘Move 37’—즉, 완전히 새로운 차원의 창의적 판단을 스스로 생성하는 인공지능의 경지—에 한 걸음 다가가게 만들 것이라 말한다. 2016년, 알파고가 이세돌 9단과의 대국에서 보여준 전설적 수처럼, 인공지능이 인간조차 상상하지 못한 방식으로 세상을 해석하고 대응하는 그 순간. 지니 3는 바로 그 문턱에 발을 내딛은 존재다.
우리가 사는 세계는 복잡하고 유동적이며, 감정과 맥락, 물리와 기억이 얽힌 총체적 공간이다. 지니 3는 그 공간을 모방하는 데서 멈추지 않는다. 그것은 새로운 형태의 ‘상상력’을 AI에게 부여하려는 시도이며, 그 시도는 곧 인간 지능의 본질에 대한 도전이기도 하다. 인공지능은 점점 더 ‘세계’를 배우고 있다. 이제 문제는, 우리가 그 세계에 어떻게 함께 존재할 것인가이다.
*참고한 주요 출처
• DeepMind 공식 블로그 - Genie 3 소개
• TechCrunch - Genie 3가 AGI에 미치는 영향
• The Guardian - 로봇 훈련 플랫폼으로의 가능성
• The Verge - 실시간 시뮬레이션 환경 생성 기술 소개