최근 구글이 Gemini 3을 출시하며 사람들에게 놀라움을 선사하고 있습니다. 이 Gemini 모델 뒤에는 구글, 그리고 DeepMind가 있습니다. DeepMind는 뛰어난 모델을 만드는 연구 조직일 뿐만 아니라, Google이 AI를 어떻게 장기적인 자산으로 축적해 왔는지를 보여주는 명확한 사례입니다.
DeepMind는 2010년, 영국 런던에서 설립되었습니다. 설립자는 데미스 하사비스(Demis Hassabis)로, 게임 개발자 출신이면서 신경과학을 연구했습니다. DeepMind는 처음부터 명확한 비즈니스 모델을 내세우기보다는, “인간처럼 학습하는 범용 인공지능을 만든다”는 다소 추상적이지만 야심 찬 목표를 내세웠습니다.
Google은 이런 DeepMind의 가능성에 주목했습니다. 2014년 Google은 DeepMind를 인수하며, AI 연구 역량을 내부로 흡수합니다. 이 인수는 매출과 수익을 목표로 한 결정이 아니라, 장기적인 기술 경쟁에서 주도권을 확보하기 위한 전략적 투자에 가까웠습니다. Google은 DeepMind에 상당한 연구 자율성을 보장했습니다. 이는 이후 DeepMind가 단기 성과에 매몰되지 않고, 장기적 연구를 이어갈 수 있었던 중요한 배경입니다.
1) AlphaGo – 강화학습의 가능성을 증명
Google 인수 이후 DeepMind의 첫 번째 상징적 성과는 AlphaGo입니다. AlphaGo는 딥러닝과 강화학습을 결합해, 기존의 규칙 기반 접근으로는 해결하기 어려웠던 문제를 풀어냈습니다.
2016년, AlphaGo는 세계 최고 수준의 프로 바둑 기사 이세돌 9단과의 대국을 통해 전 세계의 주목을 받았죠. AlphaGo가 보여준 수들은 인간의 기보를 모방한 결과가 아니라, 스스로 학습한 결과물이었고, 그 과정에서 인간 바둑 전문가조차 예상하고 해석하지 못하는 선택들이 등장했습니다.
이 사건은 AI가 단순 계산 능력을 넘어, 전략적 사고와 탐색 능력을 가질 수 있음을 대중과 산업계에 동시에 각인시킨 계기입니다.
2) AlphaZero – 범용 학습으로의 도약
AlphaGo 이후 DeepMind는 한 가지 질문을 던집니다.
“이 접근 방식은 특정 문제에만 유효한가, 아니면 더 일반화될 수 있는가?”
그리고 이 질문에 대한 대답이 AlphaZero입니다. AlphaZero는 바둑, 체스, 쇼기라는 서로 다른 게임을 사전 지식 없이 동일한 알고리즘으로 학습합니다. 이후 인간의 경험 데이터를 사용하지 않고, 자기 대국을 통해 실력을 끌어올립니다.
이는 AI가 문제마다 새롭게 설계되고, 학습이 필요한 시스템이 아니라, 하나의 학습 원리로 다양한 영역에 적용될 수 있음을 보여준 사례입니다. 이 시점부터 DeepMind의 연구는 ‘특정 문제를 잘 푸는 AI’가 아니라, ‘범용적으로 학습하는 AI’로 방향을 명확히 잡습니다.
3) MuZero – 세상을 이해하는 AI
현실 세계는 게임과 다릅니다. 규칙이 명확하지 않고, 모든 정보를 사전에 알 수 없죠. 이를 다루기 위해 등장한 모델이 MuZero입니다. MuZero는 환경의 규칙을 명시적으로 주어지지 않은 상태에서도, 내부적으로 세계를 모델링하고 이에 바탕해 예측과 의사결정을 수행합니다.
이는 AI가 단순히 주어진 규칙 안에서 최적의 선택을 하는 단계를 넘어, 환경 자체를 이해하려는 단계로 진입하는 것을 의미합니다. 이후 등장하는 ‘월드 모델’ 개념의 중요한 전환점이 바로 이 지점입니다.
1) 게임을 넘어 현실 문제로 – 에너지와 효율
DeepMind는 자신의 기술을 게임을 넘어 실제 산업 문제로 확장합니다. 대표적인 사례가 Google 데이터센터의 에너지 효율 최적화입니다. 강화학습 기반 AI는 냉각 시스템을 자동으로 조정하며 전력 사용을 줄이고 운영 효율을 개선합니다.
이는 DeepMind의 연구가 실험실 안에 머무르지 않고, 실제 비용 구조와 운영 성과에 직접적인 영향을 줄 수 있음을 보여준 사례입니다. AI가 연구 성과를 넘어 비즈니스 성과로 이어질 수 있다는 점을 명확히 보여줍니다.
2) 과학 문제로의 본격 진입 – AlphaFold
DeepMind 연구의 방향성이 결정적으로 확장된 사례는 AlphaFold입니다. AlphaFold는 단백질 구조 예측이라는 생명과학의 난제를 해결하며, AI가 과학 연구의 보조 도구를 넘어 발견의 주체가 될 수 있음을 증명합니다.
이 성과는 단순한 기술적 성취에 그치지 않았습니다. AlphaFold2의 연구 성과로 데미스 하사비스와 핵심 연구진은 노벨 화학상을 수상하며, AI 연구가 전통적인 과학 성과로 공식 인정받는 역사적 장면을 만듭니다. 이는 AI가 “응용 기술”을 넘어, 인류의 지식 체계를 확장하는 도구가 될 수 있음을 상징적으로 보여준 사건입니다.
최근 DeepMind는 Google Brain과 통합되어 Google DeepMind로 재편되었습니다. 연구의 초점은 언어, 이미지, 코드, 행동을 아우르는 멀티모달의 범용 모델(Gemini 계열)로 이동하고 있습니다. 이는 지금까지 축적된 강화학습, 월드 모델, 과학 연구 경험을 하나의 범용 지능 시스템으로 통합하려는 시도입니다. Google은 이제 개별 모델의 성능 경쟁을 넘어, 지능 그 자체를 플랫폼으로 구축하는 단계에 들어섰다고 볼 수 있습니다.
참고
1) Google. https://about.google/company-info/our-story
2) DeepMind. https://deepmind.google/about/
3) Google DeepMind. http://en.wikipedia.org/wiki/Google_DeepMind
4) Announcing Google DeepMind. https://deepmind.google/blog/announcing-google-deepmind/
5) AlphaGo. https://deepmind.google/research/alphago/
6) AlphaZero, MuZero. https://deepmind.google/research/alphazero-and-muzero/
7) Controlling Commercial Cooling Systems Using Reinforcement Learning. https://arxiv.org/abs/2211.07357.
8) DeepMind AI Reduces Google Data Centre Cooling Bill by 40%. https://deepmind.google/blog/deepmind-ai-reduces-google-data-centre-cooling-bill-by-40/
9) AlphaFold. https://deepmind.google/science/alphafold/
10) Highly accurate protein structure prediction with AlphaFold. https://www.nature.com/articles/s41586-021-03819-2
11) Nobel Prize in Chemistry 2024. https://www.nobelprize.org/prizes/chemistry/2024/summary/
12) Gemini. https://gemini.google.com/