brunch

You can make anything
by writing

C.S.Lewis

by Chris송호연 Sep 05. 2017

DeepMind's Vision

The Theory of Everything-Demis Hassabis

한창 인공지능 공부를 하다가, 저는 잠시 궁금한 게 생겼습니다.


강화학습, 인공지능 다 멋진 기술이긴 한데, 

인공지능 기술을 리드하고 있는 딥마인드가 이 기술을 미친듯이 파고 있는 이유가 있지 않을까?


물론 다들 알고 계시겠지만 딥마인드의 미션은 여러번 발표되었고, 두 가지 문장으로 요약됩니다.



DeepMind's Mission

- Solve Intelligence

- Use it to solve everything else


딥마인드의 미션

- 지능을 해결한다

- 이 것을 다른 모든 것을 해결하는 데 사용한다



그리고, 딥마인드는 프로그래밍 되지 않은 범용 지능(General-Purpose Learning Machines)을 개발하려는 좀 더 구체적인 미션을 가지고 있습니다. 


사실, 저는 좀 더 알고 싶었습니다. 

인공지능 분야의 리더는 어떻게 생각하는 지 궁금했습니다.


회사의 비전에 대해 이해하는 최고의 방법은 리더의 말을 하나 하나 다 들어보는 것이라 생각합니다. 

회사의 방향성과 프로젝트는 사실, 리더의 생각과 비전에서 나옵니다. 그리고 그 생각과 비전을 알 수 있는 방법은 리더가 하는 말을 꼼꼼하게 듣고 이해하는 것입니다.


그래서 저는 데미스 하사비스의 여러 강연들에서 발표한 내용을 우선 그대로 받아적어보기로 했습니다.


첫 번째 영상은 바로 데미스 하사비스가 "The Theory of Everything" 이라는 주제로 발표한 영상입니다. 


https://www.youtube.com/watch?v=rbsqaJwpu6A




DeepMind에서 우리는 기본적으로 인공 지능을 연구하고 인공 지능은 기계를 스마트하게 만드는 과학입니다. 인류가 발명하는 가장 중요한 기술 중 하나가 되기를 기대합니다.하지만 이 세션에서는 "모든 것에 대한 이론"을 발표하기로 했으므로 앞서 생각했습니다. 


저의 개인적인 여정에 대한 설명으로 시작하겠습니다. 어떻게 제가 이 시점에 이르게 되었는 지. 그리고 왜 내가 결정했는지 이야기 해드리겠습니다. 


제가 어렸을 적, 학교에서 어린 나이부터, 이 기본 원리에 입각하여 물리학과 신경 과학 만 공부할 가치가있는 두 가지 과목이 있었습니다. 물론 물리학을 위해서는 외부 세계를 설명하는 것이 전부입니다. 우주 전체를 포괄하는 외부 세계, 신경 과학 및 심리학은 실제로 내부, 내부 세계에 대해 역으로 설명하는 것입니다. 


그렇다면이 점에 대해 생각했을 때 실제로 마음이 더 중요하다는 결론이 나온 것입니다. 분명히 우리가 실제로 외부 세계를 해석하기 때문입니다. 사실, 마음은 세상를 해석합니다. 이것은 위대한 철학자 임마누엘 칸트가 처음 제안한 아이디어였습니다. 


마음은 세상을 해석한다 - 임마뉴엘 칸트
The Mind interprets the World - Immanuel Kant



그래서 여기에서 AI가 오는 것입니다. 왜냐하면 어떤 것을 이해한다는 최고의 표현은 그 것을 재창조하는 것이기 때문입니다. 그리고 Richard Feynman은 말했습니다. 


내가 만들지 못하는 것은, 내가 아직 이해하지 못한 것이다. - 리차드 파인만
What I cannot build, I do not understand - Richard Feynman


사람의 지능을 재창조한다는 것은 인공지능 관해 저를 정말 흥분시키는 주제입니다. 왜냐하면 인공지능은 우리가 인간의 지능을 이해하는 것을 도울 것이기 때문입니다.


인공지능에 대한 저의 개인적인 여행은 게임으로 시작되었습니다. 저는 체스를 시작했습니다. 저는 4 살 때 체스를하는 법을 배웠고, 다양한 체스 팀과 다양한 영국 체스 팀을 상대로 경기를 끝내었습니다. 12 세까지 나는 체스 마스터였습니다. 중요한 것은 제가 이런 생각을 했다는 것입니다.


내 마음은 왜 이러한 말 이동을 생각했는가?
나는 어떤 메커니즘으로 체스를 플레이하는가?

그래서 제가 약 8 년이되었을 때, 저는 실제로 국제 경기 대회에서 우승한 과정의 알고리즘을 생각했고, 제 첫 번째 컴퓨터 인 ZX Spectrum 48k를 사서 직접 프로그램을 가르쳤습니다. 내가 기억할 수있는 첫 번째 일종의 빅 프로 그램 중 하나는 실제로 플레이를 만드는 프로그램 이었지만 아주 잘 돌아 가지 않았지만 작은 동생을 이길 수 있었습니다. 저는 그 당시 매우 기뻤습니다. 알다시피, 그것은 효과가 있었고, 이것은 인공 지능을 목표로하는 길의 시작이었습니다. 


자, 프로그래밍에 대한 나의 사랑과 체스 게임은 일종의 비디오 게임의 형태로 함께 모였습니다. 그리고 첫 경험자는 비디오 게임을 제작하고 디자인했습니다. 나는 10년 동안 이 일을 했고 몇 가지 베스트 셀러 게임을 제작했지만, 내가 쓰는 가장 유명한 게임은 아마도 내가 17 살 때 쓴 테마 파크라고 할 수있을 것입니다. 이 게임은 인공 지능을 주요 게임 구성 요소로 사용하는 최초의 게임 중 하나입니다. 따라서이 게임은 94 년 90 년대에 나왔습니다. 게임의 목적은 자신의 디즈니 월드와 수천 명의 작은 사람들을 자신의 욕망과 특성으로 디자인 한 것이 디즈니 월드 심판들은 당신의 테마 파크에서 얼마나 재미 있었는지 결정했습니다. 그들은 가서 친구에게 말하면 다음 날에 올거야. 그래서이 게임은 경영 전략 시뮬레이션(Management Simulation) 게임이라고 불리는 게임의 전체 장르를 창안했습니다. 그리고 실제로, 일종의,이 총체적인 장르의 크리에이티브 게임을 시작했습니다. 실제로 사격과 살인이 일어나지 않고, 실제로 물건을 만들고 빌드하고, 게임을 하는 방식에 반응합니다. 두 사람은 같은 게임으로 끝났습니다. 인공 지능이 플레이어의 플레이 방식에 적응했기 때문입니다. 사실 모든 게임에 AI가 많이 포함되어 있었고 마지막으로 지그 소 퍼즐의 마지막 부분이 10 년 동안이 게임을 팔고 나서 게임 회사를 팔았습니다. 


그리고 저는 대학으로 돌아가서 신경 과학 박사 과정에서 박사 학위를 받았습니다. 어떻게 뇌가 그 중 일부를 풀 었는지 연구했습니다. 내가 선택한 주제의 어려움과 기억과 뇌의 영역이 상상력과 기억을 담당하는 해마 (hippocampus)라고 불렀기 때문입니다. 왜냐하면 이것들은 우리가 인공 지능에서 어떻게해야할지 잘 모르기 때문입니다. 나는 뇌가 실제로 문제를 해결하는 방법을 알려주고 영감을 얻고 싶었습니다. 그래서 두명의 post-doc MIT와 Harvard 이후, Ithen은 내가 모든 착각 자들과 구성 요소가 DeepMind를 시작하도록 결정했고 실제로 AI 문제를 집중적으로 연구하기 시작했습니다. 그래서이 모든 경험이 절정에 달했습니다. 2010 년 DeepMind 공동 창립과 DeepMind의 아이디어는 실제로 AI를 위한 일종의 아폴로 프로그램 같은 미션을 창조하기위한 것입니다. 


이제 DeepMind에서 우리는 100 명의 연구 과학자 100 명 박사 학위를 소지했으며, 머신 러닝 분야의 최고 인재들과 AI를 해결하는 작업자의 신경 과학 파일을 가지고 있습니다. 우리가 연구하는 인공 지능의 유형은 신경 과학에서 영감을 얻은 AI입니다. 뇌가 매우 높은 단계 인 시스템 수준에서 어떻게 작동하는지에 따라 영감을 얻었습니다. 


그래서 우리가 딥 마인드 (DeepMind)에서 허가를 분명히 밝히는 한 가지 방법은 실제로 명료하게 표현하는 것이 매우 쉽지만 분명히 할 수있는 일은 두 가지 단계 과정입니다. 



스텝 1, 지능을 해결하고 

스텝 2 다른 모든 것을 해결하기 위해 그것을 사용하는 것입니다. 

그래서 실제적으로 우리가 무엇을 하는 것일까요? 



우리는 세계 최초의 범용 학습 기계를 만들기 위해 노력할 것입니다. 


여기서 핵심 단어는 '범용'과 '학습'입니다. 


우리 딥마인드에서 만드는 모든 것은 바로 '학습 알고리즘' 입니다. 자동으로 작업을 마스터하는 알고리즘입니다. 그들은 사전 프로그래밍되지 않았습니다. 두 번째 부분도 있습니다. 시스템이 일반화되기를 바란다는 아이디어입니다. 알고리즘은 한 가지 문제를 풀 뿐만 아니라 실제로 다양한 작업을 해결하기 위해 작동 할 수 있습니다. 물론 '인공 지능'은 현재 큰 인기를 얻고 있으며 AI에서 큰 업적을 맺었습니다 물론 당신도 알고있을 것입니다. Deep Blue 90 년대에 Garry Kasparovin을 물리 치고, 최근에는 IBM의 Watson이 Jeopardy 경연자를 능가하지만 우리의 견해에 따르면 그것은 Narrow AI라고 부르는 것을 보여줍니다. 그래서 이것은 특별히 구체화되었거나 하나의 문제와 하나의 문제만을 위해 만들어졌고 AI의 일종의 인공 지능, 일종의 인공 지능 등은 유연하고 일반적이고 적응력있게 구축되어 있다는 것입니다. 관련된 작업을 특수화하거나 사전 프로그래밍하지 않아야합니다.


첫 번째 원칙에서부터 모든 것을 배워야합니다. 그래서 우리는 일종의이 프레임워크 내의 지능 문제에 대해 생각해 봅니다. '강화 학습'이라고하며 매우 간단한 프레임 워크로 설명하기 위해이 간단한 다이어그램으로 설명하려고합니다. 



그래서 여기 왼쪽 편에는 시스템 자체가 있습니다. AI 시스템과 AI 시스템은 목표를 달성하기 위해 노력하고있는 일종의 환경을 발견하고 그 환경은 실제 세계 또는 가상 세계일 수 있습니다. 이제 시스템은 두 가지 방식으로 환경과 만 상호 작용합니다. 처음에는 그 감각 신경을 통해 환경에 대한 관찰을 얻습니다. 우리는 일반적으로 DeepMind에서 시력을 사용하지만 다른 방식을 사용할 수 있습니다. 이러한 관찰은 언제나 불완전하고 불완전합니다. 따라서 체스 게임이 아닌 현실 세계는 실제로 매우 시끄럽고 지저분합니다. 그리고 당신은 계속 진행되는 것에 대해 완전한 정보를 얻지 못합니다. 시스템의 임무는 거기 세계의 가장 좋은 모델을 구축하는 것입니다. 세계의 그 모델을 가지고 있습니다.


이 시스템의 두 번째 직업은 그 순간에 그곳에서 사용할 수있는 일련의 행동에서 가장 가까운 행동을 취할 수있는 최선의 행동을 선택하는 것입니다. 일단 시스템이 어떤 행동을 취했는지 결정하면, 행동이 실행되고, 그 행동이 실행되면 환경에 변화가 생길 수도 있고 그렇지 않을 수도 있으며, 그것은 새로운 관찰을 유도합니다. 이 모든 시스템이 비록이 도표에 아주 간단하게 설명되어 있지만 숨겨진 복잡성이 많이 있습니다.이 다이어그램 뒤에있는 모든 것을 해결할 수 있다면 지능이 충분할 것입니다. 우리는 그것이 정보를 얻기에 충분하다는 것을 압니다. 왜냐하면 이것이 인간을 포함한 모든 포유류가 배우는 방법이기 때문입니다. 우리 인류의 도파민 시스템은 강화 학습을 구현하는 두뇌입니다. 



그래서 저는 비디오 작업 몇 가지를 보여 드리겠습니다. 알고리즘 작업에 대한 몇 가지 비디오를 보여 드리겠습니다. 하지만 제가 보여 드리기 전에, 저는 여러분이 보게 될 것이 무엇인지 명확하게 설명하고 싶습니다. 그래서 우리는 알고리즘 알고리즘의 지능을 테스트하기위한 테스트 베드를 사용했고 진정한 기계 또는 인식 시스템을 감각 운동 데이터 데이터 흐름 모터의 현실에 포함시켜야했습니다. 그리고 게임 자체를 파악해야합니다. 게임은 실제로이를 완벽하게 설정하고 있습니다. 실제로 우리는 80 년대의 고전적인 Atari 게임을 사용했는데, 이는 인간에게 도전적 이도록 설계되었지만 그렇게 복잡하지는 않습니다. 알고리즘은 게임을 진행할 수 없었습니다. 그래서 제가 여러분에게 보여줄 것은이 Atari 게임을 즐기는 것입니다. 그러나 시스템이 원시 픽셀을 입력으로 얻는 유일한 방법은 화면의 모든 픽셀을 보면서 사람이 화면을 바라 보는 것과 같습니다. 따라서 화면의 200x150 픽셀 크기와 목표는 단순히 점수를 최대화하기 때문에 약 30,000 개의 숫자가 표시됩니다. 모든 것이 처음부터 배워지고 동일한 시스템이 모든 다른 Atari 게임들, 수백 개의 다른 Atari 게임들을 플레이한다고 주장합니다.


이제 이 비디오를 실행할 것입니다. 이것은 1 분 분량의 비디오입니다. Space Invaders입니다, 아마 Atari에서 가장 상징적인 게임입니다. AI 가 이 데이터 스트림을 본 첫 번째 시간입니다. 잊지 못할 것입니다. 그것이 무엇을 제어하는지 알지 못하고, 제어 할 수있는 것을 알지 못합니다. 실제로 세 개의 생명을 잃고. 그것은 로켓이 스크린의 바닥을 헤치고있는 것을 제어하고 있으며, 그것이 무엇을하고 있는지 알지 못하기 때문에 3 개의 생명이 즉시 사라집니다. 하나의 GPU 머신으로 밤새 플레이하도록 남겨두면, 다음날 다시 돌아올 수 있습니다. 이제 게임에서 컴퓨터는 초인이되었습니다. 그것은 경험을 통해 스스로를 배우고, 어떻게 놀 수 있느냐는 것입니다. 이제 당신은 그것이 발사되는 모든 단 하나의 생명을 볼 수 있습니다. 그것은 더 이상 살 수 없습니다. 분홍색 모친이 화면 상단에 오면 가장 많은 점수를받을 가치가있는 것으로 나타났습니다. 그렇게 할 수있는 정확하고 정확한 샷을 수행합니다. 스페이스 인베이더 러스를 기억하는 사람들은 빠른 속도로 우주선을 발견합니다. 로켓트가 마지막으로 촬영 한 것을 지켜보십시오. 




이 것은 마지막 우주 침략자를 강타한 예측 미사일입니다. 그러면 게임 세계와 그 데이터 스트림이 얼마나 완벽하고, 일종의 모델인지를 알 수 있습니다. 이렇게 정확하게, 그것은 스크린에서의 픽셀로부터 일어날 일을 미리 예측할 수 있습니다.


여기 두 번째 비디오가 있습니다. 실제로 제일 좋아하는 비디오입니다. 이것은 Breakout 게임입니다. 여기 에이전트가 더 좋아지고 시스템이 나아 졌어요. 그래서 100 게임에 불과하고 게임이 100 게임이 넘었습니다. 여기서 볼 수 있습니다. 시스템은 예쁩니다.하지만 당신은 아마 자신이 스스로에게 확신시켜야 할 사실을 알기 시작할 것입니다. 바를 공쪽으로 움직이십시오. 자, 이제 300 episode가 끝났습니다. 이제는 항상 공을 치고 있습니다. 유실된 된 것이 거의 없으므로, 이 게임에서 최고의 인간이 될 수있는만큼 좋은 결과를 얻었습니다. 그런 다음 우리는 생각했습니다. '정말 멋집니다. 우리가 컴퓨터에서 게임을 몇 백 개 더 남겨두면 어떻게 될까요? ' 이 놀라운 일이 일어났습니다. 무슨 일이 있었는지 최적의 전략은 여기 왼쪽 측면 터널을 파고 그 다음 믿을 수없는 정확성을 지닌 행동을 알려주는 것이 었습니다. 사실 멋진 프로그래머와 연구원이 이 프로그램에 참여하고 있기 때문에 그들은 프로그래밍에 능숙하고 알고리즘을 생각해 내고 있습니다.하지만 그들은 Atari를 잘 다룰 수 없으므로 실제로 전략 자체를 알지 못했습니다. 그래서 이것은 무언가였습니다. 인공지능이 만들어 낸 게임 플레이는 인공지능을 가르쳤습니다. 




그래서, 여러분 모두 아시다시피, Nature의 표지에 실제로 출판 된 모든 작업은 세계에서 가장 큰 과학 저널입니다. 그래서이 세부 사항에 대해 더 많이 읽고 싶다면 확인하실 수 있습니다. 그곳에. 이제 우리는 더 많은 것들, 능력들, 컨셉들, 학습 추상적 개념들, 그리고 장기간의 기억으로 나아가고 있습니다. 이것은 나의 일과 다른 사람들의 신경 과학에서 영감을 얻었으며, 해마라고 불리는 두뇌의 한 부분의 작용을 모방 한 것입니다. 물론, 우리는 단지 Atari 게임을하기 위해 이러한 알고리즘을 제작하는 것이 아닙니다. 이제 3D games, Go, 시뮬레이션을 향해 나아가고 있습니다. 그리고 나서 궁극적으로는 실제 로봇을 어느 시점에서, 더 가까운 시기에, 응용 프로그램 측면에서 사용하려고합니다. 예측 건강 관리 응용 프로그램으로 옮겨 가고 있습니다. 이제 저는 이것에 대해서 다시 생각해 보겠습니다. 모든 이론에 대한 주제가 있습니다. 


사회가 정보 과부하를 겪고있는 가장 큰 두 가지 문제점은
너무나 많은 데이터가 있다는 것입니다.

알다시피, 모든 사람들이 큰 데이터에 관해서 이야기하지만, 문제는 일단 그것을 모두 가져 왔으면 어떻게해야할까요? 제노믹스 (genomics)와 엔터테인먼트 (entertainment)와 같은 많은 분야가 많다고 생각합니다. 이 대홍수 데이터로 고통 받고 있습니다. '그 데이터를 통해 통찰력을 찾기 위해 어떻게이 데이터를 조사해야합니까?' 물론, 개인화 기술은 우리가 도우려고 노력하는 기술 중 하나입니다. 그러나 그들은 매우 개인화되지 않았기 때문에 순간적으로 잘 작동하지 않습니다. 그들은 유저 그룹을 평균하여 일하고 있습니다. 둘째, 시스템 복잡성 문제가 있습니다. 알다시피, 우리가 사회와 같은 기후, 질병, 에너지 경제학, 심지어 물리학조차도 너무 복잡해지기를 원하는 시스템의 대부분은 알 잖아요. 최고의 기술자와 가장 똑똑한 인간조차도 평생 동안 마스터하고, 여전히 혁신을위한 충분한 시간을 둡니다. 제가 AI에서 일하는 이유 중 하나는 왜 그것이 가장 중요한 기술 중 하나가 될 것이라고 생각합니까? 그 해결책은 다른 모든 문제에 대한 잠재적으로 일종의 메타 솔루션입니다. 우리는이 문제를 해결하는 데 도움이 될 수 있습니다. AI에서 일하는 것에 대해 가장 흥분되는 꿈은 과학자를 만들거나 창조 할 수있는 미래에 있습니다. 또는 과학을 도왔으며 가능한 한 인간 전문가와 인간 과학자와 함께 작업했습니다. 


AI에서 일하는 것에 대해 가장 흥분되는 꿈은 과학자를 만들거나 창조 할 수있는 미래에 있습니다. 또는 과학을 도왔으며 가능한 한 인간 전문가와 인간 과학자와 함께 작업했습니다. 이제 AI 관련 윤리에 관한 많은 뉴스가 있었고, 새롭고 강력한 기술과도 관련이있었습니다. 윤리적으로 책임감있게 사용되어야하며, 활발하게 조사하고 이러한 작업을 수행하고 있습니다. 윤리위원회가 있습니다. 이 기술의 사용을 관리합니다. 기술 자체는 중립적입니다. 항상 기술 인력이이 기술을 사용하여 윤리적인가 아닌가를 결정합니다. 물론 인간 수준의 인공 지능은 수십 년 간 떨어져 있지만 우리는 이제 논쟁을 시작해야합니다. 저는 작년에 구글 (Google)과 힘을 합쳤습니다. 



구글의 선언문은 세계 정보를 체계화하고 보편적으로 접근 가능하고 유용하게 만드는 것입니다. 구글과 협력하기로 결정한 한 가지 이유는이 구글에 우리의 미션을 잘 수행할 수 있도록 돕는 미션이 있다고 느꼈기 때문입니다. 다른 방법으로는 미션이 지식을 통해 능력을 부여하는 것을 생각하는 것입니다. 이것에 대해 생각해 볼 또 다른 방법은 AI 구조 인공 지능 정보입니다.이 방법은 구조화되지 않은 정보를 자동적으로 실행 가능한 지식으로 변환하는 과정입니다. 그래서 모든 것의 이론을 끝내기만 하면됩니다. 당신은 인공 지능 연구원 으로서뿐만 아니라 신경 과학자입니다. 


인공 지능을 알고리즘 구조로 발전시키고
그것을 인간과 비교해 보면
의식의 창의성과 심지어 마음, 그리고 꿈과 같은
 가장 깊은 신비의 문제를 풀 수 있다고 생각합니다. 



모든 것의 이론을 찾으려면 먼저 정보를 먼저 풀어야한다는 결론을 내릴 수 있습니다.


들어주셔서 감사합니다.



작가의 이전글 Gradient Descent Overview
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari