brunch

매거진 지능정보사회 연구실 J

라이킷 7 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 이십세기 소년 Feb 05. 2021

#모두의 4차 산업혁명 : 30교시

거대사를 통괄하는 산업혁명 클래스

#37. 인공지능 VS 인간

이렇게 발전하게 된 인공지능은 때마다 오픈 테스트를 거쳐 왔는데 바로 특정 분야에서 인간을 이길 수 있는지에 관한 것이었습니다. 첫 도전장은 죠나단 쉐퍼가 개발한 인공지능 프로그램 ‘치누크(Chinook)’였습니다. 치누크는 1990년 미국 체커협회가 주최하는 체커(Checker : 체스판 검은색 칸에 말을 놓고 움직여 상대의 말을 획득하는 서양 실내놀이) 대회 선수로 참가했는데 당시 체커 세계챔피언 마리온 틴슬리는 사람들끼리 겨루는 대회에 컴퓨터 프로그램이 끼어드는 것에 대한 항의로 대회를 거부하기도 했다는군요. 우여곡절 끝에 마침내 치누크와 틴슬리는 운명의 한판 대결을 치루는데 결과는 4:2로 틴슬리가 치누크를 가볍게 눌렀죠. 이때까지는 인간의 위대함을 인공지능 따위가 범접할 수준은 아니었습니다.

그러나 반전은 지금부터 시작됩니다. 1994년 대회에서 치누크는 인간과 기계를 통합한 세계 챔피언을 차지하게 됩니다. 이후 그 진가는 1997년 5월에는 미국 IBM사에 수퍼 컴퓨터인 ‘딥블루(Deep Blue)’와 체스 챔피언 그랜드마스터 가리 카스파로프가 마주앉으면서 발휘됩니다. 사실 1996년 이미 한 차례 대결이 벌어지기는 했습니다. 이때는 4-2로 카스파로프가 승리한 적이 있었습니다. 이후에 딥 블루에 엄청난 성능향상 작업이 있었고 결국 재대결에서 3.5-2.5로 인간에게 승리를 따냅니다. 딥 블루의 승리는 어느 정도 예측된 일이었습니다. 딥 블루는 연산속도가 11.38기가플롭스(FLOPS, Floating point Operations Per Second)였으며 30개의 120MHz CPU와 480개의 VLSI칩이 내장되어 있었죠. 초당 2억 번이나 체스 말의 위치를 확인할 수 있는 것은 물론 최고 20수 이상을 내다볼 수 있었고 그랜드 마스터들의 대국 900국을 완전히 기억하고 있었죠. 반면 카스파로프는 초당 2가지 경우의 수를 생각할 수 있었을 뿐이었습니다. 게임에 진 이후로 카스파로프는 그도 이해할 수 없는 기계의 창의성을 보았다고 합니다. 또한 그는 경기를 하는 동안 기계가 학습했다고 말하기도 했습니다. 그는 재경기를 원했지만, IBM은 그것을 거부했다는 얘기가 전해지는데 아마 충분히 높아진 딥 블루의 몸값에 IBM 주식이 10년 만에 최고치를 경신하며 이미 마케팅 목표를 충분히 달성한 상황에서 굳이 모험을 했을까하는 내재적 접근을 해봅니다.(웃음)

인공지능과 인간의 다음 승부는 2011년 퀴즈 대결에서였죠. 이번에는 IBM사의 슈퍼 컴퓨터 ‘왓슨(Watson)’이 등장합니다. 미국의 인기 퀴즈쇼 제퍼디(Jeopardy)에 출현한 왓슨은 총 66개의 문제를 맞히며 2명의 퀴즈 챔피언들보다 3배 이상 많은 총 100만 달러의 상금을 획득하였습니다. 왓슨에는 2억 페이지 분량의 내용(약 1백만 권의 책에 해당)이 입력되어 있었고 2백만 페이지 분량의 내용을 왓슨의 ‘뇌’로 3초 안에 살펴볼 수 있었다고 하네요.

체스와 퀴즈를 차례로 정복한 인공지능. 하지만 유일하게 인간을 넘지 못하는 종목이 있었으니 바로 바둑이었습니다. 인공지능이 바둑으로 인간을 이기려면 새로운 능력이 필요했습니다. 체스판의 칸은 64개에 그치지만 바둑판의 칸은 총 361개로 첫수를 주고받는 경우의 수만 무려 12만 9,900가지입니다. 361개의 점을 모두 채워가는 경우의 수는 10170가지로 우주 수소 원자의 수인 1080의 수를 뛰어넘으며 모든 경우의 수를 계산하려면 슈퍼 컴퓨터로 수십억 년이 걸리죠. 여기다 형세판단도 필요하고 죽은 돌을 덜어낸 자리에 다시 둘 수 있는 규칙 또한 복잡합니다.

하지만 알파고의 등장으로 상황이 달라집니다. 구글에서는 계산능력만 활용하는 기존 기술과 달리 스스로 학습해 경험을 쌓고 응용할 수 있는 딥 러닝 기술을 적용했습니다. 이를 위해 바둑 기보 3,000만 건을 입력해 규칙을 가르친 뒤 하루 30,000번씩 대국을 진행하도록 했습니다. 이는 한 달이면 100만 번 대국하는 꼴로 인간이 연간 1,000번씩 천년동안을 대국하는 것과 같습니다. 결과는 성공적이었죠. 중국 프로기사 판후이 2단에 5:0 으로 꺾으며 완승을 거둡니다. 알파고는 판후이 2단과의 승부이후 400만 번의 대국을 진행하며 새로운 도전자를 찾게 됩니다.

바로 세계정상의 프로바둑기사 이세돌 9단이었죠. 바둑은 다른 게임과는 다릅니다. 판을 진행하는 과정에 있어 자기의 철학과 직감이 요구되는 특수한 게임입니다. 게다가 체스의 몇 천배 이상의 차이나는 수를 컴퓨터가 완벽하게 입력하기란 현실적으로 어렵죠. 사람도 다 알지 못하는 바둑의 세계 세기의 대결이라 했던 이세돌과 인공지능의 세기의 대결. 결국 4:1로 인공지능이 승리를 했죠. 후에 이세돌이 밝혔지만 “첫 승리했을 때의 대국에서 패배가 짙은 상황에서 모험에 가까운 수를 두었고, 이 수에 버그를 일으킨 알파고로 인해 겨우 이길 수 있었다”고 말이죠. 심지어 당시 알파고 스텝진 조차 그 버그를 이해하고 고치기까지 꽤나 고생했다고 말했죠. 마치 레이 커즈와일이 말한 특이점이 도래하면 인공지능이 만든 결과물을 인간이 도저히 이해할 수 없는 지경에 이른것같은 생각이 들기도 했습니다. 아무튼 불가능이라 여겼던 인공지능의 바둑에서의 완벽한 승리로 인해 전 세계는 4차 산업혁명 시대의 도래를 본격적으로 체감하게 됩니다.

더 놀라운 것은 알파고의 이후 버전 업에서 드러난 진화 속도였습니다. 이세돌 9단과 대결한 ‘알파고 리(AlphaGo Lee)’ 다음 버전이었던 ’알파고 마스터(AlphaGo Master)’는 당시 세계 바둑랭킹 1위를 차지하고 있던 커제 9단과 대결에서 모두 승리하게 됩니다. 기존의 알파고 리가 학습한 내용을 토대로 추론했다면 알파고 마스터는 추론과 동시에 학습할 수 있고, 학습에 필요한 시간이 기존의 1/3로 단축되었다고 합니다. 또한 머신의 물리적인 부피가 줄어들면서 에너지 효율은 10배가량 향상되었다고 하죠. 이 대국 이후부터 바둑계 안팎에선 인간의 수준을 넘어선 알파고의 바둑을 평가하는 것은 큰 의미가 없다는 것이 중론이 되었습니다.

바둑관련 대미를 장식하는 것은 알파고 마스터 후속 버전으로 나온 ‘알파고 제로(AlphaGo Zero)’였습니다. 지금까지의 인공지능이 외부에서 데이터와 인간 지식의 도움을 받아야 하는 이른바 ‘지도 학습’을 했다면 알파고 제로는 대국상대 없이 순수히 독학만으로 인간이 수천 년 동안 개발한 바둑 이론을 깨달게 됩니다. 구글 딥마인드의 창업자인 데미스 허사비스(Demis Hassabis)는 이번 연구 결과를 설명하는 ‘백지 상태에서의 학습’이라는 글에서 다음과 같이 밝혔습니다.

“인간 지식은 너무 비싸고 신뢰할 수 없거나 이용할 수 없는 경우가 있다는 문제가 있다”라며 “인공지능 연구의 오랜 과제는 어떤 인간의 도움 없이도 초인적인 문제 해결 능력을 보이는 알고리즘을 만들어 이런 단계를 건너뛰는 것이었다”

인공지능을 훈련시키기 위해 방대한 데이터를 수집·입력하고 전문가의 지식을 동원하는데는 많은 비용과 시간이 걸리겠지요. 인간의 잘못된 지식이나 선입견이 오히려 인공지능 학습에 한계가 될 수 있는 편향으로 작용할 수도 있습니다.

최근에는 이런 문제를 극복하기 위해 인공지능이 스스로 수많은 시행착오를 통해 요령을 터득하는 ‘강화학습(Reinforcement Learning)’에 대한 연구가 활발한데요, 이런 강화학습은 인간의 지식 자체가 부족하거나 전무한 새로운 분야를 연구하는 데 큰 도움이 될 수 있겠습니다.

강화학습 방식으로 만들어진 알파고 제로는 지금까지 나온 알파고 버전들 중 가장 강력했습니다. ‘알파고 제로’는 72시간 독학을 한 후 ‘알파고 리’와 대국한 결과 100전 100승을 기록했는데 한 수에 0.4초가 걸리는 ‘초속기’ 바둑으로 490만판을 혼자 두고 쌓은 결과였습니다. 40일에 걸쳐 2,900만 판을 혼자 둔 후에는 2017년 5월 세계랭킹 1위 커제 9단을 3대 0으로 꺾었던 ‘알파고 마스터’의 실력마저 압도했지요. 알파고 제로는 알파고 마스터에 100전 89승 11패를 거뒀습니다. 알파고 제로는 강화학습으로 바둑의 이치를 스스로 깨달았을 뿐만 아니라 새로운 정석을 개발하기도 했습니다. 알파고 제로가 기존 버전들보다 강한 이유에 대해 데미스 허사비스는 “인간 지식의 한계에 더 이상 속박되지 않기 때문”이라고 설명했습니다. 알파고 제로는 컴퓨팅 파워도 크게 줄였는데 이세돌과 대결했던 알파고가 TPU(텐서프로세싱유닛 : 인공지능에 특화돼 구글이 만든 칩) 48개를 쓴 반면, 알파고 제로는 4개만으로 구동했죠.

지금까지 인공지능의 역사와 원리, 발전과정 등에 대해 살펴봤는데요, 인공지능의 무한한 가능성을 제대로 활용하게 된다면 인류가 직면한 중요한 문제들을 해결하는데 커다란 도움이 될 것은 자명한 일이겠지요. 우린 이제 그 가능성을 막 확인한 참입니다. 앞으로 인류가 이 가공할 무기를 어떻게 사용하느냐에 따라 그 결말은 극과 극으로 나뉘게 될 수도 있을 것입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari