brunch
매거진 사각의 링

컴퓨터의 도전

조영필

by 조영필 Zho YP
2015년 3월 17일, 조치훈 9단 대 돌바람(source: nitro15.ldblog.jp)


사이버오로의 뉴스를 항상 즐겨보고 있었는데, 한가지 아쉬운 점이 생겼다. 그것은 일본에서 최근 시행된 전성전(電聖戰)에 대한 소식이었다. 전성전은 2012년의 시범실시를 거쳐 2013년부터 본격 개최된 바둑컴퓨터(소프트웨어)와 프로기사와의 대결이다.


그런데 사이버오로에서는 2015년 3월 17일 전성전이 개최되고 거기에 초대된 기사가 한국의 조치훈 9단이며, 또한 조9단과 대결하는 바둑프로그램 중의 하나는 한국인이 개발한 '돌바람'이라고까지 애드벌룬을 띄워놓고서는 그 이후에는 감감무소식이다.


바둑인의 한사람으로 너무나 기다리던 소식이었지만, 사이버오로가 소식을 전달해주지 않았기에 직접 확인을 해보는 수밖에 없었다.


직접 일본 웹사이트에 들어가서 확인해본 결과 조치훈 9단과 돌바람(한국, 임재범 개발)은 4점 접바둑으로 돌바람이 승리하였고, 조치훈 9단과 Crazy Stone(프랑스, Rémi Coulom개발)은 3점 접바둑으로 조치훈 9단이 승리하였다.


그런데 이 두 컴퓨터 소프트웨어는 제8회 UEC배 컴퓨터바둑대회에서 우승과 준우승을 한 프로그램이다. 특히 Crazy Stone은 제1회에는 이시다 마사오 9단에게 3집승을, 제2회 대회때는 요다 노리모토 9단에게 2집반승을 기록하여, 처음으로 3점에 도전하는 영광을 안았으나, 이번에는 분루를 삼키게 되었다.


사실 컴퓨터의 인간 두뇌에 대한 도전은 1997년 5월 11일 IBM의 프로그램인 Deep Blue가 세기의 체스 천재 개리 카스파로프에게 2승 3무 1패를 기록하여 그 서장을 열었다. 이때, 컴퓨터가 사용한 프로그램의 원리는 대략 세 가지라고 한다.


그 처음은 Minimax Procedure(최소최대화)이다. 내가 두는 시점에서 가장 좋아보이는 수를 두는 것이 아니라, 상대가 대응하여 두는 수(나에게 가장 안 좋은 수, Mini)를 예상해서 그 중에서 나에게 가장 좋은 수(Max)를 트리(Tree) 형식으로 찾아내는 것이다.


다음으로는 Pruninig(가지치기)이다. 한 눈에 무시해도 되는 영역과 숙고해야 되는 영역을 구별한다.


마지막으로는 Transportation Tables(치환)이다. 이 기술은 특정한 형태의 포지션의 가치를 일시적으로 기억하게(cache) 하여, 다음에 동일한 상황에 마주칠 때, 재계산할 필요가 없어, 효율적으로 사고처리를 할 수 있게 해준다.


이러한 세가지 방식으로 컴퓨터가 체스는 정복하였는데, 그렇다고 해서, 세계의 모든 장기가 모두 컴퓨터에 무릎을 꿇은 것은 아니다. 사실 컴퓨터가 중국장기(샹치)와 한국장기는 이미 정복한 것으로 보인다. 중국장기의 경우, 프로시합에서 우승하는 사람은 항상 컴퓨터 프로그램을 활용하지 않았는지 의심을 받게 된다고 하는 정황을 보면 더욱 그렇다.


그러나 일본장기(쇼기)의 경우에는 다르다. 매년 개최되는 컴퓨터와 일본프로기사간의 단체전인 전왕전(電王戰)에서 2013년, 2014년에는 컴퓨터가 승리하였으나, 2015년 올해에는 (4월 11일) 사람이 3 대 2로 승리하고 있다. 또한 체스에서의 카스파로프와 같이 쇼기를 대표하는 하부 요시하루 명인과의 빅매치는 아직껏 이루어지지 않고 있다.


쇼기는 죽은 말이 다시 살아나는 재투입 규칙으로 인하여, 일군의 장기 중에서도 가장 까다로운 장기라고 할 수 있다. 그러나, 컴퓨터의 발달로 우리는 조만간 컴퓨터와 쇼기 최고기사간의 세기의 대결을 보게 될 수 있지 않을까?


장기의 경우는 이와 같이 컴퓨터가 압도적으로 위력을 발휘하고 있는데, 바둑은 아직도 Deep Blue의 쾌거 이후 근 20년이 다되어가도록 난공불락을 자랑하고 있다. 아마도 그것은 바둑이 영토게임이자 동시에 포획게임이기 때문일 것이다.


체스의 경우에는 왕을 잡는 것이 게임의 목표이다. 따라서 목표와 수단이 동일하다. 그러나 바둑의 경우에는 목표는 영토이나, 수단은 포획이다. 목표와 수단이 서로 상이한 것이다.


그렇다 하더라도 결국은 경우의 수의 문제이다. 현재 9줄에서는 컴퓨터가 프로기사와 대등한 실력을 보이고 있는 것으로 보인다. 그렇다면, 결국 프로그램의 속도가 발전하면, 19줄 또한 충분히 극복될 수 있을 것이다.


요즈음의 바둑프로그램은 몬테카를로방식이라는 알고리즘을 사용한다고 한다. 이것은 무수한 모의대국을 둬 통계적으로 더 나은 착수를 얻어내는 알고리즘이라고 한다. 결국 끝내기를 예상하고 둔다는 것이다.


이것은 바둑 실력을 한뼘이라도 늘리고자하는 모든 인간 하수들에게도 하나의 계시가 아닐까? 포석이거나, 정석이거나, 사활이거나 간에, 종반을 예측해서 이긴다고 확신이 서는 수를 두면 되는 것이다.


조치훈은 "크레이지스톤은 초중반이 좋았고, 돌바람은 중후반이 좋았다."고 평했다. 필자는 그렇다면, 돌바람이 더 향후 가능성이 있다고 본다. 초중반은 보완하면 되지만, 중후반은 틀을 구축하기가 쉽지 않기 때문이다.


바둑은 컴퓨터와 수학에게 새로운 목표를 주어 다시금 인류를 진화시키는 소임을 가지고 있는 것일까? 우리 세대 내에 다가올 컴퓨터와 인간의 진검승부가 더욱 기다려진다.


(2015.04.16 사이버오로 게재)