맥주 한잔하면서 잡(짭)지식에 기반한 이야기를 적어봅니다. 쓰고나니 글이 좀 길기도 하고 어렵기도 하네요. 잘 이해 안가는부분 댓글 주시면 부연 설명 드릴께요. 물론 자고 일어나서요 ㅎㅎ
-.
이세돌 9단이 이길 확률이 높은 이유는, 알파고가 쓰는 몬테카를로 방법이 바둑에서 빛을 보려면 이세돌9단 같은 일류 프로들과의 경험이 현재보다 훨씬x10000 더 많이 필요하기 때문입니다.
첨부된 사진의 위는 바둑돌을 놓을 수 있는 경우의 수, 아래는 체스의 경우의 수 입니다.
체스같은 경우는 경우의 수가 그리 많지 않기 때문에, 가능한 모든 루트에 대해 말을 반복적으로 놓아보고 그중 가장 높은 승률을 갖는 위치에 말을 놓는 몬테카를로 방법이 빠른 시간내에 최적화가 되어 인간을 압도 했습니다만, 바둑은 이야기가 좀 다릅니다.
놀라지 마세요..
바둑은 돌을 두는 위치에 있어서 "1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000" 가지의 경우수가 있습니다. 이는 우주에 있는 원자의 수보다 많고, 체스와 비교할때 경우의 수가 10의 100제곱 이상 많습니다. (https://brunch.co.kr/@techsuda/17)
때문에 아래와 같은 몇가지 이유로.. 아직은 알파고가 적수가 되지 않는다고 봅니다.
1. 몬테카를로 방법은 애당초 계산 가능한 루트들에 대하여 시행횟수/계산횟수가 더 많아질수록 결과에 대한 신뢰도가 더 정교해지고 함정에서 빠져나올 가능성이 높아집니다. 결국 위에 적은 숫자를 초월하는.. 훨씬 더 많은 계산을 시도해야 한다는것인데 이건 바둑에 적용하기에 멍청한 방법이기도 하고 2의 이유로 "항상 올바른 답"을 주지도 않습니다. 컴퓨팅 파워도 무지막지하게 요구되기 때문에, 현재 컴퓨터로도 다 되는지 모르겠습니다. (몬테카를로 시뮬레이션에 대해선 과거에 쓴 글 (http://clien.net/cs2/bbs/board.php?bo_table=park&wr_id=43175639 을 참조 하시면 될 것 같습니다.)
2. 1을 보완하기 위해, 알파고에는 두 가지 인공지능이 내장되어 있습니다. "정책망(policy network), 가치망(value network)"이 그것이죠. 위의 모든 경우에 수에 대해서 반복 시행을 충분히 많이 해서 결과들이 나왔다고 가정해봅시다. 뽑혀나온 결과는 "최적"이라고 선택되는 돌의 위치가 한곳이 아니라 많은 위치에 동일한 높은 확률 혹은 비슷한 확률로 선정 되어 있을 겁니다. 바둑은 체스나 장기처럼 경우의 수가 적어 쉽게 딱 계산이 떨어지는! 게임이 아니니까요. 그 결과로 뽑혀나온 후보군에는 제대로 된 돌의 위치도 있겠지만 사람들이 두는 대국과는 전혀 다른 엉뚱한 위치도 여럿 섞여 나오게 마련입니다. 순진한 컴퓨터는 이 중 어느것이 좋은 수인지 구분할 수 없습니다. 단지 승률이 높다고 측정되는 결과를 신뢰할 수 밖에 없죠. (전문가들 글을 찾아보니 실제로 과거 바둑 인공지능들이 실패한 이유가 여기에 있습니다.) 그래서 이중에 어떤것이 적합하고/비적합한지 경험에 기반한 인공지능을 통해 추려내는게 알파고에서 말하는 심층신경망/고급트리탐색으로 추정 됩니다. 이 한계를 극복하려면 무수한 경험에 바탕한 학습이 필수적입니다. 물론, 알파고는 사람이 아닌 컴퓨터라 계속해서 쉬지않고 대전을 하고 경험을 쌓고 있긴 합니다.
하지만, 누군가에게 게임 배워보신분들은 다 아시겠지만.. 가장 빠르게 실력을 올리는 방법은 최고의 유저들에게 빌붙어 배우는것이죠. 고수들은 내가 갖고 있는 생각의 한계를 넘어 위에서 보고 있는데, 내가 이 시야에 도달하려면 혼자서는 훨씬 더 많은 시간이 걸리고.. 누군가에게 배운다면, 이왕이면 당대 최고수들에게 배우는게 시간을 엄청나게 절약해주는 경험, 누구나 다 해보셨을겁니다. 하지만, 알파고는 아직 이세돌9단 같은 당대 최고수들과의 대국 경험이 별로 없습니다. (물론, 저는 바둑/인공지능/알파고에 대해 전혀 모르는 남자 사람이라.. 이건 어디까지나 제가 알고 있는 몬테카를로 시뮬레이션 지식에 기반한 추정/상상입니다.)
3. 몬테카를로 방법으로 뽑혀 나오는 최적 바둑돌의 위치는 이세돌9단이 예측 가능한 "정직한 현재 바둑의 정석"의 위치에서 크게 벗어나지 못합니다. 수를 꼬아서 상대를 기만하거나 혼란에 빠트리는 방법은 몬테카를로 시뮬레이션에서 나오는 답과는 정반대의 성향이기 때문이죠. 물론 알파고의 인공지능에는 이러한 부분도 포함 되어 있을겁니다. 다만 경험이 턱 없이 부족할뿐..(전문가들 분석 글을 보니 이 역시 과거 바둑 인공지능들이 갖고 있는 한계 중 하나라고 합니다)
4. 저는 바둑을 잘 모릅니다. 4방향 포위하면 상대 돌을 먹는다는것 밖에는요. 하지만 검색을 통해 찾아본 이세돌9단은 정석을 추구하는 플레이어가 아니라 상대가 예상 못하는 수를 계속해서 던져대는, 상대를 계속해서 난처하게 만드는 플레이를 즐긴다고 하더군요. 3의 이유로 정직한 정석바둑 성향의 알파고에게 이세돌9단은 알파고를 쥐고 흔들 수 있는 현시대에.. 최적화 된 적수라 생각합니다.
원본 글 : http://iamlocked.tistory.com/271
4에 언급한대로 바둑 집짓기 밖에 모르고 본적도 없지만, 이번 대국은 정말 본방으로 꼭 한번 보고 싶네요. 오는 9일이 참 기다려집니다. ㅎㅎ