인공지능 바둑의 실력을 알고 싶다

인공지능과 바둑 (1):

by 이재형

지금으로부터 9년 전, 구글 딥마인드(DeepMind)가 개발한 인공지능 바둑 프로그램 ‘알파고(AlphaGo)’가 세계 최강 기사 이세돌을 4대 1로 꺾으며 전 세계에 충격을 안겼다. 체스에서는 이미 오래전에 인공지능이 인간을 넘어섰지만, 경우의 수가 사실상 무한에 가까운 바둑의 특성상 AI가 인간을 이기는 것은 오랫동안 불가능에 가깝다고 여겨져 왔다.


딥마인드는 알파고의 전체 소스 코드를 공개하지는 않았지만, 핵심 알고리즘과 학습 원리를 논문으로 발표했다. 이를 바탕으로 세계 각국에서 수많은 인공지능 바둑 프로그램이 개발되었고, 현재까지 의미 있는 수준에 도달한 프로그램만도 100개 이상으로 추정된다. 이들 대부분은 이미 인간 최고수의 기력을 훨씬 뛰어넘는 실력을 갖추고 있다. 한때는 AI 간의 대결을 겨루는 인공지능 바둑 대회도 활발히 열렸으나, 최근에는 관심이 줄어들며 관련 소식을 접하기 어렵다.


그렇다면 지금까지 등장한 수많은 인공지능 바둑 프로그램 중, 과연 어떤 것이 가장 강할까? 이 물음에 대한 해답을 찾기 위해 챗GPT와 제미나이 등 대표적인 언어형 AI와 인터뷰를 진행했고, 그 내용을 정리해보았다.

우선 챗GPT와 같은 언어형 인공지능과 알파고와 같은 바둑 특화 AI는 학습 구조에서 본질적인 차이를 가진다. 챗GPT는 사전 학습된 모델로, 사용자가 아무리 많이 대화를 나눠도 스스로 성능이 향상되지는 않는다. 반면 알파고는 수천만 번의 자가 대국을 반복하는 자기 학습(self-play) 방식을 통해 기력을 끊임없이 발전시킨다. 즉, 알파고는 스스로 강화 학습을 거듭하며 점점 더 강해지는 구조다.


알파고는 대략 다음과 같은 5가지 주요 버전으로 구분된다. 각 버전의 특징과 실력은 다음과 같다.

• 알파고 판(Fan): 초기 버전. 중국 프로기사 판후이와의 대국에서 5:0 승리. Elo 약 3,300

• 알파고 리(Lee): 이세돌과의 5번기에서 4:1 승. Elo 약 3,500

• 알파고 마스터(Master): 커제와의 대국에서 3:0 승. 알파고 리와의 비공식 대국에서는 100전 전승. Elo 약 4,500

• 알파고 제로(Zero): 마스터와의 대국에서 89승 11패. Elo 약 5,200

• 알파제로(AlphaZero): 바둑, 체스, 쇼기 등을 동시에 학습한 범용 AI. Elo 약 5,300

(주: Elo 레이팅은 바둑, 체스, 스타크래프트 등 1대1 게임에서 상대적 기력을 수치화해 비교하는 방식으로, 현재 바둑의 국내·국제 랭킹 시스템에서도 활용된다.)


이 중 '판', '리', '마스터'는 인간의 기보와 자기 학습을 병행해 실력을 높였지만, '알파고 제로'와 '알파제로'는 바둑의 기본 규칙만 주어진 상태에서 인간 기보 없이 수천만 번의 자기 대국을 통해 실력을 쌓았다. 알파고 제로는 약 40일간 4천만 판의 바둑을 둔 것으로 알려져 있다.

이쯤에서 자연스럽게 드는 의문이 있다. “이들 알파고 버전 간의 실력 차이는 실제로 얼마나 될까?”


예를 들어, 알파고 마스터는 리 버전을 상대로 100전 전승을 거두었고, 제로는 마스터에게 100판 중 89승을 거두었다. 전적만 놓고 보면 압도적인 차이지만, 이를 바둑의 ‘집 수’(실력의 계량 단위)로 환산한다면 실제 격차는 얼마나 될까?


개인적으로는, 실력 차이가 아무리 크더라도 집 수로 따지면 그 격차는 극히 미미할 것이라 생각해왔다. 고수 간의 대국은 아주 작은 차이에서 승패가 갈린다. 예를 들어, 정상급 프로기사에게 덤을 단 1집만 더 줘도 승률이 크게 바뀐다. 반면, 아마추어 기력에서는 그런 차이가 크게 작용하지 않는다. 나의 경우, 대국에서 실질적인 차이를 만들려면 적어도 서너 집 이상의 핸디캡이 필요하다. 기력이 더 낮은 대국자 간에는 그보다 더 큰 차이가 있어야 승부에 영향을 준다.


하지만 알파고 각 버전은 이미 인간을 한참 앞선 ‘신(神)의 영역’에 있다. 이처럼 극한의 수준에서는 단 몇 집의 차이조차 승패를 가르는 결정적 요소가 될 수 있다. 그런 점에서 마스터와 리의 100:0 전적, 제로와 마스터의 89:11 전적도 실제로는 1~2집 차이만으로도 결미과가 달라질 수 있는 수준일지 모른다.


이러한 가정을 바탕으로 챗GPT와 제미나이에게 심층 질문을 던지며 인터뷰를 진행했다.

그런데, 그들의 대답은 내 예상과는 사뭇 달랐다.

(계속)


※ 이 글은 <월간 바둑> 2025년 10월호에 실린 필자의 컬럼이다.