brunch

You can make anything
by writing

C.S.Lewis

by 조우성 변호사 Dec 30. 2023

(45) 알파고와 알파고 제로. 강화학습


[문돌이의 AI] (45) 알파고와 알파고 제로. 강화학습



#1


2016년 3월, 구글 자회사 딥마인드가 개발한 알파고는 한국의 바둑 최고수 이세돌 9단을 이기며 전 세계를 놀라게 했다. 이건 단순한 승리가 아니라, 인공지능이 사람의 지능을 넘어설 수 있다는 증거이자, 인류 기술의 새 경계를 여는 계기가 되었다. 그리고 이 충격적인 사건은 '알파고 리'라는 이름으로 기록되었다.



#2


2017년 5월, 알파고는 더 강해져서 중국의 커제 9단을 3대 0으로 이겼다. 이때의 알파고를 ‘알파고 마스터'라 부른다. 이 승리는 인공지능이 계속 발전하고, 놀라운 학습 능력을 가지고 있다는 것을 보여줬다.



#3


하지만 진짜 놀라운 변화는 '알파고 제로'의 등장이다. 알파고 제로는 과학 잡지 '네이처'를 통해 알려졌는데, 기존 알파고들과 달리 ‘스스로 바둑을 배우는 방식’이다. 알파고 리와 알파고 마스터가 사람이 만든 바둑 지식을 학습한 것이라면, 알파고 제로는 바둑의 기본 규칙만 알고 스스로 게임을 하면서 배웠다. 그 결과, 알파고 리를 100대 0, 알파고 마스터를 89대 11로 이겼다.



#4


알파고 제로에는 '강화학습 시스템'이 적용되어 있다. 이는 생물의 뇌처럼 스스로 시행착오를 겪으며 배우는 방식이다. 즉, 알파고 제로는 사람의 도움 없이 스스로 게임을 하며 실력을 키웠다. 그 결과, 알파고 제로는 단 사흘 동안 490만 번의 게임을 하고 나서 알파고 리와의 100판 대결에서 모두 이겼고, 40일 동안 2,900만 번의 게임 뒤에는 알파고 마스터를 거의 다 이겼다. 딥마인드는 알파고 제로가 3시간 만에 바둑 초보자처럼 되고, 19시간 만에 바둑의 중요한 원리를 이해하며, 70시간 만에 인간 바둑 기사 수준이 되었다고 밝혔다.



#5


알파고 제로의 등장은 인공지능이 더 넓은 범위에서 활용될 수 있다는 기대를 주지만, 동시에 위험성에 대한 걱정도 주었다. 알파고 제로는 사람의 바둑 지식 없이 스스로 바둑의 원리를 이해하고 이기는 길을 찾았다는 점에서 사람의 통제를 넘어섰다고 평가되지만, 그래서 사람보다 더 우월하고 독립적인 존재가 될까 봐 두렵다는 의견도 있다.

















태그


매거진의 이전글 (44) chat GPT 4.0으로 사업보고서 분석하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari