캐글 대회 중 정기적으로 개최되는 대회가 있습니다. 매년 크리스마스에 열리는 산타 대회와 NFL 대회가 대표적입니다.
2020년 산타 대회는 이전 연도들과 다르게 강화학습 문제로 개최되었습니다. (와우!). 20년 6월에 데이콘의 "블럭 장난감 제조 공정 최적화 AI경진대회"에 참가 후 강화학습의 높은 벽을 실감 후 좌절했던 기억이 나네요. 처음부터 다시 시작하는 마음으로 산타 대회에 참가하기로 했습니다.
강화학습 시작을 위해 캐글에서는 kaggle-environments 라이브러리 및 Learming Course를 제공하고 있습니다. kaggle-environments는 OpenAI의 Gym 같은 강화학습에 필요한 환경을 제공하는 라이브러리 입니다. Gym 환경은 학습을 주 목적으로 한다면 kaggle-environments 는 평가에 주안점을 두었다고 합니다. Learming Course는 kaggle-environments 라이브러리를 이용한 환경에서 Connect Four 보드게임을 예제로 강화학습을 배우도록 구성되어있습니다.
그밖에 강화학습의 학습환경으로는 OpenAI의 Gym 환경 등이 있습니다. Gym의 FrozenLake,
CartPole 환경이 예제로 많이 사용되고 있습니다.
다른 예제로는 크롬의 Dino 게임을 강화학습으로 길들이는 예제들도 있습니다. 자세한 내용은 "Chrome Dino 강화학습으로 길들이기"에서 보실수 있습니다.
Learming Course의 Connect Four 보드게임의 규칙에 대해서 알아보겠습니다. Connect Four는 두 명의 플레이어가 번갈아 가며 컬러 디스크를 수직 그리드에 떨어뜨리는 게임입니다. 각 플레이어는 다른 색(일반적으로 빨간색 또는 노란색)을 사용하며, 게임의 목적은 연속해서 디스크 4개를 얻는 첫 번째 플레이어가 승리하는 게임입니다.
다음 시간에는 Connect Four 보드게임 환경을 설정하고 에이전트를 만드는 방법을 배워보도록 하겠습니다.