빅데이터의 가능성과 한계
빅데이터는 우리가 상상하는 것 이상으로 방대한 가능성을 지니고 있습니다. 그래서 빅데이터는 생각보다 우리의 관심사에 자연스럽게 녹아들어 있는 경우가 많습니다. 하지만 빅데이터가 가지고 있는 이 가능성이라는 것을 모르는 사람들이 꽤 많습니다. 이러한 상황 속에서 많은 대중들에게 빅데이터의 가능성을 잘 보여 준 사례로 영화 '머니볼'을 들 수 있습니다. 데이터를 수집하고 그 데이터를 분석해 프로야구 구단의 성적을 끌어올리는 마법 같은 일을 잘 보여주는 영화입니다.
영화 머니볼은 실제로 가능할까?
영화 '머니볼'은 미국 프로야구인 메이저리그의 한 구단에서 새롭게 취임한 빌리라는 단장의 성공기를 다루고 있습니다. 이 빌리라는 단장은 경제학을 전공하여 모든 선수의 능력을 데이터로 분석하고자 합니다. 각 포지션마다 중요한 지표가 무엇일지 생각하고 그 지표(데이터)가 좋고 몸값이 비싸지 않은 선수라면, 인성 등 다른 여타의 요소를 감안하고 과감하게 영입을 시도합니다. 그렇게 꾸려진 외인구단 스타일의 야구단이 미국 메이저리그에서 성공하는 내용을 이 영화 '머니볼'은 담고 있습니다.
다만, 이러한 영화의 줄거리는 다소 현실성이 없다고 느껴질 수도 있습니다. 아무리 데이터가 중요하고 그 데이터가 좋은 선수들을 영입 한다한들 스포츠에서 가장 중요한 팀의 단합력, 선수의 성실함, 슈퍼스타의 영입 등 다양한 요소를 배제하고 정말 성공을 한다는 것이 가능할까요? 한 가지 분명히 말할 수 있는 점은 인공지능을 비롯한 빅데이터는 무궁무진한 가능성을 가지고 있지만 현시점에서는 그 한계 또한 뚜렷이 존재한다는 점입니다. 그래서 빅데이터에 대해 이야기를 할 때는 언제나 희망과 망상이 공존하기도 합니다. 그렇다면 과연 영화 머니볼은 희망적인 이야기로 보아야 할까요 망상의 이야기로 보는 것이 좋을까요? (https://brunch.co.kr/@8d1b089f514b4d5/5)
현실적인 빅데이터의 적용
질문에 대한 답부터 해보자면, 데이터 분석을 전공하고 업으로 삼는 사람의 입장에서 보았을 때 영화 '머니볼'의 이야기는 충분히 현실적이며 실제로 빅데이터의 가능성을 매우 잘 보여주는 사례라고 볼 수 있습니다. 빅데이터 이야기 속에 언제나 양립하는 희망과 망상 중 망상이 될 수 있는 부분은 기가 막히게 제거하고 희망이 될 수 있는 부분은 잘 보여준 사례가 이 영화에서 충분히 드러나고 있기 때문입니다. 즉 야구 분야에 빅데이터를 적용했을 때 실제로 실천 가능한 목표만을 잘 선정하여 적재적소에 데이터를 활용하고 있다고 볼 수 있습니다.
프로야구, 스포츠를 포함하여 어떤 산업에든 빅데이터를 적용할 때 반드시 유념해야 할 사항이 한 가지 있습니다. 바로 빅데이터를 도입하고 적용함으로써 드라마틱한 성과의 상승을 바라거나 마법 같은 기능을 새로이 생성할 것이라는 기대감을 버리는 것입니다. 이를 프로야구에 적용해도 마찬가지입니다. 사실 데이터 상으로 훌륭한 선수를 영입하게 된다면, 리그에서 가장 우수한 선수만을 몽땅 영입하게 될 겁니다. 이는 정말 꿈같은 일이긴 하지만 많은 구단들이 우수한 선수를 모두 영입하는 것을 하기 싫어서 안 하는 것이 아닙니다. 연봉, 포지션, 팀의 화합 등 다양한 요소가 복합적으로 작용하여 단순히 데이터 상으로 성적이 좋은 선수만을 영입하는 것에는 분명 한계가 존재합니다.
부수적인 지표를 포기하고 하나의 지표만을 바라보다.
데이터를 통해 프로야구 선수를 평가하고자 한다면 매우 쉬운 방법이 하나 있습니다. 야구라는 스포츠에 존재하는 모든 지표들을 합쳐 가장 숫자가 높은 선수들을 선별해내면 됩니다. 하지만 이는 앞서 말한 것처럼 현실적인 무리가 따르기 마련입니다. 그래서 영화 '머니볼'에서 단장 빌리는 부수적인 지표들은 모두 포기하고 단 하나의 지표만을 포지션별로 바라보고 있습니다. 예를 들어, 1번 타자의 가장 중요한 점으로는 출루율을 뽑았습니다. 물론 홈런을 많이 치고 타율이 높은 타자가 분명 훌륭한 선수임에는 분명하지만 포지션에 가장 중요한 딱 하나의 지표만을 선정해 그 역할을 가장 잘 수행해낼 수 있는 가성비 선수를 찾아내고자 한 것입니다.
여기에 더해 단장 빌리는 선수의 몸값이라는 지표 역시 주요하게 살펴보았습니다. 다른 측면에서 단점이 있을지언정, 훌륭한 성적(지표)에 비해 분명 몸값이 저렴한 선수가 존재할 것이며 그러한 선수들을 모두 추려낸 것입니다. 영화 '머니볼'에서 빌리 단장이 이렇게 데이터를 성공적으로 적용하는 것에는 큰 배경이 하나 존재합니다. 바로 단장이 야구에 해박한 지식을 가지고 있다는 점입니다. 이를 빅데이터 용어로 풀어쓰자면 훌륭한 도메인 지식을 가지고 있는 사람이라는 것을 의미합니다. 도메인 지식을 바탕으로, 주요하게 살펴야 할 지표를 선정하고 현실적이면서도 과감하게 그 지표만을 보고 선수를 차출하는 것이 바로 '머니볼' 성공의 근간이라 할 수 있습니다.
이제 야구에 데이터를 접목하는 것은 일상이 되었습니다.
영화 '머니볼'의 배경은 1998년입니다. 지금과는 다소 시점의 차이가 존재합니다. 그리고 현재는 사실상 모든 프로야구 구단들이 빅데이터를 활용합니다. 지표를 세분화하여 선수들의 장단점을 명확하게 분석하는 것은 물론 이를 바탕으로 팀에 가장 필요한 선수를 선별하는데 요긴하게 사용합니다. 앞서 말한 1번 타자에게 출루율이 중요하다는 이제는 야구 업계에서 너무나도 당연한 사실이 되었습니다. 데이터를 통해 야구 구단을 운영하는 것이 저 당시에는 획기적인 일일 수 있겠지만 지금 시점에서는 구단 운영에 빅데이터가 자연스럽게 녹아들어 있는 것입니다.
내용을 확장시켜 인공지능 분야로 넓혀봐도 이야기는 마찬가지입니다. 비록, 선수의 훌륭함을 한 번에 지표로 만들거나 예측하기는 힘듭니다. 하지만 앞서 언급한 것과 같이 출루율, 장타율 등 특정 지표만을 현실적으로 목표로 삼아 인공지능을 적용한다면 각 프로야구 선수가 매년 어느 정도의 성적을 낼지 예측하는 것도 불가능한 영역이 아닙니다. 야구선수의 다음 해 성적을 예측할 수 있다는 것은 구단의 운영, 선수와의 연봉 계약 등 활용가치가 어마어마하게 높은 일이 될 수 있습니다. 실제로 같은 내용으로 진행이 되었던 빅데이터 공모전도 있었습니다. (https://dacon.io/competitions/official/62540/overview/description)
스포츠와 빅데이터의 융합 여기서 멈출까요?
인공지능, 빅데이터에 관심이 있는 사람들이라면 누구나 흥미로워하는 주제가 하나 있습니다. 바로 인공지능과 빅데이터가 향후에는 어디에 얼마나 많이 적용이 될지 생각을 해보고 예상을 해보는 것입니다. 이를 이번 사례인 '머니볼'과 프로야구에 적용시켜 보았을 때, 스포츠와 빅데이터의 융합은 이 정도 수준으로 끝난다고 보는 것이 맞을까요? 개인적인 의견이지만 앞으로 빅데이터의 활용성은 더욱 늘어날 것이며 이는 특히 스포츠 분야에서는 더욱 잘 적용되는 말일 것이라 생각합니다. 데이터를 스포츠에 적용시키는 그 방법론이 너무나 많이 발전하고 있기 때문입니다.
비단 야구가 아니더라도 축구, 미식축구 분야에서는 프로선수의 장비에 부착된 센서로부터 데이터를 새롭게 수집하기 시작했습니다. 즉, 선수 개개인마다 특화된 데이터가 수집된다는 것이며 이는 다시 데이터 분석을 진행하거나 인공지능을 적용할 재료가 풍부해진다는 것을 의미합니다. 이전에는 상상하지 못했던 방식으로 스포츠 산업에 데이터가 적용되고 있는 것입니다. 최근 프로야구에서는 인공지능 심판 도입이 뜨거운 감자로 대두되고 있습니다. 심판마저 인공지능이 대체할 수 있는 상황에서, 스포츠와 빅데이터의 융합이 어디까지 발전할 수 있을지 상상의 나래를 펼쳐보는 것도 재밌는 일이 될 것 같습니다.