People are overlooked for variety of biased reasons and perceived flaws. Age, appearance, personality. Bill James and mathematics cut straight through that.
그간 다양한 이유로 많은 선수가 평가절하되었어요. 나이, 외모, 성격. 빌 제임스와 수학 통계가 그런 편견을 깼죠.
영화 <Moneyball>에서 명문대 경제학과 졸업생이 프로야구팀 단장에게 건네는 말이다. 이 영화는 2003년 출판된 마이클 루이스(Michael Lewis)의 책을 영화화한 것이다. 마이클 루이스의 책은 기적 같은 2002시즌의 원동력이 되었던오클랜드 애슬레틱스(Oakland Athletics)의 혁신적인 도전을 다룬다.
야구계를뒤흔든오클랜드의 '머니볼'
오클랜드 애슬레틱스의단장 빌리 빈(Billy Beane)은뉴욕 양키스, 보스턴 레드삭스 등 큰 규모 구단들과 자금력으로 경쟁해서는 이길수없다는 걸 깨닫는다. 2002 시즌을 앞두고 그는 하버드 경제학과 졸업생 폴 디포데스타(Paul DePodesta)와 함께 '머니볼' 이론을 기반으로 팀을 꾸린다. '머니볼'은 기존의 선수 평가 방식이 아닌 새로운 기준으로 야구를재해석한다. 다양한 데이터 분석을 통해 선수의 가치를 철저히 수치화하여 리그에서 저평가받는 '가성비 좋은' 선수를 찾는 방법이다.이렇게빌리빈은 적은 투자로우승 후보 팀을 구성한다. 이런 통계학 접근은 빌 제임스(Bill James)가 제시한 세이버메트릭스(sabermetrics)*를 기반으로 한다.
*컴퓨터를 이용한 야구 데이터 분석법 (출처: 네이버 사전)
영화 <Moneyball>
오클랜드는 리그 30개 팀 중 3번째로 적은 선수단 연봉으로 시즌을 시작한다. 그리고 결과는 아메리칸 리그 서부지구 우승과 아메리칸 리그역사상 최다 연승 기록. 아쉽게도 월드시리즈 우승에는 실패하지만 데이터기반의 '머니볼'이 야구에서 통할 수 있다는 걸 증명한다.그예로 2002 시즌이 끝난 후 보스턴 레드삭스는 비야구인 빌 제임스를 구단으로 데려오고 불과 2년 후 보스턴은 구단 역사상 86년 만에 월드시리즈 우승이라는 쾌거를 이룬다.
'머니볼'을 향한 부정적인 시선
영화 <Moneyball>에서 평생 야구계에서일한스카우트는 얘기한다. "야구는 단순히 통계 분석으로 설명할 수 없다. 야구인의 경험과 직감이 필요하다.지난150년동안야구인은이렇게해왔다." 그리고 빌리 빈 단장은 스카우트에게 이렇게 얘기한다.
Adapt or die
영화에 나오는 스카우트뿐만 아니라 실제로 많은 야구인과 팬들은 야구를 '데이터화' 하는 것에 대하여 거부 반응을 보였다. 야구는 필드에서 하는 경기이지 컴퓨터 앞에 앉아 숫자로 하는 것이 아니라고 얘기한다. 물론, 틀린 말은 아니다. 야구에 대해 모든 걸 데이터로설명할 수는 없다. 그러나 데이터로기존 방식을 대체하려는 것이 아니다. 기존 방식의 문제점을 파악하고 데이터 분석을 통해 문제점을 해결해나가려 하는 것이다. 스카우트가 말하는 경험과 직감에 데이터 분석 결과까지 더해지면 더 완성된 방법으로 선수를 평가하고 경기를 분석할 수 있다. 시대는 변하고 있고 변화를 부정하면 결국 뒤처질 수밖에 없다.
'머니볼'이다른스포츠에서도통할까?
오클랜드의 성공을 통해 '머니볼'이 세상에 소개된뒤로 다양한 스포츠 종목에서 '머니볼' 신화를 재현하고자 노력했다.하지만, 타 스포츠 종목에서는 데이터를이용한선수/경기 분석이 어렵다는 의견이 많다. 그리고 축구는 유독 더 어렵다고 얘기한다. 야구와 타 스포츠의 다른 점은 무엇일까?
1. 야구는 다른 팀 스포츠에 비해 개인 종목 성향이 강하다
축구,농구는한선수의성과는동료의영향을크다.예를 들어 야구의 홈런은 온전히 타자와 투수의 일대일 대결의 결과물인반면축구나 농구에서 득점을 하려면 동료의 도움이 필요하다. 이러한 팀 스포츠 특성 때문에 특정 선수의 성과,경기플레이의연계성을 쉽게 수치화하기 어렵다.
2. 야구는 정지 상황이 많다
정지 상황이 많다는 얘기는 그만큼 플레이 하나, 하나를 끊어서 분석할 수 있다는 얘기다. 그에 비해 시간은 멈추지 않고 공은 계속 굴러가는 축구에서는 변수가 많으며 각 플레이를 데이터로 정의하기어렵다.
이런 이유에도 불구하고 미국에서는 야구 외에 농구, 축구, 아이스하키의데이터분석기술이발전하고있고관련 데이터가 대중화되어가고 있다. 유럽도 마찬가지로 언론에서도 종종 다루고 트위터, 블로그 등을 통해 팬들이 쉽게 접할 수 있다. 야구에서만큼 데이터가 큰 역할을 할 수 없을 수도있지만 하루가다르게데이터관련기술이 발전하는시점에서 타 스포츠 구단들도 점점데이터 분석에 투자를늘리고있는상황이다.
축구, 그리고 숫자
아직 국내 팬들에게 축구 관련 데이터 분석은 생소한개념이다. 물론, 해외축구 팬이라면 어느 정도 데이터 분석 개념을 이해하고 다양한 데이터에 대해 알고 있을 수도 있다. 그러나 아직 국내에선 Opta, WhoScored와 같은 스포츠 데이터 서비스를 찾기 힘들고 언론에서도 기존 데이터 외에는 많이 다루지 않는 것이 현실이다. 골, 어시스트, 패스 성공률 등 단순한 데이터의 문제점은 각 데이터의 문맥과 상황을 알 수 없다는 것이다. 예를 들어 추가 데이터 없이 20골을 넣은 공격수가 18골을 기록한 공격수보다 더 실력 있다고 단정 지을 수 없다.
기존의 단순데이터 외에 선수와 팀을더정확하게 평가할 수 있는 데이터가 다양해졌고앞으로는더많아질것이다. 이 블로그를 통해서 다양하고 더 선진적인 축구 관련 데이터에 대해 다룰 예정이다. 그리고 빅데이터 기술을 통해 새롭게 발굴된데이터는 어떤 것이 있는지 차근차근 소개해보려고 한다.