brunch

You can make anything
by writing

C.S.Lewis

세이버메트릭스, 오타쿠들이 성공할 수 있는 세계

데이터과학 그리고 세이버메트릭스

Sabermetrics, 세이버메트릭스는 여러가지 수리적 방법론을 동원해 야구라는 스포츠를 쪼개 분해하는 행위를 일컫는 말입니다. 세이버메트리션은 그것을 하는 사람들을 의미합니다. 세이버메트릭스가 주목받게 된 것은 빌리빈의 머니볼이 계기가 되었다고 할 수 있습니다. 예산이 한정적인 소규모 구단인 오클랜드가 머니볼을 도입하면서 좋은 성적을 얻게 되면서 화제를 얻게 됩니다. 그런데 일반적으로 잘 알려지지 않은 사실이 있습니다. 빌리빈의 오른팔인 폴 디포네스타가 LA다저스 단장을 맡게 되면서 구단을 말아먹은 사례가 있다는 것입니다. 오히려 2000년대 중후반 보스턴 레드삭스가 다수의 세이버메트리션들을 기용하면서 우승을 두번이나 했다는 것이 보다 적합한 성공사례가 아닐까 합니다. 하지만 오클랜드의 머니볼 사례가 야구계가 세이버메르릭스를 도입하는 데 중요한 역할을 했음은 부인할 수 없습니다.


                                                 <source = http://www.cs.middlebury.edul>


세이버메트릭스가 비판받는 이유 중 하나는 지나치게 통계와 숫자에 집착한다는 것입니다. 세이버메트릭스에 국한된 비판만은 아닙니다. 통계의 허점은 숫자를 맹신하는 것에 있습니다. 숫자를 이용해 결과를 만들어내는 행위에서 항상 유의해야 할 점이기도 합니다. 스탯 또는 숫자로 나타난 것들은 그것이 실질적인 의미와 어떤 연관관계가 있는지를 고민해야 합니다. 표면에 드러난 것이 근본적인 원인과 관련이 없는 경우도 있습니다. 야구 뿐만은 아닙니다. 축구에서도 세이버메트릭스는 중요할 것입니다. 축구에서 한창 점유율을 부르짖던 시기가 있었습니다. 지난 브라질월드컵의 경기를 분석한 자료를 살펴보면 점유율은 실제 승리와 큰 관계가 없음을 알 수 있습니다. 점유율이 높으면 물론 좋겠지만 그것이 승리에 직접적으로 영향을 주는 것이 아니라면 의미있는 수치가 아니라는 것입니다. 숫자도 이와 같습니다. 의미를 가지는 상관관계를 찾아내는 것이 세이버메트릭스 또는 분석행위의 핵심입니다.


                                                     <source = http://blog.daum.net/zpids>


컴퓨터의 처리속도와 각종 통계 툴의 발달은 데이터의 가공이 좀 더 빠르고 세련되도록 가능하게 해줍니다. 최근에 유행하는 빅데이터의 뜻처럼 쌓인 데이터가 많아서 의미가 있는 것이 아니라 그 처리속도와 컨텍스트에 그 의미가 있을 것입니다. 이전에도 수치가 없었던 것은 아니거든요. 데이터 분석의 가치는 모든 것을 분해해내는 것이 아니라 의미있는 상관관계를 찾아내 해결책을 도모하는 데 있습니다. 그렇기 때문에 그 데이터의 크기가 크다고 해서 반드시 그 확률이 높다고는 볼 수 없습니다. 의미있는 수준의 크기를 가지게 되면 충분히 좋은 결과를 뽑아낼 수 있습니다. 개인적으로는 빅데이터라는 용어의 거품이 곧 걷어질 것이라 생각합니다. 이는 분석의 핵심이 아니기 때문입니다. 관련 업계에서는 빅데이터보다는 데이터 분석 혹은 데이터 과학 같은 용어가 사용되는 빈도가 늘어나고 있습니다. 

    

<source = http://www.popsci.com>


모든 요소를 모두 아우르는 것만이 성공은 아닙니다. 가장 잘할 수 있고 의미있는 것을 찾아 집중하는 것이 오히려 성공이 될 수 있습니다. 커다란 기업이 아닌 스타트업이 일하는 방식이 바로 그렇습니다. 그렇기 때문에 저는 세이버메트릭스가 린스타트업 방식과 비슷한 느낌이 있다고 생각합니다. 고객에 집중하고 빠르게 피드백을 가져가는 순환구조가 특히 그렇습니다. 세이터메트릭스의 주목을 가져온 오클랜드의 사례는 그것을 잘 보여줍니다. 규모가 작기에 성공으로 연결되는 작지만 핵심적인 요소를 찾아내어 그것에 집중했습니다. 세이버메트릭스를 비롯한 수치분석행위가 가져야하는 접근법도 그러해야 합니다. 데이터분석도 마찬가지입니다. 본질로 연결되는 지점을 찾아 집중적으로 분석하고 그 효과를 극대화해야 합니다. 단순히 숫자로의 나열이 아니라 의미있는 컨텍스를 찾아내어야 하는 것입니다.


                                                    <source = http://oanasagile.blogspot.kr>


세이버메트릭스는 데이터과학의 아주 훌륭한 예시이기도 합니다. 통계학보다는 데이터과학에 보다 가깝습니다. 데이터에 큰 비중을 둔다는 것, 프로그래밍 기술을 크게 필요로 하는 것 그리고 광범위한 전문지식을 분석에 접목시켜야 한다는 것이 그렇습니다. 특히 문제해결에 도움이 되는 공식을 만들기 위해 야구지식을 동원해야 합니다. 분석기술만 알아서는 제대로 필요한 시스템을 만들어낼 수 없습니다. 그렇기 때문에 세이버메트릭스는 오타쿠들이 성공할 수 있는 세계이기도 합니다. 실제로 세이버메트리션 중에서는 MBA 출신도 많고 통계학, 컴퓨터과학과 같은 특정분야 전문가들도 많습니다. 


스포츠에서 가장 좋은 것은 선수의 플레이 자체를 보고 요소요소를 정확히 평가하는 것이지만, 그런 경지를 이룰 수 있는 것은 아주 극소수에 불과합니다. 그렇기 때문에 통계를 비롯해 논리적이고 합리적인 데이터분석을 통해 그러한 판단의 효율성을 도울 수가 있고 그러해야 합니다. 그래서 스포츠를 제대로 좋아하는 사람이 그저 관중이 아니라 결과와 관중에 기여하고 전문성을 피력할 수 있는 분야가 세이버메트릭스인 것입니다. 기술의 발달이 가져온 혜택일지도 모르겠습니다. 관중에서 기여자가 될 수 있는. 조금 과장하자면 오픈이노베이션의 적절한 예시가 아닐까 하는 생각도 듭니다.



꿈꾸는 데이터 플레이어

Convergence Business Designer

Facebook.   https://www.facebook.com/keyassist

작가의 이전글 실행의 의미에 관하여
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari