통계학의 관점에서 바라 본 야구 선수의 성적
야구 선수의 실력은 돈이다. 메이저리그 구단들은 좋은 성적을 기록한 선수들에게 1년에 400억에 달하는 거금을 쏟아부을 준비가 되어 있으며, 10년 동안 그들의 계약을 보장해 줄 용의도 있다. 이처럼 야구는 특출 난 선수 몇 명이 이끌어가는 스포츠라고 해도 과언이 아닐 정도로 좋은 실력을 가진 선수는 확실하게 대접받는다.
하지만 어제의 스타플레이어가 내년에도 좋은 성적을 기록하리란 보장을 하기는 어렵다. 왜냐하면 성적은 그 자체가 실력은 아니기 때문이다. 실력이라는 본질이 투영된 현상이 성적일 뿐이다. 물론, 이 둘은 높은 상관관계를 가질 것이다. 성적이 좋은 선수는 야구 실력이 좋다고 추정할 수 있는 충분한 근거(성적)가 있다. 하지만 어떤 하나의 지표로 뚜렷하게 표현할 수 없는 선수의 실력은 성적과는 무언가 다르다. 전 세계 야구 천재들이 모인 메이저리그에는 한 해 반짝하고 마이너리그 혹은 아시아리그를 전전하는 선수들이 많아도 너무 많다. 그렇기 때문에 메이저리그 구단들은 내년에도 믿을만한 선수에게 큰 거금을 쓰고, 이들을 걸러낼 만한 방법을 강구하기 위해 어느 스포츠보다 힘을 쏟는다. 구단이 행하는 방법은 크게 두 가지로 나뉜다. 바로 지속가능성과 실력 추정이다.
이 방법들은 통계학 관점에서 이야기할 수 있다. 지속가능성은 바로 분산($\sigma$)이다. 이를 조금 풀어서 이야기하면, ‘어떤 선수가 기록할 것으로 예측되는 성적의 범위’ 정도로 이야기할 수 있다. 그리고 실력 추정은 평균($\mu$)다. 여기서 평균은 표본 평균을 의미하는 것이 아니라 모평균을 의미한다. 그리고 평균의 주체는 성적이 아니라 실력이다. 통계가 과거의 데이터로 미래의 값을 추정되는데 활용되는 것처럼 평균(실력 추정)은 높을수록, 분산(지속가능성)은 낮을수록 이전 데이터에 대한 신뢰도가 높아져 좋은 평가를 받는다.
많은 구단과 팬들은 분산을 줄이는 방법으로 선수들을 평가한다. FA 시장에 나오는 선수들은 대개 6~7년의 프로 레벨 성적 레퍼런스가 존재한다. 이 성적이 꾸준하게 좋거나, 뚜렷한 성장세를 기록한 선수들은 구단들이 의심하지 않고 돈다발을 들고 찾아온다. 그리고 이런 선수들에 대한 팬들의 평가도 후한 편이다. 당장 내년에 어느 정도 성적을 기록할 것인지 가늠이 가고 시즌 구상이 가능하기 때문이다. 좋은 성적을 꾸준히 기록했다는 점에서 그 좋은 성적이 함의하는 좋은 실력(평균)이 예측 가능하고 지속 가능하다고 판단할 수 있다.
하지만 이런 방법을 모든 구단들이 사용할 수 있는 것은 아니다. 지속가능성이 높은 선수일수록 시장에서 높은 평가를 받기 마련이다. 이들은 400억 달러의 계약을 맺을 수 있는 선수들로 그 메이저리그 안에서도 이러한 선수를 살 수 있는 구단은 한정적이다. 기껏해야 뉴욕, LA, 시카고, 샌프란시스코와 같은 빅마켓을 등에 업은 구단들만이 이들을 살 수 있다.
다행히도 메이저리그는 이들만을 위한 리그는 아니다. 이따금씩 캔자스시티, 템파베이, 클리블랜드와 같은 팀들이 좋은 성적을 기록하는 리그가 바로 메이저리그다. 이들은 앞서 말한 빅마켓 구단과는 거리가 먼 스몰 마켓 구단들이다. 이들은 리스크가 낮고 몸값이 비싼 선수들은 이미 구할 수가 없다. 대신에 차선책을 택하는데, 바로 실력을 추정하는 것이다.
앞서 말했듯이, 실력은 성적의 잠재 변수다. 실력은 여러 변수들로 추정할 수 있다. 물론, 직전 성적은 실력을 판단할 수 있는 가장 좋은 변수 중에 하나다. 하지만 지난 시즌 좋은 성적은 이미 지속가능성 측면에서 다뤄졌고 선수들의 몸값을 높이는 가장 중요한 요소이기도하다. 그래서 진흙 속 진주를 찾고자 하는 실력 추정에선 지난 성적이 아닌 다른 것들을 다뤄야 한다. 조금 더 마이너하고 고리타분한 숫자 놀음 말이다. Barrel 타구가 대표적이다. 배럴 타구는 타율 0.500, 장타율 1.500 이상을 생산하는 타구들의 범위를 의미한다. 보통 98 mph 이상의 빠른 속도와 26~30도에 달하는 발사 각도를 갖추면 배럴 타구로 정의된다.
배럴 타구를 많이 날린다는 의미는 좋은 타구를 많이 만들어낸다는 의미다. 그러나 좋은 타구와 안타와는 조금 안 맞는 구석이 있다. 야구는 수비 범위가 딱 지정되어 있는 것이 아니라 상황에 따라, 선수에 따라, 수비 성향에 따라 조금씩 달리 배치된다. 즉, 같은 타구라도 수비 위치에 따라 다른 결과로 이어질 수 있다. 하지만 이런 불운이 평생 따라다니지는 않는다. 불운이 있으면, 행운도 찾아오는 법이다. 이처럼 모든 데이터는 평균으로 회귀하게 되는데 만약 배럴 타구를 꾸준히 생산해내는 타자라면, 지금 당장 성적이 낮더라도 언젠가는 좋은 성적으로 회귀할 것이라고 추정할 수 있다.
배럴 타구는 이미 국내외 야구 커뮤니티에서 많이 다뤄진 실력 추정 방법으로 배럴 타구를 많이 생산하는 선수들은 이미 좋은 대우를 받고 있다. 하지만 핵심은 누군가는 배럴 타구라는 개념을 처음으로 채택해 몇 년간 저렴한 가격으로 좋은 선수들을 수급했다는 점이다. 스몰 마켓 구단인 오클랜드와 템파베이는 믿음직한 스타급 플레이어를 살 수 없다. 그래서 항상 실력을 가장 잘 추정할 수 있는 방법들을 강구한다. 배럴 타구도, FIP도, BABIP도 모두 이러한 상황 속에서 태어난 지표로 현대 야구팬들에게는 타점, 승수보다 더 높은 평가를 받고 있다.
이처럼 우리가 보는 것(성적)이 실제로는 우리가 원하는 것(실력)을 잘 담아내지 않을 때가 있다. 야구의 여러 지표도 이러한 수많은 고민 끝에 나온 결론이며, 지금 이 순간에도 이 간극을 좁히는 어떤 방법론을 가지고 선수들을 수급하고 있는 팀들이 있다. FA 시장에서도, 국제 유망주 시장에서도, MLB 파이프라인에서도 엘리트 선수를 차지하기 위한 구단들의 노력은 계속된다.