brunch

타율의 함정

타율은 얼마나 가치있는 지표일까

by 마일스

야구 중계에서 타자를 소개할 때 가장 먼저 나오는 지표가 있습니다. 바로 안타 개수와 타율입니다. 특히 3할 타율은 강한 타자의 상징처럼 여겨지기도 하죠. 특히 2024 시즌 KBO에서는 롯데 자이언츠의 레이예스 선수가 기존에 서건창 선수가 가지고 있던 한 시즌 최다 안타 기록을 갈아치우면서 엄청난 주목을 받기도 했습니다. 자, 그렇다면 여기에서 우리는 근본적인 질문을 던져 보아야 합니다. 타자의 타격 생산성을 평가할 때 타율은 과연 얼마나 가치있는 지표일까요?




두 타자 중 누가 더 가치있는 선수일까

자, 여기 두 선수가 있습니다. 여러분은 이제부터 프로야구 감독입니다. 여기 두 선수 중 여러분은 한 명을 반드시 선택해야만 합니다.

선수 A : 141경기 타율 3할 / 출루율 3할 3푼 8리 / 장타율 4할
선수 B : 153경기 타율 2할 6푼 9리 / 출루율 3할 6푼 6리 / 장타율 5할 4푼 5리


언뜻 보면 3할 타율의 A 선수도 나쁘지 않아 보입니다. 타율이 무려 3푼이 넘게 차이가 나니까요. 위의 성적은 1988년 MLB에서 실제로 뛰었던 두 선수의 기록을 가져온 것입니다. A선수는 선수 시절 내내 크게 주목받지는 못했던 선수인 제럴드 페리, B선수는 커리어 통산 월드시리즈에서 3번의 우승을 차지하고 1988년 내셔널리그 MVP 2위를 차지한 대럴 스트로베리입니다. 같은해 두 선수의 대체선수 대비 승리기여도(WAR)*는 각각 0.7과 5.3이었습니다. 간단히 말해, 1988년 B선수는 A선수보다 4승이 넘는 가치가 있었다는 의미입니다.

* fWAR 기준입니다.


어라, 생각해 보니 좀 이상합니다. 3할 타자의 승리 기여도가 이렇게 낮을 수가 있나요?


머니볼과 세이버메트릭스 혁명

2000년대 초반, 메이저리그에서 가장 가난한 구단 중 하나인 오클랜드 애슬레틱스는 돌풍의 팀이 되었습니다. 2002년에는 아메리칸리그 최다 연승 기록인 20연승을 기록하고 2003년에는 아메리칸리그 서부지구 우승을 차지했죠. 그 해에 갑자기 오클랜드에 유망주가 쏟아져 나왔던 것도, 오클랜드에 돈이 많아졌던 것도 아닙니다. 오클랜드의 단장 빌리 빈은 그 당시 스카우터들이 중요하게 생각하던 선수들의 운동능력이나 타율과 같은 지표를 과감하게 배제하고, 당시 저평가된 지표였던 출루율이 높은 선수들을 저렴하게 영입하는 전략을 구사했습니다. 이유는 단순했습니다. 데이터가 그렇게 말하고 있었기 때문입니다.


사람들은 이런 빌리 빈의 저비용 고효율 전략을 '머니볼'이라고 불렀고, 메이저리그 팀들은 하나둘씩 전문 데이터 분석가들을 중용하기 시작했습니다. 이전의 지표에서 진보한 통계적 데이터를 기반으로 선수들의 가치를 평가하는 이른바 '세이버메트릭스 혁명'입니다.

%EB%A8%B8%EB%8B%88%EB%B3%BC_%EC%98%81%ED%99%94.jpg 생각하시는 이 머니볼 맞습니다


타자를 평가하는 다양한 지표들

과거에는 보통 5툴(5-tools)이라는 지표로 타자를 평가했습니다. 파워, 스피드, 컨택, 수비, 송구입니다. 파워는 홈런이, 스피드는 도루 개수가, 컨택은 타율이, 수비와 송구는 '수비율'이라는 지표가 대신했습니다. 하지만 세이버메트릭스 시대가 도래하면서 이 지표들만으로 타자의 능력을 완전히 대변할 수는 없다는 사실이 드러났습니다.


1. 타율의 함정, 그리고 출루율과 장타율

타율은 직관적입니다. 타자가 전체 타수*에서 몇 번 안타를 쳤는지만 알면 됩니다. 안타는 선수가 직접 공을 때려서 출루한 기록이기 때문에 마치 순수한 타자의 능력인 것처럼 느껴지기도 합니다. 하지만 타율은 아래 2가지의 질문에 전혀 올바른 답을 주지 못합니다.

1) 단타와 2루타, 3루타, 홈런은 모두 같은 가치를 가지나요?
2) 볼넷과 몸맞는공을 통한 출루는 어떻게 가치를 평가하나요?

* 타수 : 전체 타석에서 사사구와 희생타, 실책 등을 뺀 수치입니다. 헷갈리죠? 당연한 말이지만, 몰라도 경기를 보는 데에는 문제가 없습니다.


그렇습니다. 타율은 타자가 단순히 얼마나 안타 자체를 잘 쳐내는지만 나타낼 수 있을 뿐, 실질적인 공격의 생산성이라는 측면에서 바라보았을 때 자칫 잘못하면 완전히 왜곡된 결과가 나올 수도 있습니다. 실제로 MLB 기준 타율과 팀 득점과의 상관계수는 0.75 정도로 그다지 높은 편이 아닙니다.

Ichiro6.gif.opt_medium.gif 물론 이치로처럼 대부분의 출루를 안타로 만드는 선수도 있습니다


그래서 사람들은 출루율과 장타율이라는 지표를 추가로 활용했습니다. 출루율은 전체 타석에서 어떤 방법으로든(안타든 볼넷이든 몸맞는공이든) 주자로 살아 나갈 확률입니다. 타율이 무시하던 사사구를 반영한다는 점에서 사실상 타율의 상위호환 지표에 가깝습니다. 하지만 출루율 또한 장타의 가치를 나타낼 수는 없다는 한계가 있었죠. 장타율은 이런 출루율의 한계를 보완한 지표입니다. 타수당 몇 개의 베이스를 갈 수 있는지, 다소 의역하면 이번 타수에서 타자가 몇 루타를 칠 수 있는지에 대한 확률입니다.

SSC_20241105142932.jpg 타율에 비해 출루율과 장타율이 높은 선수로는 대표적으로 최정이 있습니다


2. 그래서 뭐가 완벽한 지표인데요

출루율과 장타율만 해도 타율에 비해 꽤 신뢰도가 높은 지표이기는 하지만, 결국 하나의 지표만 가지고서 타자의 모든 능력을 대변할 수는 없었습니다. 그래서 세이버메트릭스를 다루는 데이터 분석가들(세이버메트리션이라고 부르기도 합니다)은 다양한 경기 기록들과 야구장별, 연도별 가중치까지 조합해서 지금도 새로운 지표를 만들어내고 있습니다. 이른바 wRC+, wOBA와 같은 지표들이 그것이죠. 하지만 이런 지표에는 치명적인 단점이 하나 있었는데, 바로 대체 이 지표가 어떤 계산을 통해 나온 숫자인지 일반인의 입장에서는 도저히 이해할 방법이 없다는 것이었습니다.

wRC-Flash-Card-7-19-15-e1437317254601.png 현시점 가장 정확도가 높은 공격 지표중 하나인 wRC+의 계산식입니다. 물론 전 계산 못하지만요..


그럼 현대 야구에서 현실적으로 가장 신뢰도가 높고 이해하기 쉬운 지표는 대체 뭘까요? 여기 OPS라는, 정말 이상한 지표가 하나 있습니다. OPS는 아주 단순한 계산으로 나오는 지표인데, 출루율과 장타율을 그냥 더하기만 하면 됩니다. 통계적으로는 아무 의미도 없는 숫자지만, 놀랍게도 대표적인 세이버메트릭스 공격 지표들과 비교해도 정확도가 크게 떨어지지 않을 정도로 신뢰도가 높습니다. 물론 엄밀히 따지면 가장 정확하다고 볼 수는 없지만, 직관성과 신뢰도를 모두 고려하면 개인적으로 OPS만큼 쉽게 타자의 공격력을 가늠할 수 있는 지표가 또 있을까 싶을 정도로 정확합니다.

figure2.jpg 키스 로의 저서 '스마트 베이스볼'에서 계산한 타율, 출루율, 장타율, OPS와 팀 점수 간의 상관계수


숫자는 거짓말을 하지 않는다

야구를 보다 보면 가끔 엄청난 임팩트를 보여 주는 선수들이 있습니다. 컨택 능력이 좋고 발이 빨라서 화려한 선수이거나, 단기전에 특히 강한 선수들이 보통 그렇습니다. 그런데 막상 전체 데이터를 보면 생각보다 기록이 저조한 경우들이 왕왕 있습니다. 우리가 실제로 경기에서 보는 선수들의 모습은 수백 개의 타석 중에서 표본 하나를 실시간으로 보고 있는 것과 비슷하기 때문입니다.


물론 한 경기, 그리고 단기전에서는 어떤 변수라도 일어날 수 있습니다. 대표적으로 포스트시즌이 그렇습니다. 그래서 가끔은 데이터가 크게 의미가 없다는 생각이 들 수도 있어요. 하지만 야구는 긴 시즌을 치러야 하는 스포츠입니다. 숫자는 거짓말을 하지 않죠. 특히나 야구는 '기록의 스포츠'라고 부를 정도로 다양한 데이터들을 수집해서 활용하고 있는 만큼, 이 데이터들을 하나씩 살펴보면서 내가 보지 못했던 변수들을 찾아 선수의 가치를 평가하고 경기를 예측하는 것 또한 야구의 재미 중 하나입니다.

maxresdefault.jpg 폼은 일시적일 수 있지만, 클래스는 영원합니다


keyword
수요일 연재