최근 데이터를 통한 Run Value와 linear weights 계산
오늘은 조금 수학적인 주제를 다룰겁니다.
인생의 모든 순간의 가치가 다르듯이, 야구에서 모든 안타의 가치도 상황에 따라 다릅니다.
9회말 끝내기 안타와 1회초 선두타자 안타는 같은 안타지만 맥락에서 오는 무게감이 다르지요.
하지만 선수를 비교하고, 줄세우기를 하는데 이런 모든 상황을 일일이 계산하는것은 여간 귀찮은 일이 아닙니다.
그래서 우리는, 아니 세이버메트리션들은 "정규화"라는 카드를 꺼내듭니다.
같은 질문을 던졌어요. 선수 비교를 하는데, 홈런은 일괄적으로 x점을 주고, 2루타는 y점, 삼진은 -z점을 주기로 해 본 거죠. 제일 쉬운 예로는 카X포인트가 있겠네요.
하지만 세이버메트리션들은 진짜 수많은 데이터를 토대로, 홈런의, 아웃의 가치를 계산해보고 싶었어요. 어떤 이벤트가 얼마나 많이 나오는지를 보고, 그 이벤트는 총 몇점의 기여를 했는지를 따져보면 이벤트당 평균 득점의 가치가 나올거라는 계산이었어요.
그래서 선조님들의 방법을 그대로 저도 따라해 봤어요. 2021년부터 2025년 6월 15일까지의 약 25만개의 타석을 토대로 계산해 봤어요.
(공식기록과는 아주 미묘한 차이가 있을수 있습니다. 그부분 감안해 주세요.)
아웃은 당연히 점수를 까먹는 행위에요. 하지만 안타의 종류에 따라서 가치가 확실히 다르다는 걸 알 수가 있어요.
음... 홈런에는 4가지 종류가 있어요. 1점, 2점, 3점, 4점홈런이죠. 이 4가지 홈런이 만든 전체 점수를, 전체 홈런수로 나누면 평균 run value가 되는 거에요. 그러니까 야구 카드게임이라고 한다면, '내가 홈런카드를 뽑았어'라고 했을 때, 1.46점을 얻을수 있다고 볼수 있는 거에요.
하지만 우리는 이걸 그대로 쓰지 않아요.
득점 기여행위는 '아웃'이라는 기회비용을 전제로 합니다. 그러므로 각 이벤트의 득점 기여도는 '아웃'의 가치를 기준점으로 하게 됩니다. 아웃의 득점 기여도가 -0.251점 정도이므로(땅볼/뜬공을 모두 합한값), 홈런 1개의 가치는 1.717 점 정도가 됩니다.
이렇게 무사만루, 2사만루, 득점권 비득점권을 고려하지 않은, 순수한 이벤트의 가치만을 따지는 것을 linear weights라고 부릅니다. 여기서 명심해야 할 것은, '고려하지 않는다' 라는 의미를, '특정 맥락에 국한되지 않고 모든 맥락에서 발생한 데이터를 종합하여 평균적인 가치를 도출한다'는 것으로 이해해 주셔야 한다는 점입니다. '무시'가 아니라 '가치중립적'이란 단어가 좀더 어울리겠네요.
그러면 맥락에 따른, 그러니까 득점권(RISP)과 비득점권에서의 장타에 대한 가치는 어떻게 변했을까요?
이 표가 던지는 시사점은 무엇일까요
크게 보자면, '클러치'라는 단어 자체의 가치입니다. 매우 당연하지만, 득점권에서 안타를 치는 것은 득점에 기여하게 되므로 당연히 이벤트의 가치가 높습니다. 득점권에서는 안타, 2루타의 가치가 매우 크게 증가합니다. 그 이유는, 3루타나 홈런은 이미 득점 또는 득점에 가장 가까운 값인 관계로, 증가율이 상대적으로 낮을 수 밖에 없기 때문입니다. 즉, 홈런은 주자가 없어도 최소 1점이라는 매우 높은 실전적 가치를 가집니다. 하지만 주자 없는 상황에서의 단타는 사실 점수와 큰 관련이 없어요. 즉 '득점에서 얼마나 멀리 떨어져 있었느냐'라는 부분이, 득점권에서의 가치 증가율에 영향을 매우 크게 미치게 됩니다.
그럼 이러한 이벤트별 가치는 MLB와는 어떤 차이를 보일까요?
아래는 KBO와 MLB의 알려진 wOBA 가중치 비교표입니다.
이멘트별로 메이저리그에 비해 KBO의 가치가 12~19%정도 낮습니다. 그 이유는
투수의 평균적인 실력 차이: MLB: 세계 최고 수준의 투수들이 많아 타자들이 홈런이나 안타를 치기 매우 어렵습니다. 그래서 힘들게 만들어낸 홈런이나 안타 하나하나가 "와, 저걸 쳤어?" 하는 감탄사와 함께 높은 점수(가중치)를 받습니다. KBO는 MLB에 비해 투수들의 평균적인 구위나 제구력이 상대적으로 약한 편입니다. 그래서 타자들이 MLB만큼 어렵지 않게 안타나 홈런을 만들 수 있고, 이로 인해 개별 안타/홈런의 '가치'가 MLB보다는 조금 낮게 평가됩니다. (가치는 희소성에 의해 결정된다는 점!)
리그 전체의 득점 환경: KBO: 리그 전반적으로 득점이 더 많이 나는 '타고투저(타격이 강하고 투수가 약함)' 성향이 강할 수 있습니다.
득점권 상황의 효율성: MLB: 득점권 기회가 왔을 때, 투수들의 강력함 때문에 안타나 홈런이 나오기 매우 어렵습니다. 그래서 득점권에서 안타나 홈런이 터지면 그 가치가 엄청나게 커집니다. 하지만 KBO에서는 득점권 상황에서도 MLB보다는 안타나 홈런이 나올 확률이 높아, 득점권 상황에서의 '클러치' 타격이 MLB만큼 압도적인 가치를 가지지 않을 수 있습니다. (제공된 데이터에서 홈런의 '상황별 민감도'가 낮은 것도 이와 관련)
가중치 계산의 기준점 (Scaling Factor): wOBA 가중치는 각 리그의 '평균적인' 득점 환경을 반영하여 최종적으로 조정됩니다. KBO는 출루율 자체는 높지만, 위의 이유들로 인해 타격 이벤트 하나하나가 만들어내는 '진정한 득점 가치'가 MLB에 비해 낮게 측정될 수 있습니다. 이렇게 낮게 측정된 각 이벤트의 '기본 득점 가치'에 아무리 높은 출루율 스케일을 적용하더라도, 원천적인 득점 가치가 낮기 때문에 최종적인 wOBA 가중치도 낮아지는 것입니다.
오늘은 여기까지.
https://KBO-ELO.app 이라는 간단한 놀이터를 만들어 두었습니다.
이제 야구단 또는 관계사의 직원은 아니지만, 제가 공부하고 연구한 결과를 보여드리고, 또 여러분이 이러한 놀이터를 통해서 더 많은 흥미를 느끼셨으면 합니다.