파크팩터를 통해 다시 그려본 한국 야구장의 규격도
저는 삼성라이온즈의 팬이자, 삼성라이온즈의 홈경기에서 라디오 해설을 하는 해설자이기도 합니다.
대구구장, '라팍'은 홈런이 많이 나오기로 유명합니다. 야구장의 특이한 구조에서 기인하는 것인데요, 좌우중간의 짧은 거리로 인해 다른 구장에서 나오지 않는 짧은 플라이의 홈런이 많이 생산됩니다. 이걸 보통 '라팍런'이라고 부릅니다.
세이버메트리션들은 이러한 '특정 구장의 효과'를 계산하기 위해서 가상의 중립구장을 두고 어떤 구장에서 홈런이, 1루타가, 2루타 3루타가 얼마나 더 나오는지를 알아보기 위해 '파크 팩터'라는 지수를 만들었습니다. 중립구장이 100이라고 할때, 홈런 팩터가 120이면 중립구장에 비해 홈런이 20% 더 많이 생산되었다 라고 해석할수 있는것이죠.
여기서 잠깐! 파크팩터는 대표적인 '후행 지표'입니다. 즉, 이미 일어난 일을 통계로 만들어서 '지금까지 이러한 결과가 있었다'라는 의미를 담은 것이지요. 지금까지 라팍에서 홈런이 많이 나왔기 때문에 라팍의 지수가 높을 것이고, 잠실은 홈런이 잘 나오지 않았으니 지수가 낮을 것이다 라는 정도의 예상은 할 수 있습니다. 하지만 만약 괴력의 타자가 엘지/두산에서 등장하여 구장 크기를 무시하고 홈런을 뻥뻥 쳐대기 시작하면 팩터에도 약간의 변화가 생길 수 있습니다. 물론 샘플이 커질수록 이러한 '편향 효과'는 아주 미미해지기 때문에 파크팩터를 예측 기반 자료로 활용할 수도 있습니다만, 파크팩터가 원래 어떠한 타입의 지표인지는 반드시 기억해 두셔야 지표의 해석에 있어 혼란이 줄어들 수 있습니다.
그렇다면 '라팍'과 '잠실'의 파크팩터는 어떠했을까요?
잠실 : 전체 파크팩터 95.1 / 홈런팩터 69.5
라팍 : 전체 파크팩터 109.6 / 홈런팩터 145.3
라팍은 잠실보다 홈런이 2배 이상 더 많이 나오는 극단적 타자친화 구장 입니다. 전에 파크팩터를 통해 해석할 수 있는 것은, 라팍은 잠실보다 득점이 15%가량 더 많이 나온다고 볼 수 있겠습니다. 그만큼 투수에게는 매우 불리한 구장이기도 합니다.
그렇다면 좌/우타자별 스플릿 데이터는 어땠을까요?
잠실 : 좌타자 홈런팩터 60 / 우타자 홈런팩터 79
라팍 : 좌타자 홈런팩터 131 / 우타자 홈런팩터 160
이러한 지표를 볼 때, 파크팩터가 '후행 지표'라는 것을 염두에 두어야 한다는 것입니다. 삼성, 두산, LG에는 강한 좌타자들이 많지만, 실제로 우리가 기억하지 못하는 우타자들의 홈런이 더 많이 나왔을 수 있습니다. 그래서 두 구장 모두 우타자의 홈런팩터가 상대적으로 높을 수 있습니다.
좌우 타자별 파크팩터까지 계산해 보고 나니, 문득 궁금해졌습니다.
파크팩터로 선수들이 느끼는 '구장의 심리적 크기'를 그려볼수 있지 않을까
전체 팩터가 있고, 좌우타자별 스플릿 데이터가 있으니, 우타자의 팩터를 가지고 구장 좌측 담장의 거리를 조정하고, 좌타자의 팩터를 가지고 우측 담장의 거리를 조절하는 식으로 구장의 '심리적 모양'을 그려보려고 했습니다. 그래서 그 초기 버전을 만들어 낸게 아래와 같은 그림입니다. (3루타 팩터는 모든 구장에서 비정상적으로 높습니다. 이유는 3루타 자체의 샘플수가 적기 때문에 가중치 계산에서 매우 극단적인 값들이 나오는 것입니다. 그래서 3루타의 팩터는 구장을 그리는 요소에서는 제외했습니다) 오늘 글에서는 2025시즌의 파크팩터로만 계산을 진행했기 때문에, 여러분이 기존에 알고있던 이미지의 구장 사이즈와는 전혀 다른 그림이 나올수도 있습니다. 다시한번 밝히지만 아래의 그림들은 '이미 나온 홈런수, 2루타 개수'를 토대로 그린 것이기 때문에 경기가 진행됨에 따라 계속 변할수 있습니다. (한경기에 홈런이 10개씩 터져나오기 시작하면 팩터가 휙휙 변할수 있다는 뜻입니다.)
실제 팩터가 아니라 가상의 팩터를 입력해서 그려봤더니, 꽤나 그럴싸한 모양이 나왔습니다. 그래서 계산을 가다듬고, 9개 구장의 실제 모양을 그려보기로 했습니다.
계산식을 아주 간단히 설명하자면 아래 그림과 같습니다.
타격분포를 모델링하고, 좌우타자의 팩터를 모델링 수치 기반 가중치로 입력해서 좌우, 좌우중간, 센터의 거리를 계산한 후, 구장의 모양을 그려냅니다. 표준 야구장의 크기를 101-113-122-113-101미터로 두고, 팩터에 따라 크기를 조정했습니다.
그래서 라팍과 잠실을 파크팩터 기준으로 크기를 그려보면 어떤 모양이냐? 라는 게 가장 궁금하셨을 겁니다.
실제 잠실과 라팍을, 선수들이 느낄만한 심리적 크기로 그려보면 위 그림과 같아집니다. 라팍은 좌측과 우측이 90미터 수준으로 확 줄어들고, 그에 비례하여 구장 크기가 많이 작아집니다. 타구장의 2루타성 플라이볼이 상당량 홈런으로 치환되므로, 상대적으로 2루타 팩터는 낮은 편입니다(107)
그럼 새로지은 대전 구장과 고척은 어떻게 그려졌을까요?
고척 또한 상당히 투수 친화적인 구장인 것으로 계산되었습니다. 대전은 초반에는 어느정도 중립적 팩터를 지켰었는데 어느정도 경기가 더 진행된 시점에서 보니 타자 친화적인 구장으로 팩터가 조금씩 변화하고 있습니다. 그렇다 하더라도, 대전은 점선과 매우 유사한 형태의 구장 모양을 보여준다는 점에서 꽤나 중립적인 구장이라고 볼 수 있겠습니다.
빛고을 챔필은 라팍과는 조금 성격이 다릅니다. 3루타의 요소를 논외로 하면, 챔필은 파크팩터계의 스위스 같은 곳입니다. 지표들이 100에 가까운 값을 보이고 있습니다. 그래서 위 그림과 같이 회색 점선(중립구장)의 크기로 그려집니다. 하지만 우타자보다는 좌타자의 홈런 팩터가 좀더 낮아, 우측담장이 좀더 멀게 그려져 있습니다.
엔팍은 올해 데이터가 좀 많이 부족합니다. 예년대로라면, 엔팍은 이 수치보다는 훨신 타자친화적인 구장이니다. 하지만 파크팩터라는 지표가 '후행적'이기 때문에, 이호준감독이 계속 뛰는야구를 고집한다면 홈런 팩터가 그리 드라마틱하게 상승할 가능성은 높지 않을것 같습니다.
위즈파크도 꽤나 중립적인 구장입니다. 아마 로하스가 작년정도의 페이스를 보여줬다면 안현민의 존재감과 더불어 지금보다는 더욱 타자친화적인 수치가 나왔을 지도 모르겠습니다. 일단 현재 시점(25년 7월 5일)에서는 눈에 띄는 포인트가 있는 구장은 아닙니다.
부산갈매기의 집은 실제로 큽니다. 좌우 끝단이 103-106미터일 정도로 홈런을 치기는 쉽지 않습니다. 2루타 팩터도 높은 편이라, 좌우중간 거리또한 뒤로 조금씩 밀려있는 형태입니다.
문학구장에 대한 해석은 너무 어렵습니다. 일단 문학을 홈으로 쓰는 구단의 올시즌 타격지표가 리그 밑바닥인 상태에서, 투수진의 퍼포먼스는 매우 훌륭합니다. 이 두가지 요소가 겹쳐지면서 대부분의 타격 팩터가 매우 낮은 값을 보여줍니다. 그래서 올시즌 문학구장은 역사적 인식-_-과는 다르게 매우 투수친화적인 면모를 보여줍니다. 올시즌 문학은 심리적 거리로만 볼때 잠실 또는 사직에 버금가는 상황이라고 볼 수도 있겠습니다.
기록을 숫자로 보기 보다는 좀더 와닿는 컨텐츠를 만들어 보려고 했습니다. 분명 이 글을 끝까지 읽어주신 여러분의 생각과는 많이 달랐을 수도 있습니다. 실제로 제가 몇번이나 검증한 계산식과 모델링이 잘못되었을 수도 있고, 가져온 데이터가 100% 리그 공식기록과 일치하지 않을 수도 있다보니 생길 수 있는 일들이라고 생각합니다.
저는 숫자를 다루고, 데이터를 해석하는 일을 했지만, 팬 여러분이 꼭 그럴 필요는 없다고 생각합니다. 그래서 재미없는 세이버메트릭스를 좀더 친근한 형태로(대부분 그림) 표현해보려고 고민을 많이 하고 있습니다.
좋은 아이디어가 있으면 댓글로 남겨주세요.
읽어주셔서 감사합니다.