세 가지 성공의 길

Power vs Command vs Balanced

by randahlia

성공은 한 가지가 아니다


6편에서 충격적인 사실을 밝혔다. 시퀀싱은 성공과 실패를 가르지 않는다. 진짜 중요한 건 삼진률(K%)이다. Odds Ratio 7.12. 평균보다 조금만 더 좋아도 성공 확률이 7배 뛴다.

그런데 여기서 의문이 생겼다. 삼진을 많이 잡지 못하는데도 성공한 투수가 있다. 후라도가 대표적이다. K% 17.4%로 리그 평균 수준이지만, WAR 5.6을 기록했다. 삼진이 적어도 성공할 수 있다면, 비결이 뭘까?

128명의 성공 투수 데이터를 클러스터링해봤다. 비슷한 특성을 가진 투수들끼리 묶는 작업이다. 결과가 흥미로웠다. 세 개의 뚜렷한 그룹이 나타났다.


클러스터링


클러스터링에 사용한 지표는 6개였다. K%(삼진률), BB%(볼넷률), FB Velo(직구 구속), SwStr%(헛스윙률), FPS%(초구 스트라이크율), Chase%(볼존 스윙 유도율). 성공과 실패를 가르는 핵심 지표들이다.

처음에는 K-means 클러스터링을 시도했다. 하지만 sklearn 라이브러리에서 이상한 에러가 났다. 클로드와 함께 디버깅하다가 scipy의 계층적 클러스터링으로 방향을 틀었다. 결과가 오히려 더 해석하기 좋았다. 덴드로그램을 보면서 최적의 클러스터 수를 3개로 결정했다.

Generated Image December 23, 2025 - 6_20PM.jpeg 덴드로그램은 이런겁니다.

성공 투수 72명이 세 그룹으로 나뉘었다. 각 그룹의 프로파일을 분석했다. 그리고 이름을 붙였다.


Power_Strikeout: 삼진으로 압도하는 자


첫 번째 그룹. 29명, 전체의 40.3%.

이 그룹의 평균 K%는 23.6%였다. 리그 평균(약 18%)을 훨씬 웃돈다. SwStr%는 11.5%. 헛스윙을 많이 유도한다. 직구 평균 구속은 148km/h. 빠른 편이다.

특징이 명확하다. 삼진으로 밀어붙이는 타입이다. 빠른 직구와 낙폭 큰 변화구를 조합해서 타자를 압도한다. 볼넷이 다소 많아도 상관없다. 삼진으로 커버하니까. 이 그룹의 평균 WAR은 4.70. 세 그룹 중 가장 높았다.

대표 투수를 보면 특징이 더 뚜렷해진다. 헤이수스(2024)는 K% 24.0%에 WAR 3.8. 루친스키(2021)는 K% 22.0%에 WAR 5.8. 라일리(2025)는 K% 26.2%에 WAR 4.7. 모두 "삼진 머신"들이다.

구단에서 일할 때 이런 투수를 좋아했다. 삼진이 많으면 일단 보기 좋다. 팬들도 좋아하고, 언론도 주목한다. "저 투수 빠워있네"라는 말이 나오면 절반은 성공한 셈이다. 물론 삼진만 많고 볼넷이 너무 많으면 문제지만, K/BB 비율 3.0 이상이면 괜찮다.


Generated Image December 23, 2025 - 5_47PM.jpeg


Command_Control: 제구로 승부하는 자


두 번째 그룹. 28명, 전체의 38.9%.

이 그룹의 평균 FPS%(초구 스트라이크 비율)는 64.7%였다. 초구의 65%가 스트라이크다. 타자가 첫 투구부터 불리한 상황에 몰린다. BB%는 5.3%. 볼넷이 매우 적다. 반면 K%는 18.7%로 평균 수준. 삼진을 많이 잡지는 않는다.

특징이 명확하다. 제구로 승부하는 타입이다. 화려한 삼진보다 안정적인 이닝 소화. 볼넷을 주지 않고, 유리한 카운트를 만들어서 타자를 몰아간다.(엄밀히는 볼넷을 안준다기 보다 볼넷보다 인플레이 타구를 내주는 것을 선호한다.) 이 그룹의 평균 WAR은 4.57. Power_Strikeout보다 0.13 낮지만, 사실상 동등한 수준이다.

대표 투수들. 플럿코(2022)는 K% 21.4%, BB% 5.9%에 WAR 4.6. 뷰캐넌(2023)은 K% 16.2%, BB% 5.5%에 WAR 6.3. 후라도(2023)는 K% 17.4%, BB% 5.4%에 WAR 5.6.

뷰캐넌(2020시즌)이 눈에 띈다. K% 16.2%는 리그 평균보다 낮다. 삼진을 잘 못 잡는 투수다. 그런데 WAR 6.3. 시즌 전체 외국인 투수 중 손가락에 꼽히는 성적이다. 비결은 BB% 5.5%와 FPS% 65% 이상. 볼넷을 안 주고, 초구를 스트라이크로 넣는 능력.

구단에서 일할 때 이런 투수를 과소평가한 적이 있다. "압도적인 모습이 보이지 않는다"라는 이유로 최종 후보군에서 빠지곤 했다. 화려함이 부족하니까. 하지만 데이터는 말해준다. 삼진이 적어도 볼넷만 안 주면 된다.


Balanced: 균형 잡힌 자


세 번째 그룹. 15명, 전체의 20.8%.

이 그룹은 특별히 뛰어난 지표가 없다. K% 19.6%로 평균. BB% 8.7%로 약간 높음. FPS% 58.9%로 평균. SwStr% 9.6%로 평균.

특징이 없는 게 특징이다. 균형 잡힌 타입. 뚜렷한 강점도 없고, 치명적인 약점도 없다. 전반적으로 무난하다. 이 그룹의 평균 WAR은 3.26. 세 그룹 중 가장 낮다.

하지만 3.26도 나쁜 성적이 아니다. WAR 3.0 이상이면 "괜찮은 선발"이다. 에이스급은 아니지만 로테이션을 안정적으로 책임질 수 있는 수준. Balanced 타입은 "2~3선발"로 적합하다. 일단 3.0WAR 정도를 기록했다면 풀 시즌을 소화했다는 것. 돈값은 했다고 평가할 만한 수준이다.

구단에서 일할 때 이런 투수가 필요했던 순간이 있다. 에이스가 이미 있고, 보조 선발이 필요할 때. 화려하진 않아도 꾸준히 이닝을 먹어주는 투수. 그게 Balanced 타입이다.



ANOVA 검정: 차이는 유의미한가


세 그룹의 WAR 차이가 우연은 아닌지 확인해야 했다. ANOVA 분석을 돌렸다.(여러 그룹을 한 번에 비교해서 '진짜 차이 vs 우연'을 가려내는 통계 검증)

F-statistic 5.51, p-value 0.006. 유의수준 0.05보다 훨씬 낮다. 결론은 명확하다. 세 그룹 간 WAR 차이는 통계적으로 유의미하다. 이건 우연이 아니다.(F-statistic 5.51은 그룹 간 차이가 개인 편차보다 5배 이상 크다는 뜻. p-value 0.006은 우연일 확률 0.6%로, 통계 기준 5%보다 8배 이상 확실하다.)

특히 Power_Strikeout(4.70)과 Balanced(3.26) 사이의 차이가 크다. 1.44 WAR 차이. 이건 한 시즌에 1.5승 정도의 차이를 만든다. 작아 보일 수 있지만, 포스트시즌 진출이 1~2승 차이로 갈리는 KBO에서는 결코 작지 않다.

흥미로운 건 Power_Strikeout(4.70)과 Command_Control(4.57)의 차이다. 고작 0.13 WAR. 사실상 동등하다. 성공하는 방법은 두 가지가 있고, 둘 다 똑같이 효과적이다.


영입 전략에 주는 시사점


이 분류가 실제 영입에 어떻게 적용될 수 있을까?

Generated Image December 23, 2025 - 6_07PM.jpeg

첫째, Power_Strikeout 타입 우선. 다른 조건이 같다면, K% 22% 이상, SwStr% 11% 이상인 투수를 선택하라. 평균 WAR 4.70. 가장 높은 기대값이다.

둘째, Power가 없으면 Command를 찾아라. 삼진이 많은 투수를 못 구하면, 볼넷이 적은 투수를 찾아라. FPS% 64% 이상, BB% 6% 이하. 평균 WAR 4.57. Power와 거의 같다.

셋째, Balanced는 차선책. 둘 다 해당하지 않으면 Balanced 타입이 된다. WAR 3.26. 나쁘지 않지만, 에이스급은 기대하기 어렵다. 가성비를 따져야 할 때 선택할 타입이다.

넷째, 둘 다 없으면 위험. K%도 낮고 BB%도 높으면? 실패 확률이 크게 올라간다. 이런 투수는 피하는 게 좋다.

구단에서 일할 때 이런 기준을 만들었다면 얼마나 좋았을까. 물론 현장은 단순하지 않다. 연봉, 가용성, 타이밍. 고려할 게 많다. 하지만 적어도 "이 투수는 어떤 타입인가"를 알면 기대치를 조절할 수 있지 않았을까 하는 아쉬움이 남았다.


v5.1의 6분류 vs v6.0의 3분류


5편까지의 블로그에서는 6가지 타입을 소개했다. 삼진 마스터, 파워 직구형, 변화구 장인, 제구형 투수, 그라운드볼 유도형, 밸런스형. 규칙 기반 분류였다. "직구 비율 54% 이상이면서 구속 148km/h 이상이면 파워 직구형"처럼.

v6.0에서는 3가지로 줄었다. Power_Strikeout, Command_Control, Balanced. 통계적 클러스터링 결과다.

왜 줄었을까? 6가지 구분이 실제로 의미 있는 차이를 만들지 않았기 때문이다. "파워 직구형"과 "삼진 마스터"는 결국 같은 그룹에 속했다. "변화구 장인"은 성적에 따라 Command_Control 또는 Balanced로 나뉘었다. "그라운드볼 유도형"은 대부분 Balanced였다.

규칙 기반 분류는 직관적이지만, 실제 성적 차이와 맞지 않을 수 있다. 데이터 기반 클러스터링은 덜 직관적이지만, 실제로 의미 있는 구분을 해준다. 이번에 배운 교훈이다.


그런데 한 가지 찜찜한 게 있다


시스템이 어느 정도 궤도에 오른 것 같았다. 세 가지 성공 유형도 찾았고, 클러스터링도 잘 작동했다. 리포트를 뽑아보면 그럴듯한 결과가 나왔다. Matt Sauer를 분석하면 Power_Strikeout 타입, 성공 확률 81.9%, 예상 WAR 4.38~7.54.

그런데 한 가지 찜찜한 게 있었다. 변환 계수 말이다.

v6.0 모델에서는 이런 공식을 쓰고 있었다.

Generated Image December 23, 2025 - 5_56PM.jpeg 그림은 나노바나나 Pro모드로 제작하였음

KBO K% = MLB K% × 1.08 + 1.5

KBO BB% = MLB BB% × 1.10 + 0.5

이론적으로 그럴듯해 보였다. KBO는 MLB보다 투수 친화적인 환경이니까. 타자 수준이 낮으니 삼진을 더 많이 잡을 것이고, 볼넷도 조금 더 줄 것이다.(볼넷을 더 줄였어야 했을까!)

문제는 이 공식을 제대로 검증해 본 적이 없다는 거였다. "대충 맞겠지"라는 가정 아래 쓰고 있었던 셈이다.

검증해봐야겠다는 생각이 들었다. 실제 데이터로.


[8편: 공식이 다 틀렸다 - v6.0 변환 계수의 충격적인 검증 결과]

이전 05화한계와 미래