brunch

#1. 못다한 숙원

매년 반복되는 외국인 선수 영입. '도박'과 '투자' 사이의 그 어딘가.

by randahlia

11월의 기억


11월. 마무리 훈련이 끝나고 선수의 이동이 시작되는 시기다. 구단에서 데이터 분석가로 일하던 시절, 이맘때쯤이면 회의실에 낯선 이름들이 적힌 리스트가 바쁘게 돌기 시작한다. 마이너리그 성적표, 스탯캐스트 리포트, 에이전트들의 콜드 메일들. 우리가 그동안 선별해둔 리스트, 그리고 이맘때쯤 자유의 신분이 되는 선수들 사이에서, 우리는 모두 같은 질문을 되뇌었다. "이번에는 누굴 데려와야 하지?"


외국인 투수 한 명의 연봉은 기본 100만 달러, 우리 돈으로 약 15억 원이다. 여기에 계약금, 숙소, 통역, 가족 체류비까지 더하면 실제 투자 규모는 20억 원을 가뿐히 넘긴다. 웬만한 국내 FA 계약에 필적하는 금액이다. 그런데 이 비싼 투자의 성공률은? 구단이 데이터를 쌓고, 경험있는 인력을 충원하고 육성함에도 불구하고, 외국인 선수 스카우트는 항상 큰 결단력을 요구했다. 성공하면 가을야구의 주역이 되고, 실패하면 시즌 중반 방출이다. 매년 반복되는, 가장 큰 돈을 쓰는 업무 중 하나였다. 40억 이상이 되는 돈의 용처를 결정하는 것은 데이터팀 3명의 역할이었고, 성공과 실패는 그 예산 이상의 기쁨과 스트레스를 동반했다.


비록 지금은 대구에서 지역방송 해설을 맡고 있지만, 스토브리그 뉴스가 뜰 때마다 예전 생각이 난다. "저 투수, 괜찮을까?" 손이 근질거린다. 데이터를 직접 분석하고 싶어진다. 그래서 시작했다. AI의 도움을 받아보기로 했다.



숫자가 말해주는 현실


2021년부터 2025년까지, KBO에서 뛰었던 외국인 투수들의 기록을 모았다. 총 128개의 시즌 기록, 이른바 128 pitcher-seasons다. 이 숫자 안에는 리그를 지배했던 에이스도 있고, 이름조차 기억나지 않는 채 사라진 투수도 있다. 구단에 있을 때는 우리팀에 올 투수, 우리팀에 있는 투수만 신경스면 되었다. 이제는 리그 전체를 보면서, 고향팀 삼성과의 상성도 생각해보고 내년 성적도 종합적으로 판단해 볼 수 있어야만 했다. 냉정하게 WAR(대체 선수 대비 승리 기여도)로 줄을 세워보면 현실이 드러난다. 그래서 먼저 문자중계 데이터를 통해서 경기정보를 수집했고, 미약하나마 나만의 WAR 시스템을 구축했다.


WAR 4.0 이상을 기록한 투수, 즉 팀의 확실한 에이스로 자리매김한 경우는 전체의 28%에 불과했다. 128개의 샘플 중 36회에 불과했다. 절반이 조금 넘는 51%, 65번은 "그럭저럭 쓸 만했다"는 평가를 받는 중간층에 머물렀다. 그리고 나머지 21%, 27번의 샘플은 명백한 실패였다. 기대에 한참 못 미치는 성적을 남기거나, 시즌을 채 마치지 못하고 방출되었다. 5명 중 1명은 "왜 데려왔나"라는 비난을 듣는다는 이야기다.


2025시즌만 놓고 봐도 상황은 다르지 않다. 쿠에바스, 벨라스케즈는 WAR가 마이너스였다. 팀에 있는 것만으로도 손해라는 뜻이다. 누군가는 그들에게 15억 원 이상을 투자했고, 그 이상의 성적을 바랬을 것이다. 하지만 큰 돈의 투자가 실패하면 더 큰 손실로 다가온다. 그렇게 롯데는 톨허스트를 보고 데려온 벨라스케즈의 몰락으로 인해 가을야구에서 탈락했다. 그 돈이면 유망주 육성에 쓰거나, 국내 투수 연봉을 올려줄 수도 있었다. 하지만 이미 지나간 물이다. 구단은 다음 시즌을 위해 또다시 낯선 이름들이 적힌 서류를 펼친다. 포털 칼럼니스트로 외국인 선수 스카우팅 리포트를 쓴 것이 16년 전, 그리고 직접 스카우팅 실무를 한 것이 4년이다. 이제는 다시 밖에서 보는 입장이 됐지만, 그 고민의 무게는 여전히 느껴진다.



같은 스펙, 다른 운영


왜 이런 일이 반복될까? 핵심은 정보의 비대칭에 있다. 구단에서 일할 때도, AI센터에서 야구 서비스를 통한 정보 컨텐츠를 기획할 때도 늘 부딪혔던 문제다.


MLB에서 ERA 3.50을 기록한 투수가 있다고 하자. 나쁘지 않은 성적이다. 마이너리그에서 꾸준히 좋은 숫자를 찍어왔다면 더할 나위 없다. 그런데 이 투수가 한국에 오면 어떻게 될까? 정답은 "아무도 모른다"이다. 확실할 것 같았던 선수가 전반기에 집으로 가기도 하고, 너무나도 확신이 없던 상황에서 계약한 선수가 최고의 활약을 보여주기도 했다.


폰세를 보자. 그는 일본에서의 긴 커리어 후 KBO로 이적했다. 2024년 그의 NPB 성적은 썩 좋은 편은 아니었다.(1군: 15경기(12 선발) 67이닝 3승 6패 평균자책점 6.72 92피안타 19볼넷 56탈삼진 WHIP 1.61 피안타율 .332) 그런데 한국에서는 완전히 다른 투수가 됐다. WAR 9.38, 리그 전체 1위. MVP 오를 정도로 압도적인 시즌을 보냈다. 반면 벨라스케즈는 어떤가. 그는 MLB 메이저리그 경험까지 있는 투수였다. 이력만 보면 폰세보다 "검증된" 선수처럼 보였다. 결과는 WAR -0.58. 강속구를 던지는 파워피처라는 공통점을 가진 두 선수가 완전히 다른 운명을 맞이했다.


대체 무엇이 다른 걸까? 메이저/마이너리그 성적만으로는 설명이 안 된다. ERA, WHIP, 삼진율, 볼넷율. 이런 전통적인 지표들을 아무리 들여다봐도 누가 성공하고 누가 실패할지 예측하기 어렵다. 물론 '안정적인 제구'를 중시하는 것이 '리스크를 줄이는' 방법의 한 가지인 것은 확실하다. 하지만 현장은 '안정성'보다는 '에이스'를 원한다. 하이리스크 하이리턴이 강제되는 구조에서, 데이터팀과 해외스카우트는 로우리스크 하이리턴의 리스트를 추리기를 강요받는다. 요즘은 겨우내 잠깐의 사설 클리닉 경험이 마치 '기연'을 얻어 성공하는 지름길인 것 처럼 포장되기도 한다. 과거의 성적으로 단 1년 앞을 보는것조차 이렇게 어렵다.



완전히 다른 무대


MLB 성적이 KBO에서 그대로 재현되지 않는 이유는 분명하다. 두 리그의 환경이 근본적으로 다르기 때문이다. 모두가 인정할 만한 부분일 것이다. 기본 연봉 5천만원 vs 15억. 이걸로 '환경'이라는 단어의 대부분이 설명이 된다. 메이저리그에서 1군레벨에 진입하기라도 하려면, 한국에 오는 외국인선수보다 뛰어나야 한다.


KBO는 여전히 150km정도의 빠른공이면 리그 최상급 레벨의 투수 대우를 받을수 있다. 하지만 메이저리그는 이미 리그의 패스트볼 평균 구속이 93마일(150km)를 넘어섰다. 2025년 기준 KBO의 직구 평균구속은 146km정도였는데, 메이저리그에는 이정도 구속의 슬라이더나 스플리터를 던져대는 투수가 즐비하다.


스트라이크 존도 미묘하게 다르다. ABS를 도입한 이래, KBO의 스트라이크존은 기존 심판이 잡아줄 가능성이 낮던 영역에 대한 스트라이크 비율이 높아지며 투고타저 리그로 변화했다. 높은 존의 활용도가 급증했고, 경계선을 이용한 투구들이 각광받기 시작했다. 라이징 패스트볼을 주무기로 쓰는 투수에게는 희소식이지만, 낮은 존 공략형 투수에게는 적응이 필요한 부분이다. 공인구의 특성도 무시할 수 없다. KBO 공인구와 MLB 공인구는 솔기 높이와 표면 질감이 다르다. 같은 그립, 같은 릴리즈 포인트에서 던져도 공의 궤적이 달라질 수 있다는 뜻이다.


결국 MLB에서의 성공이 KBO에서의 성공을 보장하지 않는다. 오히려 MLB에서 "애매했던" 투수가 KBO의 환경에 딱 맞아떨어져 에이스로 거듭나는 경우도 많다. 문제는 그 "딱 맞음"을 미리 알아내기가 극도로 어렵다는 점이다.



또다시 데이터로


"그동안 쌓아온 걸 써먹어보자."


구단 4년, AI센터 5년. 합치면 9년이다. 그 시간 동안 야구 데이터를 보고, 분석하고, 서비스로 만드는 일을 해왔다. 머릿속에는 온갖 아이디어가 있었지만, 조직에 속해 있을 때는 마음대로 시도하기 어려웠다. 우선순위가 있고, 리소스가 있고, 승인이 필요했다. 하고 싶은 연구와 해야 하는 업무 사이에서 늘 타협해야 했다.


지금은 다르다. 혼자다. 대신 AI가 있다. 클로드(Claude)라는 AI를 만나고 나서 많은 것이 달라졌다. 예전에는 분석 스크립트 하나를 짜려면 반나절이 걸렸고, 에러를 수정하다 지쳐 버린 코드만 해도 몇만줄이 될것이다. 지금은 아이디어를 말로 설명하면 코드가 나온다. 물론 완벽하지는 않다. 수정하고, 다시 설명하고, 또 고치는 과정을 반복해야 한다. 하지만 코딩과 디버깅을 내가 직접 하지 않아도 된다는 것 만으로도 진행도가 눈에 띄게 향상되엇다. 지금은 그저 혼자서 이 정도 속도로 프로젝트를 진행할 수 있다는 게 놀랍다. 드디어 9년간 머릿속에만 있던 것들을 실제로 만들어볼 수 있게 됐다.


가설은 단순했다. 성공한 외국인 투수들에게는 공통된 특성이 있을 것이다. 그 특성을 데이터로 잡아낼 수 있다면, 비슷한 특성을 가진 신규 후보를 찾아낼 수 있을 것이다. 그리고 그런 후보는 평균적으로 더 높은 성공 확률을 보일 것이다. 물론 가설일 뿐이다. 검증이 필요했다.


KBO 데이터는 2021년부터 2025년까지의 정규시즌 기록을 수집했다. 외국인 투수 128 pitcher-seasons. 투구 단위 데이터—구속, 무브먼트, 로케이션, 구종—부터 성적 데이터—WAR, FIP, K%, BB%—까지. MLB 후보 데이터는 Baseball Savant의 Statcast에서 동일한 형식으로 가져왔다. 두 리그의 데이터를 같은 형식으로 맞추는 작업이 생각보다 까다로웠지만, 클로드와 함께하니 며칠 만에 해결됐다.(물론 해설위원 첫해 다양한 꺼리들을 준비하며 연구한 피칭디자인, 투구패턴관련 연구들이 큰 도움이 되었다)



128, 투수의 시즌을 모두 분리한 숫자


128 pitcher-seasons이라는 숫자가 중요한 이유가 있다. 기존의 분석들은 대부분 "성공한 투수"만 봤다. 후라도, 알칸타라, 폰세 같은 에이스들. 그들의 공통점을 찾고, 비슷한 특성을 가진 후보를 추천하는 방식이었다. 얼핏 합리적으로 보이지만, 이 접근법에는 치명적인 함정이 있다. 생존자 편향(Survivorship Bias)이다. AI센터에서 야구 AI 서비스를 기획할 때도 이 문제로 골머리를 앓았던 기억이 있다.


2차 세계대전 당시의 유명한 일화가 있다. 영국 공군은 귀환한 폭격기의 피탄 위치를 조사했다. 동체와 날개에 총알 구멍이 집중되어 있었다. 군 관계자들은 당연히 그 부분을 보강해야 한다고 생각했다. 하지만 통계학자 에이브러햄 월드의 생각은 달랐다. "귀환한 비행기는 저 부분을 맞고도 살아남은 것입니다. 귀환하지 못한 비행기는 다른 곳—엔진, 조종석—을 맞았을 것입니다. 보강해야 할 곳은 총알 구멍이 없는 곳입니다."


외국인 투수 분석도 마찬가지다. 성공한 투수만 분석하면 실패의 원인을 알 수 없다. 후라도와 비슷한 특성을 가진 투수가 왔는데 실패한 경우가 있을 수도 있다. 그 데이터가 없으면 "후라도와 비슷하면 성공한다"는 잘못된 결론에 도달하게 된다. 그래서 성공한 투수와 실패한 투수를 모두 포함했다. 해마다 달라진 선수들의 실력 레벨을 별도의 샘플로 판단하기 위해서, 23시즌의 후라도와 24시즌의 후라도, 25시즌의 후라도는 각각 개별 샘플로 처리했다. WAR 9.38(폰세)부터 WAR -0.9(맥키니)까지, 모든 스펙트럼을 데이터에 담았다. 에이스부터 시즌 중 방출까지, 128개의 서로 다른 이야기가 담긴 데이터셋이 완성됐다.



예측하고 싶은것, 그리고 할수 없는 것


목표를 명확히 해야 했다. 이 시스템으로 무엇을 예측하고 싶은가?


첫째, Per 150 IP WAR. 이 투수가 건강하게 풀 시즌을 던진다면 어느 정도의 가치를 창출할 수 있을까? 부상 없이 150이닝을 소화했을 때의 기대 성적이다. 둘째, 생존 확률. 현실적으로 모든 투수가 150이닝을 던지지는 못한다. 이 투수가 50이닝, 100이닝, 150이닝을 소화할 확률은 각각 얼마일까? 셋째, 투수 유사성 체크. KBO에서 비슷한 스타일로 뛰었던 투수는 누구인가? 과거 사례를 참조하면 어떤 결과가 나올지 가늠하기 쉬워진다.


동시에 예측하지 않기로 한 것들도 있다. 부상은 데이터로 예측할 수 없다. 중간에 퇴출된 이유가 부상일 때도 존재했다. 하지만 이것도 단순히 '방출'로 처리할수 밖에 없었다. 멘탈이나 문화 적응도 정량화가 불가능하다. 포수와의 궁합, 팀 수비력 같은 환경적 요인도 투수 개인 데이터로는 파악할 수 없다. 구단에서 일할 때 "데이터로 다 되는 거 아니냐"는 질문을 자주 받았다. 정말 아직도 기억나는 업무지시가 "잠실에서 이기는 법"을 조사해 오라는 것이었다. 내가 데이터를 통해 잠실에서 이길수 있는 필승법을 알고있었다면, 그 방법을 들고 엘지나 두산에 팔러 가지, 뭐하러 엔씨에 남아있겠는가. 그때도 '그런것은 안됩니다' 라고 했다.(그럼에도 불구하고 그 임원은 데이터 분석으로 그런것도 못한다고 내가 퇴직할때까지 나를 괴롭혔다) 안되는 것은 안 된다. 한계를 명확히 인정하는 것도 분석의 일부다. 이 시스템은 "능력"을 예측하지, "운"을 예측하지는 않는다. 불확실성을 완전히 제거할 수는 없지만, 줄일 수는 있다. 그게 데이터 분석의 역할이다.



첫 번째 시도, 그리고 예상 밖의 결과


데이터를 모으고 첫 번째 모델을 만들었다. 클로드와 며칠간 씨름한 끝에 완성한 시스템이었다. 16개 특성—구속, 무브먼트, 구종 다양성, 존 공략률 등—으로 유사도를 계산하고, 후보 투수와 가장 비슷한 KBO 투수를 찾아주는 구조였다. 이론적으로는 완벽해 보였다. 성공한 투수와 비슷한 특성을 가진 후보라면 성공 확률이 높을 것이다. 아..드디어 이런걸 만들어 보는구나. 정말 뭔가 나오겠구나 하는 뿌듯함이 감정이 온 몸을 감쌌다


첫 번째 테스트 대상은 Matt Manning이었다. 딱 그때 즈음 삼성으로 온다는 루머가 돌기 시작했기 때문이었다. 직구 구속 152km/h의 스위퍼를 장착한 우완 투수. 과연 가장 유사한 투수는 누구일까.


"가장 유사한 KBO 투수: **후라도(2024)**. 유사도: 82.6%."


화면을 두 번 확인했다. 후라도? 후라도는 KBO를 대표하는 기교파 투수다. 직구 구속 146km/h, 공격적 투구패턴으로 여러 구종을 자유자재로 구사한다. 삼진을 많이 잡기보다 타자와의 수싸움에서 압도적 선택지로 우위를 가져가는 스타일이다. 152km/h 강속구 투수가 146km/h 기교파와 82% 유사하다고? 이건 누가봐도 잘못된 결과였다.


첫 번째 모델은 이렇게 시작부터 실패했다. 왜 이런 결과가 나왔는지 분석해야 했다. 실패의 원인을 파헤치는 과정에서 더 중요한 무언가를 발견하게 될 줄은 그때 몰랐다.



**[2편: 첫 번째 실패 - "구종 6개면 무조건 후라도?"에서 계속]**



keyword
일요일 연재