기대 득점 + 기대 어시스트 = '기대 공격포인트'
국내에서는 골과 어시스트 수를 합하여 ‘공격포인트'라고 부르며 이를 통해 한 선수의 공격 기여도를 평가한다. 축구는 결국 골을 넣어야 이길 수 있고 한 선수의 공격 기여도를 판단할 때 골과 어시스트 수만큼 직접적인 지표도 없을 것이다. 다만, 이전 xG와 xA 관련 글에서 골, 어시스트 수는 선수 활약에 아주 단편적인 면만 보여준다는 이야기를했었다. 그렇다면 골/어시스트 수 대신 xG/xA 개념을 활용하여 한 선수의 공격 기여도를 효과적으로 평가할 수 있는 지표가 있을까? 단순히 생각하면 공격포인트처럼 xG + xA를 합한 수치가 좋은 지표라고 생각할 수도 있다. 하지만 축구 데이터 분석가 사이에서 이보다 더 효과적인 지표인 NPxG90와 xA90를 합한 수치를 활용하고 있다. 이번 글에선 NPxG90와 xA90가 각각 어떤 것을 의미하며 이 둘을 합친 NPxG90 + xA90 지표에 대하여 소개해보겠다.
xG 관련해서는 EP 3: xG(Expected Goals)와 골 결정력에서 자세히 다룬 적이 있다. 간단히 설명하자면, 한 선수가 슈팅을 했을 때 슈팅의 다양한 요소 (슈팅 비거리, 골문과의 각도 등)을 고려하여 해당 슈팅이 골로 이어질 확률을 xG라고 정의한다. 무작위성(randomness)의 많은 영향을 받는 '골' 이벤트로 공격수를 평가하기보다는 비록 골로 이어지지는 않았지만 좋은 슈팅을 공격수의 가치를 알아볼 수 있는 지표가 바로 xG, 기대득점이다.
xG에서 파생된 NPxG(Non-Penalty xG)는 이름에서 알 수 있듯이 "non-penalty", 즉 페널티킥을 제외한 xG(Expected Goals; 기대득점) 값이다. xG대신 NPxG 지표를 활용하는 이유는 페널티킥을 랜덤성이 짙은 잡음 데이터 (noise data) 라고 보기 때문이다. 페널티킥 찬스는 평범한 슈팅에 비해 골로 이어질 확률이 월등히 높을뿐더러 페널티킥은 골로 연결한 선수보다 페널티킥을 얻어낸 선수의 비중이 더 크기 때문이다. (물론, 페널티 키커가 직접 얻는 경우도 있다) 따라서, 페널티킥 슈팅을 제외하고 xG의 합을 구함으로써 페널티킥이라는 잡음 데이터를 제거하고 더 정교하게 발전된 지표가 바로 NPxG이다.
xA(기대 어시스트)는 xG 개념을 이해한다면 아주 간단하다. 공격수가 한 슈팅을 통해 0.5 xG 값을 기록한다면 해당 슈팅 직전에 패스한 선수에게 동일한 값(0.5)의 xA가 부여된다. 어시스트 또한 골과 마찬가지로 한 경기에 자주 나오는 이벤트가 아니다 보니 슈팅 기회를 창출한 선수에게도 공격 기여도를 부여하기 위한 지표이다.
NPxG와 xA에 대해 간단히 얘기해봤는데 NPxG90, xA90 처럼 뒤에 붙는 90은 무엇을 뜻할까? G90, A90과 마찬가지로 데이터 지표 뒤에 90이 붙으면 “90분당 평균"(per 90)의 기록이라는 뜻이다. “Per 90" 기록은 한 선수의 지표 수치과 뛴 시간(분)을 이용하여 계산된다. 예를 들어 한 선수가 150분을 뛰고 2골을 기록했으면 그 선수의 G90(Goals per 90) 값은 2 x (90/150) = 1.2가 된다. 경기당 추가시간도 존재하기 때문에 90분이 아닌 96분당 평균(per 96)으로 계산하기도 한다. NBA 관련 스탯 같은 경우 한 농구 경기가 48분인 것을 고려하여 48분당 평균(per 48) 지표가 흔하게 사용된다.
Per 90 지표가 활용되는 이유는 선수를 보다 동등한 위치에서 비교하기 위함이다. 골, 어시스트, xG, xA 등 여러 지표는 선수의 출전 시간이 많을수록 더 높은 수치를 기록할 확률이 높다. 한 시즌에 3,000분을 뛴 공격수는 1,500분을 뛴 공격수보다 골을 기록할 시간이 2배나 많이 주어진다. Per 90 지표가 아닌 단순한 골 수를 갖고 이 두 공격수를 비교하는 것은 무의미하다.
하지만 per 90 지표를 사용할 때 주의해야 할 점이 있는데 바로 표본의 크기이다. 12경기에 걸쳐 1,000분을 뛰며 20골을 기록한 선수와 50분을 뛰고 한 골을 넣은 선수의 G90 값은 동일하지만 20골을 넣은 선수가 더 꾸준한 활약을 했다고 볼 수 있다. 표본의 크기가 작을수록 이상치 데이터(outlier)에 의해 데이터가 더럽혀질 수 있으며 데이터 해석이 잘못될 수 있어 주의해야 한다.
90분당 평균 NPxG와 xA를 합한 값이 바로 NPxG90 + xA90이다. 단편적으로 보면 90분당 공격포인트와 비슷한 개념의 지표이다. 다만 골 수 대신 슈팅 찬스 기반의 페널티킥을 제외한 지표인 NPxG와 xA를 사용함으로써 무작위성, 이상치 등에 영향을 받는 공격포인트보다 더 정교하게 한 선수의 공격 기여도를 수치화할 수 있다. '90분당 평균 공격포인트'의 한 단계 더 발전된 지표라고 이해할 수 있다.
2019/20 EPL 시즌 NPxG90 + xA90 랭킹
Understat 사이트에서는 유럽리그의 NPxG90 + xA90 데이터를 확인할 수 있다. 과연 EPL에서 뛰어난 NPxG90 + xA90을 기록한 선수 중 과연 우리가 알고 있는 공격력이 뛰어난 선수도 포함되어있는지 한번 확인해보자.
단발성 활약의 가능성을 최소화하기 위해 최소 1,500분 이상 뛴 선수로 리스트를 제한했다. 지난 시즌 Top 10 리스트를 보면 상위 4명을 비롯하여 10위의 다비드 실바까지 무려 5명의 맨체스터 시티 소속 선수가 포함되어있다. 가브리엘 제수스가 유일하게 1.0 이상의 수치를 기록했으며, 이는 제수스가 90분당 평균 한 개 이상의 공격포인트를 기록할 기회를 창출했다고 볼 수 있다. 물론, 제수스 같은 경우, 골 찬스를 자주 놓쳐 실제 공격포인트 수는 기대값보다 적다. 리버풀의 ‘마누라' 라인 또한 3명 모두 Top 10에 랭크하며 상위 10명 중 총 8명이 맨시티, 리버풀 팀 소속이다. 2019/20 시즌 두 팀의 공격력이 얼마나 막강했는지 보여주는 대목이다. 그 외에 지난 시즌 활약을 기반으로 잉글랜드 국가대표에 선발된 첼시의 아브라함이 5위를 기록했고 중하위권 팀 소속임에도 불구하고 코로나 중단 재개 후 뛰어난 모습을 보여준 웨스트햄의 안토니오가 7위를 기록했다.
11~20위를 보면 아브라함과 함께 첼시 공격의 미래를 책임질 풀리식 (0.68), 번리 공격의 중심 크리스 우드 (0.66), 레스터시티의 간판 스트라이커 제이미 바디 (0.64) 등이 이름을 올리며 2019/20 시즌을 돌아봤을 때 공격 능력이 뛰어난 선수들이 상위권에 포함된 것을 확인할 수 있다. 커리어 최고 시즌을 보낸 손흥민(0.56)은 21위에 랭크했다. 토트넘 선수 중에는 제일 높은 NPxG90 + xA90 값을 기록하며 토트넘 공격의 중심이었다는 점을 데이터로도 확인할 수 있는 대목이다.
NPxG90 + xA90의 한계
한 선수의 공격력, 공력 기여도를 단순 '공격포인트' 보다 더 정교하게 수치화하는 NPxG90 + xA90 지표이지만 뚜렷한 한계점도 존재한다. xG와 xA가 슈팅, 그리고 슈팅 직전의 패스를 기반으로 하는 수치이기 때문에 자연스럽게 슈팅이 많이 나오는 앞선의 공격수, 미드필더 선수가 높은 수치를 기록하게 되는 지표이다. 빌드업이 어느 때보다 중시되고 있는 현대축구에서는 슈팅 기회를 만들기까지 여러 차례의 패스가 이뤄지는데 아쉽게도 이 부분은 반영되지 않는다. 빌드업의 중심이 될 수 있는 미드필더, 수비수의 공격 기여도는 NPxG90 + xA90 지표로 확인하기 어렵다. 공격 빌드업의 기여도의 수치화를 시도하는 여러 지표가 또 존재하며 이는 다음 기회에 다뤄보겠다.