Expected Goal Chains and Buildup
축구에 조금이라도 관심 있는 팬이라면 ‘빌드업'이라는 용어가 꽤 친숙할 것이다. 쉽게 풀이하여 "공격 전개의 과정”을 의미하는 빌드업은 축구 전술에서 가장 중요한 요소 중 하나이다. 전술이 다양해지고 압박의 중요성이 강조되는 현대축구에서 빌드업은 그 어느 때보다 핵심요소로 떠오르고 있으며 소위 "발밑" 좋은 골키퍼, 왼발잡이 센터백 등의 가치는 더 오르고 있다. 현역 감독 중에는 펩 과르디올라의 빌드업 전술이 많은 주목을 받는다. 골키퍼부터 시작되는 “후방 빌드업"을 통해 펩은 점유율을 높이며 더욱 확률 높은 빌드업을 추구하는 축구를 바르셀로나, 바이에른 뮌헨에 이어 맨체스터 시티에서도 보여주고 있다.
축구에서 가장 흔히 사용되는 지표는 득점, 도움 수이지만 이보다 더 정밀한 분석을 위해 xG, xA 지표를 이전에 소개했었다. 그리고 지난 글에서 한 선수의 공격 기여도를 확인할 수 있는 NPxG90 + xA90 이라는 “기대 공격포인트" 지표도 다뤘었다. 하지만, 이 xG 기반 지표들은 철저히 슈팅, 그리고 슈팅 직전 패스를 기반으로 하므로 공격을 마무리 짓는 선수들에게 집중될 수밖에 없는 지표이다. 슈팅을 포함한 득점, 그리고 어시스트는 성공적인 빌드업의 마무리 과정일 뿐이며 여러 선수의 패스가 이루어내는 결과이다. 득점, 어시스트 수, xG 기반 지표를 통해서는 빌드업에 중심이 되는 선수(특히, 3선 미드필더, 수비수 등)의 공격 기여도를 확인하기 힘들다.
그렇다면 빌드업의 기여도를 데이터로 확인할 방법이있을까? 축구 데이터 분석 업계의 선두주자인 Statsbomb에서 xG 개념 기반의 xGChain (xGC), xGBuildup (xGB)이라는 지표를 정의했고 이를 통해 각 선수가 성공적인 빌드업에 얼마만큼 기여했는지를 수치화한다.
xG에 대한 이해도가 있다면 xGChain는 쉽게 이해할 수 있다. xG는 슈팅이 있어야 기록되는 해당 슈팅이 득점으로 이어질 확률을 나타내는 지표이다. 그리고 xGChain를 쉽게 생각하면 슈팅으로 마무리된 빌드업의 관여한 선수가 기록하는 지표라고 할 수 있다. xGChain을 구하는 방법은 다음과 같다:
1. 슈팅으로 마무리된 볼 점유(possession)에 관여한(한 번이라도 공을 터치한) 선수를 추린다.
2. 마무리 슈팅의 xG 값을 계산한다.
3. 동일한 값을 볼 점유에 관여한 모든 선수에게 부여하며 그 값이 바로 xGChain이다.
아스날의 한 공격 장면을 예로 들어보겠다.
콜라시나츠의 스로인으로 시작되는 이 점유(possession)는 세바요스 → 콜라시나츠 → 티어니 → 세바요스 → 은케티아를 거쳐 리스 넬슨의 슈팅으로 마무리된다. 이때 넬슨의 슈팅이 골로 이어질 확률을 30%라고 가정하자. 그러면 리스 넬슨은 0.3 xG를 기록하게 되고 슈팅 직전의 패스를 한 은케티아는 0.3 xA를 기록하게 된다. 그리고 넬슨과 은케티아를 포함하여 빌드업에 관여했던 세바요스, 콜라시나츠, 티어니 모두 0.3 xGC를 기록하게 된다.
물론, 해당 점유에서 각 선수의 기여도는 조금씩 다르겠지만 데이터 수치화를 위해 모든 선수가 동일한 비중을 차지했다고 가정한다. 이를 통해 빌드업 마무리 과정에 있는 선수들뿐만 아니라 빌드업에 관여한 모든 선수를 데이터로 확인할 수 있다. xG, xA 기록만 봤을 때 확인되지 않은 선수의 기여도를 파악할 수 있게 되는 것이다.
EPL 19/20 시즌 xGChain90 (xGC90)
지난 시즌 EPL xGC90 기록(최소 출전 시간 1,500분)을 보면 상위 10명 중 7명이 맨체스터 시티 소속 선수다. xGC는 xG, xA를 기록한 선수도 기록되기 때문에 xG90, xA90 값이 높았던 맨시티 선수가 다수 포함된 것이다. Top 10 선수의 대부분이 기존 NPxG90 + xA90 상위권 리스트에도 있던 공격수, 또는 공격 성향이 강한 미드필더이지만 눈에 띄는 새로운 선수도 있다. 9위에 랭크된 귄도안은 주로 3선의 수비형 미드필더로 활약을했다. 그의 득점, 어시스트, NPxG90+A90 기록은 모두 저조하나 귄도안의 xGC90 기록은 그가 맨시티의 후방 빌드업에 많은 관여를 했다는 것을 보여준다.
xGC90 기록 11~25위를 보면 빌드업 마무리가 아닌 빌드업 과정에 중심적인 역할을 하는 선수들이 확연히 두드러진다. 맨시티의 로드리(11위)와 카일 워커(20위), 토트넘의 알리(14위), 리버풀의 헨더슨(23위) 모두 NPxG90 + xA90의 기록은 좋지 못하나 각 팀 빌드업에 중추적인 역할을 하는 선수들이라고 볼 수 있다.
NPxG90 + xA90 상위 선수 리스트보다 xGC90 상위권 리스트에는 빌드업에 중심 역할을 하는 중앙/수비형 미드필더 선수들의 이름을 확인해볼 수 있었지만, 특히 Top10 같은 경우 대부분이 그래도 높은 xG, xA를 기록하는 공격 성향의 선수들이다. xG, xA를 기록한 선수는 xGC 값도 기록되기 때문에 이는 자연스러운 결과이다. 이들을 제외하고 빌드업 과정에 더 집중하려면 xG Buildup이라는 지표를 활용할 수 있다. xGG와 비슷하게 xG가 기록되는 시점에 해당 점유에 관여했던 모든 선수가 xGB를 기록하지만, xGC와 다르게 xG, xA를 기록한 선수는 제외된다.
위 아스날 플레이의 예로 돌아가자면 슈팅을 한 넬슨, 그리고 그 직전 패스를 한 은케티아는 다른 선수들과 동일하게 xGC를 기록하지만 xGB는 기록하지 못한다. 빌드업 마무리에 있던 두 선수를 제외한 선수들이 0.3 xGB를 기록하게 된다.
EPL 19/20 시즌 xGBuildup90 (xGB90)
xGC90와 비슷하게 xGB90 Top 10 리스트(최소 출전 시간 1,500분)에서도 맨시티 선수를 쉽게 찾아볼수 있다. 상위 10명 중 무려 9명이 맨시티 소속 선수인데 특정 선수에게만 의존하지 않고 필드의 모든 선수가 빌드업에 관여하는 펩의 후방 빌드업, 점유율 축구가 고스란히 데이터로 드러나는 대목이다. 실제로 지난 시즌 센터백으로 활약한 페르난지뉴, 좌/우 풀백인 벤자민 멘디와 카일 워커가 Top 10에 랭크되고 센터백 오타멘디가 11위에 올랐다는 점이 이상적이다. 2/3선 미드필더가 아니라 맨시티의 빌드업이 수비라인부터 시작된다는 점을 xGB 데이터가 정확하게 짚어준다.
리버풀의 헨더슨, 파비뉴, 로버트슨 그리고 맨체스터 유나이티드의 마티치, 프레드가 상위 20위안에 들었다. 이들의 공격 기여도는 단순히 득점, 어시스트 수 외에 xG, xA 기록으로도 나타나지 않아 정량적으로 확인하기는 어렵다. 공격 마무리가 아닌 전개 과정에 집중된 xGB 지표를 통해서야 비로소 각 팀 빌드업의 중심에 있는 선수를 데이터로 확인할 수 있게 된다.
빌드업 기여도를 수치화하는 xGC/xGB 또한 여느 데이터 지표와 같이 아쉬운 부분이 있다. 가장 아쉬운 부분은 점유에 가담했던 모든 선수에게 동일한 값의 xGC/xGB가 부여된다는 점이다. 물론, 장기적으로 많은 데이터가 쌓였을 때 오차가 줄어들 수는 있지만, 빌드업 과정에서 간단한 백패스를 한 선수와 수비수 사이로 스루패스를 한 선수의 기여도는 엄연히 다르기 때문이다. 이런 한계가 있기 때문에 리그에서 xGC/xGB 값이 높다고 ‘빌드업 능력이 뛰어난 선수’라고 단정 지을 수 없으며 다른 지표보다 정성적 데이터의 역할이 더 중요한 지표이다.
완벽하지는 않지만, 기존에 정량적 데이터로 확인하기 어려웠던 후방지역 선수의 공격 기여도를 수치화하고 각 팀 빌드업의 중심인 선수 등을 데이터로 확인할 수 있다는 점에서 다양한 활용 방안을 제시한 xGC/xGB는 분명 축구 데이터 분석 분야를 한층 더 발전시켰다. 그리고 xGC/xGB의 한계점을 다른 방식으로 해결하려는 지표도 존재하며 이는 다음번에 한번 다뤄보겠다.
참고자료
이 글을 작성하며 참고한 글 두개를 소개한다:
Statsbomb의 Introducing xGChain and xGBuildup
American Soccer Analysis의 EXPECTED GOAL CHAINS