brunch

You can make anything
by writing

C.S.Lewis

by 이지훈 Mar 20. 2023

18년 차 Gooner가 보는
축구와 데이터 2

코드스테이츠 PMB 17 W6D4


 이번 포스팅은 '18년 차 Gooner가 보는 축구와 데이터1'와 이어지는 내용이다. 이해를 위해 해당 글을 먼저 읽고 보시는 것을 권장합니다.




시작하며


우리는 지난번 포스팅에서 데이터가 축구에 얼마나 부합하는지에 대한 가설 3가지를 세워보았다.


가설1

볼 점유율이 높으면 패스의 길이도 짧을 것이다.


가설2

높은 지역에서 압박을 하는 팀은 압박 시도도 많이 할 것이다.


가설3

파이널 써드 영역을 차지하고 있는 팀은 많은 슈팅을 시도할 것이다.


본격적으로 Kaggle에서 제공받은 데이터를 토대로 해당 가설이 적합한지 검증을 해보도록 하려 한다.

2021-2022 Season England Premier League Team Data  




가설 검증하기



가설1

볼 점유율이 높으면 패스의 길이도 짧을 것이다.

볼을 오래 소유하기 위해서는 동료들 간의 간격이 촘촘할 것이고, 그만큼 패스의 길이도 짧아질 것이라 예상한다. → 가설 일치


프리미어리그 팀 별 패스 데이터 (2021-2022)
프리미어리그 팀 별 포제션 데이터 (2021-2022)

 


첫 번째 가설을 검증하기 위해 Passing Stat과 Possesion 데이터를 선택해 확인해 보았다. 두 자료 모두 각 팀의 전체적인 패스와 포제션에 대한 데이터를 다루고 있기 때문에 우리가 검증하려는 가설에 필요한 데이터만 추출하고 엑셀로 그래프 형태를 만들어 보았다.



 각 구단 별 짧은 패스와 볼 점유율의 상관관계를 증명하기 위해 피그마를 활용하여 X축 영역엔 볼 점유율(%), Y축 영역엔 짧은 패스 성공률(%)로 설정하여 데이터의 가시성과 시인성을 높였다. 그래프에서 보이듯 짧은 패스와 볼점유율이 매우 높은 맨체스터 시티부터 제일 낮은 번리까지 전반적으로 볼 점유율이 높은 팀은 짧은 패스 성공률 또한 높은 것으로 나타났다. 따라서 해당 그래프는 '양의 상관관계'를 보이며 가설이 일치한다.






가설2

높은 지역에서 압박을 하는 팀은 압박 시도도 많이 할 것이다.

높은 지역에서 압박하여 상대의 볼을 뺏으려 하는 만큼, 뒤로 물러서는 게 아니라 적극적이라 수비할 것이라 생각하여 압박 시도 횟수가 많을 것이라 예상한다. → 가설 불일치


 

 똑같은 방식으로 depensive 데이터 중 압박 총 회수와 파이널써드 영역 압박 시도 횟수 지표를 뽑아 엑설로 그래프를 제작하고, 피그마로 고도화를 진행하였다.


 고도화된 그래프를 형태를 보듯이, 상대 진영에서 적극적으로 압박을 시도하는 팀이 전체적인 압박의 빈도도 높을 것이라는 보통의 예상과는 달리 각 팀들의 압박 지표가 일정한 패턴을 보이지 않고 오밀조밀 몰려 있는 것을 확인할 수 있다. 특히 제일 의외였던 부분은 맨체스터 시티와 아스날 같이 높은 수비 라인을 형성하고, 높은 점유율을 바탕으로 끊임없이 공격을 하는 팀들의 총 압박 시도와 파이널 써드 영역에서의 압박 시도 데이터가 높지 않는다는 것이다. 이는 압박의 시도나 위치보다는 어느 상황에서 효율적으로 압박을 하는지가 중요하다는 것을 알 수 있게 하는 데이터이다.





가설3

파이널 써드 영역을 차지하고 있는 팀은 많은 슈팅을 시도할 것이다.

위험지역에서 머물면서 기회를 많이 만들 것이고, 그만큼 많은 슈팅을 할 것이라 생각한다.

 → 가설 불일치



 이번 가설도 동일한 방법으로 Shooting 데이터와 Possesion 데이터에서 총 슈팅 시도 횟수와 파이널 써드 영역 볼 터치 횟수를 추출한 뒤 피그마로 그래프를 고도화하여 검증해보았다. 


 이번 그래프에서는 관찰 값들이 특정 지점에 모여있는 것을 볼 수 있었다. 이는 단순히 파이널 써드 영역에 머무는 시간이 길다고 하여도 슈팅까지 이어지는 움직임과 전술은 별개의 부분이라고 추론해볼 수 있다. 우리는 종종 상대팀을 일방적으로 몰아놓고 경기를 운영하지만 골로 이어지지 않는 답답한 축구를 본 적이 있다. 위험 지역에서 많은 볼 소유를 하는 것은 공격 빈도를 높일 수 있는 조건 중 하나이지만, 효율적이지 못하면 무의미한 공격 작업일 뿐인 것이다. 그래프에서 눈에 띄는 위치에 있는 맨체스터 시티와 리버풀, 첼시, 아스날의 경우 많은 터치를 통해 슈팅까지 이어지는 빈도가 매우 높은데 이는 감독의 전술과 선수들의 역량 그리고 팀의 정체성까지 세가지 요소가 이루어져 나온 효과라고 볼 수 있다. 





마무리하며


스포츠 과학이 발전하면서 데이터 분석의 고도화가 이루어졌지만 지난 '18년 차 Gooner가 보는 축구와 데이터1'에서도 언급했듯이 축구라는 스포츠는 수 많은 변수가 동시 다발적으로 발생하는 스포츠인만큼, 다른 스포츠보다 직접적인 영향력은 다소 작다는 것을 알 수 있다. 하지만 데이터가 결과로 바로 이어지는 것은 아니지만, 고도화된 데이터를 수집하고, 분석하여 이후 팀의 전략에 효율적으로 반영하는 것은 매우 중요하다. 축구를 비롯한 스포츠 분야에 '스포츠 과학자', '데이터 분석가' 등 코칭 스태프들이 새로 각광받고 있는 것이 이를 반증한다. 우리가 일하고 있는 IT 업계 역시 데이터를 기반으로한 의사 결정과 비즈니스 활동이 성공을 좌우하는 큰 요소 중 하나이며, 이를 결정하는 PM과 기획자 역시 매우 각광받는 포지션임에 틀림 없다.



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari