11회 연속 본선 진출을 기원합니다.
2026년 북중미 월드컵 3차 예선이 계속되고 있는 요즘이다.
내가 기억하는 우리나라 대표님의 월드컵 첫 출전은 1986년이다. 그때 독일에서 명성을 날리고 계셨던 차 범근 감독님의 국가 대표 합류 소식을 듣고 혹시나 한 경기라도 이길 수 있지 않을까 하는 기대로 말 그대로 전 국민이 열정적으로 응원했었던 기억이 난다. 비록 예선에서 모두 패배했지만 Top Tier인 아르헨티나와 경기에서 황 장선 선수의 벼락같은 중거리 슛과 이탈리아에서 최 순호 선수의 페널티 박스 오른쪽에서의 그림 같은 골은 앞으로 월드컵에서 우리나라 축구의 가능성을 보여준 것이라고 생각했다.
우리나라는 1986년을 시작 2022년까지 연속 10회 월드컵 본선에 진출했고, 2026년 11회 연속 진출을 위해 고군분투 중이다. 아직 본선 직행을 확정하지는 못했지 B조에서 1위를 굳건히 지키고 있어 오는 6월에 이라크, 쿠웨이트 경기에서 좋은 결과를 만들어 낼 것으로 기대하고 있다.
과연 우리나라는 이번 6월 3차 예선에서 과연 몇 골을 넣을 수 있을까?
축구는 상대방보다 더 많을 골을 상대방 골대에 넣는 경기다. 선수가 공을 골대로 향해 찼을 때 골대에 공이 들어갔는지, 아닌지 단 두 가지 결과만 존재한다. 이 또한 베르누이 상황이다. 그렇다면, 우리나라 대표팀과 상대팀이 몇 골을 넣을 것인지 예상을 한다면 승리를 예측할 수 있지 않을까? 지금까지 치러진 예선 경기 결과를 바탕으로 예상을 해 보자.
위 결과를 보면 최근 8경기 기준으로 한국은 평균 1.75골, 이라크는 1골, 쿠웨이트는 0.875골을 넣고 있음을 알 수 있다. 이를 바탕으로 국가별 게임당 골 수에 대한 확률은 다음 그림과 같다.
우리나라의 경우 0골을 넣을 경우는 20% 아래이고, 다른 두 나라는 35% 이상이다. 또한 2골 이상 넣을 확률도 다른 두 나라보다 높다. 조심스럽게 예측한다면 우리나라가 1골 이하로만 실점한다면 최소한 비기거나 승리할 확률이 높지 않을까?
축구는 다른 구기 종목에 비해서 상대적으로 점수(골)를 뽑기가 어려운 경기다. 이렇듯 관심사가 발생하기 어려운 상황에서 활용하는 분포가 "포아송 분포"다. 프랑스 수학자인 시메옹 드 포아송의 이름을 딴 이 확률분포는 특정 시간, 공간 또는 명확하게 정의한 구간(Unit)에서 희귀하게 발생하는 관심사가 발생할 건수에 대한 확률을 구할 때 사용한다. 이때 우리는 평균 발생 건수는 알아야 포아송 본포를 활용할 수 있다.
포아송 분포는 일상생활과 AI에서도 많이 활용하고 있다.
- 특정 시간(오전 7시 ~ 9시) 사이에 방문하는 고객 수에 대한 예측 --> 고객 대기 시간 예측과 대
- 특정 기간(예, 1년)에 발생하는 자동차 사고 건수에 대한 예측
- 한 권의 책에서 발생하는 오탈자 개수에 대한 예측
- 노트북, TV, 모니터의 대형 화면에 있는 불량 개수에 대한 예측
- 단위 시간에 발생하는 이상 개수를 활용한 비 정상 패턴의 확인
- 스팸 탐지와 같은 텍스트 분류작업의 활용 등등...