brunch

You can make anything
by writing

C.S.Lewis

by MeeyaChoi May 06. 2024

어디에나 가우스분포

빅데이터 속 세상

마이클 조던의 기록에 숨겨진 분포는 뭘까?


마이클 조던은 1984년부터 1998년까지 미국 프로농구(NBA)의  시카고 불즈(Chicago Bulls)에서 13 시즌 동안 슛팅 가드(Shooting Guard)와 스몰 포워드(Small Forward)로 뛰면서 10번 정규시즌 득점왕과 5번 MVP를 수상했고, 플레이오프 챔피언쉽에서 무려 6번이나 팀을 우승으로 이끌며, 세계 농구역사의 전설이 되었다. 마이클 조던이 당시 유명하던 아디다스 대신 무명의 나이키 운동화를 광고하자, 온 세상에서 마이클 조던과 나이키를 모르는 사람이 없을 만큼 유명해지면서 마이클 조던과 나이키는 큰 돈을 벌었고, 마이클 조던은 돈으로도 이후 모든 스포츠 선수들의 선망의 대상이 되었다.

       

마이클 조던의 정규시즌 통산기록은 은퇴 후 다시 복귀한 2001, 2002 시즌 싱턴(WAS)에서의 기록 때문에 다소 떨어졌지만, 정규시즌 총 1072경기에서 매 경기 평균 23번의 2점짜리 필드골을 시도해서 49.7%이라는 높은 슛성공률을 유지했으며, 또한 매 경기 1~2회 3점 슛을 시도해서 32.7%의 꽤 괜찮은 성공률을 보였다.


마이클 조던의 정규시즌 2점짜리 필드골의 분포를 시뮬레이션으로 그려보자. 아래 그림의 맨 왼쪽 그래프는 한 경기에서 2점 슛 23번 중 12번 실패와 11번 성공을 나타낸다. 두번째 그래프는 20경기에서 각 경기마다 2점 슛 23번 중 성공횟수의 분포이고, 세번째 그래프는 한 시즌 82경기에서 각 경기마다 2점 슛 23번 중 성공횟수의 분포이며, 마지막 그래프는 마이클 조던의 커리어 통산 1072 경기에서 각 경기마다 2점 슛 23번 중 성공횟수의 분포를 나타낸다. 


마이클 조던의 정규시즌 경기의 횟수가 1번, 20번, 82번, 그리고 1072번으로 증가하면서, 슛 성공과 실패의 두 값만 갖던 분포가 점점 변하여, 분포의 봉우리와 꼬리가 생기고, 봉우리는 가운데로 옮겨가고 양쪽 꼬리는 점점 얇아진다. 맨 왼쪽 성공과 실패 두 값만 표현하는 그래프의 이름이 베르누이분포이며, 가운데 둘은 이항분포, 맨 오른쪽 종모양으로 부드러운 곡선을 이루는 그래프의 이름이 가우스분포 또는 정규분포이다.


모든 NBA 선수들의 2점슛 분포가 이런 정규분포로 수렴하는 건 아니다. 마이클 조던처럼 경기마다 2점 슛의 시도가 많을수록, 커리어 통산 경기수가 많을수록 정규분포가 잘 드러난다. 마이클 조던이 역대 최고 선수였음을 생각할 때, 보통 선수들의 경기 2점 슛 시도가  성공률이 낮거나 또는 경기수가 충분히 많지 않은 상태로 은퇴하면, 커리어 통산 기록이 비대칭으로 보일 가능성이 높다. 따라서 커리어 통산 기록 분포가 정규분포인 것만으로도, 마이클 조던이 얼마나 대단한 선수인지 알 수 있다.


정규분포의 역사는 1733년으로 거슬러 올라간다. 프랑스 수학자 드무아브르가 데이터가 커질 때 베르누이 분포의 합이 정규분포에 수렴함을 최초로 발견했고, 1774년 라플라스는 이를 증명하려 애썼다. 1801년에, 가우스가 태양계 최초로 발견된 왜소행성 세레스(Ceres)의 궤도를 예측하기 위하여, 행성궤도의 관측 오차 분포로 정규분포를 사용했다. 그 결과 세레스는 정확하게 가우스가 예측한 위치에서 관측되었고, 이 일로 가우스는 당시 천문학계에서 큰 명성을 얻었다. 데이터가 커질 때, 합이니 평균이 정규분포임 정확하게 증명한 사람은 리아프노프(Liapounoff, 1899)였다.


퀘틀렛과 골턴이 키, 가슴둘레, 시험점수, 곡물의 무게 등에서도 정규분포가 나타나는 것을 밝히면서, 정규분포의 역할이 다양한 사회현상으로 확장되었다. 이 곡선을 처음 발견한 드무아브르는 좀 억울하겠지만, 골턴은 이것을 가우스 곡선이라고 불렀고, 피어슨은 정규분포라고 불렀다. 오늘 날 수학자와 과학자들이 정규분포를 ‘자연 그 자체의 곡선(curve of nature itself)’이라고 부르며, 이 정규분포는 수학과 과학, 공학, 의학, 인문 사회학뿐만 아니라, 마이클 조던의 슛 기록 같은 스포츠 등 어디에서나 발견되고 있다.


데이터가 커지자, 어디에나 가우스분포가 보인다.



참고


1. 위키피디아 Michael Jordan stats

https://www.basketball-reference.com/players/j/jordami01.html


2. History of Statistics 2. Origin of the Normal Curve – Abraham DeMoivre (1667- 1754).

The Evolution of the Normal Distribution S. Stahl. Mathematics Magazine. 79, 2, 2006 https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf


3. 야코프 베르누이 (1654-1705) 스위스 수학자이며, 온 집안이 수학자 과학자였으며, 그 중 한 명이 오일러의 스승이다.


4. 드무아브르 (De Moivre, 1667-1754) 프랑스 수학자이다.


5. 요한 카를 프리드리히 가우스 (Johann Carl Friedrich Gauss, 1777-1855) 독일의 수학자, 물리학자. 수학의 왕자라는 별명이 있을 만큼, 수학과 통계학, 물리와 천문학, 전자전기학 등에서 분야를 가리지 않고, 획기적인 업적을 남겼다. 특히, 통계 자료분석의 초석이 되는 최소제곱법을 처음 사용하고 발전시켰다고 알려져 있다. Wikipedia 카를_프리드리히_가우스 중 천문학


6.  아돌프 퀘틀렛 (Adolphe Quetelet, 1796-1874) 벨기에 천문학자, 수학자, 통계학자이다.


7. Francis Galton(1822-1911) 영국의 인류학자이고, 찰스 다윈의 사촌 동생이며, 유전학에 관심이 많았다.


8. Karl Pearson(1857-1936) 영국의 통계학자이고, 법학자, 우생학자이다. 그의 저서로 “The Grammar of Science(1892)가 있으며, 상관계수, 카이제곱 검정법 등을 개발하였다.



작가의 이전글 큰 수의 법칙
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari