brunch

You can make anything
by writing

C.S.Lewis

by 별더하기 Jun 05. 2020

근대 수리 통계학의 창시자-로널드 피셔와 표본

통계학의 수학적 기초를 확립한 칼 피어슨이 근대 수리 통계학의 아버지라면 이번에 소개할 사람은 근대 수리 통계학에 생명을 불어넣은 이 분야의 절대 권력자라 할 수 있다.

어느 분야든 경쟁 상대가 있다는 것은 해당 분야의 발전과 함께 몸담고 있는 사람들이 함께 발전하는 기회가 된다는 의미가 있다. 칼 피어슨 또한 그가 활동할 당시 경쟁 상대인 로널드 피셔(Ronald Aylmer Fisher, 1890~1962)가 있었기 에 통계학의 학문적 위치가 더욱 견고해졌다.

이 시기에 유전학과 통계학은 매우 밀접한 관계를 형성하고 있었다. 크게 피어슨을 중심으로 한 생물측정학파biometricians와 윌리엄 베이트슨(William Bateson, 1861~1926)을 중심으로 한 멘델학파Mendellians가 있었는데, 이 두 학파의 지루한 공방과 논쟁을 일시에 종식시킨 인물이 바로 피셔다.


앞서 소개한 것처럼 현대 통계 분석은 분석하려는 대상의 특성을 파악하고자 통계적 가설을 정하고 전체로부터 표본을 추출해 가설 검정으로 추론하는 것이 일반적이다. 피셔는 이 부분에도 영향을 미쳤는데, 분석 대상 전체(모집단)와 전체에서 추출한 일부(표본)를 명확하게 분리하였고 일부를 통해 전체에 대한 분석과 추리가 가능하다는 방법을 귀무가설로 증명했다. 이후 피셔는 추측 통계학, 즉 추계학stochastic을 창시하고 통계학 발전에 한 획을 그었다.

피셔의 업적은 일일이 열거하거나 설명하기에 벅찰 정도지만 그의 업적 중에서도 선택된 일부가 전체를 대변할 수 있다는 점을 수학적으로 증명해낸 부분은 데이터를 다루는 모든 이들에게 기립박수를 받아 마땅하지 않을까 생각한다. 그러면 귀무가설null hypothesis을 최초로 사용한 피셔는 과연 어떻게 이용어를 사용하게 된 것일까?


영국의 뮤리엘 브리스톨(Muriel Bristol, 1888~1950) 박사는 그 시대의 여느 부인들처럼 차를 마시고 맛을 음미하는 것에 매우 중요한 의미를 부여했다. 어느 날 그녀가 항상 가는 까페에서 매번 마시는 차를 주문하고 시간을 보내고 있었다. 하지만 그날따라 차 맛이 평소와 달랐다. 이를 의아하게 생각한 그녀는 다시 한 번 차를 마셔보았다. 평소와 달리 차에 우유를 먼저 넣고 차를 따랐음을 파악한 그녀는 즉각 종업원을 불러 평소처럼 차를 먼적 따르고 우유를 나중에 넣어달라고 요청했다. 종업원은 의아해했지만, 그녀가 부탁한 대로 다시 차를 가져다주었다. 이후 그녀는 자신을 비롯한 영국 대부분 귀부인이 우유와 차를 넣는 순서에 따른 차 맛의 차이를 명확하게 구분할 수 있다고 공공연히 말하고 다녔다.

이 소식을 들은 피셔는 브리스톨의 주장에 궁금증이 생겨 조사를 해보기로 했다. 조사에 앞서 그는 브리스톨의 주장이 전혀 터무니없지는 않지만, 제조 순서에 따른 차 맛의 차이를 구별하기 어렵다는 쪽에 무게를 두고 ‘귀부인들은 차 맛을 구분하기 어렵다’라는 암묵적인 결론을 설정했다. 그는 주변에서 차 맛을 안다는 귀부인들을 초대했다. 그리고 총 8잔의 차를 준비해 4잔은 우유를 먼저 넣고 나머지 4잔은 차를 먼저 넣어 부인들이 모인 탁자 위에 무작위로 올려놓았다. 그리고 다음과 같이 말했다.

“자 탁자 위에 8잔의 차가 준비돼 있습니다. 한 잔씩 천천히 시음해 보시고 우유가 먼저 들어갔다고 생각되면 왼편으로, 차가 먼저 들어갔다고 생각되면 오른쪽으로 잔을 놓아 주세요.” 

그곳에 모인 부인들은 차를 한 잔씩 음미했다. 그런데 놀랍게도 부인들은 모두 정확하게 차 맛을 구별해 잔을 분리했다.

이 실험에서 피셔는 그의 암묵적인 결론(우유와 차를 넣는 순서에 따른 차 맛의 차이를 구분하기 어렵다)을 좀 더 명확하게 설명하기 위해 확률을 적용했다. 총 8개의 잔에서 다른 4개의 잔을 선택해 나올 수 있는 경우의 수는 70가지고, 이 중에서 3개는 정확히 구별하고 1개 이하로 틀린 경우에는 부인들이 차 맛을 구별할 수 있다고 판단하는데, 그 확률은 24.3% (22.8%+1.4%)였다. 따라서 무작위 실험에서 3잔 이상 정확하게 구별할 확률 24.3%보다 결과가 높다면 ‘부인들이 차 맛을 구분하기 어렵다’는 그의 암묵적인 결론을 포기하기로 했다.



부인들의 차감별 시험lady tasting tea 과정과 이론을 담은 피셔의 책 『 실험 계획법The Design of Experiments』에서 그는 암묵적으로 설정한 결론인 ‘부인들은 차 맛을 구분하기 어렵다’라는 가정을 ‘null hypothesis’라 한데서 귀무가설이 유래하게 됐다. 그가 세운 귀무가설이 맞다는 것을 증명하기는 어렵지만 이 가설이 거짓이라는 것은 증명할 수 있었고, 가설은 거짓이 됐다. 따라서 이 가설의 반대인 ‘부인들은 차 맛을 구분할 수 있다’를 증명했다.


현재의 통계는 가설과 표본으로 설명된다. 물론 피셔가 설명한 귀무가설은 현재의 귀무가설과 정확하게 일치한다고 할 수 없다. 그러나 그가 설명한 이론이 현재 데이터 분석 분야에 영향을 줬다는 것은 무시할 수 없는 사실이다.


http://www.yes24.com/Product/Goods/71859635?scode=032&OzSrank=1


매거진의 이전글 근대 수리 통계학의 아버지-칼 피어슨과 상관분석
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari