brunch

You can make anything
by writing

C.S.Lewis

by 조영필 Zho YP Jul 24. 2016

t 분포 이야기

조영필

t 분포는 1908년 윌리엄 고셋이 아일랜드 더블린의 기네스 양조 공장에서 맥주 발효 시 맥아 안에 있는 효모의 수를 작은 표본으로도 파악하기 위해서 만들었다.

당시에는 대표본으로 모집단을 파악하는 것이 일반적인 통념이었는 데, 고셋은 자신이 처한 소표본에서의 추정이 실제로 연구자들이 당면한 보다 일반적인 상황이라고 생각하였다.

그런데 소표본으로 모집단을 추정하고자 할 때의 문제는 표본의 분산이 모집단의 분산에 비해 작아지는 편향이었다. 이래서는 소량 표본의 통계량으로 모집단의 모수를 타당하게 추정할 수 없다.

고셋은 그런 고민 속에서 매일 측정된 소표본의 분포와 분산을 조사하였다. 그러던 어느날 그 분포가 피어슨의 X^2 분포와 연관성이 있음을 발견하게 된다. 결국 그는 표준정규분포와 X^2 분포의 비율인 t 분포를 만들게 되었다. 이로써 작은 표본으로도 모집단을 추정할 수 있는 추리통계학의 길이 열리게 된다.

고셋은 t 분포를 개발하면서, 자유도의 개념도 정의하였다. 그러나 정작 '자유도'라는 용어 자체는 피셔가 X^2 분포에 관한 논고에서 처음으로 사용하였다.

고셋은 기네스사의 내부 보안 방침에 저촉되지 않기 위하여 자신의 이름을 숨기고 Student라는 필명으로 통계학 학술지 [Biometrica]에 이 사실을 논문으로 기고하였다. 이때 분포의 변수명으로는 Z 를 사용하였다고 한다. 그러나 당시 Z 는 이미 정규분포에 따르는 변수로 사용하고 있었기 때문에 이를 피하기 위해 훗날 피셔가 이 변수를 t 로 변경하였다. 그래서 "스튜던트의 t 분포" 가 되었다.

고셋이 갑자기 죽어서 통계학회에서 그의 유고 논문집을 출판하기 위한 자금 협찬차 기네스 맥주회사를 방문할 때까지도 회사에선 고셋의 논문투고 및 학문활동 사실을 전혀 모르고 있었다고 한다.

고셋의 생전에 t 분포는 그리 높은 평가를 받지는 못하였다. 그러나 이제 우리는 중심극한정리, 가설검정 그리고  자유도로 멋을 낸 t 검추정을 매일같이 사용하고 있다.

(D. 살스버그, [천재들의 주사위] 등 참고)

매거진의 이전글 평균, 분산 그리고 표준편차의 구조

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari