brunch

You can make anything
by writing

C.S.Lewis

by 별더하기 May 21. 2021

윌콕슨 순위합 검정

wilcoxon rank sum test


근대 수리통계의 근간은 일반적으로 유럽, 특히 영국과 독일에서 정립됐다고 해도 과언이 아닙니다.

앞서 살펴본 통계 관련 인물 모두 유럽인인데, 특히 영국 사람이 많았습니다.

이번에는 유럽에서 벗어나 북아메리카 대륙으로 떠나 보겠습니다.

미국의 화학자이자 통계학자 프랭크 윌콕슨(Frank Wilcoxon, 1892 ~ 1965)이 주인공입니다.

윌콕슨은 아일랜드계 미국인으로 매우 부유한 환경에서 자랐습니다.

그는 미국 코넬 대학교Cornell University에서 물리 화학 박사 학위를 받았습니다.

윌콕슨은 화학을 전공했지만, 통계학자로도 명성이 매우 높았는데, 비모수적 검정 기법인 윌콕슨 순위합 검정(wilcoxon rank sum test)과 윌콕슨 부호 순위 검정(wilcoxon signed rank test)을 정립했습니다.

모수적 양측 검정 기법인 t-검정에 대응하는 비모수적 양측 검정 기법의 하나가 윌콕슨이 정립한 순위합 검정 기법입니다. 

두 기법은 엄연히 다르나 이후 설명할 부분은 공통으로 적용되므로 이해를 돕기위해 이하 순위합 검정이라 통칭하고 그 방법을 간략하게 살펴봅니다.


데이터 분석에는 분석할 데이터가 필요합니다.

데이터 수집은 수집자가 연구하거나 담당하는 분야에서 확보하는 것이 유리하고 손쉽죠.

유전학자는 유전학 관련 데이터를, 심리학자는 심리학 관련 데이터를, 화학자는 화학 관련 데이터를 수집하는 게 편하다는 얘기죠.

그래야 자신의 전공 분야도 인정받기 때문입니다.

윌콕슨은 화학자라서 윌콕슨이 정립한 순위합 검정은 화학 실험을 기반으로 진행됐습니다.

그가 선택한 실험 대상은 스프레이 파리약으로 파리가 죽을 확률이었죠.

윌콕슨은 각각의 독립된 실험 결과를 비교하고 결과의 차이를 확인했습니다.

윌콕슨의 실험과 분석 과정을 살짝 엿봄으로써 순위합 검정 기법이 어떤 과정으로 진행되는지 간단히 살펴보겠습니다.

윌콕슨은 서로 다른 환경에서의 실험 결과를 다음과 같이 정리했습니다.


두 실험 결과에 차이가 있다는 가정을 증명하려 했기 때문에 양측 검정을 시행했습니다.

그러나 두 실험은 서로 독립된 환경이라서 정규분포를 가정할 수 없었죠.

고민 끝에 윌콕슨은 두 실험 결과를 하나로 합쳐 확률이 낮은 결과부터 높은 결과를 오름차순으로 정렬하고 순위를 부여했습니다.

음영 처리된 항목은 실험 B의 결과입니다.

순위 부여 시 결과가 같으면 해당 순위의 평균값을 취합니다.

앞의 표에서 66%가 세 번이었고 해당하는 순위가 9, 10, 11이므로 순위의 평균인 10을 부여했습니다.

이후 실험 A와 B의 순위를 각각 모두 더합니다.


실험 A의 순위합: 3 + 8 + 10 + 12.5 + 12.5 + 14 + 15 + 16 = 91


실험 B의 순위합: 1 + 2 + 4 + 5 + 6 + 7 + 10 + 10 = 45


이렇게 도출된 각 실험의 순위합을 비교합니다.

두 실험의 결과가 비슷하다면 순위합은 비슷하겠지만 결과가 서로 다르면 실험 결과가 한쪽으로 치우쳐 앞의 예시처럼 두 순위합이 차이가 난다고 설명합니다.

이것이 바로 윌콕슨 순위합 검정의 기본적인 배경입니다.

물론 논리적 전개는 단순 순위합을 비교하는 것으로 끝나지 않습니다.

다만 이러한 발상으로 양측검정이 충분히 가능하다는 것을 정립한 것은 실로 대단하죠?

때로는 단순함이 복잡함을 설명합니다.

윌콕슨의 순위합 검정은 독립된 집단의 결과를 통합해 정리하고 순위를 부여한 뒤 각각의 집단에 대한 순위합을 구해 비교하는 방식입니다.


매거진의 이전글 스피어만 상관계수 2
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari