brunch

You can make anything
by writing

C.S.Lewis

by 별더하기 Apr 27. 2021

스피어만 상관계수 1

스피어만 상관계수(Spearman's rank correlation coefficient 또는 Spearman's rho)는 영국의 심리학자인 찰스 스피어만(Charles Edward Spearman, 1863~1945)이 고안한 비모수적 상관분석 기법입니다.



스피어만은 독일의 라이프치히 대학교Leipzig University에서 철학을 공부해 박사 학위를 받았습니다.

당시에는 심리학이 별도의 학문으로 자리 잡기보다 철학의 한 분야로 인식됐습니다.

그 후 영국으로 돌아와 은퇴할 때까지 유니버시티 칼리지 런던(University College London)에서 심리학을 연구했습니다.

스피어만은 심리학자이기 전에 군 장교였습니다.

심리학자이면서 심리 통계학에도 뚜렷한 업적을 남겼죠.

앞서 소개한 인물들이 수학으로 방법론을 개발하고 전개해 근대 수리통계학에 업적을 남긴 사실과 비교해 보면 매우 독특한 분야를 연구했다고 할 수 있습니다.

스피어만 상관분석은 두 변인(변수) 간의 순위를 부여하고 연관성을 검정하는 기법으로, 피어슨 상관분석과 같이 -1~1 사이의 값(계수)을갖습니다.

보통 피어슨 상관분석을 곱적률 상관분석이라고 하며 스피어만 상관분석을 순위 상관분석이라고 합니다.

간단히 표현하면 전자는 두 변인 간의 선형관계를 계수로 표현한 것이고, 후자는 변인 간의 순위를 부여한 값을 기반으로 분석을 한다는 것이죠.

두 분석 모두 두 변인 간의 연관성 정도를 -1에서 1까지의 값으로 표현한다는 점은 비슷하지만, 들여다 보면 약간의 차이가 있습니다.

단순히 모수와 비모수를 다루는 기법과 선형과 순위를 기반으로 한다는 점뿐 아니라 결괏값, 즉 상관계수에서도 차이를 찾을 수 있습니다.

다음 그래프에 표시된 값을 너무 깊이 생각하지 마세요.

이해를 돕고자 비교했을 뿐 큰 의미는 없습니다.



앞의 그래프를 보면 한 쪽 변인이 증감함에 따라 다른 변인 역시 일정한 크기로 증가하는 양의 상관관계를 보이며 완벽한 선형관계를 이룹니다.

이때 피어슨 상관계수는 1이고, 스피어만 상관계수 역시 1이 나옵니다.

두 번째 그림 역시 두 변인 간에 양의 상관관계가 있습니다.

하지만 그비율이 일정하지 않습니다.

따라서 비례적 연관성을 검증하는 피어슨 상관계수는 대략 0.8 정도지만, 순위 비교를 통한 스피어만 상관계수는 여전히 1입니다.

이는 선형관계를 파악하는 피어슨 상관분석과 단순 순위 비교를 진행하는 스피어만 상관분석의 명확한 차이를 보여줍니다.

이 차이는 앞의 예시처럼 양의 상관관계는 물론 음의 상관관계에서도 같게 나타납니다.

다만 다음 그림처럼 두 변인 간 연관성이 존재하지 않을 때는 두 분석 모두 1과 –1이 아닌 0에 가까운 값(-0.089)으로 나타납니다.



그런데 스피어만은 비모수적 상관분석을 어떻게 발견한 것일까?

다음 포스팅에서는 그 과정을 들여다 보겠습니다.

매거진의 이전글 모수와 비모수
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari