brunch

You can make anything
by writing

C.S.Lewis

by LenJoHoie Sep 17. 2019

어떨 때 어떤 통계를 써야 할까?

어떤 통계를 어떨 때 사용해야 할까?

통계를 사용하기 전에 알아야 할 것이 어떨 때, 어떤 통계를 사용해야 하는지에 관한 것이다.

사실 매우 간단한 것이기 때문에 알아두면 알아두면 분명히 도움이 된다.


가장 큰 기준은 '표본 집단의 수'와 '독립변수의 수', '독립성', 그리고 '정규분포'이다. 나눌 기준이 많을 것 같지만 생각보다 어렵진 않다. 가장 먼저 고려야 해야 할 것은 표본 집단이 몇 개 인가하는 것이다.


큰 기준: 표본 집단이 3개 이상인가?

가장 큰 구분은 표본 집단의 개수이다. 

표본 집단이 3개 이상이면 아노바 계열을, 2개라면 t-test 계열을 사용하면 된다.

Yes: ANOVA 계열(one-way, two-way, kruskal-walis)
No: T-test계열(T-test, paired t-test, wilcoxon, mann-whitney)


표본 집단이 2개이다. 어떤 통계를 써야 하지?

표본 집단에 따라 통계 기준이 나눈 후에는 간단하다. '독립성'과 '정규분포를 따르는가?'에 따라서 사용해야 할 통계가 나뉜다. 아래 4가지 중에 하나를 선택하면 된다.


여기서 독립적이란 뜻은 각기 다른 두 그룹에 실험을 진행한 경우이며, 비독립적이란 이야기는 같은 그룹에 실험을 두 번 진행한 경우이다.


t-test: 표본의 개수가 2개이고 독립적이며 정규분포를 따르는 경우
paired t-test: 표본의 개수가 2개이고 비독립적이며 정규분포를 따르는 경우
wilcoxon-rank-test: 표본의 개수가 2개이고 비독립적이며 정규분포를 따르지 않는 경우
wilcoxon singed-rank: 표본의 개수가 2개이고 독립적이며 정규분포를 따르지 않는 경우 



표본 집단이 3개 이상이다. 어떤 통계를 써야 하지?

표본 집단이 3개 이상이라면 ANOVA 계열을 사용한다. ANOVA 계열 역시 독립성과 정규분포에 따라서 크게 구분이 된다. 아래 다섯 가지 중에 하나를 사용하면 된다.

ONE-WAY ANOVA: 표본의 개수가 3개 이상이고 독립적이며, 정규분포를 따르며, 독립변수가 하나인 경우
TWO-WAY ANOVA: 표본의 개수가 3개 이상이고 독립적이며 정규분포를 따르며 독립변수가 두 개 이상인 경우 
Repeated-Measure ANOVA: 표본의 개수가 3개 이상이고 비독립적이며 정규분포를 따르는 경우
Kruskal-walis test:  표본의 개수가 3개 이상이고 독립적이며 정규분포를 따르지 않는 경우 
freid-man test : 표본의 개수가 3개 이상이고 비독립적이며 정규분포를 따르지 않는 경우 


작가의 이전글 통계, 분포에 대해 알기 전에
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari