brunch

You can make anything
by writing

C.S.Lewis

by 라인하트 Jun 14. 2021

Jamovi 의 이해 : 3. t 검증

  자모비(Jamovi)는 SPSS의 공개 오픈 소프트웨어 버전입니다. 자모비 소프트웨어는 아래 사이트에서 다운로드할 수 있습니다. 


   

이 글은 SPSS에서 사용법을 위주로 설명하여 배경 지식을 설명하지 못했습니다. 자모비를 설명할 때는 배경 지식을 위주로 설명합니다.  


유의 확률 p값을 계산하는 방법

   검정 통계량을 통해 계산된 확률이 p값입니다. p 값은 표본 통계량이 나타날 확률입니다. 귀무가설이 참일 때 표본 분포에서 추출한 표본 검정 통계량이 나올 확률입니다. 통계 기법이 사용하는 확률 분포 함수에 따라 정규 분포, t 분포, F 분포, 카이제곱 분포 통계량을 사용하여 p값을 계산합니다. 



t 검증 


   t 검증은 집단 간의 평균을 비교 분석하는 방법으로 모집단의 분산을 알지 못할 때 주로 사용하는 통계 분석 기법입니다. 표본의 크기가 클수록 표본 표준편차는 모표준편차와 비슷해지므로 정규 분포  z 분포와 비슷해지고 표본의 크기가 작을수록 정규 분포 z 분포를 따르지 않습니다. 


   통계학자 윌리엄 실리 고셋 (Willam Sealy Gosset)은 표본의 크기에 따른 분포 형태를 제시하였고, 그의 필명인 스튜던트(Student)를 사용하여 t 분포를 스튜던트 t 분포라고 합니다. t 분포는 표본의 크기를 나타내는 자유도 (df, degrees of freedom) 까지 고려합니다. 아래 그림은 자유도 (v)에 따른 t 분포의 모양입니다. 



1. 단일 표본 t 검증 (One Sample t-test)


1.1 단일 표본 t 검증 개요

   단일 표본 t 검증은 모집단의 모분산 또는 모표준편차를 알 수 없는 상황에서 표본의 평균과 특정한 평균값을 비교 검증하는 방법입니다. 


   예를 들면, 중학교 3학년의 지능이 100 인지를 검증하기 위해 중학교 3학년 200명을 대상으로 지능 검사를 합니다. 지능 검사의 평균이 103일 때 3점의 차이가 통계적으로 유의미한 지를 검증할 때 단일 표본 t 검증 기법을 사용합니다. 

      분모는 표준오차로 n은 표본의 크기이고, σ 는 표본의 표준 편차입니다. 분자는 표본 평균에서 모집단의 평균을 뺀 것입니다.  


1.2 단일 표본 t 검증 결과 해석

    아래 사례에서 단일 표본 t 검증을 계산합니다. 


Student's t (t 검정) 

   수학 성적을 아래 공식에 대입할 경우 다음과 같이 계산합니다. 

   영어 성적을 아래 공식에 대입할 경우 다음과 같이 계산합니다. 

   통계량과 동일한 값입니다. 


df (자유도)

   모집단이 아닌 표본 집단에 대해 통계량을 계산할 때 전체 데이터 개수 n에서 1을 뺍니다. 실제로 표본의 평균을 안다면 마지막 한 개의 데이터는 무조건 정해지기 때문입니다. 예를 들면, 3개의 표본 1,2,3 이 있고, 평균이 2입니다. 누군가 1과 2를 선택하면 평균 2를 맞추기 위해 나머지 데이터는 무조건 3입니다. 누군가 1과 3을 선택하면 평균 2를 맞추기 위해 나머지 데이터는 2입니다.  즉, n-1 까지 데이터는 무작위로 추출할 수 있지만, 마지막 데이터는 무작위 추출을 할 수 없기 때문입니다. 


   얘를 들면, 총 데이터의 수 n은 30개이고, 자유도는 1을 뺀 29개입니다. 


유의 확률 p값

   p값이 유의 수준 0.05 또는 0.01보다 작으면 귀무가설을 기각하고 대립가설을 채택합니다. p값이 유의 수준보다 클 경우 귀무가설을 채택합니다. 

   

   예를 들면, 수학 성적은 p값이 0.05 보다 크기 때문에 귀무가설을 채택하고, 영어 성적은 p값이 0.05보다 작기 때문에 귀무 가설을 기각합니다. 즉, 수학 성적의 평균은 65점이다는 귀무가설을 통계적으로 채택할 수 있고, 영어 성적의 평균은 65점이다는 귀무 가설을 통계적으로 기각합니다. 실제로 표본집단에서 수학 성적의 평균은 64.40이고, 영어 성적의 평균은 57.13 입니다. 



1.3 p 값의 이해 


   p값을 이해하기 위해  distrAction 모듈을 설치합니다. 

   메뉴에서 "Analysis >> distrACTION >> T-Distribution"을 선택합니다. 

 


수학성적의 p값

  자유도 df에 29를 입력하고, 수학의 t  분포 -0.47을 x1에  입력합니다. 양방 검증을 위해 x2에 0.47도 입력합니다. 결과창에 결과는 다음과 같습니다. 



    t값이 -0.47보다 큭고 0.47보다 작을 확률은 0.358이므로 귀무 가설을 채택할 확률은 1-0.358 = 0.642 입니다. 따라서,    0.05 보다 높은 확률이므로 학생들의 평균 성적이 65점이라는 귀무가설을 채택합니다. 


영어 성적의 p값

  자유도 df에 29를 입력하고, 수학의 t  분포 -2.84를 x1에  입력합니다. 양방 검증을 위해 x2에 2.84도 입력합니다. 결과창에 결과는 다음과 같습니다. 

    t값이 -2.84보다 크고 2.84 보다 작을 확률은 0.992 이므로 귀무 가설을 채택할 확률은  1-0.992 = 0.008입니다. 따라서, 0.05 보다 낮은 확률이므로 학생들의  평균 성적이 65점이라는 귀무가설을 기각합니다. 

택합니다. 




1.4 자모비 실습 : 단일 표본 t 검증


T 검증

    "Analyses >> T-Tests >> One Sample T-Test"를 선택합니다. 


Tests

    테스트 영역에서 Student's 를 선택합니다. 


Hypethesis

     가설 영역에서 귀무 가설과 대립가설을 입력합니다.  

     예를 들면, 귀무가설은 수학 성적의 평균은 65점이다입니다. 

                       대립가설으 수학 성적의 평균은 65점이 아니다 입니다.  


Missing values

    값이 없는 데이터를 제외 여부를 선택합니다. 

Descriptives  

t 검증에 필요한 기술 통계값을 확인합니다.


- N : 표본이 총수

- Mean : 표본 평균

- Median : 표본 중앙값

- SD : 표준 편차

- SE : 표준 오차 



평균 차이 (Mean Difference)

   평균 차이는 표본 집단의 평균과 가설에서 정의한 평균과의 차이입니다. 평균 차이는 t 검증에서 분자 영역입니다. 


      평균 차이에서 95% 신뢰 구간을 선택하면 신뢰수준을 보여줍니다.  Lower 값과 Upper 값 사이에 0이 있다면 귀무가설을 채택하고, 0이 없다면 귀무가설을 기각합니다. 

      예를 들면, 수학은 0이 있으므로 귀무가설을 채택하고, 영어는 0이 없으므로 귀무가설을 기각합니다. 


Effective Size (Cohen's d)

   효과 크기를 확인할 때 Cohen's d 를 사용합니다. Cohen's d 를 계산하는 공식은 다음과 같다. 


   예를 들어, 수학 성적에서 Cohen's d 를 계산합니다. 

 영어 성적에서도 Cohen's d를 계산합니다. 

   d값이 0.2 미만이면 작은 효과, 0.5 수준이면 중간 효과, 0.8 이상이면 큰 효과로 해석합니다. 0.2 이하라면 무시해도 좋다라고 해석할 수 있습니다. 따라서, 수학성적은 모평균 65점과 표본 평균 63점의 차이는 무시해도 좋다고 해석할 수 있습니다. 매우 미미한 차이입니다. 반면에 영어 성적은 -0.5로 중간 효과가 있습니다. 



2. 독립 표본 t 검증 (Independent Samples t-test)


2.1 독립 표본 t 검증 개요

   독립 표본 t 검증은 서로 다른 두 모집단의 평균을 비교하기 위해 두 표본 집단들간의 평균의 차이가 통계적으로 유의미한 지를 검증합니다. 


등분산과 이분산 

   분산(Variance)은 데이터가 흩어져 있는 정도를 나타냅니다.  두 개의 독립 표본이 정규 분포를 따를 때 분산이 같다는 것은 평균을 중심으로 데이터가 흩어진 정도가 같다는 것입니다. 왼쪽 그림은 평균은 다르지만, 분산이 같은 등분산이고, 오른쪽 그림은 평균도 다르고 분산도 다른 이분산입니다. 

    아래 그림은 평균이 같은 3개의 데이터 분포를 나타냅니다. 3가지 데이터는 평균이 같지만, 데이터가 흩어져 있는 정도가 모두 다릅니다. 평균이 같더라도 분산이 다르면 데이터는 현저하게 다르다는 것을 의미합니다. 




   따라서, 두 독립 표본이 같다는 것은 평균과 분산이 같다는 것을 의미합니다. 






2.2 독립 표본 t 검증 결과 해석

    

   아래 사례에서 독립 표본 t 검증을 계산합니다. 

   수학 성적을 남자와 여자 두 집단으로 나눈 후 등분산인지를 검증합니다. 스튜던트 t 검증은 두 모집단이 등분산이라고 가정하고, welch's t 검증은 두 모집단이 등분산이나 이분산에 상관없이 사용합니다. 


Student's t 등분산 가정



  표본의 표준편차 s 이고, 스튜던트 t 값은 두 표본의 평균의 차이를 두 표본의 표준 오차입니다.  수학 성적에 대한 남자 표본과 여자 표본을 비교합니다. 

   자유도 df는 여자 집단의 총 데이터 15개, 남자 집단의 총 데이터 15개에서 각 1개를 빼기 때문에 28입니다. 



Welch's t 이분산 가정

   두 표본이 이분산을 가정한 경우 t 값은 다음과 같습니다.  

   표본의 표준편차 s 이고, 스튜던트 t 값은 두 표본의 평균의 차이를 두 표본의 표준 오차입니다.  수학 성적에 대한 남자 표본과 여자 표본을 비교합니다. 



   반올림 문제로 인해 값의 차이를 제외한다면 같은 값입니다. 



Normality Test(Shapiro-Wilk)

   사피로-윌키 값은 0.9016이고 유의확률 p는 0.05보다 작은 값입니다. 따라서, 수학 점수는 정규 분포를 벗어난 모양입니다. 


Levene's F 등분산 가정 

    Levene's F 테스트는 두 독립 표본이 등분산이지를 검증합니다. 두 독립 표본이 같다는 것은 평균과 분산이 같다는 것을 의미합니다. Levene의 등분산 F 검정은 분산의 동일성을 검정합니다. Levene의 등분산 검정에서 귀무가설과 대립가설은 다음과 같습니다.


          귀무가설 : 두 표본은 등분산이다. (p > 0.05) 

          대립가설 : 두 표본은 등산이 아니다.  (p < 0.05)


   Levene 등분산 검점에 대한 유의확률 p값이 0.05보다 크면 귀무가설을 채택하고 대립가설을 기각합니다. 유의확률 p값이 0.05보다 작으면 귀무가설을 기각하고 대립가설을 채택합니다. 


   수학 성적을 남자(male)과 여자(Female)로 묶어서 두 집단이 등분산인지를 Levene's F 테스트로 검증합니다. Levene's F 의 유의 확률 p는 0.180 이므로 귀무가설을 채택하고 두 표본은 등분산입니다. 



2.4 자모비 실습 : 독립 표본 t 검증


2.4.1 Independant Samples T 검증 

    "Analyses >> T-Tests >> Independant Samples T-Test"를 선택합니다. 


   수학 성적과 영어 성적을 남자와 여자 그룹으로 나누고 등분산인지 이분산인지를 검증합니다. 두 그룹은 모두 등분산입니다. 


2.4.2 Additional Statistics - Mean Difference

   평균 차이 (Mean Difference)와  표준 오차 차이 (SE difference)를 보여줍니다. 평균 차이는 두 집단의 평균을 뺀 값이고, 표준 오차는 다음과 같이 계산합니다. 



  수학 성적의 표준 오차 차이는 다음과 같이 계산합니다. 



2.4.3 Additional Statistics Difference


   효과 크기를 확인할 때 Cohen's d 를 사용합니다. Cohen's d 를 계산하는 공식은 다음과 같다. 



2.4.4 Assumption Checks 



Normality Test(Shapiro-Wilk)

   사피로-윌키 값은 0.9016이고 유의확률 p는 0.05보다 작은 값입니다. 따라서, 수학 점수는 정규 분포를 벗어난 모양입니다. 


Levene's F 테스트

   수학 성적을 남자(male)과 여자(Female)로 묶어서 두 집단이 등분산인지를 Levene's F 테스트로 검증합니다. Levene's F 의 유의 확률 p는 0.180 이므로 귀무가설을 채택하고 두 표본은 등분산입니다. 


매거진의 이전글 Jamovi 의 이해 : 2. 추리 통계
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari