brunch

You can make anything
by writing

C.S.Lewis

by 라인하트 May 03. 2021

SPSS로 배우는 통계 - 7. 독립 표본 t 검정

    변수의 척도가 범주형인지 연속형인지에 따라 데이터를 분석하는 방법이 다릅니다.  가설의 독립변수가 범주형이고 종속변수가 연속형일 때 사용할  수 있는 검정 방법은 t-test입니다. t 테스트는 두 개의 표본 평균 간의 차이를 검정합니다. 독립변수는 성별 또는 나이대와 같은 범주형 데이터이고 종속 변수는 평균을 산출할 수 있는 연속형 데이터입니다. 



독립 표본 t 검정 (Independent samples t test) 개요


      독립 표본 t 검정은 두 개의 독립적인 표본 간에 평균값이 동일한 지를 검정합니다. 두 독립 표본이 평균이 같고 등분산이라고 가정합니다. 


Levene의 F 검정

   분산(Variance)은 데이터가 흩어져 있는 정도를 나타냅니다.  두 개의 독립 표본이 정규 분포를 따를 때 분산이 같다는 것은 평균을 중심으로 데이터가 흩어진 정도가 같다는 것입니다. 왼쪽 그림은 평균은 다르지만, 분산이 같은 등분산이고, 오른쪽 그림은 평균도 다르고 분산도 다른 이분산입니다. 

    아래 그림은 평균이 같은 3개의 데이터 분포를 나타냅니다. 3가지 데이터는 평균이 같지만, 데이터가 흩어져 있는 정도가 모두 다릅니다. 평균이 같더라도 분산이 다르면 데이터는 현저하게 다르다는 것을 의미합니다. 




   따라서, 두 독립 표본이 같다는 것은 평균과 분산이 같다는 것을 의미합니다. Levene의 등분산 F 검정은 분산의 동일성을 검정합니다. Levene의 등분산 검정에서 귀무가설과 대립가설은 다음과 같습니다.


귀무가설 : 두 표본은 등분산이다.  

대립가설 : 두 표본은 등산이 아니다.  


   여기서, Levene 등분산 검점에 대한 유의확률 p값이 0.05보다 크면 귀무가설을 채택하고 대립가설을 기각합니다. 유의확률 p값이 0.05보다 작으면 귀무가설을 기각하고 대립가설을 채택합니다. 


   분산의 동일성을 검정하는 Levene의 등분산 F검정은 분산분석과 회귀분석 등에서 사용합니다. 



SPSS에서 독립 표본 t 검정하기   


1. 가설의 설정

   "자동차 판매 사원들을 교육하는 두 가지 방법이 있습니다. 신입 판매 사원 18명을 무작위로 나누어 A 방법과 B 방법으로 교육하였습니다. 교육 후 6개월간의 판매실적이 있을 때 교육 방법에 따른 판매 실적에 차이가 있다고 할 수 있는 가?"


   연구가설을 설정하고, 가설 검증을 위한 귀무가설과 대립가설을 설정합니다. 


연구가설

   판매 사원들에 대한 두 가지 교육 방법에 따른 판매실적에 차이가 있을 것이다


귀무가설

   두 가지 교육 방법의 분산이 같다 


대립가설

   두 가지 교육 방법의 분산은 같지 않다  


   연구 결과가 귀무가설을 채택할지 또는 기각할지 확인하기 위해 독립 표본 t 검정을 사용합니다.



2. SPSS에서 일표본 t 검정 설정하기


1) 메뉴바에서 "분석 >> 평균비교 >> 독립표본 T 검정"을 선택합니다. 



2) 독립표본 T 검정 창에서 테스트변수에 "판매실적"을 넣고, 그룹변수에 "교육방법"을 넣습니다. 그룹 정의 버튼을 누른 후 A 방법은 1, B 방법은 2로 코딩합니다. 



3. 독립 표본 t 검정 분석하기

  집단통계량(Group Statistics) 표에서  A 방법의 평균은 35.22 이고, B 방법의 평균은 31.56입니다. 그리고, 독립표본 테스트(Independent Samples Test)에서 F 검정은 0.061이고 유의확률 (Sig.)은 0.807입니다. 따라서, Levene 등분산 검정의 유의확률이 0.05보다 크므로 영가설을 기각할 수 없고 채택합니다. 


      논문에서  Levene 등분산 검정의 결과에 따라 등분산을 가정하는 경우(Equal Varienaces assumed)에 해당하는 평균의 동일성에 대한 t 검정(t-test for Equality of Means)  값을 사용합니다. 다음과 같이 표현합니다.


   " A 방법(35.22)과 B 방법 (31.56)의 두 가지 교육 방법에 따른 판매실적에는 유의미한 차이가 없는 것으로 나타났다 (t= 1.649, p= .119)"


       유의미한 차이가 없는 이유는 p값이 0.119로 0.5보다 크기 때문입니다. 

     

4. 테스트 파일




SPSS에서 독립 표본 t 검정하기 - 과제 파일  


1. 가설의 설정

   "성별에 따른 수학성적과 국어성적에 차이가 있는 지를 검정하시오"


   연구가설을 설정하고, 가설 검증을 위한 귀무가설과 대립가설을 설정합니다. 


연구가설

   성별에 따른 수학성적과 국어성적은 차이가 있을 것이다. 


귀무가설

   성별에 따른 수학성적과 국어성적의 분산은 같다 

   (성별에 따른 수학성적과 국어성적에 차이가 없다) 


대립가설

    성별에 따른 수학성적과 국어성적의 분산은 같지 않다  

     (성별에 따른 수학성적과 국어성적에 차이가 있다) 


   연구 결과가 귀무가설을 채택할지 또는 기각할 지 확인하기 위해 독립표본 t 검정을 사용합니다.


2. SPSS에서 독립 표본 t 검정 설정하기


3. SPSS에서 t 검정 분석하기


수학성적 분석

  집단통계량(Group Statistics) 표에서  수학 성적을 기준으로 남성의 평균은 80.67이고, 여성은 84.53입니다.  그리고, 독립표본 테스트(Independent Samples Test)에서 수학성적 F 검정은 1.557이고 유의확률 (Sig.)은 0.222입니다. Levene 등분산 검정의 유의확률이 0.05보다 크므로 영가설을 기각할 수 없고 채택합니다. 


   논문에서 Levene 등분산 검정의 결과에 따라 등분산을 가정하는 경우(Equal Varienaces assumed)에 해당하는 평균의 동일성에 대한 t 검정(t-test for Equality of Means)  값을 사용합니다. 다음과 같이 표현합니다.


   " 남성(80.67)과 여성 (84.53)에 따른 수학성적의 유의미한 차이가 없는 것으로 나타났다. (t= -1.540, p= .135)"


       유의미한 차이가 없는 이유는 p값이 0.135로 0.5보다 크기 때문입니다. 


국어성적 분석

  집단통계량(Group Statistics) 표에서  국어 성적을 기준으로 남성의 평균은 72.87이고, 여성은 83.20입니다.  그리고, 독립표본 테스트(Independent Samples Test)에서 수학성적 F 검정은 1.311이고 유의확률 (Sig.)은 0.262입니다. Levene 등분산 검정의 유의확률이 0.05보다 크므로 영가설을 기각할 수 없고 채택합니다. 


   논문에서  Levene 등분산 검정의 결과에 따라 등분산을 가정하는 경우(Equal Varienaces assumed)에 해당하는 평균의 동일성에 대한 t 검정(t-test for Equality of Means)  값을 사용합니다. 다음과 같이 표현합니다.


   "남성(72.87)과 여성 (83.20)에 따른 국어성적의 유의미한 차이가 있는 것으로 나타났다. (t= -1.540, p= .01)"


    유의미한 차이가 있는 이유는 p값이 0.011로 0.01보다 작기 때문입니다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari