brunch

You can make anything
by writing

C.S.Lewis

by 라인하트 May 02. 2021

SPSS로 배우는 통계 - 5. 독립성 검정(교차분석)

    변수의 척도가 범주형인지 연속형인지에 따라 데이터를 분석하는 방법이 다릅니다.  가설의 독립변수와 종속변수가 모두 범주형일 때 검정할 수 있는 교차분석을 설명합니다. 



 교차분석또는 카이제곱 (Cross-tabulation Analysis)

   교차분석은 범주형 데이터들 간의 상호관련성를 확인하기 위해 교차표를 만들어 관계를 확인하는 분석 방법으로 카이제곱 검정이라고 합니다. 카이(x)는 그리스 알파벳입니다. 카이제곱 검정은 카이제곱 분포에 기초한 통계 방법으로 관찰 빈도가 기대 빈도와 차이가 의미가 있는 지를 검정합니다. 카이제곱검정은 관측빈도에서 기대빈도를 뺀 값의 제곱을 기대빈도로 나눈값입니다.  


   카이제곱 검정은 독립성 검정에 사용합니다. 독립성 검정은 두 범주형 변수간의 관계가 서로 독립적인지 아닌지를 검증합니다. 독립적이라는 의미는 서로 상관이 없다는 의미입니다. 


   교차 분석은 범주형 데이터들 간의 상호관련성을 다루므로 설문에 명목척도가 있어야 합니다. 교차 분석을 위한 설문 사례는 다음과 같습니다.

당신의 연령대를 무엇입니까? 
         (1) 10대     (2) 20대    (3) 30대     (4) 40대 (5) 50대  (6) 60대

당신는 어느 정당을 지지하십니까?

 (1) 더불어민주당     (2)국민의 힘   (3)국민의당.  (4)정의당   (5)민생당   (6)기타




SPSS에서 교차 분석하기

   

1. 가설의 설정


   교차 분석을 위한 질문은 다음과 같습니다. 

   세탁기 담당 마케팅 관리자는 가족규모에 따라 구매하는 세탁기의 크기가 다른지를 알기 위하여 마케팅 조사자와의 협의에 의해 주부들을 대상으로 다음과 같은 질문을 하였다. 

1) 귀하의 가족은 모두 몇 명 입니까?

       1~2명 ________ 3~4명 ________ 5명 이상 ________


2) 귀하 가정의 세탁기 크기는 다음 중 어디에 해당합니까?

      소형 ________ 중형 ________ 대형 _______

 

  연구가설을 설정하고, 가설 검증을 위한 귀무가설과 대립가설을 설정합니다. 


연구가설

   가족 규모와 세탁기 크기는 독립적이지 않다   


귀무가설

   가족 규모와 세탁기 크기는 독립적이다 

   (가족 규모에 따라 세탁기 크기는 무관하다)

대립가설

   가족 규모와 세탁기 크기는 독립적이지 않다 

   (가족 규모에 따라 세탁기 크기는 다르다)



2. SPSS에서 교차분석 설정하기


1) 메뉴바에서 "분석 >> 기술통계량 >>교차분석"을 선택합니다.



2) 교차 분석 창에서 두 개 변수 세탁기 크기와 가족 규모를 각각 행과 열로 옮깁니다. 그리고, 통계량을 선택하고 카이제곱, 분할계수,  파이 및 크레이머의 V를 선택합니다. 



3)교차 분석창에서 셀을 선택하고 관측빈도와 기대빈도를 선택합니다. 

   

 - 관측빈도

        각 셀에 있는 실제 케이스의 수


 - 기대빈도

           영가설 하에서 얻을 것이라 기대되는 사례 수

           예) 영가설 : 가족규모에 따라 세탁기의 크기는 다르지 않다



3. 교차 분석 결과 분석하기 


 

기대빈도 계산

   교차표(Crosstabulation)에서 행변수는 세탁기의 크기이고, 열변수는 가족규모입니다. 두 변수의 도수는 개체수 또는 품종 수를 나타냅니다. 두 도수가 만나는 각 셀은 관측빈도(Count)와 기대빈도(Expectd Count)를 표시합니다. 관측빈도는 실제로 수집된 데이터의 빈도이고, 기대빈도는 전체 빈도를 기준으로 교차되는 셀에서 기대할 수 있는 빈도를 뜻하고, 계산은 행의 합과 열의합을 곱한 것을 전체 빈도로 나누어줍니다. 예를 들면,  교차표의 첫행 첫열의 기대빈도 9.3은 (70*40)/300 의 계산 결과이고, 첫행 2열의 기대빈도 32.7은 (70*140)/300의 계산 결과입니다. 



   교차분석은 교차표에서 두 변수의 관계를 분석하고 검정합니다. 카이제곱검정은 두 변수에 대해 독립성 검정과 동질성 검정을 합니다. 독립성 검정은 교차표에서 각 범부들이 독립적인지를 검정하고 동질성 검정은 행변수의 각 범주에서 열 변수의 비율이 같은지를 검정합니다. 


   교차분석을 하는 카이제곱 공식은 다음과 같습니다. 

   카이제곱은 음수와 양수로 인한 합산의 무제를 제거하기 위해 오차의 제곱을 이용합니다.  카이제곱 테스트에서 카이제곱을 계산할 때 범주형 변수의 개수가 k개일 때 자유도는 k-1로 계산합니다. 자유도(df)는 미지수의 개수입니다. 가족규모 변수에서 k는 3-1인 2입니다. 카이검정의 결과는 다음과 같습니다.


   "카이 제곱 검정 결과 Person 카이제곱의 값은 58.208이고, 유의확률 p값은 .000으로 나타났습니다.p값이 0.01보다 작으므로 영가설을 기각합니다."


    즉, 가족 규모에 따라 세탁기의 크기는 유의미한 차이가 있는 것으로 나타났습니다. 



테스트 과제


SPSS에서 교차분석하기 - 과제 파일  


1. 가설의 설정

   "30명의 남녀를 대상으로 그들이 지지하는 정당 (A, B, C)을 조사하였다. 이 자료로부터 선호하는 정당이 성별에 따라 다르다고 할 수 있는 가?" 


   연구가설을 설정하고, 가설 검증을 위한 귀무가설과 대립가설을 설정합니다. 


연구가설

   성별과 지지정당은 독립적이지 않다    


귀무가설

   성별과 지지정당은 독립적이다.  

   (성별에 따라 지지정당은 다르지 않다) 


대립가설

   성별과 지지정당은 독립적이지 않다 

   (성별에 따라 지지정당이 다르다) 


   연구 결과가 귀무가설을 채택할지 또는 기각할 지 확인하기 위해 교차분석을 합니다.  


2. SPSS 교차분석 분석하기


   카이제곱 검정결과 Person 카이제곱 값은 7.814, p값(유의 확률)은 .02로 나타났다. p값이 0.05보다 작으로 영가설을 기각합니다. 성별에 따른 지지정당은 유의미한 차이가 있는 것으로 나타났습니다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari