SPSS로 배우는 통계 - 4. 가설과 가설 검정

May 1. 2021

1. 통계 가설에 관련 용어 정리

통계 가설을 설명하기 위해 사용되는 몇 가지 용어를 정리합니다.

모집단(Population)

모집단은 통계 실험의 모든 대상입니다. 예를 들면, 대한민국 남성의 키를 조사할 때 모집단은 대한민국의 모든 남성의 키 데이터입니다.

모수 (Parameter)

모수는 모집단의 특성을 나타내는 수치입니다. 모수는 모집단의 평균을 나타내는 모평균, 모집단의 분산을 나타내는 모분산, 모집단의 표준 편차를 나타내는 모표준편차 등입니다. 연구자가 알고 싶은 것은 모집단의 데이터가 아니라 모집단의 특성을 설명하는 모수입니다. 예를 들면, 대한민국 남성의 키를 조사할 때 연구자가 알고 싶은 것은 모든 데이터가 아니라 모평균 또는 모표준편차입니다.

모집단 분포 (Population Distribution)

모집단은 데이터 집단으로 어떤 분포를 이룹니다. 모집단 분포는 모집단을 구성하는 데이터가 이루는 확률 분포입니다.

표본 (Sample)

대한민국 남성의 키를 조사할 때 모집단은 대한민국 모든 남성의 키 데이터를 확보해야 합니다. 하지만, 경제적 공간적 시간적 제약으로 전수조사는 불가능합니다. 따라서, 표본을 추출하여 모집단을 추정합니다.

통계량(Statistics)

모수가 모집단 분포 특성을 설명한 것처럼 통계량은 확률 표본의 특성을 설명합니다. 통계량은 표본 평균 표본 분산, 표분 표준편차 등입니다.

확률 표본 (Random Sample)

표본은 어떤 의도 없이 객관적이고 무작위로 추출해야 합니다. 확률 표본은 동일 분포와 독립 분포를 따릅니다. 동일 분포는 확률 표본과 동일한 모집단에서 추출한다는 의미이고, 독립 분포는 표본과 표본이 서로 영향을 미치지 않고 같은 확률로 추출한다는 의미입니다.

확률 변수 (Random Variable)

변수는 변하는 값이고, 확률 변수는 무작위 실험을 반복할 때 특정 확률로 발생하는 결과를 수치로 표현한 변수입니다. 예를 들면, 동전 던지기로 앞면이 나올 확률이 0.5일 때 시도할 때마다 앞면 또는 뒷면이 나옵니다. 앞면은 1 뒤면 0으로 실수 값을 부여하고, 동전 던지기에서 확률 변수 x는 시도할 때마다 0과 1의 값을 나타냅니다.

확률 분포 (Random Distribution)

확률 분포는 확률 변수의 모든 값과 대응하는 확률들의 분포입니다. 예를 들면, 동전 던지기로 앞면이 나오는 확률 변수에 따른 확률 분포를 그릴 수 있습니다. 예를 들면, 동던 던지기를 시도할 때마다 앞면이 나올 확률을 계산할 수 있고 시도횟수가 증가하면서 확률 분포를 그릴 수 있습니다.

확률 함수

확률 변수에 의해 정의된 실수를 확률에 대응시키는 함수입니다. 예를 들면, 동전 던지기에서 0과 1로 대응된 시키는 확률 함수입니다. 확률 변수와 확률 함수 간에 다음의 관계가 있습니다.

Screen Shot 2021-04-30 at 11.01.05 PM.png

2. 모수와 통계량의 관계

모집단은 변하지 않기 때문에 모수도 변하지 않습니다. 반면에 표본은 추출방법에 따라 달라지기 때문에 통계량은 달라집니다. 연구자들은 이론적으로 모수는 측정할 수 없기 때문에 통계량으로 모수를 추정합니다. 측정할 때마다 달라지는 통계량으로 어떻게 모수를 추정할 수 있을까요?

통계량이 확률 변수이고 확률 변수의 확률 분포가 정규 분포를 따른다고 가정합니다. 특정 확률 변수와 확률 함수를 안다면 특정 사건이 발생할 확률을 예측할 수 있습니다. 모수와 통계량의 관계를 안다면 모수에 대한 통계적 추정을 할 수 있습니다. 통계량이 확률 변수이고 통계량의 확률 함수 또는 표본 분포를 안다면, 모수를 추정할 수 있습니다.

반대로 빅데이타는 표본이 아닌 모집단을 대상으로 연구합니다.

3. 중심 극한 정리(Central Limit Theory)

중심 극한 정리는 모집단의 모수와 표본의 통계량에 관계를 수학적으로 설명하는 것이고 다음과 같이 표현할 수 있습니다.

"모집단이 평균 μ(뮤)이고 표준편차 σ(시그마)인 분포를 이룰 때, 모집단으로 부터 추출된 표본의 크기 n이 충분히 크다면 표본 평균을 이루는 분포는 평균이 μ이고 표준편차가 σ/√ n에 근접한다"

표본은 매번 추출할 때마다 달라지기 때문에 표본 평균도 달라집니다. 표본이 아무리 크더라도 표본평균이 모평균과 같다고 할 수 없습니다. 중심 극한 정리에서 표본평균분포는 모집단에서 표본 크기가 n인 표본을 여러 번 반복해서 추출할 때 각 표본 평균이 이루는 분포입니다. 예를 들면, 표본 평균 분포는 표본의 크기가 30개를 100번 또는 200번 반복해서 추출했을 때 표본의 평균들이 이루는 분포입니다. 중심 극한 정리는 표본의 크기가 커질수록 표본 평균들이 이루는 분포가 "모집단의 평균 μ과 표준편차가 σ/√ n에 근접한다"는 것입니다.

중심 극한 정리는 표본 수집에 대한 아주 중요한 이론적 근거입니다. 모집단이 어떤 분포를 가지고 있든 간에 표본의 크기가 충분히 크면 표본 평균 분포가 모집단의 모수를 기반으로 한 정규 분포를 이룹니다. 특정 사건이 일어날 확률을 계산할 수 있습니다. 중심 극한 정리는 표본 분포와 모집단 간의 관계를 증명하고, 표본의 통계량을 이용해 모집단의 모수를 추정할 수 있는 수학적 근거입니다.

중심 극한 정리는 최소 표본의 수가 30개 이상이면 통계량이 모집단의 모수와 같다고 판단합니다.

4. 가설의 개요

가설(Hypothesis)은 변수들 간의 잠정적인 관계에 대한 진술 또는 진실이라고 생각되는 주장이라고 할 수 있습니다. 가설 검정 (Hypothesis Testing)은 관찰 대상에 대한 가설을 통계 기법으로 검정하는 것을 의미합니다. 과학에서 가설은 "태양이 지구를 돈다"라는 천동설이나 "지구가 태양을 돈다"라는 지동설과 같은 것이고, 실험이나 관찰로 가설을 검정합니다. 통계에서 가설은 "어떤 모집단에 대한 잠정적 주장"으로 일정한 형식을 따릅니다.

통계적 가설 검정에서 반드시 귀무가설과 대립 가설을 설정합니다. 어떤 가설을 채택할지 또는 기각할지를 결정하는 것은 확률에 따라 결정합니다. 두 가설의 의미는 다음과 같습니다.

귀무가설, 영가설(Null Hypothesis)

귀무가설은 모집단의 특성에 대해 참이라고 제안하는 주장입니다. 모집단의 모수는 무엇과 같다 또는 모집단의 모수는 무엇과 차이가 없다입니다. 예를 들면, 대한민국 남성의 평균 키는 180cm라는 주장을 통계적으로 검정할 때, 귀무가설은 "대한민국 남성의 평균 키는 180cm와 같다" 또는 "대한민국 남성의 평균 키는 180cm와 차이가 없다"입니다. 귀무가설은 "~와 같다"로 끝납니다.

대립가설, 대안가설 (Alternative Hypothesis)

대립가설은 귀무가설이 거짓일 때 대안으로 참인 가설입니다. 따라서, 귀무가설이 기각될 때 채택되는 가설입니다. 예를 들면, "대한민국 남성의 평균 키는 180cm와 같다"라는 귀무가설에 대한 대립 가설은 "대한민국 남성의 평균 키는 180cm와 같지 않다"입니다. 또, 제약회사에서 "신약은 효과가 있다"라는 귀무가설에 대한 대립 가설은 "신약은 효과가 있지 않다"입니다. 대립 가설은 "~와 같지 않다"로 끝납니다.

5. 귀무가설의 유의성 검증 (Null Hyphothesis Significance Testing)

귀무가설의 유의성 검증은 데이터를 바탕으로 설정한 귀무가설과 대립가설 중에 어느 것이 맞는 지를 판단하는 것입니다. 모집단으로부터 표본을 추출하고 통계량으로 귀무가설이 참인지 거짓인지를 판단합니다.

표본을 추출할 때마다 통계량의 차이가 발생하기 때문에 항상 오류의 가능성이 존재합니다. 따라서, 귀무가설이 참이라고 가정할 때 표본에서 얻은 통계치가 관측될 확률을 계산합니다. 이 관측될 확률을 p 값이라고 합니다. 통계적으로 검정을 할 때 오류를 최소화해야 합니다. 통계적 오류는 크게 1종 오류와 2종 오류가 있습니다.

1종 오류 (Type 1 Error)

1종 오류는 귀무가설이 실제로 참이어서 채택해야 하지만, 표본의 오차로 인해 채택하지 않는 오류입니다. 유의 수준이라고 말하며 α(알파)로 표기합니다.

2종 오류 (Type 2 Error)

2종 오류는 귀무가설이 거짓으로 채택하지 말아야 하지만, 표본의 오차로 인해 채택하는 오류입니다. β로 표기합니다.

1종 오류와 2종 오류는 다음과 같이 정리할 수 있습니다.

Screen Shot 2021-04-30 at 11.36.11 PM.png

신약 개발 사례로 정리합니다. 귀무가설은 "신약은 효과가 없다"입니다. 1종 오류는 실제로 신약이 효과가 없지만 효과가 있다고 판단하는 경우로 회사는 엄청난 손해를 볼 것입니다. 2종 오류는 실제로 신약이 효과가 있지만 효과가 없다고 판단하는 경우로 회사는 수익을 창출하지 못할 것입니다.

통계 가설 검정에서 1종 오류를 최소한으로 줄이기 위해 유의 수준을 설정합니다. 보통 1% 또는 5% 이내로 설정하고 귀무가설을 채택하거나 기각합니다. 예를 들면, 유의 수준 5%는 독립변수가 실제로 종속 변수에 효과가 없지만 검정 결과 효과가 있다고 잘못 결론 낼 수 있는 확률이 5% 미만이라는 뜻입니다. 즉, 유의 수준 5%는 표본에서 추출한 통계량이 우연히 나타날 확률이 5% 미만이라는 뜻입니다.

6. 가설 검정 방법의 선택

연속 변수(Continous Variable)와 불연속 변수 (Discrete Variable)를 설명하면서 척도의 종류를 간단하게 설명했고, 좀 더 자세히 설명합니다.

범주형 데이터는 명목척도와 서열척도로 나뉩니다.

명목척도

명목 척도 (Nominal Scale)는 이름으로 구분하는 것으로 성별, 국적, 직업, 지역, 학력 등입니다. 명목 척도를 숫자로 표현하지만 수량이 아닌 카테고리를 의미합니다. 측정 대상의 특성을 분류하거나 확인할 목적으로 숫자를 부여한 척도 입니다. 예를 들면, 성별 데이터는 남자는 1, 여자는 2 로 구분하지만, 수량을 의미하지 않고 범주를 나눕니다.

서열척도

순위 척도는 이름 그대로 순위를 나타내는 척도입니다. 측정 대상의 순서나 계층을 나타내는 척도로 석차, 사회 계층, 순위 등입니다. 예를 들면, 가구 당 재산을 기준으로 상위층은 1, 중위층은 2, 하위층은 3으로 나누는 것은 수량을 의미하지 않고 순서를 나타냅니다.

연속형 데이터는 등간척도와 비율 척도로 나뉩니다.

등간척도

등간 척도(interval scale)는 변수의 양적 차이를 균등하게 분할하여 측정하고 절대 0점이 없습니다. 대표적인 등간척도는 온도이고, 0도는 어는점일 뿐 온도가 없다는 의미가 아닙니다.

비율 척도

비율 척도(Nominal Scale)는 서열, 등간 비율의 모든 것을 가지고 절대 0점이 있습니다. 대표적인 비율 척도는 거리, 무게, 시간이고 거리와 시간이 없는 0이 있습니다.

위의 4가지 척도를 범주, 순위, 등간격, 절대영점을 기준으로 구분하면 다음과 같습니다.

Screen Shot 2021-04-29 at 11.45.29 PM.png

척도가 범주형인지 연속형인지에 따라 데이터를 분석하는 방법이 다릅니다.

Screen Shot 2021-04-29 at 11.30.26 PM.png

7. 가설 검정 순서 정리

귀무가설과 대립가설, 1종 오류와 2종 오류, 유의 수준을 이해했습니다. 이제 가설을 검정하는 방법을 정리합니다.

1단계 : 귀무가설과 대립가설을 설정합니다.

예) 귀무가설 : 토의식 수업 그룹과 강의식 수업 그룹 간의 시험 성적 평균은 같을 것이다.

대립가설 : 토의식 수업 그룹과 강의식 수업 그룹 간의 시험 성적 평균은 같지 않을 것이다.

2단계 : 유의 수준 α를 정합니다. (0.05 또는 0.01)

귀무가설을 기각하거나 채택하기 위한 유의 수준은 보통 5% (0.05) 또는 1%(0.01)로 설정합니다. 또한, 양측 검정을 할지 단측 검정을 할지도 설정합니다. 양측 검정이 단측 검정보다 좀 더 엄밀하게 검정을 합니다.

Screen Shot 2021-04-30 at 11.50.34 PM.png

3단계 : 표본을 수집하고 검정 통계량을 계산하고 p값을 계산합니다.

표본을 수집합니다. 학생들을 두 집단으로 나누고 강의식 수업과 토의식 수업을 진행합니다. 수업 이전의 성적과 수업 이후의 검정 통계량을 계산합니다. 검정 통계량은 수집한 데이터를 이용해서 계산한 확률 변수입니다.

검정 통계량을 통해 계산된 확률이 p값입니다. p 값은 표본 통계량이 나타날 확률입니다. 귀무가설이 참일 때 표본 분포에서 추출한 표본 검정 통계량이 나올 확률입니다. 통계 기법이 사용하는 확률 분포 함수에 따라 정규 분포, t 분포, F 분포, 카이제곱 분포 통계량을 사용하여 p값을 계산합니다.

Screen Shot 2021-04-30 at 11.53.44 PM.png

4단계 : p값이 α 보다 작으면 귀무가설을 기각하고, p값이 α보다 크면 귀무가설을 채택합니다.

p값이 유의 수준 0.05 또는 0.01보다 작으면 귀무가설을 기각하고 대립가설을 채택합니다. p값이 유의 수준보다 클 경우 귀무가설을 채택합니다.

Screen Shot 2021-05-01 at 12.01.27 AM.png

참고자료

https://drhongdatanote.tistory.com/80?category=648822

[개념 통계 21] 가설 검정 방법과 원리

안녕하세요. 홍박사입니다. 이번 포스팅에서는 가설 검정을 하는 방법에 대해서 이야기해보도록 하겠습니다. 지금까지 가설 검정하는 방법을 이해하기 위해 앞 선 포스팅에서 "귀무가설/대립가

https://drhongdatanote.tistory.com/80

keyword

매거진의 이전글SPSS로 배우는 통계 - 3. 신뢰도 분석SPSS로 배우는 통계 - 5. 독립성 검정(교차분석)매거진의 다음글