brunch

You can make anything
by writing

C.S.Lewis

by 도안 Jun 27. 2023

파이썬 카이제곱 검정 예

카이제곱 독립성, 카이제곱 적합성

카이제곱 독립성 검정

문제:-> 한 자동차 회사는 가족의 크기에 따라 구매하는 차의 크기가 다른지 알기 위해 조사를 하였다.

300 가구를 조사하여 다음과 같은 교차표를 만들었다.


이 자료에 따라 가족의 크기에 따라 구매하는 차의 크기가 다르다고 할 수 있는가?


답: 범주형 교차표이므로 카이제곱 검정을 한다.

가설설정

H0 : 가족의 크기와 차의 크기는 독립적이다.

H1 : 가족의 크기와 차의 크기는 독립이 아니다. (가족수와 차의 크기는 상관이 있다.)


파이썬으로 카이제곱 독립성 검정을 한다.

카이제곱 독립성 검정은 먼저 교차표를 만들어야 한다. 문제에서 교차표가 주어졌기 때문에 이것을 df에 집어넣었다.

stats.chi2_contingency()를 이용하면 카이제곱통계량, p-value, 자유도, 기대빈도가 출력된다.


결론

유의 수준 a= 0.05에서 p-value는 6.9e-12로 0.05보다 작으므로 귀무가설은 기각된다.

따라서 가족의 크기에 따라 차의 크기가 다르다고 할 수 있다.



카이제곱 적합도 검정

문제:-> 한 커피숍에서 월요일부터 금요일까지 커피가 팔린 횟수를 조사하였다.

요일변 커피 판매량

요일에 따라 커피의 판매율이 다르다고 할 수 있는가?


답: 범주형이기 때문에 카이제곱 적합도 검정을 한다.

가설설정

H0 : 요일별 커피판매율은 동일하다.

H1 : 요일별 커피판매율은 다르다.


파이썬으로 카이제곱 적합도 검정을 한다.

적합도 검정은 기대빈도를 구하여야 한다.

기대빈도를 구한 후 통계량을 구한 값이 y이다.

stats.chi2()을 이용할 경우 통계량을 직접 구해야 한다.

stats.chisquare(관측빈도, 기대빈도)를 사용하면 더 빠르게 구할 수 있다.


결론

유의 수준 a= 0.05에서 p-value는 0.00로 0.05보다 작으므로 귀무가설은 기각된다.

따라서 요일에 따라 커피 판매율이 다르다고 할 수 있다.


카이제곱 검정통계량

카이제곱 검정통계량

독립성 검정과 적합도 검정의 검정통계량을 구하는 방법은 같다.

O는 관측빈도를 말하고, E는 기대빈도를 말한다.

독립성 검정의 자유도는 (n1-1) X (n2-1)이고 적합도 검정의 자유도는 n - 1이다.



경영지도사 사무소 바로가기

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari