메뉴
brunch
매거진
마케팅 전략 도구
실행
신고
라이킷
4
댓글
공유
닫기
You can make anything
by writing
C.S.Lewis
브런치스토리 시작하기
브런치스토리 홈
브런치스토리 나우
브런치스토리 책방
계정을 잊어버리셨나요?
by
도안
Jun 27. 2023
파이썬 카이제곱 검정 예
카이제곱 독립성, 카이제곱 적합성
카이제곱 독립성 검정
문제:-> 한 자동차 회사는 가족의 크기에 따라 구매하는 차의 크기가 다른지 알기 위해 조사를 하였다.
300 가구를 조사하여 다음과 같은 교차표를 만들었다.
이 자료에 따라 가족의 크기에 따라 구매하는 차의 크기가 다르다고 할 수 있는가?
답: 범주형 교차표이므로 카이제곱 검정을 한다.
가설설정
H0 : 가족의 크기와 차의 크기는 독립적이다.
H1 : 가족의 크기와 차의 크기는 독립이 아니다. (
가족수와 차의 크기는 상관이 있다
.)
파이썬으로 카이제곱 독립성 검정을 한다.
카이제곱 독립성 검정은 먼저 교차표를 만들어야 한다. 문제에서 교차표가 주어졌기 때문에 이것을 df에 집어넣었다.
stats.chi2_contingency()
를 이용하면 카이제곱통계량, p-value, 자유도, 기대빈도가 출력된다.
결론
유의 수준 a= 0.05에서 p-value는 6.9e-12로 0.05보다 작으므로 귀무가설은 기각된다.
따라서 가족의 크기에 따라 차의 크기가 다르다고 할 수 있다.
카이제곱 적합도 검정
문제:-> 한 커피숍에서 월요일부터 금요일까지 커피가 팔린 횟수를 조사하였다.
요일변 커피 판매량
요일에 따라 커피의 판매율이 다르다고 할 수 있는가?
답: 범주형이기 때문에 카이제곱 적합도 검정을 한다.
가설설정
H0 : 요일별 커피판매율은 동일하다.
H1 : 요일별 커피판매율은 다르다.
파이썬으로 카이제곱 적합도 검정을 한다.
적합도 검정은 기대빈도를 구하여야 한다.
기대빈도를 구한 후 통계량을 구한 값이 y이다.
stats.chi2()
을 이용할 경우 통계량을 직접 구해야 한다.
stats.chisquare(관측빈도, 기대빈도)
를 사용하면 더 빠르게 구할 수 있다.
결론
유의 수준 a= 0.05에서 p-value는 0.00로 0.05보다 작으므로 귀무가설은 기각된다.
따라서 요일에 따라 커피 판매율이 다르다고 할 수 있다.
카이제곱 검정통계량
카이제곱 검정통계량
독립성 검정과 적합도 검정의 검정통계량을 구하는 방법은 같다.
O는 관측빈도를 말하고, E는 기대빈도를 말한다.
독립성 검정의 자유도는 (n1-1) X (n2-1)이고 적합도 검정의 자유도는 n - 1이다.
경영지도사 사무소
바로가기
keyword
파이썬
검정
통계
브런치는 최신 브라우저에 최적화 되어있습니다.
IE
chrome
safari