brunch

You can make anything
by writing

C.S.Lewis

by 여행하는 기획자 Jun 16. 2019

대체 T 검증이 무엇이란 말인가


통계에 대해 아무것도 모르는 제가 통계 중간고사를 본다는 소리에 부랴부랴 야매로 통계를 공부하고 있는 요즘입니다. 사실 박사과정에서 시험 성적은 크게 상관이 없지만 통계는 논문을 쓸때마다 계속 다뤄야 하는 부분이기에 이왕 하는 것 부랴부랴 열심히 쫓아가고 있답니다.


T 검증은 아마 통계수업을 들으셨던 분들이시라면 한번쯤 들어본 내용일 것 같아요. 

먼저 짚고 넘어가야 할 부분은 T 검증에는 두가지 타입이 있다는 점입니다.

독립표본 검증과 대응표본 검증이라는 점인데요, 하나하나 차근차근 정리를 해보겠습니다.


먼저 독립표본은 집단이 완전히 다른것을 비교하는 것이에요.

남과 여, 미국과 한국 이런 식으로 비교하는 자체가 다른 검정이죠.


대응표본은 집단은 일단 같습니다.  

같은 수학 과목이라는 과목 내에 사전 점수와 사후 점수를 비교하는 형태이죠. 


먼저 독립표본 T 검정을 해보겠습니다.

저는 제 인스타그램 좋아요;;;를 갖고 한번 통계를 내보겠습니다.


* 용도 : 1= 홍보, 2=도시 정보, 3=일상 공유 (케이스 수 = 20)

(사실 진짜 유의미한 값을 얻으려면 적어도 30개 이상의 케이스 수를 확보해야 하지만

 전 너무 귀찮으므로 일단 최근 포스팅한 20개의 케이스 수로 비교하겠습니다.)


그럼 이제 작업을 시작해보겠습니다.




분석 > 평균비교 >독립표본 T 검정


이제 가설을 세워보겠습니다.

귀무가설 : 용도에 따라 좋아요 평균에 차이가 없다.

대립가설 : 용도에 따라 좋아요 평균에 차이가 있다.


그럼 검정변수가 좋아요가 됩니다.집단변수에는 용도가 들어가죠.





 

그런다음 T검정을 시작해봅니다.


좋아요에 대한 총 표본은 36개가 나왔네요. 

개인홍보에 대한 좋아요 평균값은 114, 도시정보에 대한 평균값은 119가 나왔습니다. 



T검증에서는 독립표본 검증을 이해하는 것이 중요합니다. 바로 이어서 나오는 표이죠.

유의확률을 보면 0.089값이 나옵니다. 

즉, 유의수준이 5%보다 높다고 볼때 등분산을 가정한다고 볼 수 있습니다.


따라서 이런 결과값이 나왔을 때 T통계량 값은 0.535, 유의확률은 0.596이 나오므로 

용도에 따른 좋아요 차이가 있음을 확인할 수 있습니다.


혹시 이 글을 보시고 이해가 되셨는지 잘 모르겠네요. 언젠가 통계 관련하여 좀더 체계적으로 정리를 하거나 영상<?>을 만들어보고 싶은 소망도 있답니다. 




통계는 사실 용어가 낯설고 어색하지 오히려 프로그램을 돌려가면서 실습하면 재미있는 경우가 많습니다.

아예 제 삶의 데이터를 갖고 돌려보면 훨씬 재미있는 경우가 많답니다. 

저도 통계 바보이지만 혹시 궁금하신 부분 있으시면 연락주세요!





* 흩어지는 순간을 기억하고자 기록합니다.

@traveler_jo_

* book_jo@naver.com





브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari