brunch

You can make anything
by writing

C.S.Lewis

by 여행하는 기획자 May 07. 2019

말도 안되는 숫자들의 통계를 구하고 싶다면

분산의 불편파추정치를 알기 위해 알아야 할 것들치란



휴, 늘 그렇지만 용어 용어 통계는 용어가 정말 가장 어렵습니다. 약간 진입장벽 같기도 하고.. 왜 이렇게 굳이 어려운 용어를 사용하는지 모르겠네요. 오늘도 처음보는 단어 불편파 추정치에 대해 설명을 드리고자 합니다.


분산의 불편파추정치란



불편파 추정치를 알려면 이 2가지 개념을 이해하셔야 합니다. 역시 용어는 어렵지만 알고보면 쉬운....

바로 모수치와 추정치입니다. 

모수치는 연구하려는 리얼 대상이고요, 
추정치는 그 리얼 대상을 조사하기 어려우니 추정한 데이터를 의미합니다. 


우리가 정말 기똥차게 추정치를 잘 뽑았다. 즉 리얼 데이터는 아니지만 그래도 그런대로 꽤 잘 데이터를 뽑았다!라고 하려면 몇가지 조건이 있는데요, 가장 대표적인 조건이 바로 불편파성입니다.


불편파성


불편파성이라고 하니까 엄청 어색한데요, 그러니까 편견이 없는 성격이라고 생각하시면 됩니다. 

생각해보면 우리도 가끔 편파적이지 않다. 이런 말을 쓰잖아요. 그 말과 비슷합니다.

당연히 데이터가 편견이 없으니까 좋겠죠. 추정치와 모수치가 기대값이 동일하다고 표현할 수 있습니다. 


일관성

표본의 크기가 클수록 평균이 비슷해 지는 것을 말합니다. 

제가 저희 반에서 150cm 이상 사람을 찾는다고 할때 2사람 뽑는 것보다 10사람 뽑는게 더 평균치에 가까워지죠? 이것을 의미합니다.



추정치는 그 리얼 대상을 조사하기 어려우니 추정한 데이터를 의미합니다. 자 그럼 다음에는 가장 통계의 하이라이트라 볼 수 있는 불편파추정치에 대해 다뤄보도록 하겠습니다!


우리 모두 통계가 가뿐해지는 그 날을 위하여!





* 흩어지는 순간을 기억하고자 기록합니다.

@traveler_jo_

* book_jo@naver.com



작가의 이전글 통계에서 나오는 용어들 정리 1탄
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari