brunch

You can make anything
by writing

C.S.Lewis

by Chanuk Park Jul 26. 2019

14. 정규분포란 (대충) 이런 것이다

독학으로 논문 쓰는 안내서

#정규분포란 무엇인가?


정규분포. 일단 말이 어렵다. 영어로는 normal distribution. 노멀 하다는 말은 보통이라는 말이고, 디스트리뷰션은 분포니까 쉽게 이해하자면 보통 분포, 즉 지구 상에 많은 것들이 대충 이런 분포를 보인다 라는 뜻이다. 그래프로는 아래와 같은 모양으로 표현된다.


표준정규분포 그래프


어디서 많이 본 그림이지 않은가? 이건 마치 어린 왕자에 나오는 코끼리를 삼킨 보아뱀을 그려놓은 것 같지만 사실 그것은 아니다. 

이거 아니라고!

그림출처: https://m.blog.naver.com/PostView.nhn?blogId=joshyp00&logNo=120174853793&proxyReferer=https%3A%2F%2Fwww.google.com%2


사실 대충 이런 것이다. 우리 주변에 키가 160cm~ 190cm 인 성인 남자는 꽤 많지만 키가 100cm 이하, 혹은 3미터 이상인 남자는 몹시 드물다. 그것을 표현한 것이 이 그래프이다. 


어렵다고? 다시 또 예를 들겠다. 수능이 400점 만점인데, 만점자는 TV에 나올 정도로 적고 빵점 맞은 사람은 TV에는 안 나오지만 아마 매우 적을 것이다. 만점 받기도 어렵지만 빵점 맞기도 사실 쉬운 게 아니기 때문이다. 반면에 중간에 낀 사람들, 점수 200~300점 정도는 엄청나게 많은 사람들이 있을 것이다. 


요약하자면 양쪽 극단 값은 전체에서 수가 적을 수밖에 없고 그래프에서 양쪽 끝의 낮은 수치로 표현된다. 반대로 중간은 배불뚝이처럼 튀어나온다. 우리 주변에 이러한 분포를 보이는 것은 아주 많다. 그래서 이게 정규분포(보통 이러한 분포를 보인다)이고 핵심적인 내용은 이미 다 설명했다.  


우리가 사회과학에서 통계를 통해서 검증하는 모든 것은 바로 연구의 대상이 대부분 이러한 분포를 보일 것이라고 가정해 놓고 시작한다. 



차근차근 밟아봅시다. 이건 정규분포 그래프이고 의학분야 등에서는 다른 분포를 가정합니다. 

매거진의 이전글 13. 연구가설 설정, 아니 연구 모델링
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari