왜곡된 통계를 박살내다

by 김규형



통계학이란 관찰과 조사를 통해 얻은 다량의 데이터를 분석하고 정리하는 학문이다. 폭넓은 분야에서 응용되고 있고 우리 곁에도 가까이 있다. 내가 자주 듣는 라디오 프로그램인 뉴스공장에서도 대통령과 정당 지지도, 국정 운영 평가 등에 대한 리얼미터의 통계와 여론조사를 듣는다. 국가 행정기관인 통계청에서도 매년 인구 조사와 같은 정보를 수집하고 발표한다. 직장인 평균 월급 이런 것도 통계적 수치이다. 통계는 실증적인 뿌리를 가지고 있으며 실질적 활용에 초점을 맞추고 있다. 그래서 응용수학의 일종으로 여겨지기도 한다. 통계학은 수치들이 왜곡되어 해석되지 않도록 다양한 연구로 보강되고 있다. 통계 수치를 통해 제공된 정보를 바탕으로 합리적인 의사결정을 할 수 있도록 돕는 것이다.



위에서 설명한 내용이라면 통계학은 엄청 어려운 분야라고 할 수 있다. 어느 분야라도 전문가 수준으로 들어가면 어려운 법이다. 씽큐베이션 멤버들과 함께 읽은 “벌거벗은 통계학”은 우리 생활 속에 있는 통계학에 대해 쉽게 이해할 수 있도록 해준다. 특히 도입부에서 후반부까지 난이도 조절이 잘 되어 있어 나처럼 통계학을 처음 접한 사람들에게도 이해가 잘 된다. 전공 지식, 전문가 수준이 아니더라도 책장을 넘기는데 무리가 없다.


특히 통계 수치만으로 왜곡될 수 있는 부분을 잘 짚어낸다.




상관관계와 인과관계는 다르다.


회귀 분석은 두 변수간의 상관관계만을 말해준다. 전에도 말했듯이 통계만 가지고는 한 변수의 변화가 다른 변수의 변화를 초래 했다고 증명할 수 없다. 실제로 회귀분석을 잘못하면 서로 아무 관계도 없는 두 변수 간에 통계적으로 유의한 밀접한 연관관계가 나타날 수 있다.



책 속 내용 중에 눈에 띄는 부분이라 발췌하였다. 회기 분석이란 통계에서 측정한 어떤 연속적인 변수들의 모형을 뽑아내고 그것이 적합한 지를 분석하는 방법이다. 통계적 예측에 이용 될 수 있는 방법이다. 가정이 맞는지 아닌지 판단하지 않은 채 이용되어 잘못 이용하는 경우가 있다고 한다. 작가는 ‘상관관계와 인과관계는 다르다’는 주장으로 정확한 정보 분석이 연구자에게 달려 있다고 한다. 정확한 문장이다.


"수치는 우리를 판단하게 만드는 중요한 요소이다."


"수치화할 수 없다면 관리도 할 수 없다."


하지만 의사결정을 하는 것이 수학 보다 중요하다. 우리는 씽큐베이션에서 함께 읽은 평균의 종말이라는 책에서 보았다. 평균이라는 수치만 놓고 보았을 때 얼마나 큰 오류를 범할 수 있다. 통계적 수치 자체로는 사실을 입증하긴 어렵다. 통계학을 통해 수치가 어떻게 우리 삶에 접목할 수 있을지, 우리를 둘러싸고 있는 사회 현상에 대한 통찰을 얻을 수 있다. 누군가 평균의 종말과 벌거벗은 통계학 두 책 중 하나를 읽고 있다면, 나는 꼭 시간을 내서라도 무조건 두 책을 다 읽으라고 권유하고 싶다.

작가의 이전글언제가 그렇게 중요한가?