통계와 R로 파묻힌 세상의 이치를 파헤칩니다.
숫자는 누구도 반박할 수 없을만큼 객관적이지만, 숫자는 누구도 믿지않을 만큼 주관적입니다.
서로가 무엇을 하는지 도저히 알 수 없는 복잡한 이 세상에서 우리는 숫자로 설명하고 이해합니다.
거대한 현실을 데이터로 표현하고, 데이터를 다시 적은 숫자로 표현하는 굉장한 압축의 과정에 통계가 있습니다. 통계는 직장인들의 평균 연봉을 계산한 것처럼 간단한 요약부터, 확률이라는 어마어마한 개념으로 만들어낸 통계모형에 이르기까지 다양한 방법으로 세상을 설명하고 있습니다.
문제는 복잡한 세상만큼이나 통계의 벽이 거대하다는 것입니다. 훌륭하신 학자들이 펴낸 '알기쉬운 통계학'도 한 단원을 넘기기 어렵습니다. 그래서 대부분의 사람들은 통계를 전문가에게 맡기거나, 구색을 맞춰 적당히쓰거나, 무시하고 넘깁니다.
이해하기는 어렵고, 설명하기는 더 어려운 것이 통계인 것 같습니다. 거의 매일 통계를 쓰는 분석가도 자신의 분석에 대한 100% 확신을 갖기가 어렵고, 다른 사람에게 설명하는 것은 더 어렵습니다. 마치 수십년동안 우리의 발목을 잡고 있는 영어처럼, 이 시대의 언어, 통계는 우리 모두를 힘들게 합니다.
통계는 왜 이렇게 힘들까요?
우리는 십수년 영어를 배우지만 말 한마디 하기가 어렵습니다. 영어로 말하는 것을 못배웠기 때문이죠. 통계 역시 마찬가지입니다. 우리는 통계로 말하는 것을 배우지 못하고, 영문법보다 더 엄격하고 딱딱한 통계학을 배웁니다. 확률과 분포, 추정과 검정에 이르는 거대한 틀이 우리의 머리를 옥죄고 있죠.
통계는 세상과 데이터로 소통하는 언어입니다. 완벽한 문장을 구사하는 것보다 한마디라도 말을 건네고, 한 문장이라도 듣고 이해하는 것이 중요합니다. 우리에게 지금 필요한 것은 쉬워보이는 통계학 책이 아니라 한마디라도 따라 읽어 쓸 수 있는 회화책입니다.
시간날 때마다 하나씩 세상의 주제를 정해 데이터를 통계로 살펴보려고 합니다. 우리 사회를 둘러싼 수많은 일들을 데이터 표현하고, 또 통계로 설명하려고 합니다. 제 생각엔 덜 어려운 통계를 시작합니다.