brunch

You can make anything
by writing

C.S.Lewis

by 요니짱 Jan 26. 2017

새빨간 거짓말, 통계

요니의 Book Review 02

이 책은 빌게이츠와 웨린버핏이 추천했다는 책이다. 재작년 서점에서 처음보고, 매우 읽어보고 싶다는 생각이 들었던 책이다. 구매직 후 바로 읽기 시작했으나, 끝까지 읽지 못했고 그러다 최근에 다시 읽었다. 새빨간 거짓말, 통계는 최근에 읽었던 책 중에 개인적으로 가장 어렵게 느껴졌던 책이 아닌가하는 생각이 드는 책이었다. 누군가는 30분이면 가뿐히 읽을 수 있는 책이라고 이야기하기도 했지만, 원래 빠르게 책을 읽지 못하기도 하고, 깊게 이해하려고 애써서 그런지 다 읽는데 무려 열흘이나 걸렸다. 전공이 수학이라 다른 사람에 비해 통계를 더 깊게 배웠고, 더 많이 접했음에도 불구하고 몰랐던 내용, 즉 새롭게 알아갈 수 있는 내용이 굉장히 많았다.


머릿말 부분에서부터 강렬하게 시작되는 책이다.

통계학이라는 비밀스러운 술어는 증거를 중요시하는 문화를 가진 현세에서 사람들을 선동하거나 혼란에 빠뜨리게하며, 사물을 과장하거나 극도로 단순화하기 위해 자주 사용된다.

이 부분이 사실 책의 전체 내용이라 여겨도 문제가 전혀 없었다. 머릿말 이후로 10가지 챕터로 구성되어있고, 표본의 크기, 표본의 추출방법, 평균의 사용방법, 유의수준, 그래프, 상관관계 등을 이용해서 어떤식으로 통계를 활용해 과장을 할 수 있는지에 대해서 말해주는 책이라고 해도 과언이 아니다.

추출한 표본의 크기가 충분히 크다면 그리고 그 표본을 선택하는 방법이 적절하다면, 대부분의 경우 그 표본은 모집단 전체를 대표하는 것으로 볼 수 있다.

통계에 있어서 가장 중요한 것은, 표본을 근거로 어떤 결론을 내릴 때 그 표본이 모집단 전체를 대표하는 것이라야 한다는 사실이다.


모수 전체를 가지고 값을 구하는건 너무 비효율적인 경우가 많아서 표본조사를 굉장히 많이하는 편인데, 여기서 가장 중요한 점은 그 표본이 모집단 전체를 대표할 수 있어야한다. 일반적으로, 통계학을 배울 때 표본의 크기가 최소 30이상이어야 한다고 말한다. 크기가 커지면 커질수록 더 모집단과 유사한 표본이라고 이야기한다.


그러나 자료를 통계적 조작에 의해 몇 번이고 걸러서 그 결과가 소수점이 붙은 평균값으로 바뀔 때쯤 되면, 그 결과가 본래의 데이터와는 전혀 다름에도 불구하고 이상스럽게 맹목적인 신뢰감마저 들기 시작한다.

정말이지 50보다는 48.97이 훨씬 더 신뢰도있는 실제값이라고 느껴지는 경우가 많다. 정말 미묘할 정도로 작은 숫자인데, 인식되어지는 느낌은 어떻게 이렇게까지 다를 수도 있나라는 생각까지 들 정도로 통계학에서는 48.97이라는 숫자가 훨씬 더 실제값이라고 느껴진다.


사람의 키나 몸무게, 가슴둘레 등의 체위에 관한 자료들로부터 얻은 여러 종류의 평균값들이 거의 일치하고 있을 뿐만 아니라 그 분포는 정규분포라 불리는 곡선에 가까운 아름다운 그림으로 나타난다. 즉, 이 자료들을 곡선으로 나타내면 종 모양으로 그려지며, 산술평균값, 중앙값, 최빈값이 모두 같은 값으로 정해진다.

통계학에서는 자연적인 현상으로 이루어진 것들은 정규분포를 이룬다고 이야기를 한다. 그래서 그런지, 정규분포의 곡선이 가장 이상적인 모습으로 보이기도 한다. 마찬가지로, 이 책에서도 종모양인 이런 정규분포가 산술평균값과 중앙값, 최빈값이 모두 같은 아름다운 그림이라고 표현되곤 했다.


미국 목수의 돈 자루의 높이는 로툰디아 목수의 돈 자루 높이의 2배인 것은 사실이지만 동시에 그 폭도 2배이다.

그래프에 관련된 내용도 있었다. 특히 신문 기사에서 많이 접할 수 있는 내용인데, 이론적으로는 알고 있었지만 실제로 활용되고 있는 것은 몰랐던 것 같다. 바로 2배를 표현하기 위해 그림 그래프를 사용하는 것인데, 높이가 2배이면 실제로는 넓이는 4배가 되기 때문에 압도적으로 커보인다는 것이다. 물론 입체적인 그림을 활용한다면, 8배가 되는셈이다.


지금 당장 크리스마스 선물을 사면 100% 절약을 할 수 있습니다. 실제 할인율은 50%에 불과하다.

화장품 가게 등에서 쉽게 볼 수 있는 내용인데, 30%+30%이런식으로 쓰여져있는 광고문구를 한 번정도는 누구나 봤을 듯 하다. 책에 나온 것처럼 퍼센트 즉 백분율은 더하기가 불가능한데 이상하게 60%로 여겨진다. 실제로는 30%할인된 금액의 30%를 추가로 할인받는 것이라 60%까지 할인률이 커지지 않음에도 불구하고 말이다.


대부업과 은행 이자율이 같이 6%라고 하더라도 실질적으로는 완전 다른 값이다.

은행 및 대부업에 대한 이자부분 관련 내용이 있었다. 둘다 같은 6%의 이자율에 대해 이야기를 하고 있지만, 상환한 금액을 뺀 나머지를 가지고 이자율을 계산하면 은행이자는 실제 3%정도가 된다. 하지만, 처음 빌린 액수에 대해서 이자를 문다면 거의 12%에 가까운 이자를 낼 수 있다는 점에 대해서도 이 책에서는 이야기를 해주고 있다.


이 외에도 앞에서 말한 다양한 방법을 활용해서 통계적인 수치를 실제로 어떤식으로 받아들여야하는지를 전체적으로 보여주는 책이라고 볼 수 있다. 마지막으로, 이 책을 마케터 관점으로 본다면 제품이나 서비스를 알림에 있어 숫자를 활용해서 어떻게 사람들을 현혹시킬 수 있는지에 대한 방법론을 제시하고 있는 책이라고도 볼 수 있는 책이다. 너무 과하게 활용하면 당연히 안되겠지만 말이다. 한 번쯤은 읽어보고 실제로 숫자가 어떤 힘을 가지고 있는지에 대해 느껴보는 시간을 갖는 것도 좋을 것 같다.

작가의 이전글 네이버 상위노출의 모든 것
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari