brunch

You can make anything
by writing

C.S.Lewis

by Juhn Mun Oct 20. 2019

<벌거벗은 통계학> 찰스 월런

언제까지 통계가 어렵기만 할 거야

우리의 일상엔 항상 통계가 존재한다. 통계란 단어 자체는 낯설고 어렵게 느껴질 수 있다. 그렇다면 평균은 어떤가? 최소값과 최대값은? 조금 더 나가면 산술평균, 기하평균, 중간값, 표준편차는 어떤가? 이들은 모두 통계의 기본개념이지만 우리 일상에서 흔히 쓰이고 있다. 우리는 통계를 어려워할 필요가 없다. 이미 우린 통계 속에 살고 있으니깐.


이보다 어려운 통계 개념도 우리 주변에서 쉽게 찾을 수 있다. 대표적인 분야는 여론조사이다. A와 B후보 중 승리자를 예측할 때 언론사에서는 A의 지지율이 53%라고 발표한다. 그리고 이번 조사는 신뢰 수준 95%에서 오차범위 ±2프로라고 덧붙인다. 이는 A의 지지율이 51%에서 55% 내 일 확률이 95%로 예상된다는 말의 통계적 표현일 뿐이다.


조금 더 직관적인 통계기법은 스포츠에서 볼 수 있다. 야구를 예로 들어 보자.  선수의 타율, 출루율, 장타율, WAR, 방어율 등은 모두 통계적 기법이다. 해당 선수의 능력을 평가하기 위해 고안된 통계기법들이다. A선수가 B선수보다 올해 안타를 더 많이 쳤다고 말하는 것 대신 A선수의 타율이 B선수보다 높아 라고 말하는 것은 직관적으로 이해도 쉽고 논리적으로 타당해 보인다. 이런 부분이 통계의 매력이다.


매력적인 통계기법을 알기 쉽게 정리해놓은 책이 찰스 월런의 ‘벌거벗은 통계학’이다. 책을 읽으면서 대학교 때 기본과목으로 수강한 통계학 원론 수업이 생각났다. 오래전에 배운 개념들을 리뷰하는 느낌으로 쭉 읽어 나갔는데 교수님께는 죄송한 이야기지만 그때보다 더 쉽고 간단하게 이해됐다. 시험이 없다는 부담 때문일 수도 있지만 비전공자나 배경지식이 크게 없는 독자도 충분히 쉽게 이해할 수 있을 것 같다.


데이터에 접근성이 높아진 지금 통계기법의 활용성은 더욱 커질 것이다. 데이터 없는 통계기법은 무의미하고 분석 없는 데이터도 무의미하다. 그렇기에 데이터와 통계는 결코 때어놓고 생각할 수 없다. 이미 우리는 통계 속에 살고 있고 통계적으로 생각하고 있다. 알고 보면 통계기법도 우리의 직관과 크게 다르지 않다. 만약 지금도 통계가 어렵다고 막연히 생각하고 있다면, 이 책을 자신 있게 추천해주고 싶다.

매거진의 이전글 <직장이 없는 시대가 온다>새라캐슬러
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari