믿거나 말거나, 그것은 당신의 선택
'인간은 살아가면서 약 100마리의 벌레를 먹는다'
'여성의 평균수명이 남성의 평균수명보다 높아'
'한국인 위암 발병률 세계 1위'
우리는 각종 미디어에서 위와 같은 (연구 및 조사 결과에 따른) 통계를 하루에도 수십 개씩 접하게 된다. '할 일이 없나, 뭘 이런 걸 다 조사해?'라는 생각이 드는 황당한 것부터 '나의 식습관을 돌아보게 만드는 연구결과'까지 다양하다. 그런데 그렇게 발표된 결과를 우리는 1의 의심도 없이 곧이곧대로 믿어야 할까? 주변에 몇 안 되는 지인들을 대상으로 얻어낸 뇌피셜에 가까운 정보부터 왠지 모르게 믿어야만 할 것 같은 언론보도에 이르기까지 수많은 통계 결과들이 있다. 그중에 우리는 보고 싶은 대로, 믿고 싶은 대로, 듣고 싶은 대로 입맛에 맞는 통계치만 받아들이고 별 관심 없는 것들은 한 귀로 흘려보냈을 수도 있다. 또 어떤 이는 모든 결과를 무한 신뢰하며 주위에 전파하고 있는지도 모르겠다.
<벌거벗은 통계학>의 저자 찰스 윌런은 통계는 고성능 무기와 같아서 올바로 이용되면 유익하지만, 잘못 쓰이면 치명적인 재앙을 불러올 수 있다고 한다. 보기에도 황당한 통계는 재미로 보고 넘어갈 수 있지만 우리가 잘 알지 못하는 분야에 대해서는 보여주는 결과값 그대로를 받아들이기가 쉽다. 우리보다 더 전문가인 그들이 낸 연구결과이니 겸허히 받아들이는 것이 순리인 것 같은 생각이 든다. 그들은 적어도 비전문가인 우리들보다는 그 분야에서 해박하지 않겠나? 똑똑한 그들의 말은 신뢰가 간다. 그런데 <벌거벗은 통계학>을 읽다 보면 그동안 우리가 얼마나 그들의 통계 호갱(어수룩하여 이용하기 좋은 사람)이 되기를 자처했는지 깨닫게 된다. 같은 내용도 입맛에 따라, 그들의 주장을 더 타당하게 보이게 하기 위해 얼마든지 다른 결과값으로 표현할 수 있었다.
자, 그렇다면 더 이상 통계 호갱이 되지 않기 위해서 우리는 각 통계 결과들을 어떻게 해석하고, 때로는 합리적인 의심을 하며 제대로 된 연구결과들을 가려낼 수 있을까? <벌거벗은 통계학>에서는 다양한 혜안을 주는데 그중에서 흥미롭게 읽었던 몇 가지를 소개해 볼까 한다.
1. 정밀성과 정확성의 함정
정밀성과 정확성을 구분할 수 있어야 한다. 정밀성이란 무엇인가를 얼마나 정교하게 표현하는지를 의미하고, 정확성은 어떤 수치가 진실과 전반적으로 얼마나 일치하는지를 재는 척도이다. 나라마다 길이를 측정하는 데 사용하는 단위가 다양한데, 단위에 따른 계산 오차 때문에 비행기와 우주선이 추락했다는 뉴스를 언론을 통해 접해 본 적이 있을 것이다. 정밀해 보이는 숫자도 Input(데이터)이 적절하지 못하면 output(결과)은 쓰레기에 불과하다. 가장 정밀한 측정치들과 계산 값들이라 하더라도 반드시 상식에 반하지 않는지 점검해야 한다. <벌거벗은 통계학>, p.80
2. 분석 단위의 함정
분석단위란 통계에서 비교되거나 묘사되는 대상이다. 아래의 예문은 같은 내용을 다르게 해석한 것이다.
정치인 A: 우리나라 경제가 심각하게 추락하고 있다. 지난해 30개 주에서 소득이 줄어들었다.
정치인 B: 우리나라 경제가 주목할 만한 성장을 보여주고 있다. 지난해 미국 국민들 가운데 70퍼센트가 소득이 늘었다.
A가 말하는 30개의 주는 버몬트, 로드 아일랜드와 같은 작은 주 들일 것이고, B가 말하는 70퍼센트의 소득은 가장 큰 주들의 경제 상태가 가장 건전하다는 사실을 뜻하는 바일 것이다. 주의 크기가 제각각이라는 점을 감안하면 많은 미국인의 상황이 좋아지는 반면에 많은 주의 상황이 나빠지는 것도 충분히 가능하다. A는 주를, B는 국민을 묘사하고 있다. 핵심적인 교훈은 분석단위에 주의를 기울여야 한다는 것이다. <벌거벗은 통계학>, p.87
3. 통계 조작의 함정
평가를 받는 이들이 주어진 목표와 동떨어진 방법을 활용해 통계적으로 스스로를 더 나아 보이게 만드는 경우가 없도록 단단히 주의를 기울여야 한다. 뉴욕 주는 심장병 전문의들을 평가하기 위해 이들이 흔히 하는 심장동맥 확장 수술을 받은 환자들의 사망률을 측정하는 채점표를 도입했다. 그런데 의도와는 다르게 전문의들은 환자 사망률을 낮추기 위해서 심각한 병세를 보이는 환자들의 수술을 거부했다. 채점표는 표면적으로는 환자들을 위하는 것처럼 보였지만 오히려 환자에게 해롭게 작용했다. <벌거벗은 통계학>, p.108
책을 읽는 내내 깨달음의 소리를 몇 번이나 뱉었는지 모르겠다. 발표되는 통계 결과를 예전에는 곧이곧대로 믿었다면 앞으로는 다양한 시각으로 바라봐야겠다. 결국은 아는 만큼 보일 것이다. 아는 만큼 합리적인 의심을 하게 될 것이고, 아는 만큼 엉터리 통계 값들을 가려낼 수 있게 될 것이다. 그렇다면 어떻게 해야 할까? 이미 눈치챘겠지만, 정답은 공부다.(우선 <벌거벗은 통계학>을 읽기를 추천한다. 따분할 수 있는 통계 이야기를 재미있게 잘 풀어냈다.) 정보의 홍수 속에서 이리저리 휩쓸리며 계속 허우적거리고 있을지, 누군가 잘 정리해 준 신뢰할 수 있는 통계 값을 야무지게 써먹을지는 당신의 선택에 달려있다. 그대여, 여전히 통계 호구로 남아있고 싶은가?