수학의 위대함, 내지는 쓸모 있음을 강조한 책들을 연거푸 읽고(, https://brunch.co.kr/@kwansooko/611, https://brunch.co.kr/@kwansooko/613) 이렇게 숫자를 의심해야 한다는 책을 읽는 게 흐름 상 조금 맞지 않아 보일 지도 모르겠다. 하지만 이 책 결론적으로는 역시 수학적 사고의 중요성을 일깨우고 있는 것만큼은 분명하다. 숫자를 오해하거나, 혹은 숫자를 이용한 속임수에 당하거나 하는 게 결국은 우리가 숫자의 본질을 제대로 이해하지 못하고 있기 때문이다.
사너 블라우의 『위험한 숫자들』가 물론 보다 더 최신의 데이터를 분석하고 있긴 하지만 이전의 다른 책들과 완전히 새롭거나 다른 근거를 대거나 주장을 하는 것은 아니다. 나이팅게일이 숫자와 함께 그래프를 이용하여 영국, 나아가 전 세계의 의료계의 혁신을 가져왔다는 것이나, IQ 측정의 문제, 킨제이 보고서의 문제, 흡연이 폐암을 일으킨다는 명백한 증거를 두고 추악한 시간 싸움을 벌인 담배 회사, 인과 관계가 아닌 상관 관계만으로도 만족하는 빅데이터의 문제(이 문제에 대한 비판이야말로 가장 논쟁적이지 않을까 싶다. 많은 사람들이 빅데이터라고 하면 일단 신뢰부터 하니까 말이다), 논문에서의 p 해킹의 문제. 이런 것들은 이러저런 책들에서 이미 다룬 내용들이다.
하지만 이것들을 한 데 모아 읽는 것은 분명 의미가 있다. 이것들은 모두 숫자에 파묻혀 살아가고, 숫자를 제시하면 일단 고개를 끄덕여보는 우리의 버릇 같은 숙명에 총체적인 의문점을 던져주고 있기 때문이다. 개별적인 사항들의 문제점들에 대해서 조목조목 분석하며 비판하고 있다. 하지만 우리는 이미 이 내용들을 알고 있으니 똑같거나 비슷한 상황에 맞닥뜨렸을 때 숫자에 속아 넘어가지 않을까? 그러기 쉽지 않다는 게 나의 생각이자, 저자의 생각이다. 나부터 논문을 쓰는 데 데이터를 조작하지는 않을 지언정 ‘p 해킹’과 같은 방법에 대한 유혹에서 벗어나기가 힘들다. 어쩌면 대부분의 논문은 그런 유혹의 경계에서 왔다갔다 하지 않나 싶다.
그렇다면 무엇이 중요할까? 세상은 숫자를 이용해서 상황을 왜곡하고,
여기의 여러 상황들에 대한 구체적인 이해와 함께(이해를 위해서는 최소한의 수학이 필요하다) 숫자를 의심하는 연습을 평소에 해두어야 한다고 저자는 지적하고 있다. 저자가 제시하고 있는 것은 다음과 같은 것들이다.
숫자나 통계를 전달하는 이가 누구인지를 파악해야 한다.
숫자에 대해 어떤 감정을 느끼는지 스스로 판단해야 한다. 감정을 버릴 수는 없지만 감정만으로 끝나서는 안된다.
제시되는 숫자가 표준화된 것인지를 점검해야 한다. GDP 같은 수치가 국민의 행복을 측정하는 수치는 아니다(경제에 대해서도 의심스럽다).
데이터가 어떻게 수집되었는지도 확인해야 한다. 몇 명이 조사에 참여했는지, 표본을 추출하는 데 편견이 없는지 등등
그 데이터가 제대로 분석되었는지는 확인해야 한다. 단순한 상관 관계인지, 인과 관계인지, 나아가 거꾸로 된 인과 관계인지 등을 파악해야 한다.
그리고 숫자를 제시하고 있는 방법에 대해서도 조심해야 한다. 평균을 맹신하면 안 된다. 그래프를 제시하는 방법을 달리하여 교묘하게 결론을 왜곡하는 경우가 많다.
끝으로 저자가 숫자에 대해 쓰고 있는 말을 그대로 옮겨 본다.
“수는 현실의 수동적 기록인 것처럼 보일지 모르나, 실제로는 그렇지 않다. 수야말로 현실을 창조한다.”