1. 커피가 암 발생률을 높이지 않지만, 커피 마시는 집단에서 암 발생률이 더 높다. 왜 그럴까?
2. 경제적으로 훨씬 여유 있는 백인이 흑인에 비해 사망률이 높았다. 연령별 사망률을 비교해 봤더니 모든 연령에서 백인 사망률이 낮았다. 그럼에도 백인의 전체 사망률이 높은 이유는?
사람이 가장 많이 사망하는 응급실과 중환자실이다. 사망률을 낮추기 위해 응급실 & 중환자실 폐쇄한다면 말도 안 되는 소리로 들리지만, 각 현상의 상관관계만을 분석하다 보면 통계해서 흔하게 발생할 수 있는 오류다.
세상에는 세 종류의 거짓말이 있다. 거짓말, 새빨간 거짓말, 그리고 통계 -벤자민 디즈레일리-
현대사회에서 여론조사, 각종 상품광고, 경제통계 등 수많은 통계자료를 만나게 된다. 통계자료를 자신에게 유리하게 곡해하는 경우가 많아서, 통계를 맹신하면 안 된다. 물질 A가 높은 사람에서 암이 많이 발생하였다는 것이 통계적으로 입증되었다면 어떨까? 물질 A는 암을 일으킨다라고 확신하기는 어렵다. 상관관계는 증명되었지만, 인과관계는 명확하지 않다. 화재현장에서 자주 발견되는 사람을 화재원인으로 추정하다 보면 소방관을 비난하는 오류가 생긴다.
커피를 마신 집단에서 암이 많이 생겼다면, 커피와 암의 상관관계는 증명되지만 인과관계는 증명되지 않아 커피가 암의 원인이라고 말할 수 없다. 커피와 흡연이 연관되어 있다면, 흡연이 교란변수로 작용하여 커피가 암 발생을 높이는 것 같은 착시현상을 일으키는 것이다.
커피를 마시는 사람이 흡연을 더 많이 하는 경향이 있고, 담배가 암 발생을 증가시킨다면 커피가 암 발생과 상관이 없어도 커피 마시는 집단에서 암 발생률이 높아질 수 있다.
모든 연령에서 사망률이 낮은데 총사망률은 더 높을 수 있을까? 언뜻 들으면 말도 안 되는 소리 같지만, 충분히 나타날 수 있는 현상이다.
1965년 볼티모어 시의 흑인과 백인의 사망률 비교
인구 1,000명당 사망률 백인 (14.3명), 흑인 (10.2명)
당시 흑인들의 생활조건과 의료이용의 어려움을 고려하면 예상 밖의 결과였다. 원인 파악을 위해 연령별 사망률을 구해봤더니, 모든 연령대에서 흑인의 사망률이 백인보다 더 높았다.
모든 연령에서 흑인의 사망률이 높지만 전체 사망률은 백인이 높은 이유는 바로, 백인이 고령 비율이 훨씬 높았기 때문이다. '백인이 사망률이 높다'는 틀린 말은 아니지만, 진실을 굉장히 왜곡되게 인식하도록 하는 잘못된 표현이다. 정확한 표현 : '백인의 건강상태가 더 좋지만 백인의 고령 비율이 높아서 사망률이 높아 보인다'
각종 여론조사나 광고 등을 보면, 80% 의 국민이 어떤 정책을 지지한다는 둥 이 제품을 복용하면 피로개선 효과가 몇 70% 에서 있었다느니 하는 주장들은 액면 그대로 믿으면 안 된다.
설문조사, 여론조사 등은 질문 한마디, 뉘앙스 차이 등으로 매우 큰 오차가 발생할 수 있다. 대중이 얼마나 속기 쉬운지를 보여주는 재미있고 유명한 일화가 있다.
출처 : 위키백과
1997년 미국의 14세 중학생이 동급생들을 대상으로 DHMO의 폐기를 호소하는 탄원서를 써서 서명하도록 요구하였고 50명에게 서명을 부탁한 결과 찬성 43명, 반대 1명, 기권 6명이었다. 당신은 DHMO의 사용금지에 동의하시겠습니까?
DHMO의 실제 이름은 일산화 이수소(Dihydrogen Monoxide, DHMO), 즉 수소 2개에 산소 1개. H2O (물)이다.물의 사용금지를 호소하는 탄원서에 86% 의 중학생들이 간단히 동의한 것이다.
현대 사회에는 수많은 진실과 거짓 사실들이 뒤섞여서 돌아다니고, 가짜 뉴스에 신뢰성을 높이기 위해 자주 사용되는 도구가 '통계'이다. 통계가 얼마나 조작되거나 왜곡되어 해석될 수 있는지 인식하고 통계를 한번 더 의심스럽게 바라보자.