brunch

매거진 격물치지

You can make anything
by writing

C.S.Lewis

by 파르헤시아 Dec 10. 2019

기저율 무시의 오류

"흑인 청소년이 NBA 경기에서 뛸 수 있는 확률은 13만 5,800분의 1에 지나지 않지만, 농구에 미친 흑인 청소년들은 자신이 마이클 조던처럼 될 수 있다는 꿈을 버리지 않는다. 이런 현상을 가리켜 ‘기저율 무시(neglect of base rate)’라고 한다" -강준만 칼럼


'기저율'이란, '어떤 요소가 통계적으로 전체에서 차지하는 기본 비율'을 말한다. 기저율은 사안 발생의 개연성, 즉 발생 확률을 가늠할 수 있는 중요한 척도가 된다. 통계적으로 확률이 더 크고 개연성이 더 높은 요인이 있음에도 불구하고, 그보다 확률이 훨씬 낮고 현실에서 개연성도 희박한 특정 정보를 이슈화하여 부각시킴으로써, 그 결과로 실제하는 진실을 보지 못하게 가로막는다. 이러한 판단 오류를 '기저율 무시의 오류' 또는 '기본비율 무시의 오류'라고 한다. 기저율 무시의 오류는 전체에서 차지하는 기본 비율, 즉 기저율을 고려하지 않았을 때 나타난다. 개념에서 설명한 것처럼, 기저율을 무시하게 만드는 주요 원인은 어떤 사안과 관련하여 추가로 제공된 특정 정보 때문이다. 이는 맥락에서 '기준점 편향'과 밀접한 관계가 있다. '기준점 편향'이란, '처음 제시된 정보가 기준점이 되어 판단에 중요한 영향을 미치는 현상'을 말한다.


예컨대, 어떤 사람이 있다. 그는 안경을 쓰고 있고, 평소 클래식을 즐겨 듣는다. 독서가 취미다. 이 사람의 직업을 추론한다면, 다음 둘 중에서 어느 쪽일까? ① 서울대학교 독문학 교수 ②택시 기사.


정답의 힌트는, 만일 판단 과정에서 기저율을 무시하지 않는다면, 통계적으로 확률이 크고 개연성이 높은 쪽이 정답에 가깝다. 다시 말해, 상식적으로 각각의 해당 직업에 종사하는 사람이 얼마나 되는가를 우선하여 고려해 보면 쉽게 답이 나온다는 말이 되겠다. 제시된 정보를 바탕으로 감이나 직관으로 추론한다면, 필히 기준점 편향 효과로 인하여 누구라도 기저율 무시의 오류에 빠지고 만다. 참고로, 2020년 현재 서울대 독문학과 교수진은 13명, 그 중에서 학과 교수진 프로필 사진에 안경을 쓴 이는 3명이다. 택시기사의 경우, 전국택시운송사업조합연합회 자료(2018년 9월 기준)에 의하면, 전국 택시 기사 수는 27만200명이다. 대한시과학회지의 연구조사(2019년)에 따르면, 대한민국 성인 남성의 49.3%가 안경을 착용하고 있다. 스마트한 분들에게는 힌트만으로도 충분하리라 생각하여, 굳이 답을 제시할 필요가 없을 듯하다. 


또 다른 예로,  비행청소년 1000명 중 990명이 게임 중독인 것으로 조사되었다. 이 통계조사를 근거로 하면, 비행청소년의 99%가 게임중독인 셈이 된다. 이러한 조사 결과는 게임이 청소년을 비행청소년으로 이끄는 핵심 요인이라고 추론하여 확대해석하고 잘못된 판단의 근거자료로 이용될 가능성이 크다. 실제로 인터넷 게임이 청소년을 쉽게 폭력과 비행 등 각종 범죄에 빠지게 만드는 주요 원인이라 판단하는 사람들이 많다. 심지어 이를 근거로 게임이 청소년 범죄의 핵심 원인으로 주장하는 청소년 문제 전문가, 자칭 범죄학자, 종교인 그리고 정치인들도 있다. 그러나 이는 전형적인 기저율 무시의 오류에 해당한다. 전체 청소년 중에서 비행청소년이 차지하는 비율을 확인하면 명확해진다. 

여성부 청소년 통계조사(2019)에 따르면, 전체 청소년 수는 876만 5천여 명, 2017년 기준으로 소년범죄자(비행청소년)는 7만 2천7백 명이다. 청소년 전체에서 차지하는 비율로 따지면, 비행 청소년은 0.83 %이다. 또 게임을 하지만 게임중독이 아닌 청소년이 대부분일 뿐만 아니라, 게임중독자이지만 비행청소년이 아닌 청소년이 대부분이다. 

통계청이 발표한 '한국의 사회동향 2017' 자료에 따르면 초등학생 고학년(4∼6학년)의 91.1%, 중학생의 82.5%, 고등학생의 64.2%가 게임을 하고 전체의 2.5%가 게임 과몰입 상태, 즉 게임중독을 의심케하는 상태로 조사되었다. 2016년 곽상도 의원이 제출한 자료에 따르면, 청소년의 게임 과몰입에 관한 상담 건수는 3천873명으로 집계되었다. 청소년 전체에서 차지하는 비율은 대략 0.044%다. 이는 청소년이 게임을 한다고 해서 누구나 게임중독에 빠지지 않는다는 통계적 근거다. 인간 사회와 개인 삶의 양태 및 심리적 문제는, 미처 예상할 수 없거나 상상조차 할 수 없는 온갖 변인· 변수가 존재하기 때문에 수치와 통계와 사례로 일반화하여 특정 짓고 간단 명료하게 분류할 만큼 그리 단순하지 않다.


어떤 기업의 올해 성장률이 작년의 두 배로 100% 성장을 했다고 공식적으로 발표를 했다고 하자. 한 해 동안 대단한 성과를 이루어 냈다고 생각할 수 있다. 그런데 기저율을 살펴보니, 작년의 성장률은 창업 이후 평균 성장률을 약간 넘어선 1% 다. 그렇다면 100% 성장을 이루어 낸 이 기업의 올해 실질 성장률은 실제로는 2%다. 1%에서 2%로 더 나아졌으므로 100% 성장한 것이다. 기업은 거짓말을 한 게 아니고 사실을 말했다. 판단 오류의 책임은 기저율을 무시한 독자에게 있다.


가령 지난달 여론조사에서 90% 찬성, 10% 반대의 결과가 나온 사안이 있다고 가정하자. 그런데 동일한 사안에 관한 이번 달 언론 보도에 의하면, 이번 달 여론 조사의 결과에서 반대가 50%가 증가했다는 제목으로, 그것도 단독 보도로 대서특필을 헀다. 흔히 이러한 언론 보도의 제목만으로도 누구나 찬성 50%, 반대 50%로 여론의 방향이 바뀌었다고 판단 오류를 하기 쉽다. 하지만 실제 여론조사 결과의 내용은 찬성 85% 반대 15%이다. 문제는 언론이 보도한 반대 50% 증가가 거짓이 아닌 사실이라는 데에 있다. 반대가 지난달 10%에서 이번 달에는 15%로 5% 증가했기 때문에 반대가 50% 증가했다고 보도한 것은 명백한 사실이다.


또 다른 비근한 예로, 유사 심리학(대중심리학), 사이비 심리상담, 점성학, 토정비결, 사주풀이, 점술, 유사 종교 등에서 특별히 자신을 지적하는 진술의 내용들이 거의 80~90% 이상 일치하고 적중하는 데에 매우 놀란다. 몇 년 전 우연히 호기심으로 인터넷 사주풀이 프로그램에 내 정보를 넣고, 그 결과로 나온 풀이의 정확성에 깜짝 놀란 경험이 있다. 거의 70~80% 이상 적중했기 때문이다. 실제로 나 이외에도 상당히 많은 사람들이 그 신통함에 놀라고 심지어 맹신하여 맹목적으로 거기에 빠지기도 한다. 그러나 기저율의 관점에서 살펴보면, 현실에서는 연령대에 따라 나와 비슷한 삶의 경험을 가진 사람들이 부지기수로 많이 존재한다. 다시 말해 나를 놀라케 한 그 신통한 내용들이, 나와 비슷한 연령대의 비슷한 수준의 다른 사람들에게도 똑같이 해당되고 또 나처럼 그렇게 생각한다는 말이다. 연령, 성별에 따라 경험적으로 누구나 인정하고 공감할만한 공통의 경험을 통계로 집산하여 추출된, 보편적 경험 사실을 말함에도 불구하고, 내가 거쳐온 내 삶, 내 과거 경험이 유일한 1/n로써 수많은 사람들 가운데서 특별할 것이라 생각하기 때문에 쉽게 착각에 빠지고 만다. 여담으로 심리치유 집단상담의 현장에서 제각기 나름 한 자리를 하는 4~60대의 성인들이, 모든 계급장을 다 떼버리고 체면마저 내팽개치고 생판 낯선 서로를 부둥켜 안고 아이처럼 서럽게 우는 이유는, 철옹성처럼 굳게 닫혀 있던 마음을 열고 보니, 자신만 그런 게 아니라 비록 서로 삶의 양태는 다를지라도 똑같은 마음의 상처와 아픔과 설움의 경험을 공유하고 있다는 것을 깨달았기 때문이다.


이렇듯 거의 대부분의 보통 사람들이 이러한 기저율 무시의 오류에 곧잘 빠진다. 심지어 저널리스트, 경제학자, 광고 및 마케팅 전문가, 그리고 정치가들조차도 이러한 기저율 무시의 오류에 빠지는 경우도 허다하다. 심지어 앞의 예처럼 진실이 아니라는 것을 잘 알면서도 특정 목적 달성을 위해 일반 대중에게 이를 악용하는 경우가 허다하다. 기성 언론은 물론이고 심지어 믿었던 특정 언론마저 왜곡 정보 혹은 취사선택한 가공의 정보를 남발하는 사회현실이다.


"생생한 꽃들일수록 슬쩍 한 귀퉁이를/ 손톱으로 상처내본다 / 피 흘리는지 본다 / 가짜를 사랑하긴 싫다/ 어디든 손톱을 대본다 " -김경미 詩, '생화', 부분-


기저율 무시의 오류가 주는 교훈은, 어떤 사안이나 상황에 대해서 사전 지식이 없거나 관련 정보를 알지 못하는 경우에 올바른 판단을 내려야 한다면, 이해당사자가 직접 그 사안에 대해 제공된 정보에 무작정 의존할 것이 아니라, 통계적으로 확률이 얼마큼 되는지를 즉, 기저율을 먼저 살펴보아야만 한다는 것이다. 다시 말해, 제시된 어떤 통계수치로 오류에 빠지지 않고 바르게 판단하려면, 해당 사안의 통계 수치가 속하는 전체의 총량에서 차지하는 비율이 얼마인지를 마땅히 고려해야 한다는 것이다. 만약 전체에서 차지하는 비율이 높다면 확률이 높고 개연성이 크므로 진실일 가능성이 크다. 그 반대의 경우라면 사실을 왜곡하거나 호도하기 위해서 일부의 사실을 부풀렸거나, 혹은 '체리피킹' 즉 특정 사실을 이슈화할 목적으로 더 크고 중요한 사실의 일부를 감추고, 강조하고 싶은 사실의 한 부분만을 취사선택하여 보여주는 가공된 정보일 가능성이 많다.


한 가지 더 덧붙이자면, 기저율의 확인은 이론 또는 무언가를 주장하는 글들을 대할 때도 마찬가지로 적용할 수 있다고 생각한다. 제대로 된 대부분의 글이나 이론들은 그게 진실이든 사실이든 허구이든 거짓이든 간에 공히 논리적으로 보편타당한 것으로 받아들일 수 있도록 나름의 논리적 근거를 갖추고 있다. 하지만 그러한 글들 혹은 이론 중에는 글쓴이의 입장, 가치관, 관점, 의도에 따라 특정한 사실을 전제로 삼거나, 무언가를 가정하고 논리를 전개하는 경우가 적지 않다. 따라서 주장하는 글이 정확하게 무엇을 말하고 있는지, 또 이러한 글을 쓴 글쓴이의 의도가 무엇인지를 정확히 파악하기 위해서는, 최우선적으로 논증의 바탕이 되는 전제나 가정을 비판적으로 살피는 것이 매우 중요하다. 전제가 참(사실)이 아니거나 혹은 가정을 바탕으로 이끌어 낸 결론이 참(사실)임을 증명하지 못할 경우, 결론은 아무리 논리적인 근거와 논리적 타당성을 갖추고 있더라도 참(사실)이 될 수 없기 때문이다. 이처럼 글을 읽을 때 전제와 가정을 살피는 적극적 읽기 행위가 바로 기저율을 살피는 것에 해당한다고 하겠다. 그 이유는 글의 의미와 글쓴이의 의도를 자의적으로 확대 해석하거나 곡해하지 않고 바르게 파악하고 바르게 이해하고자 함에 있다. 이러한 과정에서 간혹 글의 진위와 오류가 드러나기도 하고, 좋은 글 나쁜 글이 가려지기도 한다.


여담이다. 참새들이 나란히 전깃줄에 앉아 있었다. 이때 포수가 나타나 참새들을 바라보며 한쪽 눈을 감았다. 그리곤 엽총을 겨눴다. 포수의 엽총을 본 참새들은 본능적으로 일시에 날아올랐다. 그중에 오직 한 마리의 암컷만 포수를 뚫어지게 쳐다만 볼 뿐 도망가지 않았다. 마침내 총소리와 함께 암컷 참새는 땅으로 떨어졌다. 총 맞은 참새, 죽어가며 한탄조로 말한다. “그놈의 윙크 때문에... 내가 참 쓸개 빠진 년이지... 포수가 내게 반해 윙크하는 줄로만 알았으니..." 인터넷에 떠도는 오래된 유머다. 나도 가끔 쓸개 빠진 참새가 되는 경우가 더러 있다. 현실이 현실인 만큼, 내가 이 나이에도 각자도생의 심정으로 틈틈이 낯설고 어려운 개념을 애써 배우고자 하는 나름의 이유는 간단하다. 내가 무지하다는 것을 스스로 잘 알기 때문이다. 사람이든 세상사이든 간에, 내게 여전히 아쉬운 것은 올바른 분별력이다. (2019.12.9 쓰고, 12.10 정리하고 다시 고쳐쓰다)

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari