brunch

You can make anything
by writing

C.S.Lewis

by 칼란드리아 Jan 08. 2024

대니얼 카너먼 <생각에 관한 생각> #2

제2부. 어림짐작과 편향


2부 어림짐작과 편향

10. 소수 법칙

11. 기준점 효과

12. 회상 용이성의 과학

13. 회상 용이성, 감정, 잠재적 위험

14. 톰 W의 전공

15. 린다: 적은 게 많은 것이다

16. 인과관계는 통계를 이긴다

17. 평균 회귀

18. 직관적 예측 길들이기


1부에서 시스템 1과 시스템 2의 특성, 특히 시스템 1에 대해서 소개가 있었는데 2부에서는 '어림짐작과 편향'이라는 제목으로 본격적으로 이야기가 전개되네요. 여기 나온 내용 중에는 1부에서 간단하게 언급된 것들도 있긴 했지만요.




10장은 '소수 법칙'에 대한 이야기를 하고 있는데 이는 표본의 크기와 오차 위험에 대한 것입니다. 그러다 보니 아무래도 통계학 얘기가 나오고, 통계학 지식이 좀 필요할 것 같아요.


표본의 크기가 작을수록 대표성도 작아지고 오차는 커지죠. 그래서 통계학에서는 표본의 수가 중요합니다. 특히 의학통계에서 임상시험을 할 때 필요한 표본의 수를 미리 계산해 두는데요, 임상시험 시 1종 오류와 2종 오류 발생 가능성, 검정력과 유의 수준을 고려해서 정하게 됩니다.


하지만 표본수를 계산하는 것도 복잡하고, 또 그만큼의 표본을 모으는 것도 쉽지는 않습니다. 또 기대한 만큼의 차이가 발생하지 않을 수도 있고요. 


게다가 이 책에서는 '직관적 오해'로 인해 표본 추출 시 그 범위의 차이가 크다고 하는군요. 임상시험에서는 그럴 가능성은 적지만, 심리학에서는 더 그런 것 같습니다. (그래서 심리학의 실험결과에 대한 불신을 더 하게 되는 것 같기도 하고요)


저자는 이에 '소수 법칙'이라는 용어를 붙였는데 '일반화를 위한 표본수를 무시하고 소수의 사례로부터 유도된 법칙'이라고 할 수 있을까요?  그러면서 '느낌' 말고 '계산'을 이용하라고 권고합니다. 당연한 거 아닌가요? 그런데 실제로는 그렇지 않다는 게 문제겠죠.


시스템 1은 의심과는 거리가 멀다. 시스템 1은 모호함을 억누르고, 최대한 논리적으로 일관된 이야기를 즉석에서 지어낸다. 해당 내용이 그 자리에서 무시되지 않는 한, 마치 그 내용이 진실인 양 거기서 연상 작용이 시작된다. 시스템 2는 양립 불가한 가능성을 동시에 고려할 수 있어서 의심을 품을 수 있다. 그러나 의심을 품기는 확실하다고 믿기보다 어렵다. 소수 법칙은 의심보다 확신을 편애하는 일반적 편향을 그대로 드러낸다. 이 편향은 이 책에서 앞으로 여러 모습으로 등장할 것이다.


또한 시스템 1이 왜 그러한 편향을 나타내는지 간략하게 언급되어 있습니다. 믿으려고 하는 시스템 1과 의심하는 시스템 2 사이의 갈등. 하지만 기본적으로는 믿으려는 경향이 더 강하다는 것이죠. 설사 그 근거가 약하거나 혹은 과장되어 있다고 하더라도요.


또한 우리의 사고는 기본적으로 '인과관계'를 찾아내도록 되어 있어서 무작위성과 같이 인과관계가 없는 경우에도 그것을 만들어내고자 합니다. 이것이 진화상 유리했다고 할 수도 있지만 많은 경우에는 불합리하게 작동해서 문제를 만들어내기도 합니다. 인과관계가 아니라 그저 우연의 산물인 경우가 많으니까요.




11장은 '기준점 효과'입니다. 기준점은 수치로 된 것뿐만 아니라 어떤 기준이 될 수 있는 것들로서 일종의 '암시' 작용을 합니다.


이런 현상이 일상에서 워낙 흔하고 중요하니, 이 현상의 이름을 알아두는 게 좋겠다. 바로 ‘기준점 효과 anchoring effect’다. 이 현상은 모르는 수량을 추정하기 전에 특정 값이 머릿속에 떠오를 때 나타난다. 실험심리학에서 나타나는 매우 신뢰할 만하고 막강한 현상인데, 이때 사람들은 머릿속에 떠오른 값을 기준점 삼아 그와 가까운 숫자를 추정치로 내놓는다. 


이러한 기준점 효과는 일상에서도 쉽게 볼 수 있고 또 많은 연구가 되었습니다. 


저는 일반적인 사례로 '평균으로의 회귀'도 이의 일종이라고 생각하는데요, 사람들은 대체로 평균으로부터 멀어지지 않으려는 속성이 있는 듯해요. (물론 멀어지려고 하는 속성도 있지만, 평균에 가까울수록 안정감을 느끼는 게 일반적이라 대체로는 회귀를 하게 되죠) 이 경우에는 평균값이 기준점이라고 할 수 있을까요? 


기준점 효과는 효율적이기도 하지만 그로 인해 잘못된 결론을 내는 경우도 생깁니다. 애초 제시된 기준점에서 크게 벗어나지 못하는 편향에 빠지는 거죠. 이는 시스템 1의 점화 효과와 시스템 2의 의도적 조정 작업 둘 다 작용한 결과입니다.


조정은 의도적이고 의식적인 활동이지만, 주관적 체험이 없이도 나타나기도 합니다. 이는 앞서 말한 '암시 때문인데요, 암시는 연관된 증거를 선별적으로 촉발하는 점화효과입니다. 저자는 이 암시효과에 대해서 자세하게 얘기를 하네요. 아무래도 본인은 조정보다는 암시로 인한 점화 효과에 더 중점을 두고 있어서 그런 듯합니다.


그런데 여담이지만, 이런 기준점 효과 혹은 초기값 문제는 비단 우리의 사고에서만 생기는 것이 아니라 수학적 최적화 문제에서도 발생합니다. 어디를 시작점으로 하느냐에 따라 결괏값이 달라지게 되는데 이는 전체최적값(global minimum)이 아닌 국소적 최적값(local minimum)에 빠지게 되면 그로부터 벗어나지 못하는 문제가 생기기 때문이기도 해요. 물론 그러한 것을 벗어날 수 있는 알고리듬들도 있지만요. 최적화문제가 제 박사과정 때 연구 주제이기도 했어서 연관 지어 생각이 되네요. ^^;;


아무튼, 기준점의 사용은 도움이 되는 경우도 있지만 잘못된 기준점의 사용 혹은 오남용은 문제를 일으킵니다. 또한 의도적으로 그러한 기준을 설정하는 경우가 많은데 이에 휘둘리지 않기 위해선 '반대로 생각하기'를 해야 합니다.


무작위 기준점의 효과는 시스템 1과 시스템 2의 관계와 관련해 많은 것을 말해준다. 이제까지 기준점 효과는 결국에는 시스템 2가 마무리하는 판단과 선택을 대상으로 연구되었다. 그러나 시스템 2는 기억에서 끄집어낸 자료를 기반으로 작동하는데, 기억을 소환하는 작업은 시스템 1이 즉흥적이고 무의식적으로 하는 일이다. 이때 정보를 좀 더 쉽게 소환할 요량으로 기준점이 편향적으로 작동할 때가 있고, 시스템 2는 이런 상황에 쉽게 휘둘린다. 게다가 시스템 2는 기준점 효과를 통제하지도, 눈치채지도 못한다.
기준점 효과는 연상 활성화에서 나온다. 이야기가 진짜인지, 단지 그럴듯한 지는 전혀 중요치 않다. 무작위 기준점에는 정보가 전혀 없다는 걸 생각하면, 무작위 기준점의 막강한 영향력은 연상 활성화의 극단적 사례다.


그런데 시스템 1이야 그렇다 쳐도 왜 시스템 2는 그런 잘못된 추정을 그대로 받아들이는 걸까요? 기준점 효과는 연상 활성화에서 나온다고 하는데요, 그게 너무 강해서 '믿음'이 '의심'을 압도해 버리기 때문인 것 같아요. 그러한 순간적인 판단에 의심이 끼어들 겨를조차 없는 것이기도 하겠고요.




12장에서는 '회상 용이성의 과학'이라는 제목이 붙어 있는데 이는 '회상 용이성 어림짐작'에 대한 이야기입니다. 저자는 이를 '일정한 범주의 크기 또는 그 범주의 사건이 일어나는 빈도를 추정할 때 사람들이 머릿속에 떠올리는 것'으로 보고 그 용이성을 크기나 빈도로 나타내고자 했습니다. 


우리 연구 과제 하나는 우리가 ‘회상 용이성 어림짐작’이라 부른 것이었다. 이 어림짐작은 이를테면 ‘60세 이후 이혼하는 사람들’ 또는 ‘위험한 식물’ 같은 일정한 범주의 크기 또는 그 범주의 사건이 일어나는 빈도를 추정할 때 사람들은 실제로 어떤 생각부터 할지, 우리 스스로 자문하다가 생각해 낸 개념이었다. (...) 사람들이 그런 범주에 속하는 사례를 기억에서 끄집어낼 때 막힘없이 쉽게 생각나면 그 범주를 크다고 판단한다. 우리는 회상 용이성 어림짐작을 “해당 사례가 머릿속에 쉽게 떠오르는 정도”로 크기나 빈도를 판단하는 과정이라고 정의했다.


그런데 사람들은 회상 용이성 어림짐작을 통해 다른 판단 어림짐작과 마찬가지로 어떤 문제를 다른 문제로 바꿔치기한다고 합니다. 즉, 어떤 범주의 크기나 어떤 사건의 발생 빈도를 추정해야 할 때 해당 사례가 머릿속에 얼마나 쉽게 떠오르는가에 대한 느낌으로 그 추정을 대신한다는 것이죠. 


그러한 예시들도 나와 있는데요, 이로 인해 '잠재적 회상 용이성 편향'이 나타나기도 합니다. 특히나 강한 충격이 있었던 사건이나 기억은 더 강한 편향성을 갖게 합니다. 그런데 그런 편향성 마저 앞서 언급되었던 대로 행동이나 표정의 변화만으로도 또 다른 결과가 나타난다니, 사람의 판단이란 정말 믿기 어려운 건가 싶습니다. ㅋ


회상 용이성으로 판단에 이르는 과정에는 복잡한 연쇄적 추론이 개입하는 것처럼 보입니다. 하지만 회상 용이성은 시스템 1의 작용에 의한 것이고, 그 예측이 빗나갈 때 놀라기도 하지만 다행히도 시스템 2가 조정작용을 하여 그런 놀랄 일들을 줄여주기도 하는군요.


결론을 말하자면, 사례가 머릿속에 쉽게 떠오르는 것은 시스템 1의 어림짐작의 결과이고, 여기에 시스템 2가 좀 더 관여하면 그 어림짐작 대신 사례 내용에 집중하게 된다. 여러 증거를 모아보면, 시스템 1에 좌우되는 사람은 정신을 바짝 차리고 사는 사람보다 회상 용이성 편향에 휘둘릴 가능성이 훨씬 높다는 결론이 나온다.




13장에서는 12장의 내용에서 조금 더 나아가 '회상 용이성, 감정, 잠재적 위험'에 대한 이야기를 합니다. 이 역시 회상 용이성 편향에 관련된 것들인데요, 사람들의 머릿속에 쉽게 떠오르는 정도와 그 위험에 대한 감정 반응이 복잡하게 얽혀 있지만 더 무섭거나 위험하다고 생각하는 것일수록 더 쉽게 떠오르고 두려움이 가중됩니다. 이는 우리의 기억이라는 것이 상당히 왜곡될 수 있고, 그로부터 잘못된 판단을 하기 쉽다는 것을 의미하기도 합니다. 즉, 실제보다도 훨씬 가중되게 그 위험성을 평가한다는 것이죠.


슬로빅이 명명한 이런 '감정 어림짐작'은 사람들이 감정에 의지해 판단과 결정을 내린다는 개념인데요, 이는 일상적으로도 나타나며 특히 어려운 문제 (생각)를 쉬운 문제 (감정)으로 바꿔치기한다고 하네요. 그런 사람들이 많죠. 이성적으로 판단하기보다는 감성적, 감정적으로 대하는 사람들도요.


이러한 것은 위험성뿐만 아니라 가치 판단에서도 작용합니다. 하지만 역시나 다른 요인에 의해 영향을 받기 때문에 신뢰하기 어려울 수도 있네요.


이어 일반인과 전문가에 대한 얘기가 나옵니다. 저는 이 부분에서 상당히 공감하면서도 또 의외이기도 했는데요, 사실 저도 제 분야에서는 전문가이지만 일반인들 (가장 가까운 예로 저의 가족들)과 얘기할 때 상당히 답답함을 느끼기도 합니다. 특히나 제 분야가 위험성과 안전성을 다루는 것이다 보니 더 그러한데요, 아무리 데이터와 근거에 기반해도 믿음을 바꾸는 것은 쉽지 않죠.


그런데 그러한 것은 전문가들의 오만이라고 하는군요. 일반인이 전문가보다 위험성을 바라보는 개념이 더 풍부하다고 하면서요. 


슬로빅은 이런 관찰을 토대로, 일반인이 전문가보다 위험성을 바라보는 개념이 더 풍부하다고 주장한다. 따라서 결정은 전문가가 내려야 한다거나, 일반인의 견해나 소망이 전문가와 상충할 때 당연히 전문가의 의견을 받아들여야 한다는 시각을 단호히 거부한다. 그는 전문가와 일반인의 우선순위가 다를 때 “양측은 상대의 혜안과 지혜를 존중해야 한다”라고 말한다.


딜레마이긴 한데 사실 저는 그러한 것을 받아들이기는 어렵습니다. 이것은 마치 얼토당토않게 다수결로 하자는 얘기처럼 들려서요. 자칭 전문가로서의 자존심 같은 것일 수도 있지만, 그렇게 훈련되어 온 결과이기도 할 것입니다. 하지만 제 분야가 아닌 것에 대해서는 또 다른 스텐스를 취하게 되니 좀 모순적이기는 하죠. ^^;;


이와 관련해서 '회상 용이성 폭포'라는 용어도 소개되었습니다. 이는 마치 폭포처럼 흘러서 우선순위가 재조정(왜곡)되는 것을 의미하는데 그 폭포수가 거세지면 걷잡을 수 없어 합리적인 관리나 대처가 무력해지기도 합니다. 그런데 이런 것들은 상당수 정치적인 것 혹은 여론에 의해 증폭되는 것들이 많습니다. 이에 대한 대표적인 사례들도 언급되었죠. 우리나라에서도 흔하게 경험하는 것들이라 아마 쉽게 이해하실 수 있을 듯해요.




14장은 '톰 W의 전공'이라는 제목이 붙어 있어요. 저자들이 만든 가상의 인물인 톰 W의 전공을 추정해 보는 내용입니다.


그런데 저는 14장의 내용에 대해서 할 말은 많지만 통계학 전공이 아닌 분들이 대부분이시니 간략하게만 얘기할게요.


저자는 톰의 전공을 추정하면서 '기저율'이라는 문제로 접근했습니다. 이는 '빈도론자'의 관점인데요, 모집단 내 표본이 균질하게 분포되어 있을 경우 임의로 추출된 표본은 그 통계분포를 따른다는 가정입니다. 개별적 표본의 관점이 아닌 모집단 전체에 대한 통계분포가 관심사항이죠. 하지만 톰의 심리테스트 결과가 덧붙여지면서 기저율이 무시되는 현상이 발생한다는 것이 저자의 주장입니다. 그러면서 자신이 만든 테스트에서 사람들이 기저율과 반대되는 판단을 하는 것을 상당히 즐기고 있는 듯했습니다.


하지만 저는 '베이즈주의자'의 입장이라 심리테스트 결과라는 추가 정보가 주어졌을 때 사람들이 판단이 바뀔 수 있는 점은 타당하다고 생각하거든요. 베이즈주의는 사전분포(사전확률)와 가능도를 알고 있을 때 사후분포(사후확률)를 추정할 수 있다는 것입니다. 이는 개별 표본에 대한 관점이기도 합니다. 그래서 상당히 불편하게 이번장의 내용을 읽었어요.


그런데 공교롭게도 뒷부분에 베이즈확률에 대한 얘기가 나왔군요. 더군다나 이런 계산은 베이즈확률로 계산해야 한다면서 말이죠. 그 점에서는 저자의 의견과 일치하지만 왜 뒤에 가서야 그런 얘기를 했나 싶군요. 


또한 제가 불편했던 이유가 뭘까를 생각해 보니 사전분포와 가능도에 대한 것이 명확하게 언급되지 않은 채 본인이 주장하는 '기저율'만을 강조했기 때문인 것 같습니다. 이를 통계적으로 타당하게 추론하려면 어쨌든 사전분포와 가능도가 명확해야 하니까요. 주석도 봤는데 사실 베이즈확률이 그렇게 간단하게 계산되지는 않죠. 그런 계산은 시험문제에서나 나오는 거고요.


통계학은 우리의 직관과는 상당히 거리가 있어요. 그나마 빈도주의보다는 베이즈주의가 우리의 직관에 더 가깝긴 한데 합리적이긴 하지만 객관적이지 않다는 문제가 있습니다. 


아무튼 14장은 상당히 찜찜했지만 일단 저자가 얘기하려는 바는 이해하기에 그대로 따라갔습니다. 


또 한 가지, 통계학 분야 중에 '통계조사방법론'이라는 것이 있는데요, 여기에서는 주로 사회과학에서 사용되는 통계조사에 대해서 배웁니다. 설문조사에 대한 것도 포함되는데요, 이러한 설문조사는 연구자의 목적에 적합하도록 문항을 개발하게 됩니다. 그러한 문항은 때로 '조작적 정의'를 통해 만들어지는데요, 그 과정에서 결과에 왜곡을 줄 수도 있어서 상당히 주의를 해야 합니다. 이 책에서도 질문에 따라 답이 달라지는 문제를 언급했죠. 그래서 통계학은 함정이 참 많습니다. 


부정확한 직관적 판단이 내려지면, 시스템 1과 시스템 2가 동시에 비난받아야 한다. 부정확한 직관을 제안한 것은 시스템 1이고, 그것을 인정해 판단을 내린 것은 시스템 2다. 그러나 시스템 2가 이런 잘못을 한 데에는 두 가지 이유를 생각해 볼 수 있다. 무지와 나태다. 어떤 사람은 개별 정보가 있으면 기저율은 관련이 없다고 생각해 기저율을 무시한다. 또 어떤 사람은 질문에 집중하지 않아서 기저율을 무시한다. 
베이즈 추론과 관련해, 그리고 우리가 그 추론을 얼마나 쉽게 무시하는가와 관련해, 두 가지 명심할 점이 있다. 첫째, 기저율의 중요성이다. 다른 증거가 있어도 기저율은 중요하며, 이 둘이 직관과 맞지 않을 때도 자주 있다. 둘째, 우리는 증거의 검증력을 직관적으로 과장한다. 보이는 것에만 의존하는 성향에다 연상적 일관성이 더해지면, 스스로 지어낸 이야기를 믿어버린다. 베이즈 추론을 훈련하는 핵심 요소를 요약하면 다음과 같다.

- 어떤 결과가 나올 확률을 추정할 때 믿을 만한 기저율을 기준점으로 사용하라. 
- 가지고 있는 증거의 검증력을 의심하라.


우리의 사고가 얼마나 불완전하며 많은 것들에 휘둘리는지, 또 이성적인 판단을 한다고 생각하지만 감정적인 부분에 휘둘리는지 새삼 느끼게 됐네요. 특히나 시스템 1의 특성 때문에 더 그렇기도 한데, 시스템 2가 그것을 제대로 조절하지 못해서 그렇기도 하죠.


그럼에도 인간이 이렇게 살아남을 수 있었고 발전해 올 수 있었던 것은 그러한 불완전함 가운데서도 효율적으로 작동하는 시스템들 덕분이겠죠. 완전함이 아니라 불완전해도 효율적이었기에 그것이 진화의 방향이 되었을 수도 있고요.




15장은 '린다: 적은 게 많은 것이다'라는 제목으로 되어 있습니다. '린다'는 가상의 여성의 이름이고, '적은 게 많은 것이다'라는 말의 의미는 15장 뒷부분에서 나옵니다.


앞서도 계속 통계적 관점을 무시한 채 직관에 의해 판단하면 편향에 빠지거나 잘못된 결론을 내릴 수 있다고 했는데요, 그러한 내용이 계속 이어지고 있어요. 그러면서 린다라는 가상의 여성을 이용한 테스트의 예를 들면서 '대표성 직관과 확률 논리가 상충하는 경우'에 대해서 얘기합니다. 논리와 대표성 중에서 대표성이 더 우선한다는 것이죠.


뻔한 논리 규칙을 적용하지 못했을 때 흔히 ‘오류 fallacy’라고 하는데, 아모스와 나는 ‘결합 오류 conjunction fallacy’라는 말로 이 현상을 설명했다. 사람들은 결합된 두 사건(은행 창구 직원과 여성운동을 하는 사람)과 그중 한 사건(은행 창구 직원)을 직접 비교할 때 결합된 두 사건이 일어날 가능성을 더 높게 판단하는 실수를 저지른다.


이는 시스템 1의 특성 때문이기도 합니다. 시나리오를 더 구체적으로 하면 더 그럴싸하게 들려서 혹하게 되는 거죠. 비록 그것의 확률이 더 낮아지게 되는데도요. 그래서 논리적 일관성, 그럴듯함, 발생 가능성은 주의가 필요합니다.


'적은 게 많은 것'이라는 말은 크리스토퍼 시의 실험에서 그가 언급한 것인데요, 어떤 선택지에서 가치의 합계가 더 큰 것이 있음에도 가치의 합계는 적으나 가치의 평균이 더 큰 쪽을 선호하게 된다는 의미였어요. 즉, 가치의 평균을 떨어뜨리는 요소가 있는 쪽은 전체의 가치를 낮게 보는 경향이 있다는 것이고, 이 경우 선별을 통한 모집단의 수가 적으면 더 유리하게 될 수 있겠죠. 이러한 것은 명백하게 보이지 않는 확률문제 (앞서 린다의 경우와 같은)에서도 동일하게 작동하고 있습니다. 


또한 빈도표기에 있어서도 '몇 명'과 '몇 %'에 따라서도 반응하는 것이 다르다니, 이건 경험적으로 느낀 것이기도 하지만 그런 것 같기도 합니다. 일상에서는 빈도보다는 비율이 더 익숙하게 사용되는데 비율은 빈도보다는 덜 직관적이면서도 오류 발생 가능성이 더 크다고 하니 이건 미처 생각해보지 못한 것이었네요. ^^;;


시스템 1은 그러한 문제가 있지만 시스템 2의 게으름 때문에 (중요하지 않다고 생각하기에) 그런 문제에 대해 반박을 하지 못하고 그대로 받아들이게 되기도 합니다. 




16장은 '인과관계는 통계를 이긴다'는 제목으로 되어 있습니다. 앞서도 인과관계에 대한 내용이 나왔기에 제목이 의미하는 바는 바로 알 수 있을 듯해요. 시스템 1은 인과관계에 익숙하지만 통계적 추론에는 약합니다. 통계적 추론은 시스템 2의 영역이니까요.


여기에서도 베이즈 추론에 대한 얘기가 나왔는데요, 사실 베이즈 추론은 익숙하지 않은 사람들에겐 직관에 반하는 것으로 여겨지기도 합니다. 아니, 통계, 확률 자체가 그렇기도 하죠. (사실 저도 그래요. ㅋ)


우리는 이런 범주에 속하는 사람이나 사물을 대표하는 하나 이상의 ‘표준’을 정해 그 집단의 대표 이미지로 기억한다. 이때 그 대표 이미지를 ‘전형’이라고 말한다. 전형적 이미지는 더러 치명적으로 잘못 만들어지기도 하고, 적대적으로 만들어진 이미지는 심각한 결과를 초래할 수도 있지만, 머릿속에서 전형이 만들어지는 현상을 피할 수는 없다. 옳든 그르든 전형은 우리가 범주를 생각하는 방식이다.


또한 '전형적 이미지'에 대한 것과 그의 부작용에 대해서도 언급하고 있는데 우리는 그러한 것을 '선입견'이라고 하죠. 사실 우리는 그러한 선입견의 지배를 받고 살아가는 듯합니다.


그리고 '책임의식'에 대한 실험결과 (도움 실험)도 있었는데요, 다른 사람이 있으면 내 책임의식이 약해질 수 있다는 것을 보여주었습니다. '내가 아니어도 다른 누군가가 하겠지'라는 생각은 단순히 도덕성의 문제라기보다는 인간의 심리 자체가 그런 것 같네요. 물론 개인차가 클 것 같지만요.


16장 말미에서 저자는 이렇게 말합니다. 이 속에 그가 말하고자 싶은 바가 들어있는 것 같네요.


인간 행동과 관련해 놀라운 통계를 배우고 거기서 깊은 인상을 받았다면 그 사실을 친구들에게 이야기할 수는 있지만, 그렇다고 세상을 이해하는 시각이 달라졌다고는 볼 수 없다. 심리학을 제대로 배웠는지 알아보려면, 어떤 상황을 마주했을 때 그것을 이해하는 시각이 달라졌는지를 봐야지, 단지 새로운 사실을 알았는지를 봐서는 안 된다. 



17장의 제목은 '평균 회귀'입니다. '회귀'라는 말은 통계학에서도 많이 사용되고, 회귀분석은 중요한 분석기법이기도 합니다.


그런데 앞서 11장에서 '기준점 효과'를 얘기할 때 제가 '평균으로의 회귀'를 언급한 바가 있었는데요, 뒤에서 이 내용이 나온다는 것을 알고 얘기한 것이 아니라 평소에 생각하던 것을 말한 것인데 다시 나왔군요. 아마 제가 저자의 생각과 많이 비슷해서 그런 듯합니다. ㅎ


'평균 회귀'는 어떤 분포가 평균을 중심으로 분산을 이루고 있을 때, 설사 평균으로부터 떨어져 있는 것이라도 평균으로 돌아가려는 (회귀) 성질이 있다는 의미입니다. 이는 그 표본 자체가 의지가 있다기보다는 그냥 자연의 성질인 것 같아요. 일반적인 예로는 정규분포를 들 수 있겠죠. 그래서 어떤 분포를 보게 되면 (설령 분포가 명확하지 않은 소수의 표본만을 다루더라도) 그 평균을 먼저 감안해야 합니다. 물론 분산도 중요한 요소이긴 하지만 여기서 다루는 내용과는 거리가 있으니 일단 논외로 하고요.


그런데 사람들은 그러한 분산의 무작위성을 무시한 채 그 속에서 어떤 경향성을 찾으려 하는 듯합니다. 물론 기저평균은 계통적(시스템적) 일 수도 있고 무작위적(랜덤) 일 수도 있는데요, 해결 가능한 전자의 경우는 제외하고 대체로 후자를 관심의 대상으로 두는 경우가 많습니다. 그럴 경우 상관관계는 0에 가까워지는 경우도 많죠. 인과관계는 당연히 없고요. 하지만 사람들은 인과관계적 해석에 강박적인 듯해요. 


회귀 설명이 왜 그렇게 힘들까? 그 주된 이유는 이 책에서 반복되는 주제 때문이다. 그러니까 우리 머리는 인과관계 설명에 지나치게 편향되어 있어서 ‘오직 통계와 관련한 사실’은 잘 다루지 못한다. 어떤 사건에 주의가 집중되면 우리 연상기억은 그 원인을 찾으려 한다. 더 정확히 말하면, 기억에 저장된 원인이란 원인은 모조리 들춰내려 한다. 회귀라는 느낌이 들 때도 인과관계 해명이 떠오르는데, 그 해명은 엉터리다. 평균 회귀는 설명될 수 있어도, 인과관계는 없다.


이는 역시나 시스템 1과 2 둘 다 문제입니다. 심지어 시스템 1은 시스템 2가 통계적인 이해와 판단을 못하도록 계속 방해하고 인과관계 해석을 하도록 한다는군요. 문득, '인간이 그럼으로써 얻은 진화적 이득은 무엇일까?'라는 의문이 듭니다.




18장은 '직관적 예측 길들이기'입니다. 2부에서 어림짐작에 기반한 인간의 직관은 편향성과 오류를 지니기 때문에 문제가 많이 발생한다는 것을 계속 보여주었는데요. 2부의 마지막장에서는 그러한 직관적 예측이 단순히 부정적이기만 한 것은 아니고 긍정적인 측면도 있음을 되새겨줍니다.


예측이 들어가는 판단 중에는 직관적인 판단과 명확한 분석 뒤에 내리는 판단이 있는데요, 전자는 시스템 1, 후자는 시스템 2가 주로 관여할 것입니다. 그중에서도 직관적 판단은 기술과 전문성에서 나오는 직관, 어려운 문제를 쉬운 문제로 바꿔치기하는 어림짐작에서 나오는 직관으로 다시 나누어 볼 수 있습니다. 이 두 가지가 결합되어 전문 영역에서의 판단이 이루어지는 경우가 일반적입니다만, 문제는 이 두 가지를 구분하지 못하는 경우가 많다는 것입니다. 즉, 어림짐작을 본인의 전문성에 기반한 것으로 착각하는 것이죠. 


이러한 것은 특히 미래에 대한 예측에서 더 분명하게 보입니다. 특히 바꿔치기와 세기 짝짓기에 있어서 그런 사례들이 있음을 보여주었어요. 이는 일련의 사고 과정을 통해 체계적으로 편향된 결과입니다.


그러한 편향은 평균 회귀를 통해 수정되어야 하며, 수치 또는 규모를 예측할 때 나타나는 편향의 경우에 특히 더 그러합니다. 이러한 예측 수정은 시스템 2가 하는 역할입니다. 


하지만 그러한 편향을 없애는 것이 늘 옳은 것은 아닙니다. 주어진 정보가 매우 유효하거나 혹은 극단적인 경우에는 그러한 결론이 나올 수도 있습니다. 이러한 비편향예측은 그 오류 가능성에도 불구하고 때론 유용하게 작용하기도 하니까요. (발생 가능성은 적으나 그 중요도는 높은, 푸아송 분포의 사례가 언뜻 떠오르기도 합니다)


하지만 우리는 늘 합리적은 아니며, 더러는 심각한 충격을 피하기 위해 왜곡된 추정으로 안도감을 찾아야 할 때도 있다. 그러나 극단적 예측으로 자신을 속이기로 했다면, 내 멋대로 예측했다는 사실을 계속 알고라도 있어야 옳다.


그러나 그것이 일반적인 경우는 아닙니다. 극단에 치우친 예측, 그리고 빈약한 증거를 기반으로 드문 사건을 흔쾌히 예측하는 성향은 모두 시스템 1이 작동한 결과입니다. 우리는 그러한 극단적인 예측에 대해선 과신하기 쉽기에 이를 주의해야 합니다. 


이렇게 2부가 마무리되었는데요, '과신'의 문제로 마무리되어서인지 3부는 '과신'이라는 제목으로 이어지네요.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari