[서평] 데이비드 핸드의 <신은 주사위 놀이를 하지 않는다>
샐리 클라크라는 변호사는 1999년 영아 살해 혐의로 체포되어 종신형에 처해졌다. 첫째 아이에 이어 둘째 아이까지 잠자던 중에 영아돌연사증후군으로 사망했기 때문이었다. 검사 측 증인으로 나온 소아과 의사는 영아돌연사증후군의 확률이 8543분의 1이라고 증언했다. 따라서 두 아이가 모두 영아돌연사증후군으로 사망할 확률은 저 확률의 제곱, 즉 7300만 분의 1이며, 절대 그냥 일어날 수 없는 일이라고 주장했다. 재판부는 확률을 들이댄 그의 증언을 받아들였다.
확률에 대한 오해는 철학적 문제에도 이어진다. 구글의 최고위 엔지니어인 모 가댓은 <행복을 풀다>에서 진화론을 부정하고 창조론을 옹호했다. 단백질이 무작위로 결합하여 DNA가 되는 확률이 너무 낮기 때문에 우주의 나이를 고려하면 결코 발생할 수 없는 일이라는 것이 그의 결론이다.
이 책은 극히 희박한 확률의 사건이 왜 자꾸 일어나는지를 설명해 주는 책이다. 어느 아마추어 골퍼가 이틀 연속으로 홀인원을 기록했다면, 그 골퍼와 내기를 한 사람이 아닌 다음에야 그냥 웃고 넘어가면 될 일이다. 하지만 2주 연속으로 로또 당첨 번호가 같게 나왔다면 어떨까? 사회적 파장은 샐리 클라크에 대한 종신형 선고보다 더 파괴적일 수도 있을 것이다.
우연을 설명하는 다섯 가지 법칙
희박한 확률의 사건이 왜 자꾸 일어나는가? 사실은 일어날 만해서 일어나는 것이다. 그 이유를 저자는 다섯 개의 법칙을 통해 설명한다. 법칙이라고는 하지만, 당연한 사실을 정리한 것뿐이다. 하나씩 살펴보자.
1. 필연성의 법칙
아무리 확률이 작은 사건이라도 언젠가는 일어난다는 법칙이다. 발행된 로또 전부를 사면 하나는 당첨된다. 충분히 여러 차례 시도하면, 주사위 열 개가 전부 1이 나오는 사건도 벌어지는 법이다.
광신도를 만드는 법을 알려주겠다. 1,024명에게 내일 주가의 방향을 맞추겠다고 하고, 512명에게는 오른다, 다른 512명에게는 내린다는 내용의 메일을 보낸다. 다음날에는, 전날 맞는 예언을 받은 512명을 대상으로 다시 반에게는 오른다, 다른 반에게는 내린다는 내용을 알린다. 이렇게 10일을 반복하면, 딱 한 사람은 당신을 예언가로 떠받들 것이다. 10일 연속으로 주가의 향방을 정확하게 예측했으니 말이다!
2. 아주 큰 수의 법칙
필연성의 법칙에서 이어지는 내용으로, 아주 여러 차례 시도하면 아무리 작은 확률의 사건이라도 일어난다는 이야기다. 한 반에 생일이 겹치는 학생이 한 쌍 존재하려면 학생이 몇 명이나 필요할 것 같은가? 직관적으로 생각하면 대략 366명 정도 있어야 할 것 같다. 그런데 정답은 23명이다.
23명의 생일을 모두 다르게 정하는 경우의 수를 살펴보자. 우선 한 사람의 생일을 정한다. 두 번째 사람은 첫 번째 사람과 생일이 겹치지 않아야 하므로, 첫 번째 사람의 생일이 아닌 나머지 364일 중에서 생일을 골라야 한다. 세 번째 사람은 363일 중에서, 그리고 죽 이어가면 23번째 사람은 남은 343일 중에서 고르면 된다.
따라서 모든 사람이 생일이 겹치지 않게 늘어설 확률은 364/365 x 363/365 x 362/365 x .... x 343/365 = 대략 49%가 된다. 즉, 23명이 모이면 그중 생일이 같은 사람이 두 명 이상 있을 확률이 51%로 절반을 넘는다.
두 주 연속으로 로또 당첨 번호가 같게 나오면 어떤 일이 벌어질까? 실제로 이런 일이 2009년 불가리아에서 벌어졌다. 언론은 "52년 로또 역사상 처음 일어난 기괴한 사건"이라고 보도했고, 체육부 장관은 조사를 지시했다. 정말로 누군가가 조작한 사건일까? 49개의 숫자에서 6개의 숫자를 조합하는 방법은 약 1400만 가지다.
저자의 계산에 따르면, 4,400번 정도 추첨을 반복하면 똑같은 당첨 번호가 두 번 나올 확률이 그렇지 않을 확률보다 커진다(조금 전에 한 생일 계산을 떠올려 보라). 매주 추첨을 할 경우, 85년이 걸리는 일이다. 불가리아에서는 이 사건이 조금 일찍 일어난 것 뿐이다. 다시 말해, 극악의 확률이 현실화된 것이 아니고, 그냥 낮은 수준의 확률을 가진 사건이 일어난 것뿐이다.
3. 선택의 법칙
10개의 과녁 모두 정중앙에 화살이 하나씩 꽂혀 있다. 그런데 알고 보니 우선 화살을 마구 벽에다 쏜 뒤, 나중에 과녁을 그린 것이었다면? 어처구니없다고 생각하겠지만 이런 일은 우리 주위에서 빈번히 일어난다. 대표적인 것이 통계 검증이다.
앤설 키스(Ancel Keys)는 1978년 유명한 '7개국 연구'라는 논문을 통해 포화지방 섭취가 심장병 발생과 유의미한 상관관계가 있다고 밝혔다. 저지방 식단에 대한 전 세계적 노이로제가 시작된 역사적 순간이다. 그런데 나중에 다른 연구자들은 앤설 키스가 23개국 자료 중에서 자신이 믿고 싶은 '결론'과 일치하는 일곱 개 국가의 자료만을 추려내서 발표했다는 사실을 폭로했다.
경제 예측도 선택의 법칙이 난무하는 각축장이다. 사람들은 적중한 예측은 놀라운 것으로 받아들이면서 기억하지만 빗나간 예측은 쉽게 잊는다. 그래서 주가나 경제성장률을 예언하는 '전문가'들은 수많은 예측을 쏟아낸다. 100개의 예측 중 하나라도 맞으면 사람들은 적중한 예측만을 기억하고 그를 떠받들 것이기 때문이다.
4. 확률 지렛대의 법칙
2008년의 금융 위기는 1.3*10^23분의 1의 확률로 일어날 사건이라고 말하는 사람들이 있다. 주가의 움직임을 정규분포로 보고, 2008년 낙폭이 평균에서 10 표준편차만큼 떨어져 있는 수준이기 때문이라는 것이다. 과연 주식시장 등락이 정규분포를 따를까?
코시분포는 정규분포에 비해 꼬리 쪽이 조금 더 두툼한 형태인데, 주식시장 등락이 만약 코시분포를 따른다면 2008년의 낙폭은 1/32의 확률로 일어난다. 언제 일어나도 이상할 것이 없는 확률이다.
확률 지렛대의 법칙은 나비효과와 유사하다. 가정이 조금만 달라져도 계산 결과는 엄청난 영향을 받는다는 것이다. 바이클 베리는 10^10광년 떨어져 있는 전자 하나가 제거될 경우, 그 효과가 불과 1억 분의 1초 만에 이곳에 미친다는 사실을 계산을 통해 밝혔다. 확률 계산의 전제조건이 극히 미세하게 바뀌더라도 그 효과는 폭발적일 수 있다.
5. 충분함의 법칙
만약 내가 100개의 숫자 중 하나를 맞추겠다고 하고 13을 예측했는데 12가 나왔다면 다들 거의 맞췄다면서 아쉬워할 것이다. '대강 맞는다고 치자.' 이것이 충분함의 법칙이다. 예지몽의 경우 대개 충분함의 법칙으로 설명이 된다. 조금 비틀어서라도 현실과 맞아 떨어진다면 꿈의 내용은 예지로 받아들여진다.
충분함의 법칙은 선택의 법칙과도 아주 궁합이 잘 맞는다. 내가 올해 우리나라 경제성장률을 3.3%라고 예측했는데 실제 결과가 3.4%로 나온다면 나는 '거의 맞는' 예측을 한 전문가 취급을 받을 것이다(물론 저 예측을 올해 초에 했어야 하겠지만 말이다).
디킨즈의 소설 <오래된 골동품 상점>에는 두 여인이 우연히 만나 서로 공통점이 너무 많다고 놀라워하는 장면이 나온다. 둘 다 과부이고, 한 명의 아버지는 다른 사람의 아버지보다 정확히 4년 10개월 나이가 더 많았고, 한 사람은 수요일에, 다른 사람은 목요일에 죽었으며, 둘 다 가문이 고귀하고 외모가 빼어났다는 것이다. 충분함의 법칙이 작용하면 세상 웬만한 것은 다 우연의 일치가 된다.
확률의 오해
샐리 클라크의 사건으로 돌아가 보자. 무작위로 고른 두 사람이 같은 암으로 사망할 확률은 낮지만, 만약 그 두 사람이 가족 관계라면 이야기가 달라진다. 샐리 클라크 사건에서는 두 영아의 돌연사증후군을 각각 독립사건이라고 판단했다. 그러나 연구에 따르면 한 영아가 돌연사증후군으로 사망했을 때, 동생이 같은 증상으로 죽을 확률은 10배로 높아진다.
타당한 결론에 도달하려면 두 아이가 살해되었을 확률과 영아돌연사증후군으로 사망했을 확률을 비교해야 했다. 한 대학교수의 계산에 따르면 두 아이가 모두 살해되었을 확률은 두 아이가 모두 영아돌연사증후군으로 사망했을 확률에 비해 훨씬 작다. 샐리는 2003년 무죄 석방되었지만, 시련의 충격으로 2007년 사망했다. 사인은 급성 알코올 중독이었다.
모 가댓은 <행복을 풀다>에서 어떤 실수를 한 걸까? 나는 이미 <행복을 풀다>의 두 번째 서평에서 스티븐 호킹의 <위대한 설계>를 인용해서 모 가댓의 오류를 지적한 바 있다. 요약하면, 무작위로 생명이 발생할 가능성은 한없이 작지만, 존재하는 우주의 숫자가 너무 많기 때문에 그중 몇 개의 우주에는 생명이 발생할 수밖에 없다는 내용이다. 나는 '아주 큰 수의 법칙'이라는 용어는 들어본 적이 없었지만, 같은 개념으로 논증을 한 것이다. (저 다섯 개의 법칙이 새로운 발견은 아니지 않은가?)
그런데 '아주 큰 수의 법칙'을 다시 생각해 보면 굳이 다중우주까지 가지 않더라도 생명 탄생의 확률은 꽤 높아질 수 있다. 모 가댓은 원숭이가 타자기를 무작위로 두드려서 <전쟁과 평화>가 쓰여지는 확률을 진화에 의한 생명 탄생과 비교했다. 그런데 아주 많은 원숭이가 타자기를 두드린다면 어떻게 될까?
확률을 잘못 이해하는 것은 샐리 클라크의 경우에서 보는 것처럼 비극을 초래하기도 한다. 샐리는 마녀사냥으로 죽은 것이나 다름없다. 2008년 주식 시장 쇼크가 우주 역사에서 절대 일어날 수 없는 확률의 사건이라고 말하는 것은, 주식 시장의 움직임이 정규분포를 따른다는 아무 근거 없는 가정에 의한 것이다.
경제학자들의 거짓말에 놀아나지 않기 위해 경제학을 배워야 한다는 말이 있다. 통계학에 대해서도 같은 이야기를 하고 싶다. 샐리 클라크의 비극은 소아과 의사가 증언한 '확률' 때문이었다.