흔히 사주, 관상 같은 걸 믿는 사람들은 관련된 얘기를 하면서 빅데이터 혹은 통계라는 말을 한다. 하지만 이는 빅데이터 및 통계에 대한 이해가 부족해서 발생하는 오해다. 아마도 빅데이터라는 용어는 통계의 최신 유행하는 밈 정도일 테니 통계라는 것에 대해서 간략히 생각해 보자.
통계는 오차의 학문이다
주사위를 던질 때 가장 가까운 숫자를 맞히는 사람이 이긴다고 해보자. 1 혹은 6을 고른 사람과 3 혹은 4를 고른 사람 중에 누가 이길 가능성이 높을까? 당연히 후자이다. 이것은 주사위를 던졌을 때 기댓값 3.5가 의미하는 것과 같다. 통계에서는 이런 식으로 맞힐 가능성을 극대화하는 문제를 푼다. 대표적으로 회귀분석(regression)이 그렇다.통계는 통제할 수 없는 오차를 인정하면서도 그 안에서 관계성, 경향성을 찾는 학문이다. '오늘 비 올 확률이 80%입니다'라고 하더라도 여러 이유로 비가 안 왔다면 오차의 학문 입장에서 어쩔 수 없는 오차가 발생했다고 생각하게 된다. 반대로 통계에 기반을 두었다면 '내 말 무조건 맞으니까 그것에 따라!' 같은 얘기는 하지 않는다. 마찬가지로 오차의 학문이기 때문이다. 웃기지만 이 지점이 우리 사회가 '기브 앤 테이크', '그릿' 같은 사회과학에 기반한 책을 잘못 소비하는 방식이기도 하다. 저자들은 오차의 학문을 기반으로 연구하고 발표한 결과를 대중서적으로 낸 것인데, 소비하는 사람들은 오차 없음의 학문으로 이해하고 소비하기 때문이다.
사주는 오차 없음의 예언이다
하지만 사주는 어떤가? 일단 사주집은 방문하면 강한 카리스마로 압도한다. 생년월일 등을 받아 적고 나름의 규칙에 기반해 운명을 전개해 나간다. 그렇게 나온 결과에 사주를 봐주시는 분의 직관과 연륜을 섞어 지금까지 이래왔고, 올해에 무슨 일이 생길 거고, 몇 살에 결혼할 것이고, 돈을 얼마나 벌고, 가족과의 관계는 어떻고 등에 대해 얘기를 이어나간다. 이들은 절대 오차가 있을 수 있으며 이런 부분이 데이터 상 부족하다 같은 얘기를 하지 않는다. 사주는 오차 없음의 예언이기 때문이다. 예언은 언제 어떤 사건이 발생하는지, 가능하다면 어떤 이유로 발생하는지까지 맞혀야 진짜 예언이다. 올해 아파트 가격이 떨어질 거라고 10년에 걸쳐 매년 얘기하다가 연준의 금리인상을 트리거로 아파트 가격이 떨어지면 그 사람의 예언은 맞았다고 할 수 있을까? 사주에서 남편이 교통사고로 죽을 거라고 했는데 80살에 밥 먹다가 기도가 막혀 죽었으면 예언이 맞았다고 할 수 있을까? 당연히 아니다. 이처럼 언제, 어떻게, 왜 사건이 발생하는지 예언하고 심지어 여러 개의 예언을 모두 맞히는 것은 과학적으로는 불가능한 일이다.
사주는 왜 유지되는가?
이제 사주가 과학적 근거가 없다는 걸 우리는 알 수 있다. 마치 '어떻게 지평좌표계로 고정을 하셨죠?'라는 얘기로 귀신이라는 존재를 과학적으로 믿지 않게 되는 것처럼 말이다. 그렇다면 사주는 왜 유지되었을까? 두 가지 이유가 있는데 하나는 선택 편향이다. 사주에 n가지의 예언이 있다면 높은 확률로 다 틀린다. 놀랍게도 우리는 그 틀린 예언들을 다 잊어버리거나 재미로 본 거니까라며 넘긴다. 하지만 만약 하나가 맞았다면 나머지를 뭐라고 예언했든 간에 우리는 그 집이 용한 집이라고 얘기하게 된다. 실제 원리는 고장 난 시계도 하루에 두 번 맞는 원리인데 말이다. 이 하나의 용함이 그 사주집을 줄 서서 사주 보게 하는 집으로 만들기 때문에 이 한 번의 성공경험이 있냐 없냐에 따라 이후 운명이 바뀐다.