숫자가 말을 걸어올 때

벤포드의 속삭임

by 안도현

통계라는 예


통계수학


고3 시절 읽었던 통계학 책에서 신기한 이야기를 본 적이 있다.

"자연에서 나타나는 숫자들을 무작위로 모아보면, 1로 시작하는 숫자가 30% 이상 나온다."

처음엔 말도 안 된다고 생각했다. 1부터 9까지, 당연히 각각 11% 정도씩 나와야 하는 거 아닌가. 하지만 책은 계속해서 설명했다. 인구 통계, 강의 길이, 주가, 심지어 피보나치수열까지. 온갖 자연 현상에서 이 법칙이 성립한다고 했다.

그게 바로 벤포드의 법칙(Benford's Law)이었다.

1881년 천문학자 사이먼 뉴컴이 처음 발견하고, 1938년 물리학자 프랭크 벤포드가 체계화한 이 법칙은 우리가 사는 세상이 얼마나 기묘한 질서를 숨기고 있는지 보여준다. 무작위처럼 보이는 숫자들 속에서도 어떤 규칙이 꿈틀거리고 있다는 것이다.

마치 카지노에서 "언제나 도박장이 돈을 번다"는 절대적 진리처럼 말이다.






졸업을 앞둔 지금, 지난 4년을 돌아보면 통계학은 내게 세상을 보는 새로운 눈을 선사했다.

처음 입학할 때만 해도 통계학이란 그저 숫자를 가지고 노는 학문 정도로 생각했다. 하지만 곧 깨달았다. 통계학은 숫자에 관한 학문이 아니라 불확실성不確實性에 관한 학문이라는 것을.

키르케고르는 시인을 두고 "시칠리아의 암소에 갇힌 죄수"에 비유한 적이 있다. 형틀 속에서 울부짖는 비명이 아름다운 음악으로 들린다는 그 이야기처럼, 통계학자도 불확실성이라는 고통 속에서 의미를 찾아내는 존재가 아닐까.





내가 가장 좋아하는 통계학 개념 중 하나는 생일 문제(birthday paradox)다.

무작위로 23명을 뽑으면 그중 최소 2명이 같은 생일일 확률이 50%를 넘는다. 41명만 되어도 확률은 90%를 넘어선다. 직관적으로는 말이 안 되지만, 수학적으로는 완벽하게 증명되는 현상이다.

이 문제를 처음 접했을 때의 충격을 지금도 기억한다. 세상이 내가 생각하는 것보다 훨씬 더 기묘하고 반직관적이라는 깨달음. 일상의 상식이 얼마나 허술한 토대 위에 세워져 있는지를 보여주는 단적인 예였다.

통계학은 그런 식으로 우리의 편견을 산산조각 낸다. "아마도", "대략", "보통은"이라는 모호한 표현들을 정확한 숫자로 바꾸어 놓으면서 말이다.



《동의보감東醫寶鑑》에서는 분노가 오장육부를 가장 심각하게 망가뜨린다고 했다. 통계학에서도 비슷한 이야기가 있다. 편향(bias)이라는 것이다.

확증편향, 생존편향, 선택편향... 온갖 종류의 편향이 우리의 판단을 흐린다. 마치 색안경을 끼고 세상을 바라보는 것처럼, 편향은 우리가 보고 싶어 하는 것만 보게 만든다.

통계학도가 되는 과정은 결국 이런 편향들과 맞서 싸우는 훈련이었다. 내가 보고 싶어 하는 것이 아니라 데이터가 보여주는 것을 바라보는 법을 배우는 것. 감정이 아닌 증거에 기반해 판단하는 습관을 기르는 것.

하지만 요즘 우리 사회를 보면 정반대다. 한국의 악플이 선플보다 네 배나 많다는 통계도 있지 않던가.

사람들은 자신과 다른 의견을 만나면 귀를 막고 눈을 감는다. 확증편향에 사로잡혀 보고 싶은 것만 보려 한다. 진실을 원하는 척 하지만, 사실은 자신의 진실이 진실이라 위안받고 싶은 것뿐이다.

그런데도 나는 여전히 믿는다. 화합과 사랑이 세상을 움직이는 진짜 열쇠라고.

희망은 여명黎明처럼 다시 피어날 거다.



교수님과 상담했을 때 이런 말씀을 하셨다. "통계학자는 질문을 만드는 사람이다. 답을 찾는 사람이 아니라."

그때까지만 해도 통계학이란 주어진 데이터에서 결론을 도출하는 학문이라고 생각했는데, 실상은 정반대였다. 어떤 질문을 하느냐가 어떤 답을 얻느냐보다 훨씬 중요했다.

마치 몬드리안의 신조형주의新造形主義 작품처럼, 진짜 의미는 선과 삭면 사이의 여백에 숨어 있는 것이다. 데이터가 말하지 않는 것, 측정되지 않은 것, 관찰되지 않은 것들 속에 더 큰 진실이 도사리고 있다.

졸업을 하며 만난 한 가지 깨달음이 있다.

통계학은 완벽한 답을 주지 않는다. 대신 "95% 신뢰구간에서", "유의 수준 0.05 하에서"라는 조건부 진실을 제공할 뿐이다. 언제나 불확실성의 그림자가 따라붙는다.

하지만 그게 오히려 통계학의 매력이다. 겸손함을 가르쳐주는 학문이랄까. 세상에 절대적인 것은 없으며, 모든 판단에는 오류의 가능성이 따른다는 것을 인정하는 태도 말이다.

4년 전 신입생 시절, 나는 "새로운 통계 법칙을 발견하겠다"는 거창한 꿈을 품었다. 지금 생각해 보면 우스운 일이다.



통계학의 진짜 가치는 새로운 것을 발견하는 데 있지 않다. 이미 우리 곁에 있던 패턴들을 알아보는 눈을 기르는 데 있다. 벤포드의 법칙처럼, 생일 문제처럼, 일상 속에 숨어 있는 기묘한 질서들을 읽어내는 능력을 키우는 것이다.

통계학자는 세상의 속삭임을 듣는 사람이다. 숫자들이 들려주는 이야기에 귀 기울이고, 그 속에서 인간의 흔적을 찾아내는 사람이다.

오늘도 어디선가 데이터가 말을 걸어온다. 1로 시작하는 숫자들이 30%의 확률로 나타나면서, 23명 중 2명이 같은 생일을 가지면서, 그렇게 조용히 자신의 비밀을 털어놓고 있다.

이제 나는 그 속삭임을 들을 줄 안다. 그것만으로도 충분하다.

keyword