확률과 통계가 갖는 의미
결과가 집단을 대표하기 위해 갖춰야 하는 조건
과학적인 영역뿐 아니라 철학, 사회, 정치와 같이 인문적인 영역도 불확실성 위에 놓인 오늘날 확률과 통계의 개념이 이들 영역에서 불확실성을 다루는 데 도움을 줄 수 있다면, 우리는 우선 확률과 통계가 이야기하는 기본적인 개념을 이해해야 한다. 물론 우리는 전문적으로 수학을 하거나, 통계학을 하는 학자가 아니기 때문에 통계를 학문적으로 깊게 파고들어 이해할 필요는 없다. 우리에게는 불확실성이 우리에게 주는 의미를 혼동하지 않을 정도의 지식만 있으면 충분하다.
확률과 통계가 갖는 의미를 이해하기 위해서는 먼저 우리 머릿속에 자리 잡고 있는 한 가지 생각의 틀을 버려야 한다. 사람마다 그 정도가 다를 수 있고 불확실성의 시대에 걸맞은 사고방식을 자주 접한 사람이라면 이미 버렸을 수도 있는 인식의 틀, 바로 결정론적 사고방식이다. 결정론적 사고방식은 우리가 접하는 상황에 하나의 고정된 정답이 있다는 인식의 틀이다. 하나의 정답이 존재한다는 사고방식이라고 하면 그리 특별하게 느껴지지 않을 수도 있지만 결정론적 사고방식은 생각보다 폭넓게 인간의 삶을 지배하고 있었다. 서로 다툰 두 사람의 이야기를 들었을 때 한쪽이 틀렸다는 생각을 갖게 되는 것처럼 우리가 일상에서 흔히 마주하는 상황에서부터 정치적인 영역에서 대립하는 가치가 있을 때 한 가지 가치가 반드시 옳다고 믿는 생각까지, 이와 같이 대립하는 것들 중에 하나가 반드시 옳다고 믿는 생각이 결정론적 사고방식이다. 결정론적 사고방식이 일상에서 드러날 때는 이분법적인 사고방식으로 드러나게 된다. 신의 시대에는 신이 옳았고, 신을 거스르는 것은 옳지 않았다. 인간 이성의 시대에는 인간 이성이 옳고 이성적이지 않은 것은 옳지 않았다. 결정론이 가져온 이분법적인 사고방식에서는 이렇듯 하나의 진리가 있고 그 외의 것은 언제나 옳지 않다. 선이 있으면 그 반대에 악이 존재하고, 대립하는 가치 중 하나는 선의 위치를 차지하게 된다. 마음속에 하나의 선이 자리 잡은 상태에서는 그 반대에 있는 것은 언제나 악이 되는 것이다. 이러한 개념은 우리 사회의 모든 영역에서 강하게 작동하고 있다. 성장과 분배, 집중과 분산, 좌와 우로 표상되는 모든 담론은 항상 이분법적인 사고방식을 택하고 결정론적인 사고방식과 결합한다. 이러한 사고방식 하에서는 반드시 하나의 개념이 정답, 진리의 위치를 차지하기 때문에 반대편의 개념이 설 자리가 없다. 다름은 용납되지 않고 틀림으로 인식된다. 하지만, 인간이 만들어 낸 가치 중에 절대적인 것이 존재한다고 이야기하기는 쉽지 않다. 이분법적인 사고방식이 해결책이 되지 못한다는 것은 극단을 상상해보는 것으로 알 수 있는데, 이러한 사고 실험의 대표적인 예가 래퍼 곡선이다. 래퍼 곡선은 효율적인 조세 구간에 대한 논의에서 자주 등장하는 개념인데, 세율이 극단적인 두 지점에서 어떤 일이 벌어지는지를 생각해보는 것이다. 세율이 0이라면 당연히 세입은 0이 될 것이다. 그러나 반대로 세율이 100% 일 때 또한 아무도 일을 하지 않을 것이기 때문에 세입은 0이 될 것이다. 양 끝단의 어느 점에서도 세입이 존재할 수 없다는 것을 알게 되면 조세의 문제에서 세율이 무조건적으로 낮아야 좋다는 입장과 무조건적으로 높아야 좋다는 입장은 모두 해결책이 될 수 없다는 것을 깨닫게 된다. 즉 세입은 양 끝단에서 0이며 중간에서 상승하는 형태의 포물선, 혹은 흔들리는 곡선을 그 사이에서 그리게 될 테니 우리가 논의해야 할 것은 그 사이 어느 지점이 우리가 원하는 목표를 이루기 좋은 지점일까에 대한 논의이다. 인문적인 영역에서 대립하는 수많은 가치들에 대해 이러한 극단적 사고 실험을 하다 보면 거의 모든 가치가 그 자체만으로 정답이 될 수 없다는 것을 알 수 있다. 심지어 이타적인 생각이나 사랑도 과하면 독이 된다. 이분법적, 결정론적인 사고방식이 인간의 삶에 주어진 문제에 해결책이 될 수 없다는 것을 인식한다면 대립하는 수많은 사안에 대해 다른 시각을 가지게 된다. 더 이상 하나의 가치가 반드시 옳다고 주장하는 것은 논의의 대상이 되지 않는다. 논의의 방향이 '최적화'로 옮겨 가는 것이다. '주어진 조건 하에서 어떤 지점에 놓이는 것이 우리에게 최선의 선택일까?'가 우리가 치열하게 의논해야 하는 질문인 것이다. 인문학적 문제에서 결정론적 사고방식을 버리고 중용의 사고방식을 받아들여 문제 자체를 '최적화'로 옮겨가는 것, 이것이 확률과 통계의 의미를 이해하기 위해 필요한 첫 번째 생각의 전환이다.
확률과 통계가 이야기하는 것 또한 이러한 최적화의 문제다. 주어진 상황에서 불확실한 결과가 우리 눈앞에 놓였을 때, 우리는 이 결과를 어떻게 해석하는 것이 최적인가? 항상 옳다고 말할 수는 없지만 어떻게 이야기하는 것이 최적의 표현인가? 에 대한 답이 확률과 통계이다. 그리고 그때 등장하는 대표적인 개념이 기댓값이다. 기댓값이란 우리에게 주어진 상황에서, 그 상황이 특정한 조건을 만족했을 때 우리가 기대할 수 있는 결과, 최적의 표현이다. 수학적으로는 확률가중평균으로 계산되는 값인데, 예를 들어 동전을 던졌을 때 이러한 상황에서 앞면이 나올 횟수의 기댓값은 0.5라고 이야기할 수 있다. 나올 수 있는 결과는 앞면이 나오거나 뒷면이 나오거나와 같이 불확실하지만, 두 사건이 동일한 확률로 일어난다고 했을 때 절반의 확률과 이때 앞면이 나오는 횟수 1번을 곱한 0.5가 앞면이 나오는 횟수의 대푯값이 되는 것이다. 하지만 기댓값에는 하나의 함정이 있다. 기댓값이라는 용어 자체가 우리가 결과에 대해 기대할 수 있는 것을 의미하는 것처럼 느껴지기 때문에 항상 우리는 기댓값을 계산하고 이와 같은 결과를 기대하게 된다. 그러나 기댓값은 모든 상황에서 이와 같은 결과를 기대할 수 있다고 이야기하지 않는다. 앞에서 기댓값을 정의할 때 잠깐 지나갔지만 사실 가장 중요한 것은 '그 상황이 특정한 조건을 만족했을 때'라는 단서다. 이때의 특정한 조건은 동일한 사건을 무수히 많이 반복할 수 있을 때를 의미한다. 동전을 던졌을 때 앞면이 나올 횟수의 기댓값이 0.5라는 것은 우리가 동전을 한 번 던져놓고 0.5회 앞면이 나올 것을 기대하라고 이야기하는 것이 아니다. 동전을 한 번 던지면 나오는 결과는 앞면이 한 번 나오거나, 나오지 않는 1 또는 0 뿐이다. 기댓값이 0.5라는 것의 의미는 우리가 동전을 계속해서 던질 때, 앞면이 나온 횟수가 평균적으로 0.5에 수렴해간다는 것을 의미한다. 한 번의 동전을 던져놓고 0.5회의 앞면을 기대할 수는 없지만, 100번을 던졌다면 0.5라는 비율에 더 가까워질 것이고, 10000번을 던지게 되면 앞면의 비중은 0.5에 더 가까워질 것이다. 기댓값을 기대하기 위해서는 생각보다 엄격한 조건이 필요한 것이다.
우리가 불확실성의 시대에서 통계적인 인식의 틀을 받아들인다면 가장 많이 사용하게 될 지표는 기댓값일 것이다. 멀리서 찾을 필요도 없이 투표의 결과는 기댓값을 의미한다. 우리 각자가 동전이 되어 던져지는 것이 투표다. 누군가는 찬성하고 누군가는 반대한다고 했을 때 우리 사회, 집단 전체의 대푯값으로 채택되는 것이 바로 기댓값인 것이다. 기댓값은 투표를 하는 우리에게 두 가지 주의사항을 알려준다. 첫째, 투표 결과는 결정론적인 결과를 의미하지 않는다. 0%부터 100% 까지 투표 결과는 연속적으로 존재한다. 어느 한쪽이 결정론적으로 옳다거나 틀렸다거나와 같은 이분법적인 의미를 주는 것이 아니다. 물론 투표 결과를 통해 현실적인 조치를 취하게 될 때는 하나의 결과를 택할 수밖에 없기 때문에 결정론적으로 사용할 수밖에 없지만 우리가 그 의미를 받아들일 때는 불확실성이 존재한다는 것을 인식해야 한다. 불확실성을 품고 있는 상황에서 투표 결과는 참과 거짓이 아닌, 참일 확률의 문제, 연속적으로 놓인 결과 하에서 어떤 것이 가장 우세한 지를 의미할 뿐이다. 그 이상으로 하나를 선, 그 밖의 겻을 악으로 규정하는 것은 확대해석이다. 또 한 가지는 투표 결과가 우리 집단을 대표하기 위해서는 기댓값이 필요로 하는 조건을 만족시켜야 한다는 것이다. 투표에서 중요한 것은 기댓값에 해당하는 결과가 아니다. 그 기댓값이 진짜 기대할 수 있는 값이 될 수 있도록 조건을 만족시키려는 노력이다. 기댓값이 필요로 하는 조건은 동일한 시행이 최대한 많이 이루어지는 것이다. 이때 동일한 시행은 우리가 모두 같아야 한다는 것을 의미하지 않는다. 서로가 서로의 결과에 영향을 미치지 않는 것, '독립적일 것'을 의미한다. 투표를 할 때 모든 개인이 자기 자신의 생각으로 본인의 선호를 결정하는 것이 투표의 핵심이라는 뜻이다. 오늘날 사회, 정치, 인문적인 사안에서는 이러한 독립성에 대한 중요성을 주의 깊게 다루지 않고 있다. 우리가 집중하고 있는 것은 여전히 결과이다. 투표 결과가 50%를 기준으로 어느 쪽으로 기울었는지가 가장 큰 관심사가 되고 있는 것이다. 하지만 통계가 우리에게 결과는 받아들이되, 중요한 것은 과정이라고 말한다. 결과는 어찌 되었든 나오게 되어 있다. 그러니 결과를 대푯값으로 만들기 위해서는 모든 개인이 객관적인 것을 접하고, 자신의 생각을 더해 자신의 결과를 만들어야 한다. 요즘 우리 사회는 불확실성의 시대가 필요로 하는 이러한 객관성에서 멀어지고 있다. 타인의 생각에 객관적이지 않은 방법으로 영향을 미치려는 사람들이 넘치고 자신의 생각에 영향을 미치려는 타인의 말을 무비판적으로 수용하는 사람들이 더 많다. 누군가가 한쪽이 당연히 옳다고 이야기하면 그 말을 그대로 믿거나, 누군가 제시한 틀린 정보를 가지고 그대로 자신의 생각을 굳힌다. 객관성이 불확실성의 시대를 다루는 가장 중요한 원칙 중 하나라면, 그 역할을 수행하는 중요한 임무를 맡은 것은 언론이나 그 외의 대중 매체다. 그러나 객관성인 정보를 제공해서 모든 사람이 독립적인 판단을 할 수 있도록 해야 하는 역할을 받은 언론은 오히려 주관적인 정보를 사람들에게 주입해서 독립적인 판단을 방해한다. 한쪽으로 편향된 정보를 제공하고, 자신의 입맛에 맞는 정보만을 원하는 사람들이 엉겨 붙어 점점 더 객관적, 독립적인 판단에서는 멀어지는 오늘날의 사회는 불확실성의 시대에 걸맞은 사고방식에서 점점 더 멀어지고 있다. 수학에서는 독립성이 확보된 시행을 '독립시행'이라고 부르는데, 우리 사회의 사안에 대한 대푯값을 정할 때 '독립 시행'이라는 조건을 위해 노력하지 않는 한, 우리는 투표 결과가 우리 사회, 집단을 대표하는 결과라고 이야기할 수 없다.
개인은 결정론적이고 이분법적인 사고방식을 버리는 것,
객관적인 정보를 제공해서 모든 개인이 자기 자신의 독립적인 판단을 할 수 있는 조건을 갖추는 것,
이 두 가지를 갖추지 않는 한 우리 사회는 불확실성의 시대를 헤쳐나가는 철학을 갖출 수 없다.