빈도, 대칭, 믿음의 세 얼굴
[♪ 밝은 음악]
이지은: 안녕하세요, '안개 속을 걷다'의 이지은입니다! 오늘은 정말 흥미로운 주제를 가져왔어요. 우리가 매일 쓰는 '확률'이라는 말, 과연 어떤 의미일까요?
어제저녁, 친구들과 밥값을 걸고 동전 던지기를 했는데요. 그때 정말 재밌는 논쟁이 시작됐어요. 한 친구가 "당연히 50대 50이지!"라고 하자, 다른 친구가 바로 반박했어요. "아니야, 방금 3번 연속 뒷면 나왔잖아. 이번엔 무조건 앞면이야!" [웃음] 그러자 또 다른 친구가 끼어들었어요. "잠깐, 동전이 완벽하게 대칭일 리 없잖아. 정확히 50%는 아닐걸?" 저는 그냥 웃으면서 "난 왠지 앞면일 것 같은데~"라고 했고요.
[띠링!]
그 순간 깨달았어요. 우리 모두 '확률'이라고 말했지만, 각자 완전히 다른 걸 생각하고 있었다는 걸요! 같은 단어인데 서로 다른 의미로 쓰였다니, 정말 놀랍죠?
그런데 있잖아요, '확률'이라는 말에는 세 가지 서로 다른 의미가 숨어있어요. 오늘 저와 함께 이 세 가지 관점을 하나씩 살펴보면, 불확실한 상황을 훨씬 더 명확하게 이해할 수 있게 될 거예요. 자, 그럼 시작해 볼까요?
확률. 우리는 하루에도 몇 번씩 이 단어를 씁니다. 내일 비 올 확률 70%. 새 프로젝트 성공 가능성. 로또 1등에 당첨될 희박한 기회. 그런데 정작 확률이 무엇인지 물으면 말문이 막힙니다.
Ep.1에서 우리는 불확실성에 두 가지 종류가 있다는 걸 살펴봤습니다. 우연적 불확실성과 인식론적 불확실성이죠. 공중에서 회전하는 동전에서 어떤 면이 나올지 모르는 것과 그 동전이 평범한 동전인지 속임수용 동전인지 모르는 것. 이 둘은 근본적으로 다른 불확실성입니다. 확률은 바로 이런 불확실성들을 숫자로 표현하는 언어입니다. 다만, 어떤 종류의 불확실성을 다루느냐에 따라 관점이 달라집니다.
확률을 바라보는 관점은 크게 세 가지로 나뉩니다 [1,2]. 각 관점은 확률의 서로 다른 측면을 보여주는데, 상황의 성격에 따라 어떤 해석이 적절한지가 결정됩니다. 이 세 관점을 이해하면 불확실한 상황을 더 명확하게 이해할 수 있습니다.
첫 번째는 빈도주의 관점입니다. 가장 직관적이고 객관적인 접근법이죠. 같은 실험을 반복했을 때 특정 결과가 나타나는 비율, 그것이 곧 확률이라고 정의합니다 [3].
동전을 던진다고 해봅시다. 공정한 동전을 1000번 던지면 대략 500번 정도 앞면이 나옵니다. 만 번, 십만 번으로 늘릴수록 앞면이 나오는 비율은 50%에 가까워지죠. 큰 수의 법칙(law of large numbers)입니다. 빈도주의자에게 확률이란 이런 장기적 상대빈도를 뜻합니다.
빈도주의는 우연적 불확실성을 다루는 데 적합합니다. 동전이 날아가는 순간의 회전 속도, 공기 저항, 착지 표면의 미세한 굴곡까지—수많은 요인이 얽혀 결과를 예측 불가능하게 만들죠. 하지만 이런 무작위성에도 패턴이 있습니다. 반복하다 보면 특정 상대 빈도에 수렴하거든요.
빈도주의의 가장 큰 매력은 객관성입니다. 철수가 동전을 던지든 영희가 동전을 던지든, 동전을 충분히 많이 던지면 결국 같은 상대 빈도를 얻게 됩니다. 과학 실험이나 품질 관리처럼 시행을 반복할 수 있는 상황에서는 이보다 확실한 방법이 없죠. 카지노가 항상 이기는 이유도 여기 있습니다. 한 판 한 판 그 결과는 알 수 없어도, 만 번 게임하면 카지노가 이기도록 확률이 설계되어 있습니다.
하지만 한계도 명확하죠. 내일 지구에 운석이 충돌할 확률, 다음 대선에서 특정 후보가 당선될 확률—이런 일회성 사건은 반복해서 관찰할 수 없습니다. 설사 반복이 가능하더라도, 충분히 많은 횟수를 반복하기 어려운 경우도 많습니다.
두 번째는 고전적 관점입니다. 고전적 확률의 기초는 대칭성과 무차별 원칙(principle of indifference)입니다. 특별한 이유가 없다면 모든 결과에 같은 확률을 부여합니다 [4].
주사위를 생각해 봅시다. 주사위를 굴려 1이 나올 확률은 얼마일까요? 빈도주의 관점에서는 주사위를 수천 번 굴려 상대 빈도를 확인해야 하지만, 고전적 관점에서는 굴려볼 필요도 없습니다. 공정한 주사위라면 특정 면이 더 나올 이유가 없으니, 대칭성만으로 각 면의 확률은 1/6이어야 합니다.
이 접근법은 조합론과 함께 발전했습니다. 수학적으로 우아하고 계산도 간단합니다. 포커에서 로열 플러시가 나올 확률, 로또 1등에 당첨될 확률—이런 확률을 계산할 때 우리는 자연스럽게 고전적 관점을 택합니다.
고전적 확률도 주로 우연적 불확실성에 적용됩니다. 주사위나 카드의 물리적 대칭성이 무작위성의 근원이라고 보는 거죠. 하지만 정보가 부족한 상황에서는 인식론적 불확실성에도 적용할 수 있습니다. 한 번 상상해 보세요. 강아지 두 마리와 함께 사는 집. 퇴근해 보니 사료 봉투가 뜯어져 있습니다. 누가 범인인지 단서가 없다면? 각 강아지가 범인일 확률을 50%로 보는 게 합리적입니다.
하지만 현실에서는 이런 이상적인 대칭 상황이 드뭅니다. 내일 비가 올 확률은? 비가 오거나 안 오거나 두 가지니까, 각각 50%? 말도 안 됩니다. 계절, 기압, 습도, 바람, 구름의 움직임—수많은 변수가 작용합니다. 대부분의 현실 상황에서 '동등한 가능성'이라는 가정은 환상입니다.
세 번째는 주관적 확률 관점입니다. 베이지안(Bayesian) 관점이라고도 불리는 이 관점은 확률을 개인의 믿음 강도로 봅니다 [5]. 이상하게 들리시나요? 사실 우리가 일상에서 자신도 모르게 쓰는 확률이 바로 이겁니다.
프로젝트 성공 확률이 70%라고 말할 때, 그 근거는 무엇일까요? 같은 프로젝트를 백 번 해본 경험이 있나요? 성공과 실패가 대칭적인가요? 둘 다 아닙니다. 과거 경험, 현재 상황, 그리고 직관을 종합한 판단입니다. 같은 프로젝트를 두고도 사람마다 다른 확률을 매깁니다. 정보가 달라서죠. 그리고 새로운 정보를 얻으면 확률 판단도 바뀝니다. 이처럼 주관적 확률은 인식론적 불확실성을 다룹니다.
주관적 확률은 내기를 통해 측정할 수 있습니다 [5,6]. 친구가 제안합니다. '이 드라마 시청률이 10%를 넘으면 내가 치킨 쏜다. 안 넘으면 네가 쏴.' 받아들이시겠어요? 내기를 받는다면 시청률이 10%를 넘을 확률을 적어도 50% 이상으로 보는 거죠. 내기를 통해 막연한 믿음이 구체적인 숫자가 됩니다.
주관적 확률의 강점은 유연성입니다. 일회성 사건, 반복 불가능한 상황에도 적용할 수 있죠. 더 중요한 건 업데이트가 가능하다는 점입니다. 새로운 정보가 들어오면 확률을 수정할 수 있습니다 [7]. 시즌 2에서 다룰 베이지안 추론(Bayesian inference)의 핵심은 바로 이것—새로운 정보를 얻을 때마다 믿음을 합리적으로 업데이트하는 방법입니다.
물론 주관성이 약점으로 보일 수 있습니다. 같은 상황을 두고도 사람마다 다른 확률을 매길 수 있죠. 하지만 데이터가 충분히 쌓이면, 열린 마음으로 출발한 합리적인 사람들의 판단은 수렴합니다 [7]. 경험 많은 의사들의 진단이 비슷해지는 것과 같은 이치입니다.
세 관점은 서로 경쟁하지 않고 보완합니다 [1]. 상황에 맞는 관점을 선택하거나, 때로는 여러 관점을 함께 적용하는 것이 현명합니다.
신약의 효과를 평가하는 과정을 생각해 봅시다. 임상시험에서는 수천 명의 환자 데이터를 모읍니다. 빈도주의 접근이죠. 하지만 눈앞의 환자에게 이 약을 쓸지 말지 결정하는 것은 다른 문제입니다. 환자의 병력, 체질, 의사의 임상 경험—이 모든 것을 종합한 판단이 필요합니다.
투자도 비슷합니다. 과거 10년간 수익률 데이터(빈도주의)를 분석하는 것도 중요합니다. 하지만 미래 시장에 대한 전문가의 판단(주관적 확률)도 필요합니다. 현명한 투자자는 두 가지 정보를 모두 활용합니다.
어떤 관점이 적절할까요? 간단한 기준이 있습니다. 반복 가능한 상황이라면 빈도주의가 답입니다. 주사위나 동전처럼 물리적 대칭성이 명확하다면 고전적 확률을 쓰세요. 일회성 사건이거나 전문가의 판단이 중요한 상황이라면 주관적 확률이 적절합니다.
확률의 세 관점은 불확실성을 바라보는 세 개의 렌즈입니다. 상황에 맞는 렌즈를 선택하면, 불확실성 속에서도 더 나은 판단을 내릴 수 있습니다.
확률을 바라보는 세 관점을 알았으니, 한 가지 더 짚고 갑시다. 어떤 관점을 택하든 확률은 몇 가지 규칙을 따릅니다.
첫 번째 규칙, 모든 확률은 0 (= 0%)과 1 (= 100%) 사이의 값을 가집니다. 0은 불가능, 1은 확실함을 뜻합니다. 그래서 '120% 확신한다'는 말은 수학적으로 말이 안 됩니다.
두 번째 규칙, 모든 가능한 결과의 확률을 더하면 정확히 1이 됩니다. 왜일까요? 상호배타적이고 완전한(mutually exclusive and collectively exhaustive) 사건이라는 개념을 알면 이해가 쉽습니다.
동전으로 돌아갑시다. 앞면과 뒷면이 동시에 나올 수 있나요? 불가능합니다. 이 두 사건은 '상호배타적'입니다. 앞면과 뒷면이 아닌 제3의 결과가 발생할 수 있나요? 불가능하죠. 모든 결과를 포함한다는 의미에서 이 두 사건의 집합은 '완전합니다'. 앞서 확실한(반드시 일어나는) 사건의 확률은 1이라고 했습니다. 그럼 생각해 보세요. 동전을 던지면 앞면 아니면 뒷면이 반드시 나옵니다. 따라서 앞면 확률과 뒷면 확률의 합은 1이어야 합니다. 주사위도 마찬가지죠. 여섯 면 중 하나는 반드시 나오고, 두 면이 동시에 나올 수는 없으니까요.
세 번째 규칙, 상호배타적인 사건 중 하나가 일어날 확률은 각 사건의 확률을 더한 값과 같습니다. 주사위로 예를 들어봅시다. 짝수가 나올 확률은 얼마일까요? 짝수는 2, 4, 6입니다. 이들은 상호배타적이죠. 따라서 각각의 확률을 더하면 됩니다. 1/6 + 1/6 + 1/6 = 3/6 = 1/2. 바로 50%입니다.
여기까지가 확률의 기본 문법입니다. 0과 1 사이, 전체 합은 1, 겹치지 않으면 더한다.
이 규칙들은 무작위 변수(random variable)라는 개념과 함께 사용됩니다. 무작위 변수란 무엇일까요? 다시 동전으로 설명해 봅시다. 동전을 던지기 전에는 결과를 알 수 없습니다. 하지만 앞면 아니면 뒷면, 둘 중 하나라는 건 알고 있죠. 각 결과의 확률도 정해져 있습니다. 이처럼 가능한 결과와 각 결과의 확률은 알지만, 실제로 무엇이 나올지는 모르는 것. 이것이 무작위 변수입니다.
예를 들어, 동전 던지기 결과, 동전 두 개를 던졌을 때 앞면이 나온 횟수 등은 모두 무작위 변수입니다. 친구가 지금 아픈지 건강한지 모른다면? '아프다'와 '건강하다'에 각각 확률을 매길 수 있죠. 주관적 관점에서 보면, 친구의 건강 상태도 무작위 변수가 됩니다.
확률 분포는 무작위 변수의 전체 그림입니다. 가능한 모든 값과 각 값의 확률을 한눈에 보여주죠. 예를 들어, 동전 던지기 결과의 확률 분포를 표로 그리면 이렇습니다:
단순하죠? 하지만 이 간단한 표가 동전 던지기의 모든 정보를 담고 있습니다.
이 책에서는 확률을 표기하는 간단한 방법을 사용합니다. 수학적 엄밀성을 희생하고, 이해하기 쉬운 표기를 택했습니다. P는 확률(Probability)의 첫 글자입니다. P(무작위 변수)는 그 변수의 확률 분포 전체를 가리키죠. 가령 P(건강 상태)는 건강 상태에 대한 확률 분포를 의미합니다. 반면 P(특정 값)은 그 값이 나올 확률을 뜻합니다. P(건강하다) = 70%라고 쓰면, 건강할 확률이 70%라는 뜻이죠. 때로는 P(건강 상태 = 건강하다) = 70%처럼 더 명확하게 쓰기도 합니다. 문맥에 따라 P가 확률을 가리키는지 확률 분포를 가리키는지는 달라집니다. 하지만 걱정하지 마세요. 문맥상 헷갈릴 일은 거의 없습니다.
이 개념들이 왜 중요할까요? 시즌 2에서 베이지안 추론을 배울 때 꼭 필요하기 때문입니다. 새로운 정보를 얻어 믿음을 업데이트할 때, 확률이 어떻게 재분배되는지 이해하려면 이 개념들이 필수적입니다. 어떤 가능성의 확률이 올라가면, 나머지 가능성들의 확률 합은 줄어들어야 합니다. 전체 확률의 합은 언제나 1이니까요.
지금까지 하나의 무작위 변수만 다뤘습니다. 동전 던지기 결과, 주사위 눈, 친구의 건강 상태—모두 개별적으로 봤죠. 하지만 현실에서는 무작위 변수들이 서로 연결되어 있습니다. 날씨와 교통 상황이라는 두 무작위 변수를 생각해 보세요. 비가 오는 날 교통이 정체될 확률은 맑은 날보다 높겠죠? 한 사건의 정보가 다른 사건의 확률을 바꿉니다. 이것이 조건부 확률입니다.
[♪ 차분한 음악]
이지은: 와, 정말 많은 내용을 다뤘네요! 확률의 세 얼굴부터 기본 규칙까지.
오늘의 핵심을 정리하면요. 먼저 확률을 보는 세 가지 관점입니다. 반복해서 세는 빈도주의, 대칭성을 따지는 고전적 관점, 그리고 내 믿음을 숫자로 표현하는 주관적 관점. 그리고 모든 확률은 0과 1 사이에 있고, 전체 합은 항상 1이고, 겹치지 않는 사건은 확률을 더할 수 있다는 기본 규칙도 배웠죠. 무작위 변수와 확률 분포라는 개념도 만났고요. 이 개념들이 다음에 배울 조건부 확률의 토대가 된답니다!
[띠링!]
오늘의 미션! 내일 하루, 확률이나 가능성을 말할 때마다 잠깐 멈춰보세요. 어떤 관점에서 말하고 있는지 자문해 보세요. 버스가 늦을 확률이 높다고 할 때, 그게 매일 늦어서인가요? 아니면 오늘따라 불안한 느낌 때문인가요?
신기하게도, 이렇게 의식하기 시작하면 내가 어떤 식으로 생각하는지 패턴이 보여요. 각 관점의 장단점을 알면, 상황에 맞는 생각을 할 수 있게 되죠. 그게 바로 현명함의 시작이에요!
다음 시간에는 조건부 확률에 대해 살펴보려고 해요. 비가 오면 교통이 더 막히죠? 날씨가 교통에 영향을 미치는 거죠. 이렇게 한 사건에 대한 정보가 다른 사건의 확률을 바꾸는 현상, 함께 파헤쳐봐요!
확률은 불확실성의 언어예요. 오늘 배운 세 가지 관점이라는 렌즈로, 내일부터 세상이 조금 다르게 보일 거예요. 저는 이지은이었습니다.
[♪ 밝은 음악]
참고문헌
1. Hacking, I. (2001). An Introduction to Probability and Inductive Logic. Cambridge University Press.
2. Hacking, I. (2006). The Emergence of Probability: A Philosophical Study of Early Ideas about Probability, Induction and Statistical Inference (2nd ed.). Cambridge University Press.
3. von Mises, R. (1957). Probability, Statistics and Truth (2nd ed.). Dover Publications.
4. Laplace, P.-S. (1951). A Philosophical Essay on Probabilities. Dover Publications. (원서출판 1814)
5. de Finetti, B. (1974). Theory of Probability. John Wiley & Sons.
6. Lindley, D. V. (2006). Understanding Uncertainty. John Wiley & Sons.
7. Bernardo, J. M., & Smith, A. F. M. (1994). Bayesian Theory. Wiley.