brunch

조건부확률, 확률에 왜 조건이 붙어요?

by 박정수

이미 수학을 좋아한다고 알려진 학생들 중에서, 과학도 좋아하는 학생들”

통계학을 공부하다가 많은 분들이 처음으로 '벽'을 느끼는 부분이 바로 조건부 확률(Conditional Probability)입니다. 직관적으로 이해될 것 같으면서도, 막상 문제를 풀면 교집합(곱사건)과 헷갈리기 쉽기 때문입니다. 오늘은 직관적인 비유와 풍부한 예시를 담아 여러분에게 쉽고 편한 설명 하고자 합니다.




1. 조건부 확률, 도대체 뭔가요?

우리가 흔히 말하는 확률은 '전체 경우의 수' 중에서 '원하는 사건이 일어날 경우의 수'를 따지는 것입니다. 하지만 조건부 확률은 전제 조건이 붙습니다.

"만약 A라는 일이 이미 일어났다고 칠 때, 그때 B가 일어날 확률은?"

이것을 기호로는 P(B|A)라고 씁니다. 가운데 있는 막대기(|)는 "Given(~가 주어졌을 때)"이라고 읽습니다. 즉, "A가 주어졌을 때의 B의 확률"이라는 뜻입니다.


일상 예로 바꾸면:

교집합: “수학을 좋아하고 동시에 과학도 좋아하는 학생들”

조건부집합: “이미 수학을 좋아한다고 알려진 학생들 중에서, 과학도 좋아하는 학생들”



A = {1, 2, 3}, B = {3, 4, 5} → A ∩ B = {3}

A = {사과, 바나나}, B = {바나나, 포도} → A ∩ B = {바나나}

아시겠죠?


2. 가장 헷갈리는 포인트: 교집합 vs 조건부 확률

많은 분들이 'A와 B가 동시에 일어나는 것(교집합, AB)과 '조건부 확률(P(B|A))'을 혼동합니다. 이 둘의 결정적인 차이는 바로 '분모(전체 이벤트의 세상)'가 다르다는 점입니다.


OIG4.jpg


윗 그래프의 중앙에 진하게 보이는 오렌지색이 교집합 (저로 교류하는 집합, (A∩B))이라면 조건부집합은 어떻게 그림으로 표현을 할까요?


바.png




이미 수학을 좋아한다고 알려진 학생들 = a+b

이중 과학도 좋아하는 학생들=b

이해가 되죠?


3. 공식으로 보는 직관 (무작정 외우지 마세요!)

조건부 확률의 공식은 다음과 같습니다.

P(B|A) = (A∩B)/P(A)

이 식을 말로 풀면 아주 당연한 이야기가 됩니다.

분모 P(A): 세상이 A로 좁아졌으니, 전체 기준은 A가 됩니다.

분자 P(A∩B): 좁아진 A 세상 안에서, B에도 해당하는 부분은 결국 A와 B가 겹치는 부분입니다.

우리의 예의 경우 (b)/(a+b)의 비율로 계산이 됩니다. 이제 개념상이 아니라 실제로 예를 들어 볼게요.


OIG1.jpg


4. 실생활 예제로 완벽하게 이해하기


여러분들의 이해를 돕기 위해 쉬운 예제부터 조금 생각해야 할 예제까지 준비했습니다.

예제 1: 10km 마라톤 대회를 했는데, 전체 참여 인원 100명 중, 10km를 완주한 선수가 80명이고, 전체 부상자는 10명인데, 이중 완주자 부상을 당한 수는 2명이라 합니다.


교집합 A ∩ B

전체 참가자(T): 100명

완주자 집합(A): 80명

부상자 집합(B): 10명

완주·부상 모두 해당(교집합 A ∩ B): 2명

완주자 중 부상자 비율(전체기준): P(A ∩ B) = 2 / 100 = 0.02 (2%)

조건부 확률/비율

P(부상 | 완주) = P(A ∩ B) / P(A) = (2/100) / (80/100) = 2 / 80 = 0.025 → 2.5% 해석: “완주자 중 부상자의 비율은 2.5%”

P(완주 | 부상) = P(A ∩ B) / P(B) = (2/100) / (10/100) = 2 / 10 = 0.2 → 20% 해석: “부상자 중 완주자의 비율은 20%”

추가로 알 수 있는 수치

비완주자: 100 − 80 = 20명

비완주 부상자: 전체 부상 10명 중 완주 부상 2명을 제외 → 8명

비완주 비부상자: 20 − 8 = 12명

완주 비부상자: 80 − 2 = 78명

그림2.png


예제 2: 남녀 공학 고등학교

전교생 100명 중 남학생 60명, 여학생 40명입니다. 안경 쓴 남학생은 20명입니다.

교집합: 선생님이 눈을 감고 전교생 중 한 명을 뽑았는데, "남학생이면서 안경을 썼을" 확률은?

안경 쓴 남학생 = 20/100

조건부 확률: 선생님이 "남학생 다 나와!"라고 해서 남학생만 운동장에 모였습니다. 그중에서 한 명을 뽑았을 때 안경을 썼을 확률은?

P(A) =남학생을 뽑았을 확률 = 60/100

P(A∩B) = 20/100 (지문에 준 정보가 이것이 전부입니다. 안경을 쓴 여생생 정보도 없고)

조건부확률 = (20/100)/(60/100) = 20/60 = 0.33

(분모가 100에서 60으로 줄어들었기 때문에 확률이 올라갑니다!)


사건 B(“안경을 썼다”)를 정의했지만, 여학생 중 안경을 쓴 학생 수가 주어지지 않았습니다.

따라서 전체 확률 P(B) = “전교생 중 안경을 쓴 학생의 비율”을 정확히 계산할 수 없습니다.

문제의 의도

사실 이 문제의 핵심은 교집합 확률과 조건부 확률의 차이를 보여주는 데 있습니다.

교집합: P(A∩B)=20/100=0.2P(A \cap B) = 20/100 = 0.2

조건부: P(B∣A)=(20/100)/(60/100)=20/60≈0.33P(B|A) = 20/60으로 약 0.33

여기서 중요한 포인트는 분모가 전체(100)에서 조건 집합(60)으로 줄어들면서 확률이 달라진다는 점이에요.


OIG5.jpg


여러분, 조건부 확률은 어렵게 생각하면 한없이 어렵지만, 핵심은 하나입니다. '분모라는 변수가 생겼다'는 것입니다. 전체를 볼 것이냐, 특정 조건 안에서만 볼 것이냐의 차이만 기억하면, 베이즈 정리까지 가는 길이 훨씬 수월해질 것입니다.


다음 편에서는 조건부 확률 예제를 좀 더 다뤄 보면서, 베이지안통계로 넘어가 보자고요..

keyword
이전 06화내 직관은 왜 항상 틀릴까? (몬티홀의 배신)