brunch

You can make anything
by writing

C.S.Lewis

by 동경 Jan 17. 2021

기초 확률론: 확률 계산

귀납 논리 #6

특정 사건이 발생하는 경우의 수와 가능한 모든 경우의 수를 통해서 그 사건이 발생할 확률을 구할 수 있다면 이제 여러 확률을 두고서 계산하는 법도 알아보시죠.


여러 사건 중 최소 하나가 일어날 확률


사건 A가 일어난 확률 Pr(A)과 사건 B가 일어날 확률 Pr(B)가 각각 40%와 60%라고 쳐봅시다. 가령 내일 비가 내일 확률과 내리지 않을 확률이라고 해보죠. 그럼 내일 비가 오거나 비가 오지 않을 확률 Pr(A∨B)은 얼마일까요? 당연히 100%입니다. 비가 오지도 않고 안 오지도 않는 경우는 없을 테니까요.

이렇게 두 사건 중 최소 어느 하나라도 일어날 확률을 구할 땐 각각의 사건이 발생할 확률을 더해주면 됩니다.

단, 조건이 있습니다. 두 사건은 절대 동시에는 일어날 수 없는 상호 배타적인mutually exclusive 사건이어야 합니다.


비가 내리는 사건과 비가 내리지 않는 사건은 결코 동시에 일어날 수 없습니다. 그러니 상호 배타적이죠. 따라서 비가 내리거나 내리지 않을 확률을 구할 땐 Pr(A)와 Pr(B)를 더하여 100%라고 말할 수 있습니다.

하지만 두 사건이 동시에 일어날 가능성이 조금이라도 있다면 이렇게 간단한 덧셈으로 확률을 계산해선 안 돼요.

가령 태풍이 올 확률 Pr(C)가 30%라면 비가 오거나 태풍이 올 확률은 얼마일까요? 40%+30% = 70%이라고 말해도 괜찮을까요? 그렇지 않습니다. 왜냐하면 비와 태풍이 함께 찾아올 수도 있기 때문이죠. 비가 오는 사건과 태풍이 오는 사건은 상호 배타적이지 않습니다.

이럴 때 두 사건 중 어느 하나가 일어날 확률은 각각의 사건이 발생할 확률을 더한 후에 두 사건이 동시에 일어날 확률 20%를 빼주어야 합니다. 비가 오거나 태풍이 올 확률은 (1) 비는 오지만 태풍은 오지 않을 확률과 (2) 태풍은 오지만 비가 오지 않을 확률, 그리고 (3) 비와 태풍이 모두 찾아올 확률을 더한 값이죠. 그래서 비 또는 태풍이 올 확률은 70%가 아닌 50%입니다.

Pr(A∨C)는 곧 Pr(A)+Pr(C)-Pr(A&C)라는 것이죠. 두 사건 중 최소 어느 하나가 일어날 확률을 계산하는 법은 이렇게 익혀두는 게 좋습니다. 두 사건이 상호 배타적이라면 어차피 Pr(A&C)는 0이니까, 계산에 영향을 미치지 못하거든요. 비가 내리면서 내리지 않을 가능성은 당연히 없겠죠?


여러 사건이 모두 발생할 확률


두 사건이 모두 발생할 확률은 각각의 사건이 발생할 확률을 곱하여 구합니다. Pr(A&B) = Pr(A) x Pr(B)라는 얘기죠.

주사위를 던져서 1이 나오는 사건을 A라고 한다면 Pr(A)는 확률은 1/6입니다. 또 주사위를 한 번 더 던져서 3이 나오는 사건 B의 발생 확률 Pr(B)도 1/6이죠. 그럼 주사위를 두 번 던졌더니 첫 번째는 1이 나오고, 두 번째엔 3이 나올 확률은 얼마일까요? 1/6 x 1/6 = 1/36입니다.

여기서도 조건이 있습니다. 두 사건은 독립적independent이어야 합니다. 어떤 두 사건이 독립적이란 건 한 사건의 발생 여부가 다른 사건의 발생 확률과 무관하다는 의미입니다.


가령 주사위를 던졌을 때 홀수가 나올 확률 Pr(O)과 소수prime number가 나올 확률 Pr(P)은 서로 독립적이지 않습니다. 그래서 Pr(O&P) = Pr(O) x Pr(P) = 1/3 x 1/3 = 1/9이라고 말할 수가 없어요.

만약 주사위를 던져 홀수가 나왔다면 그 수가 소수이기도 할 확률은 2/3일 겁니다. 왜냐하면 홀수 1과 3, 5 중 3과 5가 소수니까요. 또 주사위를 던져 소수가 나왔을 때 그 수가 홀수이기도 할 확률 역시 2/3입니다. 소수 2와 3, 5 중 3과 5가 홀수니까요. 홀수가 나오는 사건이 발생할 경우 소수가 나오는 사건의 발생 확률은 1/3이 아닌 2/3가 됩니다. 그 반대도 마찬가지고요. 따라서 이 두 사건은 독립적이지 않아요.

그래서 주사위를 던졌을 때 홀수 혹은 소수가 나올 확률을 구할 때 Pr(O)와 P(P), 그러니까 1/3과 1/3을 곱하여 구해서는 안 되는 것입니다. 이 확률은 주사위를 던졌을 때 홀수인 동시에 소수이기도 한 수 3과 5가 나오는 경우의 수(=2)를 나타날 수 있는 모든 경우의 수(=6)로 나누어 구해야 합니다. 따라서 Pr(O&P)는 2/6, 그러니까 1/3이죠.


앞에서 비가 올 확률이 40%인데 태풍이 올 확률이 30%라는 예시를 들었습니다. 그런데 비와 태풍이 모두 찾아올 확률은 40% x 30% = 12%가 아닌 20%였어요. 이건 곧 비가 내리는 사건과 태풍이 불어오는 사건이 서로 독립적이지 않다는 걸 의미합니다. 아무래도 태풍이 온다면 비가 내릴 확률이 좀 더 높지 않겠어요?


조건부 확률: 어떤 사건이 이미 발생한 상황에서 다른 사건이 발생할 확률


주사위를 던졌을 때 나올 숫자가 1일 확률 Pr(A)은 얼마죠? 당연히 1/6입니다. 그런데 주사위는 이미 던져졌고 짝수가 나왔습니다. 이때 1이 나올 확률은요? 당연히 0입니다. 짝수가 나온 이상 그게 1일 가능성은 없겠죠. 반면 이미 던져진 주사위에서 홀수가 나왔다면 그 수가 1일 확률은 1/3로 올라갑니다. 2와 4, 6은 이미 배제되었으니까요.

이렇게 어떤 사건이 이미 발생한 상황에서(=그 사건의 발생이라는 조건이 충족된 상황에서) 또 다른 사건이 발생할 확률을 조건부 확률conditional probability이라 부릅니다.

사건 B가 발생한다는 조건이 충족될 때 사건 A가 발생할 확률은 Pr(A/B)라고 표기하고요. Pr(A/B)는 Pr(A&B)/Pr(B)로 계산합니다.

Pr(A/B)는 빨간색 영역이 전체에서 차지하는 비중(=약 33%)가 아니라 오른쪽 원(B)에서 차지하는 비중(=약 66%)가 된다

가령 주사위를 던져 홀수가 나왔을 때 그 수가 소수일 확률은 어떻게 구할까요? 소수이면서 홀수인 수가 나올 확률은 Pr(A&B)는 1/3입니다. 그리고 홀수가 나올 확률 Pr(B)는 1/2이죠. 그러니 일단 홀수가 나온 상황에서 그 수가 1일 확률은 1/3÷1/2 = 2/3입니다.




자, 이제 조건부 확률을 좀 응용해서 문제를 하나 풀어봅시다.

주머니가 두 개 있습니다. 어느 주머니에서 공을 꺼낼지는 동전 던지기로 결정해요. 앞면이 나오면 A 주머니에서 공을 뽑고, 뒷면이 나오면 B 주머니에서 공을 뽑습니다. 어떤 주머니에서 공을 꺼내게 될 것인지는 50% 확률로 결정되는 거죠. Pr(A)와 Pr(B)가 모두 50%인 상황이죠.

이렇게 주머니를 고르고 난 다음에는 그 주머니에서 공을 하나 뽑습니다. 이때 빨간 공을 뽑을 확률을 Pr(R)로 표시할게요. 만약 A 주머니에서 공을 뽑게 된다면 빨간 공을 뽑게 될 확률은 80%입니다. 그런데 B 주머니를 받게 된다면 빨간 공을 뽑게 될 확률은 40%에요.

누군가가 동전을 던졌습니다. 앞면인지 뒷면인지는 모릅니다. 그리고 두 주머니 중 하나를 집더니 거기서 공을 한 꺼냈어요. 빨간 공이 나왔습니다. 자, 그럼 이 사람이 받은 주머니가 A일 확률(=동전 던지기에서 앞면이 나왔을 확률)은 얼마일까요?


일단 우리가 구해야 할 확률은 일단 빨간 공이 이미 나온 상황에서 그 공을 뽑아낸 주머니가 A일 확률입니다. 이 조건부 확률은 Pr(A/R)로 나타낼 수 있겠죠? 그리고 이 값은 곧 Pr(A&R)/Pr(R)과 같습니다. 우린 이제 이 값을 구해야 해요.


당장 주어진 값은 이렇습니다.

Pr(A) = Pr(B) = 50%
Pr(R/A) = Pr(R&A)/Pr(A) = 80%
Pr(R/B) = Pr(R&B)/Pr(B) = 40%

그런데 우리는 Pr(A)와 Pr(B)의 값을 알고 있으니 Pr(R&A)와 Pr(R&B)도 구할 수 있습니다.

Pr(R&A)/50% = 80%
∴ Pr(R&A) = 40%

Pr(R&B)/50% = 40%
∴ Pr(R&B) = 20%

우리가 구해야 할 값 Pr(A&R)/Pr(R)의 분자는 구했네요. 40%죠? (A 주머니를 받아 빨간 공을 뽑는 것과 빨간 공을 뽑았더니 그게 A 주머니인 것은 동일합니다.)


이제 Pr(R)만 구하면 됩니다. 이건 어떻게 구할까요?

바로 Pr(R&A)와 Pr(R&B), 그러니까 A 주머니를 통해 빨간 공이 나올 확률과 B 주머니를 통해 빨간 공이 나올 확률을 더해서 구합니다. 이 두 사건은 결코 동시에 일어날 수 없는 상호 배타적인 사건이에요. 동전의 앞면과 뒷면이 동시에 위로 올 수 없으니 주머니는 어느 하나만 열리게 되어 있죠. 그래서 Pr(R) = Pr(R&A) + Pr(R&B) = 40% + 20% = 60%가 됩니다. (추가로 더해줘야 할 값은 없어요. 빨간 공은 오로지 A 주머니 혹은 B 주머니에서만 나올 수 있을 뿐, 제3의 주머니는 없으니까요. 이렇게 모든 가능성을 포괄하는 사건들을 일컬어 전체 망라적collectively exhaustive이라 합니다.)


따라서 Pr(A&R)/Pr(R)은 40%/60% = 2/3가 됩니다. 동전 던지기의 결과가 무엇이었는지 몰라도 일단 빨간 공이 나왔다면 아마도 주머니 A가 선택되었을 확률(=동전의 앞면이 나왔을 확률)이 그렇지 않을 확률보다 두 배로 더 높다고 볼 수 있겠네요.




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari