brunch

You can make anything
by writing

C.S.Lewis

by 정섭 Oct 03. 2024

마지막 관문, 범칙금 딱지(기댓값)

청소년을 위한 게임이론 제1장 8

 ※ 맨 뒤에 요약이 있습니다.


┃쉽디 쉬운 기댓값의 개념


자동차 운전 중에 신호위반이 적발되면 범칙금 딱지가 날아옵니다. 1회 위반에 5만 원입니다. 통계청의 분석에 의하면 신호등을 위반하는 운전자가 신호위반에 걸랄 확률이 10% 정도라고 합니다. 이 말은 10번 위반할 때 1번 걸린다는 말이지요. 10번 중에 한 번 걸리는데, 이 정도면 아주 운이 없는 때에만 범칙금 5만 원을 내는 셈입니다. 이 경우 1회 신호위반으로 인한 평균 범칙금은 얼마인가요? 그렇습니다. 5만 원의 10%인 5천 원입니다. 이렇게 계산한 값을 통계학에서는 ‘기댓값(Expected Value)’이라고 합니다.


기댓값은 확률로 결정되는 값들의 ‘평균값(Mean)’입니다. 기댓값은 본질적으로 평균값인데, 다만 확률로 결정되는 값의 평균값이라는 측면에서 기댓값이라는 말로 표현합니다. 기댓값의 계산은, 확률로 결정되는 값에 그 확률을 곱해서 모두 더하는 방식으로 합니다. 그러므로 교통 신호 위반의 경우 기댓값을 계산하는 식은, 걸렸을 때의 범칙금 값인 5만 원에 걸릴 확률 1/10을 곱한 5천 원이 되는 겁니다.


주사위를 던졌을 때 나올 숫자의 기댓값, 쉽다!

그렇다면 주사위를 던졌을 때 나올 숫자의 기댓값, 즉 주사위를 여러 번 던졌을 때 나올 숫자의 평균값은 얼마일까를 생각해 봅시다. 기댓값을 구하려면 먼저 주사위의 각 숫자가 나올 확률을 알아야 합니다. 주사위를 던져서 1이 나올 확률은 6분의 1입니다. 2가 나올 확률도 6분의 1이지요. 나머지 숫자들도 모두 6분의 1의 확률로 나올 겁니다. 그렇다면 주사위를 던졌을 때 나올 값의 평균, 즉 기댓값은 얼마인가를 계산할 수 있습니다. 확률로 결정되는 값의 평균값인 기댓값은, 확률에다가 확률로 나오는 값을 곱해서 더하면 된다고 했습니다. 1이 나올 확률은 1/6이니, 1 곱하기 6분의 1, 2가 나올 확률도 1/6이니 2 곱하기 6분의 1, 그런 식으로, 3 곱하기 6분의 1, 4 곱하기 6분의 1, 5 곱하기 6분의 1, 6 곱하기 6분의 1을 모두 더하면 됩니다. 식으로 쓰면, 

  

주사위를 던져서 나올 수의 기댓값은 다음과 같이 계산합니다.

(1 ×1/6) + (2 ×1/6) + (3 ×1/6) + (4 ×1/6) + (5 ×1/6) + (6 ×1/6) =(1+2+3+4+5+6)/6

= 21/6 = 18/6 + 3/6 = 3.5                                                                                     (이상 식 1.1)


즉 주사위를 던져서 나올 숫자의 평균, 즉 기댓값은 3.5입니다. 여기까지 이해하셨다면 여러분은 게임이론에서 필요한 확률이론 대부분을 다 알게 된 것입니다. 여러분이 주사위를 던져서 나올 숫자를 놓고 ‘up or down’ 게임을 한다면, 3보다는 up이 나오는 쪽에, 4보다는 down이 나오는 쪽에 걸어야 이길 확률이 높다는 것을 알 수 있습니다.


로또 1등이 되지 않을 확률?

한 가지 확인. 어떤 일이 일어날 확률과 일어나지 않을 확률은 더하면 1이 된다는 사실은 다들 알고 계실 것입니다. 로또에 1등으로 당첨될 확률은 1/8,145,060입니다. 와, 진짜 벼락 맞을 확률보다 낮은 것 같네요. 그렇다면 1등이 되지 않을 확률은 1- (1/8,145,060) = 8,145,059/8,145060이 됩니다. 일반식으로 나타내면, 어떤 사건이 일어날 확률이 p라면 그 사전이 일어나지 않을 확률은 1-p입니다.



┃기댓값 계산 일반식 도출하기, 쉬워요.


야바위꾼에게 속지 않기 위해

이제 실전 문제를 통해 기댓값을 계산하는 일반식을 도출해 보겠습니다. 여러분이 장날에 모처럼 시장에 나가 이것저것 구경을 하다가 시장 끄트머리에서 야바위 게임판이 벌어졌다고 해 봅시다. 야바위 게임은 뒤집힌 세 개의 컵 가운데 하나에 주사위를 넣고 이리저리 옮겨 주사위가 들어있는 컵을 맞추는 ‘게임’입니다. 손님이 100을 걸어서 맞추면 두 배인 200을 받고(+200이 되는 것입니다.) 못 맞추면 건 돈 100을 잃습니다(-100인 것이죠). 맞췄을 때 받는 돈이 못 맞췄을 때 주는 돈의 두 배니까 이 게임에 참여하는 것이 옳을까를 생각해 봅시다.


이 판단을 하기 위해 먼저 해야 하는 것이 바로 이 게임으로 내가 돈을 얻을 기댓값을 계산하는 것입니다. 그런 것 하지 않고, ' 맞추면 2배? 할 만한데'하고 달려들면 주머니에 있는 돈 다 털립니다. 야바위꾼은 세 개의 컵 가운데 하나의 컵에 주사위를 넣는 것을 보여주고 이리저리 옮깁니다. 기댓값을 계산하려면 우선 확률을 알아야 합니다. 신호 위반에 걸릴 확률이 필요한 것처럼 말이죠. 세 개의 컵 가운데 주사위가 들어있는 컵을 맞출 확률은 ‘정상적인’ 경우라면 33.3%. 못 맞출 확률은 66.6%죠. 그렇다면 이 게임에서 내가 얻을 돈의 기댓값은 얼마일까요?


확률로 어떤 값이 결정되는 경우 평균인 기댓값은 그 값에 그 값이 나올 확률을 곱해서 구한다고 했습니다. 그렇다면 컵을 맞추면 200을 받는데 컵을 맞출 확률은 33.3%니까 200 곱하기 33.3%가 됩니다. 66.6이죠. 그런데 못 맞출 수도 있습니다. 못 맞출 경우의 기댓값은 –100 곱하기 66.6%, 즉 –66.6이 됩니다. 결국 이 게임의 평균값, 즉 기댓값은 둘을 더한 0이 됩니다. 해 봐야 본전이 될 확률이 높은 것이지요. 내 눈으로 보고 하는 것이니 나에게 승산이 더 있을 것 같지만 게임의 주인은 그보다 더 강력한 눈속임을 쓰기 때문에 주사위가 든 컵을 맞출 확률은 33.3%보다 낮습니다. 야바위판에는 호객꾼도 있어서 쉽게 맞출 것처럼 보이지만 손님의 판돈이 걸리면 대부분 속임수를 써서 돈을 잃는 것은 바로 이런 이유 때문입니다.


기댓값 계산 일반식

이상의 내용을 식으로 써 봅시다. 맞출 확률을 p라고 하면 못 맞출 확률은 1-p가 됩니다. 맞췄을 때 x의 값을 받고 못 맞췄을 때 y의 값을 받는다면 이 게임의 기댓값(보통 E로 씁니다)은,     


(기댓값 계산 일반식)

  E = p*x + (1-p)*y                                                                                                                            (식 1.2)


가 됩니다. 여기서 x와 y는 확률적으로 어떤 사건이 일어날 때 실현될 값이고 p는 x가 일어날 확률, (1-p)는 y가 일어날 확률을 의미합니다. 식으로 쓰니 괜히 복잡해 보이지만, 개념은 지극히 단순합니다.


야바위 게임의 결말

 야바위 게임에 대입하면 다음처럼 0이 됩니다.


E=(0.33*200) + 0.66*(-100) = 0      


야바위꾼이 사기를 치지 않는다고 해도 이 게임의 기댓값은 0입니다. 괜히 시간만 낭비하는 게임입니다. 물론 으레 야바위꾼들은 여러 명이 이런저런 사기 수법을 동원하기 마련이라 순진한 여러분이 을 딸 가능성은 없는 게임이라고 할 수 있습니다.



┃기대효용 개념도 완전히 같은 개념


x와 y가 어떤 구체적인 값, 예컨대 금액 같은 것이 아니라 만족감 같은 추상적인 값일 수도 있습니다. 추상적인 만족감을 경제학에서는 효용이라고 하는데, 아주 중요한 개념입니다. x와 y가 어떤 효용이라면 기댓값을 나타내는 부호 E 대신에 E(u)로 쓰고, x, y값은 U(x), U(y)처럼 쓸 수 있습니다. E는 Expectation, U는 Utility의 약자입니다. E는 함수를 나타내는 일종의 기호에 불과합니다. 수학 시간에 함수를 나타내는 부호로 쓰는 f(x)를 기억하시면 됩니다. U(x)는 ‘x가 주는 효용’을 나타내는 함수입니다. 이때는 기댓값이 아니라 ‘기대효용’이라고 해야겠죠. 그렇다면 기대효용을 계산하는 식은,

    

(기대효용 계산 일반식)

 E(u) = p*U(x) + (1-p)*U(y)                                                                                                             (식 1.3) 

    

로 쓸 수 있습니다. 하나도 어렵지 않죠? 이제 여러분은 게임이론을 본격적으로 시작할 모든 준비를 마쳤습니다. 축하합니다.


┃요약


신호위반 범칙금이 5만 원이고 실제로 걸릴 확률이 1/10이라면 신호위반으로 인한 범칙금 평균값은 5천 원입니다. 이처럼 확률적으로 결정되는 값의 평균값을 '기댓값'이라고 표현합니다. 주사위를 던져서 나올 숫자의 기댓값은 각 숫자가 나올 확률을 먼저 구한 후 그 값을 곱해서 더하면 됩니다. 식으로는 (1 ×1/6) + (2 ×1/6) + (3 ×1/6) + (4 ×1/6) + (5 ×1/6) + (6 ×1/6)이고, 그 값은 3.5입니다.


세 개의 컵 중 주사위가 든 컵을 맞추는 야바위게임. 손님이 맞추면 200, 못 맞추면 -100입니다. 세 개의 컵 가운데 주사위가 들어있는 컵을 맞출 확률은 ‘정상적인’ 경우라면 33.3%. 못 맞출 확률은 66.6%죠. 그렇다면 이 게임의 기댓값은 (0.33*200) + 0.66*(-100) = 0이 됩니다. 즉 이 게임의 평균값(기댓값)은 0입니다. 야바위판에 끼어봐야 시간만 버릴 뿐 돈을 딸 가능성은 없다는 것입니다. 야비위꾼들이 약간의 사기만 쳐도 돈은 잃게 마련입니다.


확률로 결정되는 것이라면 효용의 평균값도 바로 이 기댓값 계산 방법과 동일하게 할 수 있습니다. 이렇게 계산한 평균값을 기대효용이라고 합니다.


이상으로 게임이론을 본격적으로 시작할 모든 준비가 끝났습니다. 게임이론 시동걸기 끝.

이전 07화 정규형과 전개형 바꿔 표현하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari