brunch

You can make anything
by writing

C.S.Lewis

by KWJ Jul 05. 2018

월드컵과 Prediction Market

Prediction Market #1 - 도박에서 수학으로 

메커니즘 디자인 매거진의 첫글로 월드컵의 열기가 식기 전에 Prediction Market(이하 PM) 에 대해 먼저 쓰고 싶었다.Algorithmic Game theory, Mechanism Design 이 어떤 학문인지는 다음 글에서 설명하려고 한다. 


메커니즘 디자인을 간략하게 한줄로 설명하자면 

어떻게 한 시스템 안에서 룰들을 잘 디자인하여 서로 다른 전략들을 가진 self-interested agent 들이 디자이너가 의도한 방향으로 좋은 퍼포먼스를 낼 수 있도록 할까를 연구하는 과학이다. 


완벽하지 않은 메커니즘 디자인의 예로 월드컵 토너먼트를 들 수 있다. 이번 일본과 폴란드의 경기는 스포츠 정신에 위배되었다고 비난을 받아야 했지만 룰 안에서 그 두 나라들이 각자의 이익을 위해 할 수 있는 최선의 선택들이었다. 사실 월드컵 토너먼트 룰 내에서는 경우에 따라 서로 지는 것이 최선의 전략인 경기도 있을 수 있다. 예를 들어 16강이 확정된 2 팀이 서로 경기를 하는 상황을 생각해보자. 이 경기에서 이기든 지든 두 나라는 이미 16강 진출은 확정되어 있다. 만약 이 경기에서 이겨서 조 1위가 되면 16강에서 세계 1위 나라와 붙어야 되고 져서 조 2위가 되면 16강에서 세계 50위 나라와 붙어야 하는 상황이라면 8강을 꼭 가야만 되는 두 나라들은 이 남은 마지막 경기에서 최선을 다해 지려고 노력할 것이다. 

 

이 이야기는 다음에 더 하도록 하고 아무튼 월드컵이니까 이 글에서는 축구와 인생 이야기로 prediction market을 설명해보려 한다.


"인생은 축구니까"


이번 대한민국의 월드컵 경기들을 보고 또 마지막 독일전을 보면서 이 말에 참 많이 공감이 갔다. 

저렇게 욕을 먹은 후에야만 반성하고 정말 잘하려는 모습이 딱 내 모습을 보는 듯한 느낌이어서 말이다. 


축구가 인생이었던 박지성 선수는 어땠을까?

MBC 스페셜 "당신은 박지성을 아는가"
당신은 박지성을 알았는가. 


"앞으로 이 선수는 좋은 선수가 될 재목감이다."

이학종 수원공고 감독는 대학 감독들에게 이렇게 말을 했지만 그의 말을 믿어준 사람은 없었다.

단 한명, 명지대 김희태 감독이 박지성의 연습 경기를 보고 그를 능력을 판단하고 뽑아주었다. 


내가 김희태 감독이었다면 스스로 다음과 질문을 하지 않았을까.

그 연습경기 때의 감각 좋고 지구력 좋은 박지성 선수의 모습은 과연 진짜 그의 모습이었일까.

아니면 이번 경기에만 우연치 않게 나타난 가짜 모습이었을까. (흔히 스포츠에서 뽀록이라고 하는..)

나보다 박지성에 대한 정보를 더 많이 갖고 있는 이학종 감독의 말이 진실(true)일까. 


올림픽 대표팀과의 친선경기에서 그가 골을 넣는 모습을 보고 허정무 감독은 박지성 선수를 대표팀으로 발탁하였다. 허정무 감독도 비슷한 질문을 했을 것 같다. 박지성 선수가 말한 것처럼 '어떻게 하다 보니까' 5명을 제치고 골기퍼도 제치고 골을 넣게 된 것이니까. 한가지 다른 점은 이번엔 한사람, 이학종 감독뿐이 아니라 두사람, 김희태 감독까지 박지성에 대해 좋은 평가를 내렸다는 점이다. 이 경우는 두 사람 다 긍정적인 평가를 하였기에 그가 좋은 선수라는 의견에 힘이 더 실리겠지만 만약 두사람이 다른 의견을 말할 때 당신은 어떤 쪽으로 더 판단을 내려야 하는가. 두사람이 박지성에 대해 아는 정보의 양과 질이 다를 때는 어떻게 판단을 내려야 하는가. 이런 질문들이 더 생길 수 있겠다. 


박지성 선수가 정말 잘하는 선수인지에 대한 답은 박지성 선수만이 아는 Private Information 일 수도 있고 아니면 그조차도 모르는 아직 일어나지 않은 unknown outcome 일 수도 있다. 위와 같은 질문들을 답할 때 유용한 도구가 베이즈 정리인데 Prediction Market을 설명하기 전에 이를 통해서 먼저 각각의 확률이 어떻게 되는지 분석을 해보자.



수학이 너희를 자유케 하리라


자 여기 두 종류의 코인이 있다. 하나는 진짜 코인(Real)이고 하나는 가짜 코인(Fake)이다. 각 코인들의 한면은 True 고 반대면은 False 다. 그리고 제 3자(절대자)가 이 두 코인을 던지고 둘 중에 하나만 랜덤으로 선택해서 우리들에게 보여준다. 우리는 그것이 진짜 코인(R) 인지 가짜 코인(F) 인지 모른다. 그리고 우리가 본 코인으로 상황을 판단한다. 진짜 코인은 하나밖에 없지만 가짜 코인은 모든 사람들한테 하나씩 unique 하게 있다. 


이 두 코인에 대해 여러가지 대입해서 생각해볼 수 있는데 앞서 말했던 박지성 선수로 얘기해보자. 박지성 선수의 경우 진짜 코인이 그의 진정한 모습을(혹은 그의 미래 모습) 의미한다. 코인의 True 는 그가 정말 뛰어난 선수다라는 것을 의미하고 False 는 아니라는 것을 가리킨다. 따라서 박지성 선수는 R 코인이 True 였다. 그를 못 미더워했던 기자들이 봤던 코인은 False 였고 그 코인은 결국 Fake 코인이었다라고 설명할 수 있다. 즉, R=True, F=False인 상황에서 F를 봤던 경우다. 


그렇다면 이학종 감독은 어떤 상황이었을까. 그가 봤던 코인은 True 였고 그것이 진짜 코인이었을 수도 있고 가짜 코인이었을 수도 있다. 즉, 그는  R=True, F=True 인 상황에서 R 혹은 F를 봤다고 할 수 있다. 김희태 감독은 어떤 상황이었을까. 그는 이학종 감독과 같은 상황에다가 한가지 더, 이학종 감독이 자신의 코인은 True로 확인했다고 말해준 상황이다. 


즉 우리는 이렇게 문제를 정리해볼 수 있다. 내가 본 코인이 True 였을 때,(박지성 선수가 뛰어난 선수라 판단했을 때)


1. 진짜 코인이 True 였을 확률. ( 그것이 참일 확률)


P(R=T | told=True) 

= P(R=T | told=True & coin=Fake)*P(coin=Fake) + P(R=T | told=True & coin=Real)*P(coin=Real)  = 0.5*0.5 + 1*0.5 = 0.75

즉, 이학종 감독이 판단했던 것처럼 박지성 선수가 진짜로 뛰어난 선수일 확률은 75% 정도라고 생각하면 된다. 반대로 그것이 아닐 확률은 25%다.


2. 다른 사람도 True를 봤다고 내게 말해줬을 때 진짜 코인이 True 였을 확률.

True를 봤다고 내게 말해준 사람이 n명인 경우로 일반화 시켜보자. 그리고 n 명이 True 라고 말해주는 사건을 E라고 지칭하자. 이 때 진짜 코인이 True 일 때와 False일 때의 비율을 생각해보면


P(R=T | E)         P(R=T) * P(E | R=T)

------------  =     -------------------------

P(R=F | E)         P(R=F) * P(E | R=F)


P(R=T)와 P(R=F)는 0.5이므로 상쇄되어 

           P(E | R=T)

<=>   --------------

           P(E | R=F)


이 된다. R이 True 였을 때 True 코인을 보게 되는 확률은 75%고 (F=True 일 때 어떤 코인을 랜덤으로 선택해도 상관없으니 0.5 + F=False 일 때 무조건 R을 선택해서 보여줘야 하니 0.5*0.5 = 0.25) 반대로 R이 False 였을 때 True 코인을 보게 되는 확률은 25%이다. 

각 사람이 보는 코인은 서로 독립사건이기 때문에 R=T 고 n 명이 True 를 보았다면 0.75^n 이 되고 R=F인데 n 명이 True 를 보았다면 0.25^n 이 된다. 따라서 위의 식을 다시 전개하면 

<=> 0.75^n / 0.25^n = 3^n 이 나온다. 

P(R=T | E ) = 1 - P(R=F | E) 이기 때문에 


1 - P(R=F|E)        

---------------   =   3^n  

P(R=F | E) 


식을 전개해서 정리하면 결국 R(R=F | E) 는 1 / (3^n) + 1 이 된다. 

즉, n 명이 True 를 봤는데 진짜 코인이 False 인 확률은 n 이 2일 때 1/ 10, 10%가 되고 반대로 n 명이 True 를 봤는데 진짜 코인도  True 인 확률은 9/10, 90% 라는 뜻이다. 

즉, 김희태 감독의 경우, 박지성 선수가 좋은 선수라는 것을 경기를 보고 판단했고 (자신의 코인이 True로 나왔고)  이학종 감독이 박지성 선수를 좋은 선수라 확인했다고 말해주었으므로 (n이 2 인 경우), 그에게 박지성 선수가 진짜 좋은 선수라는 경우의 확률은 이제 90% 가 된다.


3. 다른 사람이 False를 봤다고 내게 말해줬을 때 진짜 코인이 True 였을 확률.

X를 두 사람이 본 코인의 결과를 나타내는 random variable로 정의하고 Y를 두 사람이 본 코인이 진짜인지 가짜인지를 표현하는 random variable 로 정의하자. 

그러면 X는 (True, True), (False, True), (True, False), (False, False) 네 가지 종류가 있고 우리는 (True, False) 인 경우다. 

Y는 (R, R), (R, F), (F, R), (F, F) 이렇게 네가지가 존재한다. 

그렇다면 우리가 원하는 확률은 

P(R=True | X = (True, False)) 

= P(R=True, A=(R,R) | X = (True, False)) 

+ P(R=True, A=(F,R) | X = (True, False))  

+ P(R=True, A=(R,F) | X = (True, False)) 

+ P(R=True, A=(F,F) | X = (True, False)) 

= P(R=True | A=(R,R), X = (True, False))*P(A=(R,R) |  X = (True, False))

+ P(R=True | X = (True, False), A=(F,R))*P(A=(F,R)|  X = (True, False))

+ P(R=True | X = (True, False), A=(R,F))*P(A=(R,F)|  X = (True, False)) 

+ P(R=True | X = (True, False),  A=(F,F))*P(A=(F,F)|  X = (True, False)) 

= 0*0 + 0*1/3 + 1/3 + 1/2*1/3

= 1/2

50%이다. 즉, 허정무 감독이 박지성 선수가 좋은 선수라는 것을 알고 있었을 때, 한 기자가 그가 실력이 뛰어나지 않은 선수라고 알고 있다고 말한다면 박지성 선수가 정말로 좋은 선수라는 경우의 확률은 50%라는 뜻이다. 


각자가 가짜 코인 하나씩만 갖고 있다는 가정은 모두들의 정보가 대칭적이다(symmetric)라는 의미다. 정보의 양과 질을 표현하기 위해서는 한단계 더 확장할 필요가 있다. 모든 사람들이 가지고 있는 가짜 코인의 수가 각각 다르면 어떻게 될까? 


예를 들어 진짜 코인은 여전히 하나고 A는 가짜 코인 5개를 갖고 있다고 하자. 그러면 진짜 코인을 포함한 총 6개 코인 중에 하나를 제 3자가 랜덤하게 선택해 그 flip 결과를 A에게 보여준다. B는 가짜 코인 1개를 갖고 있어 제 3자가 총 2개 중에 하나를 선택해 B에게 보여준다고 하자. 


A가 더 좋을까 B가 더 좋을까 라는 질문 전에 Prediction Market을 설명해야 될 것 같다. 역시 돈이 개입되어야 머리가 잘 굴러가니까. 


Prediction Market이란 미래 사건의 결과를 예측하여 상품을 거래하는 시장이다. 미래 스포츠 경기가 어떻게 될지, 선거의 결과는 어떻게 될지 혹은 내일 날씨는 어떻게 될지 모든 것들이 예측 시장의 상품이 될 수 있다. 예측 시장은 참여자들의 판단을 효과적으로 합하기 때문에 그 시장에서 형성된 가격이 그 미래 사건이 일어날 확률과 밀접한 연관이 있다. 


박지성 선수를 상품으로 한 예측시장을 가정해보자. 

박지성 선수가 FA 선수가 되었고 이 시장에서 박지성 선수가 굉장한 선수가 될 것이라고 예측하는 선수들은최대한 낮은 값을 내고 박지성 선수를 사려고 할 것이고 (bid) 반대로 그는 가짜 선수라고 예측하는 사람들은 박지성 선수를 최대한 비싼 금액에 팔려고 할 것이다. 당신이 감독이고 이 시장에서 박지성 선수라는 상품을 거래하고 싶다면 당신은 A의 판단을 따르는 것이 좋을까 아니면 B의 판단을 따르는 것이 좋을까. 당연히 B의 판단이 더 중요하게 생각해야 될 것이다. 왜냐하면 그가 본 코인의 True, False가 진짜 코인의 결과일 확률이 A보다 훨씬 높기 때문이다. 즉, 내가 갖고 있는 가짜 코인의 수가 적다는 것은 나의 정보의 질이 더 높고 진실을 제대로 예측할 확률이 높다는 것을 의미한다. 


우리는 이 상황을 비대칭적인 정보를 갖고 있는 시장이라고 한다. 월드컵과 Prediction Market의 다음 글에서는 이런 예측시장에서 나의 가짜 코인이 몇개일 때 어떻게 박지성 선수의 가격을 메길 수 있는지 그 확률 모델을 설명하고 다른 참여자들의 bidding prices 혹은 asking prices 들을 보고 어떻게 다시 내 예측과 가격을 업데이트할 것인지에 대한 전략을 살펴볼 것이다. 


예측 시장이 흥미로운 점은 내가 가진 정보로 사람을 판단할 때에도 연관지어 생각해볼 수 있다는 점이다.

우리는 보통 어떤 사람과의 만남을 통해 그리고 또 다른 사람들이 그 사람에 대해 한 이야기를 통해 그 사람에 대한 정보를 취합하고 그 사람을 판단한다. 그 사람에 대한 예측이 올바른지 잘못된지 계량화할 수 있을까.


계량화하기 어렵기 때문에 오해들이 생기는 것 같고 이런 일들이 인생을 살면서 드물지 않게 일어나는 것 같다. 사람들과 부딫히며 생기는 오해들은 대부분 당사자보다는 다른 사람들을 통해 들은 이야기들 때문에 생기는 경우가 많다. 사람은 어느 정도 자신에게 유리한 방향으로 부풀어 이야기하는 경향이 있기 때문에 누가 뭘 했다느니 누가 어떻다더니 하는 이야기들은 경험상 흘러 듣는 게 좋다. 흘러들을 수 없는 경우라면(내가 좋게 봐왔던 사람이 알고보니 안좋은 사람이라고 할 때(혹은 그렇게 변했을 때)) 나는 보통 당사자한테 솔직하게 물어보고 확인하는 편이다. 솔직한 게 제일 좋은 방법이라고 생각하니까. 


가끔은 그렇게 하기 어려운 경우, 감정 소모하며 고민할 필요없다. 이제부터 그럴 땐 쿨하게 확률적인 모델로 접근해보자. 이런 면에서 참 수학은 멋진 것 같다. 


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari