brunch

You can make anything
by writing

C.S.Lewis

by 정섭 Dec 09. 2024

청소년을 위한 게임이론 제4장 혼합전략 내시균형(6)

페널티킥 눈치게임(2)

※ 맨 뒤에 요약이 있습니다.


상대 플레이어가 예측할 수 없는 전략을 찾아라 2, 골키퍼의 경우

 

그렇다면 이제 키커의 입장에서 이 문제를 봅시다. 키커가 이 게임에서 얻을 보수도 골키퍼가 왼쪽으로 막을 것인지 오른쪽으로 막을 것인지에 달려있다는 것을 기억하시기 바랍니다. 아래 그림은 바로 앞 글의 그림 4.7을 그대로 가져온 것입니다. 이제 골키퍼가 왼쪽으로 막을 확률을 q라고 합시다. 그렇다면 오른쪽으로 막을 확률은 (1-q)가 됩니다.                    

키커가 왼쪽으로 차는 경우 키커의 기댓값

먼저 키커가 왼쪽으로 차는 경우 키커의 기댓값을 구해봅시다. 보수행렬의 왼쪽 열을 보시면 됩니다. 키커가 왼쪽으로 찼는데 골키퍼가 100% 왼쪽으로 막으면 키커는 –1의 보수를 얻습니다(①에서의 –1 곱하기 100%). 키커가 왼쪽으로 찼는데 골키퍼가 90%는 왼쪽으로 막고, 10%는 오른쪽으로 막으면 키커의 보수는 ①의 –1 곱하기 90%에 ②의 2 곱하기 10%를 더한 –0.7이 됩니다(=(-1*0.9)+(2*0.1)). 이것을 일반화해서 말하면 다음과 같습니다. “골키퍼가 왼쪽으로 막을 확률을 q, 오른쪽으로 막을 확률을 1-q라고 하면, 키커가 왼쪽으로 차는 경우 키커가 얻을 기댓값은 (-1*q)+(2*(1-q))가 된다.” 이를 식으로 나타내면 다음과 같이 됩니다.     


키커가 왼쪽으로 차는 경우 키커의 기댓값:

 - 골키퍼가 왼쪽으로 막을 확률 q, 이 경우 키커의 보수는 -1

 - 골키퍼가 오른쪽으로 막을 확률 (1-q), 이 경우 키커의 보수는 2

 - 그러므로 키커의 기댓값: -1q + 2(1-q) = -3q + 2                                 이상 (식 4.10)     


키커가 오른쪽으로 차는 경우 키커의 기댓값

키커가 오른쪽으로 차는 경우 그의 기댓값도 같은 논리로 구할 수 있습니다. 이 경우는 그림 4.7의 오른쪽 열의 경우입니다. 키커가 오른쪽으로 차는데 골키퍼가 왼쪽으로 막으면 키커는 1의 보수를 얻는데(③의 경우), 골키퍼가 왼쪽으로 막을 확률이 q이므로 그의 기댓값은 1q가 되고, 골키퍼가 오른쪽으로 막는 경우 키커의 보수는 –1인데(④의 경우), 골키퍼가 오른쪽으로 막을 확률은 (1-q)이므로 그 기댓값은 –1(1-q)가 됩니다. 그러므로 키커가 오른쪽으로 차는 경우 키커의 기댓값은 이 둘을 더한 값입니다. 이를 식으로 나타내면 다음과 같습니다.     


키커가 오른쪽으로 차는 경우 키커의 기댓값:

 - 골키퍼가 왼쪽으로 막을 확률 q, 이 경우 키커의 보수는 1

 - 골키퍼가 오른쪽으로 막을 확률 1-q, 이 경우 키커의 보수는 –1

 - 그러므로 키커의 기댓값: 1q – 1(1-q) = 2q-1                                     이상 (식 4.11)     


q의 균형확률은?

q는 골키퍼가 왼쪽으로 막을 확률입니다. 이건 골키퍼가 결정합니다. 그렇다면 골키퍼는 q를 어떻게 결정하는 것이 가장 최선일까요? 키커가 오른쪽으로 차든 왼쪽으로 차든 어느 쪽도 키커에게 더 많은 이득을 주지 않는 q를 찾아야 합니다. 이 역시 식 4.10과 식 4.11이 일치하는 값입니다. 즉,     


 -3q + 2 = 2q – 1

∴ q = 3/5                                                             (이상 식 4.12)     


이 역시 q의 균형 확률입니다. 이는, 골키퍼는 3/5의 확률로 왼쪽으로 막는 것이 가장 최선의 전략이라는 것을 의미합니다.


혼합전략 내시균형 p와 q를 구했다.

 그러므로 우리는 이렇게 결론 내릴 수 있습니다. 키커와 골키퍼는, 각자 상대의 행동을 고려한 최선의 반응으로 p와 q를 각각 2/3, 3/5의 확률로 선택해야 합니다. 페널티킥 게임의 혼합전략 내시균형을 찾았습니다. 누구든 이 혼합전략 내시균형을 단독으로 변경해서는 이득을 얻을 수 없습니다. 상대가 전략을 바꾸지 않는 한 자신의 전략을 바꿀 필요가 없는 내시균형입니다.


┃요약

보수행렬이 그림 4.7과 같다고 할 때,

골키퍼는 키커가 자신이 어느 방향으로 막을지 알 수 없는 확률로 q를 선택해야 한다


키커가 왼쪽으로 차는 경우 키커의 기댓값:

 - 골키퍼가 왼쪽으로 막을 확률 q, 이 경우 키커의 보수는 -1

 - 골키퍼가 오른쪽으로 막을 확률 (1-q), 이 경우 키커의 보수는 2

 - 그러므로 키커의 기댓값: -1q + 2(1-q) = -3q + 2                                 이상 (식 4.10)    


키커가 오른쪽으로 차는 경우 키커의 기댓값:

 - 골키퍼가 왼쪽으로 막을 확률 q, 이 경우 키커의 보수는 1

 - 골키퍼가 오른쪽으로 막을 확률 1-q, 이 경우 키커의 보수는 –1

 - 그러므로 키커의 기댓값: 1q – 1(1-q) = 2q-1                                     이상 (식 4.11)     

   

- 키커가 어떤 전략을 선택하더라도 다른 전략보다 더 많은 이득을 얻지 못하는 q 찾기

- 이는 키커가 오른쪽으로 차든 왼쪽으로 차든 골키퍼의 기댓값이 같아야 한다는 것을 의미

- 즉 위 두 식이 일치하는 값 이 q의 균형확률임. 즉,


 -3q + 2 = 2q – 1

∴ q = 3/5                                                             (이상 식 4.12)     


앞장에서의 결론, p=2/3와 이번 장에서의 결론 q=3/5가 페널티킥 눈치게임의 혼합전략 내시균형임.


  

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari