brunch

You can make anything
by writing

C.S.Lewis

by 정섭 Dec 23. 2024

청소년을 위한 게임이론 제4장. 혼합전략 내시균형(7)

페널티킥 눈치 게임(3)

※ 맨 뒤에 요약이 있습니다.


┃페널티킥 눈치게임, 그림으로 그리기


앞에서 다룬 두 개의 글에서 우리는 페널티킥 눈치 게임의 균형 확률, 즉 혼합전략 내시균형을 찾았습니다. 이제 우리는 그래프를 통해 이 균형의 직관적인 의미를 알아보기로 하겠습니다. 그래프를 그릴 때 가장 중요한 것은 수직축(y축)과 수평축(x축)을 정하는 것이라고 말씀드린 적이 있습니다. 보통 x축은 독립변수를 y축은 종속변수를 나타냅니다. 예컨대 y=2x라는 함수가 의미하는 것은, x값이 1이면 y값이 2가 된다는 것입니다. x의 값에 따라 y의 값이 결정된다는 의미입니다. 페널티킥 눈치게임에서는 각 플레이어의 행동 선택 확률에 따라 기댓값이 결정되기 때문에 p와 q가 독립변수이고 기댓값이 종속변수가 됩니다. 그러므로 x축은 p나 q를 나타내고, y축은 기댓값으로 표시하면 됩니다.


골키퍼의 기댓값을 나타내는 선

먼저 골키퍼의 기댓값을 나타내는 식 4.7과 식 4.8을 그래프로 그려봅시다. 말한 것처럼 골키퍼는 키커가 차는 방향의 확률에 따라 기댓값(기대이득)이 달라집니다. 그림 4.8은, 키커가 왼쪽으로 찰 확률이 p일 때 골키퍼의 선택에 따른 기대이득인 식 4.7과 식 4.8을 그린 그래프입니다. 수평축은 키커가 왼쪽으로 찰 확률(p)이고 수직축은 키커가 왼쪽으로 찰 확률에 따라 골키퍼가 얻게 될 기대이득입니다.                    

그림 4.8의 노란색 선, 골키퍼가 왼쪽으로 막는 경우 골키퍼의 기댓값

키커가 왼쪽으로 찰 확률이 p일 때 골키퍼의 첫 번째 선택은 왼쪽으로 막는 것입니다. 식 4.7에서 보듯, 이 경우의 기댓값은 2p-1입니다. y축 절편이 -1이고 기울기가 2인 우상향 그래프로 그릴 수 있습니다. 그림 4.8에서 주황색 선입니다. 이 선은 골키퍼가 왼쪽으로 막는 경우 골키퍼가 받게 될 기대이득을 나타내는 그래프입니다.


그림 4.8의 빨간색 선, 골키퍼가 오른쪽으로 막는 경우 골키퍼의 기댓값

같은 상황에서 골키퍼의 두 번째 선택은 오른쪽으로 막는 것입니다. 이 경우 골키퍼의 기대이득은 식 4.8에 의해 -3p+1입니다. 이는 y축 절편은 1이고 기울기는 –3인 그래프로 그릴 수 있고 이는 그림 4.8의 빨간색 선이 됩니다.


두 선의 일치하는 p값(=2/5)이 균형확률

우리는 두 식이 일치하는 p=2/5가 ‘상대방인 골키퍼가 어떤 선택을 해야 할지를 예측하지 못하게 하는 확률’, 곧 균형 확률임을 증명한 바 있습니다. 그림 4.8의 그래프에서는 두 선이 교차하는 점입니다. 이 점에서 골키퍼의 기대이득은 –0.2입니다.


골키퍼가 이 균형 확률을 벗어나는 경우 키커는 어떤 선택을 할지를 봅시다. 키커가 2/5(40%) 보다 높은 50%의 확률(p=1/2)로 왼쪽으로 차는 경우 골키퍼는 자신에게 더 높은 보수를 주는 주황색 선을 선택할 것입니다. 즉 왼쪽으로 더 많이 막는 것이지요. 그래프에 의하면 이 경우 기댓값은 –0.2보다 높은 0입니다. 물론 이 상태는 오래가지 못할 것입니다. 자신이 균형 확률보다 더 높은 확률로 왼쪽으로 차는 것을 눈치챈 골키퍼가 왼쪽으로 더 많이 막는다면 키커는 자신의 전략을 수정해야 합니다. 점차 왼쪽으로 차는 비율이 줄어들면서 골키퍼의 기대이득도 0에서 줄어들어 결국 균형 확률인 p=2/5에 다다르면 골키퍼는 왼쪽으로 막는 것으로부터 더 이상 추가적인 기대이득을 얻을 수 없게 됩니다.                    

키거의 경우는 다음 그림 4.9와 같은 그래프로 나타낼 수 있습니다. 키커가 왼쪽으로 차는 경우 키커의 기댓값을 나타내는 선은 노란색 선입니다. 이는 식 4.11에서 키커의 기댓값=-3q+2를 그린 것입니다. y축 절편이 2이고 기울기가 –3인 직선입니다. 키커가 오른쪽으로 차는 경우 키커의 기댓값은 빨간색 선으로 나타나 있습니다. 이는 식 4.11(2q-1)을 그린 직선입니다.


교차점은 p가 3/5, 즉 0.6에서 이뤄집니다. 왼쪽으로 차는 것과 오른쪽으로 차는 것의 기댓값이 같아지는 확률이 바로 균형 확률입니다. 


┃요약

- 골키퍼의 기댓값(기대이득)은 키커가 차는 방향의 확률에 따라 달라짐(그림 4.8).

- 그림 4.8: 키커가 왼쪽으로 찰 확률이 p일 때 골키퍼의 선택에 따른 골키퍼의 기대이득을 그린 그래프

- 수평축은 키커가 왼쪽으로 찰 확률(p), 수직축은 확률 p에 따라 골키퍼가 얻게 될 기대이득.

- 노란색선: 골키퍼가 왼쪽으로 막을 경우 골키퍼가 얻을 기대이득(y=2p-1)

- 빨간색선: 골키퍼가 오른쪽으로 막을 경우 골키퍼가 얻을 기대이득(y=-3p+1)

- 교차점(p=2/5)이 키커의 균형확률


- 키커의 기댓값(기대이득)은 골키퍼가 막는 방향의 확률에 따라 달라짐(그림 4.9)

- 그림 4.9: 골키퍼가 왼쪽으로 막을 확률이 q일 때 키커의 선택에 따른 키커의 기대이득을 그린 그래프

- 수평축은 골키퍼가 왼쪽으로 막을 확률(q), 수직축은 확률 q에 따라 키커가 얻게 될 기대이득

- 노란색선: 키커가 왼쪽으로 차는 경우 키커가 얻을 기대이득(y=-3q+2)

- 빨간색선: 키커가 오른쪽으로 차는 경우 키커가 얻을 기대이득(y=2q-1)

- 교차점(q=3/5)이 골키퍼의 균형확률


- 그러므로 혼합전략 내시균형: p=2/5, q=3/5

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari