청소년을 위한 게임이론 제2장 3
※ 맨 뒤에 요약이 있습니다.
이제 ‘내시균형(Nash Equilibrium)’에 대한 이야기를 할 순서입니다. 우선 '모든 비협조 게임에서의 균형은 내시균형'이라는 명제로 출발합니다. 협조게임과 비협조 게임의 정의에 대해서는 1.2강에서 말한 바 있습니다. ‘협조게임’이란 경기자들이 서로의 이익을 위해 협력하는 게임입니다. 그런데 앞에서 본 것처럼 협력하려면 서로 행동을 규제할 수 있어야 합니다. 각자의 행동을 서로 규제하지 못한다면 애초에 협조라는 개념이 생길 수 없습니다.
반면에 ‘비협조 게임’은 계약이나 협력, 혹은 협상을 하지 않는 게임입니다. 플레이어는 상대방의 행동에 따른 ‘최선의 반응’을 선택할 뿐입니다. 적군과 아군 간의 전쟁은 비협조 게임입니다. 체스나 바둑, 장기와 같은 게임, 그리고 홀짝게임 역시 비협조 게임이라는 사실이 명백합니다. 앞선 장에서 말씀드린 것처럼 게임이론은 대부분 비협조 게임에 대한 이론이며 이 연재에서 협조게임이라는 별도의 설명이 없으면 모두 비협조 게임입니다.
플레이어들이 전략을 바꿔서 이득을 얻을 수 없는 균형 상태
바로 이 비협조 게임에서의 균형을 내시균형이라고 부른다는 것입니다. 내시균형의 핵심 개념은 그것이 상대의 선택에 대한 ‘최선의 반응’을 선택한 결과라는 것입니다. 이런 사실로 인해 내시균형에는 한 가지 중요한 특징이 있습니다. 그것은 ‘상대가 전략을 바꾸지 않는 한, 자신의 전략을 바꿔서 이득을 얻을 수 없는 상태’라는 것입니다. 자신의 전략을 바꿔서 더 큰 이득을 얻을 수 있는 전략이 있다면 그건 이미 최선의 반응이 아닙니다. 모든 플레이어는 다른 모든 플레이어의 전략을 고려해 자신에게 최적인 반응을 선택할 것이고 그렇게 성립된 균형이 바로 내시균형입니다.
'최선의 반응'이기 때문
최선의 반응만으로 이뤄진 전략조합, 즉 상대의 반응에 따른 나의 최선의 반응만으로 이뤄진 짝이 있다면 그것이 바로 내시균형입니다. 그림 2.7에 제시된 죄수의 딜레마 게임에서 보수쌍 모두에 밑줄이 그어진 (자백, 자백) 전략조합이 바로 내시균형이라는 것입니다.
앞에서 우리는 죄수의 딜레마 게임의 균형인 (배신, 배신)은 우월전략 균형인 사실을 밝힌 바 있습니다. 우월전략 균형 역시 내시균형입니다. 죄수 각자는 상대의 행동에 대해 최선의 반응을 했음을 우리는 알고 있습니다. 우월전략 균형을 설명할 때 ‘최선의 반응’이라는 표현을 의도적으로 사용했는데, 그것이 내시균형임을 암시하는 복선이라고 할 수 있습니다. 정리하자면, 내시균형은, 플레이어들이 자신들의 전략을 변경할 동기가 없는 안정된 균형 상태를 의미합니다.
내시균형으로 게임의 결과 예측 가능
내시균형을 통해 우리는 게임의 결과를 ‘예측’할 수도 있습니다. 그것은, 게임에 참가하는 각 플레이어는 다른 플레이어들의 전략을 고려하여 최선의 전략을 선택할 것이기 때문입니다. 내시균형의 상태에서는 어떤 플레이어도 자신의 전략을 단독으로 바꾸어 더 좋은 결과를 얻을 수 없습니다. 이런 성격 때문에 내시균형은 경제학, 정치학, 생물학 등 다양한 분야에서 응용되고 있습니다.
존 내시(John Nash)는 모든 비협조게임에서는 적어도 하나 이상의 균형이 존재한다는 사실을 밝혔습니다. 내시균형이라는 이름이 붙은 것도 이런 이유 때문입니다. 그런데 이 말은 약간의 보완이 필요합니다. 지금부터 그 이야기입니다. 이 이야기는 바로 앞에서 배운 홀짝게임으로 시작됩니다. 홀짝게임은 앞에서 제로섬 게임의 예로 설명했었습니다. 이제 이 홀짝게임의 균형, 게임의 해를 찾아보기로 하겠습니다.
┃홀짝게임 균형 찾기┃
우월전략균형? 없는데..
그림 2.8은 그림 1.2를 그대로 가져온 그림입니다. 이제 A와 B가 상대의 전략에 따른 자신의 최선 반응을 찾아 밑줄을 긋은 작업을 해보겠습니다. 결과는 그림 2.8.1입니다.
A가 홀을 쥐었을 때 B는 홀을 부르는 것이 최선의 반응이라고 했습니다(A가 홀을 때 B의 선택지인 ①과 ③중에 B의 보수가 높은 것은 ①의 100, 밑줄 쫙). A가 짝을 잡았을 때 B는 짝을 부르는 것이 최선의 반응입니다(A가 짝일 때 B의 선택지인 ②와 ④중에 B의 보수가 높은 것은 ④의 100, 밑줄 쫙). 그러므로 이 게임에서 B는 우월전략이 없습니다. A가 뭘 쥐느냐에 따라 B의 최선 반응도 홀과 짝으로 바뀌기 때문입니다.
A도 마찬가지입니다. B가 홀을 불렀을 때 A는 짝을 쥐어야 합니다(B가 홀일 때 A의 선택지인 ①과 ②중에 A의 보수가 높은 것은 ②의 100, 밑줄 쫙), B가 짝을 부르면 A는 홀을 쥐어야 할 것이고요(B가 짝일 때 A의 선택지인 ③과 ④중에 A의 보수가 높은 것은 ③의 100, 밑줄 쫙). 그러므로 A에게도 우월전략은 없습니다. B가 뭘 부르느냐에 따라 A의 최선 반응도 홀과 짝으로 바뀌기 때문입니다.
내시균형? 못 찾겠는데..
이로써 홀짝게임은 우선 우월전략이 없는 게임이라는 사실이 밝혀졌습니다. 균형은 있을까요? 직관적으로는 균형이 없다는 것을 이미 눈치채셨겠지만, 균형이 없는 이유를 논리적으로 이해할 필요가 있습니다. (내시) 균형은 상대가 전략을 바꾸지 않는 한 내 전략을 바꿀 필요가 없는 상태라고 했습니다. 홀짝게임에서는 그런 상태가 없습니다.
A가 홀을 쥐고 B가 홀을 부르는 ①의 경우를 봅시다. 이 경우 A는 100의 손실을 보게 됩니다. A는 탄식이 절로 나옵니다. ‘아, 짝을 쥐었어야 했는데’하고 말입니다. 이 말은 이 상태가 균형이 아니라는 것을 의미합니다. 그러나 A가 짝을 쥐는 순간 B도 짝으로 선택을 바꾸는 것이 더 이익입니다. 거꾸로 A가 홀을 쥐었는데 B가 짝을 부르는 ③의 경우, 이때는 B가 100을 잃습니다. 이때는 B가 탄식을 하겠지요. ‘홀을 불렀어야 했는데’ 하고 말입니다. 이 말은, 만약 상대가 전략을 바꾸지 않는다면 자신의 전략을 바꿔서 더 큰 이득을 챙길 수 있다는 것을 의미합니다. 이는 내시균형의 정의를 위배합니다. 내시균형은, 상대가 전략을 바꾸지 않는 한 내 전략을 바꿀 필요가 없는 상태라고 했습니다. 죄수의 딜레마 게임의 경우 균형상태에서는 어느 누구도 먼저 움직여서 이익을 볼 수 없습니다.
내시균형은 숫자쌍 모두에 밑줄이 그어진 전략조합
물론 직관적으로는, 그림 2.8.1에서 보듯, 두 숫자 모두 밑줄이 그어진 숫자쌍이 없다는 것에서 내시균형이 없다는 것을 알 수 있습니다. 밑줄을 긋는 것이 내시균형을 찾아가는 하나의 훌륭한 방법이 되는 이유는 간단합니다. 우리는 상대방의 선택에 따른 최선의 반응에 밑줄을 그었기 때문입니다. 그러므로 두 플레이어 모두가 최선의 반응인 전략조합, 즉 밑줄이 둘 다 그어진 전략쌍은 내시균형이 됩니다.
'순수전략' 홀짝게임에는 없는 내시균형
그런데 이런 결과는, 이 글 앞머리에 내세웠던, 비협조게임에서는 내시균형이 반드시 존재한다는 명제와 위배됩니다. 그러나 아직 실망하기엔 이릅니다. 지금까지 우리가 살펴본 홀짝게임은 정해진 전략 홀과 짝 가운데 하나를 all or nothing으로 선택하는 게임이었습니다. 이를 순수전략(Pure Strategy)이라고 합니다. 그러므로 순수전략 홀짝게임에서는 내시균형이 없다는 표현이 정확한 표현입니다.
홀과 짝을 확률적으로 선택하는 전략을 구사할 수도 있는데 이를 우리는 혼합전략(Mixed Strategy)이라고 합니다. 만약 내시가 밝힌 ‘모든 비협조게임에서는 내시균형이 반드시 존재한다’는 명제가 옳다면, 혼합전략 홀짝게임에서는 반드시 균형이 존재해야 할 것입니다. 이 부분은 혼합전략을 다룰 때 살펴볼 예정입니다.
- 모든 비협조게임의 균형은 내시균형입니다.
- 내시균형의 핵심 개념은 그것이 상대의 선택에 대한 ‘최선의 반응’을 선택한 결과라는 것입니다. 이런 사실로 인해 내시균형에는 한 가지 중요한 특징이 있습니다. 그것은 ‘상대가 전략을 바꾸지 않는 한, 자신의 전략을 바꿔서 이득을 얻을 수 없는 상태'입니다.
- 존 내시(John Nash)는 모든 비협조게임에서는 적어도 하나 이상의 균형이 존재한다는 사실을 밝혔습니다. 내시균형이라는 이름이 붙은 것도 이런 이유 때문입니다.
- 홀짝게임에는 우월전략도, 균형도 없습니다. 그러나 현재까지 우리가 살펴본 홀짝게임은 정해진 전략 '홀'과 '짝' 가운데 하나를 all or nothing으로 선택하는 게임이었습니다. 이를 순수전략(pure strategy)이라고 합니다. 그러므로 '순수전략 홀짝게임에서는 내시균형이 없다'는 표현이 정확한 표현입니다.
- 나중에 우리는 홀과 짝을 확률적으로 선택하는 전략인 혼합전략(mixed strategy)을 알아볼 텐데, 순수전략에서 내시균형이 없었다면 혼합전략에서는 반드시 내시균형이 있어야 '모든 비협조게임에서는 적어도 하나 이상의 균형이 존재한다'는 명제가 성립이 될 것입니다.