청소년을 위한 게임이론 제2장 4
※ 맨 뒤에 요약이 있습니다.
죄수의 딜레마 게임을 다시 생각해 봅시다. 죄수의 딜레마 게임의 보수행렬은 그림 2.9와 같습니다. 이는 그림 2.1을 그대로 가져온 것입니다. A의 입장에서 생각해 보면, B가 어떤 선택을 하든, 자백을 하는 것이 최선의 반응이 됩니다. 이를 우월전략이라고 했습니다. 이를 반대로 보면 침묵은 열등전략이 됩니다.
이렇게 우월전략이 분명한 게임(=열등전략이 분명한 게임)에서는 열등전략은 아예 고려하지 않고 지워버리는 방식으로 내시균형을 찾을 수 있다는 것은 앞에서 설명한 바 있습니다. 죄수의 딜레마 게임의 내시균형 (자백, 자백)도 열등전략을 지우는 방식으로 찾을 수 있습니다. 여기까지는 지난 시간에 다룬 내용입니다.
강우월전략, 강열등전략
죄수의 딜레마 게임에서처럼 열등전략과 우월전략이 분명한 경우, 이제 우리는 이런 열등전략을 ‘강열등전략(strictly dominated strategy)’이라고 부르고, 이런 우월전략을 ‘강우월전략(strictly dominant strategy)’이라고 부르기로 하겠습니다. ‘강열등전략’은 조금이라도 열등한 전략입니다. 마치 부등호에서 =그러므로 아예 고려하지 않고 지워버릴 수 있는 전략인 것입니다.
그런데 열등하지도 우월하지도 않은 상황이 있을 수 있습니다. 그림 2.10의 보수행렬을 보시기 바랍니다. A와 B는 쌍둥이 자매입니다. A는 몸이 좀 약해서 내성적이고 B는 건강한 데다 활발한 성격입니다. 둘은 같은 방에서 같이 생활합니다.
취침이냐, 산책이냐
그날은 정월 대보름날이었습니다. 그날따라 보름달이 너무 휘영청 밝았습니다. 그러나 날씨는 아주 춥습니다. A와 B는 밤도 늦고 날씨도 추우니 그냥 잘 것인지 아니면 보름달이 밝으니 달구경 겸 산책이라도 할 것인지를 놓고 실랑이하고 있습니다.
A는 추운 날의 산책이 싫습니다. 더구나 B가 걸으면서 너무 재잘거려서 B와 함께하는 산책은 더 싫습니다(1점). 그나마 혼자 산책을 하면 둘이서 하는 산책보다는 낫습니다(2점). A는 산책보다는 잠이 좋지만, 잠도 둘이 자는 것(2점)보다 혼자서 자는 것이 낫습니다(3점). 반면, B는 취침도 산책도 다 좋습니다. 다만 좁은 방에서 같이 자는 것(2점)보다는 혼자서 자는 게 낫고(3점), 산책은 혼자 하든 둘이 하든 똑같이 좋습니다(3점). 이런 관계가 그림 2.10의 보수행렬에 나타나 있습니다. 숫자는 효용의 크기입니다.
일단 보수행렬을 보면 ①(2, 2)와 ④(1, 3)보다 ②(3, 3)과 ③(2, 3)의 보수가 더 크거나 최소한 같습니다. 이 말은 둘 다 취침이든 산책이든 따로 하는 것이 더 낫다는 의미입니다. 이때쯤 되면 여러분은 보수행렬을 보는 순간 내시균형을 찾기 위해 보수쌍의 숫자에 줄을 긋는 것부터 시작할 것입니다. 그런데 얼씨구? 줄을 어디다 그어야 할지 모르는 숫자쌍이 있을 것입니다. 일단 줄을 긋는 방식은 나중에 보기로 하고 지금까지와 다른 방법으로 내시균형을 찾아보기로 하겠습니다.
약우월전략, 약열등전략
B가 취침을 하는 경우 A는 취침(⓵의 2)과 산책(⓶의 2)에서 모두 같은 효용을 얻습니다. 그런데 B가 산책을 선택하면 A는 취침을 선택(⓷의 3과 ⓸의 1 비교)하는 것이 더 효용이 큽니다. 그러므로 A로서는 B가 어떤 선택을 하든 취침을 선택하는 것이 산책을 하는 것보다는 우월한데, 그 정도는 약합니다. B가 취침을 하는 경우에는 A로서는 취침이든 산책이든 효용이 같기 때문입니다. 다만 B가 산책을 하는 경우에만 더 우월합니다. 이런 상황을 ‘우월하긴 하지만 약하게 우월하다’고 표현하고, 이런 전략을 ‘약우월전략(weakly dominant strategy)’이라고 표현합니다. 반대로 열등한데 약하게 열등한 전략은 ‘약열등전략(weakly dominated strategy)’입니다. A에게 약우월전략은 취침, 약열등전략은 산책입니다.
이제 A의 선택에 따른 B의 입장을 볼까요. A가 취침을 선택하는 경우에 B는 산책이 우월합니다(①의 2보다 ③의 3이 우월). 그런데 A가 산책을 하는 경우에 B는 취침과 산책의 효용이 같습니다(②의 3과 ④의 3). 이 경우 A가 어떤 선택을 하더라도 B는 산책이 우월한데, A가 산책을 선택하는 경우에는 취침과 산책이 같은 효용인 3을 주므로 약하게 우월하다고 말할 수 있습니다. 이 역시 약우월전략입니다. 즉 B의 약우월전략은 산책, 약열등전략은 취임입니다.
약우월전략이 내포된 '어색한' 균형도 내시균형
약우월전략 증, A 취침, B 산책인 ③은 내시균형이 되는 것이 분명합니다. 이는 모든 보수쌍을 통틀어 둘 모두에게 가장 높은 효용을 주는 보수쌍입니다. 그런데 우리가 약열등전략이라고 제쳐둔 ⓶의 경우, 즉 A가 산책을 선택하고 B가 취침을 선택하는 (산책, 취침) 전략조합도 내시균형입니다. 왜냐고요? 이 조합 역시 상대가 전략을 바꾸지 않는 한 자신의 전략을 바꿀 이유가 없는 조합이기 때문입니다. 우선 B는 굳이 취침을 산책으로 바꿀 이유가 없습니다. 이미 최선의 효용인 3을 얻고 있기 때문입니다. 그렇다면 A 역시 바꿀 이유가 없습니다. 산책을 취침으로 바꿔도 취침과 마찬가지의 효용인 2를 얻을 뿐이기 때문입니다. 그러니 (산책, 취침) 전략조합 역시 내시균형입니다. 뭔가 ‘어색한’ 균형이지만 내시균형임에는 분명합니다.
밑줄 치는 방법으로 내시균형 찾기
이제 밑줄을 긋는 방식으로 내시균형을 찾아봅시다. 이 경우 여러분은 동일한 크기의 보수 둘 다 밑줄을 쳐야 합니다. 이는 둘 중 어느 것도 배제되지 않기 때문입니다. 즉, B가 취침을 선택하는 경우 A는 취침과 산책이 모두 같은 보수 2를 얻습니다. 이 경우 둘 다 밑줄을 치는 것이지요. 또 A가 산책을 선택하는 경우 B는 취침이든 산책이든 동일한 보수 3을 얻습니다. 이 경우에도 둘 다 배제하지 않기 때문에 둘 다 밑줄을 친다는 것입니다. 이렇게 찾은 내시균형 역시 ②와 ③의 전략조합입니다.
우리는 앞에서 열등 전략은 제거함으로써 내시균형을 찾은 바 있습니다. 그러나 제거되는 열등 전략은 강한 열등 전략입니다. 지금 본 것처럼 약한 열등 전략은 제거되지 않습니다. 이 ‘어색한’ 균형을 제거하는 방법은 ‘떨리는 손’을 다루는 글에서 살펴볼 예정입니다.
- ‘우월하나 약하게 우월’한 전략을 ‘약우월전략(weakly dominant strategy)’이라고 표현합니다. 반대로 '열등한데 약하게 열등'한 전략은 ‘약열등전략(weakly dominated strategy)’입니다.
- A의 입장에서, 취침과 산책 두 전략 가운데 취침에서는 명백히 우월하나(3>2), 산책에서는 우월함을 가릴 수 없는(2=2) 전략쌍은 A에게 약우월전략이 됩니다.
- 그러나 B의 입장에서 이 전략은 약열등한 전략, 즉 산책에서는 명백히 열등(2 <3) 하나, 산책에서는 우월함을 가릴 수 없는(2=2) 상태이므로 이 전략쌍은 B에세 약열등전략이 됩니다.
- 균형을 찾을 때는 보수가 같은 경우 모두 내시균형의 대상이 됩니다. 그러므로 산책도 2, 취침도 2인 경우 두 경우 모두 밑줄을 그어야 합니다(이 역시 최선 반응으로 본다는 의미입니다).
- 이렇게 찾은 내시균형은 확실히 '어색한' 균형입니다. 이 어색한 균형을 제거하는 방법도 있습니다.