청소년을 위한 게임이론 제1장 5
※ 맨 뒤에 요약이 있습니다.
홀짝게임은 초등학생부터 대학생, 심지어 군대에 간 성인에 이르기까지 광범위한 고객이 있는 게임입니다. 우리가 어릴 때는 ‘짤짤이’라는 경망스러운 이름으로 불렀습니다. 미국에도 있다고 하는데 책에서 알게 된 사실이지만 우리와는 하는 방식이 다릅니다. 미국에서는 게임을 시작하기 전에 미리 자신이 짝수인지 홀수인지를 정해 놓는다고 합니다. 그리고 각자 하나씩 쥔 동전의 앞뒤를 동시에 보여주는데 둘 다 같은 면이면 짝수를 선택한 플레이어가 상대의 동전을 차지하고, 서로 다른 면이면 홀수를 선택한 플레이어가 상대의 동전을 차지하는 방식입니다. 우리나라는 동전을 쥐는 쪽과 거는 쪽만 정해 놓습니다. 그리고 쥐는 쪽이 홀수개를 쥐었는지 짝수개를 쥐었는지를 거는 쪽이 맞추는 방식이지요. 맞추면 거는 쪽이 건만큼 뺏어오고 못 맞추면 쥐는 쪽이 건만큼 뺏어오게 됩니다. 방법의 차이는 있지만 원리는 비슷합니다.
A는 동전을 쥐고, B는 홀이나 짝을 부릅니다
이제 홀짝게임(우리나라 방식)을 시작해 봅시다. A가 동전을 쥐었습니다. B가 ‘홀’을 부르면서 100원을 걸었습니다. A가 주먹을 펴 확인했더니 진짜 홀수 즉, ‘홀’이 나왔다면 B는 A로부터 100원을 받게 될 것입니다. A는 –100입니다. 반대로 ‘홀’을 불렀는데 A가 쥔 동전의 숫자가 ‘짝’이라면 A가 B로부터 100원을 받게 될 것입니다. 역할을 반대로 해서 B가 쥐는 경우에도 같은 방식입니다. 예비군 훈련을 받으면서도 저 뒤편의 아저씨들이 했던 바로 그 게임입니다.
이제 이 간단한 게임을 그림으로 나타내 보겠습니다. 이 그림은 게임이론을 이해하기 위해서는 반드시 알아야 할 표입니다. 게임이론에 입문하기 위해 필수적으로 거쳐야 할 첫 번째 고비입니다. 여기서 포기하면 게임이론은 내 인생에서 영원히 아웃이 될 가능성이 큽니다. 다행히 아주 쉽습니다.
A와 B의 전략: '홀'이냐 '짝'이냐?
선택가능한 전략조합은 모두 네 개!
A와 B는 모두 각각 홀과 짝이라는 ‘전략’을 선택할 수 있으므로 전체적으로 선택 가능한 전략조합은 네 가지입니다. 이것을 행렬표, 즉 매트릭스로 나타낸 것이 아래 그림 1.1입니다. ① ② ③ ④는 편의상 번호를 매긴 것이고, 이 자리에는 A와 B가 받을 보수(payoff)가 표시됩니다.
우선 네 개 조합의 성격을 먼저 살펴봅시다. 게임의 전략이나 보수를 나타낼 때, '전략조합'이나 '보수쌍'의 왼쪽은 A, 오른쪽은 B를 나타냅니다. ②를 먼저 보겠습니다. ②의 전략조합은 (짝, 홀)로 씁니다. 전략조합의 왼쪽은 A, 오른쪽은 B를 나타내기 때문입니다. 그렇다면 A는 홀이고 B는 짝을 나타내는 ③은 (홀, 짝) 전략조합이 될 것입니다. 같은 원리로 ①은 (홀, 홀), ③은 (짝, 짝) 전략조합이 됩니다. ①, ②, ③, ④의 각 칸에는 A와 B가 선택한 전략조합에 따라 A와 B에게 부여되는 보수쌍이 숫자로 표시됩니다. 100원을 거는 홀짝게임의 보수표는 그림 1.2와 같습니다. 이제 홀짝게임의 완전한 메트릭스, 행렬표가 완성됐습니다.
보수표를 이해하자
①, ②, ③, ④의 각 칸에 괄호로 묶은 숫자쌍이 보수쌍입니다. 앞에서 말한 것처럼, 각 쌍에서 앞의 숫자는 A, 뒤의 숫자는 B를 나타냅니다. ①의 경우를 먼저 볼까요? ①은, B가 홀을 불렀는데 A가 홀을 쥔 (홀, 홀) 전략조합일 때 A와 B가 각각 갖는 보수쌍입니다. 보수가 (-100, 100)으로 표시되어 있습니다. A가 쥔 패인 홀을 알아맞힌 B가 이긴 것이고 A는 진 것입니다. 그러므로 A는 100원을 B에게 줘야 합니다. -100이죠. B는 100을 땁니다. 그러니 보수가 (–100, 100)이 되는 것입니다. 나머지도 마찬가지입니다. 하나만 더 해볼까요? ③은 A가 홀을 쥐었는데 B가 짝을 부른 상황입니다. 전략조합은 (홀, 짝) 전략조합입니다. B가 틀렸으니 A가 100을 따고 B는 100을 잃습니다. 그러니 보수쌍은 (100, -100)이 됩니다.
게임을 이와 같이 메트릭스 형태로 나타낸 것을 '정규형(normal form)' 혹은 '전략형(strategic form)'이라고 합니다. 트리형태로도 나타낼 수 있는데 이는 '전개형(extensive form)'이라고 부릅니다. 전개형은 다음 글에서 다룰 예정입니다.
게임의 삼대 요소
여기까지 따라오시면서 여러분은 몇 가지 중요한 사실을 무의식 중에 알게 됐습니다. 첫 번째는 게임에는 반드시 두 명(이상)의 ‘플레이어’가 있어야 한다는 것(여기서는 A와 B), 두 번째는 그 플레이어가 선택할 수 있는 ‘전략들’이 있어야 한다는 것(여기서는 홀과 짝), 마지막 세 번째로 각 전략조합 별로 플레이어가 얻는 ‘보수’가 있어야 한다는 것(여기서는 100과 –100으로 구성된 보수쌍)입니다. 경제학에서 게임이라는 상황이 성립하기 위해서는 바로 이 세 가지 요소가 반드시 필요합니다. 게임의 삼대 요소라고 할 수 있습니다.
이 게임의 본질은, A와 B의 운명은 각각 상대방의 선택에 달려있다는 점입니다. 경제학에서 개인의 행동은 오로지 개인의 효용 극대화 선택에 의해서만 결정된다고 가르칩니다. 효용이론은 미시경제학의 핵심 개념이기도 합니다. 그러나 게임이론은 그렇지 않다고 말합니다. 게임이론에서 개인의 행동은 ‘상대방의 전략을 고려한 선택‘이어야 하기 때문입니다. 단순한 홀짝게임에서도, 내가 홀을 쥐든 짝을 쥐든, 혹은 홀을 부르든 짝을 부르든, 플레이어의 운명은 상대의 선택에 의해 결정되는 것을 우리는 살펴보았습니다. 이처럼 게임이론에서 어떤 개인의 선택은, ‘상대의 전략을 고려한 합리적 선택’이어야 합니다. 게임이론에서는 이러한 선택을 ‘최선의 반응’이라고 표현합니다.
게임 상황을 쉽게 이해하기 위해 우리는 위에서 본 것과 같은 행렬표를 이용합니다. 게임을 이처럼 표로 나타낼 수 있다는 것은 큰 장점입니다. 만약 홀짝게임을 이 표가 없이 설명한다고 생각해 보십시오. 주절주절 말이 길어질 것이고 제대로 납득시키기도 쉽지 않을 것입니다. 그러니 이 표를 정확히 이해하는 것은 대단히 중요합니다. 여러분의 편의를 위해(설명의 편의를 위해), 이 글의 모든 보수행렬의 보수표에, ① ② ③ ④와 같은 원문자로 각 보수쌍의 위치를 표시할 것입니다.
게임이 성립하기 위해서는 복수의 플레이어, 각 플레이어가 선택하는 전략, 그리고 선택에 따른 보수가 반드시 있어야 합니다. 이 중 하나라도 빠지면 게임이 될 수 없습니다. 플레이어, 전략, 보수를 게임의 삼대요소라고 합니다.
홀짝게임에는 두 명의 플레이어, 각 플레이어가 선택하는 전략인 홀과 짝, 그리고 그에 따른 대가인 보수가 있습니다. 두 명의 플레이어가 두 개의 전략으로 게임을 하므로 전략조합은 (홀, 짝), (홀, 홀), (짝, 짝), (짝, 홀) 네 가지가 나옵니다. 각 전략조합의 앞부분은 A(메트릭스의 왼쪽 플레이어), 뒷부분은 B(메트릭스의 위쪽 플레이어)의 전략을 표시합니다. 예컨대 (홀, 짝) 전략조합은 A가 홀, B가 짝인 전략조합입니다.
각 전략조합에 대해 보수쌍이 반드시 필요합니다. 보수쌍 역시 앞부분은 A, 뒷부분은 B의 보수를 나타냅니다. (100, -100)의 보수쌍은 A가 100을 따고 B가 100을 잃는 것을 의미합니다. 만약 (홀, 짝) 전략조합이라면 A가 쥔 홀을 B가 맞추지 못한 것이 되므로 A는 100을 따고 B는 100을 잃는 (100, -100)이 보수쌍이 될 것입니다.
게임을 이와 같이 메트릭스 형태로 나타낸 것을 '정규형(normal form)' 혹은 '전략형(strategic form)'이라고 합니다.
홀짝게임에서도 본 것처럼 게임에서 플레이어의 운명은 상대의 선택에 의해 결정됩니다. 그러므로 게임에서 나의 선택은 상대방의 선택에 대한 '최선의 반응'이어야 합니다. '최선의 반응', 중요한 개념이니 꼭 익혀두세요.