[시리즈 완결] 전쟁은 과연 없어지지 않을까?

- 인기 만화 '스파이 패밀리' 캐릭터들로 알아보는 반복 게임의 전략들

by 묘한 경제

지난 편에서 우리는 도노반 데스몬드의 냉혹한 전쟁론, 즉 '안보 딜레마'를 엿보았다.

상대방을 믿지 못하기에, '군비 증강(배신)'이 우월 전략이 되어버리는 절망적인 게임.

하지만 그의 게임 이론은 게임이 '단 한 번'이라는 가정 위에 서 있다.

현실의 외교, 안보, 딜레마는 '반복'되고, 그제서야 단판에서는 보이지 않던 두 가지의 새로운 규칙이 게임판을 지배하기 시작한다.


MISSION ?? : 도노반이 간과한 '시간'이라는 변수


규칙 1: '우리는 맞는 길로 가고 있는 걸까?'

단판 게임에서는 살펴보았듯 '배신'이 최고의 전략이다. 상대가 어떤 선택을 하든 '배신'은 내가 '협력'을 선택했을 때보다 더 큰 이득을 가져다 준다.

균형점은 (배신, 배신)에서 형성된다.

그렇지만 우리는 알고 있다. 둘 모두에게 가장 만족스러운 효용은 (협력, 협력)에서 나온다는 것을.

단판에서는 배신해서 이득을 보면 끝이지만, 반복 게임에서는 양국은 서로 최선의 선택인 (배신,배신)을 하며 문득 떠올린다. "이렇게 한 게임 당 배신의 결과인 1의 이득을 꾸준히 얻는 게 아니라, 서로 협력하면 꾸준히 3의 이득을 얻었을 텐데." 현실적으로는, "서로 신뢰할 수 있었다면 상호 배신에서 나오는 국방비를 아껴 양국 모두 발전에 힘을 얻었을텐데."

이처럼 오늘의 이기적인 선택이 미래에 얻을 수 있었던 더 큰 협력의 이익을 날려버린다는 가능성.

이것이 바로 모든 플레이어의 머리 위로 드리우는 '미래의 그림자'다.

이 미래에 대한 고려가, 단판 게임에서는 비합리적이었던 '협력'을 합리적인 선택지로 바꾸는 첫 번째 열쇠다.


규칙 2: '국제 사회에서의 우리는'

도노반의 게임에서는 두 개의 국가만이 존재했지만, 현실은 그렇지 않다.

우리의 게임을 다른 국가들이 지켜보고, 그 국가들도 우리와 관계를 맺는다는 것. 여기서 '평판'이라는 두 번째 규칙이 생겨난다.

만약 A라는 한 쪽 국가가 상대를 배신해버리고 자신의 이득을 챙긴다면, 그 게임에서는 이득을 볼 수 있지만 이를 지켜본 다른 모든 국가가 보기엔 '믿을 수 없는 나라'라는 낙인이 찍혀버린다.

'언제든 배신하는 녀석'이라는 평판 아래서 A와 '협력'해줄 국가는 없고, 다른 국가들이 상호 협력하여 효용을 극대화할 때 (배신, 배신)의 짜잘한 이득만을 보거나 이 낙인을 벗기 위해 상대의 배신에도 협력하며 얻은 이득을 모두 토해내는 수밖에 없다.

결국 이 평판 때문에 단판 게임에서는 합리적이었던 오늘의 '배신'이, 내일의 모든 게임에서의 자신을 불리하게 만들어버리는 선택지로 바뀐다.


게임이론가들은 이 끝없는 눈치 싸움 속에서 살아남기 위한 몇 가지 전략들을 도출했다.

흥미롭게도, 대표적인 전략들은 따분한 이론이 아니라 각자 뚜렷한 개성과 철학을 가진 하나의 캐릭터처럼 느껴진다.

역시나 이번에도 작품 <스파이 패밀리>의 등장인물들을 떠올리며 반복 게임의 세계 속 기본적인 전략들을 탐험해보자.

각 전략들이 어떤 인물을 닮았는지 하나씩 살펴보면, 그 본질을 훨씬 더 명확하게 이해할 수 있을 것이다.




1. 도노반 데스몬드의 '무조건 배신'

image.png?type=w966


가장 먼저 만나볼 플레이어는 이 절망적인 게임판의 설계자이자 오스타니아의 최고 권력자 도노반 데스몬드다.

그의 전략인 '무조건 배신'은 이름 그대로다. 상대가 누구든, 어떤 행동을 하든 상관없이, 매 순간 '배신'만을 선택한다.

도노반의 세계관 속에서, '인간은 거짓말쟁이'이므로 협력은 언젠가 깨질 신기루에 불과하다.

따라서 최악의 상황(나만 협력하다 배신당하는 것)을 원천적으로 차단하는 것이 가장 합리적이라는 결론에 도달한다.

하지만 이 전략은 스스로 협력의 가능성을 영원히 차단함으로써, 더 큰 이익을 얻을 수 있는 모든 기회를 잃어버린다는 치명적인 약점을 갖는다.

그럼에도 왜 그는 이토록 단순하고 극단적인 전략을 고수하는 걸까? 그의 확신 뒤에는, 사실 소름 끼치도록 냉철한 게임이론적 계산이 숨어있다.


만약 오스타니아와 웨스탈리스의 게임이 '10개의 라운드'로 정해져 있다고 상상해 보자.

마지막 10라운드. 이 라운드가 끝나면 더 이상의 '미래'는 없다. 그렇다면 이 라운드는 사실상 '단판 게임'과 같다.

여기서 최선의 전략은? 당연히 상대를 배신하는 것이다. 두 합리적인 국가는 모두 10라운드에서 서로를 배신할 것이다.

그렇다면 9라운드는 어떨까? 두 국가는 이미 알고 있다.

"어차피 10라운드에서는 서로 배신할 텐데, 굳이 9라운드에서 협력해서 신뢰를 쌓을 필요가 있나?"

결국 9라운드에서 협력의 동기는 사라지고, 여기서도 최선의 전략은 배신이 된다.

그런데, 그 생각을 상대가 못할까? 8라운드 역시 마찬가지다. 어차피 9라운드에서 배신할 거라면...

이 논리의 도미노는 끝없이 앞으로 밀려온다. 7라운드, 6라운드, 5라운드를 거쳐... 마침내 오스타니아는 첫 번째 라운드부터 배신하는 것이 가장 합리적인 선택이라는 무서운 결론에 도달하게 된다. 이것이 바로 '정해진 끝'이 있는 유한 반복 게임의 비극이다.

도노반의 '전쟁 영원론'은 바로 이 냉철한 계산에 기반을 두고 있는 것이다.


2. 헨리 헨더슨의 '무조건 협력'

도노반의 냉소주의에 정면으로 맞서는 플레이어가 있다.

바로 '엘레강트', 헨리 헨더슨이다.

아냐가 다니는 명문 이든 칼리지의 역사 교사이자 기숙사장으로, 입버릇처럼 '엘레강트!'를 외치는 고고한 교육자의 전략.

'무조건 협력' 또한 놀랍도록 단순하다. 상대가 나를 배신하더라도, 굴하지 않고 '협력'의 손을 내미는 것이다.

얼핏 보면, 이 전략 역시 너무나도 순진하고 어리석어 보인다.

'무조건 배신'이라는 도노반 같은 플레이어에게 모든 것을 착취당하는 완벽한 호구이자 바보가 아닌가?

맞다. 하지만 헨더슨에게 이것은 손익 계산의 문제가 아니다. 바로 '엘레강트'의 문제다.

그에게 '협력'은 이기기 위한 수단이 아니라, 그 자체로 지켜야 할 품위이자 신념이다.

배신이라는 '엘레강트하지 못한' 수를 두느니, 차라리 점수를 잃는 길을 택하는 것. 이것이 그의 숭고하지만 비현실적으로 보이는 철학이다.

게다가, 이 숭고한 철학은 비단 '바보같다'기엔 꽤 강력한 요소들이 숨어있다.

반복 게임의 진짜 승리는 단기적인 점수가 아니라, '신뢰할 수 있는 파트너'를 찾아 장기적인 이익을 극대화하는 데 있기 때문이다.

헨더슨의 '무조건 협력'은, "나는 당신을 절대 배신하지 않겠다"는 가장 순수하고 강력한 신호를 끊임없이 발산하는 '등대'와 같다.

이 빛을 보고 수많은 배신자들 속에서 숨어있던 또 다른 협력자가 그를 찾아낼 수만 있다면, 두 사람은 (협력, 협력)이라는 게임 전체에서 가장 '엘레강트'한 결과를 영원히 누릴 수 있게 된다.

그 과정에서 발생하는 손실은, 이 위대한 파트너십을 찾기 위한 어쩔 수 없는 '수업료'인 셈이다.


3. 로이드 포저의 '팃포탯'-눈에는 눈, 이에는 이

image.png?type=w466
image.png?type=w966

도노반의 극단적인 불신과 헨더슨의 숭고한 신뢰. 이 양 극단 사이에 주인공 로이드 포저(황혼)가 있다.

그의 방식은 반복 게임에서 가장 성공적이라고 알려진 '팃포탯(Tit-for-Tat)' 전략이다.

이 전략의 규칙은 충격적일 만큼 단순하다.

"일단 협력하고, 그 다음부터는 상대방이 바로 전에 했던 행동을 그대로 따라 한다."

최고의 요원에겐 복잡한 계산도, 깊은 심리전도 필요 없다. 그저 상대방이라는 거울에 나를 비출 뿐이다.

그런데 이 지극히 단순한 규칙이, 분석해보면 놀랍게도 네 가지의 강력한 미덕을 만들어낸다.


첫째, 먼저 배신하지 않는 '선량함'이다.

팃포탯의 첫 수는 언제나 '협력'이다. 로이드 포저가 스파이 '황혼'의 냉철함을 숨긴 채, 늘 친절한 정신과 의사로 자신을 소개하는 것처럼 말이다.

이는 불필요한 적을 만들지 않고, 협력적인 파트너(예를 들어 헨리 헨더슨)을 만났을 때 함께 이익을 극대화할 수 있는 가장 효율적인 첫 수다.


둘째, 즉각적으로 응징하는 '보복성'이다.

로이드의 선량함은 결코 순진함이 아니다.

상대가 '배신'의 칼을 뽑는 순간, 정신과 의사 로이드 포저는 황혼으로 바뀌어 다음 라운드에 즉각적이고 정확한 보복을 가한다.

이는 상대방에게 "나는 결코 만만한 상대가 아니다"라는 명확한 메시지를 보내 미래의 추가적인 배신을 억제하는 효과를 낳는다.


셋째, 언제든 다시 협력하는 '관대함'이다.

냉철한 스파이 '황혼'에게는 감정적인 증오 따위 사치이다.

상대가 보복을 받고 다시 협력의 자세로 돌아온다면, 팃포탯은 언제 그랬냐는 듯 임무를 위해 다음 턴에 다시 협력의 손을 내민다.

이 '관대함'은, 한 번의 실수로 인해 서로가 영원히 보복만 하는 '죽음의 소용돌이'에 빠지는 것을 막아준다.


넷째, 누구나 이해할 수 있는 '명료성'이다.

이 모든 과정은 상대방에게 아주 명확한 '게임의 규칙'을 학습시킨다.

"나에게 협력하면 나도 협력한다. 나를 배신하면 나도 배신한다."

이 단순하고 명료한 신호는, 상대방이 장기적으로 협력하는 것이 왜 더 나은 선택인지를 분명하게 보여준다.


결국 로이드 포저의 '팃포탯'은 도노반처럼 스스로를 고립시키지도, 헨더슨처럼 무방비하게 착취당하지도 않으면서 장기적으로 가장 안정적인 성공을 거두는 현실적이면서도 쉬운, 그러나 강력한 전략이 된다.


4. 요르 브라이어의 '트리거'

image.png?type=w966
image.png?type=w466

한편 세상에는 '게임' 그 자체를 이해하지 못하는 플레이어도 있다.

그들은 계산하고 예측하는 대신 그저 자신의 본능과 신념에 따라 움직일 뿐이다.

그리고 때로는 그런 플레이어가 게임판 자체를 찢어버리기도 한다. 바로 '가시공주' 요르 브라이어처럼 말이다.

그녀의 방식은 반복 게임 전략 중 가장 단호한 모델인 '트리거 전략(Trigger Strategy)'. 규칙은 단 하나다.

"평소에는 완벽하게 협력한다. 하지만, 상대가 단 한 번이라도 '배신'을 저지르면, 게임이 끝날 때까지 영원한 보복을 가한다."

그녀의 전략은 '팃포탯'처럼 주고받는 상호작용이 아니다.

오히려 둥지를 지키는 맹수와도 같은 '영역 방어'에 가깝다.

평소의 요르는 누구에게나 상냥하고, 심지어 자신을 이용하려는 사람에게도 협력하려는 모습을 보인다. 그녀의 디폴트 값은 '협력'이다.

그러나 조국 오스타니아에 위협이 되거나, 아냐를 포함한 가족들에게 위협이 된다면 어설픈 요르는 사라지고, '가시공주'가 당신을 영원히 쫓는다.


로이드의 보복이 '괜히 수작부리지 말고 서로 적당히 잘해봅시다'는 스파이의 수법이라면,

요르의 응징은 트리거가 눌리는 순간 '당신에게 적당한 수준의 응징은 없다'는 암살자의 방식이다.

거기에는 용서도, 관용도 존재하지 않는다. 배신에 대한 그녀의 대응은, 게임이 끝날 때까지 영원히 지속되는 '무한 보복'이다.

이 '트리거 전략'이 뿜어내는 공포는, 그 어떤 계산적인 플레이어도 감히 선을 넘을 수 없게 만드는 궁극의 억제력으로 작용한다.

그것은 관계를 유연하게 관리하는 전략이 아니라 가장 소중한 것을 지키기 위한 최후의 방어선과도 같은, 비장하고도 순수한 생존 방식인 셈이다.


자. 그렇다면 이론적으로 말고, 실제로 저 전략들의 효용을 계산해보자.


'현실'을 위해 각 플레이어를 5명으로 복제해보자. 팃포탯(로이드) 5명, 트리거(요르) 5명, 무조건 배신(도노반) 5명, 무조건 협력(헨더슨) 5명.

규칙은 간단하다. 총 20명의 플레이어가 서로와의 10라운드 게임을 한다.

보수행렬은 쉽게 (협력,협력)에 각각 3점, (협력, 배신) 시 배신자 5점, 협력자 0점, (배신, 배신) 시 각각 1점으로 가정한다.

이제 각 플레이어 1명의 입장에서, 나머지 19명(자신과 같은 유형 4명, 다른 유형 15명)과 10라운드씩 게임을 했을 때의 총점을 계산해 보자.




1. 로이드 (팃포탯) 1명의 총점

vs 다른 로이드 4명: (협력, 협력) 10라운드 → 30점 x 4명 = 120점

vs 요르 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 헨더슨 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 도노반 5명: 1R(0점) + 9R(각 1점) = 9점 x 5명 = 45점


▶ 로이드 최종 총점: 120 + 150 + 150 + 45 = 465점

2. 요르 (트리거) 1명의 총점

vs 다른 요르 4명: (협력, 협력) 10라운드 → 30점 x 4명 = 120점

vs 로이드 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 헨더슨 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 도노반 5명: 1R(0점) + 9R(각 1점) = 9점 x 5명 = 45점


▶ 요르 최종 총점: 120 + 150 + 150 + 45 = 465점


3. 도노반 (무조건 배신) 1명의 총점

vs 다른 도노반 4명: (배신, 배신) 10라운드 → 10점 x 4명 = 40점

vs 로이드 5명: 1R(5점) + 9R(각 1점) = 14점 x 5명 = 70점

vs 요르 5명: 1R(5점) + 9R(각 1점) = 14점 x 5명 = 70점

vs 헨더슨 5명: (배신, 협력) 10라운드 → 50점 x 5명 = 250점


▶ 도노반 최종 총점: 40 + 70 + 70 + 250 = 430점


4. 헨더슨 (무조건 협력) 1명의 총점

vs 다른 헨더슨 4명: (협력, 협력) 10라운드 → 30점 x 4명 = 120점

vs 로이드 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 요르 5명: (협력, 협력) 10라운드 → 30점 x 5명 = 150점

vs 도노반 5명: (협력, 배신) 10라운드 → 0점 x 5명 = 0점


▶ 헨더슨 최종 총점: 120 + 150 + 150 + 0 = 420점


최종 순위 및 결론


제목 없음.png


결과를 살펴보면 가장 충격적인 사람은 도노반 데스몬드다.


그의 점수 대부분은 선량한 헨더슨을 배신하는 데서 나왔는데, 본인과 같은 전략을 쓰는 서로에게서 이득을 못 보고 로이드와 요르는 쉽게 당해주지 않은 결과, 최종 점수는 '바보같은 전략을 쓰는' 헨더슨과 별 차이도 나지 않는다.

심지어 국제 관계에서는 숭고한 헨더슨이 존재할 리 만무함을 고려하고, 뭐 눈에는 뭐만 보이는 것처럼 그는 불신으로 가득 찬 본인-과 똑같은 상대 국가와 마주하며 (배신,배신)의 늪에서 공멸할 것을 생각한다면...


이것이 바로 이전 포스트에서 다루었던 도노반의 전쟁론이 틀린 이유다.


SHORT MISSION

하지만 이 합리적인 계산과 별개로, 현실의 전쟁과 딜레마는 아직도, 혹은 영원히 존재한다.

방금의 시뮬레이션이 옳다면 왜 세상은 여전히 불신과 배신으로 가득 차 있을까?

아쉽게도 전쟁은 그렇게 단순하지 않고 현실은 언제나 합리적이지는 않기 때문이다.

도노반 또한 우리가 설명한 단순한 계산만으로 그런 전쟁관을 가진 것이 아니다.

우리가 처한 '남한과 북한'의 게임을 생각해 보자.

이 게임이 비극적인 이유는, 애초에 두 플레이어의 '승리 조건'이 다르기 때문이다.


한쪽(남한)은 '모두의 번영'을 목표로 하지만, 다른 한쪽(북한)은 '체제 유지와 상대의 굴복'을 목표로 한다.


이 경우, 반복 게임이고 뭐고 북한의 우월전략은 '배신-군비 증강'에 고정된다.

우리가 최선이라 가정했던 (협력,협력)-즉 평화는 체제의 붕괴 위험을 더하며 북한에게는 '상호 이득'이 아니게 되어버리기 때문이다.

게다가 반복게임의 새로운 변수, '평판'도 북한에게는 의미있지 않다.

위의 이론에 따르면 국제사회의 신뢰를 잃은 북한은 다른 국가와의 관계에서 최고의 결과를 만들어내지 못하는 손해를 부르지만, 과연 그럴까?

북한의 목표는 오직 '체제 유지 및 남한의 붕괴'이기에 국제적 응징은 그들에게 닿지 않는다.

북한이 원하는 건 오직 상대인 남한과의 1대1 승리.

반면 남한은 '세계적 협력 관계 유지, 자국민 번영과 더불어 북한에게 승리'를 모두 달성해야 하는데, 북한이 '국제적 응징'을 맞는다면 한민족인 북한의 국민을 위해 경제적 지원까지 해줘야 한다.


결국 이 게임은 합리적인 '반복 게임'이 아니라, 한쪽이 상대의 인도주의를 인질로 잡고 있는 '불합리한 인질극'이 되어버린다.

이처럼 이론마저 무력해지는 냉혹한 현실 앞에서 우리는 무엇을 할 수 있을까? 결국 다시, 도노반의 전쟁론이 정답이었던 걸까?


하지만 어쩌면 이에 대한 가장 인간적이고 엘레강트한 해답은 그 도노반 데스몬드 본인이 은사 헨더슨과 나눈 대화로 이미 언급했을지 모른다.


(스파이 패밀리 99화 중)

학창 시절 도노반 데스몬드 : 실례지만 선생님은 바보에요. 인간은 어리석어서 기대할 가치가 없다고 선을 그었어야 합니다.
헨리 헨더슨 : 그러면 너무 재미없지 않을까 데스몬드?
그렇게 포기해버리면 인간의 역사는 거기서 끝이야.
내 장래의 일자리도 없어져 버리겠지.
도노반 : 그건 곤란합니다. 선생님의 수업은 재미있으니까요.

이미지 출처 : 만화 <스파이 패밀리> © Tatsuya Endo / Shueisha, 한국판 (주)학산문화사

모든 저작권은 원작자(Tatsuya Endo), 출판사(Shueisha), 국내 퍼블리셔(학산문화사)에 있습니다. 이 글은 비평과 교육을 목적으로 해당 작품을 인용하였습니다.




작가의 이전글전쟁은 왜 없어지지 않을까