brunch

매거진 이기적 유전자

라이킷 16 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by Andy강성 Mar 23. 2024

이기적 유전자 (7)

제12장 마음씨 좋은 놈이 일등한다

제12장 마음씨 좋은 놈이 일등한다
(Nice guys finish first)

마음씨 좋은 놈, 마음씨 나쁜 놈

“마음씨 좋은 놈이 꼴찌한다.(Nice guys finish last)” 이 문구는 야구세계에서 유래된 것 같다*.

* 이 말은 처음 미국 야구단 'Brooklyn Dodgers'의 manager인 Leo Durocher가 했던 말이다. 당시 같은 뉴욕을 근거로 하는 경쟁 구단인 뉴욕 자이언츠는 그 구단에서만 선수 생활을 했던 전설적인 타자 멜 오트(Melvin Thomas Ott)가 매니저를 맡고 있었는데, 그는 여유있는 스타일로 구단을 운영하기로 유명했다. 그런데 뉴욕 자이언츠가 1946년에 꼴찌를 하자 Leo Durocher가 “마음씨 좋은 놈이 꼴찌한다.(Nice guys finish last)”라고 비꼬았다고 한다.

미국의 생물학자 가레트 하딘(Garrett Hardin)은 이 문구를 ‘사회 생물학’ 또는 ‘이기적 유전자학’을 요약하는 메시지로 사용했다.

[출처 구글 이미지]

다윈주의의 말로 바꾸면, 마음씨 좋은 놈이란 자기를 희생하면서 동종의 다른 구성원을 도와 이들의 유전자가 다음 세대로 전해지도록 하는 개체다. 따라서 마음씨 좋은 놈은 그 수가 줄어들게 될 것이다. 그가 가진 좋은 마음씨는 다윈주의적인 죽음을 맞이하게 된다.

그러나 ‘마음씨 좋은’이라는 말에는 또 다른 전문 용어로서의 의미가 있고 그 정의를 채택한다면 마음씨 좋은 놈이 일등이 될 수도 있다. 이 장은 이러한 낙관적인 결론에 관한 것이다.

미국의 정치학자 로버트 액설로드(Robert Axelrod)는 도킨스의 ‘호혜적 이타주의’(원한자, 청소어, 개미의 공생 등)에 ‘죄수의 딜레마(prisoner’s Dilemma)’ 이론을 접목하여, 많은 야생 동식물이 진화의 긴 시간 동안 죄수의 딜레마 게임을 끊임없이 해 오고 있다고 주장한다.

[액설로드 사진과 그의 저서 출처 구글 이미지]

죄수의 딜레마

이 게임은 ‘물주’가 한 사람 있고 내가 당신과 게임을 하여 물주가 판정에 따라 이득을 지불한다. 각자 손에 협력과 배신 카드 한 장씩 들고 있다. 두 장의 카드 중 하나를 골라 상대방과 동시에 패를 낸다. 각자 낸 카드가 어떤 것인가에 따라 가능한 결과는 네 가지가 된다.

결과 1 : 양쪽이 모두 ‘협력’ 카드를 내면 물주는 양쪽에 3백 달러를 지불한다. 이를 상호 협력의 ‘포상’이라고 한다.

결과 2 : 양쪽이 모두 ‘배신’ 카드를 내면 물주는 벌로서 양쪽 모두에게 벌금 10달러를 징수한다. 이것은 상호 배신의 ‘벌’이라고 한다.

결과 3 : 당신이 ‘협력’ 카드를, 내가 ‘배신’ 카드를 냈을 때 물주는 나에게 5백 달러를 지불하고(‘배신의 유혹’) 당신(봉)에게 벌금 1백 달러를 징수한다.

결과 4 : 당신이 ‘배신’ 카드를, 내가 ‘협력’ 카드를 내면 물주는 당신에게 5백 달러의 ‘유혹’ 이득을 지불하고 봉인 나에게 벌금 1백 달러를 징수한다.

* 이 게임이 작동하기 위해서는, 1) 배신의 유혹은 상호 협력에 대한 포상보다 커야 하고(500 > 300), 2) 상호 협력에 대한 포상은 상호 배신의 벌보다 커야 하며(300 > -10), 3) 상호 배신의 벌은 봉이 뜯기는 양보다 나은 것이어야 한다(-10 > -100). 또한 4) 배신의 유혹과 봉이 뜯기는 양의 평균이 포상을 초과해서는 안 된다(500 + -100 /2 < 300).

당신이 '배신' 카드를 낸다면 나는 무조건 '배신' 카드를 내야 이득이다. 상호배신이면 벌금 10달러를 낸다. 상대가 '배신'인데 내가 '협력'카드를 내면 벌금 100달러를 내야 한다. 100달러 내는 것보다 10달러 내는 것이 더 이득이다.

당신이 '협력' 카드를 낸다 해도 나는 무조건 '배신' 카드가 이득이다. 내가 '배신' 카드를 내면 5백 달러를 받는데, '협력' 카드를 내면 3백 달러만 받는다. '협력'보다 '배신' 카드를 내는 것이 이익이다. 따라서 무조건 나는 배신 카드를 내야 한다. 상대방 역시 마찬가지다.

그러나 문제는 그리 간단하지 않다. 왜냐하면 둘은 모두 상호 '협력' 카드를 내면 3백 달러의 보상이 주어진다는 것을 알기 때문이다. '배신' 카드가 가장 좋은 방책이다. 그러나 두 사람이 협력하면 각자보다 큰 이익을 얻을 수 있다.

이 게임은 원래 두 명의 죄수라는 가상의 예에서 유래한다. 이들은 두 건에 대하여 기소되어 한 건은 증거가 충분하지만 다른 한 건의 증거가 부족한 상황이고 각각 독방에서(서로 소통하지 못하도록) 공범자에 대하여 불리한 자백을 하여 동료를 배신하도록(그 경우 증거가 충분한 건까지 용서해 주기로) 사주받았다.

양쪽이 모두 부인하면 증거가 충분한 건에 대해서만 약한 형량을 받고, 한쪽이 자백하고 다른 쪽이 부인하면 부인한 쪽은 가중 처벌되며, 모두 자백하면 두 건 모두 처벌을 받지만 둘 다 감경된 형을 받게 되는 상황이다.

양쪽 모두 상대가 무엇을 하든 자기 자신은 상대를 ‘배신’ 즉 자백하는 것 이상으로 좋은 방책이 없는 것을 잘 알고 있다. 그러나 만일 두 사람이 협력하면 각자보다 큰 이익을 얻을 것이라는 것도 알고 있다. 그러나 상대가 어떻게 나올지 알 수 없기 때문에 최종적으로 이 게임은 상호 배신으로 끝날 운명인 것이다.

[죄수의 딜레마 형량표 출처 한겨레신문과 구글 이미지]

반복된 죄수의 딜레마

이 반복 게임은 경기자 두 명이 위에서 이야기한 단순 게임을 무한정 반복하는 게임이다. 이번에는 한 번으로 끝나지 않고 또다시 카드를 집어서 다음 게임에 임한다. 몇 번 게임을 반복함으로써 우리는 서로에게 신뢰 또는 불신을 쌓고, 보복하거나 회유할 기회를 갖는다. 중요한 것은 무한정 계속되는 게임에서 우리가 서로에게 손해를 입히지 않고 오히려 물주에게 손해를 입힘으로써 둘 모두가 승자가 될 수 있다는 점이다.

게임을 열 번 반복한 뒤 이론적으로 최대 5천 달러를 얻을 수 있지만 그것은 상대가 터무니없이 어리석거나 살신성인하여 내가 항상 배신하고 있는데도 매번 ‘협력’ 카드를 낼 경우에 그렇다.

보다 현실적으로는 열 번의 게임에서 모두 ‘협력’ 카드를 냄으로써 물주의 돈 3천 달러를 손에 넣는 것이 더 쉽다. 우리는 현재까지 상대가 냈던 패를 통해 상대를 신뢰할 수 있는지 여부를 짐작할 수 있기 때문에 살신성인할 필요가 없다. 실제로 우리는 서로의 행동을 단속할 수 있는 것이다.

또 하나 가능성이 높은 것은 우리 중 누구도 상대를 신뢰하지 않는 것이다. 즉 둘 모두가 열 번의 게임 모두 ‘배신’ 카드를 내 물주가 우리로부터 각각 1백 달러를 얻게 하는 것이다. 이 중에서 가장 가능성이 높은 것은 우리가 서로 어느 정도 상대를 신뢰하고 ‘협력’과 ‘배신’ 카드를 어느 정도 번갈아 내 최종적으로 중간 금액을 얻는 것이다.

10장에서 다룬 서로의 깃털에서 진드기를 잡아주는 새들은 일종의 반복된 죄수의 딜레마 게임을 하고 있었다. 도움을 받은 새가 훗날 친구에게 도움을 갚아야 하는 것은 당연하다.

그러나 만일 새가 자신의 시간과 에너지를 아끼기 위해 속이고 도망칠 수 있다면 그 새는 비용을 치르지 않고 그 이익을 모두 얻을 수 있으므로 그러한 유혹도 당연히 존재할 것이다. 양자가 배신하면 남의 진드기를 애써 잡아 주면서 자신은 진드기에 뒤덮여 있는 경우보다 나쁘지는 않을 것이다.

이것을 생각하면 할수록 인간의 생활뿐만 아니라 동물과 식물, 심지어 박테리아까지도 모두 반복된 죄수의 딜레마 게임을 하고 있다는 사실을 알게 될 것이다. 여기서 반복이 왜 중요한가에 대해 더 자세히 검토를 해보자.

여러 가지 전략

배신만이 유일한 합리적인 전략인 '단순 게임'과 달리 '반복 게임'은 다수의 전략적 선택의 여지를 제공한다. 액설로드는 게임 이론 전문가들이 제안한 14가지의 전략에 ‘랜덤(Random)’이라는 15번째 전략을 추가해서 각 전략의 조합을 225가지(15 ×15)로 정리했다.

그리고 각각의 대전에서 200회의 승부가 끝나면 점수를 총계해서 승자를 정하고 어떤 전략이 15개 상대와의 대전 모두를 합계했을 때 최대의 ‘돈’을 누적하는지에 대해 컴퓨터 프로그램으로 산출해 보았다.

[엑셀로드의 컴퓨터 토너먼트로 내가 얻은 이득 347쪽]

하나의 전략이 달성할 수 있는 최고 점수는 15,000점(매회 5점씩 200회)이고 가능한 최저 점수는 0이다. 평균 점수는 600점(3점씩 200회), 즉 두 경기자 모두 계속 협력하는 경우보다는 훨씬 점수가 낮을 것으로 예상되었고 실제로 평균 점수가 600점을 넘는 전략은 없었다.

’이에는 이, 눈에는 눈‘과 ‘순진한 시험꾼’

많은 교묘한 전략들이 제안되었지만 승리를 거둔 전략은 놀랍게도 가장 단순하고 가장 덜 교묘해 보이는 전략이었는데, 그것은 '이에는 이, 눈에는 눈(Tit for Tat' (앞으로 줄여서 ‘TFT’라 한다) 전략이었다. TFT는 최초의 승부는 협력으로 시작하고 그 이후에는 단순히 상대의 앞 수를 흉내 낸다. 양쪽이 모두 TFT인 경우 양자 모두 협력으로 시작하면 양쪽 모두 게임이 끝날 때까지 ‘협력’을 계속하여 600점이라는 ‘기준’ 점수의 1백 퍼센트를 얻게 된다.

[Tit for Tat 출처 Thesaurus, Deepstach]

순진한 시험꾼

‘순진한 시험꾼(Native Prober)’은 기본적으로 TFT다. 10회 게임을 한다고 하면 순진한 시험끈은 한 번 정도는 이유 없이 배신을 하여 배신으로 인한 높은 점수를 받게 된다. 그러나 다음 게임에서는 상대방이 배신을 선택한다. TFT는 배신당하면 자신도 배신하기 때문이다.

그에 반해 순진한 시험꾼은 다시 TFT로 돌아가서 앞에서 상대방이 내민 패를 그대로 따라 하기 때문에 협력을 선택한다. 그리고 이후로는 서로 협력과 배신이 반복된다. 결과적으로 둘은 둘 다 TFT일 때보다 약간 낮은 점수(5점과 0점의 평균인 2.5점)를 획득하게 된다.

후회하는 시험꾼

후회하는 시험꾼(Remorseful Prober)은 순진한 시험꾼과 비슷하다. 하지만 자신의 배신에 대한 후회로 상대방에게 '한 번의 자유로운 선택'을 허용한다. 즉 내 배신의 결과로 다음 게임에서 상대방은 배신을 선택할 것이다.

나는 그 배신에도 불구하고 후회의 대가로 다음 게임에서 배신이 아닌 협력을 선택한다. 이렇게 하면 둘 다 협력을 하는 원래 상태로 돌아간다. 이 경우는 순진한 시험꾼보다 TFT와의 승부에서 더 높은 점수를 얻지만 둘 다 TFT일 때보다는 낮은 점수를 얻는다.

참가한 전략 중 어떤 것은 후회하는 시험꾼과 순진한 시험꾼의 전략보다 세련되지만 단순한 TFT보다는 평균적으로 낮은 득점에 그치며, 모든 전략(랜덤을 제외하고) 중에서 가장 성공률이 낮았던 것은 가장 복잡한 전략이었다.

액셀로드에 따르면 가장 중요한 범주는 '마음씨 좋은' 전략군이다. 마음씨 좋은 전략은 먼저 배신하는 일이 결코 없는 전략으로 정의된다. TFT가 그 일례인데, 이 전략은 배신할 수 있기는 하지만 보복으로서만 배신한다.

참가한 15개의 전략 중 8개는 마음씨 좋은 전략이고 TFT가 평균 504.5점(600점의 84퍼센트)을 얻었는데 이들은 그 보다 조금 낮은 83.4퍼센트에서 78.6% 사이의 점수를 얻어 모두 득점이 높은 상위 8위를 차지했다(못된 전력 중 최고는 66.8퍼센트이었다). 결국 이 게임에서는 마음씨 좋은 놈이 성공하는 것이 꽤 설득력 있는 것으로 확인되었다.

관대

액셀로드가 사용한 또 하나의 전문 용어는 ‘관대(forgiving)’다. 관대한 TFT 전략은 보복하는 일은 있으나 단기의 기억밖에 없다. 배신자에 대해 그 즉시 가볍게 벌하고 그 후에는 과거를 씻은 듯이 잊는다.

그렇다면 관대(용서) 하지 않고 끝까지 기억하는 ‘형식상 원한자’의 점수는 어떨까? 계산에 의하면 마음씨 좋은 전략 8가지 중 끝에서 두 번째의 점수를 얻었다. 이유는 '후회하는' 전략일 경우에도 상호 보복의 연쇄를 없애지 못했기 때문이다.

TFT보다 더 관대한 전략도 있다. ‘두 번은 봐준다(Tit for Two Tats, TFTT)’는 전략은 상대가 연거푸 2번 배신하는 것을 용서하고 나서 보복하는 전략이다. 이 역시 승리를 거둔다. 상호 보복의 연쇄를 잘 피할 수 있기 때문이다.

2번째 토너먼트

액셀로드는 추가로 다양한 전략을 제안 받아 2번째 토너먼트를 시행했다. 이번에는 전략을 63개로 참여하게 하고 한 게임당 승부를 200회로 고정하지 않았다.

이번에도 TFT가 승자가 되었고 상위 15위 중 하나만 제외하면 모두 마음씨 좋은 전략이고 하위 15위 중 하나만 제외하면 모두 못된 전략이었다.

그런데 TFTT는 2번째 토너먼트에서는 비교적 하위 순위에 머물렀다. 이번 토너먼트에는 그와 같이 솔직한 약자를 무정하게 짓밟을 수 있는 더 미묘한 못된 전략이 포함되어 있었기 때문이다.

이후 액설로드는 도킨스의 권유로 해밀턴을 만났고 두 사람의 ESS적 접근 방식을 도입한 연구 결과가 공동 논문으로 1981년에 <사이언스>지에 발표되고 전미 과학진흥협회의 ‘뉴콤클리브랜드상(Newcomb Cleveland Prize)’을 수상했다고 한다.

ESS적 접근 방식

ESS적 접근을 액설로드가 두 토너먼트에 적용한 ‘리그전 방식’과 비교해 보자. 리그전 방식이란 각각의 전략이 다른 전략들과 돌아가면서 모두 대전하는 방식이다. 한 전략의 최종 득점은 다른 전략 모두와의 대전에서 획득한 점수의 총계다. 따라서 리그전 방식에서는 모든 다른 전략에 잘 대항해야 한다(이를 액설로드는 '강건하다(robust)'고 표현한다).

그런데 사람들이 제출했던 일련의 전략들은 제멋대로인 임의의 전략들이었고, 특히 거의 모두가 우연히 못된 전략이었다면 TFT는 최종적으로 이기지 못했을 것이다(즉 강건하지 않은). 이 환경은 TFT에게 맞지 않았을 것이다. 이 자의성을 줄일 수 있는 것은 ‘ESS적 사고’를 통해서다.

ESS의 중요한 특징은 어떤 전략이 전략들의 집단 내에서 다수를 점하고 있을 때 계속 좋은 성적을 얻게 된다는 것이다. 말하자면 TFT가 ESS라는 것은 TFT가 우위를 점하는 환경에서는 TFT가 계속 잘해 나갈 것이라는 것을 의미하고 이것을 일종의 ‘강건함’으로 간주할 수 있다.

다윈주의자들에게 성공적인 전략은 전략가들의 집단 내에서 그 수가 많은 것들이다. 어떤 하나의 전략이 계속 성공하기 위해서는 그 전략이 다수일 때, 즉 자기 자신의 사본이 많은 환경에서 특히 잘 되어야 한다.

액설로드는 '3번째 토너먼트'를 자연 선택이 행하는 식으로 실시하여 ESS를 구하려고 했다. 그는 63가지 전략을 컴퓨터에 입력해 '제1세대'를 만들었다. 그리고 이 1세대의 게임 결과를 돈이나 점수가 아닌 부모와 동일한 자손의 수로 산출되었다.

세대가 지나면서 어떤 전략은 그 수가 점점 줄어들고, 어떤 전략은 점점 수가 많아진다. 따라서 전략의 비율이 변하면서 다음 단계의 게임이 펼쳐질 환경도 변하게 된 것이다. 이렇게 대략 1천 세대를 경과하면 더 이상 비율이나 환경이 변하지 않는 안정 상태에 도달한다. 그리고 살아남는 전략은 TFT처럼 '마음씨가 좋으면서도 분개할 줄 아는' 전략이었다.

그러나 TFT가 ESS라고 볼 수는 없다. TFT가 못된 전략의 침입에 영향을 받지 않지만 다른 '마음씨 좋은 전략'의 침입은 막을 수 없기 때문이다. 또한 세계가 마음씨 좋은 상태에 있다면 TFT가 ESS라고 할 수 있다고 생각할지 모른다.

그러나 TFT와 달리 항상 협력하는 전략은 항상 배신하는 전략처럼 못된 전략의 침입에 대해 안정적이지 못하다. 항상 배신하는 전략은 항상 협력하는 전략을 이긴다. 따라서 세계가 항상 마음씨 좋은 상태에 머물러 있으리라는 보장은 없다.

하지만 비록 TFT가 진짜 ESS는 아니지만, 기본적으로 마음씨가 좋으면서도 보복적인 TFT와 유사한 전략들의 혼합 전략이 실제로 ESS에 해당한다고 보는 것은 아마도 적절할 것이다. 이후 로버트 보이드(Robert Boyd)와 제프리 로버바움(Jeffrey Lorberbaum)은 TFTT와 ‘의심 많은 TFT’의 혼합 전략을 고찰하였다.

그들은 TFT의 집단은 "TFTT와 의심 많은 TFT의 혼합" 전략의 침입에 영향을 받으며 이 둘은 서로 공존하면서 번영한다는 것을 보여 주었다. 이것은 인간 생활에서 흔히 볼 수 있는 측면들을 반영하는 것으로 보인다.

액셀로드는 TFT가 ESS가 아님을 인식하고 있었다. 그래서 '집단적으로 안정한 전략(collectively stable strategy)'이라는 표현을 만들어냈다. 즉 하나의 전략이 아니라 동시에 둘 이상의 전략이 집단적으로 안정할 수 있다는 것이다. 이를 쌍안정(bistable)의 시스템으로 간주할 수 있다.

혈연관계

서로 닮은 개체끼리 도대체 어떻게 뭉치고 국소적 집합을 이룰 수 있을까? 자연계에서 이는 유전적인 인연, 즉 혈연을 통해서 이루어질 수 있다.

대개의 동물 종은 집단 내 임의의 개체와 가까이 자기의 형제자매, 조카 등과 가까이 살고 있다. 반드시 개체의 선택을 통해서 그렇게 되는 것은 아니다. 집단 내의 '점성(viscosity)'(각 개체가 출생 장소 근처에서 살려는 경향)을 통해 자동적으로 그렇게 되는 것이다.

혈연관계인 개체들은 단순히 용모뿐만 아니라 그 밖의 모든 종류의 사항에서도 닮는 경향이 있다. 그리하여 집단 전체로 보면 TFT가 드물더라도 국소적으로는 그 수가 많을 수 있다. 일정한 지역에서는 TFT 개체들이 상호 협력하여 번영할 정도로 충분히 자주 만날 수 있다.

TFT 집단은 지역 집단에서 매우 커져서 항상 배신하는 개체가 우세하던 지역에까지 퍼질 수 있다. 그러나 항상 배신하는 전략은 진짜 ESS인데도 불구하고 지역적인 소집단을 형성하여 다수가 되는 임계점을 넘을 수 없다. 항상 배신하는 개체들의 지역 집단은 서로의 존재에 의해 번영하기는커녕 서로를 공격하기 때문에 아주 죽을 쑤게 된다.

여기서 액설로드의 또 하나의 전문 용어를 소개한다. TFT는 ‘시샘하지도 않는다(not envious)’. 이 의미는 상대가 당신과 같은 돈을 얻었다고 해도 두 사람 모두 많은 금액을 물주로부터 얻을 수 있는 한 완전히 만족한다는 의미다. TFT는 기껏 잘돼야 상대방과 비길 뿐이다. 그러나 각각의 비기는 게임에서 고득점을 얻게 된다.

그러나 슬프게도 현실의 인간 사이에서는 거의 모든 경기자들이 ‘시샘의 유혹’에 빠져 상대적으로 적은 금액밖에 얻지 못한다. 별생각 없이 많은 사람들은 상대방과 협력하여 물주를 공격하기보다 상대방을 공격하려고 한다. 액셀로드의 연구는 이것이 실수라는 것을 보여준다.

영합 게임과 비영합 게임

게임은 한쪽의 승리가 상대편의 패배로 귀결되는 영합게임(zero-sum game)과 두 선수가 함께 어깨동무를 할 수 있는 비영합 게임(non zero-sum game)으로 구분된다. 체스는 영합게임이다. 반면 ‘죄수의 딜레마‘는 물주가 있고 두 선수가 어깨동무를 하고 끝까지 물주를 뜯어내는 것이 가능하기 때문에 비영합 게임이다.

민사 분쟁

민사 ‘분쟁’이라고 하는 것에는 실제로 크나큰 협력의 여지가 남아 있는 경우가 흔하다. 영합 대립으로 보이는 것에 약간의 선의를 보태면 쌍방에 이익을 주는 비영합 게임으로 바꿀 수 있다.

이혼을 생각해 보자. 좋은 결혼은 분명히 상호 협력이 가득한 비영합 게임이다. 그러나 결혼에 실패하더라도 두 사람이 상호 협력을 계속하여 이혼까지도 비영합 게임으로 만듦으로써 이익을 얻을 수 있는 요소는 얼마든지 있다.

그러나 이혼 소송을 하게 되면 영합 게임이 된다. 남편과 부인은 서로를 이기기 위해 막대한 소송 비용을 부담한다. 이익을 보는 것은 변호사들 뿐이다. 이혼 소송은 의뢰인에게는 영합 게임이지만 변호사에게는 비영합 게임이다.

축구 경기

축구는 일종의 영합 게임이다. 그러나 때로는 비영합 게임이 될 수도 있는데, 1977년 영국 축구 리그전에서 일어났다. 당시 1부 리그에서 강등당할 위기에 있는 3팀(선더랜드와 나머지 2팀)이 경기를 진행하였는데, 선더랜드는 4위 팀과 경기를 갖고 나머지 두 팀은 서로 맞붙게 되었다. 선더랜드가 지면 나머지 두 팀은 비기기만 해도 잔류가 가능해지는 상황이었다.

당시 두 팀의 경기가 동시에 진행되었어야 함에도 불구하고 나머지 두 팀의 경기가 5분 늦게 시작되었다. 그로 인해 나머지 두팀의 경기가 치열하게 2:2로 접전 중인 상태에서 3분 정도 남은 시점에 선더랜드의 패배 소식이 전해지면서 그때부터 그 경기는 갑자기 비영합 게임으로 변해 버렸다.

반복

지금까지 살펴본 것은 모두 게임이 반복된다는 것을 전제로 한 것이다. 선수들은 지금 하고 있는 게임이 최종회가 아니라는 것을 잊어서는 안 된다. 액설로드의 명언처럼 ‘미래의 그림자’는 길어야 한다.

그런데 게임은 대체 얼마나 오랫동안 반복되어야 하는가? 사실 게임에서 중요한 것은 반복의 지속이 아니다. 모든 게임 참여자가 게임이 언제 끝날 지를 몰라야 한다는 것이다.

만약 두 사람이 대전 중이고 두 사람 모두 게임의 횟수가 백 번이라는 것을 알고 있다면 어떻게 될까? 두 사람 누구에게나 최종 라운드에서의 유일한 합리적인 전략은 '배신'이 될 것이다. 따라서 상대방이 최종 라운드에서 배신하리라는 것을 분명히 예측할 수 있다.

그렇게 되면 이제는 99번째 라운드도 1라운드의 게임과 같게 되므로 각각의 경기자에게 유일한 합리적인 선택 역시 '배신'이 될 것이다. 98번째도 같은 논리를 따르게 되고 그 앞의 라운드도 마찬가지다. 게임이 몇 번째에서 끝나도록 정해져 있는지 알고 있다면 배신만 하게 되는 것이다.

게임 참가자는 게임이 언제 끝날 지를 추정한다. 추정치가 길면 길수록 더 마음씨 좋고, 관대하고, 덜 시샘할 것이다. 반대로 추정치가 짧으면 더 못되고 더 시샘하게 될 것이다.

영국군과 독일군

액설로드는 미래의 그림자의 중요성을 나타내는 감동적인 사례로 제1차 세계 대전 중 참호에서 영국군과 독일군은 '우리도 살고 남도 살리자(live-and-let-live)' 운동을 들었다.

크리스마스에 영국과 독일 부대가 중간 지대에서 일시적으로 전투를 중단하고 같이 술을 마신 일은 잘 알려진 사실이다. 비공식적으로 암암리에 ‘우리도 살고 남도 살리자’는 불가침협정이 모든 전선에서 1914년부터 적어도 2년간 착실히 지켜졌다고 한다.

[크리스마스 휴전 기념 동상과 사진 및 기사 출처 구글 이미지]

당시의 참호전에서 개개의 소대에 드리워진 미래의 그림자는 TFT 형태의 협력을 촉진하기에 아주 충분히 길고 막연했다. 상호 협력은 장군의 입장에서는 바람직하지 않은 것이지만 양 진영 병사의 입장에서는 매우 바람직한 것이었다.

이들은 TFT 전략을 따랐다. 상대방이 공격하면 반드시 보복했다. 그러나 양 진영의 일급 사격수들은 적군 병사가 아닌 근처에 있는 무생물의 표적을 쏘아 사격 솜씨를 과시했다. 이는 적군이 배신하면 보복을 당한다는 사실을 일깨워주는 역할을 했다.

[1차 대전 당시의 참호전 출처 구글 이미지]

한편 TFT류 전략의 중요한 특징은 관대하다는 것이다. 이것은 서로에게 상처를 주는 장기간의 상호 보복의 연쇄를 진정시키는데 한몫한다. 그 중요성은 한 영국인 장교의 회상록에 극적으로 표현되어 있다.

내가 A중대 병사들과 차를 마시고 있을 때 매우 시끄러운 소리가 들려 정찰을 나갔다. 아군과 독일군이 각각 낮은 방어벽 위에 서 있었다. 갑자기 일제히 사격이 시작됐으나 사상자는 없었다. 당연히 양 진영 모두 몸을 숙였고 아군 병사들은 독일병에게 욕설을 퍼붓기 시작했다. 그때 갑자기 용감한 독일병 한 명이 방어벽 위로 올라와 “대단히 미안하다. 부상자가 없어야 하는데… 우리 잘못이 아니라 망할 놈의 프로이센 대포 때문이다”라고 외쳤다.

엑설로드는 또 상호 신뢰의 안정된 패턴을 유지하는 데 예측 가능성과 의식도 중요하다고 강조한다. 이에 대한 좋은 사례는 영국군 포병대가 전선의 특정 지점에서 시계처럼 정확하게 정기적으로 행하는 ‘저녁 포격’이다. 한 독일병은 다음과 같이 말하였다.

그것은 7시에 있었다. 너무도 규칙적이어서 그때 시계를 맞출 수 있을 정도였다. 그것은 언제나 같은 표적을 겨누었으며 조준은 정확하여 표적에서 벗어나거나 너무 멀거나 모자라는 일이 결코 없었다. 호기심이 강한 사람 몇몇은 그 포격을 보기 위해 7시 조금 전에 참모 밖으로 나가기도 했다.

액설로드는 그와 같은 “형식적이고 정기적인 발포 의식은 이중의 메시지를 보낸다. 사령부에 대해서는 공격을, 적에게는 평화를 전하고 있다”라고 멋지게 논평한다.

무의식의 전략

도킨스는 지금까지의 논의에 대한 한 가지 오해를 없애고자 한다. 게임 참가자들처럼 의식적인 목표와 전략에 따른 결과라고 보는 오해이다. 도킨스는 이 전략들이 모두 무의식적인 것이라 다시 한번 못박는다.

엑설로드의 프로그램이 제시한 낙관적 결론(시샘 없고 관대하며 마음씨 좋은 전략의 승리)이 자연계에도 그대로 적용되는지 여부에 대해 도킨스는 “예”라고 대답한다. 다만 그 조건은 자연이 때때로 죄수의 딜레마 게임을 설정해야 하고, 미래의 그림자는 길어야 하며, 그 게임이 비영합 게임이어야 한다는 것인데, 이와 같은 조건은 생물계의 도처에서 확실히 충족되는 것이라고 한다.

"박테리아가 의식이 있는 전략가라고 하는 아무도 없겠지만, 기생성의 박테리아는 아마도 숙주와 끝없는 죄수의 딜레마 게임을 하고 있을 것이다. 이들의 전략에 '관대한, 시샘이 없는‘ 등의 형용사를 붙이면 안 되는 이유는 없다."

무화과말벌

액설로드와 해밀턴에 의하면 식물이 복수하는 경우도 있다고 한다. 이것은 분명히 무의식적이다. 무화과는 열매가 아니다. 끝에 작은 구멍이 있고, 그 구멍 속으로 들어가면 안쪽 벽에 수백 개의 작은 꽃이 있다. 말벌은 이 속에 들어가 수분을 하고 알을 낳는다.

무화과말벌이 배신을 한다고 하면 그것은 무화과 속 꽃에 알만 많이 낳고 수분을 거의 하지 않는 것이다. 이런 말벌의 배신에 대해 무화과나무는 수분을 하지 않은 말벌의 알이 들어 있는 무화과를 가지에서 떨어지게 하여 응징한다. 가지에서 떨어진 무화과 속의 말벌 애벌레는 사멸해 버리고 만다.

[무화과와 말벌의 공생 출처 구글 이미지]

농어의 협력과 배신

에릭 피셔(Eric Fischer)는 자연계에서 TFT와 같이 보이는 유별난 예를 암수한몸의 농어에서 발견했다. 암수한몸 농어는 암수 양쪽의 기능을 모두 할 수 있는 개체다. 이들 농어 한쌍은 암수의 역할을 교대로 한다. 이때 수놈 역할을 하는 놈을 선호한다. 수놈의 역할이 지출이 적기 때문이다.

바꿔 말하면 상대방이 대부분의 시간 동안 암컷의 역할을 하도록 설득하는 데 성공한 개체는, 암컷 역할을 하는 쪽이 낳은 알에 투자한 경제적 이익을 모두 얻을 뿐만 아니라, 다른 물고기와 짝짓기 하는 등의 다른 일에 소비할 수 있는 자원의 여유를 갖게 된다.

그래서 농어는 암놈과 수놈의 역할을 번갈아가며 한 번씩 한다. 그런데 한 놈이 수놈의 역할을 한 후에 또 수놈의 역할을 하는 '배신'을 한다. 이러면 상대 농어의 보복이 있다. 다음에 자신이 암컷의 역할을 해야 할 차례가 왔을 때 암컷의 역할을 거부하거나 간단하게 모든 관계를 끝장낼 수도 있다. 피셔는 실제로 성 역할의 분담이 불공평한 쌍이 헤어지는 경향이 있다는 것을 관찰했다.

[암수한몸의 큰입선농어(Barramundi) 출처 구글 이미지]

박쥐의 헌혈

흡혈 박쥐는 필요 이상의 여분의 피까지 잔뜩 빨아먹을 때가 있다. 이때 다른 굶주린 동료 박쥐(혈연이 아닌 경우까지)에게 자신의 먹이를 토해내어 먹도록 한다. 윌킨슨은 이런 '헌혈' 행위를 통해 매우 굶주린 박쥐의 수명을 얼마나 연장할 수 있는지 계산했다. 그리고 이렇게 연장된 수명이 헌혈을 한 박쥐의 사망 확률의 증가와 비교했다.

[흡혈박쥐 출처 구글 이미지]

비교 결과 헌혈 박쥐의 사망 확률 증가에 비해 굶주린 박쥐의 생존 확률 증가가 더 높았다. 이들이 서로를 돕는 협력 전략을 취하고 있다면 헌혈하는 투자를 하여 나중에 자신이 굶주릴 때 받게 될 이익을 보장받는 것이다. 이런 박쥐 간 헌혈 관계는 자신과 가까운 박쥐에게 집중된다. 즉 다른 동굴에서 온 새 친구보다 같은 동굴의 오랜 친구에게 먹이를 더 잘 나눠주는 것이다. 이는 박쥐 간의 협력관계로 설명될 수 있다.

흡혈박쥐는 빅토리아 고딕풍의 공포 문학 애호가에게 공포의 대상이었으나, 이제 기분 좋은 새로운 신화, 즉 서로 나누고 협력하는 신화의 선봉이 될 수 있다. 흡혈박쥐는 이기적 유전자에 지배되면서도 마음씨 좋은 놈이 일등이 될 수 있다는 따뜻한 생각을 퍼뜨릴 수 있을 것이다.

<8편에 계속>

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari