유전자들의 협력 연대기 [Part 2]

[Part 2] 협력의 진화: 이기적 신사들의 승리 전략 (1984)

by 성효경

1976년 도킨스가 남긴 미완의 질문, "이기적인 존재들이 어떻게 혈연을 넘어 협력하는가?"에 대한 답은 생물학자가 아닌 정치학자의 컴퓨터 시뮬레이션에서 시작되었다. 1984년 로버트 액슬로드는 《협력의 진화》를 통해 이기적 존재들이 지배하는 세상에서도 '착함'이 가장 강력한 생존 전략임을 수학적으로 입증하며 도킨스의 미완성 방정식을 풀어냈다.


액슬로드는 유전적 관계가 전혀 없는 개체들 사이에서 협력이 자생적으로 발생하는 과정을 탐구하기 위해 게임이론의 고전인 '죄수의 딜레마'를 도구로 삼았다.

이 게임의 보상 체계는 네 가지 변수로 구성되며, 참가자가 어떤 선택을 하든 상대의 패를 모르는 상태에서 ‘개인에게 가장 유리한 선택’을 하도록 설계되어 있다. 이 보상 구조를 이해하는 것은 이기적 개체가 왜 이타적 협력을 거부하는지 설명하는 핵심 열쇠가 된다.


배신의 유혹(T, Temptation): 나는 배신하고 상대는 협력할 때 얻는 최고점. (5점)

상호 협력의 보상(R, Reward): 둘 다 협력하여 얻는 안정적인 점수. (3점)

상호 배신의 처벌(P, Punishment): 둘 다 배신하여 얻는 낮은 점수. (1점)

호구의 보수(S, Sucker's payoff): 나는 협력하는데 상대가 배신할 때 얻는 최하점. (0점)


이 수치들은 단순한 숫자가 아니라 두 가지 엄격한 수학적 전제를 충족해야 한다.


첫째는 T > R > P > S 이다. 이는 상대가 협력할 때 나도 협력(R=3)하는 것보다 배신(T=5)하는 것이 이득이고, 상대가 배신할 때 내가 협력(S=0)하는 것보다 나도 배신(P=1)하는 것이 낫다는 것을 의미한다. 즉, 상대가 어떤 수를 두든 개인의 입장에서는 ‘배신’이 언제나 우월한 전략이 된다.


둘째는 2R > T + S이다. 이는 두 참가자가 서로 한 번씩 배신을 주고받는 것보다, 계속해서 상호 협력을 유지하는 것이 집단 전체의 총합 면에서 더 유리하다는 조건이다.


여기서 죄수의 딜레마가 가진 비극적 역설이 발생한다. 두 명의 참가자가 각자의 이익을 위해 가장 합리적인 선택(배신)을 내리면, 결과적으로 둘 다 협력했을 때 받을 수 있었던 3점(R) 대신 1점(P)이라는 초라한 보상을 받게 된다. 개인의 합리성이 집단의 최적해를 파괴하는 것이다.


이것이 바로 1976년의 도킨스가 직면했던 거대한 장벽이었다. 유전자가 이기적이라면, 생존 기계들은 서로를 착취하기 위해 배신만을 일삼아야 하며, 그 결과 사회나 협력 같은 고차원적인 시스템은 결코 등장할 수 없어야 한다. 이 냉혹한 수학적 감옥에 '반복'이라는 변수를 넣어 탈출구를 찾아낸 것이 바로 액슬로드의 토너먼트였다.


단 한 번의 만남에서는 배신이 최선일지 모르나, 내일 또 만나야 하는 관계라면 이야기는 달라진다. 액슬로드는 게임이 언제 끝날지 모른다는 전제, 즉 '미래의 그림자'가 길게 드리울 때 이기적 존재들이 어떤 선택을 하는지 지켜보기로 했다. 오늘의 배신으로 얻는 단기적 이득보다, 내일의 보복으로 잃게 될 누적 손실이 더 커지는 환경을 조성한 것이다.


그는 전 세계의 경제학자, 수학자, 정치학자들에게 죄수의 딜레마를 수행할 컴퓨터 프로그램을 공모하며 거대한 시뮬레이션 전장을 마련했다. 제1차 대회에 제출된 14개의 전략은 상대를 기만하기 위해 수천 줄의 코드로 짠 정교한 알고리즘부터 무작위로 수를 던지는 방식까지 다양했다. 하지만 이 치열한 수 싸움에서 승리한 것은 가장 정교한 프로그램이 아닌, 지독할 정도로 단순한 'Tit for Tat(TFT, 눈에는 눈, 이에는 이)'였다.


아나톨 라포포트가 제출한 이 프로그램은 고작 4줄의 코드로 이루어져 있었으며, 첫 수에 협력한 뒤 상대의 직전 선택을 그대로 따라 하는 단순한 논리만으로 무장하고 있었다. 1차 대회의 결과에 의구심을 품은 학자들을 위해 열린 제2차 대회에서는 TFT를 저격하기 위해 62개의 더 영악한 전략들이 모여들었다. 상대의 심리를 역이용하거나 배신을 교묘하게 섞는 고도의 전술들이 투입되었음에도, 승자는 다시 한번 TFT였다. 이는 '똑똑한 이기주의'보다 '신사적인 대응'이 진화적으로 더 강력한 생존력을 가짐을 보여주는 충격적인 결과였다.

액슬로드는 TFT가 수많은 영악한 전략을 제치고 연승을 거둔 비결을 분석해, 진화적으로 성공하는 전략의 특징을 네 가지 키워드로 정리했다.


1. 신사적임(Nice): 결코 먼저 배신하지 않는다. 이는 불필요한 갈등 비용을 원천 차단하여 상호 협력의 평화를 유지한다.

2. 보복성(Provocable): 상대의 배신에는 즉각 응징한다. 무조건 돕기만 하는 '호구'가 되어 집단 내 배신 유전자를 증식시키는 것을 방지하는 핵심 장치다.

3. 용서(Forgiving): 상대가 다시 협력으로 돌아오면 과거를 묻지 않는다. 배신과 보복의 무한 루프에 빠져 집단이 공멸하는 것을 막는다.

4. 명확성(Clear): 전략이 지독하게 단순하여 상대가 나의 의도를 쉽게 예측할 수 있다. 상대에게 "네가 협력하면 나도 한다"는 신뢰의 신호를 명확히 전달하여 협력의 궤도로 유도한다.


TFT는 단 한 번도 개별 대결에서 상대보다 높은 점수를 얻은 적이 없다. 상대를 '이기는' 전략이 아니라 상대와 '함께 이득을 취하는' 전략이었기 때문이다. 그러나 토너먼트 전체 점수에서 TFT는 압도적 1위를 기록했다. 배신자들은 서로를 착취하며 자멸했지만, TFT는 만나는 모든 이로부터 협력을 이끌어내어 전체 파이를 키웠다.


이로써 1976년 도킨스가 설명하지 못했던 '비혈연 간 협력'의 공백이 완벽하게 보완되었다. 도킨스가 본능의 오작동이나 진화의 잔재로 치부했던 타인에 대한 호의가, 실은 유전자가 자신의 영속성을 지키기 위해 선택한 가장 정교한 생존 전략임이 수학적으로 증명된 것이다.


혈연이 없어도, 각자가 철저히 자신의 이익을 위해 움직여도, 관계가 반복된다면 '착함'은 나약함의 증거가 아니라 장기적인 이익을 극대화하기 위한 가장 세련된 생존 전략이 된다. '착한 놈이 꼴찌한다'는 인류의 오랜 편견이 박살 난 동시에, 이기적 유전자 이론은 비로소 사회라는 거대한 메커니즘을 설명할 수 있는 완전한 동력을 얻게 되었다.

작가의 이전글유전자들의 협력 연대기 [Part 1]