게임이론으로 풀어보는 인간의 이타성
이 책은 인간의 이타성에 대해 말하기 위해 게임이론을 활용합니다.
저자는 머리말에서 “이 책은 진화적 게임이론을 통해 사회를 바라보는 하나의 시각을 제공하고자 하는 의도에서 쓰였다”라고 선언합니다. 아무래도 대중서로 기획된 책이다 보니, 진화적 게임이론이 “어떻게 사회를 분석하는 데 응용될 수 있는가”를 보여주는데 집중했습니다.
조금 더 쉽게 말하자면, 이기적인 존재인 사람들이 왜 남을 위한 행동을 하는지를 게임이론이란 공구 상자에서 몇몇 게임을 공구처럼 꺼내다 쓴다는 겁니다. 이 책에서도 가장 중요하게 다루는 게임은, 마치 온갖 곳에 가져다 쓰는 일자 드라이버처럼, 죄수의 딜레마를 가져다 씁니다.
책은 크게 세 부분으로 나뉩니다만, 첫 번째 “우리 인간 사회에서 어떻게 이타적 협조행위가 진화하게 되었는지”를 다룬 부분이 분량 면에서나 집중도 면에서나 가장 큽니다. 두 번째 부분은 실험경제학과 인류학에서 도움 되는 이야기를 가져왔습니다만, 전체 맥락에 큰 영향을 주진 않습니다. 또한 “이타성의 진화적 기원을 찾는 문제란 다르게 표현하면 상대방을 위하면서 심리적 만족감을 느끼게 되는 기원을 찾는 문제와 다를 바 없다”라고 글을 끝맺습니다. 마지막 부분은 “게임 이론에 대한 개략적인 설명을 담고 있는 부록”이라고 덧붙였는데요, 저자의 전작인 『게임이론과 진화 다이내믹스(2009)』을 조금 읽다 덮어버린 입장에선 읽어볼 만했습니다. 심지어 저는 부록부터 읽고 본문을 읽기 시작했습니다.
저자의 논문, 「경제학에서 호모 이코노미쿠스의 지위, 그리고 타인을 고려하는 선호」(사회경제평론, 2019, vol.32, no.2, 통권 59호 pp. 153-171)에서는 역사주의적 자명성을 띄고 있는 호모 에코노미쿠스의 개념에 대해 비판하고 있지만, 이 책에서는 그 통념에 기초해서 논의를 진행합니다. 그래서 “타인에 대해 무관심하고 자신의 이익만을 생각하며 그래서 금전적인 이해에만 매달리는 탐욕적 존재”를 상정한다면, 죄수의 딜레마를 통해 ‘인간은 이기적’이란 기본 전제를 설파하기 편해집니다.
죄수의 딜레마 게임은 이 책에서 가장 중요한 위치를 차지하는 게임이다.
-345쪽
저자는 어떤 게임이 죄수의 딜레마 게임이 되기 위한 두 가지 조건으로, (1) 상대방을 배신하는 전략이 항상 우월 전략이란 점과 (2) 모든 경기자가 협조 전략을 선택하는 것이 사회적으로 최적이란 점을 꼽습니다. 협조하는 게 사회적으로는 최적이지만, 호모 에코노미쿠스 개인에게는 배신이 최선인지라, 저녁 값의 딜레마 Diner’s Dilemma나, 시장의 실패가 나타날 수밖에 없다는 겁니다. 게임이론을 다룬 모든 책에서 이때쯤 리처드 도킨스의 책, 『이기적 유전자 The Selfish Gene』를 인용하곤 합니다.
윌리엄 해밀턴의 ‘혈연선택 kin selection’을 설명하기 위해, 게임이론의 보수 매트릭스를 보여주며 해밀턴의 법칙 Hamilton’s rule을 풀어냅니다. 저 같은 수학맹(數學盲)인 사람에게는 알다가도 모를 설명이 되기 때문에 말로 풀어낼 필요가 있습니다.
쉽게 말하자면, “한 사람을 살리려고 자기의 목숨을 희생할 요의가 있는 사람을 찾기란 쉽지 않지만, 두 명의 형제를 구하기 위해 자기 자신을 희생하거나 여덟 명의 사촌을 구하기 위해 자기 자신을 희생할 용의가 있는 사람은 많이 발견할 수 있다”는 것입니다.
이쯤에서 생각하는 책이 한 권 생깁니다. 바로 조지프 헨릭(Joseph Henrich, 이 책에서는 요세프 헨리히로 표기)의 책, 『호모 사피엔스』입니다. 먼저 읽었던 책의 내용이 새록새록 떠오르며, 저자의 주장에 동감하게 됩니다.
진화 연구자들이 수십 년 동안 주장해 온 바에 따르면, 인간이 그토록 효과적으로 조직화하고 협력할 수 있는 까닭은 친족선택(혈연선택)과 호혜적 이타주의(호혜)라는 진화적 힘들이 우리의 심리를 모양 지어왔기 때문이다. 그리고 우리의 친족 심리가 유전적으로 진화한 까닭은 그 덕에 우리가 우리와 계통적으로 관계가 있고 따라서 특정한 이타적 유전자들을 공유할 가능성이 높은 사람들에게 도움이나 편익을 베풀 수 있기 때문이다.
조지프 헨릭, 『호모 사피엔스: 인류를 지배종으로 만든 문화적 진화의 힘』, 주명진, 이병권 역, 21세기북스, 2024, 227쪽
반복-상호성 가설에 따르면 이타적 행위가 일어나는 이유는 둘 사이의 상호작용이 지속될 것임이 전제되었을 때, ‘상대방이 다음번에 보복할 것을 두려워해서’다. -106쪽
이 가설만으로 문제가 간단하게 풀리지는 않습니다. 여기서 역추론 Backward induction의 문제를 슬쩍 집어넣으면 골치는 더 아파집니다. 경기자들이 모두 합리적이고 물질적 이득에 따라 행동한다고 가정하고 역추론을 통해 얻게 되는 균형을 ‘부분게임 완전 내시균형 subgame perfect Nash Equilibrium’이라고 부르는데요, 누가 봐도 비위가 틀릴 이상한 보상 매트릭스를 만들어내곤 합니다. 이렇게 역추론의 딜레마가 발생합니다.
하지만 게임이 “충분할 정도로 높은 확률로 반복되면, 게임은 더 이상 죄수의 딜레마 게임의 구조를 갖지 않는다”라고 봅니다. 대표적으로 사슴사냥게임 stag hunt game을 꼽는 조정 게임 Coordination Game으로 바뀐다는 거죠. 조정 게임에서는 상대방과 내가 동일한 행동을 하는 게 내시균형이 됩니다.
즉 반복적 죄수의 딜레마 게임에서 협조적 행위가 일어나는 까닭은, ‘Tit-for Tat’이라는 보복이 발생하기 때문이란 겁니다. 그렇다 보니 이쯤에서 호모 에코노미쿠스에 대응하는 Homo reciprocans라는 개념이 등장하게 됩니다. 게임이론에서는 플레이어를 깍쟁이 호모 에코노미쿠스로 규정합니다만, 스스로 이타적인 행동을 하고 자신에게 손해가 가더라도 이를 응징하려는 성향을 가진 호모 레키프로칸스가 보이기 때문입니다.
게임이론과 관련해서 처음 읽었다가 꽤나 헤맸던 책, 『살아 있는 것은 모두 게임을 한다』에서도 도움을 받을 만한 내용이 생각났습니다. 반복적 죄수의 딜레마 게임에서 관찰자가 존재하면 이타성이 증가하며, 이는 ‘평판’이 이타적 행동을 추동한다고 봅니다. 그래서 좋은 평판을 유지해야 한다는 ‘규범’이 발생한다고도 봅니다.
피지 공동체에서는 부정적인 간접 호혜성 indirect reciprocity, 즉 평판 나쁜 사람을 착취하는 것을 용인하는 체제가 폭넓게 사회 규범을 유지한다. 이는 공동체의 사업을 돕는 일과 관련된 규범, 마을 잔치(음식 공유)에 기여하는 규범, 미리 정해진 방향으로 집을 짓는 규범 등을 포함한다. 누군가가 이 사회 규범을 어기면 당사자와 그 가족의 입지가 나빠진다. 거듭된 위반으로 평판이 충분히 나빠지면 아예 보호막이 사라진다.
모시 호프먼, 에레즈 요엘리, 『살아 있는 것은 모두 게임을 한다』. 김태훈 옮김, 김영사, 2023, 291쪽.
유유상종 assortative interaction 현상이 발생할 수 있을 것이라고 봅니다. 플레이어들이 타인들의 과거의 행동으로부터 얻게 된 점수를 감안해서 게임 파트너를 결정하도록 하면 그 사회에서는 유유상종 현상이 일어날 수 있다는 겁니다. 그렇게 해서 이타적 인간들끼리 무리를 짓게 되고, 그 무리 안에서는 이타적 행동이 규범화될 수 있다고 봅니다.
이 과정에서 평등주의와 관대함이 중요하게 부각되는데요, 이에 대해서는 조지프 헨릭의 견해를 통해 강화해 봅니다.
존경받는 개인들은 성질이 나쁘거나 변덕스러운 경우가 거의 없을뿐더러, 오히려 관대하기로 소문난 경우가 흔하다. 이 현상은 심지어 평등주의가 강해서 공식 지도자도 계급도 없는 사회에서도 일어난다. 인간사회 전역에서, 명망은 사람들이 관심을 갖는 활동이나 일에서 보여주는 훌륭한 기량, 지식, 성공과 꾸준히 연관된다. 이 명망 지위가 평등주의 사회에서도 쉽사리 지도력의 기반을 형성한다.
조지프 헨릭, 『호모 사피엔스: 인류를 지배종으로 만든 문화적 진화의 힘』, 주명진, 이병권 역, 21세기북스, 2024, 194쪽.
사자 앞에서 겅중겅중 뛰는 가젤이 정작 사자에게 보내는 신호는 ‘나 잡아 봐라.’가 아니라, ‘나 이렇게 잘 뛰는데 날 잡으려고? 그냥 다른 비실비실한 놈이나 잡아’라는 것이란 설명입니다.
이타적으로 행동하는 것, 어려운 상황에도 남을 배려하는 것, 부족 간의 전쟁에 맨 앞에 서서 용맹하게 싸우는 것, 사회의 규범을 솔선해서 지켜내고 이를 어기는 사람을 앞장서서 응징하는 것 등은 눈에 보이지 않는 자신만의 자질을 보여줄 수 있는 값비싼 신호일지도 모른다. - 188쪽
후안 카밀로 카르테나스 Juan Camilo Cardenas의 2005년 공유지의 비극 게임 실험은 다음과 같은 결과를 보여주었습니다.
첫째, 일단 기본 형태의 실험 결과를 보면, 실험에 참가한 사람들이 선택한 공유자원 채취량 수준은 대략 평균적으로 4에서 5 사이였다. 이 결과를 다른 학자들이 공유지의 비극 게임을 실험했을 때 얻은 결과와 그다지 다르지 않다. 사람들이 선택한 채취량 수준은 사람들이 자신들이 이익만 생각하고 선택했을 수준, 즉 8보다 낮고, 집단 전체의 이익을 중시해서 선택했을 수준, 즉 1보다는 높았다.
둘째, ‘10회를 마치고 매회 토론하는 경우’에는 참가자들이 선택한 자원 채취량 수준이 뚝 떨어져 사회적으로 최적인 수준에 좀 더 가까워졌음을 알 수 있다. 그리고 ‘10회를 마치고 단 한 번 토론하는 경우’의 그래프는 토론이 진행된 직후에는 채취량 수준이 뚝 떨어졌다가 다시 증가하고 있다. 즉 토론이 진행된 직후에는 그 효과가 크게 나타나는 반면 시간이 흐름에 따라 효과가 점점 사라지고 있음을 알 수 있다. 여기서도 의사소통의 효과가 뚜렷이 드러난다. -195쪽
어떤 집단이 어떤 특성을 갖는가, 혹은 어떤 특성을 가진 사람을 얼마나 많이 보유하고 있는가에 따라 집단들의 생존 가능성이 달라지고, 그로 인해 그 속성이 전체로 퍼져나가게 될지 아니면 없어지게 될지가 결정되는 그러한 과정을 집단선택 group selection이라고 부른다. -202쪽
저자는 이 집단선택의 과정에서 집단의 평등주의와 배타성 또한 고려해 볼만하고 봅니다.
요약하자면, 국지화는 부분적 유유상종 현상이 일어날 수 있는 환경을 만들어주고, 그 결과 모종의 집단선택 메커니즘이 작동할 수 있도록 해줌으로써, 이타적 행동의 진화에 유리한 조건을 만들어낸다. -251쪽
다만, 이타적 행동을 하는 집단이 전체를 장악하게 될 가능성은 아주 희박하다고 봅니다. “이타적인 사람들 틈에 이기적인 사람이 한 사람 끼어 있으면 이기적인 사람이 얻게 될 보수는 아주 커지므로, 이 경우에는 다시 이기적인 전략이 퍼져나갈 것이기 때문”입니다. 조지프 헨릭 역시 같은 견해입니다. “성공 편향된 문화적 학습(또는 순전히 합리적인 이기심) 때문에 개인은 자기 집단 제도에서 ‘균열’을 찾아내어 자신 혹은 일가친척의 이익을 위해 그것을 조종하거나 이용한다”라고 봤습니다.
최후통첩 게임 Ultimatum game을 이용한 실험에서 제안자들은 평균적으로 37%에 해당하는 몫을 응답자에게 건네주었는데, 50%를 제안한 사람들의 수가 가장 많았다(21명의 제안자 중 7명이 50%를 제안했다)고 합니다. 또한 응답자들은 자신에게 제안된 몫이 30%를 넘지 않으면 제안을 거부했다고 합니다.
독재자게임 Dictator game을 이용한 실험에서도 거부권을 행사할 수 없는 응답자에게 평균 25%의 몫을 건네주었다는 사실은 여전히 많은 수의 제안자들이 공평성이나 정의에 입각해서 행동하고 있음을 보여준다고 분석했습니다.
신뢰게임 Trust game의 실험 결과는 예상과 달리, 사람들은 선행자의 입장에 섰을 때 상대방을 신뢰하며 상당한 금액을 후행자에게 건네주었고. 후행자의 입장에 섰을 때는 선행자의 호의적인 제안에 대해서는 호의로 답했다고 합니다.
사람들이 평상시 행동할 때, 우리의 예상처럼 이기적이기만 한 것은 아니란 실험 결과들입니다.
다시 한번 조지프 헨릭을 인용하자면, 우리는 “제삼자와 평판이 강요하는 사회규범에 의해 다스려지는 사회에서 생존하기 위해, 친사회적 편향을 지닌 규범 학습자, 핵심 동기를 내면화하는 규범 고수자, 규범 위반 색출자, 평판 관리자가 되었다”라고 합니다. 이로써 우리는 어떤 다른 종과도 사뭇 달라진다고 말합니다.
그런데 이쯤에서 발목을 잡아 끄는 책이 한 권 나타납니다. 바로 유발 하라리의 『사피엔스』입니다. 이 냉소적인 학자는 “‘협력’이란 말은 매우 이타적으로 들리지만 항상 자발적인 것은 아니었으며 평등주의적인 경우는 드물었다”라고 말합니다. 오히려 “인간의 협력망은 대부분 압제와 착취에 적합하도록 맞춰져 있었다”라고 분석합니다. 그래서 “우리가 특정한 질서를 신뢰하는 것은 그것이 객관적으로 진리이기 때문이 아니라, 그것을 믿으면 더 효과적으로 협력하고 더 나은 사회를 만들어낼 수 있기 때문”이라고도 말합니다. 이러한 ‘상상의 질서’는 “아주 많은 사람들이 효과적으로 협력할 수 있는 유일한 방법”인지라, 이를 보호하려면 지속적이고 활발한 노력이 필수적이라고 봤습니다. 그래서 “군대, 경찰, 법원, 감옥은 사람들이 상상의 질서에 맞춰 행동하도록 강제하면서 쉴 새 없이 돌아가고 있다”라고 말입니다.