brunch

<철학은 어떻게 삶의 무기가 되는가> (1)

“죄수의 딜레마 - 게임이론”

by 해헌 서재

<철학은 어떻게 삶의 무기가 되는가> (1)

“죄수의 딜레마 - 게임이론”


강 일 송


오늘은 삶의 현장, 불확실한 현실에서 어떻게 철학이 역할을 하고 삶에 도움이 될 수

있는지를 보여주는 책을 한번 보려고 합니다.


저자는 야마구치 슈(山口風)로 게이오대학교 철학과를 졸업하고 동대학원 미학미술사

석사과정을 수료했습니다. 일본 최대 광고 회사 덴쓰(電通)를 시작으로 보스턴컨설팅

그룹과 AT커니를 거쳐 조직 개발, 혁신, 인재육성, 리더십 분야의 전문 컨설턴트로

자리매김합니다. 현재 콘페리헤이그룹의 시니어 파트너이자 히토쓰바시 대학교

경영연구과 겸임 교수로 일하고 있고 저서로는 <그들은 어떻게 지적 성과를 내는가>,

<세계의 리더들은 왜 직감을 단련하는가>, <읽은 대로 일이 된다> 등이 있습니다.


저자의 다양한 철학적 사고법 중 인상깊은 몇 가지를 시리즈로 한번 엮고

생각을 나누어 보고자 합니다.


===========================================================


★ 협조할 것인가, 배신할 것인가

- 내시 균형

존 내시(John Nash, 1928-2015)


내시 균형은 게임 이론에서 사용되는 용어다. 게임에 참가한 어떤 참가자가 다른

선택지를 고른다고 해도 기대치가 올라가지 않는 상태, 즉 ‘균형’을 이룬 상태를

가리킨다. 내시 균형을 설명하기 위한 사고 실험으로 가장 유명한 것이 ‘죄수의

딜레마’다.

죄수의 딜레마는 원래 1950년 수학자이자 프린스턴 대학교의 교수 앨버트 터커가

강의 때 사용한 일종의 사고 실험이다. 참고로 앨버트 터커는 ‘내시 균형’이란 말을

탄생시킨 존 내시의 지도교수였다.


죄수의 딜레마가 어떤 실험인지 살펴보자. 2인조 은행 강도가 경찰에 체포되어

각자 다른 방에서 취조를 받는다. 경찰관은 두 사람의 용의자에게 다음과 같이

압박한다.

“만약 두 사람 모두 묵비권을 행사한다면 증거 불충분으로 형기는 1년, 두 사람

모두 자백하면 형기는 5년이 된다. 하지만 만약 상대가 묵비권을 행사하고 당신이

자백하면 수사 협력에 대한 사례로 당신은 무죄 석방이 되고 상대의 형기는

10년이 된다.”


이때 두 죄수는 이렇게 생각할 것이다.

‘먼저 묵비권을 행사한다고 가정할 경우, 내가 자백하면 무죄 석방이고 내가 묵비하면

형기는 1년이므로 이때는 자백하는 편이 좋다. 반면 상대가 자백한다고 가정할 때

나도 자백하면 형기는 5년, 내가 묵비하면 형기는 10년이 되므로 이 경우도 역시

자백하는 편이 좋다. 즉 상대가 자백을 하든 묵비를 하든 내게는 자백하는 것이

합리적이다.’


결과적으로 두 죄수 모두 자백하고 5년형을 선고받는다. 이득을 최대화하기 위해서

합리적인 전략을 채택한다고 해서 반드시 참가자 전체의 이득이 최대화되는 것은 아니

라는 논리로, 이를 전문 용어로 ‘논제로섬 게임(Non-zero sum game)’이라고 한다.


죄수의 딜레마는 단 한 번의 의사 결정으로 참가자의 이득이 결정되는 게임인데, 실제

인간 사회에서는 그 정도로 단순하지 않아서 협조냐 배신이냐의 선택을 몇 번이나

반복하게 된다.


★ 반복적 죄수의 딜레마 게임


이 게임에서는 참가자가 각각 ‘협조’와 ‘배신’의 카드를 갖고 있다가 신호와 함께 동시에

상대에게 한 가지 카드만을 보여 준다. 두 사람 모두 배신을 선택하면 둘 다 10만원의

상금을 얻고, 두 사람 모두 협조를 선택하면 둘 다 30만 원을 상금으로 받는다.

만약 한 사람이 배신을 하고 다른 한 명이 협조를 하면 배신한 사람에게 50만 원의

상금이 주어지고 협조한 사람에게는 아무것도 주어지지 않는다. 자, 생각해 보자.

어떤 선택을 해야 가장 많은 상금을 얻을 수 있을까?


이 단순한 게임은 믿을 수 없을 정도로 엄청난 논쟁을 일으켰고, 최종적으로 정치학자

이자 미시간 대학교의 교수 로버트 액셀로드가 컴퓨터끼리 ‘반복적 죄수의 딜레마’

게임을 겨루게 했다. 정치학, 경제학, 심리학, 사회학 등 다양한 분야의 전문가 14명이

각각 심혈을 기울여 만든 컴퓨터 프로그램을 가지고 리그전을 펼쳤다. 한 시합 당

게임을 200회씩, 총 다섯 번의 시합을 실시해 평균 점수를 비교하기로 했다.


결과를 본 관계자들은 무척 놀랐다. 응모된 프로그램 중에서 가장 단순한, 단 3행으로

이뤄진 프로그램이 우승했기 때문이다. 이는 토론토 대학교의 심리학 교수 아나톨

레퍼포트가 작성한 프로그램으로 처음에 ‘협조’를 내고 그다음에는 바로 전에 상대가

냈던 것을 똑같이 내고 이것을 계속 반복하는 상당히 단순한 프로그램이었던 것이다.


이 프로그램의 강점은 무척 흥미로운 이야기인데,

첫째, 이 프로그램은 결코 자신이 먼저 배신하지 않는다. 우선 협조하고 상대가 협조

하는 한 협조를 계속하는 ‘좋은 녀석’ 전략을 구사한다.

둘째, 상대가 배신하면 그 자리에서 자신도 배신으로 돌아선다. 계속 협조하다가 상대가

배신해서 손실이 커질 경우 당장 상대에게 페널티를 준다. ‘좋은 녀석’이지만 상대가

싸움을 걸어오면 되받아친다.

셋째, 상대가 다시 협조로 돌아오면 이쪽도 협조로 돌아서는 ‘포용성’을 갖고 있다.

이미 끝난 일은 잊어버리고 미래를 위해 협력하는 깔끔한 전략을 펼친다.

마지막으로 이 프로그램은 좋은 사람이지만 내가 배신하면 상대도 바로 배신한다 는

사실이 분명해서 파악하기 쉽고 예측하기도 수월하다는 특징이 있다.

이 프로그램의 전략은 아주 견고해서 몇 년 후 제2회 콘테스트에서도 고도의 프로그램

들을 물리치고 다시 한번 우승을 차지했다.


다른 사람에 대해 사람들이 갖고 있는 기본 생각은 무척 다양하다. 이를테면 ‘사람을

보면 도둑이라고 생각해라’라는 격언을 인류가 지닌 지성의 결정으로 여기는 사람도

있을 것이다. 그러나 우선 협조하고 상대에게 배신당하지 않는 한 계속 협조하는

프로그램이 ‘반복적 딜레마’게임에서 최강의 전략으로 평가받았다는 사실은 우리에게

많은 것을 생각게 한다.


============================================================


오늘은 철학을 실제 삶의 도구로 삼아 도움을 얻게 도와주고자 하는 저자의

책을 함께 보았습니다.


오늘 첫 번째 내용으로 "게임 이론" 중 유명한 "죄수의 딜레마" 게임에 대한 내용

을 보았는데, 이 게임에서는 단 한 번의 선택으로 이득과 손실이 결정되지만

이를 현실에 적용하면 훨씬 더 복잡다단하다고 말합니다.


이 게임을 좀 더 확대한 게임인 "반복적 죄수의 딜레마 게임"을 가지고 본다면

수많은 전문가들이 복잡한 프로그램으로 리그전을 펼쳤든데, 가장 단순한 명제

를 지닌 3행의 프로그램이 두 번에 걸쳐 우승을 했다 합니다.


처음에 ‘협조’를 내고 그다음에는 바로 전에 상대가 냈던 것을 똑같이 내고

이것을 계속 반복하는 상당히 단순한 프로그램인데, 이 프로그램의 장점은

먼저 배신을 하지 않아서 도덕적 우위에 설수 있고, 상대가 배신을 하면 같이

맞받아서 배신을 하고, 협조를 하면 다시 협조를 하는, 예측 가능하면서도

단순한 전략이라는 데 있습니다.


단순히 이것을 게임 뿐아니라 현실에서의 인간 관계에서도 상당히 유용한

대응책이 되지 않을까 생각을 해봅니다. 저자가 말한 것처럼 어떤 지역의

격언에서는 만나는 새로운 상대는 "무조건 도둑"이라고 가정을 하고 만나는

전략도 있을 수 있는데, 이 전략의 장점도 분명히 있지만, 수많은 반복으로

프로그램을 시험한 결과 처음에 협조하고 상대의 반응에 맞추어 대응하는

이 단순한 전략이 더 효과적이었다는 것이지요.


이처럼 철학적 도구는 우리 실제 삶에서 응용이 바로 될 만큼 실생활과

멀리 떨어져 있지 않음을 이책을 통해서 다시 한번 알게 됩니다.


"일단 협조를 하고 상대방의 반응을 보아 똑같이 대응하고, 다시 협조를

한다면 쿨하게 받아주라."


좋은 하루 되시길 바라고, 이어서 다음에 보도록 하겠습니다.

감사합니다.

keyword