유전자들의 협력 연대기 [Part 5]

[Part 5] 제로 결정 전략: 관계를 지배하는 공식 (2012)

by 성효경

2012년, 게임이론의 세계에는 문자 그대로 천지 개벽과 같은 지각변동이 일어났다. 리처드 도킨스와 로버트 액슬로드가 30년 가까이 쌓아 올린 ‘반복을 통한 자생적 협력’의 성벽에, 물리학의 거인 프리먼 다이슨과 전산학자 윌리엄 프레스가 제로-결정(Zero-Determinant, ZD) 전략이라는 거대한 균열을 낸 것이다.이것은 단순히 새로운 전략의 등장이 아니었다. 협력을 ‘관찰하는 대상’에서 ‘설계하고 강제하는 대상’으로 바꾼 관계의 코페르니쿠스적 전환이었다.

1989년의 도킨스는 이기적 유전자가 어떻게 ‘신사’가 되는지를 보여주었다. 하지만 2012년의 ZD 전략은 이기적 유전자가 어떻게 ‘관계의 프로그래머’가 될 수 있는지를 증명한다. 이제 협력은 운 좋게 피어나는 꽃이 아니라, 정교한 수식에 의해 가동되는 엔진이 되었다.


수학적 독재자의 탄생: “당신의 점수는 내가 정한다”

기존의 모든 전략(TFT 등)은 상대의 행동에 반응하는 ‘수동적’ 성격이 강했다. 상대가 때리면 나도 때리고, 상대가 웃으면 나도 웃었다. 하지만 ZD 전략은 오만할 정도로 능동적이다. 이 전략은 상대가 어떤 수를 두든 상관없이, 자신과 상대의 보상 사이에 선형적인 관계식을 일방적으로 강요할 수 있다. 수학적으로 말하면, ZD 전략을 쓰는 플레이어는 자신의 보상 S1과 상대의 보상 S2 사이의 기대값을 다음과 같이 고정해버린다.


S1 - O = χ(S2 - O)


여기서 O는 특정 기준점(공멸 시의 점수 등)이고, χ는 내가 설정한 배수다. 이 식이 의미하는 바는 냉정하다. 상대방이 아무리 영리하게 머리를 굴려도, 그의 최종 점수는 내가 미리 짜놓은 이 함수 궤적을 절대 벗어날 수 없다. 상대의 자유의지를 수학적 공식 안에 가두어버린 것이다. 협력은 이제 발생하는 현상이 아니라, 설계자가 설정한 변숫값에 따라 산출되는 결과물이 되었다.


착취: 가장 잔인하고 영리한 지배

ZD 전략의 가장 악명 높은 변종은 바로 ‘착취’ 전략이다. 이 전략을 쓰는 개체는 자신의 이득을 상대보다 항상 일정 비율(χ배) 더 높게 유지하도록 수식을 설계한다.이 상황에서 상대방은 지옥 같은 딜레마에 빠진다.


배신을 선택하면? 우리 둘 다 최악의 점수(P)를 받는다.

협력을 선택하면? 나는 아주 조금 더 받지만(R보다 낮음), 상대는 나보다 훨씬 더 많은 이득을 챙긴다.


상대는 분명 착취당하고 있다는 사실을 알지만, 굶어 죽지 않기 위해 (최소한의 점수를 얻기 위해) 설계자가 던져주는 부스러기 같은 이득을 챙기며 계속 협력할 수밖에 없다. 도킨스의 신사적인 유전자가 사실은 상대를 수학적으로 길들이는 ‘냉혹한 지배자’일 수도 있다는 가능성을 보여준 지점이다. 이 냉혹한 공식이 현실에서 구현되는 구체적인 장면들은 다음과 같다.


[실제 사례 1: 태아와 산모의 영양 전쟁 - 모성이라는 이름의 생물학적 착취]

가장 극적인 사례는 의외로 '모성'의 영역에 숨어 있다. 진화생물학자 로버트 트리버스는 태아와 산모 사이의 갈등을 ZD 착취 전략의 관점에서 설명한다.

착취 전략: 태아는 산모의 혈당을 높이고 혈압을 올리는 호르몬을 분비해 산모의 몸에서 더 많은 영양분을 끌어오려 한다. 산모의 입장에서는 자신의 건강을 해칠 정도의 자원 유출이 발생한다.

딜레마: 산모는 분명 착취당하고 있지만(건강 악화), 여기서 영양 공급 중단이라는 '배신'을 선택하면 태아가 죽고 자신의 유전적 이득도 $0$이 된다. 결국 산모는 유전자를 남기지 못하는 최악의 결과($P$)보다 아주 조금이라도 나은 불평등한 거래를 지속할 수밖에 없다.


[실제 사례 2: 플랫폼의 알고리즘 지배 - 수학적 궤적에 갇힌 자유의지]

배달 플랫폼이나 호출 서비스의 알고리즘에서도 인공지능은 전형적인 ZD 착취자의 역할을 수행한다.

착취 전략: 알고리즘은 라이더나 기사에게 배차를 줄 때, 그들이 일을 그만두지(배신) 않을 만큼의 '최소한의 수익'만을 보장하도록 단가를 조절한다. 플랫폼은 데이터 우위를 통해 라이더의 평점, 수락률 등을 묶어 '점수 공식'을 강요한다.

딜레마: 라이더는 플랫폼이 과도한 수수료를 챙긴다는 사실을 알지만, 앱을 끄고 수익이 0이 되는 것보다는 플랫폼이 던져주는 부스러기 같은 수익을 챙기며 계속 일하는 쪽을 선택하게 된다. 알고리즘은 상대의 자유의지를 수학적 궤적 안에 가두어버린 셈이다.


[실제 사례 3: 청소놀래기의 교묘한 갑질 - 상리공생 이면에 숨은 수위 조절]

앞서 언급한 청소놀래기 사례도 깊이 들여다보면 치밀한 착취 전략이 섞여 있다.

착취 전략: 청소놀래기는 가끔 기생충 대신 고객 물고기의 '영양가 높은 점막(살점)'을 슬쩍 뜯어먹는다. 고객 물고기는 순간적으로 통증을 느끼고 화가 나지만, 그렇다고 청소놀래기를 잡아먹거나 쫓아내버리는 배신을 선택하기는 어렵다.

딜레마: 청소놀래기는 고객이 화를 내며 관계를 끊지 않을 정도의 '수위'를 조절해가며 점막을 뜯어먹는 착취를 감행한다. 고객 물고기는 약간의 살점을 잃더라도 몸의 기생충을 제거하는 게 이득이기에 이 불평등한 협력을 유지하게 된다.


진화의 반전: 왜 지배자는 ‘자비’를 선택하는가?

하지만 여기서 드라마틱한 반전이 일어난다. 2013년과 2014년, 알렉산더 스튜어트와 조슈아 플로트킨 등의 후속 연구를 통해 이 지독한 착취 전략의 한계가 드러났다. 착취는 단기적으로는 압승을 거두지만, 장기적으로는 자신의 ‘숙주’(협력 상대)를 절멸시킨다. 상대가 멸종하거나 협력할 의지를 완전히 잃으면 착취자 역시 굶어 죽는다. 결국 진화의 거대한 체 위에서 살아남은 것은 ‘관대함’ 기반의 ZD 전략이었다.

이 지배자들은 공식을 바꾼다. “상대가 잘될 때 나의 점수도 비례해서 높아지도록” 설계를 변경한 것이다. 이것은 도덕적인 깨달음이 아니다. 상대를 살려두고 그가 자발적으로 협력하게 만드는 것이 설계자 자신의 수익률을 극대화하는 유일한 길임을 유전자가 계산해낸 결과다.


[실제 사례 1: 마셜 플랜(Marshall Plan) - 파트너를 부자로 만드는 고도의 이기심]

가장 거대한 규모의 ‘관대한 ZD’ 사례는 제2차 세계대전 직후의 마셜 플랜에서 찾을 수 있다. 전쟁에서 승리한 미국은 패전국과 동맹국들을 ‘착취’하여 단기적인 배상금을 챙기는 대신, 오히려 천문학적인 자금을 쏟아부어 그들의 재건을 도왔다.미국은 계산했다. 유럽이 빈곤에 허덕이며 무너지는 것(배신/파멸)보다, 그들을 부유한 소비자이자 안정적인 교역 파트너(협력)로 만드는 것이 미국의 장기적 이익(S1)을 극대화하는 길임을 알았던 것이다. 유럽이 부유해질수록 미국의 점수(S1)도 비례해서 치솟는 선형 구조를 설계한 이 ‘계산된 자비’는 결국 미국을 전례 없는 번영으로 이끌었다.


[실제 사례 2: 애플과 구글의 '수수료 인하' - 생태계 절멸을 막는 알고리즘의 양보]

앞서 언급한 배달 플랫폼의 ‘착취’에 대한 해답 역시 ZD 전략의 진화에서 찾을 수 있다. 애플과 구글은 한때 모든 앱 결제에 대해 30%의 높은 수수료를 떼어가는 ‘착취자’였다. 하지만 개발자들이 수익성 악화로 앱 생태계를 떠나거나 저항하기 시작하자(숙주의 절멸 위기), 이들은 전략을 수정했다.

연간 매출 $100$만 달러 미만의 중소 개발사에게는 수수료를 15%로 낮춰주는 정책을 도입한 것이다. 이는 개발자들의 이득(S2)을 일정 수준 이상으로 보장해줌으로써 그들이 생태계에 머물며 계속 혁신하도록 유도한 것이다. 개발자가 살아야 플랫폼의 전체 파이(S1)도 커진다는 사실을 알고리즘적으로 수용한 결과다.


[실제 사례 3: 공생의 기원, 미토콘드리아 - 침입자에서 동반자로]

생물학적으로 가장 오래된 사례는 우리 몸속의 미토콘드리아다. 본래 독립된 박테리아였던 미토콘드리아는 세포 속으로 들어와 처음에는 에너지를 뺏어 먹는 ‘착취자’였을 가능성이 크다. 하지만 숙주 세포를 죽이는 미토콘드리아는 결국 자신도 사멸하는 운명을 맞이했다.결국 살아남은 것은 숙주 세포에게 에너지를 공급(S2를 높임)하고, 그 대가로 안전한 서식처를 제공받는 ‘관대한 지배’ 구조를 설계한 미토콘드리아였다. 세포가 잘될 때 자신도 번성하는 이 수학적 결합은 지구상에서 가장 강력하고 성공적인 생명 시스템을 탄생시켰다.


관계의 엔지니어링: 시스템이 선함을 강제하다

게임이론가들과 진화생물학자들은 협력을 더 이상 도덕적 결단으로 보지 않게 되었다. 이제 협력은 ‘구조적 강제’의 산물이다. 현대적 관점에서 유전자는 배신이 원천적으로 불가능하거나, 배신했을 때의 손해가 협력의 이득을 결코 넘어설 수 없는 ‘시스템’을 만든다. 1976년에는 그저 생존을 위해 발버둥 치던 ‘기계’들이, 이제는 수학적 지배력을 갖춘 ‘설계자’가 되어 스스로의 생존 환경을 프로그래밍하고 있는 것이다. 우리가 부르는 ‘인간성’이나 ‘사회적 미덕’은 실은 이 정교한 수학적 강제 시스템이 내놓은 가장 효율적인 결과값일 뿐이다.


이기적 설계자가 빚어낸 평화의 알고리즘

결국 ZD 전략의 등장은 이기적 유전자 이론의 마지막 퍼즐을 완전히 다른 차원에서 해결했다. 도킨스가 "우리는 협력하도록 설계되었다"고 말했다면, 다이슨과 프레스는 "우리는 협력할 수밖에 없도록 서로를 설계한다"고 덧붙인 셈이다. 이제 우리는 알고 있다. 진화의 도상에서 우리가 만나는 '착한 사람'들은 단순히 성격이 좋아서가 아니라, 서로의 이익 궤적을 교묘하게 묶어버린 수백만 년의 수학적 투쟁에서 살아남은 '가장 영리한 설계자'들이다. 이기심은 이제 타인을 파괴하는 무기가 아니라, 타인을 나의 이익 궤도로 끌어들이는 중력이 되었다.

작가의 이전글유전자들의 협력 연대기 [Part 4]