5. 30초짜리 세계에서 우리는 무엇을 선택했나 (5)

공유지의 비극을 게임과 실험으로 다시 묻다

by 대치동 중학생

5장. 비극 이후의 문장 — 무엇이 바뀌었고, 무엇이 남았나


4장에서 우리는 같은 규칙을 두 번 실행했다. 교실에서(친구들과 20회), 그리고 GPT 플레이어들로 구성된 가상 실험에서(20회, chunk=3·learn 조건). 5장의 질문은 단순히 “누가 더 합리적이었나”가 아니다. 더 정확히는 이렇다. 동일한 유인 구조 아래에서, 어떤 조건이 주어질 때 ‘공유지의 비극’에 가까운 집단 실패 사건이 더 자주 출현하고, 어떤 조건이 주어질 때 그 사건이 약화되는가.


2장에서 우리는 하딘의 논증이 공유지 문제를 ‘파국의 도식’으로 고정시키는 데 큰 역할을 했음을 보았다. 동시에 Ciriacy-Wantrup & Bishop이 일찍부터 지적했듯, 하딘이 묘사한 것은 엄밀히 말해 규칙이 존재하는 commons라기보다 접근이 통제되지 않는 open access에 가까웠다는 구분도 확인했다. 고든의 어업모형은 과잉채취를 ‘도덕’이 아니라 유인 구조로 번역했고, 코스와 데미셋의 계보는 외부효과·거래비용·재산권 형성을 통해 “파국이 필연처럼 보이게 만드는 조건”을 제도 설계의 문제로 이동시켰다. 오스트롬은 여기서 한 걸음 더 나아가, 규칙이 실제로 작동하는 사례들의 설계 원리를 정리하며 제도(institutions)를 ‘텍스트’가 아니라 ‘운영되는 장치’로 파악하게 만들었다. 5장은 그 이론적 흐름을 반복하지 않는다. 대신 그 흐름이 던진 질문—규칙·정보·학습·피드백 구조가 선택을 어떻게 바꾸는가—를 30초 게임의 결과로 다시 확인해 보려 한다.


5.1 분석 틀과 지표: ‘비극’을 사건으로 조작화하기


공유지의 비극은 거대한 말이어서, 연구 보고서의 언어로 옮기려면 먼저 측정 가능한 형태로 조작화(operationalization)할 필요가 있다. 이 실험에서 나는 비극을 “감정”이나 “인상”이 아니라 사건(event)으로 잡았다. 핵심 지표는 두 가지다.


자원 고갈로 30초를 버티지 못한 조기 종료

조기 종료가 단순 패배가 아니라, 최저 채굴 기준(6) 미달로 ‘전원패배(ALL_LOSE)’로 이어지는 경우


두 번째 지표(ALL_LOSE)는 중요하다. 게임이 경쟁적(최다 채굴 승리)인 것은 변하지 않지만, ALL_LOSE는 승패의 문제가 아니라 집단 실패를 뜻한다. 실험경제학의 언어로 말하면, 이는 개별 최적화가 합쳐져 사회적으로 바람직하지 않은 귀결을 낳는 구간을, 아주 작은 스케일에서 “가시화”한 지표다. 2장에서 다룬 공공재 실험(Andreoni, Ledyard)이나 처벌 실험(Fehr & Gächter)의 관심이 결국 “협력이 언제 무너지고, 언제 유지되는가”라는 사건의 빈도에 있었던 것처럼, 이 연구에서도 핵심은 승자의 얼굴보다 실패의 발생 조건이다.


5.2 기술통계 요약: ‘수렴’과 ‘전원패배 소거’라는 대비


4장에서 정리한 요약 통계를 다시 꺼내면 다음과 같다.


교실(20회): 전원패배 5회(25%), 평균 종료시간 19.95초, 조기 종료(≤10초) 5회

GPT(chunk=3, learn, 20회): 전원패배 0회(0%), 평균 종료시간 28.25초, 조기 종료 0회


이 두 줄은 “GPT가 더 도덕적이다” 같은 결론으로 바로 연결되기 어렵다. GPT 실험에서도 승자는 분산되고(동점 포함), 각 플레이어의 평균 채굴량은 10 내외로 경쟁적 유인이 유지된다. 차이는 경쟁의 제거가 아니라 집단 실패 사건의 빈도 감소로 나타난다.


따라서 비교의 초점은 “규칙을 이해했는가”가 아니라, 연구자적인 표현을 쓰자면 행동 조정(coordination)이 가능한 시간 운영 전략이 얼마나 빠르게 형성되었는가에 있다. 그리고 그 형성 속도는, ‘성격’보다 피드백과 학습 구조에 더 민감하게 반응한다.


5.3 비극이 발생하는 지점: ‘탐욕’보다 먼저 오는 동시적 과속


교실에서 전원패배가 나온 회차들을 보면 공통점이 있다. (i) 30초를 버티지 못했고, (ii) 자원이 빠르게 고갈되었으며, (iii) 그 결과 누군가가 6을 넘지 못했다. 직관적으로는 “누가 욕심을 냈다”가 설명처럼 들린다. 그러나 데이터가 보여주는 것은 더 구조적이다.


불확실성 하에서 각자가 선택한 ‘안전해 보이는 속도’가 합쳐질 때 집단은 과속한다.


이 게임에서 플레이어는 자원 잔여량을 보지 못하고, 타인의 채굴량도 모른다. 즉 정보 비대칭이 규칙에 내장되어 있다(3장). 그러면 초반에는 “나만 안 누르면 손해”라는 불안과 “너무 누르면 전원패배”라는 불안이 동시에 생기고, 그 타협으로 “조금만 누르자”가 나온다. 그런데 모두가 ‘조금’씩 누르면 합산 채굴이 급증해 자원이 순식간에 말라버린다. 이때 비극은 탐욕의 폭발이라기보다 동시적 과속(synchronized acceleration)이다.


2장에서 언급한 최소 노력/약한 고리형 조정게임(Van Huyck et al.)의 직관을 빌리면, 협력의 적은 ‘악의’가 아니라 전략적 불확실성이다. 불확실성이 커지면 집단은 효율적인 고수준으로 올라가기보다 낮은 수준(혹은 파국)으로 끌려가며, 초반 조기 종료는 그 끌림이 가장 극적으로 드러난 구간이었다. 다시 말해, 공유지의 비극은 “이기적 인간”의 도덕극이라기보다, 정보 구조가 만들어내는 집단적 속도 문제로 재기술될 수 있다.


5.4 ‘최소 기준 공멸’의 기능: 처벌이 아니라 위험의 재배치


그렇다면 내가 추가한 규칙—최저가 6 미만이면 전원패배—은 무엇을 했나. 이 규칙을 처벌(punishment)로 이해하면 곧장 Fehr & Gächter의 처벌 메커니즘과 섞여 버릴 수 있다. 하지만 여기서 핵심은 누가 누구를 벌하는가가 아니다. 오히려 이 규칙은 위험의 배치를 바꾼다.


“1등만 하면 된다”는 환경에서는, 빠른 채굴은 단기적으로 이득이다.

“최약자가 6을 못 넘기면 모두 패배”인 환경에서는, 1등의 과속이 오히려 자신의 패배로도 이어질 수 있다.


즉 이 규칙은 경쟁을 없애지 않고, 경쟁의 방향을 바꾼다. 앞으로만 달리는 경쟁 → 조정 가능한 속도 경쟁으로. 경제학적으로 말하면, 이는 개인의 효용함수 자체를 바꾸는 것이 아니라, 게임의 귀결 함수(payoff structure)를 재배열해 “합리적 선택”의 공간을 이동시키는 방식에 가깝다. 2장에서 Palfrey & Rosenthal의 임계치 게임, 최소 노력 게임의 계보를 언급했던 이유가 여기서 다시 살아난다. 인간의 성향을 고치지 않아도, 문턱과 귀결의 설계는 선택의 방향을 바꿀 수 있다.


다만 중요한 단서가 있다. 규칙(신호)만으로 자동으로 협력이 생기는 것은 아니다. 신호가 작동하려면 플레이어가 그 신호를 시간 운영의 기술로 번역할 수 있어야 한다. 교실에서는 그 번역이 반복과 대화 속에서 만들어졌고, GPT에서는 실험 설계가 그 번역을 돕는 형태로 구성되었다.


5.5 협력이 생기는 지점: 개인 학습이 아니라 ‘공유된 학습’의 제도화


교실에서 9회차 이후 게임이 30초에 수렴한 것은 참가자들이 갑자기 도덕적이 되었기 때문이 아니다. 관찰되는 변화는 더 기술적이었다.


초반에는 서로 눈치를 보며 시간을 끌고(채굴 억제)

“이제는 모두 최소 6은 넘겼을 것”이라고 가정되는 후반에 몰아서 캐는 방식으로 수렴


핵심은 ‘개인의 학습’이 아니라 ‘학습의 공유’였다. 전원패배가 나오면 원인이 곧장 말로 설명되고, 다음 판의 암묵적 규칙이 된다. 이 순간이 작은 규모의 오스트롬적 장면이다. 오스트롬이 강조한 제도는 법전이 아니라 반복 가능하게 작동하는 운영 장치이며, 교실에서는 그 장치가 대화·관찰·합의라는 형태로 자연 발생했다. 2장에서 그라노베터의 내재성 논의를 언급했던 것처럼, 선택은 공중에 떠 있지 않고 관계 속에서 조정된다. 이 실험에서도 ‘관계’는 고상한 연대가 아니라, 실패를 해석하고 공유하는 실용적 조정 장치로 작동했다.


GPT 실험에서 이 역할을 수행한 것은 사람의 눈치가 아니라 설계였다. 30초 전체를 한 번에 계획하게 하면(중간 수정 불가), 초반 과속이 터졌을 때 되돌리기 어렵다. 반대로 chunk=3으로 쪼개 재계획을 허용하면, 국면 전환을 감지하고 수정할 여지가 생긴다. 여기에 learn(지난 결과 요약)이 붙으면, 실패의 원인이 개인의 기억에 머물지 않고 ‘공지’처럼 공유되어 다음 계획에 반영된다.


그래서 GPT(chunk=3, learn)에서 전원패배가 0으로 수렴한 것을, “AI가 착하다”가 아니라 더 정확히는 협력은 선의의 산물이기보다, 공유된 피드백이 만들어낸 습관으로 나타난다는 것을 확인 받은 것으로 보아야 한다. 이는 실험경제학이 오랫동안 보여준 사실—협력은 단번에 주어지지 않고, 학습·규범·기대 형성의 과정을 거쳐 나타난다는 점—과도 자연스럽게 이어진다.


5.6 ‘30초’의 의미: 작은 세계는 축소판이 아니라 ‘압축 장치’


시간 제한 30초는 단순한 재미 요소가 아니다. 30초는 참가자에게 “자원이 언젠가 끝난다”는 사실을 몸으로 인식시키는 압축이다. 현실의 공유지(어업, 삼림, 기후)는 끝나는 속도가 느리고, 그래서 더 오래 “괜찮아 보이는” 착각을 제공한다. 반면 30초 세계는 착각을 허락하지 않는다. 고갈이 빨리 도착하기 때문에, 선택의 결과가 빠르게 피드백된다. 이 압축 덕분에 한 가지가 선명해졌다. 비극은 멀리 있는 도덕 문제라기보다, 가까이 있는 피드백 문제라는 점이다.


피드백이 늦으면 조정은 쉽게 무너지고 게임은 초반 과속으로 끝난다. 반대로 피드백이 촘촘하면(공지/중간 수정/반복), 협력은 의외로 빠르게 ‘기술’이 된다. 이 장면은 “공유지 문제는 결국 제도 설계의 문제”라는 코스–데미셋–오스트롬 계보의 핵심을, 교실에서 촘촘한 시간으로 재현한 것으로 볼 수 있다. 다시 말해, 우리는 성격을 측정한 것이 아니라 피드백 구조가 선택을 어떻게 배치하는지를 관찰했다.


5.7 설계적 함의: 규칙보다 중요한 것은 ‘업데이트 가능한 인프라’


내가 이 실험에서 가장 크게 얻은 결론은 설계적이다. 공유지의 비극을 줄이는 핵심은 사람을 바꾸는 것이 아니라, 조정을 가능하게 하는 인프라를 설계하는 것이다.


여기서 인프라는 거창한 시스템이 아니다. 교실에서는 말 한마디, 눈치, “아까 너무 빨리 끝났잖아”라는 합의가 인프라였다. GPT에서는 chunk=3 재계획과 learn(공지 역할)이 인프라였다. 즉 ‘규칙의 존재’만으로는 부족하고, 규칙이 작동하도록 돕는 피드백의 전달 방식, 업데이트 단위, 공유 기억이 함께 있어야 한다.


이 점은 하딘식 처방(사유화/국가 규제)과도 다른 각도에서 흥미롭다. 외부 강제가 유일한 답이 아니라, 강제 이전에 조정이 작동할 수 있는 조건이 존재한다는 것이다. 물론 그 조건은 자동으로 생기지 않는다. 만들어야 한다. 오스트롬이 보여준 것은 “사람이 선해진다”가 아니라, 규칙이 운영될 때 선택이 달라진다는 관찰이었다. 내 실험은 그 관찰을 아주 작은 장치(아두이노)와 짧은 시간(30초)으로 압축해 확인했다.


5.8 한계와 후속 실험 가설: 무엇을 더 실험하면 단단해질까


이 실험은 단순하기 때문에 한계가 명확하다. 동시에 그 한계는 다음 실험의 변수로 전환될 수 있다. 여기서는 후속 연구 방향을 가설 형태(H)로 짧게 정리해 둔다.


H1(규모 효과): 플레이어 수가 증가할수록(3→5→10), 조기 종료 및 전원패배 사건의 빈도가 증가할 것이다. 단, 공지·중간 업데이트 같은 피드백 장치가 강화되면 그 증가폭은 완화될 것이다.


H2(외부 충격/변동성 효과): 재생률을 고정(+1/초)하지 않고 확률적으로 변동시키면, 전략적 불확실성이 증가하여 동시적 과속 또는 과도한 보수화(저수준 고착)가 더 자주 발생할 것이다.


H3(공지의 신뢰성/정당성 효과): 관전자 공지(요약)가 신뢰할 만한 정보로 공유될 때는 협력이 촉진되지만, 공지의 권위가 약하거나 왜곡·지연되면 학습이 분절되어 실패가 재출현할 것이다.


H4(규칙 정당성 효과): 최소 기준(6)이 외부에서 ‘부과’될 때보다 참가자 합의(투표/협상)로 결정될 때, 규칙 준수와 시간 수렴이 더 빠르게 나타날 가능성이 있다.


여기서 핵심은, 공유지 문제를 “공동체 대 시장 대 국가”의 추상적 대립으로 남겨두기보다, 조정 장치의 설계 변수로 분해해 실험 가능한 질문으로 전환한다는 점이다. 이는 2장에서 살펴본 제도경제학과 오스트롬의 작업이 공유지 논쟁을 이론과 현장 사이에서 왕복시키는 방식과도 닮아 있다.


5.9 결론: 30초짜리 세계가 남긴 문장


이 글의 제목은 “30초짜리 세계에서 우리는 무엇을 선택했나”이다. 5장까지 오면 질문은 조금 바뀐다.


우리는 ‘무엇을 선택했나’보다, 어떤 조건에서 우리가 다른 선택을 할 수 있었나를 보게 된다.


교실에서도, GPT에서도, 비극은 출발점이 될 수는 있어도 종착점일 필요는 없었다. 다만 비극을 넘어서려면 “착해져야” 하는 것이 아니라, 조정이 가능한 리듬과 피드백의 통로가 필요했다. 최소 기준 공멸은 그 통로를 억지로 열어젖히는 장치라기보다, 통로가 없을 때 어떤 종류의 실패가 반복되는지를 또렷하게 보여주는 장치였다. 그리고 그 통로는—오스트롬이 사례로 보여준 것처럼—대개 규칙 그 자체가 아니라, 규칙을 업데이트 가능하게 만드는 운영 장치들에서 시작된다.

작가의 이전글4. 30초짜리 세계에서 우리는 무엇을 선택했나 (4)