4. 30초짜리 세계에서 우리는 무엇을 선택했나 (4)

공유지의 비극을 게임과 실험으로 다시 묻다

by 대치동 중학생

4장. 숫자가 말하기 시작할 때 — 교실과 GPT 실험에서 ‘비극’이 나타나고 사라진 조건


3장에서 게임 규칙을 만든 뒤, 나는 같은 질문을 두 세계에 던지기로 했다.
(1) 실제 교실에서 친구들이 버튼을 누를 때, 그리고 (2) GPT 플레이어들이 같은 규칙을 따라 계획을 세울 때, 비극은 얼마나 자주 발생하는가. 더 정확히는, 비극이 “탐욕”이라는 성격의 문제로 설명되는지, 아니면 피드백의 구조—누가 무엇을 언제 알 수 있는가—의 문제로 설명되는지 확인하고 싶었다.

다음의 표와 그림은 우리가 어떤 리듬을 배웠고 어떤 리듬에서 무너졌는지를 가장 솔직하게 드러낸다.


4.1 교실 실험 결과: ‘규칙 이해’보다 앞선 ‘리듬 학습’


교실에서 20회를 반복한 결과는 한쪽으로 단순하지 않았다. 초반에는 조기 종료와 전원패배가 많이 관찰되었고, 후반에는 게임 시간이 30초에 수렴하는 경향이 뚜렷해졌다. 즉, 참가자들은 규칙을 단순히 “알게” 된 것이 아니라, 시간을 운영하는 방식—초반엔 멈추고, 후반에 몰아치는 방식—을 점차 공유하게 되었다.


표 4-1. 교실 실험 요약 통계(20회)

표4-1.png

조기 종료(≤10초)가 5회라는 점이 핵심이다. ‘30초 세계’가 10초도 못 버틴다는 건, 자원이 물리적으로 부족해서가 아니라, 집단의 속도가 순간적으로 과속했다는 뜻이다. 전원패배는 모두 자원고갈 종료에서 발생했다. 즉, “최소 기준 공멸”은 추상적 규칙이 아니라, 초반 과속의 처벌 장치로 작동했다.


그림 4-1. 교실 실험 라운드별 종료 시간

ch4_fig1_classroom_endtime.png 초반의 급격한 조기 종료가 반복되다가, 반복 시행 이후 30초 완주가 늘어나며 ‘시간 수렴’이 나타난다.


그림 4-2. 교실 실험 결과 분포

ch4_fig5_classroom_counts.png 자원고갈 종료가 다수이며, 전원패배는 그 안에서 특정 조건(최저 6 미달)이 충족될 때만 발생한다.


표 4-2. 교실 실험 원자료(20회)

표4-2.png

이 표에서 가장 사회학적인 장면은, ‘협력’이 합의문으로 등장하지 않는다는 점이다. 대신 협력은 시간 운영의 암묵적 기술로 나타난다. 초반에 서로 눈치를 보며 “지금은 참자”가 생기고, 후반에 “이제는 6을 넘겼을 것이다”라는 추정이 생기면서, 게임은 30초 쪽으로 늘어난다. 즉, 교실에서 공동체는 도덕이 아니라 반복과 관찰로 굳어진 리듬으로 만들어진다.


4.2 GPT 실험 결과: ‘더 자주 업데이트할 수 있는 조건’이 비극을 약화


GPT 실험은 교실 실험을 그대로 복제한 것이 아니다. 핵심은 인간의 눈빛과 대화 대신, GPT에게 어떤 정보가 주어지는지(개인 요약 vs 공지), 계획을 얼마나 자주 갱신할 수 있는지(30초 일괄 vs chunk 재계획) 같은 정보-시간 구조 자체가 실험변수가 된다는 점이다.

이번에 성능이 안정적으로 나온 조건은 다음과 같았다.

learn(학습) 사용: 지난 라운드 결과 요약을 반영

chunk=3: 3초 단위로 재계획(업데이트 빈도 상승)

공지(공유 피드백): 실패 패턴을 ‘공동 규약’처럼 공유(공동체 기억 생성)


표 4-3. GPT 실험 요약 통계(chunk=3, learn, 20회)

표4-3.png


그림 4-3. GPT(chunk=3, learn) 라운드별 종료 시간

ch4_fig2_gpt_endtime.png 조기 종료가 사라지고, 종료 시간이 30초 근처로 안정적으로 수렴한다.


그림 4-4. GPT 결과 분포

ch4_fig6_gpt_counts.png time_limit 비중이 높고, ALL_LOSE가 0회로 수렴한다.


그림 4-5. GPT 라운드별 A/B/C 점수 변화

ch4_fig4_gpt_scores.png 최소 기준을 안정적으로 충족하면서도, 승리는 특정 플레이어에게 고정되지 않고 분산된다(경쟁이 유지됨).



표 4-4. GPT 실험 원자료(20회)

표4-4.png

여기서 중요한 점은, GPT가 “착해졌다”는 이야기가 아니라는 것이다. 승리를 향한 경쟁은 계속된다. 다만 경쟁이 공동 파국(ALL_LOSE)으로 자주 이어지지 않도록, 선택이 미세 조정된다. 다시 말해, 협력은 선의가 아니라 업데이트 가능한 운영에서 나온다.


4.3 교실 vs GPT 비교: 차이는 ‘성격’이 아니라 ‘피드백의 밀도’


교실과 GPT를 나란히 놓고 보면 대비가 명확해진다.


표 4-5. 교실 vs GPT 비교 요약(같은 규칙, 다른 피드백 구조)

표4-5.png


그림 4-6. 종료시간 비교(교실 vs GPT)

ch4_fig3_endtime_overlay.png 교실은 초반 조기 종료 이후 점차 30초로 수렴하는 ‘학습 곡선’을 보이고, GPT(chunk=3)는 처음부터 고수준의 수렴을 안정적으로 유지한다.


이 비교는 “인간 vs AI”의 우열을 말하려는 것이 아니다. 오히려 반대다. 교실은 시간이 지나며 공동체가 스스로 피드백 구조를 만들어낸다. 전원패배가 나오면 곧바로 원인이 대화로 공유되고, 다음 판의 암묵적 규약이 된다. 반면 GPT는 그런 사회적 장치가 자연 발생하지 않는다. 대신 우리가 공지(공유 피드백)와 3초 단위 재계획을 설계해 주었을 때, 비극이 급격히 약화되었다.


여기서 핵심은 “규칙” 그 자체보다 “규칙이 작동하는 방식”이다.

30초 전체를 한 번에 계획하면, 플레이어는 중간에 브레이크를 밟지 못한다.

계획을 3초 단위로 갱신하면, 실패의 징후를 반영할 수 있다.

개인이 따로 학습하면 공동체는 학습하지 못하지만, 공지가 생기면 학습이 공유된 기억으로 바뀐다.


이 장면은 2장에서 다룬 논의와 정확히 연결된다. 공유지 문제는 인간 본성의 선악이 아니라, 어떤 규칙·정보·제재·학습 구조가 ‘합리성’을 어떤 방향으로 몰아가는지에 관한 질문이다. 교실과 GPT는 서로 다르지만, 둘 다 같은 결론을 가리킨다. 비극은 “인간이 탐욕적이라서” 자동 발생하는 것이 아니라, 조정이 실패할 때 더 쉽게 나타난다. 그리고 조정은 도덕이 아니라 피드백의 기술로 강화된다.


4.4 소결: ‘최소 기준 공멸’ 규칙은 무엇을 바꾸었나


4장의 결과는 한 가지를 확실히 말해 준다.
최소 기준 공멸은 단순한 페널티가 아니라, 플레이어들이 ‘앞으로만 달리는’ 선택을 하기 어렵게 만드는 장치다. 다만 이 장치가 제 기능을 하려면, 사람들이 최소 기준을 맞추기 위한 시간 운영을 배워야 하고, 그 학습이 공유되는 구조가 필요하다.





작가의 이전글3. 30초짜리 세계에서 우리는 무엇을 선택했나 (3)