- 뉴욕타임즈 vs. 오픈 AI : 증거확보 전쟁
23년 시작되어 너무도 유명해진 소송이다.
이 싸움의 본질은 저작권이 아니다. 최소한, 저작권만은 아니다.
뉴욕타임스(NYT)가 오픈AI(OpenAI)를 상대로 건 소송. 표면적으로는 늙은 거인(Old Media)이 자신의 기사를 무단으로 '학습'하고 '산출'한 신생 괴물(Big Tech)에게 던진 창이다.
하지만 진짜 전쟁터는 따로 있었다. '전자증거개시(eDiscovery)'라 불리는, 법정 뒤편의 데이터 서버실이다.
이 전쟁의 무기는 '로그(log)'다.
NYT의 주장은 두 갈래다. 하나는 '학습(Input)' 침해. "우리 기사 훔쳐다 AI를 가르쳤다." 다른 하나는 '산출(Output)' 침해. "AI가 우리 기사를 통째로 뱉어내고 있다. 이건 유료 구독 시장을 파괴하는 행위다."
두 번째 주장을 입증하려면 물증이 필요했다. 챗GPT가 사용자의 특정 질문에 NYT 기사를 얼마나 베껴서 답했는지, 그 '범죄 현장'이 고스란히 담긴 증거.
바로 '사용자 대화 로그'다. NYT는 이 '스모킹 건'을 요구했다.
오픈AI의 대답은 간단했다. "우리는 그거 30일 뒤에 삭제합니다. 정책입니다."
NYT는 즉각 법원에 외쳤다. "저들이 증거를 '조직적으로 파기'하고 있습니다!"
2025년 5월, 뉴욕 남부지방법원의 오나 T. 왕(Ona T. Wang) 연방 치안판사가 칼을 뽑아 들었다.
명령은 상상을 초월했다. "오픈AI는 향후 삭제될 모든 출력 로그 데이터를 별도로 보존하고 분리하라."
이 결정의 무게는 간단하다. 전 세계 4억 명 사용자의 데이터가, 그들이 '삭제' 버튼을 눌렀다 하더라도, 이 소송을 위해 무기한 보존되어야 한다는 뜻이다.
사용자가 AI에게 속삭인 의료 상담, 법률 비밀, 가장 은밀한 대화까지도 증거 보관함에 갇히게 됐다. (단, 비싼 돈 내고 '데이터 무보존(ZDR)' 계약을 맺은 '엔터프라이즈' 고객은 제외됐다. 이 지점이 중요하다.)
오픈AI는 격렬하게 반발했다. 그들의 반격 논리는 정교했고, 이 싸움이 왜 21세기 가장 중요한 '전장'인지를 보여준다.
명분 1: 신뢰와 프라이버시
"사용자들은 30일 삭제 정책을 믿고 대화한다." 샘 올트먼 CEO는 말했다. "AI와의 대화는 변호사나 의사와의 대화처럼 보호받아야 한다." 사용자의 민감 정보가 소송 증거로 노출될 수 있다는 경고였다. 이것은 기술 기업이 쥘 수 있는 가장 강력한 여론전 카드다.
명분 2: GDPR (글로벌 규제)
"뉴욕 법원의 명령을 따르면, 우리는 유럽연합(EU)의 GDPR을 위반하게 된다." GDPR은 '잊힐 권리'와 '정보 최소 수집'을 명시한다. 사용자가 삭제를 요청한 데이터를 보존하는 순간, 오픈AI는 미국 법정을 벗어난 또 다른 글로벌 법률 분쟁에 휘말린다. 미국의 강력한 증거개시 제도와 전 세계 프라이버시 규범이 정면으로 충돌한 순간이다.
명분 3: 기술과 비용
"매일 600억 개의 대화가 오간다. 이걸 다 저장하라는 건 천문학적 비용과 엔지니어링 자원이 필요하다." 관련 데이터는 0.01%도 안 될 것이라며 '균형성' 문제를 제기했다.
하지만 상급 판사인 시드니 스타인(Sidney Stein)은 이 이의를 기각했다. 이유는 간단했다. "서비스 이용 약관에 '법적 요청' 시 데이터를 보존할 수 있다고 이미 써있음"
분쟁은 2025년 10월, 극적인 전환점을 맞는다.
오나 T. 왕 판사는 기존의 '무기한 전면 보존 명령'을 해제(완화)했다. 9월 26일 이후 생성되는 로그는 다시 30일 삭제 정책으로 돌아가는 것을 허용했다.
법원은 이미 5월부터 9월까지 보존된 데이터는 계속 유지하라고 명령했다. NYT는 수억 건의 '증거 샘플'을 확보했다. 또한, 법원은 AI 산출물(로그)이 명백한 '전자저장정보(ESI)', 즉 소송의 핵심 증거임을 사법 역사상 처음으로 명확히 했다.
위와 같이, 이 세기의 소송에서도 결국 증거를 확보하기 위한 당사자간 첨예한 공방이 전개되고 있다.
법정 소송의 승패는 결국 증거로 가려진다.
사실관계가 확정되어야 법리가 적용될 수 있다. 법리는 사실관계의 종속변수일 뿐이다.
사실관계는 어떻게 확정되는가?
주장과 이를 뒷받침하는 증거로 확정된다. 공개된 것도 있지만, 대부분의 중요 증거는 접근할 수 없는 상대방의 지배영역에 쌓여 있다.
결국 이를 어떻게 효율적으로 확보할 것인가가 소송의 승패를 좌우한다. 증거개시제도는 이러한 증거를 수집하는 반대 당사자가 손에 쥔 유일무이의 절대적 무기이다.
이러한 증거확보를 위한 공방과정에서 두가지가 명백해 졌다.
첫째, '데이터 무보존(ZDR)' 옵션이 포함된 오픈AI의 '엔터프라이즈' 버전의 중요성이다. 이 소송은 전 세계 기업들에게 "법적 리스크를 피할 유일한 길은 가장 비싼 유료 버전을 쓰는 것"이라는 강력한 시그널을 보냈다. 오픈AI에게 이보다 더 좋은 마케팅이 있었을까.
둘째, '증거 파기' 주장과 '프라이버시 보호' 주장 사이에서, 결국 쟁점확정의 결정적 계기는 기업이 미리 설계해 둔 '데이터 거버넌스 정책'과 '서비스 이용 약관'의 문구라는 것이다. 이를 어떻게 설계할 것인지는 이해관계자 모두에게 매우 매우 중요한 일이 되고 있다.