톰슨 로이터 v. ROSS 판결의 경쟁법적 함의
인공지능(AI) 시대의 알고리즘이 '지능'이라면, 그 학습의 원료가 되는 데이터는 '자산'이자 '권력'이다. 2025년 2월 11일, 미국 델라웨어 연방법원(District Court for the District of Delaware)의 스테파노스 비바스(Stephanos Bibas, 1969-) 판사는 Thomson Reuters Enterprise Centre GmbH v. ROSS Intelligence Inc., Case 1:20-cv-00613) 사건에 대한 약식판결(summary judgment)을 통해, AI 학습 데이터의 저작권적 보호 범위와 공정 이용(fair use)의 한계를 선언하였다. 이 판결은 표면적으로 저작권 침해 여부를 다루고 있으나, 그 이면에는 지배적 사업자가 저작권을 도구 삼아 '데이터 거점'(data bottleneck)을 형성하고 신규 진입자의 혁신을 봉쇄할 수 있는지에 대한 중대한 경쟁법적 담론이 숨어 있다.
사건의 발단은 법률 데이터 시장의 거물인 톰슨 로이터(Westlaw 운영사)가 신생 AI 법률 검색 스타트업인 로스 인텔리전스(ROSS)를 고소하면서 시작되었다. ROSS는 자연어 처리 기술을 활용한 혁신적인 법률 검색 엔진을 개발하기 위해 톰슨 로이터의 핵심 자산인 '웨스트로 헤드노트'(Westlaw Headnotes)와 '키 넘버 시스템'(Key Number System)을 학습 데이터로 활용하였다. ROSS는 톰슨 로이터와 직접 라이선스 협상을 시도했으나 거절당했고, 결국 제3자인 리걸이즈(LegalEase)를 통해 대량의 판례 요약 데이터를 확보하여 AI를 훈련시켰다. 톰슨 로이터는 ROSS가 자사의 편집 저작물인 헤드노트를 무단 복제하여 '시장의 대체재'를 만들었다고 주장하였고, ROSS는 이것이 중간 복제(intermediate copying)이자 공정 이용에 해당한다고 맞섰다(Op. at 1-12).
비바스 판사는 먼저 톰슨 로이터가 보유한 헤드노트의 저작물성을 인정하였다. 그는 판례 의견서에서 "가공되지 않은 대리석(판결문 원문) 자체는 저작권의 대상이 아니지만, 조각가가 무엇을 깎아내고 무엇을 남길지 선택하여 만든 조각상은 저작권의 보호를 받는다"라는 비유를 들어, 판례를 요약하고 분류하는 편집적 창의성을 긍정하였다(Op. at 8-10). 결과적으로 법원은 ROSS가 학습에 사용한 약 2,243개의 헤드노트가 톰슨 로이터의 유효한 저작권을 침해하였으며, ROSS의 '대량 메모'(bulk memos)가 헤드노트와 실질적으로 유사하다는 점을 명확히 하였다.
가장 치열한 격론이 벌어진 지점은 공정 이용(fair use)의 제1요소인 '변형적 사용'(transformative use)과 제4요소인 '시장 영향'이었다. ROSS는 자신들의 행위가 데이터를 단순히 복제하여 배포하는 것이 아니라, 단어 간의 수학적 관계를 학습하기 위한 '중간적 단계'일 뿐이므로 변형적이라고 주장하였다. 그러나 법원은 최근 미국 연방대법원의 앤디 워홀(Andy Warhol Foundation v. Goldsmith) 판결의 취지를 인용하며 이를 배격하였다. 비바스 판사는 ROSS의 AI 도구가 결국 웨스트로와 동일한 '법률 검색 서비스'를 제공하며, 상업적 목적이 중복된다는 점을 지적하였다. 특히 "ROSS의 AI는 새로운 콘텐츠를 창조하는 생성형 AI(Generative AI)가 아니라, 이미 존재하는 판례를 찾아주는 도구에 불과하므로 변형성이 낮다"라고 판시하였다(Op. at 15-18).
경쟁법적 관점에서 이 판결의 가장 위태로운 대목은 공정 이용의 네 번째 요소, 즉 '시장 영향'에 대한 판단이다. 법원은 ROSS의 서비스가 웨스트로의 시장 잠재력을 침해할 뿐만 아니라, 톰슨 로이터가 향후 구축할 수 있는 'AI 학습 데이터 라이선스 시장' 자체를 위협한다고 보았다(Op. at 22). 이는 지배적 사업자에게 자신의 데이터를 학습용으로 판매할지 말지를 결정할 독점적 통제권을 부여한 것과 다름없다. 만약 지배적 사업자가 경쟁사의 진입을 막기 위해 라이선스 제공을 거부한다면, 저작권은 혁신의 도구가 아니라 '진입 장벽'으로 전용된다. ROSS가 톰슨 로이터로부터 라이선스를 거절당해 우회 경로를 선택했다는 사실관계는, 이 사건이 저작권의 보호를 넘어선 '필수설비'(essential facility)에 대한 접근 차단 이슈와 맞닿아 있음을 시사한다.
이 판결은 알고리즘의 우수성보다 '데이터의 확보'가 경쟁의 성패를 가르는 AI 산업의 구조적 특징을 간과했다는 비판을 피하기 어렵다. 톰슨 로이터와 같은 선도 기업이 수십 년간 축적한 공적 데이터(판례)의 편집본을 저작권이라는 이름으로 폐쇄화할 경우, 후발 주자는 아무리 뛰어난 알고리즘을 가지고 있더라도 시장에 진입할 '원료'를 구할 수 없게 된다. 이는 시장의 동태적 효율성을 저해하고 기존 강자의 지배력을 공고히 하는 결과로 이어진다. 비바스 판사는 이 판결이 '비생성형 AI'에 국한된다고 선을 그었으나, 데이터를 영업비밀처럼 보호하려는 경향이 강화될수록 AI 생태계의 다양성은 위축될 수밖에 없다.
또한, 법원이 ROSS의 중간 복제를 구글의 도서 스캐닝(Google Books) 사례와 구별한 논리도 논쟁적이다. 구글은 검색 효율성을 위해 도서를 복제했지만 도서 판매 시장을 대체하지 않았던 반면, ROSS는 검색 결과물로 경쟁한다는 것이다. 하지만 이는 AI 학습의 본질이 '표현의 복제'가 아니라 '데이터의 분석'에 있다는 기술적 사실을 법적 형식주의로 덮어버린 측면이 있다. 만약 학습 과정에서의 모든 데이터 처리를 저작권 침해로 본다면, 거대 자본을 보유한 빅테크만이 데이터 권리자들과 독점 계약을 체결하여 시장을 과점하게 될 것이며, 이는 경쟁법이 지향하는 공정하고 개방적인 시장 구조와 정면으로 배치된다.
결론적으로 톰슨 로이터 v. ROSS 판결은 AI 시대의 데이터가 '사유재산'으로서의 성격을 강화하고 있음을 보여주는 상징적 사건이다. 그러나 이 판결이 남긴 시사점은 엄중하다. 저작권이 혁신의 병목(bottleneck)이 될 때, 경쟁법은 이를 해결할 '데이터 공유 명령'이나 '강제 실시권'과 같은 교정 도구를 고민해야 할 필요가 있다. 알고리즘의 성능이 데이터의 양과 질에 비례하는 시대에, 데이터의 폐쇄적 점유를 보장하는 법 해석은 결국 기술 권력의 세습을 정당화할 위험이 있다. 향후 상급심이나 다른 유사 소송에서 '혁신의 가치'와 '재산권의 보호' 사이의 균형추가 어디로 기울 것인지가 AI 경쟁 지형의 향방을 결정할 것이다.