표현과 표절 사이(2)

AI TDM에 대한 각국의 분쟁 및 법제 동향

Oct 13. 2025

AI 시대의 '표현과 표절 사이'를 가르는 새로운 법적 경계를 설정하는 작업에서 가장 큰 이슈는 AI 기술의 핵심인 '텍스트 및 데이터 마이닝'(Text and Data Mining; 'TDM')을 법적으로 어떻게 평가할 것인가 하는 것이다. TDM은 방대한 디지털 저작물을 통계적 패턴으로 해체하여 AI 모델의 지능적 기초를 형성하는 과정이다. AI는 이 과정에서 저작물의 '표현'을 알고리즘적 재료로 변형시켜 내면화한다. 이 학습 방식은 저작권법에 근본적인 질문을 던진다. 즉, AI가 기존의 데이터화된 저작물을 학습하여 내재화하는 행위 자체를 저작권 침해로 볼 것인지, 아니면 기술 발전을 위한 정보 처리의 일종으로 허용할 것인지에 대한 판단이 요구된다. 나아가, AI와 인간의 협업을 통해 생산되는 결과물의 저작권 귀속 문제 또한 '인간의 창작'을 전제로 하는 현행법의 틀을 벗어나 새로운 논의를 필요로 한다.

이와 관련해서 세계 주요 국가에서는 다양한 분쟁이 진행되고 있고, 다양한 형태의 입법 시도들도 관측되고 있다. 이에 관하여 이하에서 자세히 살펴보기로 한다.

AI 학습 데이터 이용의 법적 쟁점을 가장 극명하게 보여주는 사례는 뉴욕타임스(The New York Times Company)가 오픈AI(OpenAI)와 마이크로소프트(Microsoft)를 상대로 제기한 소송(1:23-cv-11195)으로서, 2023년 12월 27일에 미국 뉴욕 남부 연방지방법원(U.S. District Court for the Southern District of New York)에 제기되었으며 현재도 진행 중이다. 뉴욕타임스 측은 피고들이 수백만 건의 자사 기사를 무단으로 TDM 학습에 사용하여, AI가 자사 기사를 실질적으로 복제하거나 요약함으로써 뉴욕타임스 유료 구독 시장을 직접적으로 잠식했다고 주장한다. 이들의 핵심 주장은 AI의 학습 및 생성 행위가 공정 사용(fair use)이 아닌 저작권 침해이며, 특히 AI가 뉴욕타임스 기사의 구체적인 표현까지 복원해 내는 것은 저작물의 시장 가치를 심각하게 훼손하는 행위라고 주장한다. 이에 대해 오픈AI 측은 AI의 학습은 '변형적 이용'(transformative use)에 해당하며, 이는 원 저작물의 시장을 대체하는 것이 아니라 완전히 새로운 형태의 기술을 창출하는 것이므로 공정사용으로 보호받아야 한다고 반박한다. 그들은 AI 학습 과정에서의 일시적 복제는 인간의 읽기 행위와 유사한 정보 처리 과정의 일부일 뿐이며, AI 모델이 원본 텍스트를 그대로 저장하지 않고 통계적 패턴만을 추출한다고 항변한다.

뉴욕타임스 소송과 함께 작가들의 권리를 대변하는 집단 소송도 TDM의 합법성을 다툰다. 사라 실버만(Sarah Silverman) 등 작가들은 오픈AI와 메타(Meta)를 상대로 그들의 저작권이 있는 책들이 허가 없이 AI 훈련 데이터로 사용되었다며 소송을 제기했는데, 이 중 메타(Meta)를 상대로 한 소송{미국 캘리포니아 북부 연방지방법원(U.S. District Court for the Northern District of California), 3:23-cv-03490}도 현재 진행 중이다. 작가들 측은 AI 개발사들이 상업적 이익을 위해 수많은 저작자의 노동을 무단으로 대규모 복제하여 AI 모델을 훈련시켰다고 주장한다. 이들의 주장은 TDM을 통한 대량 복제 행위가 저작권법이 허용하는 공정사용의 범위를 명백히 벗어난다는 것이며, 저작물 이용에 대한 정당한 라이선스 계약을 체결해야 한다고 촉구한다. 이에 대하여 AI 개발사들 측은 이러한 학습이 인간의 인지적 학습 과정과 본질적으로 다르지 않으며, AI가 책의 내용을 그대로 출력하는 것이 아니므로 변형적 이용에 해당한다고 항변한다. 또한, AI 기술 발전이라는 공익적 가치를 강조하며 TDM의 자유로운 이용이 혁신을 위해 필수적이라고 주장한다.

한편, 각국의 저작권 관할 당국도 AI 이슈에 대응하고 있다. 미국 저작권청(USCO)은 AI 생성물에 대한 저작권 등록 가이드라인을 통해 "인간의 창의성이 부재한 AI 생성물"은 저작권 보호 대상이 될 수 없다고 선을 그으며, 창작성의 주체는 오직 인간임을 재확인한다. 반면, 유럽연합(EU)은 '저작권 지침'{Directive (EU) 2019/790} 제3조에서 연구 기관의 비상업적 TDM을 허용하고, 제4조에서는 상업적 TDM을 원칙적으로 허용하되 저작권자에게 명시적인 이용 거부권(opt-out right)을 부여하는 실용적인 타협점을 모색했다.

특히, 일본은 TDM 이용에 대해 더욱 폭넓게 허용하는 입장을 취한다. 일본응 저작권법 제30조의4에서 "컴퓨터를 사용하여 정보 분석(사람의 지각에 의한 것을 제외한다)에 제공할 목적으로 저작물을 기록매체에 기록하거나 번안하는 행위(복제 및 번안)는 그 저작권자의 이익을 부당하게 해치는 경우를 제외하고 허용된다."라고 규정하여, 상업적 목적의 AI 학습이라 할지라도 시장에 직접적인 피해가 없다면 폭넓게 허용될 수 있도록 했다.

반면, 우리나라는 저작권법상 TDM 관련 조항이 명확히 마련되어 있지 않아 기존의 '저작물의 공정한 이용' 조항에 의존하는 상황이다. 이러한 입법의 공백은 AI 산업의 예측 가능성을 떨어뜨리고, 저작권자들의 권리 보호에 대한 불확실성을 가중시킨다. 따라서, AI 시대에 발맞추어 저작권자와 AI 개발자 사이의 합리적인 경계를 설정하는 작업이 필요해 보인다. AI 시대에 변화된 환경에 대한 충분한 이해를 바탕으로, 해외 각국의 사례를 참고하여 국제적인 기준에도 부합하면서 우리나라의 실정에도 맞는 방안을 찾아야 한다. 그리고, 워퍼턴 교수가 언급했듯 "창의적 재사용을 위한 예외를 확대하여 금전적 인센티브와 표현의 자유 사이의 공정한 균형을 이루는 것"이 무엇보다 중요하다. 다음 포스팅에서 계속......

keyword

작가의 이전글표현과 표절 사이(1)표현과 표절 사이(3)작가의 다음글