퍼플렉시티(Perplexity) 저작권 소송 -제2편-

데이터바우처의 전략적 의미와 특허 결합의 중요성

by 정연주 변리사

4. 뉴욕타임스의 파상공세: 오픈 AI에 이어 퍼플렉시티를 상대로


뉴욕 타임즈는 2025년 1월, 퍼플렉시티 AI를 상대로 저작권 및 상표권 침해를 이유로 소송을 제기했다. 뉴욕 타임즈는 지난 2023년에도 OpenAI와 Microsoft를 상대로 저작권과 상표권 침해 소송을 내기도 했다.


뉴욕타임스는 퍼플렉시티가 AI 기반 답변 엔진 서비스를 운영하면서 자사 기사를 대규모로 수집·활용했다고 주장한다. 침해 구조는 두 단계로 설명된다. 첫째, 기사 수집 단계에서 robots.txt 등 기술적 접근 제한과 명시적 이용 거부 의사를 무시한 채 콘텐츠를 스크래핑했다는 점이다. 둘째, 서비스 단계에서 생성된 AI 응답이 기사와 실질적으로 유사한 수준에 이르러, 이용자가 원문을 볼 필요 없이 정보를 소비하게 만든다는 점이다.


이 사건의 핵심은 단순한 AI 학습의 적법성을 넘어, 검색증강생성(RAG) 방식의 서비스가 원본 콘텐츠를 사실상 대체하는 경우 어디까지 허용되는지에 있다. 뉴욕타임스는 퍼플렉시티의 서비스 구조 자체가 저작물 이용을 전제로 설계되었다고 본다.


또한 부정확한 AI 응답에 뉴욕타임스의 상표나 출처가 함께 표시될 경우, 이는 언론사의 신뢰와 명성을 훼손하는 상표권 침해 및 출처 혼동 문제로 이어질 수 있다고 주장한다.


뉴욕 타임즈가 OpenAI와 Microsoft를 상대로 제기한 저작권 침해 소송에서도 뉴욕타임즈는 생성형 AI 학습 과정에서 자사 기사들이 광범위하게 사용되었고, 그 결과물이 기사와 실질적으로 유사하다고 주장했다. OpenAI 측은 공정이용과 일부 언론사와의 라이선스 협력을 근거로 반박하고 있으나, 이 소송은 단순한 학습 여부를 넘어 AI가 언론 콘텐츠를 어디까지 활용할 수 있는지에 대한 기준을 법원이 제시할 가능성이 크다는 점에서 중요한 의미를 가진다. 최근, 해당 소송의 일부 절차 단계에서, OpenAI가 데이터 보존 의무와 관련해 부분적으로 유리한 결정을 받았다.


5. AI 데이터 무단 이용에 대한 최근 법원 판단과 합의 사례


미국 AI 스타트업 Anthropic은 불법 복제된 도서 수십만 권을 AI 학습에 사용했다는 작가들의 집단소송을 종결하기 위해 최소 15억 달러(약 2조 원)를 지급하는 합의에 이르렀다.


한편, 국내에서는 법원이 네이버가 인력과 비용을 투입해 가공·편집한 부동산 데이터베이스(DB)에 대해 DB 저작권을 인정하며, 이를 무단 크롤링한 스타트업에 손해배상과 데이터 삭제를 명령했다. 원본 정보가 공개돼 있더라도, 체계적으로 정리·검증된 DB는 보호 대상이라는 취지다. 이번 판결로 플랫폼 DB를 크롤링해 활용하는 스타트업의 소송 리스크가 커질 것으로 보인다.


[시사점]

이러한 사례들이 보여주듯, 초기 스타트업은 공개 데이터와 웹 크롤링에 의존해 서비스를 구축하는 경우가 많지만, 사업이 성장할수록 라이선스 계약, 사용자 데이터, 합성 데이터 중심의 구조로 이동하는 것이 현재의 표준적인 경로로 자리 잡고 있다.


이 과정에서 활용할 수 있는 정책적 수단이 바로 '데이터바우처' 제도다.데이터바우처는 정부가 데이터를 구매·가공·활용하려는 기업(수요기업)에 비용을 지원해, 데이터를 보유한 기업(공급기업)으로부터 합법적인 데이터 이용 권한을 확보하도록 돕는 제도다.


국내에서는 '한국데이터산업진흥원'을 중심으로 운영되며, AI·플랫폼·스타트업이 학습용·서비스용 데이터를 라이선스 계약 형태로 확보하는 것을 주요 목적으로 한다. 결국 향후 AI 및 데이터 기반 서비스에서는 모델 성능뿐 아니라, 데이터 출처의 정당성과 이용 구조의 적법성이 경쟁력의 중요한 요소로 작용할 가능성이 크다.


다만 데이터바우처나 정식 라이선스를 통해 합법적으로 확보한 데이터라고 하더라도, 데이터 그 자체만으로는 강력한 진입장벽을 형성하기는 어렵다. 오히려 중요한 것은 해당 데이터를 어떻게 활용하느냐에 있다. 데이터를 기반으로 한 분석 알고리즘, 추천 로직, 시각화 방법, 의사결정 지원 구조 등을 특허로 보호할 경우, ‘데이터 + 특허’가 결합된 방어적 구조가 형성되어 경쟁사가 쉽게 모방하기 어려운 기술적·법적 장벽을 구축할 수 있다.


작가의 이전글퍼플렉시티(Perplexity) 저작권 소송 -제1편-