퍼플렉시티(Perplexity) 저작권 소송 -제1편-

AI는 남의 글을 어디까지 '공짜'로 쓸 수 있을까 - 공정이용의 경계선

by 정연주 변리사

최근 IT 업계와 법조계의 가장 뜨거운 화두는 생성형 AI 검색 엔진 서비스 '퍼플렉시티(Perplexity)'와 실리콘밸리 거인들을 상대로 한 뉴욕타임스(NYT)의 전방위적 공세이다. 2025년부터 2026년 초까지 이어지는 이 법적 공방은 단순한 저작권 논쟁을 넘어, 생성형 AI가 인간의 지적 결과물을 어디까지 '공짜'로 소비할 수 있는지에 대한 근본적인 질문을 던지고 있다.


1. 법이 허용하는 '선'은 어디인가? (저작권법 제35조의 5)


우리 저작권법은 저작권자의 권리를 보호하면서도, 문화 발전을 위해 예외적으로 허락 없이 저작물을 쓸 수 있는 '공정이용(Fair Use)' 제도를 두고 있다. 저작물의 공정한 이용에 해당하는지에 대해 우리 대법원은 네 가지 판단 기준을 제시한다.

이용의 목적 및 성격: 해당 이용이 영리적 목적에 해당하는가, 또는 교육·연구 등 비영리적 목적에 해당하는가? 원저작물과는 다른 새로운 의미나 기능을 부가하는 변형적 이용(transformativeness)인가?

저작물의 종류 및 용도: 원저작물이 사실 전달을 주된 목적으로 하는 저작물인가, 아니면 창작성이 높은 문학·예술 저작물인가?

이용된 분량과 질적 중요성: 이용된 부분이 원저작물 전체에서 차지하는 양적 비중뿐만 아니라, 저작물의 핵심적·본질적인 부분에 해당하는지 여부

시장에 미치는 영향: 해당 이용이 원저작물의 정상적인 이용 시장을 대체하거나, 저작권자가 합리적으로 기대할 수 있는 수익 기회를 침해하는지 여부


최근 국내 판례는 이 4번 항목, 즉 '원본 시장의 대체 여부'를 매우 엄격하게 보고 있다.


2. 최근 국내 판례가 보여주는 두 가지 얼굴


최근 국내에서 나온 두 개의 판결은 공정이용의 '경계선'이 어디인지를 명확히 보여준다.


시험 목적 이용의 한계에 관한 판례 (대법원 2021다272001 판결)

시험 문제를 출제하기 위해 저작물을 지문으로 이용하는 행위 자체는 정당한 목적에 따른 이용으로 허용될 수 있다. 그러나 시험이 종료된 이후에도 해당 문제와 지문을 인터넷에 게시하여 누구나 내려받을 수 있도록 한 행위는, 더 이상 ‘시험을 위한 이용’이라는 목적이 존재하지 않으므로 공정이용에 해당하지 않는다. 이와 같은 사후 게시 행위는 저작권자가 형성할 수 있는 잠재적 시장, 예컨대 기출문제집의 제작·판매 시장을 침해할 우려가 있어 공정이용으로 인정될 수 없다고 보았다.


홍보 목적의 제한적 이용에 관한 판례 (‘똑똑한 부엉이’ 사건, 2025. 1. 23. 선고)

아동 도서 대여업자가 도서 홍보를 위해 책의 표지와 일부 속지(1~2쪽)를 웹사이트에 게시한 행위는 공정이용에 해당한다고 판단되었다. 해당 이용은 소비자의 도서 선택을 돕기 위한 부수적·보조적 목적에 불과하고, 게시된 이미지의 해상도가 낮아 원저작물을 대체할 수 없으며, 오히려 도서의 인지도와 판매를 촉진하는 효과가 있다는 점에서 저작권자의 이익을 부당하게 침해하지 않는다고 본 것이다.


3. AI 검색과 언론 저작권의 충돌: 일본 언론사 소송이 던지는 질문


2025년 8월, 일본의 주요 신문사들은 미국의 생성형 AI 검색 엔진 서비스 'Perplexity'가 기사 이용 거부 의사를 무시하고 자사 기사를 대량 수집·요약해 서비스에 활용했다며 도쿄지방법원에 소송을 제기했다. 닛케이신문문, 아사히신문, 요미우리신문은 이 같은 AI 검색 구조가 이용자의 ‘제로 클릭’을 유도해 언론사의 광고·구독 수익을 잠식하고, 일부 잘못된 요약으로 언론의 신뢰까지 훼손한다고 주장한다.

제로 클릭 검색이란 사용자가 요약된 답변만 보고 원본 사이트를 방문하지 않는 현상을 말한다.


쟁점의 핵심은 일본 저작권법상 AI 학습 예외 규정의 범위와 그 한계에 있다. 신문사들은 퍼플렉시티가 대규모로 기사를 수집한 점, 유료 기사까지 포함한 점, 그리고 robots.txt 등 기술적 수단을 통해 명시된 이용 거부 의사를 우회한 점을 들어, 해당 행위는 더 이상 정당한 학습 목적의 이용으로 볼 수 없고 저작권자의 이익을 부당하게 해치는 이용에 해당한다고 주장한다. 특히 기술적으로 분명히 표시된 접근 제한을 무시한 데이터 수집은 위법성을 인정해야 한다는 입장이 점차 힘을 얻고 있다.

robots.txt는 웹사이트 운영자가 검색엔진이나 AI 크롤러에게 어떤 페이지를 수집·이용해도 되는지, 또는 금지하는지를 알리는 접근 제한 안내 파일이다.


여기에 더해, 검색증강생성(RAG) 방식의 서비스 구조 자체도 중요한 쟁점으로 부각되고 있다. RAG 서비스는 단순히 학습 단계에서 저작물을 활용하는 데 그치지 않고, 이용자의 질의에 응답하는 과정에서 외부 문서나 기사 내용을 실시간으로 불러와 답변 생성에 직접 사용한다. 신문사들은 이 과정에서 기사 내용이 일시적으로라도 복제·저장되고, 그 결과 생성된 응답이 원문과 실질적으로 동일하거나 매우 유사한 정보를 제공한다면, 이는 검색 보조나 경미한 이용의 범위를 넘어선다고 본다. 다시 말해, RAG 응답이 이용자에게 기사 내용을 사실상 전달하는 수준에 이른 경우, 이는 단순한 학습 이용이 아니라 저작물의 복제 및 공중송신에 해당할 수 있다는 것이다.

RAG(Retrieval Augmented Generation)는 AI가 답변을 만들 때 자체 학습 결과뿐 아니라 외부 문서·데이터를 실시간으로 찾아 결합해 응답을 생성하는 방식이다.


결국 신문사 측의 문제 제기는, AI가 저작물을 어떻게 학습했는지뿐만 아니라, 그 결과물이 서비스 단계에서 원본 콘텐츠를 어느 정도까지 대체하고 있는지에 초점이 맞춰져 있다. 기술적 거부 의사를 무시한 데이터 수집과, RAG를 통해 원문과 유사한 내용을 직접 제공하는 서비스 구조가 결합될 경우, 저작권 침해로 평가될 가능성이 높다는 주장이다.


이 분쟁은 법 제도가 AI 기술 발전을 충분히 따라가지 못하는 현실을 드러낸다. 이에 일본 언론계는 기술적 거부 표시의 법적 효력 강화, AI 기업과 언론사 간 라이선스 계약, 나아가 신문 기사 AI 이용을 통합 관리하는 권리 관리 체계의 필요성을 제기하고 있다. 이번 소송의 향방은 일본을 넘어, 한국을 포함한 각국에서 AI 서비스와 콘텐츠 산업이 어떤 규칙 아래 공존해야 하는지에 중요한 기준을 제시할 것으로 보인다.



작가의 이전글삼성 vs 화웨이 특허 소송