유튜브 영상, 보는 것과 가져오는 것은 왜 다를까

Snap 소송 핵심 정리

by 이한결

Apr 13. 2026

분쟁 분석

AI 학습보다 먼저 따져야 할 것: Snap 소송이 묻는 ‘유튜브 파일 접근’의 문제

또 하나의 AI 학습 소송처럼 보이지만, 이 사건의 실제 질문은 파일 취득 경로다.

사건명: Ted Entertainment, Matt Fisher, Golfholics v. Snap

핵심 조항: DMCA §1201

핵심 포인트: YouTube 파일 접근

2026년 1월 23일, Ted Entertainment, Matt Fisher, Golfholics가 Snap을 상대로 캘리포니아 중부 연방법원에 소송을 냈습니다. 공개 소장에 따르면 원고 측은 Snap이 YouTube의 기술적 제한을 우회해 대량의 영상을 내려받아 생성형 인공지능 학습에 활용했다고 주장합니다.

다만 현재 공개적으로 확인되는 핵심 자료는 소장과 공개 도켓, 그리고 당사자·플랫폼의 공식 자료 정도이고, Snap의 본격적인 방어논리는 공개 범위에서 아직 확인되지 않습니다.

이 사건이 흥미로운 이유는, 흔히 떠올리는 “AI가 저작물을 학습해도 되는가”라는 질문으로 바로 들어가지 않기 때문입니다. 공개 소장은 그보다 먼저 “YouTube에서 영상을 파일 형태로 가져오는 과정이 적법했는가”를 문제 삼습니다. 말하자면 이 사건의 첫 관문은 공정이용 일반론이 아니라, 접근통제 우회입니다.

사건 개요부터 정리해 보겠습니다

공개 소장상 원고는 Ted Entertainment, Matt Fisher, Golfholics입니다. 피고는 Snap이고, 사건번호는 2:26-cv-00754입니다. 소장 본문은 청구의 출발점을 DMCA(디지털 밀레니엄 저작권법) §1201의 반우회 금지 조항에 두고 있습니다. 도켓 메타데이터상 사건이 저작권 사건으로 분류돼 있기는 하지만, 실제 소장 본문에서 전면에 놓인 것은 일반적인 저작권 침해 프레임보다 “기술적 접근 제한을 우회했는가”라는 주장입니다.

공개 소장 첫머리에서 원고 측은 Snap이 YouTube의 “기술적 조치”를 우회해 수백만 개의 저작권 보호 영상을 가져와 대규모 생성형 인공지능 모델을 훈련·개선·상용화했다고 적습니다. 같은 부분에서 원고 측은 Snap이 텍스트와 이미지 입력으로 영상 출력을 생성하는 시스템을 설계·훈련 중이라고 주장하고, 현재 서비스 기능의 예시로 “Imagine Lens”를 언급합니다. 이 역시 지금 단계에서는 법원이 인정한 사실이 아니라 원고 측의 주장이라는 점을 분리해서 읽어야 합니다.

여기서 한 가지는 정확히 짚어둘 필요가 있습니다. 공개 소장은 Imagine Lens를 Snap의 생성형 인공지능 기능 예시로 끌어오지만, Snap의 공식 발표를 보면 Imagine Lens는 2025년 9월 공개된 이미지 생성 Lens입니다. 반면 Snap은 2025년 12월 “Animate It”을 공개하면서 이를 자사 최초의 영상 생성 Lens라고 설명했습니다. 그래서 소장을 읽을 때는 특정 기능 하나를 곧바로 사건의 대상 제품으로 단정하기보다, Snap의 생성형 인공지능 기능군 전반을 설명하는 문맥으로 이해하는 편이 더 정확합니다.

img.png?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1777561199&allow_ip=&allow_referer=&signature=hG4keRqauOtPUVMNouS7DVC06VI%3D

이 사건의 출발점은 ‘학습’보다 ‘파일 접근’에 있다.

이 사건이 왜 그냥 ‘AI 학습 소송’이 아닌가

공개 소장이 반복해서 강조하는 것은 YouTube에서의 시청과 파일 접근의 차이입니다. 소장은 YouTube가 대중에게 허용하는 것은 통제된 스트리밍일 뿐이고, 원본 영상 파일(underlying video files) 자체에 대한 접근은 제공하지 않는다고 적습니다. 그리고 원고가 문제 삼는 행위는 영상을 “본 것”이 아니라, 파일 단위(file-level) 접근을 위해 별도의 도구와 우회 과정을 사용했다는 데 있다고 주장합니다.

이 구조는 왜 중요할까요. 저작권 분쟁에서는 흔히 “결과적으로 얼마나 비슷한가” 또는 “학습이 공정이용인가”가 먼저 거론됩니다. 그런데 §1201은 그보다 앞단에 있는 문제, 즉 저작물에 접근하는 문턱 자체를 어떤 방식으로 넘었는가를 따집니다. 17 U.S.C. §1201은 “저작물에 대한 접근을 효과적으로 통제하는 기술적 조치”를 우회하는 행위를 금지하고, 여기서 ‘우회’는 단순히 복제했다는 뜻이 아니라, 스크램블을 풀거나, 암호를 해독하거나, 그 밖의 방식으로 기술적 조치를 피하거나 무력화하는 것을 뜻합니다.

법문도 이 점을 분명히 합니다. 같은 조항은 또 “이 조항이 공정이용을 포함한 저작권 침해 관련 권리·구제·제한·항변을 바꾸는 것은 아니다”라고 적고 있습니다. 즉 §1201은 저작권 침해와 별도로 작동하는 층위가 있고, 그래서 이 사건도 공정이용 논쟁으로 바로 넘어가기 전에 접근통제 우회 여부를 먼저 다툴 수 있습니다.

공개 소장이 그리는 취득 경로

원고 측은 공개 소장에서 HD-VILA-100M과 Panda-70M을 연결고리로 제시합니다. 소장에 따르면 HD-VILA-100M은 YouTube 영상들로 구성된 데이터셋이고, 영상 파일 자체를 담고 있는 것이 아니라 YouTube 영상에 대한 포인터와 구간 정보 등을 담고 있습니다. 그래서 이 데이터를 실제 학습에 쓰려면, 각 참조 영상을 다시 YouTube에서 직접 내려받는 단계가 필요하다는 것이 원고 측의 설명입니다. 소장은 Snap이 그 과정을 대규모로 수행했다고 주장합니다.

Snap 계열의 공개 연구자료도 Panda-70M이 HD-VILA-100M에서 380만 개의 긴 영상을 수집해 7,080만 개의 클립으로 분할했다고 설명합니다. Panda-70M 공개 페이지는 이 데이터가 공개 데이터셋에서 수집된 영상 샘플로 구성돼 있고, 비디오 생성 모델 학습을 위한 추가 주석도 도입했다고 밝힙니다. 이 부분은 적어도 데이터셋의 구조와 연구적 용도에 관한 공식 자료입니다. 다만 그 과정에서 특정 원고 영상이 어떤 방식으로 취득됐는지, 그리고 그 취득 행위가 법적으로 우회에 해당하는지는 여전히 소송에서 다퉈질 문제입니다.

더 민감한 대목은 도구와 절차입니다. 공개 소장은 Snap이 yt-dlp, 가상머신, IP 주소 갱신 같은 방법을 사용해 YouTube의 감시와 차단을 피하면서 영상을 가져왔다고 주장합니다. 또 이러한 과정이 YouTube의 플레이어 페이지(player page)를 거치지 않고, 오디오·비디오 스트림을 병합해 학습용 패키지로 넘기는 방식이었다고 적습니다. 하지만 이 부분은 지금 단계에서 어디까지나 원고 측이 적어 놓은 기술적 서사이고, 법원이 사실로 확정한 내용은 아닙니다.

핵심 법적 쟁점

YouTube의 제한은 법적으로 어떤 의미를 가질까

이 사건을 이해하려면 YouTube가 무엇을 허용하고 무엇을 허용하지 않는지부터 봐야 합니다. YouTube 공식 약관은 사용자가 서비스와 콘텐츠를 “서비스가 제공하는 방식대로” 이용할 수 있다고 규정하고, YouTube와 권리자의 사전 허락이 없는 한 서비스나 콘텐츠의 일부를 접근·복제·다운로드·배포·수정하는 행위를 금지합니다. 또 보안 관련 기능이나 복제·이용을 제한하는 기능을 우회하거나 방해하는 행위, 로봇·봇넷·스크래퍼 같은 자동화 수단으로 서비스에 접근하는 행위도 금지합니다.

YouTube가 다른 이용자에게 부여하는 라이선스도 중요합니다. 공식 약관은 다른 이용자가 콘텐츠를 이용할 수 있는 범위를 “서비스의 기능이 허용하는 범위”로 제한하고, 서비스와 독립적으로 콘텐츠를 활용할 권한은 주지 않는다고 적습니다. 이 조항은 이번 사건에서 원고 측이 말하는 “스트리밍 허용”과 “파일 단위 취득”의 차이를 이해하는 데 직접 연결됩니다.

다만 이 문제를 약관 위반만으로 단순화하면 안 됩니다. YouTube 공식 도움말을 보면, 업로더는 자신이 올린 영상을 다운로드할 수 있고, Premium 가입자는 제한된 범위에서 오프라인 저장 기능을 이용할 수 있습니다. 하지만 다른 이용자의 영상을 일반적으로 내려받을 수 있는 것은 아니고, Premium으로 저장한 영상도 기기에 암호화된 상태로 저장돼 YouTube 앱 안에서만 볼 수 있습니다. 즉 YouTube는 아예 어떤 저장 기능도 없다고 말할 수는 없지만, 공식적으로 허용하는 저장 방식은 서비스 안쪽에 묶여 있습니다.

그래서 이 사건에서 남는 핵심 질문은 하나입니다. YouTube의 약관, 다운로드 제한, 앱 내 오프라인 구조, 자동화 접근 제한, 그리고 추가적인 기술적 장치가 함께 놓였을 때, 법원이 이를 §1201이 보호하는 “효과적인 기술적 조치”로 볼 것인가. 공개 소장은 그렇다고 주장하고 있고, 그 주장이 받아들여질지 여부가 이 사건의 중심입니다.

최근 공개 판결이 보여주는 선

이 지점에서 참고할 만한 공개 판결이 하나는 YouTube 쪽으로, 다른 하나는 웹 크롤링 쪽으로 나와 있습니다.

먼저 2026년 1월 23일 Northern District of California의 Cordova v. Huneault입니다. 이 사건에서 법원은 YouTube의 “롤링 사이퍼(rolling-cipher) 기술”이 무단 다운로드를 막기 위한 기술적 조치라는 원고 주장을 소장 단계(pleading stage)에서 충분하다고 봤습니다. 판결문은 동영상이 공개적으로 시청 가능하다는 사실 자체는 결정적이지 않다고 보았고, 공개 시청과 별개로 내려받을 수 있는 파일(downloadable files)에 대한 접근을 제한하는 기술적 장치가 문제 될 수 있다고 적었습니다. 또 도구의 구체적 명칭이나 사용 일시를 소장에서 완벽히 특정하지 않았다고 해서 곧바로 §1201 주장이 무너지는 것은 아니라고 판단했습니다.

반대로 2025년 12월 18일 Southern District of New York의 Ziff Davis v. OpenAI는 로봇 배제 표준(robots.txt)만으로는 §1201상 “저작물에 대한 접근을 효과적으로 통제하는 기술적 조치”가 되지 않는다고 봤습니다. 그 판결은 robots.txt가 결국 봇 운영자가 스스로 읽고 따르기로 설정해야만 의미가 생기는 지시 파일에 가깝고, 그 자체로는 접근을 막는 기술적 제어라고 보기 어렵다고 설명했습니다.

이 두 판결을 나란히 놓고 보면, 법원이 보는 것은 “약관이 있느냐 없느냐”가 아닙니다. 실제로 어떤 기술적 장치가 있었는지, 그 장치가 접근을 통제하는 방식으로 작동했는지, 그리고 상대방이 그것을 어떤 방식으로 피했다고 볼 수 있는지입니다. Snap 사건에서도 바로 그 부분이 정리돼야 합니다.

왜 원고는 저작권 일반론보다 §1201을 앞세웠을까

공개 소장은 이 점도 꽤 노골적으로 드러냅니다. 소장은 많은 YouTube 영상이 미국 저작권청에 등록돼 있지 않다고 적으면서, 그 사실이 영상을 무가치하게 만드는 것은 아니고, 접근통제 우회에 대한 보호에는 등록이 전제요건이 아니라고 주장합니다. 원고 입장에서 보면 “내 영상이 결국 어느 정도 학습됐는가”를 입증하는 것보다, “파일에 접근하는 문턱을 넘는 방식 자체가 위법했다”고 주장하는 편이 더 직접적인 소송 전략이 될 수 있습니다.

이 전략에는 실무적 이유도 있습니다. 공정이용 논쟁으로 들어가면 변형성, 시장대체성, 학습 결과물의 성격, 학습 데이터의 범위 같은 논점이 크게 열립니다. 반면 §1201은 그보다 앞단에서 접근 방식을 다투게 만듭니다. 그래서 이 사건은 “AI 학습은 공정이용인가”라는 큰 제목으로 묶어 버리면 오히려 실제 쟁점이 흐려집니다.

집단소송으로서는 어디가 어려울까

공개 소장은 이 사건을 전국 단위 집단소송으로 설계하고 있습니다. 제안된 클래스는 미국 내에서 original videos를 YouTube에 올렸고, 그 영상 또는 그 실질적 부분이 HD-VILA-100M과 Panda-70M에 포함돼 Snap에 의해 스크랩·다운로드됐다고 주장되는 사람들입니다. 소장은 수천 명 규모를 예상하고, 공통성·전형성·우월성도 주장합니다.

하지만 집단소송은 소장을 그렇게 쓴다고 자동으로 성립하지 않습니다. Rule 23은 다수성, 공통성, 전형성, 적절성뿐 아니라, 나중에는 인증(certification) 결정을 통해 실제로 클래스를 인증할지를 별도로 판단하도록 합니다. 결국 법원은 “공통 쟁점이 개별 쟁점보다 우세한지”, “어떤 기준으로 클래스 멤버를 가려낼 수 있는지”, “손해와 금지명령을 어떤 구조로 다룰 수 있는지”를 따로 봐야 합니다. 지금 단계에서 “전국적 집단소송이 성립했다”거나 “대규모 법정손해가 사실상 예정돼 있다”고 쓰는 것은 이릅니다.

게다가 공개 도켓 기준으로는 아직 complaint만 확인될 뿐입니다. 다시 말해 Snap이 §1201의 요건, YouTube 조치의 성격, 클래스 정의 방식, 공통성 문제를 어떻게 다툴지는 아직 공개 범위에서 확인되지 않았습니다. 글을 쓸 때는 “예상되는 방어 포인트” 정도만 다루고, 실제 항변이 공개된 것처럼 쓰지 않는 편이 맞습니다.

img.png?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1777561199&allow_ip=&allow_referer=&signature=QajIqZxnVIu2yKALF5iB1aM2rss%3D

쟁점은 단순한 복제가 아니라, 접근통제를 어떤 방식으로 넘었는지에 모인다.

업계 맥락

한국 콘텐츠 업계가 이 사건을 왜 봐야 하나

이 사건이 한국에 주는 메시지는 꽤 선명합니다. 플랫폼에 영상을 올렸다는 이유만으로, 그 영상이 곧바로 서비스 바깥의 독립된 파일 자원으로 풀리는 것은 아니라는 점입니다. YouTube 공식 약관도 이용 권한을 서비스 기능 안에 한정하고 있고, 다른 이용자의 독립적 이용 권한은 주지 않는다고 적습니다. 플랫폼 기반 유통이 일상화된 환경에서는 이 차이가 계약, 데이터 관리, 콘텐츠 보호 전략에 그대로 이어집니다.

실무적으로 남는 포인트

국내 제작사나 매니지먼트, 크리에이터에게 실무적으로 남는 포인트는 세 가지입니다.

“업로드했으니 누구나 학습해도 된다”는 식의 막연한 이해는 위험합니다.

이용약관과 서비스 구조, 다운로드 제한, 오프라인 저장 방식처럼 플랫폼이 만들어 둔 기술적 경계를 함께 봐야 합니다.

앞으로 생성형 인공지능 분쟁은 결과물의 유사성만이 아니라 데이터 취득 경로의 적법성을 중심으로 전개될 가능성이 큽니다.

마무리

지금 시점에서 이 사건을 두고 “Snap의 책임이 이미 드러났다”거나 “반대로 원고 주장이 무리다”라고 단정할 단계는 아닙니다. 공개 자료 기준으로는 아직 원고의 소장과 일부 외부 자료만 보일 뿐이고, 본격적인 쟁점 정리는 앞으로의 절차에서 이루어질 것입니다.

다만 한 가지는 분명합니다. 이 사건은 생성형 인공지능 분쟁을 볼 때 시선을 어디에 둘지를 바꿔 놓습니다. 앞으로 유사 사건을 읽을 때는 “무엇을 학습했는가”만 보지 말고, 그 데이터에 어떤 경로로 접근했는가, 플랫폼의 제한을 어떻게 해석할 것인가, 그리고 그 제한이 법적으로 보호되는 수준의 기술적 조치였는가를 함께 봐야 합니다. Snap 소송은 바로 그 지점을 정면으로 드러낸 사례입니다.

짧은 note

keyword

작가의 이전글매직 존슨 이름이 붙은 NFT 소송메타는 왜 ‘셀럽 사칭 투자광고’ 운영자를 고소했을까작가의 다음글