“디즈니, 픽사, 마블, 스타워즈…” 이미 많은 사람들이 알고 있는 것처럼 디즈니라는 거대한 세계 아래에 세분화되어 있는 IP(지식재산권)는 정말 놀라울 정도죠. 각각이 하나의 세계관 혹은 멀티버스로 광범위하게 확장된 개념을 이루고 있는 만큼 등장하는 캐릭터도 많고 그에 대한 시리즈물까지 차고 넘치는 수준에 이릅니다. 디즈니플러스라는 이름의 OTT 플랫폼에만 들어가 봐도 수많은 콘텐츠들이 진열되어 있고 “이것도 디즈니?”라고 할 정도로 생각하지 못했던 것들까지 목격할 수 있답니다.
사실 캐릭터를 만들어내고 콘텐츠를 제작하고 있는 사업자 입장에서는 이만한 효자도 없을 것입니다. 물론 투자한 만큼 흥행했다면 더할 나위 없겠죠. 미야자키 하야오의 지브리 스튜디오도 디즈니에 못지않습니다. ‘토토로’는 지브리의 중심축을 이루는 듯 그의 몸집처럼 안정적이고 <센과 치히로의 행방불명>에 등장했던 캐릭터 또한 엄청난 사랑을 받았죠. <모노노케 히메>, <하울의 움직이는 성> 등 오랜 시간 동안 자리 잡은 지브리의 IP 또한 셀 수도 없이 많습니다.
글로벌 아티스트로 거듭난 블랙핑크의 경우 세계적인 그래픽 디자이너 베르디(Verdy)와 함께 콜라보레이션 하여 홍대에 팝업 스토어를 내기도 했습니다. 슈퍼73 브랜드의 전기자전거도 블랙핑크 에디션으로 재탄생했는데 700만 원짜리 10대 한정판에 오픈런 주자들이 대거 몰렸다고 합니다. 팝업스토어의 경우 임시 매장의 개념이라 반짝했다가 사라져 버리곤 하는데 특정 IP를 바탕으로 굿즈를 만들거나 공간을 꾸며 대중에게 공개하고 프로모션 합니다. 블랙핑크와 베르디의 팝업스토어는 YG엔터테인먼트의 계열사이자 YG 아티스트의 IP(지식재산권)를 기반으로 콘텐츠를 제작. 유통하는 ‘YG플러스’에서 운영했습니다.
흔히 IP(Intellectual property rights)라 불리는 지식재산권은 말 그대로 지식재산에 대한 권리를 말합니다. 무언가를 발명했다거나 특정 상표 혹은 디자인 등 산업 분야의 재산권이 포함될 수도 있고 문학작품이나 뮤지션들의 음악, 미술작품까지 통틀어서 표현할 수 있는 저작권을 의미하기도 합니다. 사람의 지적 활동으로 인해 발생하는 모든 재산권을 의미하고 무형의 것이지만 엄청난 가치가 있답니다.
지금의 생성형 인공지능은 글을 만들어내기도 하고 악보를 생성할 수도 있으며 사용자 입맛에 맞는 그림도 그립니다. 어쩌면 위에서 언급했던 저작권 콘텐츠가 될 수 있다는 것이죠. 이 때문에 생성형 인공지능이 만들어내는 결과물에도 지식재산권을 적용해야 하는지에 대한 이야기가 나오고 있습니다. 챗GPT를 통해 만들어진 결과물은 방대한 데이터에서 조합한 생성 콘텐츠입니다.
어떤 백과사전의 내용을 결과물로 추출했을 수도 있고 동화책이나 소설, 혹은 불특정 다수의 언론사 기사에서 이를 발라내고 조합해서 생성했을 수도 있습니다. 동화책도 만들고 소설에 담길만한 콘텐츠도 만들어내는 생성형 인공지능은 크리에이티브 분야에서 인간의 능력을 넘보고 있고 영향력 또한 대단하다는 걸 쉽게 알 수 있을 것입니다.
그렇다면 생성형 인공지능이 유저 쿼리에 따라 뱉어낸 결과물에 대한 저작권은 어떻게 해결하면 좋을까요? 보통 저작권이란 사람(개인 혹은 단체)에게 있다고 합니다만 사람이 아닌 생성형 인공지능의 결과물에 대해서도 그 가치를 인정해야 하는 것일까요? 실제로 사람이 얼마나 개입했는지에 따라 또 달라질 수도 있다는 것이 ‘인공지능 저작권 이슈’랍니다. 여기에 저작권 침해 문제를 이야기하는 것도 전혀 어색하진 않겠죠.
게티이미지(Getty Image)는 글로벌 클라이언트 약 83만여 명을 보유하고 있고 약 5억 건 이상의 이미지와 영상 클립을 가진 거대한 이미지 뱅크입니다. 스테이블 디퓨전 AI(Stable Diffusion AI )는 2022년 8월 출시된 생성형 인공지능으로 텍스트를 입력하면 이미지로 결과물을 추출하는 대표적인 ‘Text-to-image’ 기반의 생성 AI입니다. 그런데 스테이블 디퓨전 측이 게티이미지의 저작권 콘텐츠를 침해했다면서 소송을 제기하기도 했습니다. 게티이미지 소유의 이미지 관련 메타데이터를 사용해 인공지능을 학습시켰다는 것이죠.
미국뿐 아니라 영국에서도 동일한 이슈로 소송이 제기되었습니다. 미국의 어떤 아티스트들은 “우리 작품을 사용 승인도 없이 학습자료로 활용했다”면서 스테이블 디퓨전과 미드저니 측에도 소송을 제기하기도 했는데 문제는 ‘사실 관계 입증’이었습니다. 알다시피 생성형 인공지능이 학습하는 방식 때문에 이러한 일들이 발생하게 되는 것이죠. 세상에 널려있는 데이터를 모아 패턴을 식별하고 복제하고 정제하고 또 학습하면서 작동하게 됩니다. 학습한 데이터는 유저 쿼리에 맞춰 텍스트부터 음악, 사진, 미술작품, 코드에 이르기까지 다양하게 조합하여 생성합니다. 소송을 제기한 아티스트들은 ‘어디까지나 불공정경쟁이고 부당이득을 취한 것이며 명백한 저작권 침해’라고 목소리를 높입니다.
생성형 인공지능을 대표하는 오픈 AI 측은 ‘LLM(Large Language Model)’이라 불리는 대용량 언어모델의 ‘혁신’을 위한 것이고 공정이용으로 인정될 수 있다고 받아칩니다. 빅테크 기업과 저작권을 가진 수많은 개인 및 단체 사이의 분쟁은 21세기형 콜라주 시스템(21st century collage tool)이라 불리는 생성형 인공지능 탄생으로 인해 생겨난 새로운 이슈이기도 합니다. 이렇다 할 전례도 없고 명확하게 선을 긋지 않은 케이스들이 차곡차곡 빠르게 쌓여가고 있는 것이죠. 현존하는(혹은 현존했던) 저작권법이라는 것은 생성형 인공지능 탄생 이전에 마련되었을 것입니다.
그래서 이러한 이슈에 대응하기 위한 정책들이 조금씩 생겨나거나 수정되고 있는 중이랍니다. 그러나 “생성 AI가 만들어낸 창작물에 저작권을 부여할 수 있을까”라는 지극히 근본적인 질문을 던질 것이 아니라 어쩌면 생성형 인공지능과 함께 공존하는 방법에 대해 고민해야 할지도 모릅니다. 디지털 대전환 시대와 본격 인공지능 시대에 맞춰 관련 법령이나 제도권 모두 리뉴얼해야 한다는 것이죠. 물론 저작권 ‘침해’에 따른 아티스트의 보상 체계도 충분히 마련될 수 있도록 검토가 필요하겠죠.
언론사들이 쓰는 뉴스 기사를 학습해서 활용하는 빅테크 기업들의 인공지능 모델에 대해서도 이슈가 있었습니다. 한국신문협회에서는 ‘생성형 인공지능의 뉴스 저작권 침해 방지를 위한 입장’을 내놓기도 했습니다. 생성 AI의 학습 데이터 출처를 공개하고 뉴스 콘텐츠를 어떻게 이용하는지에 대한 방식을 명기하는 것 그리고 뉴스 콘텐츠에 대한 대가를 산정하는 기준 등 국내외 굵직한 빅테크 기업들에 요구했다고 하죠. 네이버의 경우 클로바X라는 한국어 기반의 생성형 인공지능을 출시했는데요.
신문협회는 네이버가 ‘무려 50년간의 뉴스 데이터와 9년 치에 달하는 블로그 데이터를 학습했다’라고 전했습니다. 국내 언론사들의 뉴스 기사를 AI 학습에 활용했을 테니 저작권을 침해한 것으로 보는 것이죠. 그러면서도 인공지능 테크놀로지의 발전과 같이 디지털 대전환 시대에 맞는 제도 개선이 필요하고 저작권 보호 근거도 제대로 마련해야 한다고 합니다. 공생하고 공존하되 분쟁이 일어나지 않도록 적절한 보상 체계를 마련해야 하고 저작권법의 기본 원칙도 인정할 줄 알아야 한다는 이야기입니다.
로봇 저널리즘이라고 해서 주식 시황이나 날씨, 스포츠 기사를 사람이 아닌 인공지능이 작성하는 경우들이 있습니다. 물론 팩트체크라던가 논설이나 사설, 기획형 기사나 현장에서 일어난 일을 직접 취재해 작성하는 르포형 기사들은 인간이니까 할 수 있는 영역입니다. 단순히 스코어를 작성하고 주식 그래프에 따른 숫자를 표기하여 텍스트로 완성하는 건 인공지능이 사람보다 더 빠르게 만들어낼 수 있습니다. 이렇게 인공지능이 특정 영역에서 임무를 수행하게 되면 인간은 또 다른 영역에서 인간이 할 수 있는 일을 수월하게 해낼 수 있는 것입니다.
결국 저널리즘이라는 것도 인공지능과 공존하면서 발전과 성장을 도모할 수 있는 것 아닐까요? 물론 사람의 손이 필요합니다. 인공지능 알고리즘이 어떻게 표현하느냐에 따라 왜곡의 여지가 있을 수 있기 때문에 교열이든 수정이든 ‘데스킹’이라는 과정을 거쳐야 합니다. 네이버에서는 ‘자동생성기사’라고 표현하고 인공지능이 만들어 낸 기사를 따로 구분 짓습니다. 언론사에서는 ‘데이터를 기반으로 특정 알고리즘에 의해 자동 작성하지만 편집자의 데스킹을 거쳤다’라고 명시합니다. 혹자는 이를 하이브리드라고 말하기도 합니다. 사람과 인공지능이 함께 만들어낸 기사인 셈이죠.
챗GPT와 같은 생성형 인공지능이 등장한 이후 인간과 인공지능의 영역 싸움과 분쟁은 현실이 되었습니다. 과도기를 겪고 있는 지금 이 순간이 지나면 인공지능과의 공생을 목격하게 될 것입니다. 전문가들은 말합니다. 사람이 하는 업무의 대다수를 인공지능이 대신하게 될 것이라고 말이죠. 그만큼 인공지능의 발전속도는 어마어마한 수준입니다. 지금도 빅테크 기업들은 인공지능의 고도화를 위해 밤낮없이 연구를 지속하고 있을 것입니다. 챗GPT 이후 쏟아진 생성형 인공지능 모델만 봐도 그렇죠.
오픈 AI(GPT4), 구글(Bard), 메타(LLaMA2)에 이르기까지 해외 빅테크는 물론이고 국내에서는 LG(Exaone), 네이버(CLOVA X)까지 굵직한 기업들이 자신들이 구축한 인공지능을 경쟁시장 전면에 내세우고 있는 상황입니다. 네이버의 경우만 해도 하이퍼클로바X라는 거대언어모델을 개발한 뒤, 이를 기반으로 한 클로바X를 공개한 적이 있죠. 그리고는 네이버 검색 점유율 쇄신을 위한 ‘큐:(Cue:)’라는 새로운 모델을 내놓기도 했습니다. “새로운 건 끝도 없이 쏟아지는 것 같은데 지속 가능성은 고민하고 있는 것일까?” 저작권 침해라는 이슈만 봐도 그렇죠.
사실 테크놀로지가 이를 해결할 순 없습니다. 법적 효력이 있는 제도나 정책 마련도 중요하겠지만 위에서 언급했던 아티스트, 미디어 등 IP를 가진 저작권자와 인공지능을 개발하는 빅테크 기업 간의 담론 그리고 같이 먹고사는 ‘상생’에 대한 고민도 반드시 필요할 것입니다.
<뉴스 저작권 보호.신문사 공용 AI 시스템 개발 필요>(2023.07.16), 신문협회보(Vol 712)
<Current AI Copyright Cases – Part 1>(2023.03.30), copyrightalliance.org
<The scary truth about AI copyright is nobody knows what will happen next>(2022.11.16), The Verge
해당 콘텐츠는 Pen잡은 루이스님과 모비인사이드의 파트너쉽으로 제공되는 기사입니다.