왜 작가들은 뿔났을까, 인공지능의 과제는?
2~3년 전만 하더라도 브런치에 글을 쓰고 어울리는 사진을 찾느냐 한참 시간을 보냈다. 요즘엔 생성형 AI가 워낙 잘 발달돼서 글에 대한 설명을 하면 곧잘 글과 어울리는 그림이 나타난다. AI 기술을 발전으로 인해 일상 속에 생성형 AI가 꽤나 깊숙이 파고들고 있다. 이렇게 일상생활 속에 자주 쓰이는 생성형 AI는 여러 데이터를 기반으로 학습하여 텍스트나 이미지를 생성한다. 생성형 ai 모델은 텍스트, 오디오, 이미지 등 여러 유형의 데이터를 훈련하고 학습하면서 훈련받은 데이터와 유사한 새로운 콘텐츠를 생성하게 된다. GPT 3와 같은 텍스트 생성 모델은 훈련 데이터에서 학습한 패턴을 기반으로 인간과 유사한 텍스트를 생성하는 형태이다.
데이터를 훈련하고, 학습하는 과정에서 데이터 세트의 저작권 문제가 심심치 않게 발생하고 있다. 2023년 7월 미국의 SF 소설가 폴 트램블레이는 챗 GPT를 고소하였다. '똑똑똑'이라는 영화로까지 만들어진 소설 작품은 소설가의 동의 없이 내용을 무단으로 가져다 학습하였다는 것이 주된 고소 내용이었다. 캐나다 소설가 '모나 아와드'역시 챗 gpt의 문제를 지적하였다. 훈련 데이터가 자신의 작품을 동의 없이 훈련한 것에 대한 저작권 침해 문제를 제기하고 있다. 인공지능은 수많은 데이터를 끊임없이 학습하고 진화하면서 더 나은 결과물이 나오게 된다. 데이터가 있어야 끊임없이 학습하고 진화할 수 있는 상황에서 과연 저작권의 영역은 어디까지로 구분해야 하는 것일까?
AI의 저작권 문제는 일반적인 저작권에 비해 꽤나 복잡하고 상황에 따라 해석이 다르다. 일단 저작권에 대해 살펴보면 저작권은 저작권은 창작자의 권리 보호를 하기 위한 목적으로 창작물에 적용된다. 물론 AI가 생성한 작품 역시 저작권 보호를 받을 수 있다. 이때 AI가 창작한 작품은 프롬프트를 생성한 사용자 혹은 작품을 만든 개발자가 저작권자로 간주된다. 저작권에서 가장 중요한 문제는 데이터의 출처와 사용에 대한 권한이다. AI가 학습하는 데이터의 경우 원 저작권자의 허락을 받아야 사용할 수 있다. 만약 허락 없이 AI가 학습하는데 이용된다면 법적인 문제가 발생할 수 있다.
허락 없이 데이터를 사용하고 학습하는데서 빈번한 저작권 문제가 발생하고 있다. 뉴욕타임스는 2023년 12월 뉴욕타임스에 기고된 뉴스를 챗GPT가 무단으로 학습하는 데 사용했다고 주장하며 소송을 제기하였다. 소송은 계속 진행 중이며 2024년 현재까지 이어져 뉴욕타임스의 뉴스 중간에 챗GPT가 글을 무단으로 학습하고 있다는 문구가 배치되고 있다. 뉴욕타임스의 주장은 챗GPT의 챗봇을 학습하는데 기사가 인용되면서 뉴욕타임스에 수십억 손해를 입혔다는 것이다. 뉴스 매체 외 미국의 소설가 존 그리샴, 왕좌의 게임의 원작자 조지 R R 마틴 등도 챗 GPT가 자신들의 창작물을 허락 없이 학습해 글을 생성하고 있다는 이유로 소송을 제기하였다. 이렇게 허락 없이 인공지능 업체가 데이터를 사용하고 학습하면서 저작권 문제가 나타나고 있다.
유니버설 뮤직과 콩코드 퍼블리싱 역시 AI 챗봇 '클로드'의 회사 '앤트로픽'을 상대로 소송을 제기하였다. 유니버설 뮤직은 챗봇 클로드가 뮤지션의 가사를 무단으로 도용해 사용자에게 제공하는 것은 명백한 저작권 침해라고 주장하였다. 스포티파이 등도 가사를 제공하고 있긴 하지만 가사 콘텐츠를 활용할 때마다 일정 가사 라이선스 비용을 지불하고 있다. 하지만 챗봇 클로드의 경우 데이터 사용에 대한 허가를 받지 않은 채 비욘세, 브루노 마스 등의 유명 가수들의 데이터를 학습하면서 저작권 문제가 불거지고 있다.
이에 데이터를 갖고 학습한 생성형 AI 회사들의 입장은 인터넷에 누구에게나 열린 데이터로 게시된 상태의 내용을 활용했다는 입장이다. 오픈 AI의 초기 투자자인 '앤드리슨 호로위츠'는 만약 저작권 문제로 데이터 활용을 막는다면 AI 발전을 죽이거나 크게 후퇴시키는 문제라고 지적하였다. AI 개발 업체들도 데이터 저작권 소송에 대해 크게 반발하고 있다. AI 저작권으로 창작자와 AI 개발자 간 갈등이 첨예하게 대립되자 마이크로소프트는 고객이 MS의 AI를 사용하며 저작권 침해 소송을 당할 경우 이에 대한 책임을 지고 법적 비용을 부담한다는 성명을 발표하기도 하였다.
3. 인공지능에 맞서 저작권을 지키려는 움직임
과연 인공지능의 발전을 위해 창작자의 데이터를 허가 없이 사용하는 것을 사회가 받아들일지는 아직 첨예한 갈등이 뒤따르고 있다. 텍스트, 음악, 미술, 영상 분야의 창작자들은 자신들의 창작물을 지키기 위한 노력이 이어지고, AI 개발 업체들은 AI 성능을 높이기 위한 데이터 확보를 필사적으로 진행하고 있다. 허락 없이 창작자들의 창작물을 인공지능이 가져가 활용하는 것을 원치 않은 창작자들은 다양한 방법으로 저작권을 지키고자 노력하고 있다. 구체적으로 자신의 창작물에 워터마크나 메타 데이터를 작품에 삽입한다. 사진작가의 경우 자신의 사진에 저작권 정보나 연락처 등 여러 정보를 메타데이터로 삽입하는 것이다. 이 메타데이터는 이미지에 남아 추후 생성형 AI로 활용되더라도 소유권을 부여하는데 도움이 된다.
창작자들은 저작권을 지키기 위해 강력하게 법적 조치를 취하는 경우도 있다. 음반사와 출판사, 아티스트 등 창작자는 AI를 사용해 저작권 자료 침해하는 콘텐츠를 생성하는 AI 플랫폼 상대로 법적인 조치를 취하고 있다. 저작권법상 창작자, 저작권리자의 허락을 받지 않은 기업은 자신의 사업을 위해 타인의 저작물을 복제하거나 배포, 전시할 수 없기에 창작자들은 저작권법을 근거로 소송을 제기하고 있다. 이에 각 국가의 정부는 발 빠르게 가이드라인을 제정하고 있다. 국내에서는 2023년 12월 문화체육부에서 '생성형 AI 가이드라인'을 마련하였다. 생성형 AI 사용 시 주의해야 할 점, 저작권 등록 등 저작권자와 이용자 등이 알아야 할 가이드라인을 제정하였다. 문화체육부가 마련한 가이드라인에서는 '인간의 창작 개입 없이는 AI 산출물에 대한 저작권 등록이 불가하다.'라고 명시하였다. 또한 '학습 데이터에 대한 적법한 권한을 확보할 것을 권고한다.'는 문구를 기재해 창작자의 저작권을 함께 보호하고자 하였다.
저작권 관련하여 인공지능으로 만든 창작물에 대한 저작권리를 인정할 것인지도 시간에 따라 해석하는 입장이 모두 다르다. 2023년 6월 그래미상을 운영하는 레코딩 아카데미는 인공지능으로만 만든 음악은 '그래미 어워즈'에 참가할 자격이 없다는 규정을 만들었다. 그래미 상을 받기 위해서는 노래의 대부분을 인간이 작곡해야 한다고 선언한 것이다. 인간 저작물만이 그래미상 시삭에 적합하다고 공헌을 하면서 인간의 창작물을 중요하게 다루고 있다. 물론 2024년 초 다시 인공지능을 활용해 제작된 곳이 그래미상 후보에 오르면서 해당 가이드라인은 계속 보완하고 있다. 공신력 있는 협회나 기관에서 'AI 활용'에 대한 가이드라인을 엄격히 지정하는 것 역시 인공지능에 맞서 저작권을 지키는 방안이 될 수 있다. 이렇게 인간의 창작을 중요하게 다루는 인식 역시 인공지능에 맞서 저작권을 지키려는 움직임이라 볼 수 있다.
저작권 침해 문제, AI의 역할은 무엇일까
인공지능의 발전으로 함께 붉어진 사회 문제가 '저작권 침해'에 대한 문제이다. 인공지능이 더욱 똑똑해지려면 양질의 데이터가 필수적으로 필요하다. 양질의 데이터는 곧 창작자의 피와 땀이 섞여있는 노고의 산물이기에 인공지능의 발전과 창작자의 권리가 상충되고 있는 실정이다.
창작자의 권리를 지키기 위해 인공지능이 역으로 저작권 위반을 감지하는 솔루션 등을 제시하기도 하였다. 메타의 AI 팀 개발자 2명은 LLM의 잠재적 저작권 위반을 감지하는 '카피라잇캐처(CopyrightCatcher)'와 같은 솔루션을 제시하기도 하였다. 창작자의 편에 서서 인공지능 기술로서 저작권을 보호하려는 움직임이 일어나고 있는 것이다.
한편으론 인공지능이 분명 인간의 삶 전반적으로 도움을 주고 있기에 더 똑똑한 인공지능을 위해 데이터를 활용하도록 규제가 마련돼야 한다는 움직임도 일고 있다. 만약 저작권 침해 책임을 인공지능 개발 업체가 짊어지게 된다면 인공지능 업체의 수익모델은 흔들릴 수밖에 없고 적극적인 기술 개발이 어려워질 수밖에 없기 때문이다.
기술의 속도가 사회의 속도보다 훨씬 빠른 가운데 결국 창작자, 인공지능 개발자, 정책입안자 간의 사회적 합의가 무엇보다 필수적인 시점이다. 기술 발전의 보폭을 맞추기 위해 인공지능 저작권에 대한 가이드라인 제정과 함께 법적, 윤리적 프레임 워크가 제정되는 것이 필요한 때이다. 지금도 진행 중인 인공지능 저작권 문제는 계속해서 문제를 풀어나가는 단계이다. 앞으로 이 문제를 어떻게 해결할지는 각 이해관계자들의 지속적인 대화와 합의가 필요하다.