PM의 별책부록 003
2023년은 가히 생성형 AI의 시대였다.
익히 들어보았을 Chat GPT, Dall-2, 미드저니부터 시작해서 스노우의 AI 필터, 업스테이지의 Askup, 네이버 클로바와 Cue 등의 생성 AI를 활용한 한국의 각종 서비스들이 발 빠르게 나와 일반 대중들에게도 생성형 AI를 활용한 스마트하고 즐거운 경험들을 선사했다.
내가 일하고 있는 라이언로켓도 이미지 생성 AI를 활용한 간편한 이미지생성 서비스 포킷 Pokeit부터
웹툰 솔루션인 젠버스 Genvas까지 다양한 서비스를 빠르게 준비해 테스트했고, 누적 투자 140억이라는 뜻깊은 성과를 이뤄내기도 했다.
생성형 AI는 잘 활용하면 무조건 득이 되는 기술이지만, 아직 국내외적으로 저작권이나 활용가능 범위에 대한 대중적 합의가 잘 이루어지지 않았다. 서비스를 만드는 사람이나 이용하는 사람 모두 약간의 찝찝함 속에서 나름의 가이드 라인을 구축하고 있는 양상이다.
그러던 중 때마침 2023년 12월, 문체부에서 공식적으로 [생성형 AI 저작권 안내서]를 발행했다. 하나같이 꼼꼼히 살펴보면 좋을 내용들이지만 107페이지에 달하는 문서이기 때문에 최대한 요점만 간단히 요약해보았다.
*주의*
현재 내가 관심있는 분야가 ‘이미지 생성’ 파트라서 조금은 이미지 쪽으로 약간 편향된 요약일 수 있다.
오해의 소지를 줄이기 위해 자의적 해석보다는 원문을 그대로 발췌하는 방식을 사용했다. 더 많은 정보가 궁금하신 분들은 꼭 원문을 읽어보시길 추천드린다.
생성형 AI의 저작권과 활용안에 대해서는 나처럼 서비스를 만드는 사람들은 물론이거니와, 그것을 실제로 사용하게될 유저들도 어느 정도 숙지하고 있다면 좋을 것 같다. 기술이란 만드는 사람만큼 사용하는 사람의 올바름을 통해 건강하고 안전해지기 마련이니까.
생성형 AI에는 크게 두 가지 저작권적 쟁점들이 존재한다.
첫 째로 AI를 학습시키는 단계에서 무분별하게 데이터를 수집하거나 별도의 동의를 얻지 않고 인터넷에 공개된 정보들을 크롤링(Crawling)하여 생겨나는 쟁점.
두번 째로는 학습된 AI로 만든 '산출물'이 기존에 저작권을 가진 저작물과 유사하여 저작권을 침해하는 것에 대한 쟁점.
- AI 학습 단계에서의 저작권 쟁점
AI 학습 목적으로 인터넷에 공개된 데이터를 무단으로 이용하는 경우 저작권법상 각 데이터에 포함된 저작물에 대한 복제권 등의 침해 여부가 주요 쟁점
- AI 산출물의 저작권 침해 쟁점
생성 AI 산출물은 이용자의 프롬프트 등 입력에 따라서 학습 완료된 AI 모델로부터 확률적으로 도출된 것
그렇기 때문에 AI 산출물이 저작권 침해에 해당될 시 침해자가 누구인지에 대한 쟁점이 발생함
위 내용을 확인해보면 생성형 AI 저작권 문제에 대해서 사업자 뿐만 아닌 이용자, 파운데이션 모델 제작자 등에게 각각 책임을 부여하려는 태도가 엿보인다. 즉, AI 모델을 만드는 사람이 저작권 의식을 갖는 것도 중요하지만 이를 활용해 서비스를 만드는 사업자, 그리고 그것을 사용하는 사용자 모두가 건강한 저작권 의식을 가져야함을 강조한다.
기존에 AI모델 제작자와 사업자에게 대부분의 책임을 부과했던 것에서 좀 더 완화된 방향으로 발전한 것 같다.
- AI 학습 과정에서의 저작물 이용
저작재산권은 권리자의 독점을 무제한으로 인정하는 것이 공공은 이익에 부합하지 않으며, 문화 발전에도 지장을 줄 수 있음. 따라서 저작재산권이 제한되는 사유를 정하여 일정한 경우에는 권리자 허락없이 저작물을 이용하더라도 침해를 주장할 수 없도록 함.
- AI 학습 목적의 저작물 이용과 관련해서는 공정이용 규정 (저작권법 제35조의5)의 적용 여부가 주요 쟁점으로 부각.
여전히 의견 대립이 있으며 국내외 법원에 해당 규정 적용 여부를 직접적으로 판단한 판례는 없음. 판례가 축적되기 전까지는 저작권 침해 가능성이 존재함.
일정한 요건 하에 저작권자로부터의 별도 이용허락 없이도 저작물의 복제등을 허용하는 이른바 텍스트 및 데이터 마이닝(TDM) 규정 관련 저작권법 개정안이 국회의 계류 중
공정이용 규정이란?
열거적 저작재산권 제한 규정으로는 규율이 곤란한 다양한 저작물 이용 상황을 포섭하기 위해 도입된 규정
가장 많은 논란이 있었던생성 AI 학습 단계에서 타인의 저작물을 무단 학습하는 것에 대한 앞으로의 방향성을 엿볼 수 있는 대목이었다.
‘권리자의 독점을 무제한으로 인정하는 것이 공공의 이익에 부합하지 않으며, 문화 발전에 지장을 줄 수 있다’는 내용은 생성 AI 산업과 문화 발전을 위해 AI 학습을 위한 사용에 대한 규제들이 일부 완화될 것을 암시하는 듯하다.
데이터 마이닝(TDM) 규정 관련 저작권법 개정안이 국회에서 논의되는 것에 따라 앞으로의 AI 학습에 대한 규정에 큰 변화가 있을 것으로 보인다.
- 바람직한 저작물 이용 방법
AI 학습을 위한 데이터 수집 시 가급적 사전에 저작권자로부터 적법한 이용 권한을 확보하여 분쟁 발생 가능성 미연에 방지
저작권자와 계약 체결 시 저작물의 이용 목적/범위/기간 등에 대하여 구체적으로 명시할 필요가 있음
각종 자유이용 저작물 혹은 한국 저작권 위원회의 ‘인공지능 씨앗 프로젝트’ 등을 활용하는 방안
하지만 아직 해당 법이 개정되기 이전이라서인지 여전히 창작자들의 권익 보호를 위해 위와 같이 저작물 이용에 대한 권고안을 주기도 했다.
- AI 산출물의 저작권 침해 문제
AI 산출물이 기존의 저작물과 같거나 유사하다고 판단되는 경우 문제가 제기될 수 있음
1. 의거성 : AI 산출물이 기존 저작물을 인식하고 이에 근거하여 만든 것인지
2. 실질적 유사성 : AI 산출물과 기존 저작물이 같거나 유사하다고 볼 수 있는지에 대한 판단에 따라 저작권 침해 여부가 결정
***궁극적으로 AI 산출물의 저작권 침해 여부는 구체적 사실관계 등을 고려하여 법원의 판단을 통해 결정됨
다음은 서비스를 사용하는 ‘이용자’들을 위한 가이드라인이다.
자신이 만든 AI 산출물이 타인의 저작물을 ‘인식하고 이에 근거’하여 만들었고 결과적으로 산출물이 유사하다면 저작권 침해로 인정될 수 있다.
물론 이와 같은 사례와 판례가 없기 때문에 여러 정황과 사실 관계를 고려하여 ‘법원의 판단’으로 결정된다고 덧붙였다.
아래 구체적인 예시로 이해를 더해보자.
- 원하는 AI 산출물을 만들어 내기 위해서 입력하는 텍스트나 이미지, 오디오 등의 데이터가 타인의 저작권을 침해하거나 침해를 유도하지 않도록 유의
텍스트 예시 )
‘뽀로로’ 처럼 유명 캐릭터를 직접 언급해 유도하는 프롬프트를 입력 후 산출물을 활용하는 경우
이미 존재하는 소설 등의 스토리를 자세하게 입력하여 이와 유사한 스토리의 창작을 유도하고 이를 블로그 등에 게시한 경우
이미지 및 영상 )
이용자가 특정 이미지나 영상 그 자체를 무단으로 입력한 뒤 생성된 AI 산출물을 이용할 경우 ‘복제권 등의 저작권 침해 소지’
음악 )
이용자가 타인의 음악 저작물을 무단 입력하여 생성된 AI 산출물을 이용할 경우 역시 복제권 등의 저작권 침해 소지가 있음
ex. ‘마이클 잭슨’의 목소리로 ‘BTS’의 노래를 부른 음원을 제작하여 유튜브에 게시한 경우
이렇듯 해당 이슈에서는 이용자가 ‘특정 저작물’을 생성하기 위해 어떤 프롬프트를 입력했는지가 주요 판단 근거가 될 것 같다.
비록 이용자의 과실이 크다고 하더라도 해당 플랫폼에서 그를 유도하거나 암시했다면 문제가 될 수 있다.
예를 들어 이미지 생성 서비스에서 ‘지브리 스타일’을 선택해 지브리 저작권을 침해하는 산출물을 만들었다면
해당 스타일을 제공한 서비스와 생성한 이용자 모두에게 책임이 부과될 수 있다.
또한 요즘 쇼츠나 릴스에서 많이 보이는 AI 커버곡에 대해서도 ‘복제권 등의 저작권 침해 소지가 있음’을 명시했다.
이런 컨텐츠를 주로 만들고 있던 사람들은 반드시 조치를 취해야할 것 같다.
- 인터넷 등 누구나 접근 가능하게 공개된 저작물
자신의 저작물이 AI학습에 이용되는 것을 원하지 않을 시 그에 반대하는 의사를 적절한 방식으로 명시하거나 이를 방지하기 위한 기술적인 조치를 취하는 것이 적절
이미 인터넷 공간에 공개된 저작물이므로, 그와 같은 조치 등을 취하지 않을 경우 분쟁 발생 시 사안에 따라 ‘묵시적 이용허락’ 등이 쟁점화될 수 있음
이 부분은 데이터 사용자만큼 저작권자에게 표기에 대한 권고를 강하게 하는 느낌이라, 저작권자 입장에서는 상당히 번거롭고 불합리하다고 생각될 수 있을 것 같다.
그럼에도 저작권자에게 이를 권고하는 이유는 아마 사안에 대한 모호함 때문일 것이다.
2부에서 추가로 다루겠지만 앞으로 해외 사례들을 참고하여 법과 규정을 발전시켜가려는 태도를 가지고 있는데, 아직은 국내외로 판례가 부족하기 때문에 저작권자가 권리를 보호받으려면 일말의 근거라도 있어야 유리하기 때문이다.
AI 학습에 본인의 저작물이 사용되고 싶지 않다면 작업 계정의 프로필이나 여타 채널들을 통해 ‘원치 않는다’는 표기를 추가해두는 것이 좋을 듯하다.
구체적인 표기의 내용은 로봇배제표준을 참고해도 좋다.
이미 AI 학습에 내 저작물이 사용된 적이 있는지 찝찝한 기분이 든다면 해당 사이트 Have I Been Trained 에서 검토해볼 수 있다.
최근에는 각 저작물이 AI 학습 등에 제공되었더라도 유사한 산출물이 도출되는 것을 방지하는 기술들도 등장하고 있다.
ex. C대학 연구팀의 ‘글레이즈’ - AI 학습에 이용될 때 원본과 다른 형태로 인식되게 함으로써 스타일 모방을 방지
M대학 연구팀의 ‘포토가드‘ - 사람은 인식할 수 없는 방법으로 원본 이미지에 조작을 가함으로써 AI가 해당 이미지를 편집/변경하지 못하도록 하는 기술 공개
지금까지 사업자, 이용자, 저작권자에 대한 저작권법 가이드라인을 요약해보았다.
원 문서가 궁금한 사람들은 링크를 통해 PDF 문서를 다운로드할 수 있다.
그럼 2부에서는 계속해서 AI로 만든 산출물의 저작권리가 어떻게 형성될 수 있는지에 대해 다루어보겠다.
*이 글의 모든 출처 및 권한은 문체부의 ‘생성형 AI 저작권 안내서’에 있다.