2025 '세계 책과 저작권의 날' 기념 저작권 글 공모 참여
나는 시뮬레이션 연구자입니다. 자동차 분야 시뮬레이션 연구를 12년간 이어 보면서, 언제나 이전에 먼저 그 길을 걸었던 선배 연구자님들께 빚을 지고 있다고 생각합니다. 이 분들의 창조적 저작물─논문과 학술발표 혹은 저서─가 아니었다면 본인은 단 한 층도 지식을 쌓아 올릴 수 없었을 것입니다. 감사한 선배 연구자들은 북미 사람, 남미 사람, 유럽 사람, 아시아 사람, 중동 사람, 아프리카 사람까지 말 그대로 전 세계 곳곳에 계십니다.
과거에서 현재까지 이 분들께서 벽돌을 한 장 한 장 쌓아 올린 덕분에, 새롭게 시작하는 연구자는 지구촌 선배님들을 믿고 그 위에 아주 작은 모래알이라도 쌓아보려는 시도를 할 수 있습니다. 나와 같은 범인(凡人)도 연구라고 하는 고상한 지적 활동을 할 수 있는 '단초'는 앞선 지구촌 선배들의 창작물이자 저작물인 셈입니다.
구글 스콜라(google.scholar: 논문 검색 사이트)에서 수십, 수백 건 연구자의 저작물을 살펴보면, 모두가 친절한 선생님입니다. 감추거나 숨기기보다는 무엇 하나라도 독자에게 전하고 싶어 하는 진심을 느낄 수 있습니다. 어떤 분은 시간 순으로 일목요연하게 연구 흐름을 정리해 주시기도 하고, 또 어떤 분은 족집게 과외 선생님처럼 꼭 알아야 할 내용을 핵심 정리해 주기도 합니다.
문자 텍스트로 된 구글 스콜라에서의 창작물보다 살아 숨 쉬는 듯한 그들의 생생한 음성으로 들을 땐, 창작자의 열정을 느낄 수 있습니다. 대중 강연이 그렇습니다. 특히, 해외 컨퍼런스에서 문자 텍스트로만 접했던 분을, 실제 행사장에서 그분의 음성과 발표 자료로 전해지는 창작물은 그야말로 살아 숨 쉬는 듯합니다. 발표하는 연사는 참석자에게 감사의 표시로 최선을 다하고 참석자는 발표하는 연사의 소중한 이야기에 귀 기울입니다. 본인 또한 그 소중한 이야기에 귀 기울이며 하나도 놓칠 수 없단 생각에 녹음도 하고 그분의 발표 자료를 모두 사진 촬영하기도 했습니다. 이렇게 본인도 받은 만큼─빚을 진 만큼─다른 독자나 연구자에게 도움이 되어 선한 영향력을 끼칠 수 있기를 바라는 꿈도 키웠습니다.
지구촌 선배님들의 창작물을 자양분 삼아 본인도 조금씩 꿈을 키웠고, 운이 좋게 몇 차례 해외 저널에 투고하고 발표할 수 있는 영광도 얻었습니다. 어설프게나마 그 과정을 온전히 느끼며 다시 한번 창작의 고통과 어려움, 그리고 엄청난 시간을 들여야 하는 것까지 맛보았습니다.
이전 창작물들의 뒤를 잇되, 그 내용을 그대로 가져가서는 안되며, 인용하려는 출처를 정확히 표기했는지 세심하게 따져가며 써야 합니다. 인용에도 엄격한 저작권 규정이 있습니다. 실무에서는 전체의 10% 또는 1,000 단어 이하'라는 권고치가 널리 사용됩니다.[1] 뿐만 아니라 단순한 분량의 문제를 넘어, 공정이용 여부를 판단하는 네 가지 기준도 종합적으로 고려해야 합니다.[2]
<공정이용 여부를 판단하는 네 가지 기준>
(1) 원저작물을 사용하는 목적의 적절성
(2) 원저작물 중 사용하는 분량
(3) 원저작물의 창작적 가치
(4) 원저작물의 시장성 훼손 여부
인용 방법과 출처 표기와 함께 무엇보다 새로운 창작물이 갖추어야 할 것은 기존에는 없었던 자신만의 독창적인 관점이나 해석이 담겨 있어야 합니다. 독창성 여부는 저작물 관리 직원도, 카피킬러(표절 검사 프로그램)[3]도 아닌, 가장 먼저 자신이 알아차릴 수 있습니다. 본인 스스로 속이고 있는 것은 아닌지, 항상 자신과 충돌해야 하는 수고스러움까지 창작 활동에 포함됩니다.*
아는 것과 그 길을 걷는 것이 다르듯, 창작과 저작의 길을 조금 걸어본 후에야 창작물의 가치를 이해하게 되었습니다. 비로소 깨달았습니다. 앞에서 언급한 발표자의 강연을 녹음하고 발표 자료를 핸드폰 카메라로 스캔하듯 모조리 담는 행동이 경솔했다는 것을요. 꼭 필요하다면 발표 후에 발표자께 정중히 말씀드리는 게 맞습니다. 허락을 구해 당사자가 직접 공유 가능 여부를 판단하고 자료를 받는 것, 이것이 창작자의 노고를 인정하는 진정한 배려죠.
실제로 저작권법 제4조는 '강연·연설 및 발표 자료' 자체를 엄연히 창작물로 봅니다.[4] 연사의 슬라이드는 물론 음성까지 보호 대상입니다. 허락 없이 녹음이나 촬영으로 온라인에 올리면, 널리 퍼트릴 권리(공중송신권)와 복제할 권리(복제권), 동시에 침해하게 됩니다. 굳이 이렇게, "법대로 해!"와 같은 상막하고 날 선 문구가 없더라도 서로를 존중하는 마음이 먼저 통하길 바라봅니다.
저작권자와 이용자 사이에 존중과 배려가 공존하는 모습이 아름답습니다. 저작권은 결국 이 둘 사이(저작권자와 이용자) 관계가 핵심입니다. 그러나, 2022년 11월 30일 오픈AI에서 ChatGPT-3.5 등장을 기점으로 저작권자가 누구인지 알 수 없는 상황이 펼쳐지고 있습니다.
기술의 발전과 제도 사이에 간극인 것이죠. AI가 만들어낸 텍스트나 이미지, 음원의 저작권자는 모호합니다. AI 개발사일 수도, 프롬프트를 입력한 사용자일 수도, 아니면 AI가 학습한 수많은 데이터를 비율대로 나누어야 하는 게 옳은지 그 누구도 답할 수 없는 상황입니다. 그 이유 중 하나는 AI 개발사에서 LLM(Large Language Model, 거대 언어 모델)을 학습시킬 때 사용하는 데이터가 '블랙박스'이기 때문입니다. 어떠한 데이터를 학습했는지 공개하지 않습니다. 물론, 학습 데이터 고갈 문제**가 거론되는 것으로 봐서는 지구상에 있는 거의 모든 텍스트를 학습했다고 보는 게 옳은 것 같습니다.[5][6]***
텍스트뿐만 아니라 DALL-3의 '지브리 스타일'로 오픈AI는 활성 사용자를 역대급으로 늘렸지만, 저작권자와 이용자 사이 관계가 신뢰에서 불신으로 조금씩 옮겨지고 있는 것은 아닌지 걱정입니다. 스튜디오 지브리의 원작자, 미야자키 히야오 감독의 과거 발언에 우리는 한 번 귀 기울여 볼 필요가 있겠습니다.
"AI가 그린 결과물은 실제 작업하며 만드는 사람의 고통을 전혀 모른다."
"나는 이것이 생명에 대한 모독이라고 느낀다."
끝으로, 저작권자와 그 저작권의 이용자 사이에 '존중'이 무너지지 않기를. 우리 사람 사이엔 여전히 '선의'가 있으니까요.
[2] 법무부 자료, 미국 판례법상 패러디의 변형성과 공정이용법리 중 미국 저작권법 제107조
[5] Epoch AI, 인터넷 데이터 고갈 위기: 인간 창작물에 의존하는 AI 발전의 벽
[6] 스케일링의 효과: 입력 증가를 통한 AI 성능 향상(Our World in Data)
*표절 검사 프로그램은 단순히 텍스트 유사성만 확인할 뿐, 저작권법 제2조에서 정의하는 '창작성'이나 제35조의 3 '공정이용' 여부는 판단할 수 없다고 합니다. 진정한 독창성은 아이디어의 표현 방식과 관련 분야의 평가로 충분히 검증될 수 있을 것입니다.
**학습 데이터 고갈: AI 모델이 훈련에 필요한 고품질 데이터가 인터넷상에서 점차 소진되고 있는 현상을 의미합니다. 연구기관 Epoch AI에 따르면 현재의 AI 개발 추세가 계속될 경우 2026년쯤, 인터넷상에 더 이상 학습할 텍스트 데이터가 없을 것으로 예상되고 있습니다.[5]
***거대 언어 모델의 텍스트 학습 크기(아워 월드 인 데이터 제공)[6]