우리 AI에게 뭘 먹이지?

AI와 일자리 문제(8)

by 오징쌤

최근 KBS에서 방영된 '추적60분 - 당신의 직업은 안녕하십니까' 편은 AI 시대를 맞이한 우리에게 꽤 묵직한 질문을 던졌다. 특히 인상 깊었던 대목은 자신의 적성을 일찍 발견해 애니메이션 디자이너로 활동 중인 한 고등학생의 사례였다. 3만 명이 넘는 사람들이 그의 인스타그램 계정을 팔로우할 정도로 시장에서도 인정받았다. 그는 자신의 인스타그램 프로필에 "내 그림을 AI 학습용으로 쓰지 말아달라"고 써두었지만, 얼마 지나지 않아 자신의 그림체를 그대로 따라하는 생성형 AI를 서비스하는 회사를 알게 되었다. 그만의 독특한 개성까지 그대로 따라하는 것을 보면, 그의 컨텐츠로 AI를 훈련시켰을 가능성이 높아 보였다. 그는 자신의 컨텐츠로 훈련을 멈춰달라고 요청하기 위해 그 업체에 연락을 시도했지만 아무런 답변도 받지 못했다.


AI가 똑똑해지려면 질 좋은 데이터로 AI를 훈련시켜야 한다. 그것도 아주 많은 데이터가 필요하다. 문제는 AI를 훈련시킬 데이터의 저작권이 거의 논의되지 않는다는 점이다. 많은 AI 개발사들은 제도적 장치가 제대로 갖춰지지 않은 '회색 지대'를 파고들어서 창작자들에게 허락을 구하거나 적절한 보상을 주지 않고 데이터를 긁어모아 AI를 훈련시킨다. 그나마 뉴욕타임스 같은 거대 언론사는 자본과 법률 팀을 동원해 글로벌 IT 기업들과 맞서 싸우기라도 한다. 그리고 워너 브라더스나 디즈니처럼 가치있는 컨텐츠를 가지고 있는 기업들은 비싼 값으로 팔리기도 한다. 하지만 그럴 힘이 없는 개인 창작자들은 자신의 권리가 침해당해도 대응할 방법이 거의 없다. 이런 시간이 길어지면 결국 언제가는 아무도 컨텐츠를 만들지 않게 되지 않을까.


나는 AI로부터 많은 도움을 받고 있는 입장에서 AI의 성능이 좋아지면 좋겠다. 하지만 AI의 성능을 높이는 과정에서 창작자들의 저작권을 무시한다면 결국에는 부메랑이 되어 돌아올 것이다. 정당한 보상을 받지 못하는 창작자들이 더 이상 새로운 콘텐츠(곧 데이터)를 만들지 않게 되면, AI를 학습시킬 '신선한 원천 데이터'를 잃게 되기 때문이다. 결국 사람이 만든 데이터가 고갈되어 AI가 만든 데이터로 다시 AI를 학습시키게 되면, AI의 품질은 마치 복사기를 반복해서 돌려서 만든 결과물처럼 점차 망가지게 될 것이다. 이러한 시나리오를 막기 위해 최근 흥미로운 개념이 등장했다. 바로 저작권에 'AI 학습 권리(러닝 라이트, Learning Right)'를 포함하자는 논의다.


기존의 저작권법은 복제권(Reproduction Right), 2차적 저작물 작성권(Derivative Works Right), 배포권(Distribution Right), 공연권(Public Performance Right), 전시권(Public Display Right), 디지털 음성 전송권(Digital Audio Transmission Right) 등 여섯 가지 배타적 권리를 보호해 왔다. 그러나 여기에는 'AI 학습'이라는 현대적인 사용 방식이 포함되어 있지 않았다. 이에 코넬대와 MIT 등 세계적인 학자들은 기존의 저작권 개념을 보완하는 일곱 번째 권리로서 '런라이트(Learnright)'를 제안했다. 이는 AI가 창작물을 학습에 사용할 때 창작자가 이를 허용하거나 거부할 수 있는 명확한 권한을 부여하자는 것이다. 마치 우리가 음악 스트리밍 서비스를 이용할 때 가수에게 저작권료가 지불되듯, AI가 특정 데이터를 학습할 때도 그에 따른 비용을 지불해야 한다는 논리다.


'런라이트'의 핵심은 AI 학습 자체를 금지하는 것이 아니라, '라이선스와 보상'을 조건으로 하는 중도적 접근 방식에 있다. 창작자는 자신의 작품을 AI 학습에 쓰게 할지 말지 스스로 결정하고, 별도의 계약을 통해 사용료를 받을 수 있다. AI 서비스를 만드는 기업 입장에서도 매번 개인 창작자와 접촉할 필요 없이, 음원 저작권 협회 같은 중개 기관을 통해 정해진 가격에 대량의 학습 데이터를 합법적으로 구매할 수 있을 것이다. 전 세계 정부가 생성형 AI 규제안을 두고 고심하는 가운데, 런라이트는 산업 발전과 저작권 보호라는 두 마리 토끼를 잡을 수 있는 현실적인 대안으로 꼽힌다. 뉴스 아카이브나 이미지 라이브러리에 대한 라이선스 구매가 활성화되면 AI 기업은 소송 리스크에서 벗어날 수 있고, 사회적으로는 지식 생산의 선순환 구조가 정착될 수 있다.


현재의 AI 논의는 데이터센터, GPU, HBM 같은 하드웨어와 속도 경쟁에 지나치게 쏠려 있다. 물론 AI의 학습과 추론 능력을 높이는 것도 중요하지만, 학습에 들어갈 '연료'라고 할 수 있는 데이터를 어떤 과정을 거쳐 수집할지는 훨씬 더 중요한 문제다. 벌써 업계에서는 AI가 학습할 양질의 데이터가 바닥나고 있다는 우려가 들려온다. 창작자들이 마음 놓고 새로운 아이디어를 내놓고 데이터를 생산할 수 있는 환경이 조성되지 않는다면 AI 기술의 미래도 불투명하다. 하드웨어에 쏟는 관심만큼이나 창작자의 창의력과 아이디어에 대한 정당한 보상 체계를 만드는 데 힘을 쏟아야 한다. AI는 결국 인간의 지능을 보조하는 도구이며, 그 도구의 영양분은 인간의 창의성에서 나오기 때문이다. 인간의 창작 활동이 존중받는 생태계 위에서만 비로소 AI는 진정으로 지속 가능한 발전을 이룰 수 있을 것이다.







keyword
작가의 이전글AI 때문에 개발자의 역할이 더욱 중요해진 이유