brunch

You can make anything
by writing

C.S.Lewis

by 고찬수 Sep 10. 2023

인공지능 학습용 데이터 그리고 우리의 권리


인공지능이 창작자들의 영역을 너무나 빠르게 점령해가고 있습니다. 이미 몇 년 전부터 이런 변화가 예견되었지만, 지금의 변화 속도는 예측보다  빠릅니다. 불과 얼마 전까지 만해도 몇몇 거대 기업의 연구실에서나 사용이 가능했던 인공지능이 이제 관련 지식이 있다면 누구나 접근할 수 있게 되어가고 있죠. 인공지능 창작의 대중화 시대가 열리고 있는 것입니다. 특히 ChatGPT는 인공지능이 어떤 변화를 우리 일상 생활에 줄 수 있을 것이냐라고 하는 걸 사람들에게 직관적으로 느끼게 해줬다는 점에서 혁신적인 변화를 가져온 팁핑포인트 역할을 한 것 같습니다. 인공지능이 너무나 빠른 속도로 콘텐츠를 생산해내는 것에 관련 업계가 긴장하고 있습니다. 

ChatGPT 같은 성능을 보이는 인공지능을 만들어내기 위해서는 엄청난 양의 데이터가 필요하다고 합니다. 그러면 인공지능이 학습을 하는데 필요한 데이터를 기업들은 어디서 가져다가 쓰고 있을까요? 우리가 인터넷에 올리는 엄청난 양의 글과 사진 그리고 영상들이 바로 인공지능의 학습 데이터가 되고 있습니다. 그렇다면 이 데이터의 저작권을 가진 사람들에게 인공지능 개발 업체는 보상을 해야할가요? 내가 저작권을 가지고 있는 콘텐츠가 인공지능의 학습에 활용이 됐다고 하면 그거에 대해서 정당한 보상이 있어야 된다는 얘기들이 나오기 시작했고, 나의 정보를 마음대로 가져가서 활용을 해도 되는 거냐 라는 이슈가 제기된 것입니다. 

먼저 영향력이 큰 언론사들이 인공지능 개발을 하고 있는 빅테크 기업들에게 콘텐츠 생산자로서의 목소리를 내기 시작했습니다. 뉴욕타임스, CNN, 오스트리아 ABC 등 전 세계 유수의 언론사들이 오픈AI의 chatGPT가 자신들의 뉴스 콘텐츠를 긁어가는 걸 막겠다고 선언했습니다. 그들은 ChatGPT가 자신들의 기사를 공짜로 가져다가 인공지능을 학습시켜 새로운 콘텐츠를 만들어내는 것에 대해 반대하는 목소리를 내고 있습니다. 한국 언론사 중에는 SBS가 비슷한 행보를 보였는데요, 곧 더 많은 기업들이 이런 움직임에 동참할 것으로 보입니다. 인공지능을 개발하는 회사들이 정당하게 돈을 지불하고 데이터를 가져가서 인공지능을 학습을 시켜야 한다는 것은 당연한 주장처럼 보입니다. 그럼 일반 사람들이 인스타그램이나 페이스북, 블로그 등에 올린 데이터들은 어떻게 가치를 환산해서 보상받아야 할까요? 인공지능 학습에 사용되는 데이터를 규제하는 것이 관련 기술의 발전을 저해하는 것은 아닐까요? 너무나 많은 복잡한 문제들을 우리 인류는 어떻게 지혜롭게 풀어낼 수 있을까요?

인공지능 시대의 콘텐츠 창작을 두고 벌어지는 이러한 고민들은 철학의 문제고 가치관의 문제인 것 같습니다. 특정 플랫폼이 성장하는데 그 플랫폼을 이용하는 이용자들도 일정정도 기여를 했기때문에 그 기여한 부분에 대해서 보상이 필요하다는 것입니다. 그래서 참여한 모든 사람들이 성장의 과실을 함께 얻을 수 있고 win-win 하는 환경이 만들어져야 한다고 합니다.  참여하는 사람, 이걸 활용하는 사람, 소비하는 사람들도 함께 이 생태계를 만들어 가는 주인공이라는 새로운 시대의 철학이 필요하다고 합니다. 단순한 콘텐츠 소비자가 아니라 생태계의 주인공이라는 것을 사업가들이 존중하고 인정해야만 새로운 미래가 가능하다는 생각입니다.  인공지능 시대에 사회의 구성원인 인간들이 어떤 권리를 갖고 있고 어떤 혜택을 받아야 되는지에 대한 고민들이 논의되고 있는 것입니다. ChatGPT 개발을 한 Open AI의 CEO 샘 알트만이 월드코인(World Coin)을 통해 일종의 보편소득을 나눠주려는 프로젝트를 시도하고 있는 것도 이러한 고민의 일환이라고 볼 수 있을 것입니다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari