brunch

You can make anything
by writing

C.S.Lewis

by 고찬수 Mar 20. 2024

뉴욕타임즈 vs 오픈AI 소송의 의미

세계적인 유명 언론사 뉴욕타임스가 오픈AI(ChatGPT)를 저작권 침해 혐의로 고소했습니다. 자신들의 기사를 무단으로 사용하고 있다는 주장인데요. 이 소송의 결말이 어떻게 나오느냐 하는 것은 앞으로 인공지능의 발전에 상당한 파장을 줄 것으로 생각됩니다. NYT와 같은 언론사 입장에서는 ChatGPT로 대표되는 AI 챗봇이 자신들의 인터넷 트래픽을 빼앗아 광고 수익에 타격을 주게 될 것을 우려하여, 자신들의 지식재산에 기반해 AI 챗봇이 만들었졌다는 주장을 하고 있습니다. 언론사가 ChatGPT를 상대로 소송을 제기한 건 너희들이 학습을 하는데 우리 데이터를 무단으로 가져다가 지금의 인공지능 모델을 만들어 낸 거니까 우리한테 보상을 해라라는 개념입니다.

ChatGPT 입장에서는 만약에 뉴욕 타임즈 얘기를 그냥 오케이하고 들어주면 뉴욕타임스뿐 아니라 전 세계 모든 언론사에 다 돈을 줘야 되는 상황이 되는 겁니다. 그래서 ChatGPT를 만든 오픈AI는 공개적으로 이용할 수 있는 인터넷 상의 자료를 사용해 인공지능을 학습시키는 것은 ‘공정 이용’이라고 주장하고 있습니다. ‘공정이용’은 저작권자의 허가를 얻지 않고도 저작물을 제한적으로 이용할 수 있도록 허용하는 법적 개념인데요. 미국의 주요 판례가 그동안 인공지능 학습을 위해 인터넷 공간에 있는 저작물을 사용하는 것을 허용하는 의견을 내고 있습니다. 게다가 몇몇 유명 언론사들이 오픈AI와 뉴스 기사 사용에 대해 합의하기도 했습니다. 이런 상황을 종합해 볼 때, 뉴욕타임즈가 소송에서 유리한 환경은 아닌데요. 어쨌든 재판의 승패와 상관없이 이 세기의 소송은 상당히 중요한 이슈를 던지고 있습니다.

사진출처 : 로이터

ChatGPT와 같은 생성형 인공지능 모델들은 수많은 언어를 학습해서 지금의 엄청난 능력을 갖게 된 건데요. 이런 언어 학습을 위해서는 엄청난 규모의 데이터를 필요로 합니다. 그리고 얼마나 좋은 데이터를 가지고 학습을 하느냐에 따라서 보다 더 효율적인 인공지능이 만들어진다고 하기 때문에 전문가들이 인공지능 얘기를 할 때는 언제나 데이터의 중요성에 대해 얘기를 합니다. 전 세계 인터넷 데이터를 거의 독점하고 있는 구글, 페이스북 같은 빅테크 기업들이 미래 인공지능 시대에 선도적인 회사가 될 수 밖에 없는 이유도 엄청난 양의 데이터를 보유하고 있기 때문이라는 것이죠. 오픈AI 역시 ChatGPT를 만들어내기 위해서는 엄청난 양의 데이터가 필요했는데, 자체 서비스를 가지고 있지 않기때문에 인터넷에 올려져 있는 데이터들을 사용한 것입니다. 그런데 바로 이점이 인공지능 시대에 데이터를 가지고 있는 콘텐츠 기업들이 인공지능 기술을 독점하고 있는 빅테크 기업과 동등한 관계를 만들어낼 수 있는 포인트라고 생각합니다. 콘텐츠 기업들이 가지고 있는 데이터의 값어치에 대해 깊은 논의가 필요한 시기가 된 것이죠. 인공지능을 학습시키는 것에 효율적인 자료로 활용이 될 수 있기 때문에 인공지능에서 벌어들이는 돈의 일정 부분을 보상으로 가져가야 된다라고 하는 논리를 구체적으로 다듬어야할 필요가 있습니다. ChatGPT가 인터넷 데이터를 가져다가 학습을 했다고 하는데, 그렇다면 뉴욕타임즈의 기자가 쓴 기사도 있겠지만 일반 사람들이 블로그에 올린 글이라든지 유튜브에 올린 영상 등 일반 유저들이 올린 데이터들이 상당 부분 사용되어졌다고 할 수 있을 것 입니다. 이렇게 다양한 저작자들의 데이터를 사용하고 있다면 인공지능이 앞으로 벌어드릴 돈을 어떻게 창작자들에게 나눠줄 수 있을까를 깊게 고민해 봐야 되는 시간입니다.

인공지능 시대, 인공지능이 점차 사람이 하는 일을 대체하게 되면서 인간의 노동력이 위기에 빠질 것이라는 우려는 이제 현실이 되어가고 있습니다. 인공지능이 새로운 일자리를 만들거라고 하지만 다른 일자리로 옮겨가기 위해서는 교육이 필요하기에 일정 시간동안은 결국 직업을 잃을 수 밖에 없습니다. 이런 전환 과정에 엄청난 규모의 자금이 필요하다는 것이 대부분 전문가들의 공통된 의견입니다. 그래서 인공지능으로 돈을 버는 기업이나 사람들에게 세금을 걷어 이런 사회의 혼란을 일정 정도 상쇄시키는 방안을 만들어 보자라고 해서 나온 아이디어가 바로 ‘인공지능 세금(AI TAX)’입니다. 그 세금을 가지고 일반 사람들에게 기본소득이라고 해서 일정 정도의 금액을 나눠주는 것이 인류의 미래를 위해 필요하다는 의견인 것이죠. 일부에서는 이런 기본소득을 노동 의욕을 저해하는 공짜 돈이라 반대하기도 합니다. 인간이 일을 한다는 것은 단순히 돈을 버는 목적을 넘어서 자신의 꿈을 실현하는 도구가 되어야 한다고 생각하는 것이죠. 맞습니다. 우리는 그저 공짜 돈을 가지고 소비만을 위해 세상을 살고 싶지는 않습니다. 그런데 인공지능 세금으로 우리가 돈을 받는다고해도 그건 공짜 돈이 아닙니다. 우리는 영상을 유튜브에 올리고, 글을 블로그에 쓰고, 인스타에 사진을 올리는 창작 활동을 하고 있습니다. 이런 행동을 우리가 함으로써 인간이 만들어낸 데이터를 가지고 인공지능이 학습을 하는 것입니다. 이런 학습을 통해 만들어진 인공지능이 수익을 창출한다면 그것에 기여한 우리 모두는 인공지능의 학습 자료를 제공하고 있는 저작권자입니다. 모든 사람이 콘텐츠를 만들어내고 있다는 전제로 기본소득이라고 하는 것을 받을 자격이 충분히 있다는 것이죠. 뉴욕타임즈는 자신들의 기사를 ChatGPT가 가져가서 학습하는데 활용했다 라는 주장을 하고 있지만, 이 논리를 좀 더 확장해서 우리 모두가 인터넷 서비스에 콘텐츠를 생산해내고 있는 창작 주체라는 생각을 정교화할 필요가 있습니다. 인공지능 시대, 우리는 인공지능을 학습시킬 데이터를 만들어내는 창작 주체로 자리매김 되어야 합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari