brunch

공정 이용(Fair Use)

by 고찬수

인공지능 분야에서 저작권은 굉장히 미묘한 이슈인데요. 복잡한 인공지능 저작권 관련해서 특히 최근에 많은 이슈가 되고 있는 것이 ‘Fair Use’입니다. '공정 이용'이라고 우리말로는 번역을 하고 있습니다.

‘공정 이용(Fair use)’은 특정한 경우에 저작권자의 허락 없이 저작물을 사용할 수 있도록 허용하는 제도로, 주로 공적인 목적이나 사회적 이익을 위한 이용에 적용되고 있습니다. 인공지능 분야에서 이 개념이 최근 논란이 되고 있는 이유는 바로 ChatGPT 때문입니다. ChatGPT 는 LLM(Large Language Model) 즉 대규모 언어 모델이잖아요. 이름에서 알 수 있듯이 이 인공지능 모델은 엄청나게 많은 언어 자료를 인공지능에게 학습시켜서 만들어낸 겁니다. 그런데 이렇게 엄청나게 많은 언어 자료를 과연 어디서 가져와서 학습을 시켰는가 라는 것이 문제가 됐습니다. 미국의 언론사들은 자신들의 기사를 오픈AI에서 무단으로 사용하여 ChatGPT를 학습시켰다고 주장하였고, 뉴욕타임즈는 ChatGPT를 개발한 오픈 AI에 소송을 제기했습니다. 자신들의 콘텐츠를 무단으로 가져다가 사용한 거니까, 이거에 대한 보상이 필요하다라고 주장을 한 겁니다. 콘텐츠 창작자 입장에서는 보상을 받아야 된다고 하는 것이 상식적으로 이해가 됩니다.

AD_4nXcxLoDbYwj48LXT-MqmWl0S-4L4aE49Gguo9f1xrV9EWroxFzpxfdBZleMCsBmi70eLi4p5HSInlYrIdY-tpTqeyo4_VP3N6ajB399oIRRb4XA8UnVRLZdIrPzfxIFa85aqwQQOmg?key=hEX7BB9GjiowTFdavskjTg

그런데 인공지능 개발 회사들의 입장은 다릅니다. 정확하게 어떤 언어 자료를 얼마나 인공지능 학습에 사용했는지 밝히고 있지는 않지만, 상식적으로 ChatGPT 같은 LLM 인공지능 모델은 세상에 존재하는 거의 모든 언어 자료를 가져다가 학습을 시켰을 것으로 판단됩니다. 그 중에 뉴욕타임즈의 기사들도 포함되어 있을 수 있겠죠. 그리고 인공지능 모델을 지속적으로 발전시키기 위해서는 앞으로도 더 많은 언어 자료를 학습에 이용해야 할 것입니다. 만약 학습에 이용하는 자료들의 창작자들에게 보상을 해야한다면, 미래의 인공지능 개발에 엄청난 콘텐츠 사용료가 필요하게 됩니다. 지금도 조 단위의 엄청나게 많은 자금이 인공지능 개발에 들어가고 있는데, 여기에 콘텐츠 보상 비용까지 부가된다면 큰 부담이 될겁니다. 그러면 인공지능을 사용하는 사람들에게 어쩔 수 없이 그 돈을 전가할 수밖에 없다고 주장합니다. 지금도 인공지능 모델 사용료가 일반 사용자에게는 싸다고 할 수 없어, 인공지능을 많은 사람들이 사용하는데 걸림돌이 될 수도 있다고 주장하고 있는 것이죠. 저작권을 예외로 면제해 주는 공정이용에 인공지능을 학습시키는 용도도 포함되어야 된다라는게 인공지능 개발사들과 빅테크 기업들의 입장입니다.

결국 법원으로 판단의 책임이 넘어가 있는 상태인데요. 어느 쪽 손을 들어주는게 맞냐라는게 지금 큰 이슈가 되고 있습니다. 트럼프 2기에 들어서는 아무래도 미국의 경쟁력을 더 강조하는 기조가 되다 보니,

인공지능 학습 데이터를 공정 이용에 포함시켜야 한다는 분위기가 강한 것만은 사실인 듯합니다. 중국이라는 강력한 도전자와의 경쟁에서 승리하려면 일단은 인공지능 개발에 우호적인 환경을 조성하는 것이 필요하다는 생각을 하고 있는 것입니다. 우선은 인공지능 개발에 들어가는 장애물들을 해결해 주고,

그 이후에 거기서 나온 이익이나 결과물의 혜택을 많은 사람들이 공유할 수 있도록 하는 방향으로 가야 된다라는게 지금 미국 정부의 기조인 거 같습니다. 어떤 결론이 나오니냐에 따라 업계의 분위기가 크게 달라질 것으로 보입니다. 과연 어떤 판결이 나오게 될까요?

keyword
작가의 이전글아르테미스