AI 데이터 경쟁 이대로 괜찮은가?

보호받지 못하는 저작권

by 작은 불씨
aw3fwafwe.jpg 인공지능의 학습을 위한 데이터 전쟁이 시작되었다.

AI를 선도하는 기업들이 AI 모델 훈련을 위해 데이터를 수집하면서 저작권과 라이센스 권리를 무시하고 학습을 하고 있다는 목소리가 커지고 있습니다.


OpenAI의 Whisper 모델은 GPT-4를 교육하기 위해 백만 시간이 넘는 YouTube 영상을 전사함

Google과 Meta도 추가적인 교육 데이터를 확보하는 데 어려움을 겪고 있음

무분별한 데이터 수집으로 인해 법적, 윤리적 문제가 계속 발생함


AI 기술이 계속 발전함에 따라 학습 데이터의 부족이 문제가 되고 있습니다.

오픈 AI, 구글, 메타는 가이드라인을 부분적으로 무시하고 경쟁업체도 똑같이 할 것이라는 가정하에 의도적으로 저작권을 위반하는 것에 대해 논의를 하였습니다.


OpenAI는 Whisper 모델을 사용하여 Youtube의 방대한 콘텐츠를 복사하여 GPT-4 모델을 교육했다고 뉴욕타임스는 발표했습니다.


잠재적인 법적 문제가 있음에도 불구하고 OpenAI는 공정 사용이라 주장하며 대규모 데이터 수집을 진행하였고, 유튜브 대표 닐 모한은 이는 유튜브의 표준 가이드라인은 위반한 행위라고 경고를 하였습니다. 그리고 닐 모한의 이런 말은 현재 구글과 크리에이터들 간의 소송에는 악영향을 미칠 것이라고 보입니다.


이와 함께 구글과 메타는 개인 정보 보호 정책을 수정하였고 메타는 저작권이 있는 콘텐츠에 합법적으로 접근하기 위해 대형 출판사를 인수하는 등 적극적인 데이터 확보에 노력을 기울이고 있습니다.


이러한 문제는 AI가 발전할수록 인간의 발전 속도와 대비는 뒤처지게 됩니다.

앞으로는 법조차 AI가 만들지 않으면 인간은 AI의 입장에서는 원시인과 같은 속도로 따라가는 모습이 될 것이라 보입니다.


결국에 AI가 발전할수록 인간에게는 양심과 윤리 그리고 상생이라는 가치가 더 중요하게 떠오르게 됩니다.

AI가 저작권이 있는 데이터를 학습하여 그를 기반으로 새로운 데이터를 창조하였을 때 그럼 이 데이터에 대한 출처와 저작권은 어떻게 관리되고 귀속되는지에 대한 문제도 해결되지 않았습니다.


작년에만 10,000개 이상의 무역 단체, 작가, 기업 및 기타 단체가 AI 시대에 저작권법이 어떻게 적용되는지에 대한 지침을 준비하고 있는 저작권청에 AI 모델의 창작물 사용에 대한 의견을 제출했습니다.


그리고 AI 업체와 크리에이터들 간의 갈등이 점점 심화되어가고 있는 모습입니다.


아무래도 이런 소식이 계속 전해지는 것들을 보면 AI의 법제화가 논의돼야 할 시기가 다가왔다고 봅니다.

그리고 합법적인 저작권과 데이터 사용이 이루어지면 지금처럼 무료 AI가 넘쳐나는 시기는 지나갈 것이라 생각됩니다.


인간의 창의성이 쉽게 카피되는 시대에 AI 편리함과 인간 고유의 능력의 조화가 어떻게 균형을 잡아갈지 현명한 방향으로 길이 만들어졌으면 하는 바람입니다.




keyword
매거진의 이전글애플(Apple)은 가정용 로봇 개발 중