brunch

You can make anything
by writing

C.S.Lewis

by 날아라인공지능 Jan 27. 2024

뉴욕타임스 vs. 오픈AI 사건 #2

오픈AI, 뉴스 보기 전까지 피소 사실 몰라

뉴욕타임스에게 고소당한 지 약 열흘 만에 오픈AI가 입을 열었습니다. 놀랍게도 기사를 보고 피소 사실을 알았다는데요.


지난 레터에서는 뉴욕타임스의 입장을 살펴봤습니다. 이번에는 오픈AI 이야기를 들어볼까요?


오픈AI의 생각은 한 줄로 정리 정리되어 있습니다:

출처: 오픈AI 홈페이지
We support journalism, partner with news organizations, and believe The New York Times lawsuit is without merit.

우리는 저널리즘을 지지하고, 언론 기관들과 협력하며, 뉴욕타임스의 소송은 말도 안 된다고 생각한다.


오픈AI가 공식적으로 언급하는 4가지 포인트를 간단하게 살펴보겠습니다.


1. 우리는 언론 기관들과 협력하며 새로운 기회를 창조하고 있다.


오픈AI는 기술 구상 과정부터 언론 기관과의 상생을 고려한다고 말합니다. 언론 기관과의 파트너십 목적을 명확하게 하는데요. ▶방대한 자료 분석이나 번역과 같은 업무를 대신하여 기자의 시간을 절약해 주고 ▶미공개 데이터를 추가로 학습시켜 보다 정확한 정보를 제공하며 ▶실시간 콘텐츠 제공을 통해 언론사가 독자들과 새로운 방식으로 소통할 수 있도록 돕기 위함이라고 합니다.


2. 모델 학습은 공정한 절차가 맞으나, 언제든 옵트아웃(opt-out: 정보 소유자가 정보수집 거부를 명시할 때 수집을 중단하는 제도)이 가능하도록 해 두었다.

오픈AI는 공개된 인터넷 자료로 AI 모델을 학습시키는 방식은 오랜 역사와 수많은 판례가 허용한 합법적 사용임을 강조합니다.

뒤이어 “legal right is less important to us than being good citizens(법적 권리보다 우리는 좋은 시민이 되는 것이 더 중요하다)”라며 법적 권리 때문이 아닌 좋은 시민으로서의 책임감으로 간편한 옵트아웃 방식을 제공하고 있다고 했습니다.


실제로 오픈AI는 웹 크롤링에 사용되는 GPT봇을 감지하고 제거할 수 있는 방법을 명시해 두었습니다.

GPT봇 감지를 위한 코드. 출처: 오픈AI
GPT봇 제거를 위한 코드. 출처: 오픈AI


3. 콘텐츠 무단 제공은 제거 중인, 흔치 않은 버그다.

오픈AI는 학습 데이터에 여러 번 포함된 내용, 즉 다양한 웹페이지에 중복으로 공개된 콘텐츠를 모델이 외워 그대로 제공하는 버그는 제거 중이며, 드물게 발생한다고 말합니다. 오히려 모델을 조작하여 버그를 유도하는 뉴욕타임스를 지적하는데요. 이는 적절치 않은 사용 방식이자 사용 약관에도 위배되는 행위임을 명시합니다.

아울러 뉴스는 전체 학습 데이터의 아주 작은 부분일 뿐이라고 강조하는데요. 뉴욕타임스 같은 단일 데이터 소스는 모델 학습에 큰 영향을 미칠 수 없다는 주장입니다.


4. 뉴욕타임스는 앞뒤를 빼먹고 말하고 있다.

고소장이 접수되기 약 일주일 전인 작년 12월 19일, 오픈AI는 뉴욕타임스와 우호적인 미팅을 가졌다고 말합니다. 뉴욕타임스는 챗GPT를 통해 구독자와 소통하는 새로운 방식을, 오픈AI는 챗GPT 사용자가 뉴욕타임스의 기사를 읽을 수 있는 권한을 갖는 파트너십에 대해 논의했다는데요. 오픈AI는 뉴욕타임스의 기사를 읽기 전까지 피소 사실을 몰랐다며 이번 소송에 대한 당황스러운 마음을 드러냈습니다.


이어 작년 7월, 챗GPT가 콘텐츠를 무단으로 제공하는 오류를 발견하고 “브라우즈(Browse)” 베타 기능을 잠시 중단시킨 사례를 언급하며 오픈AI가 저작권 침해를 얼마나 중요하게 생각하는지 강조했습니다.

오류를 발견하여 잠시 일부 기능을 닫는다는 트윗. 출처: 오픈AI X(예전 트위터)


오픈AI는 뉴욕타임스가 언급한 문제들이 벌써 빠르게 해결되고 있고, 뉴욕타임스를 포함한 다양한 언론 기관과 AI를 통해 협력하기를 기대한다며 입장을 마무리합니다.



오픈AI 입장까지 들어보니 어떠신가요?


매일이 다른 AI 분야에는 아직 무엇이 옳고 그른지 정의를 내리지 못한 구역이 많습니다. 지금 내린 판단이 나중에도 옳은 판단일지 궁금해집니다.



[뉴욕타임스 고소장]

[오픈AI 입장문]

작가의 이전글 뉴욕타임스 vs. 오픈AI 사건 #1
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari