AI Trained on News Articles, Copyright R
AI 뉴스 기사로 훈련 저작권 삭제해 원자재 전환 공정성 진실 ‘파괴’
AI에 지능 훈련이 수백만개의 신문 기사 토대로 저작자와 맥락을 삭제하며 원자재로 전환되고 있어 언론자유를 위협하고 공정성과 진실을 파괴하고 있다고 유럽 언론인이 지적했다.
벨기에 언론인인 Peter Vandermeersch는 “OpenAI의 ChatGPT, Google의 Gemini 및 ‘AI 개요’와 같은 소프트웨어 애플리케이션인 생성형 인공지능(GPAI) 시스템은 수백만 개의 뉴스 기사에 대해 훈련되며, 이러한 기사 중 다수는 유료화 되어 있으나 애초에 허가나 지불 없이 가져갔다”면서 “GPAI 시스템은 저널리스트의 작업을 요약하고 재포장하지만 독자를 출처로 안내하는 경우는 거의 없으며, 이제 남은 것은 현실의 겉치레이고 저널리즘은 고작 저자와 맥락을 제거한 원자재로 축소됐다”고 26일 밝혔다.
그는 브뤼셀의 De Standaard와 암스테르담의 NRC Handelsblad의 전 신문 편집자이며 The Irish Independent와 Belfast Telegraph의 전 CEO이다.
그는 유럽 독립언론인 ‘유락티브’에 <저널리즘에 대한 AI의 전쟁이 언론의 자유의 운명을 결정할 것이다> 제목으로 <인공지능이 저널리즘 작업을 사용하는 방식에 대한 EU의 접근 방식은 언론의 자유가 디지털 시대에 살아남을지 아니면 데이터 흐름 속으로 사라질지 결정할 수 있다>고 밝혔다.
기고자 Peter Vandermeersch는 “유럽에서는 저널리즘이 민주주의의 기둥으로 남을지, 아니면 데이터 경제의 윙윙거리는 소리 속으로 사라질 것인지를 결정하는 조용한 전쟁이 진행 중”이라며 “수년 동안 언론사들은 실리콘밸리와 불안한 협정을 맺어 왔고, Google과 Meta는 광고비의 가장 큰 몫을 가져갔지만 독자들을 우리에게서 뺐어갔고, 그것은 일방적이지만 기능적 거래로 트래픽에 대한 대가를 확보했다”고 밝혔다.
그는 이제 “그 거래가 무너졌다”면서, OpenAI의 ChatGPT, Google의 Gemini 등의 소프트웨어 애플리케이션인 생성 인공 지능(GPAI) 시스템이 주로 유료화된 뉴스 기사로 훈련하면서 저작자에 대한 구분을 없애고 허가없이 무단 사용하는 미국식 시스템에 유럽이 공략 당하고 있고, GPAI 시스템은 저널리스트의 작업을 요약하고 재포장하지만 독자를 출처로 안내하는 경우는 거의 없다고 밝혔다.
일부 언론사와 출판사들은 두 가지 방식으로 대응하고 있다.
파이낸셜 타임즈(The Financial Times), 뉴스 코퍼레이션(News Corp), 악셀 스프링거(Axel Springer), 애틀란트 ic(The Atlant ic) 등 일부 기관은 OpenAI와 라이선스 계약을 체결하면서 적어도 저널리즘에 가치가 있다는 것을 일부 인정했다.
이 계약에는 지불, 귀속 및 원본 보고에 대한 링크가 포함된다.
강경한 입장을 선택한 뉴욕타임즈는 OpenAI와 마이크로소프트를 "대규모 저작권 침해"로 고소하고 있이다.
법원에 제출된 소송에 언론사의 질문은 AI에 대해 근본적인 <AI 회사가 저널리즘 콘텐츠에 대해 자유롭게 훈련할 수 있는가>에 모아진다.
소송은 이에 대해 <그렇지 않다면 사용한 것에 대해 기술기업들이 비용을 지불해야 하는가?>를 쟁점으로 다룬다.
정부들의 대응은 분열됐다.
호주와 캐나다는 이미 기술 플랫폼이 뉴스 비용을 지불하도록 강요하고 있다.
기고자는 “유럽에서는 디지털 단일 시장의 저작권에 관한 지침(DSM)이 게시자의 권리, 텍스트 및 데이터 마이닝을 거부할 수 있는 권리를 인정한다”면서 “EU의 새로운 AI법은 어느 정도의 투명성을 요구하며, 범용 AI 시스템을 운영하는 회사는 모델을 훈련하는 데 사용하는 데이터의 요약을 제공하고 공개해야 한다”고 밝혔다.
기고자는 이어 “유럽의 공개 의무 조항에도, 필요한 세부 수준은 저작권 보유자가 자신의 권리를 행사할 수 있도록 하기에 충분하지 않을 수 있다”고 밝혔다.
이재명 체제는 아예 뉴스 저작권을 인정하지 않고 ‘소버린 AI 강대국’ 전략에서 삼성 SK 주도의 AI 데이터 축적에 대해 정부가 직접 강제하기 시작했다.
독일의 기독교 민주주의 유럽의회 의원 악셀 보스(Axel Voss)가 곧 발표할 보고서인 <저작권과 생성 AI: 기회와 도전>을 인용한 기고자는 “새로운 긴박감을 불어넣었다”면서 “보고서 초안에서 Voss 의원은 텍스트 및 데이터 마이닝에 대한 기존 EU 예외가 산업 규모의 AI 훈련을 위해 설계되지 않았으며 ‘엄청난 법적 불확실성’을 야기했다”고 밝혔다.
보스 의원의 보고서는 출판사의 명시적인 동의가 필요한 옵트인 시스템, 라이선스 및 거부를 기록하기 위해 중앙 EU 데이터베이스의 지원을 받고, 저작권이 있는 저작물이 악용되는 것에 대해서 “완전한 투명성”을 요구했다.
독일의 보스 의원은 “AI 회사가 훈련 데이터 공개를 거부하면 저작권 침해 추정에 해당한다”면서 “AI가 생성한 저작물이 저작권 보호를 받을 수 없고, 뉴스 매체가 저널리즘을 사용하여 모델을 훈련할 때 지불과 공로를 인정받을 자격이 있다"고 밝혔다.
그의 원칙에 대해 기고자는 “진보는 저널리즘의 생존을 희생시키면서 올 수 없다”는 저널리즘과 언론자유의 기본 전제를 확인하고 있다.
유럽 의회에 제출된 최종 보고서는 구속력이 없지만 이 주제에 대한 유럽 의회의 견해를 구성하며 유럽 위원회에 입법 제안을 요구할 수 있다.
독일과 달리 영국은 여전히 망설이고 있다. 브뤼셀이 저널리즘을 방어하기 위해 법적 갑옷을 갈고 닦는 반면, 런던은 다른 관점을 보이고 있다.
영국 정부는 출판사 언론사 적극적으로 "옵트 아웃"하지 않는 한 AI 회사가 저작권이 있는 저작물을 채굴할 수 있도록 허용하려는 계획을 시도하고 있다.
‘옵트 아웃’는 저작권자로서 당사자가 명시적으로 거부할 때만이 정보수집이 중단되는 불랙리스 방식의 ‘동의 제도’이다.
기고자는 “영국식은 실제로 약탈을 위한 초대이다”며 “그것은 착취를 혁신으로 가장하고 영국 언론을 생존을 위한 싸움에서 벌거벗은 채로 내버려 둔다”고 밝혔다.
그는 이어 “협의 문서와 예의 바른 실무 그룹은 법 자체가 묻지 않고 받아들이는 사람들에게 기울어진다면 저널리즘을 구하지 못할 것”이라며 “언론의 자유에 대한 위협은 법적, 재정적일 뿐만 아니라 구조적이다”고 밝혔다.
AI는 이미 광고 수익으로 전체 실리콘 밸리를 빨아 들였다.
이제 AI 도구가 사용자의 정보 요청에 직접 응답하기 때문에 검색 및 소셜 미디어의 트래픽 감소조차도 위험에 처해 있다.
기고자는 “챗봇이 만족하는 모든 쿼리는 뉴스 사이트 방문을 한 번 줄이는 것이고, 클릭수가 적다는 것은 구독자 수가 줄어들고, 기자가 줄어들고, 조사가 줄어들고, 궁극적으로 민주주의가 약화된다는 것을 의미한다”며 “보수 없이 뉴스를 채굴하고 역류하도록 허용하는 사회는 단순히 언론인을 가난하게 만드는 것이 아니라 진리를 굶주리게 한다”고 밝혔다.
그는 “사실을 확인할 기자가 없다면 표현의 자유는 의미가 없다”면서 “미국의 소송과 브뤼셀의 정책 싸움은 돈 그 이상에 관한 것이며, 저널리즘이 AI 시대에도 여전히 경제 활동으로 존재할 수 있는지 여부를 결정할 것”이라 밝혔다.
유럽 법원이 저널리즘 콘텐츠의 "자유로운 사용"이 합법적이라고 결론을 내리면 ‘독립적 보’도는 쇠퇴할 것이다.
언론의 자유는 검열에 의해 폐지되는 것이 아니라 생존 수단이 점진적으로 사라짐에 따라 굶어 죽을 수 있다.
기고자는 “AI 회사가 사용하는 뉴스 콘텐츠에 대해 비용을 지불하도록 요구하면 어느 정도 균형을 회복할 수 있다”면서 “양질의 저널리즘의 가치는 다시 한 번 인정될 것이고, 데이터는 공정하게 공유될 수 있으며, 유럽은 혁신과 민주주의가 적일 필요가 없다는 것을 증명하는 세계적인 선례를 남길 수 있다”고 밝혔다.
그는 “전선은 이제 미디어의 미래뿐만 아니라 진실 자체의 미래에 대한 위태로움에 있다”면서 “남은 것은 현실이 저널리즘을 저자와 맥락을 제거한 원자재로 축소하여 겉치레로 만든 것이고, 이것은 단지 혁신에 대한 논쟁이 아니라 주인의식, 공정성, 진실을 위한 싸움이다“고 밝혔다.
<유럽연합 인공지능법 ‘알고리즘 훈련 콘텐츠 분석’ 의무 이재명 네이버 ‘주권침해’, 2025년 7월 12일자>참조
kimjc00@hanmail.net
AI Trained on News Articles, Copyright Removed, Converted to Raw Material, Destroying Fairness and Truth
European journalists have pointed out that AI training is threatening press freedom and destroying fairness and truth by converting millions of newspaper articles into raw material, removing authors and context.
Belgian journalist Peter Vandermeersch stated on the 26th, "Generative Artificial Intelligence (GPAI) systems—software applications like OpenAI's ChatGPT, Google's Gemini, and 'AI Overview'—are trained on millions of news articles, many of which are paid, but were originally obtained without permission or payment."
He added, "GPAI systems summarize and repackage journalists' work, but rarely direct readers to sources. What remains is a facade of reality, reducing journalism to raw material stripped of its authorship and context."
He is a former newspaper editor at De Standaard in Brussels and NRC Handelsblad in Amsterdam, and former CEO of The Irish Independent and the Belfast Telegraph.
He wrote in the European independent media outlet Euractiv, "AI's War on Journalism Will Decide the Fate of Press Freedom," that "The EU's approach to how AI uses journalistic work could determine whether press freedom survives in the digital age or disappears into the data stream."
Contributor Peter Vandermeersch stated, "A quiet war is underway in Europe, determining whether journalism will remain a pillar of democracy or disappear into the hum of the data economy."
He added, "For years, media companies have been locked in uneasy pacts with Silicon Valley, with Google and Meta taking the lion's share of advertising dollars but stealing readers away from us, securing traffic in a one-sided but functional deal."
He said that “that deal has now collapsed,” and that Europe is being targeted by the US-style Generative Artificial Intelligence (GPAI) system, a software application like OpenAI’s ChatGPT and Google’s Gemini, which trains primarily on paid news articles, disregarding attribution and using them without permission. GPAI systems summarize and repackage journalists’ work but rarely direct readers to sources.
Some news organizations and publishers are responding in two ways.
Some, including The Financial Times, News Corp, Axel Springer, and The Atlantic, have at least acknowledged the value of journalism by signing licensing agreements with OpenAI.
These agreements include payment, attribution, and links to original reporting.
The New York Times, taking a hard line, is suing OpenAI and Microsoft for “massive copyright infringement.”
The lawsuit filed in court centers on a fundamental question raised by media companies: "Should AI companies be free to train AI on journalistic content?"
If not, the lawsuit addresses the question: "If not, should tech companies pay for the use?"
Governments have responded differently.
Australia and Canada already require tech platforms to pay for news.
The contributor stated, "In Europe, the Digital Single Market's Copyright Directive (DSM) recognizes publishers' rights and the right to opt out of text and data mining." However, the contributor added, "The EU's new AI law requires a certain level of transparency, requiring companies operating general-purpose AI systems to provide and disclose summaries of the data used to train their models."
The contributor continued, "Even under European disclosure requirements, the required level of detail may not be sufficient to allow copyright holders to exercise their rights."
The Lee Jae-myung administration has completely rejected news copyright and, in its "sovereign AI superpower" strategy, has begun directly mandating the accumulation of AI data led by Samsung and SK. Citing a forthcoming report by German Christian Democratic MEP Axel Voss, entitled "Copyright and Generative AI: Opportunities and Challenges," the contributors wrote that it "injects a new sense of urgency." In a draft, Voss argued that existing EU exceptions for text and data mining were not designed for industrial-scale AI training and created "enormous legal uncertainty."
Mr. Voss's report calls for an opt-in system requiring explicit consent from publishers, a central EU database to record licenses and objections, and "full transparency" about the exploitation of copyrighted works.
"If an AI company refuses to release its training data, it constitutes a presumption of copyright infringement," Voss wrote. "AI-generated works should not be copyrighted, and news outlets should be entitled to payment and credit when they use journalism to train their models."
In his principles, the contributor affirms the fundamental premise of journalism and press freedom: “Progress cannot come at the expense of the survival of journalism.”
The final report submitted to the European Parliament is non-binding, but it constitutes the European Parliament’s view on the subject and can request legislative proposals from the European Commission.
Unlike Germany, the UK remains hesitant. While Brussels is sharpening its legal armor to defend journalism, London is taking a different approach.
The UK government is attempting to allow AI companies to mine copyrighted works unless publishers and media companies actively “opt out.”
The “opt-out” is a black-box “consent system” where data collection is halted only when the copyright owner explicitly refuses.
“The British approach is actually an invitation to plunder,” the contributor wrote. “It disguises exploitation as innovation and leaves the British press naked in the fight for survival.”
He continued, "Consultation documents and polite working groups will not save journalism if the law itself is biased towards those who accept it without question." He added, "The threat to press freedom is not just legal and financial, but structural."
AI has already siphoned off Silicon Valley's entire advertising revenue.
Now, even the decline in search and social media traffic is at risk, as AI tools directly respond to users' requests for information.
The contributor stated, "Every query satisfied by a chatbot means one less visit to a news site, and fewer clicks means fewer readers, fewer reporters, fewer investigations, and ultimately, a weakened democracy." He added, "A society that allows news to be mined and regurgitated without compensation doesn't just impoverish journalists; it starves them of the truth."
He added, "Freedom of expression is meaningless without reporters to verify the facts." He added, "The lawsuits in the US and the policy battles in Brussels are about more than money; they will determine whether journalism can still exist as an economic activity in the age of AI." If the European Court of Justice concludes that the "free use" of journalistic content is legal, independent reporting will decline.
Freedom of the press will not be abolished by censorship, but rather starved as the means of survival gradually disappear.
The contributor argued that requiring AI companies to pay for the news content they use could restore some balance. "The value of quality journalism would be recognized once again, data could be shared fairly, and Europe could set a global precedent that innovation and democracy need not be enemies."
He argued that "the battle is now not only over the future of media, but also over the future of truth itself. What remains is a reality that reduces journalism to raw material, stripped of authorship and context, and rendered veneer. This is not simply a debate about innovation, but a fight for ownership, fairness, and truth."
See <EU AI Law Mandates Analysis of Algorithm Training Content> Lee Jae-myung, Naver's "Sovereignty Violation," July 12, 2025>
AI, Article, Soborin AI, Press Freedom, Opt-out, Raw Materials, European Union, Journalism, Copyright, Truth