brunch

생성형 AI시대, 공공누리 제도 개선 방안

by 점선면

생성형 AI 시대의 공공데이터 활용 패러다임 변화
생성형 AI가 초거대 언어모델(LLM) 등을 통해 급속히 발전하면서 AI 학습용 데이터에 대한 수요가 폭발적으로 증가하고 있다. 이러한 변화는 공공데이터의 활용 방식에도 근본적인 변화를 요구하고 있다. 국가와 지방자치단체, 공공기관이 보유한 방대한 공공저작물은 AI 학습의 핵심 원천 데이터로서 그 가치가 재조명되고 있다.
현재 공공누리 제도는 공공저작물의 자유이용을 위해 4가지 유형으로 구분되어 운영되고 있다. 제1유형은 출처표시만으로 상업적·비상업적 이용과 2차적 저작물 작성이 가능하며, 제2유형은 상업적 이용을 금지하고, 제3유형은 변경을 금지하며, 제4유형은 상업적 이용금지와 변경금지를 모두 적용한다.

현행 공공누리 유형의 AI 학습 저해 요인
1. 상업적 이용금지 조건의 모순
공공누리 제2유형과 제4유형에 적용되는 상업적 이용금지 조건은 AI 학습에 심각한 제약을 가하고 있다. 대부분의 AI 기업들은 학습된 모델을 통해 상업적 서비스를 제공하므로, 이러한 제약은 공공데이터의 AI 학습 활용을 원천적으로 차단하는 효과를 낳고 있다.
특히 문제가 되는 것은 공공데이터법과 공공누리 제도 간의 부정합성이다. 공공데이터법은 공공데이터의 영리적 이용을 원칙적으로 허용하고 있으나, 공공누리 제2유형과 제4유형은 이에 반하는 조건을 적용하고 있다. 이는 공공기관으로 하여금 법적 혼란을 야기하고 있으며, 실제로 많은 기관들이 제1유형을 적용하지 않고 있는 상황이다.

2. 변경금지 조건의 AI 학습 제약
공공누리 제3유형과 제4유형에 적용되는 변경금지 조건 역시 AI 학습에 중대한 장애요인이다. AI 모델은 학습 과정에서 데이터를 변형하고 2차적 저작물을 생성하는 것이 본질적 특성이므로, 변경금지 조건은 AI 학습 자체를 불가능하게 만든다.
현행 변경금지 조건은 "내용상의 변경뿐만 아니라 형식의 변경과 원저작물을 번역·편곡·각색·영상제작 등을 위해 2차적 저작물을 작성하는 것도 금지"하고 있어, AI가 데이터를 학습하여 새로운 콘텐츠를 생성하는 과정 자체를 원천적으로 봉쇄하고 있다.

3. 출처표시 조건의 기술적 한계
모든 공공누리 유형에 공통적으로 적용되는 출처표시 조건도 AI 학습에서는 기술적 한계를 노출하고 있다. AI 모델이 방대한 데이터를 학습한 후 생성하는 콘텐츠에서 개별 학습 데이터의 출처를 정확히 추적하고 표시하는 것은 현실적으로 불가능하다.

국내외 동향 분석
해외 사례: 영국의 권리유보 시스템
영국 정부는 2024년 12월부터 2025년 2월까지 "Copyright and Artificial Intelligence" 주제로 대규모 공공협의를 진행하여 AI 학습을 위한 상업적 텍스트·데이터 마이닝(TDM)에 대한 저작권 예외 조항 도입을 검토했다. 이 과정에서 권리유보 시스템이 핵심 논의 사항으로 부상했다. 권리유보 시스템은 저작권자가 자신의 작품이 AI 학습에 사용되는 것을 명시적으로 거부할 수 있는 권리를 부여하는 제도이다.

미국의 공정이용 판례
미국에서는 AI 학습에 대한 공정이용(fair use) 판례가 축적되고 있다. 2024년 6월 캘리포니아 북부 연방지방법원은 AI 모델 학습 행위가 "지극히 변형적"이라며 공정이용에 해당한다고 판결했다. 반면 2025년 2월 델라웨어 연방법원은 AI 기반 플랫폼 구축을 위한 콘텐츠 복사가 공정사용에 해당하지 않는다고 판결하여 상반된 판례를 보여주고 있다.

국내 현황: 공공저작물 개방 확대
한국저작권위원회는 2025년 6월 기준 725만 건의 공공저작물을 '공유마당'을 통해 제공하고 있다. 그러나 대부분의 공공저작물이 제4유형(상업적 이용금지+변경금지)으로 분류되어 AI 학습에 활용하기 어려운 상황이다.

공공누리 제도 개선방안
1. AI 학습 특화 유형 신설
공공누리 제도에 AI 학습을 전용으로 허용하는 새로운 유형을 신설할 필요가 있다. 이 유형은 다음과 같은 특징을 가져야 한다:
AI 학습 목적 명시: 데이터가 AI 모델 학습에 사용될 수 있음을 명시적으로 허용
변형 허용: AI 학습 과정에서 불가피한 데이터 변형과 2차적 저작물 생성 허용
출처 표시 유연화: 개별 데이터 단위가 아닌 데이터셋 단위의 출처 표시 허용
학습 목적 제한: 순수한 학습 목적에 한해 허용하되, 상업적 서비스 제공 시 별도 협의 필요

2. 기본 유형을 제1유형으로 전환
현재 공공기관들이 제2유형과 제4유형을 과도하게 적용하고 있는 문제를 해결하기 위해, 공공데이터법과의 정합성을 고려하여 기본 유형을 제1유형으로 전환해야 한다. 저작권법 제24조의2와 공공데이터법의 도입 취지상 저작재산권을 전부 보유한 공공저작물은 제1유형을 적용하는 것이 원칙이다.

3. 권리유보 시스템 도입
영국의 사례를 참고하여 권리유보 시스템을 도입함으로써 저작권자의 권리를 보호하면서도 AI 학습을 위한 데이터 활용을 확대할 수 있다. 이 시스템은 다음과 같이 운영될 수 있다:
선택적 유보: 공공저작물 제공 시 AI 학습 허용 여부를 선택할 수 있는 옵션 제공
유보 표시: AI 학습을 금지하고자 하는 저작물에 대한 명확한 표시 시스템 구축
유보 해제: 필요에 따라 유보를 해제할 수 있는 절차 마련

4. 출처표시 체계 개선
AI 학습의 특성을 고려한 출처표시 체계를 새롭게 구축해야 한다:
데이터셋 단위 출처표시: 개별 데이터가 아닌 데이터셋 전체에 대한 출처표시 허용
기술적 구현 지원: 블록체인 등 기술을 활용한 출처 추적 시스템 구축
표준화된 메타데이터: AI 학습용 데이터의 출처 정보를 표준화된 형태로 제공

5. 공공기관 가이드라인 개선
공공기관들이 AI 학습 친화적인 공공누리 유형을 적용할 수 있도록 명확한 가이드라인을 제공해야 한다:
유형 선택 기준: AI 학습 목적을 고려한 유형 선택 기준 제시
저작권 검토 절차: 제3자 저작권이 포함된 공공저작물의 검토 절차 간소화
교육 및 컨설팅: 공공기관 담당자를 위한 체계적인 교육 프로그램 운영

결론: 균형잡힌 AI 생태계 구축을 위한 정책 방향
생성형 AI 시대에 부합하는 공공누리 제도 개선은 단순한 제도 변화를 넘어 국가 AI 경쟁력 강화의 핵심 과제이다. 현행 제도의 상업적 이용금지와 변경금지 조건은 AI 학습에 결정적인 장애요인으로 작용하고 있으며, 이를 해결하지 않으면 우리나라의 AI 발전이 뒤쳐질 수 있다.

제안된 개선방안들은 저작권자의 권리 보호와 AI 산업 발전 간의 균형을 추구한다. AI 학습 특화 유형 신설, 권리유보 시스템 도입, 출처표시 체계 개선 등을 통해 공공저작물의 AI 학습 활용을 촉진하면서도 창작자의 권익을 보호할 수 있는 체계를 구축해야 한다.

이러한 제도 개선은 정부 차원의 종합적인 접근이 필요하다. 문화체육관광부, 행정안전부, 과학기술정보통신부 등 관련 부처의 협력을 통해 공공데이터법, 저작권법, 공공누리 관련 지침의 정합성을 확보하고, AI 시대에 부합하는 새로운 공공저작물 생태계를 조성해야 할 것이다.

keyword
작가의 이전글AI의 등장과 '저자'의 죽음