국가 지식의 길을 연 ‘디지털집현전’

by 이정호

인공지능(AI) 기술이 나날이 발전하면서, 양질의 정보를 얼마나 쉽고 정확하게 찾아 활용할 수 있는지가 곧 국가 경쟁력을 좌우하는 중요한 요소로 떠오르고 있다.


정부와 공공기관 곳곳에서 방대한 양의 지식정보를 꾸준히 축적해 왔지만, 그동안 여러 기관에 분산되어 있어 국민들이 필요할 때마다 찾기는 결코 쉽지 않았다. 또한 민간 부문의 혁신 기술과 서비스 발전을 뒷받침하기 위해서는 공공이 보유한 신뢰할 수 있는 데이터가 인공지능 학습의 핵심 자원으로 자리 잡아야 한다는 지적도 계속되어 왔었다.


이러한 요구에 부응하기 위해 과학기술정보통신부는 2024년 1월, 국가지식정보 통합플랫폼인 ‘디지털집현전(k-knowledge.kr)’을 본격적으로 운영하기 시작하였다. 이는 「국가지식정보 연계 및 활용 촉진에 관한 법률」 제14조에 근거해 구축된 것으로, 국회도서관과 국립중앙도서관을 비롯한 총 101개 기관 123개 사이트에 산재해 있던 약 2억 5천만 건의 국가지식정보 메타데이터를 한 곳에 모아둔 것이다. 이곳에는 논문‧보고서 등 전문 지식부터 행정‧사회 문제, 인공지능‧컴퓨팅 등 첨단 분야까지, ‘국민이 필요로 하는 지식’을 폭넓게 담아냄으로써 지식정보의 핵심 거점으로 자리 잡았다.


서비스 실적 또한 주목할 만하다. 2024년 1월 22일부터 11월 30일까지 디지털집현전의 누적 방문 수는 약 15만 건(월평균 14,329건)에 달하며, 같은 기간 누적 검색량은 약 11만 5천 건(월평균 10,526건)을 기록했다. 오픈한 지 채 1년밖에 되지 않았음을 고려할 때 꽤 고무적인 수치이다. 이용자들이 가장 많이 찾는 분야는 일반공공행정, 사회문제, 인공지능 등이었고, 정보 유형으로는 논문‧보고서가 두드러지게 많았다.


무엇보다도 눈여겨볼 점은, 디지털집현전에 수집된 메타데이터가 이미 여러 민간 기업에서 인공지능 모델 학습과 서비스 개발에 활용되고 있다는 사실이다. 기관들이 자체적으로 품질을 검증해 온 공공 데이터이기에 전문성‧신뢰도가 높고, 과학·기술·문화·사회 등 다양한 분야를 아우르는 방대한 양의 자료가 축적되어 있어 ‘믿고 쓸 수 있는 데이터’라는 평가를 받고 있다.


그러나 여기서 멈추지 않고, 과기정통부는 △메타데이터 표준화와 품질 관리 △민간 보유 우수 지식정보 연계 △정보취약계층을 위한 UI‧UX 개선 △국가지식정보 메타데이터를 활용한 대규모 AI 모델 개발 등을 추진해 디지털집현전을 지속적으로 고도화할 계획이다. 특히, 생성형 인공지능의 급부상으로 대화형 검색 서비스에 대한 수요가 늘어남에 따라, 2025년에는 디지털집현전에서 학습한 거대언어모델(LLM)을 기반으로 자연어 대화형 검색 서비스를 제공하겠다는 포부를 밝혔다.


더불어 최근 ‘제3차 국가지식정보 지정(안)’을 통해 추가로 831만 건의 지식정보가 디지털집현전에 새롭게 연계될 예정이다. 이 중에는 경제·정책·교육 관련 자료부터 용어‧어휘 정보 등 실생활 활용도가 높은 지식정보가 대거 포함되어 있다. 과기정통부는 앞으로도 연도별 국가지식정보 현황조사를 통해 새롭게 발굴되는 우수 데이터를 적극적으로 통합플랫폼에 연계함으로써, 국민이 더 쉽게 공공 지식을 활용할 수 있는 생태계를 확대해 나가겠다고 밝혔다.


정부, 연구기관, 민간 기업이 함께 만들어가는 ‘디지털집현전’은 단순히 방대한 데이터를 모아둔 창고가 아닌, 누구나 쉽고 편리하게 지식을 얻을 수 있는 ‘공공 지식의 진정한 창구’라 할 수 있겠다. 인공지능 시대에 걸맞게 디지털집현전이 더욱 발전해 나간다면, 국민의 지식 역량을 높이는 것은 물론, 민간 혁신 서비스 발전에도 큰 힘이 될 것이다. 한글 창제 당시 지식 문화를 꽃피운 ‘집현전’의 이름을 이어받은 만큼, 디지털 시대에도 우리의 지식·기술 역사를 새롭게 써 내려가는 핵심 기반이 되길 진심으로 기대한다.

keyword