PART 2. 공공데이터는 사회적, 경제적 가치 창출을 주도한다.
4차 산업혁명이란 용어가 세상에 나온 지 약 4년 정도의 시간이 흘렀다. 그동안 4차 산업혁명에 대해 많은 정의가 있었지만 이제 서서히 “지능화 혁명”이라는 정의로 모아지는 추세로 가고 있는 듯하다. 이는 4차 산업혁명의 핵심은 “인공지능”이라는 의미와 일치한다. 인공지능이란 이론이 제기된 것은 1950년대부터라고 한다. 그러나 인공지능은 이론적 배경만이 있었지 실체와는 거리가 멀었다. 1990년 대 이후부터 점차적으로 인공지능이 어렴풋이 실체를 드러내기는 했지만 학계나 산업계에서 매우 제한적인 효용성만 가지고 있었으며 우리의 일상과는 다소 거리가 멀었다. 그런 인공지능이 4차 산업혁명의 핵심이 되었다. 인공지능은 데이터에 기반하여 운영이 된다. 사람도 아는 만큼 할 수 있는 일이 많은 것처럼 인공지능도 많은 데이터가 있어야 이를 통해 많은 일을 할 수 있게 된다. 과거에는 데이터를 생산하는 기술, 보관하는 기술 그리고 이를 분석하는 기술이 기계를 지능화시킬 만큼의 양과 질을 만들어내지 못했다. 그러나 현시점에서 IoT 기술, 클라우드 기술 그리고 빅데이터 기술은 이러한 데이터의 양과 질을 높이는 한계를 극복시켰다. 그리고 이는 데이터에 기반한 인공지능 기술을 본격적인 궤도에 올려놓게 된 것이다. 이러한 내용을 감안해 볼 때 궁극적으로 “지능화 혁명”의 본질은 “데이터 혁명”이라고 해도 과언은 아닐 것이다. 공공부문의 데이터 혁신은 공공부문의 디지털 혁신에 있어서 가장 핵심적이고도 국가 전체에 미치는 경제적, 사회적 파급효과가 엄청난 영역이라고 단언할 수 있다. 이 부분에 대해 생각해 보기로 한다.
우리나라에서 공공데이터의 양과 질은 최고 수준이라고 한다. 그러나 데이터의 개방과 활용 측면에서는 최고와는 거리가 멀다는 것이 일반적인 평가이다. 데이터라는 것은 보관하고 저장하기 위해 모아두는 것이 아니다. 이를 활용해서 좀 더 나은 가치를 창출하라는 것이 주된 목적이 되어야 한다. 그런데 우리나라의 공공기관의 경우에는 데이터를 모아두는 것에 집중한다. 서버가 터져나갈 듯이 데이터를 모아둔다. 물론 공공데이터 기반의 우수한 활용사례들이 많이 소개되고 있다. 그러나 공공기관의 서버에 모아 두고 있는 데이터의 양과 질을 감안했을 때 이는 극소수의 활용에 불과하다는 것이 필자의 생각이다. 앞서도 간략히 언급했지만 공공부문의 디지털 혁신은 그 성과의 일정 부분 이상은 국민에 대한 혜택으로 돌아가야 한다. 즉 공공부문의 디지털 혁신은 단지 공공기관 자체의 효율성 확보를 넘어서 보다 효율적이고 생산적인 공공정책과 서비스를 만들어낼 수 있는 가치를 만들어 내는 것이 필요하다. 이러한 차원에서 공공 데이터 혁신은 매우 의미 있고 공공영역에서 최우선적으로 추진해야 할 영역인 것이다.
그러나 데이터 혁신을 추진하기 위해서는 많은 장애요소들이 있다. 이 부분은 민간도 마찬가지이지만 특히 공공영역은 그 정도가 심하다. 각 종 정보보호 법규와 규제가 바로 그것이다. 다른 관점에서 보면 공공부문을 포함한 전 영역의 데이터 혁신은 기술적인 혁신이 아닌 규제의 혁신이라고 해도 과언은 아닐 것이다. 우리나라의 IT 인프라는 세계 최고 수준이라는 것은 누구나 인정하는 사실이다. 특히 인터넷과 같은 통신망 인프라는 다른 선진국과 비교해서도 월등한 수준 차이를 보이고 있을 정도라고 한다. 그러나 이러한 인프라 능력의 50%도 채 사용하지 못하고 있는 것이 현재 우리나라의 실정이라고 한다. 한 전문가는 이것을 고속도로에 비유하고 있다. “대한민국의 IT 인프라는 양방향 16차선으로 개통해서 시속 100km 이상으로 달릴 수 있는 고속도로와 같다. 그러나 이 고속도로에 규제라는 바리케이드가 곳곳에 설치되어 있음으로 인해 시속 50km의 속도밖에 내지 못하고 있는 것이 현재 실정이다.” 여기서 이야기하고 있는 바리케이드가 바로 정보보호와 관련된 규제와 법규이다. 이러한 규제와 법규들은 정보의 흐름을 차단시키고 보다 효율적인 가치를 만들어내는 데 있어 큰 장애요인이 되고 있다. 이런 관련 규제에 대한 개선의 노력이 최근 다각적으로 일어나고 있다는 것이 그나마 다행스러운 일이다. 필자가 수년 전에 “건강정보 빅데이터 플랫폼”과 관련된 프로젝트를 주관한 적이 있다. 모든 데이터는 연계되어 분석할 때 가치는 배가 되지만 각 종 규제로 인해 매우 제한적인 플랫폼을 설계하는 데 그친 경험이 있다. 100의 가치를 낼 수 있지만 50의 가치밖에 낼 수 없는 현재의 국내 데이터 관련 산업에 있어서 공공부문이 이에 대한 선도적인 역할을 해야 하는 것이 첫 번째 과제라고 할 수 있다. 이것이 선행되지 않는다면 우리나라의 데이터 기반의 비즈니스는 더 이상 희망이 없을 것이다. 이것은 곧 인공지능으로 대표되는 지능화 산업의 경쟁력을 상실하는 결과를 초래하게 될 것이다.
상기의 내용은 공공기관에서 직접적으로 극복하기에는 어려운 한계성을 가지고 있는 영역이다. 그렇다면 공공기관의 주체적으로 추진해야 할 데이터 혁신의 방향은 무엇이 있을까? 필자는 첫 번째로 적극적인 클라우드의 도입을 제시한다. 클라우드는 이제 선택적 사안이 아니다. 필수적 사안이다. 미국은 “Cloud First”정책을 시행한 지 불과 2년 만에 “Only Cloud”정책을 시행하고 있다. 유럽은 물론 일본도 클라우드 도입과 운영은 이미 일상화에 접어들고 있는 상태이다. 국내의 경우도 민간영역은 클라우드 도입이 2017년 이후 급격하게 상승하고 있는 추세이다. 클라우드를 도입해야 하는 이유는 빅데이터 시대에 본격적으로 접어들면서 데이터의 생산과 저장은 더 이상 물리적 환경 하에서 이를 수용하기에 한계에 이르렀기 때문이며, 데이터들이 빅데이터로서 활용성을 갖지 못한다면 데이터로서 가치를 상실하게 될 것이라는 것이다. 그리고 스마트 시티, 자율 주행 자동차와 같이 실시간으로 데이터를 생산하고 이 데이터들이 분석되며, 통신이 이루어져야 하는 데 있어 클라우드 기반이 되지 못한 상태에서는 운영이 불가능하기 때문이다. 따라서 클라우드는 산업환경의 변화를 감안할 때 더 이상 선택사항이 아니라는 것이다.
그러나 우리나라의 공공영역은 특히 클라우드 도입에 대해 매우 부정적인 자세를 보이고 있다. “보안상 불안하다.”라는 것이 가장 큰 이유이다. 물론 클라우드를 도입함에 있어 가장 크게 우려되는 부분은 보안 영역임은 당연하다. 그러나 최근 각 종 보고서에 따르면 클라우드의 보안성이 일반적으로 운영되고 있는 기업의 보안성에 비해 우수하다는 결과를 발표하고 있다. 기술적인 부분으로는 보안성은 우려할 만한 사안이 크게 없다는 것이다. 클라우드 운영자에 대한 신뢰성만 확보된다면 클라우드 환경은 현존하는 그 어느 시스템보다 안전성과 안정성이 확보된 시스템이라고 할 수 있다. 우리가 은행에 돈을 맡기는 것은 은행을 믿기 때문이다. 클라우드를 활용하는 것도 바로 이러한 관점에서 접근해야 한다. 2017년부터 정보화진흥원에서 공공부문의 클라우드 도입을 위한 각종 프로그램과 지원사업을 운영하고 있지만 그 실적은 아직 여러모로 미흡하다. 이에 대한 가장 큰 이유는 클라우드 도입을 기관에 자율적으로 맡겨 놓은 정부의 정책이라고 생각한다. 클라우드의 도입은 중앙정부 주관으로 초기 단계에는 강제성을 부여한 정책이 필요하다고 생각하며, 기관들 또한 환경의 변화와 부합되는 디지털 역량을 확보하기 위한 인식의 변화가 필요하다.
공공부문 데이터 혁신의 또 한 가지의 중요한 부문은 “데이터 개방과 교류”이다. 공공부문의 데이터 개방이 미치는 경제적, 사회적으로 그 영향력과 파급성은 매우 크다. 따라서 공공 부문 데이터 혁신에 있어서 데이터 개방은 가장 역점을 두어야 하는 부분이다. 그리고 모든 데이터는 그 자체로는 가치를 만들어내는 데는 한계가 있다. 데이터는 상호 연결되어야 한다. 그리고 그 연결성 속에서 가치를 찾아내는 것이다. 따라서 데이터의 교류는 데이터 활용에 있어서 필연적으로 선행되어야 한다. 그러나 우리나라 공공부문의 데이터 개방과 교류는 높은 점수를 주기에는 어렵다. 공공기관에서 개방한 데이터 중 실제로 활용 가능한 데이터의 양과 수준은 극히 미흡하며, 민간기관은 물론이고 공공기관에도 데이터의 교류 또한 극히 제한적인 범위 내에서 일어나고 있다. 공공부문에서 생산하고 저장하고 있는 데이터의 양과 질은 크게 문제가 되지 않는다고 생각한다. 이미 우리나라 공공기관의 업무수행 수준은 상당 수준에 올라와 있고, 이를 통해 생산되는 데이터의 양과 질은 일정 수준 이상이라고 확신한다. 문제는 데이터의 활용이다. 이를 위해서는 데이터에 대한 개방과 교류가 필요하다. 즉 데이터 혁신은 “개방과 교류” 관점에서 진행되어야 한다는 것이다. 이 부분은 앞서 언급한 클라우드와 마찬가지로 기술혁신이 아닌 의식혁신의 주가 되어야 한다. 개방과 교류는 기술의 문제가 아니라 의식의 문제라는 것이다.
최근 정부 정책의 가장 핵심 중의 하나는 사회적 가치, 그중에서도 일자리 창출이 기관들에게 있어서는 가장 큰 과제이다. 정해진 예산 속에서 직접 고용 관점의 일자리 창출은 극히 제한적일 수밖에 없다. 따라서 간접고용 형태로 많은 사업을 진행하고 있지만 성과로 제시되는 숫자만큼의 일자리가 과연 창출되고 있는지는 실로 의문스러운 것이 사실이다. 공공기관의 일자리 창출의 방향성은 직접이나 간접적인 고용보다는 경제적, 사회적 관점에서 일자리를 만들어 낼 수 있는 기반을 조성해 주는 것이다. 그중 핵심이 데이터 개방이다. 유효한 데이터들의 집합 속에는 인사이트가 있으며, 그러한 인사이트는 경제적 가치를 창출할 수 있게 만든다. 그러한 경제적 가치는 궁극적으로 새로운 일자리를 만들어 낸다.
전기 자동차의 선도기업인 테슬라는 2014년 그들이 보유하고 전기 자동차의 주요 정보를 거의 모두 개방했다. 적은 정보라도 노하우라는 이유로 숨기기 급급한 산업 내 관습으로 볼 때는 말이 되지 않는 행위였다. 그러나 궁극적으로 테슬라의 정보 공개는 전기 자동차 생태계를 급속도로 팽창시켰으며, 생태계의 팽창은 관련된 새로운 일자리의 수요를 급증시켰다. 정보 공개의 주체인 테슬라는 어떻게 되었을까? 전기 자동차 생태계의 게임의 법칙을 규정하고 이를 주도하는 역할을 담당하면서 해당 산업계를 선도하고 있다. 최근 블록체인 등과 같이 주목받고 있는 주요 기술들은 오픈 소스 형태로 누구나 활용할 수 있도록 제공되고 있다. 그리고 그러한 기술들은 개방을 통해 많은 사람들의 관심 하에 응용분야로 발전하면서 새로운 비즈니스 분야로 확대되어가고 있다. 정보 공개는 이러한 관점에서 바라보아야 한다. 공공 기관에서 보안이라는 명목 하에 보관되고 있는 데이터들이 과연 얼마나 국가안보와 발전에 큰 영향을 미치고 있는 지를 돌아보아야 한다. 공공기관에서 보유하고 있는 데이터의 주인은 바로 국민이다. 나의 건강검진 정보를 내가 아닌 국가기관에서 보관하고 있으며, 이를 내 마음대로 취급하지 못하고 있는 것이 현실이다. 정부에서 창업을 독려하고 있다. 스타트 업 기업을 위해 많은 정책들이 쏟아지고 금전적인 지원도 적지 않다. 그러나 스타트 업의 창업을 위해서는 무엇보다도 비즈니스 인사이트를 도출할 수 있는 데이터와 정보가 필요하다. 공공 기관에서 이를 우선적으로 제공해야 한다. 보안이라는 인위적 장막을 거두어 내고 국민들이 필요로 하고 침체된 경제를 활성화시킬 수 있는 역할을 공공영역에서 수행하기 위해서는 최우선적으로 데이터 개방 범위를 확대해야 한다. 이를 위해서는 관련된 법규와 규제의 개선이 선행되어야 한다. 공공이라는 구태의연한 관점으로 데이터를 바라보는 것이 아니라 경제적 가치, 사회적 가치 창출 관점으로 데이터를 분류하고 이를 과감하게 개방할 수 있는 중앙정부 차원의 정책 구현이 강력히 추진되어야 한다.
데이터는 연결되었을 때 가치를 창출한다고 강조한 바 있다. 이를 위해서는 데이터의 교류가 필요하다. 최근 공공 빅데이터 활용의 우수사례를 보면 대부분 여러 기관과 민간 기업의 데이터를 연계하여 성과를 도출하고 있다. 필자가 앞서도 간략히 언급했지만 “보건의료 빅데이터 플랫폼 설계” 프로젝트를 수행할 때도 국내의 보건의료 관련 기관들의 데이터 교류의 한계성으로 인해 제대로 된 기능을 발휘하기 힘든 플랫폼의 설계에 그친 경험이 있다. 서울대학교 조성준 교수는 기관들이 데이터 교류에 소극적인 이유를 다음 두 가지로 요약했다. 첫 번째는 기관이 보유한 데이터가 질적으로 미흡한 경우이며, 두 번째는 우리가 애써 확보한 데이터와 정보를 남 좋은 일에 사용하는 것이 못 마땅하기 때문이다. 우리나라 공공기관의 경우에는 아마도 후자의 경우가 대부분일 것으로 판단된다. 데이터 교류는 남 좋은 일이 아니라 나도 좋은 일이 되어야 한다. 띠라서 데이터를 제공하는 기관에 대해서 반드시 보상이 따라 주어야 한다. 향후 자율주행 자동차의 상용화나 스마트 시티가 본격적으로 운영된다면 여러 기관들의 데이터의 교류는 필연적이다. 이때 데이터를 제공하는 기관들에 대해 데이터 제공을 공공기관으로서 의무로 한정해 놓는 것이 아니라 기관들에게 성과공유 차원의 혜택을 병행해 주어야 한다. 이러한 성과공유는 보다 질 좋은 데이터의 생산과 실시간 제공을 위해 투자되는 선순환 구조를 만드는 데 활용되어야 한다.
공공부문의 데이터 혁신을 클라우드 도입, 데이터의 개방과 교류 관점으로 생각해 보았다. 디지털 혁신을 바라보는 시각은 대부분 기술관 점이다. 그러나 더욱 중요한 것은 의식 관점이다. 기술은 개발된 것을 활용하기 때문에 적응과 학습이 필요하다. 그러나 그 이전에 기술의 필요성에 대한 인식을 제대로 갖는 것이 필요하다. 공공기관에서 가장 필요한 디지털 혁신은 필자는 데이터 혁신이라고 생각한다. 이를 위해서 데이터 관련된 기술에 집중하는 것이 아니라 공공 데이터에 대한 올바른 인식의 변화와 이를 통해 정부차원에서는 각 종 규제와 관련 법규에 대한 단계적인 개선이 진행되어야 하며, 기관 차원에서는 보유하고 있는 데이터에 대한 사회적 가치, 경제적 가치에 대한 의미를 부여하고 이에 대한 개방과 교류를 위한 노력을 기울어야 한다. 공공 데이터는 국민의 것이다. 국민이 관심을 가지고 활용할 수 있도록 최선의 환경을 제공하는 것이 공공 데이터 혁신의 목표가 되어야 할 것이다.