brunch

You can make anything
by writing

C.S.Lewis

by 선한인공지능연구소 Mar 08. 2020

1-1.DATA 초격차

I. 제4차 산업혁명과 데이터 기반 혁신

1.데이터가 주도하는 제4차 산업혁명

2016년 다보스포럼 이후 화제가 된 제4차 산업혁명이라는 개념은 디지털 세계, 생물학적 영역, 물리적 영역에 걸친 기술융합에 기반한 사회경제적 혁신을 예고되었고 현재 전 세계는 데이터 경제의 거대한 폭풍 속에서 생존방법을 모색 중에 있다.

제4차 산업혁명의 근간에는 빅데이터, 사물인터넷, 인공지능 등의 IT 기술의 혁신이 추진동력으로 작용하고 있으며 이에 기반한 O2O, 핀테크 등 신서비스 등장과 제조업 등 산업 부문의 효율 개선에 대한 기대가 부각되고 있다.

세 번에 걸친 산업혁명이 인류 발전에 엄청난 기여와 변화를 가져왔듯이 4차 산업혁명 또한 인류가 경험하지 못한 새로운 시대를 가져올 것으로 기대된다. 특히 4차 산업혁명은 세계 주요국이 겪고 있는 경제 성장 정체에 돌파구를 마련해 줄 것으로 기대되면서 주요국들의 기술 및 산업정책의 변화가 진행 중이다.

제4차 산업혁명, 지능정보사회 등으로 지칭되는 새로운 변화는 데이터를 생산하고 활용하는 IT 기술에 기반하고 있어 향후 사회경제 부문에서 데이터 중요성은 가중되어 오고 있다.

기술적 동인인 빅데이터, 사물인터넷, 인공지능 등은 방대한 데이터를 다루는 기술이며 제품과 서비스의 데이터 기반 혁신이 제4차 산업혁명과 지능정보사회의 실체가 되었다.

알리바바의 마윈은 데이터 자체가 새로운 자원으로 작용하는 DT(Data Technology) 시대가 시작되었음을 주장하며 데이터 기반 혁신을 강조했다.

제4차 산업혁명이 가져올 주요한 변화 중 하나는 지식창출과 의사결정의 상당 부분이 기계화되고 인간은 보다 고차원적인 전략적 의사결정에 집중하게 된다는 점을 주목해야 한다. 센서, 사물인터넷, 3D 프린팅, 의료, 로봇 등 다양한 부문의 기술 혁신과 융합이 전망되는 가운데 가장 두드러진 특징은 빅데이터, 인공지능 등 인간의 사고 능력을 일정부분 대체하고 보완할 기술의 혁신과 응용된다는 부분이다. 

제4차 산업혁명에서 전망하고 있는 제조업, 의료 등 다양한 부문에서 발생과 기술적인 향상은 데이터를 기반으로 하는 인간의 의사결정을 기계화하는 기술적 성과에 의존되어 왔다.

지식창출과 의사결정에 직접적으로 기여할 데이터 기반 혁신은 과거 경제. 경영 혁신에 비해 효율성보다 효과성 측면에 기여하는 바가 클 것으로 기대된다.

2. 데이터 기반 혁신을 가능하게 하는 변화들

데이터 기반 혁신을 가능하게 하는 변화들의 첫 번째는 SNS, 웹페이지, 모바일 인터넷, 사물인터넷 등의 활성화로 인한 데이터의 폭발적인 증가이다.

구글의 CEO인 에릭 슈미트는 2010년 컨퍼런스에서 “최근 이틀 동안 생산된 데이터의 양은 2003년 이전 인류가 생산한 정보의 양만큼 많다”고 주장했다. 센서, 앱 등 기계가 생산하는 데이터양이 증가하고 인간의 대화와 글, 이미지, 동영상 등 비정형적인 데이터 비중이 증가한다는 점이 데이터 폭증의 특징인데 이는 비정형적이고 방대한 양의 데이터가 생산되고 있고 그 양은 앞으로 더욱 증가 할 것이라는 점은 데이터 관련 혁신 기술의 등장을 요구하고 촉진하는 요인이 된다.

최근 몇 년간 이루어진 딥러닝으로 대표되는 인공지능 알고리즘의 혁신적 성능향상은 데이터 기반 혁신의 또 다른 촉진 요인이 되어 오고 있다. 인공지능 기술은 수십년간 정체되어 있었으나 2012년 Hinton 교수 등이 딥러닝 알고리즘을 혁신하면서 이미지인식, 자연어 번역 등에 있어서 기술적 돌파구가 형성되었다. 딥러닝 등 기계학습 알고리즘 혹은 소프트웨어는 다층적 학습망을 통해 방대한 양의 비정형 데이터를 학습하는 기술로서 빅데이터에 기반한 지식 창출을 수행해오고 있다.

 빅데이터 분석 기술의 실체는 인간의 문제해결능력 하에서 컴퓨팅 파워를 활용한 통계적 분석인데 딥러닝 이후 인간의 개입 필요성이 감소되어 오고 있다. 컴퓨팅 파워, 데이터 저장용량 등에 관련된 하드웨어들의 성능 향상과 가격 하락이 주요 원인이 되었다. 

이 데이터 기반 혁신을 만들어내는 원동력은 초기 컴퓨터들에 비해 천문학적 성능향상이 이루어졌으나 가격은 극적으로 하락한 스마트폰이 수십억 대씩 이용되고 있는 것이 현 사피엔스가 될 것이다. 데이터를 수집하는 센서, 메모리, 네트워크 하드웨어 가격이 꾸준히 하락하고 알고리즘과 소프트웨어를 가동시킬 수 있는 CPU, GPU의 성능 향상될 것은 자명한 사실이기 때문이다.     

3. 데이터 기반 혁신의 사례

데이터 폭증, 인공지능 기술 혁신으로 인한 데이터 기반 문제해결의 자동화, 하드웨어 성능향상과 가격 하락은 사회경제 체제의 다양한 부문에서 혁신을 유인했다. 특히 구글, 바이두, 페이스북 등 IT 거인들은 각각 딥러닝 등 인공지능 기술 분야의 대표적 학자들을 자사에 영입하면서 다양한 서비스에 데이터 기반 혁신 주도했다. 구글은 Hinton을 영입하여 이미지 인식, 이미지 생성, 자연어 번역, 생각벡터 등에서 데이터 기반 혁신의 기술적 변화를 선도했으며, 페이스북 또한 딥러닝 혁신가 중 하나인 Lecun을 통해 이미지 인식 기술을 혁신하고 자연어 처리에 기반한 챗봇 서비스 도입 등의 혁신을 선보이고 있다. 바이두는 Andrew Ng을 자사의 인공지능연구센터장으로 영입했었고 딥러닝 기술력에서 구글을 추격하면서 일부 분야에서 구글에 비교 우위를 주장하고 있다.

아마존, 넷플릭스 등은 고객 행태 데이터에 기반한 추천 제품 및 서비스의 정확도를 바탕으로 각각 압도적인 시장 지배력을 유지하고 있다. 아마존이 거대한 종합 온라인쇼핑몰, 미디어 사업자로 성장한 주요한 요인 중 하나는 다양한 제품과 콘텐츠에 대한 고객 맞춤형 서비스 제공능력이라 본다.

넷플릭스는 방대한 영상콘텐츠에 대한 고객 취향을 파악하고 맞춤형 콘텐츠를 제공하는 역량을 통해 고객들의 지속적인 재구매를 유인한다.

 유통, 증권거래, 엔터테인먼트, 치안 등 사회경제 체제 내 다양한 부문에서 데이터에 기반한 혁신적 변화 사례들이 발생 중인데 월스트리트에서는 물리학자 2천 명이 알고리즘 트레이딩에 참여하며, 미국 주식 시장의 상당수가 알고리즘에 의한 기계적 트레이딩이 이루어지고 있다.         

영국의 데이터 분석 회사인 Epagogix는 대본과 구성, 배우 등의 데이터를 분석하는 알고리즘을 통해 영화의 흥행 성적을 예측하여 판매하여 성과를 냈다.

 온라인 쇼핑몰 Stitch Fix는 이용자 취향, 신체 치수 등과 같은 데이터에 기반해 판매 의류를 선정하고 고객은 배송을 받은 이후에 제품 구매 결정하도록 유도하고 있다.

미국 캘리포니아주 Fresno시의 경찰은 소셜 미디어의 투고를 수집, 해석해서 요주의 인물의 위험도를 평가하는 소셜미디어 감시시스템 이용하고 있으며 플로리다주는 범죄발생예측시스템Huntchlab, PredPol를 이용하여 데이터 기반 범죄발생 예상지역을 특정하고 경찰 인력을 배치하는 방법으로 효과적인 시민보호를 하고 있다.      

4. 주요 국가의 데이터 기반 혁신 대응 정책

글로벌 저성장 기조, 생산성 하락 등을 겪고 있는 주요국들은 제조업 등 주요 산업 성장 전략, 공공부문 운영효율 향상 정책으로서 데이터 기반 혁신 정책을 마련하고 있다. 특히 미국은 첨단제조업파트너십(AMP) 프로그램, 독일은 Industrie 4.0, 일본은 산업 부흥전략, 중국은 중국제조 2025를 발표하는 등 국가별 대응 전략을 추진하고 있다. 

데이터 기반 혁신을 위한 미국의 정책적 대응은 제조업의 부흥에 초점을 맞추고 있으며 이 과정에서 GE 등의 민간기업과의 공조가 두드러지는 것을 볼 수 있다. 기업 수준에서 발생하고 있는 데이터 기반 혁신 사례의 대부분이 미국에 집중된 만큼 관련 기술과 인력 측면에서 미국의 역량이 가장 앞선 것이 현실적인 전망이다.

사실상 제4차 산업혁명이라는 개념 자체가 미국이 선도하는 데이터 기반 혁신을 추격하려는 유럽 경제권역의 자각이라 할 수 있다.

 구글, 페이스북, 아마존 등 인터넷 기반 기업의 기술 및 서비스 역량이 두드러진 가운데 GE가 주도하는 제조업 부문 데이터 기반 혁신 움직임이 부각되는 양상이다. data.gov로 대표되는 공공데이터 개방 움직임을 선도한 것 역시 미국으로서 공공과 민간 양 부문에서 미국의 데이터 기반 혁신 능력이 독보적인 상태다. 국내에서도 데이터 진흥원과 NIA가 다양한 시도를 하고 있다.

유럽에서 데이터기반 혁신의 중요성을 빠르게 인지하고 정책적으로 대응한 것은 독일로서 industrie 4.0을 중심으로 제조업의 데이터 기반 혁신을 공격적으로 진행하고 있다. 제4차 산업혁명, industrie 4.0 등의 개념을 유럽의 아젠다로 확장해가면서 빅데이터, 사물인터넷, CPS 등 IT 기술에 기반한 제조업 혁신을 추진한다. 대표적으로 아디다스의 스마트팩토리가 대표적인 사례가 될 것이다. industrie 4.0은 현실과 동떨어진 표준 선정과 경직된 협력체계 등으로 난항을 겪었으나 2015년 업계 의견을 받아들여 보다 유연한 제조업 혁신 전략으로 재탄생되어 왔다.

중국은 제조업 부문에서 저임금 기반 성장의 한계를 돌파하기 위한 대책으로서 중국제조 2025 등의 전략을 표방하여 데이터 기반 혁신의 일부 개념을 포함하고 있으나 현실적으로는 저임금 기반 단순 조립을 넘어선 고부가가치 제조업 역량을 확보하기 위한 정책으로 보여진다.

일본의 산업부흥전략은 데이터 기반 혁신을 제조업, 농업, 의료, 금융 등 전 산업부문에서 활용하자는 전 방위적 산업 전략으로서 로봇에 대한 강조가 두드러지고 특히 손정의 회장의 소프트뱅크와 도요타가 손잡은 MONAT 은 자율주행 자동차 시장의 혁명적인 변화를 예고하고 있다.

기술 전략보다는 산업 응용 범위에 대한 강조가 눈에 띄는 산업 전략으로서 일본 정부의 통상적인 산업 전략에 IT 기술과 데이터에 대한 강조가 추가된 형태로 딥러닝, 빅데이터 등 IT기술에 있어서 일본의 혁신 역량이 눈에 띄지 않는 것이 현실이나 다른 주요 국가들과의 정책적 차별점은 로봇 기술에 대한 강조하고 있다.

 로봇 기술 강조의 이유는 알고리즘, 소프트웨어 보다는 정밀 기계 및 부품 분야의 장점을 데이터 기반 혁신에 접목하려는 현실적 전략으로 판단된다.          

II. 데이터 기반 혁신의 기존 이슈 분석

1. 혁신을 둘러싼 다양한 논점들

 대표적으로 기술 혁신, 위험과 효용, 시장 왜곡되고 있다. 데이터 기반 혁신은 새로운 지식과 가치의 창출, 새로운 제품과 서비스 탄생, 생산과정과 조직 운영효율의 혁신 등 다양한 영향력을 가진 만큼 관련된 문제도 다양하게 일어난다.

딥러닝, 빅데이터 등 데이터 수집 및 처리를 위한 IT기술 혁신이 선결과제로서 기계화된 지식 창출과 의사결정이라는 새로운 가능성의 이면에는 보안, 프라이버시, 인간이 배제된 의사결정 등의 문제점들이 존재한다.

기업과 기업, 개인과 기업 간 균형발전의 측면에서 거대 기업의 시장지배력 강화, 정보 비대칭 등 시장 왜곡의 가능성이 대두되고 있다. 기술 혁신 성과에 대한 합리적 기대수준과 위험 조정에 대한 의견이 각계에서 쏟아져 나왔고 비교적 늦게 시장 왜곡에 대한 경각심이 제기되는 추세이다.  

2. 알고리즘, 알고리즘, 알고리즘, 그리고 인간

데이터 기반 혁신의 전제조건인 딥러닝, 빅데이터 등 기술 혁신 경쟁이 미국 중심으로 진행되면서 위 기술에 있어서 기초 기술 혁신 역량, 산업 내 성공사례가 미국의 거대 IT 기업에 집중되어 있어 타 국가들 및 기업들이 경쟁적으로 추격하는 구조이다. 바이두가 실리콘 밸리 내에 인공지능 연구거점을 마련하는 등 미국 외 기업과 학계에서 기술 추격 노력을 계속하고 있으나 여전히 기술 격차는 존재하고 있다. 2016년 바이두가 이미지 인식 성공률에서 구글을 앞질렀다고 발표했으나 구글은 이미지와 상황의 매칭, 다국어 번역 등에서 새로운 딥러닝 기술 혁신을 선보여 기술 격차는 여전하다. ETRI 등 국내 연구자들도 이미지 인식, 인간과 알고리즘의 퀴즈 대결 등에서 일정 수준의 성과를 보이고 있으나 세계 최고 수준에는 미치지 못하고 있는 것이 현실이다. 2015년 Hinton은 인간의 생각 자체를 모델링하는 생각벡터(thought vectors) 개념을 기계학습에 접목함으로써 보다 인간에 가까운 인공지능의 가능성을 제기하여 기존의 딥러닝은 하나의 단어, 이미지, 상황에 대해 잘 훈련된 기계적 반응을 도출하는데 성공한 것이며, 생각벡터는 동일한 단어, 이미지, 상황에 대해서도 다양한 맥락을 종합적으로 인지하는 인간의 두뇌 활동을 기계적으로 모사하려는 시도로서 과거 context awareness라 지칭했던 기술 부문을 포함한 딥러닝 기술의 활용 가능성을 대폭 증가시킬 것으로 기대된다. 

데이터 기반 혁신에서 알고리즘에 대한 강조는 지나칠 수 없으나 기업과 조직 측면에서는 새로운 정보 및 지식의 생산, 소비 체계에 적합한 인적 자원의 확보에 대한 강조가 꾸준히 제기되어 오고 있다. 데이터 사이언티스트와 같은 새로운 인적 역량 확보에 대한 요구는 빅데이터, 딥러닝 기술의 확산과 더불어 지속적으로 강화되어야 한다. 기업과 조직의 문제에 빅데이터, 딥러닝 기술을 활용하기 위한 필수적 자원으로서 통계학, 수학, 코딩(파이썬, R)에 관한 지식과 종합적 문제해결 역량을 함께 갖추어야 한다. 근래에는 조직 전체가 데이터 기반 혁신을 수용하기 위한 준비로서 데이터 기술에 대한 이해 역량을 갖춘 중간관리자 계층에 대한 요구 또한 제기

위험과 효용, 대립에서 조화로 데이터 기반 혁신이 가져올 효율과 효과 증가에 대한 기대의 이면에는 프라이버시, 보안, 기계화된 지식 창출과 의사결정에 내재된 위험에 대한 우려가 여전히 존재한다. 프라이버시와 정보보안에 대한 경고는 데이터 기반 혁신에 관련되어 제기되는 가장 빈번한 쟁점으로 개인과 기업, 정보보호와 정보효용에 걸친 근본적 대립이라 할 것이다.

기업이 개인 정보를 수집, 분석함으로써 얻는 수익이 개인에게 지불되는 대가 또는 혜택에 비해 지나치게 크다는 인식이 데이터 수집 및 활용 확산에 걸림돌이 되고 있다. 옵트인, 옵트아웃 등과 같은 개인정보 제공 선택권이 마련되어 있으나 기업이 복잡한 약관 등을 통해 사실상 개인정보 제공을 강제하고 있는 것이 현실이기 때문이다.

프라이버시 보호를 위한 데이터 비식별화 등의 기술적 대안이 제안되고 있지만 빅데이터에서 나타나는 모자이크 효과로 인해 비식별화의 효용이 손상되고 있다. 특히 해킹 등 정보누출은 데이터 기반 혁신의 가치를 손상시킬 수 있는 위험이며 개별 데이터 누출이 모자이크 효과로 인해 증폭된 위험을 낳을 가능성 존재하기 때문이다. 각 조직별 보안 대책뿐만 아니라 모자이크 효과 발생 위협에 대한 종합적 보안 대책이 정보 생태계의 인프라로서 마련되어야 할 것이다.

기계화된 지식 창출과 의사결정에서 생산되는 결과물의 신뢰성, 활용에 따른 위험 발생에 대한 인간의 판단을 가능하게하기 위해 시스템의 투명성 확보가 필요하다. 딥러닝 학습 과정은 사실상 인간이 이해하는 것이 불가능하며 학습된 신경망이 산출하는 결과의 전체 집합을 검증하는 것 또한 불가능한 것이 현실이다. 강한 인공지능에 대한 각계 전문가들의 우려도 큰 맥락에서 이해 불가능한 지식 시스템에 내재된 위험을 경고하고 있다.

데이터 기반 혁신을 둘러싼 위험과 효용의 대립은 다양한 법제도와 정보기술을 통해 해소되어야 할 것이며 기본적 해결 방향은 민주적 절차에 따른 사회경제 체제 전체의 효용을 최대화하는 방향을 수립하고 시행해나가야 한다.     

3. 시장을 변화시키되 왜곡시키지 않는 데이터 기반 혁신

데이터 기반 혁신에 따른 시장 왜곡의 위험은 크게 거대 데이터 기업에 의한 시장 독점과 소비자 종속, 정보비대칭으로 인한 시장 효율 저해 등에 의해 발생된다. 방대한 데이터를 축적한 기업에 의해 시장 진입장벽이 형성되면서 사실상의 시장독점이 발생하고 이용자가 종속될 위험이 발생하기 때문이다.

Google은 검색이력 데이터를 활용하여 검색 정확성을 30% 이상 증가시키고 있다고 알려져 있는데 이는 Bing 등 후발 서비스가 극복하기 어려운 경쟁 우위를 달성하고 있기 때문이다. Google의 PageRank 알고리즘 등은 학술 논문을 통해 공개되어 있으며, 딥러닝 알고리즘, 개발 툴킷 등도 논문과 공개 SW 등의 형태로 제공되고 있으나 검색이력 데이터는 비공개되어 있다. 독점적 데이터와 지식창출 알고리즘을 동시에 소유한 기업은 데이터-지식 독점자로서 강력한 시장지배력을 획득 가능해질 것이다. Google의 경우 이용자 유입, 데이터 축적, 검색엔진 알고리즘 진화 등이 일련의 선순환 구조를 형성함으로써 지구적 시장지배력을 확보했다.

Watson 기반 컨설팅 서비스를 판매 중인 IBM, 정밀농업 컨설팅 서비스를 시작한 GE 등도 산업 데이터 축적에 따라 데이터-지식 독점자로 자리를 잡고 있으며 유럽 각국은 Google을 데이터 독점자라 공격하고 있는데 이는 검색엔진의 시장 지배력이 온라인 광고 등 서비스로 전이하고 있다는 해석에 기반을 두고 있다는데 힘이 실리고 있다. 특정 업체가 축적한 데이터와 지식창출 알고리즘을 독점적 지위의 원천으로 보고 이를 규제할 것인지에 대해서는 논의 필요한 시점이다. 유발하라리의 호모데우스에 거론된 데이터교가 정말로 현실이 되고 있다.

데이터를 축적한 기업이 개인 고객을 대상으로 정보비대칭에 기반한 가격 차별화, 서비스 차별화를 시행할 경우 이에 대한 방어 기제가 아직은 미비하기 때문이다. 금융회사가 고객의 대출 이력, 공공데이터 등에 기반하여 고객의 미래 재무 상태에 대한 예측정보를 축적할 경우 개인에 대한 강력한 red-lining 발생하기 때문이다. 이러한 정보비대칭 우려는 데이터 기반 혁신이 진일보한 상황에서 발생 가능하지만 발생하기 시작한다면 그 시점에서는 실태파악이 어려워 규제 마련이 곤란해지게 된다.

데이터 기반 기업의 시장 독점, 정보비대칭 등에 대한 법제도와 규제는 기술과 기업 변화 속도에 뒤쳐질 것으로 전망되기에 현 시점에서 규제 마련을 위한 공감대 형성이 중요하며 이는 현실적인 정책이 필요하다.          

III. 데이터 자본화를 위한 기술 및 시장 이슈

1. 데이터 자본화의 개념과 필요성

앞서 언급된 데이터 기반 혁신 관련 이슈들은 대단히 다양하지만 이러한 문제들의 많은 부분이 데이터가 자본화되지 못하고 있다는 점과 연관이 깊다고 볼 수 있다. ‘데이터 자본화’를 데이터가 독립된 재화로서 시장 참여자들 간에 원활하게 거래되는 것으로 정의한다. 데이터가 정부, 기업, 개인 등 시장 참여자들 간에 적절한 가격으로 원활하게 거래된다면 데이터 기반 혁신의 촉진과 정상적인 시장 작동이 가능할 것으로 전망되기 때문이다.

데이터 자본화의 핵심적인 요소는 데이터라는 새로운 무형 자산에 대한 적정 가치 평가 체계와 가격 결정이 가능한 거래 시장의 형성인데 데이터 가치 평가와 가격 결정이 어려운 상황에서는 데이터 거래가 일부 시장 참여자 간에 이루어지게 되고 데이터 활용에 따른 혁신이 제한될 것으로 예상된다. 또한 데이터 가치와 가격에 대한 시장 내 시그널이 부재하면 데이터 생산, 수집, 저장, 처리, 분석, 활용을 담당하는 개인, 기업의 소유권과 통제권에 대한 쟁점해결이 복잡한 규제에 의존하게 될 것이기 때문이다.

데이터 혁신 관련 프라이버시와 보안 문제, 위험과 효용의 가치 평가 문제는 개인과 기업의 데이터 소유권과 통제권 문제로 데이터 가치와 가격이 명확하게 결정될수록 완화될 것이라 생각한다. 데이터의 자본화는 데이터 기반 스타트업의 시장 진입을 촉진할 수 있어 특정 기업의 데이터 독점에 대한 간접적 방어기제로 작동가능해진다. 구글 등이 가진 데이터 관련 서비스 시장에 대한 강력한 지배력은 데이터 확보에 있어서 선순환 구조를 구축하여 사실상의 데이터 독점력을 가졌다는 점에 기반되기 때문이다. 선두기업이 구축한 데이터 확보의 선순환 구조에 의해 형성된 시장 진입장벽은 후발 업자들이 자본화된 데이터 거래를 통해 일정 부분 극복가능해질 수 있다. 데이터 기반 혁신 시장에서 나타나는 기업의 시장 독점은 시장 획정에 대한 쟁점 정리가 어려워 규제가 곤란한데 데이터 자본화는 독점력에 대한 시장 내 대항수단을 마련할 수 있다는 점에서 의의를 가진다. 

주요국들이 공공 데이터 개방을 앞 다투어 시행하고 있기에 데이터 자본화 쟁점은 민간 데이터의 거래에 집중되고 있다. 현재 사회적 효용의 제고, 혁신 유인 등의 명분에 따라 공공데이터는 무료로 개방되는 추세이며 이러한 현상은 데이터 거래 시장 형성의 씨앗으로 작용되고 있다. 영국의 컨설팅 회사인 Lateral Economics는 영국의 공공 데이터 개방 전략과 관련하여 2016년 공공 데이터가 무료로 개방될 때 국가 총생산에 기여하는 부분이 최대화됨을 발표했다. 무료에서 유료로의 전환, 프리미엄(freemium) 가격 체계의 적용, 데이터 사전 처리 수준에 따른 가격 차별화 등에 대한 검토에 기반하여 완전 무료 개방 원칙이 공공의 효용 증대에 가장효과적이라는 결론을 제시했다.

민간 데이터의 거래는 M&A, 기업 간의 포괄적 거래 계약의 일부로서 발생하는 경우가 대부분이며 최근 데이터 브로커에 의한 데이터 거래가 차츰 증가하는 추세이다. 민간 데이터의 거래는 사례가 제한적이며 가격과 가치의 평가가 불투명한 경우가 대부분이어서 데이터 자본화 수준이 아직은 낮은 상태이다.     

2. 데이터의 경제적 가치와 자본화 가능성

적시성, 무한가치성, 무형성, 축적효과성, 독점성, 신용가치성 등 데이터 자체의 경제적 가치는 데이터 기반 혁신의 가치와 대립하는 측면이 있어 이에 대한 조정이 데이터 자본화의 핵심적 이슈되 대두되고 있다. 

일반 재화와 비교할 때 데이터 자체는 재화로서 적시성, 무한가치성, 무형성, 축적효과성, 독점성, 신용가치성 등의 특징을 보유한다. 빅데이터, 기계학습 등의 기술 발전과 더불어 적시성, 축적효과성 등이 주요한 데이터 가격 결정 요인으로 작용할 것으로 보인다.

데이터의 폭발적 증가와 비정제 데이터에서 지식을 생산할 수 있는 기술적 역량의 혁신 추세를 볼 때 향후 신용가치성이 가진 중요도는 일정 부분 감소할 것이기 때문이다. 데이터는 무형자산이지만 데이터로부터 지식을 생산하는 기술이 자동화되어갈 수록 데이터의 가치에 대한 예측은 더욱 쉬워질 것이다. 데이터가 기업 내부에서 활용되는 경우에는 무한가치성이 유지될 수 있으나 데이터 거래를 통해 데이터에 기반한 유사 제품, 서비스가 경쟁적으로 출현할 때

는 데이터의 무한가치성은 낮아질 것이기 때문이다.

데이터의 독점성은 개별 기업 입장에서는 강화해야 할 가치이지만 데이터 기반 혁신 생태계 전반의 성장을 고려하는 시장 정책의 관점에서는 독점성 완화에 대한 요구가 존재한다. 최근 기술혁신이 빠르게 진행되고 있는 빅데이터, 기계학습 기술은 데이터의 양이 충분히 방대하다면 데이터의 신용가치를 일정 부분 보완할 수 있음을 시사해준다.

개별 데이터에 대한 가치 및 가격의 결정은 대단히 어려운 과제이며 그 원인은 특허 등 무형자산 가치 평가에서 마주하는 장애요인들과 일정 부분 유사하다. 데이터는 특허, 상표권, 노하우 등과 같이 무형자산으로 분류되는데 무형자산 가격 결정은 공정거래감시, 조세 등의 관점에서 주요 연구대상 중 하나이지만 현재까지 명확한 가치 결정 기준은 미비해오다 2018년 유럽특허청(EPO: European Patent Office)은 인공지능(AI: Artificial Intelligence)과 머신러닝 (ML: Machine Learning) 관련 내용이 포함된 새로운 특허심사 지침을 발표 EPO는 해당 지침을 통해 AI 와 ML 은 분 류 (Classification), 군 집(Clustering), 신경망(Neural Networks), 유전 알고리즘(Genetic Algorithms), 서포트 백터 머신(Support Vector Machines) 등을 위한 계산적 모델 및 알고리즘에 기반한 것으로, 그 자체로 추상적인 수학적 특성을 지닌다고 명시했다. EPO의 규정에 따르면 추상적인 수학적 개념은 특허성에서 배제되는 것으로, 해당 지침 내용은 EPO가 AI와 ML 자체에 대한 특허성을 인정하지 않는 것으로 해석된다. 하지만, EPO의 지침에는 일부 수학적 방법에 기반한 청구항들을 예외 사항으로 기재하고 있으며, AI와 ML의 경우 발명품의 기술적 특징이 명확해야 하며, 사용된 수학적 방법이 해당 발명품의 기술적 특징에 명백히 기여해야 특허성이 인정된다. 이는 두 가지 가능한 상황적 기준에 따라 심사되는데, 첫 번째는 “기술 분야에 대한 수학적 방법 응용”이며, 다른 하나는 “특정 기술 구현에 적용”으로, 새로운 지침은 하기와 같은 구체적인 예들을 제공하고 있다.      

① 불규칙한 심장 박동 확인을 위한 모니터링 장치에 신경망 사용

② 영상 에지, 픽셀 등 저 수준 기반의 디지털 영상, 비디오, 

   오디오 혹은 음성 신호 분류

③ 생리학적 측정 처리 자동화 시스템을 통한 의료 진단     

이런 특허, 상표권, 노하우 등의 무형자산은 재무적 가치가 평가되는 자산이 국내에서는 아직 인지되지 않고 있으며 획득에 투입된 자원은 기업의 비용으로 분류하는 것이 현실이다. 무형자산은 부분적 배타성과 누출효과, 내재적 위험, 비시장성 등의 특징으로 인해 재무적 가치 평가가 어려운데 이러한 특징은 데이터도 일정 부분 공유되어져야 한다.

데이터는 여타 무형자산과 부분적 배타성, 내재적 위험이라는 측면에서 상이한 점이 있다고 보여 지는데 이러한 점들이 데이터 자본화에 긍정적으로 작용 가능하다. 정보보안 기술을 통해 데이터의 부분적 배타성을 감소시킬 수 있고 이에 따른 데이터 자산의 배타적 효익 보장은 데이터 거래 가능성이 증가할 수 있다. 무형자산의 내재적 위험은 자산 획득 노력 자체에 대한 유인을 줄이기도 하는데 데이터의 경우 생산 및 저장 비용이 지속적으로 감소하고 있어 최소한 데이터 획득에 대한 유인의 감소는 크지 않다. 또한 데이터의 활용 부문이 데이터 자체에 의해 크게 제약받지 않는다는 점은데이터 자산의 범용성을 강화해 거래 가능성을 높인다고 할 수 있다. 

경제적 가치로서의 무형자산과 데이터의 특징 비교를 종합해보면 시장 형성이 어렵다는 점은 공통적이나 부분적 배타성과 내재적 위험 측면에서는 데이터가 여타 무형자산에 비해 자본화 가능성이 높다고 할 수 있다.      

3. 데이터 거래의 실제 사례와 향후 변화 전망

데이터 가치 평가와 가격 결정의 어려움에도 불구하고 민간 데이터의 거래가 제한적이나마 M&A, 포괄적 계약 등의 형태로 발생하고 있다. 민간 데이터 거래의 대표적 사례는 인터넷 서비스 기업들의 M&A, 개인의 IT 서비스 이용에 따라 부수적으로 발생하는 개인정보 제공 등을 통해 ISP, 구글 등의 서비스를 이용하는 개인이 명시적으로 혹은 암묵적으로 개인신상정보와 이용패턴 등의 데이터를 기업에 제공하는 것이다.

서비스 이용에 따른 부수적 개인정보의 제공은 대부분 명시적 대가 지불이 없으며 이는 거대 기업에 의한 프라이버시 침해 우려로 전환되고 있다. 미국 FCC는 2015년 Communication Act의 섹션 221에서 ISP가 개인의 명시적 허락 없이 개인정보를 수집하는 것을 금지하는 조항을 명문화했다.

페이스북은 왓츠앱을 190억 달러에 인수했는데 이는 왓츠앱 가입자 당 약 30달러의 대가를 지불한 것으로 해석가능하며 모든 유형, 무형자산에 대한 포괄적 매입이기는 하지만 데이터에 대한 거래로 볼 수 있다. 성장 잠재력이 확인된 신생 기업을 인수하는 거대 IT 기업들은 평균적으로 가입자 당 30달러 수준의 인수비용을 지불하는 것이 통상적인 수치다. 인터넷 서비스 기업들에게 있어서 고객 데이터, 서비스 시행에 따라 발생한 데이터는 그 자체로 소중한 자산이기는 하지만 데이터와 비즈니스 모델이 유기적으로 얽혀있기에 데이터 거래보다는 기업 자체에 대한 M&A가 빈번해지고 있다. 최근 점차 사례가 늘어나고 있는 데이터 브로커를 통한 데이터 거래는 데이터의 품질, 데이터의 다양성 측면에서 아직까지는 미성숙한 단계에 있다고 본다. 성별, 나이, 거주지 등 간단한 신상정보와 특정 제품, 서비스에 대한 취향 정보를 담은 데이터가 주로 거래된다. 데이터 브로커에 의한 데이터 거래는 대개 판매 형태로 이루어지며 주요 데이터 공급자는 데이터 전문 수집 업체들은 데이터 브로커 시장에서 거래되는 데이터의 다양성, 신뢰성, 적시성, 규모는 구글등 거대 IT 기업이 수집, 보유하고 있다고 보여 지는 데이터에 비해 극히 취약하다. 

향후 데이터 거래는 현재 양상과 크게 달라지기 어려운 것이 현실이기에 데이터 기반 혁신의 촉진을 위해서는 데이터 거래 구조의 혁신이 절실하다. 개인 수준에서는 현재의 IT 서비스 이용행태를 변화시킬 유인이 미미하고 거대 IT 기업들이 내부 데이터를 거래 시장에 내놓을 유인이 없다. 데이터 브로커 시장은 데이터 공급자들의 성장이 전제되어야 하는데 현재 시장에 참여중인 데이터 공급자들만으로는 방대한 데이터 공급이 어렵다. 따라서 다양한 데이터 공급자들이 데이터 거래 시장에 참여하도록 하는 촉진책이 요구된다.     

4. 데이터 자본화를 위한 준비

데이터 자산의 배타성과 내재적 위험성을 낮춤과 동시에 다양한 참여자를 유인할 수 있는 데이터 거래 시장의 기술적 구조 마련을 통해 데이터 자본화를 앞당길 수 있다.

데이터 자산의 가치 평가 가능성을 높이기 위해서는 데이터 자산의 배타성과 내재적 위험성을 낮추기 위한 정보보안, 빅데이터, 딥러닝 등의 기술 혁신에 집중해야 한다. 구글 등 거대 IT 기업은 데이터 거래 시장에 참여하기에는 자신들의 독점적 데이터 가치에 비해 데이터 거래로 얻을 수 있는 효용이 적다. 데이터 거래 시장 참여를 촉진할 수 있는 기업으로는 스타트업 등 중소 IT 기업과 금융, 유통, 제조 등 IT 이외의 산업에 속한 업체를 고려할 수 있다. 중소 규모의 IT 기업들은 데이터 독점보다 데이터 거래를 통해 얻을 수 있는 효익이 더 클 수 있고 특히 이들이 연합해 거대 IT 기업과 유사한 수준의 서비스를 부분적으로나마 제공할 가능성이 있기 때문이다. 처절한 선택과 집중 전략이 필요한 시점이다. 

 IT 이외 산업에 속한 업체들 또한 최근의 데이터 기반 혁신 성과를 활용하기 위해서는 다른 업체의 데이터를 통합해 활용할 필요가 있기에 시장 참여 가능해진다. 데이터 거래 시장은 판매, 대여 등 다양한 거래의 형태를 제공하고 데이터 이전과 활용에 관련된 정보보안, 빅데이터, 기계학습 등의 기술 역량까지 제공해야 할 것이다. 적시에 다양한 데이터에 접근, 활용하기 위해서는 다양한 라이센싱 계약이 필요하고 거래 지불 형태 또한 사전지불, 사후지불, 성과비례 가격, 프리미엄 (freemium) 가격 등의 대가 지불 구조 지원이 필요하다. 

데이터 자산의 내재적 위험을 줄이고, 적시성, 축적효과성을 극대화하기 위해서는 거래 중개뿐만 아니라 데이터 저장, 큐레이션, 분석 소프트웨어 등이 통합된 거래 플랫폼이 요구된다. 다양한 데이터를 실시간으로 통합하고 거래할 수 있을 때 데이터의 적시성, 축적효과성이 증가하는데 이를 위해서는 방대한 데이터 저장용량, 실시간 큐레이션 역량이 기본적으로 요구되며 데이터의 내재적 위험을 줄이기 위해서는 데이터 가치에 대해 거래 참여자들이 신뢰할 수 있는 평가가 이루어져야 하는데, 이를 위해서는 데이터 분석과 활용의 일정 부분이 데이터 거래 플랫폼 내에서 이루어지는 것이 이상적이다. 데이터 분석, 활용 과정에서 사용된 데이터 목록, 분석 및 활용의 결과 등은 데이터 공급자, 이용자, 거래 플랫폼의 데이터 소유권, 통제권에 따라 다르게 공개되어야 할 것이다. 이러한 거래 플랫폼은 보안, 클라우드 컴퓨팅, 빅데이터, 기계학습 등의 기술들이 통합적으로 적용되어야 하고 또한 관련 법제도 자체가 별도로 마련되어야 할 것이다.     

<요약>

본 장에서는 제4차 산업혁명 등 데이터 기반 혁신을 촉진하기 위해 데이터의 가격 평가, 데이터 거래 시장의 구성 가능성에 대해 분석해 보았음.     

1. 데이터 자본화의 개념과 필요성

데이터 기반 혁신에 관련된 사회경제 및 기술적 이슈들은 다양한데 이러한 문제들의 많은 부분이 데이터가 자본화되지 못하고 있다는 점과 연관이 깊음

- 본 장은 ‘데이터 자본화’를 데이터가 독립된 재화로서 시장 참여자들 간에 원활하게 거래되는 것으로 정의

- 데이터가 정부, 기업, 개인 등 시장 참여자들 간에 적절한 가격으로 원활하게 거래된다면 데이터 기반 혁신의 촉진과 정상적인 시장 작동이 가능할 것으로 전망

- 데이터의 자본화는 데이터 기반 스타트업의 시장 진입을 촉진할 수 있어 특정 기업의 데이터 독점에 대한 간접적 방어기제로 작동가능

2. 데이터의 경제적 가치가 가진 특성

적시성, 무한가치성, 무형성, 축적효과성, 독점성, 신용가치성 등 데이터 자체의 경제적 가치는 데이터 기반 혁신의 가치와 대립하는 측면이     있어 이에 대한 조정이 데이터 자본화의 핵심적 이슈

<데이터의 경제적 가치 특성>     

개별 데이터에 대한 가치 및 가격의 결정은 대단히 어려운 과제이며 그 원인은 특허 등 무형자산 가치 평가에서 마주하는 장애요인들과 일정 부분 유사함

    - 데이터는 여타 무형자산과 부분적 배타성, 내재적 위험이라는 측면에서 상이하다고 보여지며 이러한 점들이 데이터 자본화에 긍정적으로 작용 가능     

3. 데이터 자본화와 거래 시장 형성을 위한 제언

데이터 자산의 배타성과 내재적 위험을 낮추고 다양한 참여자를 유인할 수 있는 데이터 거래 시장의 기술적 구조 마련을 통해 데이터 자본화를 앞당길 수 있음

- 데이터 거래 시장 참여를 촉진할 수 있는 기업으로는 스타트업 등 중소 IT 기업과 금융, 유통, 제조 등 IT 이외의 산업에 속한 업체를 고려할 수 있음

데이터 거래 시장은 판매, 대여 등 다양한 거래의 형태를 제공하고 데이터 이전과 활용에 관련된 정보보안, 빅데이터, 기계학습 등의 기술 역량까지 제공해야 할 것

- 이러한 거래 플랫폼은 보안, 클라우드 컴퓨팅, 빅데이터, 기계학습 등의 기술들이 통합적으로 적용되어야 하고 또한 관련 법제도 자체가 따로 마련되어야 할 것     

----------------

1.데이터경제

 NIA 문용식 원장은‘데이터경제 활성화 전략’이라는 기조발제를 통해 데이터 이용 활성화를 위한 데이터 고속도로 구축 전략을 제시하고, 이를 위한 5대 원칙으로 ① 기계인식이 가능한 원천데이터의 적시성 있는 개방, ② 공공데이터의 품질 확보, ③ 지속적인 데이터 플랫폼 운영, ④ 데이터 전문 인력 양성을 위한 개발자 생태계 지원, ⑤ 데이터 기반의 정부 업무 프로세스 전환을 강조하였다.          

   데이터 생태계 조성을 위한 사례 발표와 중소기업의 안정적인 데이터 수급 ‧ 분석 환경과 데이터 거래 활성화 방향, 데이터 통합 관리체계 구축 등 공공데이터 활용현황과 활성화 방안에 대한 각계 전문가들의 발제가 있었다. 데이터경제 포럼은 데이터경제 활성화를 위한 원칙과 틀을 우선적으로 수립하기 위하여 ① 데이터경제 총괄, ② 거래·활용, ③ AI·빅데이터, ④ 품질·표준화, ⑤ 플랫폼(클라우드)의 5개 연구반(W/G)을 운영하여 데이터경제 현안 이슈를 진단하고, 연구반에서 논의된 이슈를 중심으로 월례 포럼과 정책세미나를 개최하여 민‧관 협력네트워크를 통해 공론화해 나갈 예정이다.

    한국정보화진흥원 원장은‘데이터경제 포럼을 통해 데이터로 국내의 혁신성장을 주도하고 미래를 준비하기 위한 국민 참여의 장, 열린 소통의 장, 문제해결의 장이 되도록 산업계, 학계, 연구계의 다양한 의견들을 모아갈 것’이라고 밝혔다. 그의 비전이 달성되기를 응원한다.     

토마 피케티는 21세기 자본론에서 글로벌세금을 제안했는데 이 내용의 핵심은 데이터 격차는 자본주의의 빈부격차보다 더 심한 격차를 만들 수도 있다는 것이다. 그에 대한 대중의 자각과 기본적인 지식을 갖춰야 한다. 그것이 앞으로 우리가 맞이할 인공지능 시대의 민주주의 시민의 기본적인 자질이라 생각한다.

우리는 한 기업의 모토를 되새길 필요가 있다. ‘악해지지 말자’               

데이터 스팩트럼         

작가의 이전글 4-2.직업의 선순환
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari