brunch

You can make anything
by writing

C.S.Lewis

by 백과흑 Sep 26. 2017

데이터 유통시장에 주목하라

개인 데이터를 삽니다. 데이터 쿱(DATA COUP)

데이터 브로커(DATA BROKER)


 많은 기업과 단체들이 자체적인 데이터를 창출, 수집, 분석하기를 원하지만, 모두가 자신에게 필요한 모든 데이터를 자체적으로 만들어 낼 수는 없다. 따라서 데이터의 생산자 혹은 공급자로부터 최종적으로 데이터를 원하는 고객에게 전달하는 데이터 유통시장의 형성은 불가피하다고 생각된다. 미국에서는 소비자의 오프라인, 온라인, 모바일 이용 정보를 수집, 분석하여 판매하는 사람 또는 기업을 데이터 브로커(Data broker)라 부르고 있으며, 정보 브로커(Information broker) 또는 정보 재판매자(Information reseller)로 부르기도 한다.

 미국 내에서만 약 600~700개의 데이터 브로커가활동하고 있으며, 전체 산업 규모가 약 150억 달러(17조 700억) 수준으로 알려져 있다. 미국 공정거래위원회(FTC)의 2014년 데이터 브로커 산업 실태 발표자료에서 조사한 9개 주요 데이터브로커 업체는 다음과 같다.

 


1) Acxiom
- 마케팅 캠페인, 부정사용 탐지를 위한 고객 데이터 분석 서비스 제공
- 전 세계 7억 명의 소비자 정보가 담긴 데이터베이스 보유


2) Corelogic
- 산업계와 정부에 재무정보와 부동산정보에 기초한 분석 서비스 제공
- 약 8억 건의 부동산 거래정보, 약 1억 건의 담보 데이터베이스 보유

3) Datalogix
- 거의 모든 미국 소비자의 마케팅 데이터를 제공
- 2012년 페이스북은 페이스북 이용자의 소셜 사이트 상품광고 조회와 오프라인 상점의 구매 관련성 측정을
  위해 데이터로직스와 협력 발표


4) eBureau
- 마케터와 재무 관련 회사, 온라인 유통업체에 수익성이 높은 잠재고객과 부정거래 예측 서비스 제공
- 매달 평균 30억 건이 넘는 새로운 정보 추가 축적

5) ID analytics
- 특정인 확인, 부정거래 확인 서비스 제공
- 7천억 건의 데이터와 14억 건의 소비자 거래 데이터 보유


6) Intelius
- 신원 조회와 공문서 정보 제공

- 20억 건이 넘는 데이터베이스 보유


7) PeekYou

- 소셜 미디어 사이트, 홈페이지, 블로그의 콘텐츠를 분석 작성자 확인 서비스 제공


8) Rapleaf

- 이메일 주소와 함께 이메일 주소 소유자의 연령, 성, 우편번호, 소득, 결혼 여부, 자녀 여부와 취미, 구매 유형 등 정보제공


9) Recorded Future

- 소비자와 기업의 과거 이력 데이터 분석을 통해 미래 행동 예측 정보 제공


[출처: 빅데이터 산업과 데이터 브로커, KISDI, 정용찬, 2015]




 가장 잘 알려진 액시엄(Acxiom)은 '69년 설립되어 미국, 유럽, 아시아, 남미 등 전 세계에 지사를 보유한 상장기업으로 미국인 3억 명을 포함 전 세계 7억 명의 소비자 정보가 담긴 데이터베이스를 보유하고 있다. 액시엄은 원래 여론조사 자료보관 및 분석업체로 출발했는데, 90년대 후반부터 개인정보를 수집하며 본격적인 데이터 브로커 업체로 변신했다.

 액시엄이 국내에 잘 알려지게 된 계기는 미국 정부가 액시엄의 데이터를 바탕으로 9.11 테러범을 잡고, 버락 오바마 전 미국 대통령이 액시엄의 데이터를 활용해 대선에서 승리한 것으로 알려지면서이다. 현재 액시엄의 매출은 15년 기준 약10억 2천만 달러(약 1조 1천6백억 원)에 이르는 것으로 알려져 있다.


 미국의 보안 회사, 팔란티어(Palantir)도 실시간성이 중요한 분야에서 독보적인 빅데이터 유통 회사로 성장하고 있다. 주요 고객은 미 국방부, CIA, FBI, NSA(국가안전위원회), CDC(국가질병센터)등 미국의 주요 정보기관들이다. 이들이 하지 못하는 일을 이들이 할 수 있는 이유는 데이터의 획득과 데이터를 실시간으로 처리해내는 기술 덕분이다. 이미 기업가치가 20조가 넘어가고 있지만, 증권거래소에 상장하지 않고 있는 이유가 기밀유지가 중요하기 때문이다.

 대표 제품인 PalantirGotham은 테러방지, 국가안보, 정보보안, 사기 방지 등을 위한 범죄 예측 데이터 분석 서비스이다. 사실, 팔란티어가 다루고 있는 분야는 매우 광범위하다. 사기 방지(ANTI FRAUD), 자본 시장(CAPITAL MARKETS), 사례관리(CASE MANAGEMENT), 위기 대응(CRISISRESPONSE), 사이버 보안(CYBER SECURITY), 방위(DEFENSE), 재난 대비(DISASTER PREPAREDNESS), 질병 대응(DISEASE RESPONSE), 의료서비스(HEALTHCAREDELIVERY), 내부 위협(INSIDER THREAT) 등이 그들이 다루고 있는 주요 분야이다.

 팔란티어 역시 2011년 알카에다 지도자인 빈 라덴 제거 작전에서 미군이 빈 라덴의 위치를 파악할 때 도움을 준 것으로 유명해졌다.




개인 데이터를 삽니다. 데이터 쿱(DATA COUP)


 기존의 데이터 브로커들의 데이터 유통과정은 일반 제품 또는 서비스의 유통과는 다소 다른 특징을 가지고 있었다. 일반적인 제품 또는 서비스의 유통은 제품 또는 서비스를 생산하는 생산자, 생산품의 최종 소비자, 그리고 중간에서 최종 소비자와 생산자를 연결하는 유통자로 구성되어 있고, 생산자와 유통자는 최종 소비자가 지불한 가격의 일부분을 수익으로 가져가기 마련이다. 그러나 현재 데이터 유통은 데이터 생산자라고 할 수 있는 일반 사용자들에게 아무런 대가 없이 데이터를 공급받고, 중간 유통자만 최종 소비자로부터 수익을 얻어가는 특이한 형태로 이루어지고 있다.

 

 최근 이러한 데이터 유통의 구조적인 불합리성을 해소하고자 하는 스타트업 업체가 새로 등장했는데, 미국 뉴욕에 위치하고 있는 데이터 쿱(Datacoup)이다. 데이터 쿱(Datacoup)은 사람들이 자신의 개인 정보의 가치를 잠금 해제할 수 있도록 돕는다 것을 기업의 미션으로 삼는다.

 데이터 쿱은 150억 달러 규모의 데이터 브로커 시장에서 어떠한 기업들도 실제 데이터를 제공하는 사람들과 아무런 관계 형성을 하지 않는다는 것에 주목했다. 데이터 쿱은 이러한 데이터 유통의 구조적인 불합리성을 해소하고자 한다. 유통 구조의 불합리성으로 인해, 일반 사용자는 자기가 제공하는 정보에 대한 정당한 대가를 받지 못하고 있으며, 최종 데이터 소비자인 기업은 완전하지 못한 데이터밖에 확보할 수 없는 한계가 발생하고 있다고 주장한다. 따라서 데이터 생산자인 일반 사용자들에게 원하는 만큼의 정보를 제공하도록 하고 그에 따른 금전적인 대가를 제공함으로써, 사용자들은 제공하는 데이터에 대한 정당한 대가를 얻고, 최종 소비자들인 기업들은 보다 양질의 데이터를 얻을 수 있다는 것이다. 이에 데이터 쿱은 개인이 제공한 정보를 필요로 하는 기업 등에 제공하는 개인 정보 마켓플레이스를 세계 최초로 선보였다.

 데이터 쿱은 2014년 소셜미디어 계정과 신용카드 또는 직불카드에 대한 거래기록 정보를 제공받고 1개월에 8달러를 지급받을 수 있는 베타 버전을 운영했다. 이 베타 버전에는 약 1천500명의 사용자들이 가입한 바 있다. 해당 정보의 가치를 8달러로 정한 것에 대한 찬반 의견 등도 있었지만, 데이터의 당사자들이 직접 개인 정보를 사고팔 수 있다는 것만으로도 많은 화제를 받았다.

 데이터 쿱은 자사 서비스 사용자에게 요청하는 데이터들을 크게 소비(Spending), 검색(Search), 소셜(Social), 건강(Health)의 4가지 카테고리로 분류하고 있다.

 

1) 소비(Spending)는 신용카드, 직불카드에 대한 거래 기록

2) 검색(Search)은 인터넷 검색 기록

3) 소셜(Social)은 페이스북(Facebook), 트위터(Twitter), 링크드인(Linkedin), 포스퀘어(Foursqure), 구글플러스(google+), 유튜브(Youtube), 텀블러(Tumblr), 미트업(Meetup), 인스타그램(Instagram) 같은 계정에 대한 정보

4) 건강(Health)은 운동 기록, 심박수 등에 대한 데이터

 

 물론 기본적인 성별, 교육 수준, 또는 소득 수준 등의 프로파일 데이터도 수집하며, 해당되는 기본 프로파일 데이터의 시장 수요와 가치에 따라 각 개인이 받을 수 있는 기본 가격이 결정된다. 각 분야 내에서도 제공하고자 하는 정보의 범위와 양을 사용자 스스로 정할 수 있으며, 제공하는 정보량에 따라 받게 되는 총액은 달라진다. 사용자들은 직관적으로 얼마만큼 의 금전적인 보상을 얻을 수 있는지 바로 확인할 수 있다. 또한 데이터 쿱을 통한 실제 금전적인 보상액은 향후 최종 기업의 구매 의향 등에 따라 일부 변동된다.

 사용자 입장에서의 이득은 명확하다. 그럼 최종 소비자인 기업 입장에서 데이터 쿱 데이터의 장점은 무엇일까? 데이터 쿱은 지속적으로 사용자가 제공하는 통합된 데이터의 중요성을 언급하고 있다. 기존의 데이터 브로커를 통해 획득된 데이터는 대부분 무작위로 긁어모은 사용자들의 데이터를 통합한(Aggregated) 데이터이다. 따라서 전체적인 데이터의 경향을 알 수는 있으나, 특정 집단 또는 세그먼트 별로 나누어서 데이터를 분석하기에는 쉽지가 않다. 누가 이러한 데이터를 제공하는 가를 알기 위해서는 데이터 생산자의 동의가 필요하기 때문이다.

 데이터 쿱은 데이터 생산자가 자기 의지로 제공한 소비행태, 검색 행태, 소셜미디어 사용행태 등의 데이터를 통합적으로 관리함으로써 세그먼트 별 데이터를 제공할 수 있다는 점에서 기존 브로커를 통한 데이터 대비 장점을 가질 것으로 보인다. 뿐만 아니라 동일 소스의 데이터 제공자로부터 지속적으로 업데이트되는 데이터를 얻을 수 있다는 점도 데이터를 구입하는 소비자 입장에서는 매력적인 부분이다.


 개인 정보를 공개하는 비즈니스인 만큼 보안에 관해서도 데이터 쿱은 각별히 신경을 쓰고 있는 모습이다. 데이터 쿱에서 수집된 데이터는 아이디, 연락처 등의 개인적인 정보들은 모두 제거된 채로 저장되며, 특히 사용자들의 우려가 높은 신용카드 및 지불 카드 내역에 대해서는 단순히 내역만을 받을 뿐 직접 계정에는 접근이 불가능함을 각종 미디어나 홈페이지 등에서 지속적으로 강조하고 있다.

 데이터 생산자와 최종 소비자 모두에게 이득이 되는 윈윈 비즈니스 일 것만 같으나 이러한 데이터 쿱의 사업 모델에 대한 회의적인 시각도 존재한다. 마케터나 기업들은 수 만개의 데이터 쿱의 데이터보다는 현재 브로커들이 제공하는 수백만에서 수천만 개에 이르는 데이터들을 더 선호할 것이며, 사용자들 역시 월 10달러 미만의 적은 가격으로 기꺼이 그들의 정보를 제공하지 않을 것이라는 것이다. 데이터 쿱도 투자받은 금액의 약 60%를 사용자수 확보를 위한 캠페인을 진행하는 데 활용할 만큼 우선적으로 데이터의 양적인 확보에 초점을 맞추고 있는 모습이다. 결국 개인 데이터를 제공하는 데에 대한 심리적 저항을 얼마나 낮출 수 있을 것인가에 대한 이슈 해결이 필요하며, 그만큼의 혜택을 제공할 수 있는 노력들이 요구되고 있다. 데이터 쿱의 서비스는 아직 미국에서만 사용할 수 있지만 향후 글로벌 서비스로의 확대를 계획하고 있으며 지속적으로 수집하는 데이터의 종류 또한 확대할 계획을 가지고 있다. 새로운 데이터 유통 비즈니스가 시장에서 어떻게 살아남을지 귀추가 주목된다.


국내 데이터 유통 산업은?


 반면 한국에서는 아직 데이터 유통 산업이 활성화되지 않았다. 미국의 데이터 브로커와 유사한 기업들을 찾기는 힘들지만, 비식별 개인정보 활용에 대한 기준이 발표되었고, 법적 제도가 뒷받침될 경우, 데이터 유통 활성화가 본격적으로 이루어질 것으로 보인다. 국내에서도 일부 데이터 유통채널들이 등장하고 있지만 여전히 공공분야가 중심을 이루고 있다.


1) Data Store

운영: 한국 데이터베이스 진흥원(공공)

오픈: 2012년 1월

특징: 민간 DB 207건 / 공공 DB 상품 203건  유통 / API 정보 5700여 건 제공, API 유통 대행, DB 중개서비스


2) API Store

운영: KTH운영(민간)

오픈: 2012년

특징: API상품 및 API 소재정보제공


3) DATA.GO.KR

운영: 한국정보화 진흥원(공공)

오픈: 2011년 7월

특징: 공공데이터 포털 서비스로 2만여 건의 공공정보 보유 및 유통


4) SK bigdata Hub

운영: SK텔레콤

오픈: 2013년 10월

특징: 480여 개 데이터셋, 통계 데이터 제공


[출처: En-core Report 국내외 데이터 유통 트렌드]




 한국 데이터베이스 진흥원이 발표한 '2015년 데이터 산업 현황조사 보고서'에 따르면 국내 데이터 마켓은 2013년 710억 원, 2014년 898억 원, 2015년에는 전년 대비 36.3% 증가한 1,224억 원을 기록했다. 데이터 유통 활용 활성화를 위한 필요사항을 조사한 결과에서 보유 데이터의 적절한 가치평가를 꼽은 응답이 56.4%로 가장 높았으며, 다음으로 데이터 유통/홍보 채널이 19.9%로 나타났다. 이러한 가운데, 미래창조과학부와 한국정보화진흥원(NIA)은 '데이터 거래 중개 선도 시범사업'을 2016년 8월부터 착수하기로 하였다. 데이터 거래 중개 선도 사업은 취약한 국내 데이터 유통 환경을 개선하고자 마련되었는데, 데이터 가공, 중개, 서비스 분야를 포함하고 있다. 기존 데이터가 다른 곳으로 흐르지 않고, 공개된 데이터도 표준화되지 않아 활용이 어려운 점을 해결하고자 하는 것이다.

 국내에서도 점차 데이터 유통을 위한 분위기가 무르익어가고 있다. 어떤 기업들이 이 기회를 살릴지 또 어떤 스타트업이 새로운 기회를 찾아 등장할지 기대를 해 본다.

매거진의 이전글 데이터를 매력 있게 보여주기 위한 시도
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari