데이터가 자산인 시대의 개인 데이터
Edit by 이윤우 (서울대학교_Decipher)
4차 산업 혁명을 외치며 달려가고 있는 요즘, 위의 문장과 유사한 말을 수차례 들어봤을 것이다. 그도 그럴 것이, 사람들은 종일 스마트폰을 쓰면서 검색 데이터, 위치 데이터, 클릭 데이터 등을 만들어 내고 있다. 이러한 데이터들은 이미 기업들의 마케팅, 비즈니스 전략뿐만 아니라 연구기관에서도 빈번히 쓰이고 있다. 다양한 분야에서 쓰이고 있는 것을 보았을 때 개인이 만들어내는 데이터의 가치는 명확하다.
한편, 자산이란 표준국어대사전에 따르면 ‘개인이나 법인이 소유하고 있는 경제적 가치가 있는 유형 또는 무형의 재산’을 말한다. 즉, 자산은 누군가 소유하고 있는 재산이다. 그렇다면 개인들의 데이터는 누가 소유하고 있을까? 당연히 개인이 소유하고 있을까?
아니다. 현재 개인의 데이터는 기업에 의해 소유되고 있다. 지난 3월, 영국에서 만들어진 ‘this is your digital life 앱(무료 성격검사 앱)’은 페이스북을 통해 이용자들의 데이터를 수집하여 데이터 분석 회사에 팔았다. 수집된 데이터는 페이스북에서 ‘좋아요’를 누른 콘텐츠 정보, 친구 목록, 위치 정보 등이 포함되었고 유출된 이용자 수는 최대 5천만 명 이상으로 추정된다.
상당수 무료 앱들의 수익 모델은 위와 같이 이용자들의 앱 사용 데이터를 판매하는 것이다. 이 과정에서 이용자의 동의를 구하지 않거나 동의 범위 이상의 데이터를 수집해 불법적으로 판매하는 경우도 많다. 디지털 기기 사용이 늘어나면서 무수히 많은 개인 데이터가 생성되고 있지만, 데이터는 전적으로 기업에 의해 소유되고 이를 바탕으로 기업은 많은 수익을 올리고 있다.
데이터가 개인이 소유하는 자산이 되기 위해서는 개인이 데이터의 쓰임을 통제하고 유통의 흐름을 투명하게 살펴볼 수 있어야 한다. 즉, 내 데이터가 어디에 쓰이는지 명확하게 인지해야 하고 내키지 않는 경우에는 이용할 수 없게 하는 권한이 필요하다. 더 나아가, 앞서 자산의 정의에서 보았듯이 경제적 가치가 있는 재산으로써 데이터를 판매하고 그로부터 수익화 또한 가능해야 한다. 물론 원하지 않는 경우엔 판매되지 않도록 하거나 판매 범위를 제한할 수 있어야 한다.
사실 현재 쓰이고 있는 기술로는 위와 같이 자신의 데이터를 통제하고 수익화까지 가능한 시스템을 떠올리기는 어렵다. 하지만 블록체인 기술은 여기에 대한 실마리를 제공해준다. 블록체인에 기록되는 정보는 누구나 열람할 수 있고 쉽게 변경되지 않는다. 그로 인해 데이터 추적이 가능하다. 여기에 더해, 블록체인 위에 저장된 코드를 바탕으로 프로그램을 실행하는 것 또한 가능하다. 이는 계약서와 같은 문서를 프로그램화해 구동시킬 수 있다는 것을 의미한다.
이러한 블록체인의 장점들을 위와 같은 데이터 유통 시스템에 적용하면, 데이터를 거래하는 판매자와 구매자의 정보는 체인에 기록되어 자신의 데이터가 어느 곳에 판매되는지 추적이 가능하다. 또한 데이터 소유자가 설정한 데이터 제공 범위와 동의 여부를 위반한 데이터가 유통되는 것을 금지하는 코드를 설정할 수도 있어, 개인들은 데이터에 대한 통제권을 가질 수 있다.
쉬운 이해를 돕기 위해 블록체인 기술이 적용된 개인 데이터 유통 과정의 대략적인 모습을 보면 다음과 같다.
① 이용자는 사용 중인 앱에서 개인 데이터 제공 동의 여부와 범위를 설정한다.
② 앱과 연동된 블록체인 서비스를 통해 동의 여부와 범위에 대한 정보를 블록체인에 저장한다. 이때 이용자의 ID는 암호화된다.
③ 앱 관리자는 블록체인 거래 시스템을 통해 앱 이용자들의 데이터를 다른 기업에 판매할 수 있다. 다만, 동의받은 사용자만 제한된 범위 내에서 가능하다.
④ 데이터가 판매되면 수익의 일부는 이용자에게 돌아간다.
⑤ 이용자는 언제든지 정보 제공 범위를 변경할 수 있고 개인 데이터가 어느 기업에 팔리는지 확인 가능하며, 원치 않는 기업에 판매될 시 판매를 거부할 수도 있다.
⑥ 판매 기록에 대한 정보는 블록체인에 기록되어 공개되어 있지만 암호화되어있기 때문에 이용자의 ID를 통해서만 접근할 수 있다.
위의 사례는 앱에서 만들어지는 데이터를 예로 들었지만 약간의 과정만 변형하면 여러 사례에 적용 가능하다. 앱 데이터뿐만 아니라 의료 데이터, 여행 데이터, 금융 데이터 등의 무궁무진 개인 데이터들이 블록체인과 맞닿을 수 있다. 실제로 상당수 프로젝트들이 블록체인 기술을 활용해 개인 데이터가 개인 자산으로 관리될 수 있도록 다양한 시도를 하고 있다.
캐리 프로토콜은 소비자들이 오프라인 매장에서 제품을 구매할 때 생성되는 결제 데이터를 자산화하기 위한 프로젝트이다. 소비자들은 결제 데이터를 제공하고 이에 대한 대가로 토큰을 받는다. 이때 지급받은 토큰은 제휴된 매장에서 제품이나 서비스를 이용할 때 일반 화폐 대신 결제할 수 있는 수단으로 이용된다.
메디블록은 개인 건강 데이터를 자산화하는 프로젝트이다. 건강 데이터를 제공한 사용자들은 토큰으로 보상을 받고, 제공된 건강 데이터들은 의료 연구에 쓰이거나 헬스케어 어플리케이션 개발에 사용된다.
에어블록은 사용자들이 앱이나 웹을 이용할 때 생성되는 데이터를 자산화하는 프로젝트이다. 앱, 웹 관리자는 사용자에게 데이터 제공 여부와 제공 범위에 대한 동의를 받아 정당한 방법으로 데이터를 수집한다. 이렇게 수집된 데이터는 제삼자에게 판매되는데 이때, 에어블록 프로토콜을 통해 동의가 확인된 데이터만 거래될 수 있도록 허용한다.
오션 프로토콜은 탈중앙화된 데이터 거래소를 만드는 프로젝트이다. 주로 AI 연구에 사용될 데이터 거래에 초점을 맞추고 있다. 데이터 소유자인 개인에게 직접적인 보상을 주지는 않지만, 데이터 거래의 범위를 확장해 개인 데이터의 가치를 높이는 프로젝트이다.
앞에서 나열한 장점들과 시도되고 있는 프로젝트들을 봤을 때, 블록체인 기술만 적용시키면 개인 데이터의 다양한 문제들이 모두 해결될 수 있는 것처럼 보인다. 하지만 블록체인 기술이 실질적으로 적용되기 위해서는 여전히 해결되어야 할 문제가 몇 가지 있다.
① 데이터 축적 소스(데이터 공급자)와 블록체인 시스템의 연동
블록체인 네트워크를 통해 거래되는 데이터가 사용자가 동의한 데이터인지 판별하기 위해서는 사용자가 별도로 자신의 ID(ex. 프라이빗 키)를 통해 동의 내용과 데이터 축적 소스(ex. 카드 결제 단말기, 일반 앱, 의료기관 등)에 대한 정보를 블록체인 위에 올려야 한다. 동의 내용과 다른 데이터가 블록체인에서 거래되는 경우 데이터 공급자에 대한 처벌을 가하기 위해서이다. 이러한 이유로 데이터 축적 소스에서 블록체인 네트워크로 연결되는 과정이 필요한데 여기서 해결해야 할 문제가 있다.
블록체인 시스템과 연동될 때 블록체인에서 문제가 발생한다면 데이터 축적 소스의 사용성까지 해칠 수 있다. 블록체인 시스템이 원활히 돌아간다면 문제없지만, 현재 블록체인 기술은 데이터 처리 속도 등의 문제가 해결되지 못하고 있다. 이러한 상황에서 일반 앱과 연동될 경우 사용자는 데이터 수집 동의 범위를 설정하기 위해 상당한 비용을 치러야 한다. 블록체인을 통한 데이터 자산화의 편익보다 불편함이 크다면 블록체인 시스템을 연동시킬 유인은 적을 수밖에 없다.
② 오프 체인 데이터 저장
블록체인에 저장한 데이터는 누구나 열람 가능해 투명하다는 장점이 있지만 그만큼 노출될 위험도 공존한다. 특히, 개인 데이터에 대한 경우 민감한 내용이 포함될 수 있어 블록체인에 데이터 자체를 저장하는 것은 바람직하지 않다. 이는 현재 블록체인 확장성 문제를 생각해보더라도 대량의 데이터를 블록체인에 저장하는 것은 효율적이지 않다. 따라서 데이터 자체는 블록체인 밖에 저장하고 유통에 대한 정보만 블록체인에 기록하는 대안이 있을 수 있는데 이 방법 역시 해결해야 할 문제점이 있다. 블록체인 밖에 저장된 데이터가 전송되는 과정은 블록체인에서 확인할 수 없기 때문에 데이터 거래 과정에서 돈을 지급했음에도 데이터를 받지 못하는 문제가 생길 수 있다.
③ 암호화 기술의 안전성
개인의 데이터가 블록체인을 통해 전송될 때 가장 크게 신경 써야 할 부분은 개인 정보의 암호화이다. 개인 데이터에는 의료 데이터 같은 민감한 데이터도 포함하고 있기 때문이다. 따라서 개인에 대한 정보는 암호화된 채 전송되어야 하고, 데이터를 통해 개인의 신원이 노출되어서는 안 된다. 또한 거래의 경우 데이터는 재화로서 값을 지급하고 이용되어야 하므로 구매자만 데이터에 접근할 수 있도록 암호화되어야 한다. 따라서 안정성이 완벽하게 요구되는 암호화 기술이 필요하다.
지금까지 살펴본 것처럼 블록체인 기술은 개인이 자신의 데이터를 통제하고 더 나아가 수익화까지 가능하게 해주는 훌륭한 수단이다. 하지만 블록체인 시스템은 탈중앙화된 시스템이기 때문에 신뢰를 대신 담보하거나 잘못된 결과를 책임질 중앙화 된 주체가 없다. 따라서 여러 문제가 발생하는 상황을 최소화하고 참여자들의 합의로 문제를 해결할 수 있는 견고한 네트워크 설계가 필요하다.
하지만 견고한 블록체인 네트워크가 구성된다고 하더라도 개인 데이터의 자산화는 이루어지지 않을 수 있다. 일반 앱과 같은 데이터 공급자들에게 블록체인을 통한 데이터 유통 방식을 강제할 수 없기 때문이다. 오히려 기존의 방식으로 데이터를 수집해 판매하는 것이 일반 앱 관리자 입장에서는 이익이 훨씬 커 기존 방식을 고수할 유인이 크다. 그렇지만 대체 수단이 있는 것과 없는 것은 다르다. 사용자들이 개인 데이터 자산화에 대한 가치를 크게 생각한다면 탈중앙화된 네트워크와 연동된 데이터 수집 기관을 더욱 선호할 것이다. 이러한 사용자의 요구에 따라 데이터 수집기관들 역시 자연스럽게 개인 데이터의 자산화가 가능하도록 유통방식을 발전시킬 것이다. 물론 이같은 미래는 사용자와 공급자, 모두가 신뢰할 수 있도록 잘 설계된 블록체인 네트워크가 전제되어야만 가능하다.
Reference
<데이터로 돈 번 페이스북… 데이터 장사 때문에 최악 위기>, 머니투데이 기사
이미지 출처