디지털 농노에서 벗어나 데이터 주권 인식 함양
21세기에 살고 있는 현대인들은 제 4차산업을 외치면서 달려가고 있고 각 국가들은 이러한 산업에서 우위를 차지하기 위해 노력한다. 제 4차 산업혁명의 핵심은 빅데이터 분석, 인공지능, 로봇공학, 사물인터넷, 무인 운송 수단, 3차원 인쇄, 나노 기술과 같은 6대 분야에서 새로운 기술 혁신이다. 빅데이터와 AI의 경우 산업의 근본이 되는 것은 바로 ‘데이터’이다. 하지만 현재 이러한 데이터는 개인이 만들어 내지만 이것에 대한 소유권은 개인이 아닌 기업이 가지고 있다. 우리가 사용하는 구글, 유튜브, 페이스북과 같은 소셜 네트워크 앱들은 사용자들로부터 데이터와 같은 가치 창출을 바탕으로 운영되며 이 과정에서 이용자의 동의를 구하지 않거나 동의 범위 이상의 데이터를 수집해 불법적으로 판매하는 경우도 많다. 디지털 기기 사용이 늘어나면서 무수히 많은 개인 데이터가 생성되고 있지만, 정작 개인들은 이러한 데이터의 주권조차 인식을 하지못하고 많은 기업들이 수익을 가져가고 있다. 블록체인을 공부하는 학생으로 기술의 특징인 탈중앙성을 바탕으로 데이터에 대한 사람들의 주권에 관심이 많아서 데이터관련 블록체인 프로젝트인 오션 프로토콜에 대해서 분석해보고자 한다. 구성은 오션 프로토콜, 오션 프로토콜의 목표, 코어 아키텍쳐, 합의알고리즘과 토큰 경제, 결론이다.
오션 프로토콜이란?
오션프로토콜은 이더리움 블록체인 기반의 분산형 AI 데이터 및 서비스 교환 프로토콜을 개발하는 블록체인 프로젝트이다. 이 프로젝트의 목적은 프라이버시를 보존하면서 데이터를 제공함으로써 AI의 이점을 확산시키는 것을 목표로 한다. 이는 시장에서 AI 데이터와 서비스를 사고팔고 일반적인 데이터에 공유 및 접근하는 소프트웨어, 데이터를 소비하는 AI/data science 도구를 제공한다. 이를 통해 오션프로토콜은 궁극적으로 기존 데이터 사일로를 없애고, 세계적으로 데이터의 공급 및 거래를 극대화시킴으로써 다양한 산업에서 새롭고 혁신적인 애플리케이션 및 인공지능이 꾸준히 개발될 수 있도록 하고자 한다. 이미 많은 프로젝트들이 데이터와 관련한 비전을 제시하고 있기도 하지만 오션프로토콜은 자신들만의 차별점을 강조한다. 바로 데이터들중 실제로 빅데이터로 활용하고 AI화 할 수 있는 데이터부분에 있어서 블록체인을 기반으로 중재자 역할을 하며 엄격한 기준에 의해 데이터를 가공/보존한다는 점이다.
오션 프로토콜의 목표는 데이터에 접근하는 기회를 공평하게 함으로써 AI의 이익을 널리 공유하는 것이다. 이러한 목표를 달성하기 위해 오션프로토콜을 개발하고 토큰화된 시스템을 만들었는데 가장 큰 4가지 문제가 존재한다.
1. 데이터의 통제권없이 AI 사용을 위한 데이터들을 어떻게 만들어 낼 것인가? 일반적으로는 개인 프라이버스 권리와 AI 모델을 위한 더 좋은 데이터들을 원하는 이 두가지 상황을 어떻게 해결할 것인가? 이다.
2. 일반적으로 주어지는 데이터에 대한 인센티브를 어떻게 할 것인가? 이는 고전적인 역설로 재풀이되는데 정보는 무료로 배포되기 원하지만 또한 한편으로 그 값을 매기고 싶어한다는 것이다.
3. 이러한 시스템이 어떠한 방법으로 중앙적인 존재의 관리없이 수세기 동안 자급자족뿐만 아니라 더 향상될 수 있는 가?
4. 이러한 생태계의 통제와 이익을 어떻게 널리 퍼지게 할 수 있는 가?
우선 첫 번째 문제를 다루는 방법으로 오션프로토콜은 오션 네트워크와 그 중심인 분산형 서비스 실행 계약(SEAs)을 제시한다. 우선 네트워크에서는 데이터 자산과 서비스로 구성되어 있고 자산은 데이터 및 알고리즘의 형태로 존재한다. 서비스는 자산을 활용하는 처리과정과 지속성이다. SEAs에서는 무작위의 데이터 서비스의 큐레이션을하고 수익화하며 이를 연결시킨다. 이는 컴퓨팅을 활용해 데이터를 가져올 수 있으므로 민감한 데이터들은 이 구역을 벗어나지 않기 때문에 데이터 유출에 대한 우려를 해결할 수 있다고 한다. 이 기준선 기능은 초기 형태적 네트워크의 배치와 일치하며 주요 대상 사용자인 AI 연구원과 데이터 과학자들에게 합리적인 네트워크 성능과 사용 비용을 예상한다. 이러한 이유로 오션은 처음에는 “퍼시픽”이라고 불리는 POA 네트워크로 제공될 것인데 여기서 각 노드는 패리티 이더리움 클라이언트이다. 여기의 노드와 노드 연산자를 유지자라고 부르며 기존의 블록체인 miner에 비해 다른 점을 강조한다. 유지자 커뮤니티는 유지자의 추가 및 제거와 스마트 컨트랙트 업그레이드를 공동으로 관리한다.두 번째 문제와 관련한 것은 Ocean은 SEA 인프라 위에 네트워크 보상을 추가하여 데이터 공유를 유도하고 이를 통해 대중화로 이어진다고 한다. 구체적으로는 Ocean 참가자들에게 CPM(Curated Proofs Market)이라고 부르는 새로운 것을 만들어 양질의 AI 데이터 및 서비스를 제출, 참조 및 이용할 수 있도록 장려한다. CPM의 경우 2가지 부분이 있는데 데이터/서비스의 예측되는 인기와 증명된 인기의 두 부분으로 구성된다. Actual popularity(증명된 인기)와 관련한 그 첫 번째는 암호 증명이고 두 번째는 Curation Market이다. 암호 증명의 경우 실제적인 인기라는 것은 데이터/서비스가 이용할 수 있거나 제공되어지는 수이다. 도박(게임화)을 피하기 위해 데이터의 가용성 증거와 같은 암호화적인 증거를 사용하여 입증가능한 형태로 사용되어져야 한다. 따라서 오션프로토콜은 CPM기반의 블록 보상을 통해 오션 네트워크 참가자가(publisher) 유용한 데이터에 대해 안전하고 신뢰있는 거래를 수행하도록 유도한다. 즉, 퍼블리셔는 다음의 행위를 모두 완수하여야 블록 보상을 받을 수 있다.
Curation Market의 경우 예측된 인기를 위한 것으로, 즉 타당성을 위한 프록시를 말한다. 일반적인 군중(즉 여기선 사용자)들이 주어진 데이터/서비스가 타당한지 오션 디자이너들보다 더 잘 안다는 것을 가정한다. 그래서 큐레이션 시장을 통해 군중들의 힘을 키운다는 것이다. 퍼블리셔는 큐레이션 마켓을 통해 미래에 인기있을 것 같은 데이터/서비스에 자신의 Ocean토큰을 예치한다. 이를 통해 퍼블리셔는 데이터 소유주를 대신하여, 소비자로부터 데이터 이용에 대한 요청이 있을 시 데이터에 대한 접근권한을 제공해야 하는 의무를 가진다(만일 소비자의 요청에 응하지 않으면 예치해 놓은 토큰은 회수당한다).
세 번째 문제와 관련해서는 Ocean은 대중에게 서비스를 제공하는 유틸리티 네트워크가 될 것이라고 한다. 이렇게 되기 위해서는 자급자족이 가능해야하며 지역사회와 6개의 공동체를 위한 꾸준한 개선이 필요하고 네트워크 보상의 일부가 기술 향상과 생태계 개발을 위한 온 체인 보상 시스템을 갖게 될 것이라고 한다.
마지막 문제와 관련해서는 오션은 권한증명에서 무허가로 진행될 것이라고 한다. 기술 옵션에는 ETH2.0, 패리티 하위 전략, 코스모스 SDK가 포함된다.
이 부분에서는 오션의 근본적인 요소들과 그에 따른 구성 및 아키텍쳐에 대해서 간단히 소개한다.
이 사진은 구성요소를 보여주는데 각 구성요소는 다음과 같다.
Frontend (Tier 3) – 클라이언트 쪽인 유저 브라우저에서 HTML+CSS+JAVASCRIPT를 통해 앱이 실행된다.
Data Science Tools (Tier 3) – 이 데이터 사이언스 도구는 데이터 과학자들에 의해 실행되는데 오션에서 데이터로의 접근과 해당 데이터 위에서 알고리즘이 실행된다.
Aquarius (Tier 2) – 백앤드 어플리케이션이고 메타데이터의 저장공간과 관리서비스를 제공한다. 주로 시장에 의해 실행된다.
Brizo (Tier 2) – 마찬가지로 백엔드 어플리케이션이고 소비자가 퍼블리셔의 데이터 또는 컴퓨팅 서비스에 접근하는 것과 같은 접근 조정 서비스를 제공한다. 주로 퍼블리셔에 의해 실행된다.
Keeper Contracts (Tier 1) – 솔리디티 스마트 계약으로 분산 EVM에서 실행된다.
Tier 3 – Application Layer
1. Pleuston Frontend: Marketplace Template
이 플루스톤은 시장을 위한 템플릿을 실행하는데 낮은 티어의 구성요소들의 사용사례를 포함한다. 이는 오션의 기능들을 증명하는데 도움을 주고, 최종 제품은 아니지만 기존 코드를 사용해 추가 시장을 구현하기 위한 참고 자료로 사용될 수 있다. 이 어플리케이션은 다음과 같은 고급 기능을 제공한다.
Publishing – 유저들이 네트워크에 새로운 자산을 등록하는 것을 허용한다.
Consuming – 유저가 등록된 자산을 목록화하고 소비하는 것을 허용한다
Marketplace – 복잡한 거래와 향상된 능력을 가능하게하는데 다음과 같다.
- 클라우드 공급자에게 존재하는 자산을 퍼블리싱한다.
- 자산을 탐색하고 발견한다
- 필터링 기능
- 특정 KYC프로세스를 이용하여 유저 등록
시장은 다음과 같은 외부적 구성요소와 소통이 가능하다.
스마트 컨트랙트를 통해 Ocean Keeper Contracts와 상호작용하여 시장 비즈니스 논리를 제제공하는 것 가능하게 한다.
Aquarius 와 Brizo는 HTTP API를 통해서 소통하면서 메타데이터의 관리와 자산으로의 접근을 하게 한다.
2. 데이터 사이언스 도구
데이터 사이언스 도구는 AI 연구자와 데이터 과학자들이 사용하는 오션 인터페이스이다. 주로 파이썬으로 쓰여지며 이러한 도구와 라이브러리는 다양한 컴퓨팅 파이프라인에서 통합된 오션 기능들을 고급 레벨의 하나로 노출된다.
Tier 2 – Protocol Layer(오션 프로토콜과 상호작용하는 고급의 라이브러리와 Keeper Contracts와 상호작용하는 것을 포함함)
1. Squid 라이브러리: 오션의 메인 API
스퀴드는 오션 프로토콜 구성요소중 가장 최고의 것과 상호작용 추상화를 하는 고급 레벨의 특정 API이다. 이것은 내재된 키퍼 계약이나 메타데이터 저장 시스템의 세부사항에 대해 걱정없이 오션 기능을 사용하게 만드는 것이다.
2. Aquarius: 메타데이터 관리
아쿠아리어스는 파이선 앱으로 백엔드에서 메타데이터 관리를 가능하게 해준다. 이것은 다른 메타데이터 공간의 접근을 이끌어낸다. 오션DB 플러그인 시스템은 다른 데이터 공간을 오션DB 인터페이스를 통해 통합화 할 수 있다.
가장 기초적인 퍼블리셔를 위한 시나리오는 퍼블리셔가 소유하거나 관리하는 자산에 대한 접근 제공이다. 이것은 다음과 같은 다른 확장 서비스 클라우드를 제공한다.
데이터의 이동없이 데이터상의 컴퓨팅
새롭게 생긴 데이터 저장 서비스
서비스 증명 수집
온체인 접근 조정
Tier 1 – Decentralized VM Layer
키퍼 컨트랙은 분산 EVM에서 실행되고 배포되는 솔리디티 스마트 컨트랙트이다.
오션 프로토콜은 합의알고리즘 방식으로 권위 증명(PoA)을 사용한다. 이 권위 증명이란 기관에서 조건에 맞는 노드를 증명해 이들 간 합의를 이루는 방식의 합의 알고리즘이다. 이는 기존의 PoS와 같이 블록 검증자가 코인을 스테이킹하지 않고 그들의 신원을 지분처럼 활용한다. 그러므로 권위증명 블록체인은 신뢰 가능한 주체를 통해서 임의로 선정되어 검증된 노드를 통해 보호된다. 이 네트워크의 특징은 요구되는 연산 능력이 상대적으로 낮고 합의에 도달하기 위한 노드간의 통신 요구 사항이 없으며 네트워크의 연속성은 공개 도메인에서 교차 검증을 통해 사전 승인되고 검증가능하게 신뢰할 수 있기 때문에 사용가능한 노드의 수와 독립적이라는 것이다. 하지만 조건으로 유효하고 신뢰할 수 있는 신원, 검증자가 되기 어려워야 하는 것, 검증자 선정 기준이 평등해야한다는 것이다.
오션 프로토콜 프로젝트를 분석하는 중에 흥미로웠던 것은 토큰모델이 매우 재미있었다는 점이다. 오션프로토콜은 화이트 리스트를 위한 TCR이라는 token curated registry를 도입했는데 이는 좋은 데이터/서비스 공급자를 관리하고 질 낮은 공급자를 배제시키기 위한 것이다. 다음의 그림은 오션프로토콜의 화이트리스트에 새로운 공급자가 등록되는 과정이다.
공급자는 적정량의 오션토큰(Ocean Token)을 예치하고 등록 신청을 한다. 이때 만약 후보 공급자가 오션 네트워크에서 제공하고자 하는 데이터가 기존의 다른 소유자의 것임을 방지하기 위해 검증 기간을 거친다. 해당 데이터가 후보 공급자의 것이 맞다고 판단되면 후보 공급자는 해당 데이터에 대한 저작권을 얻고 화이트 리스트에도 등록되게 된다. 만약 한 오션토큰 보유자가 해당 데이터에 대해 다른 소유자가 존재한다는 걸 알아냈다면 그는 후보 공급자가 예치한 만큼의 토큰을 예치하고 후보 공급자에 대해 도전(challenge)을 하여, 도전에서 이기면 후보 공급자가 예치한 토큰을 가져갈 수 있다.
이 세 부류의 이용자의 이해관계는 매우 긴밀하게 연결되어 있다. 높은 품질의 리스트는 소비자들의 관심을 유지시키고, 이는 보다 많은 후보자들이 해당 리스트에 등록되기 위해 토큰을 예치하고자 하여 토큰에 대한 수요를 올린다. 따라서 토큰 보유자들은 리스트의 품질을 높이는데 참여하는게 자신에게 더 유리하다. 이러한 메커니즘을 통해 네트워크는 자연스럽게 좋은 품질의 큐레이팅 리스트를 형성할 수 있고, 이를 통해 수요자가 지속적으로 유입되며, 토큰의 가치도 올릴 수 있다.
큐레이션 마켓에서도 이러한 토큰 경제는 확인할 수 있다. 오션프로토콜의 목표는 유용한 데이터를 최대한 많이 공급하는 것이고 이러한 목적을 달성하기위해 큐레이션 마켓을 도입하였는데 이는 앞서 설명한 CPM의 일부라고 볼 수 있다. 이곳에서 참가자들은 소비자에게 데이터/서비스를 제공함으로써 블록 보상을 받는 것뿐만 아니라, 큐레이션마켓에 예치한 토큰을 회수함으로써 인센티브를 얻을 수 있다. 이를 이해하기 위해서는 먼저 Drop토큰에 대해서 알아야 하는데 D토큰은 각 데이터/서비스에 대한 지분(share)으로 볼 수 있고, 예를 들어 X라는 데이터셋에 대한 D토큰은 Dx로 발행된다. 따라서 개별 데이터/서비스에 대한 예측 인기도(predicted popularity)는 해당 데이터/서비스에 대해 발행된 D토큰의 개수를 통해 계산될 수 있다. D토큰의 또 다른 특징은, 일반 ICO와 달리 D토큰의 가격은 본딩커브(bonding curve)를 기반으로 발행량에 따라 토큰의 가격이 결정된다는 것이다. 예를 들어, 얼리어답터(early adopter)에게 혜택을 주기 위한 본딩커브는 토큰의 발행량이 늘어날 수록 토큰의 가격이 올라가는 우상향의 형태로 설계될 수 있다.
이는 본딩커브에 관한 예인데 A라는 사람이 X라는 데이터 셋에 50개의 오션 토큰을 예치하면 500개의 Dx를 받는다. 후에 A가 블록보상을 더 많이 받고자 추가로 Dx을 토큰을 더 많이 받으려면 전에 예치한 50개의 토큰보다 더 많이 넣어야만 500Dx를 받는다. 또한 Dx의 가격이 다른 사람들의 발행으로 충분히 높아진다면 A는 처음 구매했을 때보다 비싼 값에 Dx를 O토큰으로 전환할 수 있다. 이는 가능한 한 빨리 좋은 데이터/서비스를 찾아내고 스테이킹한 사람들에게 혜택이 많이 갈 수 있도록 설계되었다
한편 이러한 본딩커브의 차액을 노리는 악의적인 사용자들을 막기 위해 토큰을 살 때의 본딩커브(in)와 팔 때의 본딩커브(out)를 다르게 설계하는 방법도 있다. 이처럼 큐레이션마켓과 TCR은 경제적 보상 구조를 통해 토큰 보유자들이 자발적으로 좋은 데이터/서비스를 찾아 표시하도록 촉구한다. 또한 큐레이션 마켓 및 TCR에 참여하기 위해 요구되어지는 토큰 스테이킹 행위는 좋은 데이터를 가리키는 지표뿐만 아니라 오션 토큰에 대한 수요를 높이고 예치해 놓은 토큰이 회수되지 않기 위해 보다 책임감있는 선택을 하도록 유도한다.(이와 관련한 예는 TCR에서 화이트 리스트가 되기위해 도전에서 졌을 시 예치해둔 토큰을 모두 잃고, 소비자의 데이터 요청에 응하지 않으면 예치한 토큰을 잃게됨으로 이루어짐)
위의 배경에서 언급하였듯 우리는 4차산업혁명과 데이터의 시대에서 살아간다. 날이 갈수록 데이터의 수는 계속해서 쌓이고, 이러한 데이터들은 기존의 자본주의의 토지 자본 노동과 같은 경제 생산요소가 될 것이다. 하지만 현재의 구조에서는 그러한 데이터들을 기업들이 가지고 있으며 플랫폼을 실제로 사용하고 데이터를 만들어 내는 사용자에게는 인센티브가 존재하지 않는다. 한재선 그라운드X 대표는 카카오 개발자 컨퍼런스에서 ‘디지털 농노제’라는 개념을 소개하며 과거 봉건제 시대 평민들이 영주의 땅을 경작하고 그에 대한 대가로 식량을 받으며 농노로 살았던 것처럼, 현재 일반 사용자들 또한 인터넷 서비스를 쓰면서 데이터를 경작하고 대가로 서비스를 받고 있으니 디지털 농노라고 볼 수 있다는 것이다. 마찬가지로 구글이나 유튜브, 넷플릭스와 같은 기존의 서비스들을 이용하면 추천시스템이라는 우리의 데이터들을 대가로한 서비스들이 제공된다. 하지만 이러한 편리함속에는 감춰진 기업들의 악의적인 데이터 수집이나 페이스북의 정보유출과 같은 사례들을 볼 수 있다. 언제까지 편안함 속에 안주하여 데이터의 착취가 아닌 데이터 주권의식의 성장이 필요한 시점이 온 것이다.
블록체인은 디지털 재산화를 현실화해줄 최적의 플랫폼이다. 오션 프로토콜은 공유재와 같은 데이터에 대한 주권의식을 이끌어 줄 수 있다는 점에서 데이터 주권에 대해서 관심있는 사람들에게 데이터 재산을 현실화 시켜준다. 또한 중앙집권적인 시스템에게 일방적으로 내 데이터가 저장되고 팔려나가도 아무런 권한을 행사할 수 없는 비대칭성을 해결해주고, 데이터 자산과 AI 기능을 보유한 소수의 조직만이 누리던 데이터의 잠금 해제, 개인이나 기업이 전세계로 데이터 오픈 영역을 넓혀 데이터 과학자, AI연구자들도 보다 많은 데이터를 확보해 연구개발을 진척시킬수 있도록 도와줄 수 있다. 비록 이 프로젝트가 일반 사용자가 아닌 전문가인 데이터 과학자나 AI연구자들에게 초점을 맞춰진 면이 있지만 이러한 프로젝트들의 등장과 운영됨에 따라 일반 시민들까지 데이터 주권에 대한 인식과 의식 발전이 이루어져 디지털 농노에서 벗어날 수 있는 시발점이 될 수 있을 것이다.
https://oceanprotocol.com/tech-whitepaper.pdf
https://data.bsa.org/wp-content/uploads/2015/12/BSADataStudy_ko.pdf
https://oceanprotocol.com/protocol/
https://www.yceffort.kr/2018/09/19/how-does-proof-of-authority-consensus-work/
http://wiki.hash.kr/index.php/%EA%B6%8C%EC%9C%84%EC%A6%9D%EB%AA%85
이정민(dlwoabsdk@gmail.com)