[Tech] sharing-as-a-service

딜로이트 2022 트랜드 리포트


Data-sharing made easy(손쉬운 데이터 공유)


2021년 데이터 중심의 업무 개편(MLOps)에 이어 2022년 딜로이트 트랜드 리포트의 첫 꼭지는 데이터 공유 산업에 대해 전망입니다.

핵심 골자는
외부데이터를 이용하여 자신이 가진 데이터를 늘리면(augmentation) 기존에 풀지 못하던 문제를 해결할 수 있다는 것이며, 여러 사례를 통해 증명되었다고 정리하고 있죠.
(예시: 백신 수급을 위한 supply chain 최적화, CVS)

또한 Data-marketplace 의 확장과 Data sharing-as-a-service 개념의 등장을 주장하고 있으며, Privacy-preserving data sharing 기술의 구현을 통해 개인정보보호에 대한 법적인 문제의 해결이 가능하다고 보고 있습니다.


결론적으로 가까운 미래에는 데이터 공유 산업의 규모가 확대될 것이라는 전망인거죠.


데이터 (공유)산업의 확대.

이 부분에 있어서만큼은 극히 공감하고 있구요. 알파고 이후 부터 찾아온 대한민국에서의 인공지능의 봄을 지속 유지하기 위한 핵심 요소라고 생각하고 있습니다.



다만, 동형암호 기술, differential privacy 등 privacy-preserving data sharing 기술을 통해 모든 것이 해결될 것이라는 기조가 있으며 궁극적으로는 APIs의 제공도 필요 없을 것이라는 주장에는 조금 의견을 달리합니다.

현재 이슈가 되고 있는 마이데이터의 관점에서 보면 중요도가 높은 "개인정보"도 정보주체의 동의하에 자유로운 이동이 가능하며, 기술 자체도 APIs를 통해 간단하게 구현이 가능합니다.

즉, 핵심은

정보 주체의 "동의"

다시 말해 데이터를 보유한 개인의 동의라는 것이지요.


딜로이트에서 주장하는 privacy-preserving data sharing 기술이 구현되더라도 "동의" 가 없을 경우 공유가 가능할 것인가는 다툼의 여지가 있다고 봅니다.(현재의 법령으로는 가능한 것으로 알고 있습니다.)

또한, 현재 데이터 산업 활성화를 위해 핵심적인 개념으로 다뤄지는 "비식별화 조치"의 경우 아무리 좋은 비식별화 알고리즘도 결국에는 원천 데이터의 정보량의 손실을 가지고 올 수 밖에 없습니다.

그리고 동의를 기반으로 개인 데이터를 수집한다면 거부감의 영향으로 많은 데이터를 모을 수 없습니다.


위의 내용들을 바탕으로

두 가지 고민해야할 점을 정리해봅니다.



1. 비식별화 한 데이터는 원 정보주체의 통제를 벗어나도 되는 것일까요?

2. 정보량이 부족하지만 충분한 양이 확보된 비식별화 데이터로 어느정도 이상 수준의 분석을 하는 것이 적절할까요?아니면 전면 동의를 받은 적은 양의 원천 데이터를 활용해 더 고품질의 분석을 하는 것이 적절할까요?


앞으로의 논쟁이 될 만한 문제가 아닐까 생각합니다.


긴 글 읽어주셔서 고맙습니다.

지금까지 "순간에 최선을" 다하는 도전지향이었습니다.


* 원문 출처: https://www2.deloitte.com/us/en/insights/focus/tech-trends.html?id=us:2em:3na:4di:5eng:6di:120821:mkid-K0154549&ctr=textlink&sfid=0035Y00003kYFwkQAG

keyword
작가의 이전글[Tech] 연합학습 기반 코로나 판정