CHAPTER 13 데이터3법이 가져온 새로운 데이터 신 비즈니스
사실 크롤링으로 개인정보를 끌어오던 시대가 있었다. 바로 2020년 1월 데이터3법이 통과되기 전까지는 그것이 불법이 아니었다. 그런데 우리나라에 데이터3법, 다시 말해 데이터 활용에 관한 법과 제도가 정비되면서 개인정보 등을 포함한 민감정보에 대한 크롤링은 이제 확실한 불법이 됐다.
데이터3법 정리.TXT
ㅁ 데이터 3법이란?
데이터 이용을 활성화하는 「개인정보 보호법」, 「정보통신망 이용촉진 및 정보보호 등에 관한 법률(정보통신망법)」, 「신용정보의 이용 및 보호에 관한 법률(신용정보법)」등 3가지 법률을 통칭한다.
데이터 이용에 관한 규제 혁신과 개인정보 보호 협치(거너번스) 체계 정비의 두 문제를 해결하기 위해 데이터 3법 개정안이 발의됐다. (‘18.11.15)
법률 개정안은 대통령 직속 4차산업혁명위원회 주관으로 관계부처·시민단체·산업계·법조계 등 각계 전문가가 참여한 ‘해커톤’ 회의 합의결과(’18.2,’18.4)와 국회 ‘4차산업혁명 특별위원회’의 특별 권고 사항(‘18.5)을 반영한 입법조치다. 시민단체, 산업계, 법조계, 학계 등의 다양한 의견수렴 절차를 거쳐 마련됐다.
데이터 3법 개정안은 2020년 1월 9일 국회 본회의를 통과했다.
“형님 요즘 열심히 광고하는 거 있잖아요~ 마이데이터~~ 그거 가입하면 커피 한 잔 준다고 앱에 막 뜨고 그러잖아요”
“아~~ 그거~ 나도 커피 쿠폰 준다고 하길래 가입했는데~~”
역시 형님도 순수하시다. 나의 개인정보 접근 권한을 커피 한잔에 파셨다니 말이다.
형님은 내가 설명하는 내용에 흥미를 갖고 귀기울이며 이야기를 듣고 있었다. 나는 미소를 지으며 이어나갔다.
데이터3법 이후 데이터 관련 비즈니스 신사업 실무자로 보내는 동안 내가 숙지한 데이터 관련 이야기를 아주 후려쳐서 설명해보면 이렇다.
예전 토스와 뱅크샐러드, 브로콜리라는 앱이 있었다. 토스는 이제 엄청난 기업으로 성장했고, 뱅크샐러드는 음.... 브로콜리는 구글플레이에서 검색해보면 2020년 7월 21일 이후 업데이트가 멈춰있다.
이들은 흔히 얘기하는 자산관리 앱이다. 그런데 그 시작은 크롤링이다.
“형님 혹시 예전에 가계부 앱 써보셨어요?”
“그렇지 그거 아주 요긴했지. 내 스마트폰에 저장된 카드결제와 은행 문자를 읽어와서 보기 편하게 보여줬으니 말야”
“형님 그것도 크롤링이라고 생각하시면 돼요. 제가 생각하기엔 토스, 뱅크샐러드와 브로콜리앱이 말은 자산관리라고 했지만, 결국 근간이 되는 서비스는 가계부앱이라고 생각하거든요.
가계부 앱의 업그레이드 버전 말이에요. 사용자의 금융정보를 스크래핑 방식으로 가져와서 세련되게 보여주는 좀 더 업그레이드된 가계부 앱이라고 생각하시면 쉽게 이해하실 수 있으실 듯해요.
근데 이들이 사용한 스크래핑 방식이 앱 사용자가 많아지면서 여론이 안 좋아졌어요. 사용자의 개인정보 보호와 네트워크 상의 과부하 등의 문제점을 야기했다고 보는 시각이 생긴거죠.
데이터가 돈이 된다는 인식이 생겨남과 동시에 스크래핑 방식으로 개인정보에 대한 문제의식이 맞물리면서, 데이터 활용에 관한 법률, 이른바 데이터 3법이 태동하게 된거에요. 그래서 이제는 스크래핑 방식으로 개인정보 수집하는 것을 금지하고, 응용 인터페이스인 API를 이용해 데이터를 모으도록 하고 있어요. 법과 제도적으로 규정지은거죠”
“API???”
“네 API요. 유식하게 영어발음을 좀 굴려드리면 API는 Application Programming Interface의 약자에요. 응용 프로그램들이 서로 상호작용하는데 사용되는 인터페이스인거죠. 기존의 스크래핑 방식과 달리 사용자의 개인정보를 직접 접근하는 것이 아니라, 금융기관이 제공하는 API를 통해 필요한 데이터를 안전하고 효율적으로 가져올 수 있도록 시스템적으로 조치를 마련한거죠. 이를 통해 사용자의 데이터 보호와 네트워크 과부하 문제를 줄일 수 있어요.”
“그렇다면 API 방식은 더 안전하고 효율적인 거네. 그런데 API 방식에도 문제가 없는 거야?”
“아뇨, 형님. API 방식도 사용자의 동의를 받아야 하고, 데이터 이용에 관한 법과 규제를 준수해야 해요. API를 사용하는데에는 기술적인 문제와 보안적인 측면에서도 신경을 써야 해요. API를 통해 데이터를 가져오면서 개인정보가 안전하게 전송되고 저장되도록 보안 조치를 강화해야 해요”
“그렇군. API 방식도 신중히 사용해야겠네.”
“맞아요, 데이터의 중요성이 커지면서 데이터 이용에 관한 법과 규제가 더욱 중요해지고 있어요. 크롤링과 스크래핑 방식은 그 효용성에도 불구하고, 합법적으로 사용하는 것이 중요하고, 데이터를 책임있고 안전하게 활용하는 것이 핵심이에요.”
형님은 내 말을 귀담아 듣고 있었고, 크롤링과 스크래핑에 대한 이해가 더욱 깊어진 것 같았다. 나는 이제 형님과 함께 마이데이터와 같은 안전하고 유용한 데이터 활용 방식을 공유하며, 함께 발전하는 미래를 상상했다.
스크래핑 정리.TXT
<스크래핑>
ㅇ 스크래핑 방식이란, 고객이 입력한 개별 금융기관의 아이디와 비밀번호, 또는 공인인증서를 통해 핀테크 업체가 금융기관의 웹사이트에 대리 접속해 고객 데이터를 수집하는 방식임
- 그러다 보니 서비스 사용자가 늘면서 스크래핑 접속이 늘어나게 되면 접속이 한 번에 몰리면서 네트워크 상의 과부하를 일으키는 부작용이 있었다고 금융권은 주장.
-> 마이데이터 사업을 진행하게 된다면 스크래핑 시스템이 아닌 응용 인터페이스인 API를 이용해 데이터를 모아야 함. API는 별도의 인터페이스를 통해 금융기관이 제3의 업체로 데이터를 전송하는 방식
“그럼 내가 로그인 안하면 어떻게 돼?”
형님은 눈에 흥미와 호기심이 가득한 표정으로 흥미진진하다는 듯 내 이야기를 들으며 물으셨다.
“사용자가 로그인을 하지 않으면 그들은 가입자의 최신 금융 정보를 가져올 수 없게 되니, 죽은 데이터가 되겠죠. 그래서 그거 기억 안나세요? 토스의 경우 사용자가 수시로 로그인하도록 하기 위해 소위 미끼를 던졌잖아요~!”
“뭐???”
“문자로 친구한테 100원, 50원, 1300원 이런 랜덤하게 문자로 돈이 오는 이벤트 말이에요~”
“그렇지 그거 나도 재미있어서 주변에 막 보내고 그랬었지~ 로그인 이벤트로 사용자를 유인하는 건 참 신기한 방법이었어”
“그게 바로 사용자로 하여금 자사 플랫폼 앱으로 로그인하도록 유인하는 미끼상품이었던 거죠. 물론 신규가입 고객 유치 목적도 있었을 테구요. 그런 통통튀는 아이디어로 토스는 지금의 토스가 만들어진 거 아닐까 해요”
“그럼 지금도 토스나, 뱅크샐러드는 내가 로그인해야 내 정보를 최신으로 업데이트할 수 있는거야?”
“맞아요. 이런 창의적인 방법으로 사용자를 유치하면서 서비스의 활성화를 도모했고 지금도 고객의 주기적 로그인을 유인하기 위해 다양한 기발한 아이디어 미끼(?)를 던지고 있죠.”
“토스와 뱅크샐러드는 초기에 많은 사용자들의 관심을 끌었던 앱이었는데, 역시 아이디어가 중요한 것 같아. 스타트업에게 가장 큰 무기는 기존 시장지배자가 하지 못하는 기발한 홍보와 마케팅인 것 같아. 젊은 조직이고 의사결정이 빠르고 과감한 조직 그런 신선함 말야”
“네 맞아요! 다만, 아까도 말씀드렸지만 스크래핑 방식은 이젠 지양해야 할 방식이라 조금 다른 게 있어요. 잘 들어보셔야 해요. 조금 혼란스러우실 수 있어요”
“그래 말해봐 정신 바짝 차리고 들을게”
“네! 데이터 활용에 관한 법률, 이른바 데이터3법이 통과되면서 데이터를 가명, 익명화해서 활용할 수 있는 길이 열였고, 또한 기존 토스나 뱅크샐러드 같이 개인정보를 크롤링해오는 기업에 대해서는 법과 제도가 정비가 됐어요. 그게 바로 ‘마이데이터’에요. 여기서 태동한 개념이 ‘데이터주권’이구요”
“데이터3법이란 것도 흥미로워 보이는데, 데이터를 가명화하거나 익명화하여 활용할 수 있게 한 거라고?”
“네 맞아요. 데이터3법은 데이터의 활용에 관한 규제 혁신과 개인정보 보호를 조화시키기 위해 만들어진 법률이에요. 이를 통해 사용자의 데이터를 가명화하거나 익명화하여 기업이나 서비스에 제공할 수 있도록 열어주었죠. 이렇게 함으로써 개인정보 보호와 데이터 활용의 균형을 맞추고자 했다고 하더라구요.”
“마이데이터와 데이터주권이라는 개념도 흥미로운걸? 사용자가 자신의 데이터에 대한 주도성을 갖고, 원하는 대로 활용하고 거부할 수 있다는 거야?”
“넵! 마이데이터는 사용자에게 데이터 주권을 보장하겠다는 개념이 담겨있어요. 사용자가 자신의 데이터를 주관적으로 관리하고 활용할 수 있도록 해주겠다는 것이죠. 다시말해 본인의 신용 정보를 본인이 관리하도록 하겠다는 거예요. 사용자가 자신의 데이터를 가명 또는 익명화된 형태로 제공하면서도 원하는 서비스와 혜택을 받을 수 있게 되는 것이죠”
형님은 이야기를 듣고 더욱 흥미를 갖고 있었다. 데이터에 대한 새로운 개념과 시스템에 대해서도 빠르게 이해하고 계셨다. 내가 놀라울 정도로.
“내가 이해한 게 맞나 잘 들어봐. 소비자들이 자신의 신용 정보가 어디에 어떻게 활용되는지를 알도록 한다. 각종 사이트 등을 통해 쌓이고 있는 자신의 데이터를 스스로 관리하게 되고, 이러한 정보들이 어느 곳에 활용될지를 직접 정할 수 있도록 한다. 이거 맞아?”
“네 형님 맞아요!”
“그렇다면 마이데이터는 사용자와 기업, 서비스 업체 모두에게 이로운 시스템이 되는 거야?”
“맞아요. 마이데이터는 사용자에게는 개인정보 보호와 권한을 보장하면서도 원하는 서비스와 혜택을 받을 수 있게 해주죠. 기업과 서비스 업체에게는 익명화된 데이터를 활용함으로써 다양한 비즈니스 기회가 열리고, 보다 정확하고 개인화된 서비스를 제공할 수 있게 돼요. 그런 측면에서 모두에게 이로운 시스템이 될 수 있죠.”
형님은 마이데이터에 대한 설명을 듣고 감탄의 목소리를 내며 말했다.
“정말로 놀라운 세상인걸! 데이터 활용에 관한 법과 제도가 정비되면서 더욱 안전하고 효율적으로 데이터를 활용할 수 있게 되겠어!”
“네, 맞아요. 하지만 항상 데이터 사용에는 책임과 윤리가 필요하다는 것을 잊어서는 안돼요. 늘 경계하고 경각심을 가져야 해요. 우리는 데이터를 더 효율적으로 활용하면서도 개인정보 보호와 사용자의 권리를 존중하는 데 주력해야 해요”
형님과 나는 데이터의 미래에 대해 더욱 논의하며, 새로운 기술과 시스템이 가져올 변화에 대해 함께 상상해보았다. 데이터의 중요성과 활용의 방향성에 대해 공감하고 이해하는 시간을 보내며, 미래에 대한 기대와 걱정을 함께 나누었다.
난 형님께 내가 예전에 데이터 신사업을 하면서 공부하며 메모해놓았던 ‘마이데이터’에 대해 정리했던 메모장을 보여드리며 말했다.
“형님 다음에 뵐 때까지 완벽 이해하고 오셔야 해요!!!!”
마이데이터의 데이터주권 개념 정리.TXT
마이데이터의 어원은 ‘내 데이터의 주인은 나’라는 데에서 왔다. 여기서 데이터 주권이라는 개념이 성립된다. 정보 주체자가 자신이 만들어낸 데이터의 권리를 행사할 수 있다는 개념이다.
데이터 주권이란 신체나 재산의 권리처럼 개인에게 정보 권리를 부여해 스스로 자신의 데이터가 어디서, 어떻게, 어떤 목적으로 사용될지 결정할 수 있는 권리를 의미한다.
그리고 여기서 개인신용정보전송요구권이란 개념도 파생된다.
개인신용정보전송요구권이란 특정 기업이나 기관이 가지고 있는 개인정보를 정보주체인 개인의 요구에 따라 다른 사업자로 옮길 수 있는 권리다.
즉, 내 데이터는 내가 직접 관리할 테니, 내가 지정하는 제3자에게 데이터를 보내달라고 요구할 수 있는 권리다.
데이터 주권과 개인신용정보전송요구권이 더해지면, 정보 주체자는 자신이 만들어낸 데이터를 자신이 원하는 기관에서 볼 수 있도록 자신의 데이터를 보관하고 있는 기업 또는 기관에 요청할 수 있게 된다.
그것이 한 곳에 모아져서 정보 주체자의 모아진 정보를 분석하여 정보 주체자가 원하는 정보를 한눈에 보여줘 그 정보를 통한 부가가치를 창출해 내는 사업이 마이데이터 사업이다.
글을 쓰고 있는 지금 시점에서 말을 덧붙이자면, ‘마이데이터’는 지금 금융권에서 열심히 광고하면서 가입자 유치에 열을 올리고 있는 서비스다. 동의받은 데이터를 제공받아 맞춤형 자산관리 등 서비스를 제공하고 이를 통해 수익을 얻는 모델이 핵심 비즈니스 모델이다.
세련된 용어로 다시 정리하면 이것이 바로 마이데이터를 통해 가능한 투자 자문, 대출 중개 등의 서비스인 것이다. 정보 주체자로부터 정보를 제공받은 제3자가 데이터를 관리하고 이를 바탕으로 분석⋅추천해줘 부가가치를 창출하는 것 말이다.
예를 들어, 정보 주체자의 소비패턴을 분석해서 맞춤형 카드를 제안하고, 자산 현황을 파악한 뒤에 좀 더 낮은 대출이자로 갈아탈 수 있다고 컨설팅해주는 것이 가능해진다.
벌써 여름이 되었다. 한창 더위가 막바지에 접어들면서 시원한 카페에서 차가운 음료를 즐기는 것이 최고의 여유가 되었다. 우리는 형님이 바쁘셔서 일정을 잡기 어려웠지만, 이번에는 드디어 시간이 맞아 미팅을 잡게 되었다.
우린 카페에 마주앉아 가벼운 대화를 나누며 오랜만에 만남을 기뻐하고 있었다. 형님은 항상 새로운 도전과 아이디어를 추구하는 성격이라 지난번에 내가 보여드린 메모가 마음에 드셨는지, 마이데이터 사업을 해보자며 내게 제안하셨다.
“우리 마이데이터 사업 시작해볼까?”
“네??? 마이데이터 사업이요?”
형님의 질문에 맞춰 나는 다시 설명했다.
“마이데이터 사업이 사용자들의 데이터를 가명화하거나 익명화하여 제공하는 서비스를 말하는 거잖아. 사용자들이 자신의 데이터에 주권을 갖고, 원하는 대로 활용할 수 있도록 돕는 비즈니스 말야. 얼마나 멋져! 우리도 사용자들에게 더 많은 데이터 활용의 기회를 제공하면서, 데이터 보호와 윤리에도 신경 쓰는 사업을 해보면 좋을 것 같아서”
형님은 열정적으로 설명하기 시작하셨다.
나는 형님의 말씀이 끝나기만을 기다렸다. 그리고 잠시 생각하는 모습을 보인 뒤, 조용히 그리고 낮은 목소리로 미소를 지으며 말했다.
“형님 생각하시는 것이 맞아요. 허가를 받는다는 것은 기업에게 일정한 권한과 보장을 줄 수 있기 때문에 좋은 것이 맞아요. 하지만 허가를 받기 위해서는 정부가 요구하는 일정한 조건을 충족해야 해요. 마이데이터 사업 면허를 받기 위해서도 기술적, 기획적, 보안적 측면에서의 요건들이 충족돼야 하고, 사용자의 개인정보 보호와 윤리적인 측면에서도 엄격한 기준을 지켜야 해요”
“그렇다면 우리가 준비해야 할 게 꽤 많겠는 걸?”
“형님 좀 더 들어보세요. 처음엔 마이데이터 면허가 허가사항이다보니 대기업들도 기대감이 컸어요. 비용이 많이 들어간다고 하더라도 초기 시장에 진입하게 된다면, 기업에게 일정한 권한과 보장이 주어지게 되고, 허가인 ‘면허’를 가지고 투자한 비용을 회수할 뿐 아니라 수익을 낼 것이라고 예상했으니까요. 그런데 지금 마이데이터 비즈니스 상황은 전 그닥 좋게 바라보고 있지는 않아요”
“왜~!!! 넌 너무 세상을 날카롭게 봐서 그게 문제라니까~ 좀 긍정적으로 보자구~ 기회가 될거야~ 해보자니까~~”
“형님 큰일날 소리에요. 제가 듣기로는 마이데이터 면허를 받기 위해 투자해야할 인프라만 200억정도 돼요. 거기에 유지보수 비용더하면 엄청나겠죠? 매년 유지비용과 인건비를 어떻게 감당하시려구요. 게다가 수익을 내기가 쉽지 않아요”
“엥?? 그게 무슨소리야??”
형님이 또 열심히 기사 검색을 하신다. 그러고나서는 형님은 의아하다는 듯이 대기업들이 모두 마이데이터 사업면허를 받기 위해 뛰어들었다는 기사를 내게 건네보여주셨다.
“형님! 지금 생각하시기에는 새로운 신사업이다보니 거기에 허가 수준인 면허를 받아야 하는 사업이다보니 뭔가 마이데이터 면허가 대단해보일 수 있어요. 이제 시작이니 빠르게 진입하면 선점효과를 볼 수 있을 것이라 기대할 수 있으니까 말이에요. 그런데 형님 이렇게 한번 생각해보시면 어떨까요?”
“응??? 뭐???”
“형님 기업이 영업활동을 하기 위해 정부로부터 면허를 따야 가능한 일들이 있어요. 의료면허, 변호사면허 등은 강력한 전문직으로 가는 면허겠구요. 건축 인허가 등도 있겠죠. 그런 것들을 보면 꽤 매력적이고, 진입장벽이 확실하게 되면 그 안에 진입하기만 하면 어느정도 꽤 큰 수익이 보장되는 것처럼 보여지기도 해요. 혹시나하는 노파심에 설명을 좀 더 드리면, 정부의 면허 중에서 가장 막강한 권한을 가진 것은 ‘허가’에요. 그다음이 인가, 승인, 등록, 신고 순이구요. 그런데 마이데이터는 인적/물적 요건 등 일정 조건을 갖춘 사업자에 대해서 발급되는 허가에요.”
“그래 그러니까! 내말이 그말이야! 허가니까 좋은 거 아냐? 그리고 200억원이나 기업들이 들여서 따려고 하는거 아니냐고?”
“형님 그렇지만 지금 현실을 직시하셔야 해요. 마이데이터 면허를 받은 기업이 100곳이 넘었어요.(나중에 출판일 기준으로 수정 필요 https://www.cica.or.kr/14_mydata/mydata_05.jsp 여기에 최신 데이터가 있음 필요시 표로 넣어도 좋음 참고) 이렇게 많은 면허를 받은 사업자가 생기면 결국 독접사업자로서 지위보다는 모두가 자기 데이터를 다 개방해서 말그대로 데이터주권자인 국민이 행복한 세상을 만들고자 하는 것 아니겠어요?”
“모두가 하나되어 위아더월드인건가?”
“네 그런거죠. 많은 사업자가 자사의 비용으로 인프라를 구축해서 마이데이터를 하게 되면.. 형님 오픈뱅킹 아시죠? 그것처럼 되는거죠. 차별화 전략은 어렵고 그냥 모두가 다 비슷비슷한 서비스를 제공하게 되는거구요. 단, 그건 있겠죠. 사용자가 많이 이용하는 충성도 높은 고객을 확보한 플랫폼이 결국 마이데이터 시장을 독식하게 된다는 것이죠”
“아..... 플랫폼 사업자!!!”
“맞아요!”
“아 이제 좀 개념이 잡히는 것 같은데...”
스크래핑과 마이데이터 개념 비교 정리.TXT
<스크래핑>
ㅇ 스크래핑 방식이란, 고객이 입력한 개별 금융기관의 아이디와 비밀번호, 또는 공인인증서를 통해 핀테크 업체가 금융기관의 웹사이트에 대리 접속해 고객 데이터를 수집하는 방식임
- 그러다 보니 서비스 사용자가 늘면서 스크래핑 접속이 늘어나게 되면 접속이 한 번에 몰리면서 네트워크 상의 과부하를 일으키는 부작용이 있었다고 금융권은 주장.
-> 마이데이터 사업을 진행하게 된다면 스크래핑 시스템이 아닌 응용 인터페이스인 API를 이용해 데이터를 모아야 함. API는 별도의 인터페이스를 통해 금융기관이 제3의 업체로 데이터를 전송하는 방식
<마이데이터>
ㅇ 마이데이터는 개인(정보주체)의 정보전송요구권을 위임받은 마이데이터 서비스 제공자가 쉽게 한 번에 개인 금융 정보를 통합 조회할 수 있는 서비스임. 마이데이터 사업은 정보주체자인 고객이 요청하는 경우 그 정보를 API 형태로 제공해야 하는 것임
- 특히 금융권에서 특히 유용할 것으로 주목되는 비즈니스 모델인데, 개인의 자산, 소비, 투자, 보험 등에 관련된 정보를 종합 수집해서 조회가 가능해져서임. 이를 통해 정보를 단순히 수집만 하는 것이 아니라 이것을 활용해서 개인의 취향과 라이프스타일이 반영된 개인화된 다양한 서비스 제공이 가능해짐. 고객의 데이터를 동의받아 다각도로 분석하고 이를 통한 컨설팅이 가능해진다는 얘기임.
-> 앞으로 더 다양한 종류의 데이터가 공유될수록, 고객이 받는 신용⋅자산 관리나 금융 상품 추천이 더욱 정교해질 것으로 기대됨. 즉 마이데이터 사업자가 고객에게 추천해줄 수 있는 금융상품이나 대출 중개 등이 더 정교해지게 돼 추천 성공에 대한 수수료 증대가 예상된다는 것임
“덕분에 이제 나도 데이터와 파이썬 전문가가 된 것 같은 걸~”
“넵 그럼요! 형님도 이제 수상한 일상코딩이 가능하신 경지에 이르르셨습니다. 이제 하산하세요!!!”
*DXDicReport : 초중고 및 대학생, 직장인들의 영어단어 암기 돕기 위한 툴