brunch

You can make anything
by writing

C.S.Lewis

by 정동근 변호사 Jul 24. 2019

빅데이터(Big Data)와 개인정보보호

최근 미국의 한 대형할인점(Target)에서는 빅데이터를 이용해 임산부라고 예측되는 고객에게 맞춤형 쿠폰을 보냈습니다. 한 중년 남성은 자신의 고등학생인 딸에게 임산부를 위한 쿠폰이 날아오자 매장을 방문해 항의했습니다. 중년 남성은 당연히 고등학생인 자신의 딸이 임신을 했을 리가 없을 것이라고 생각했을 겁니다. 매장 책임자는 중년 남성에게 사과하였지만 놀랍게도 중년 남성의 딸은 임신한 상태였습니다.


통계자료를 바탕으로 인간의 행동패턴을 분석하는 방식은 새로운 방식이 아닙니다. 보편적인 인간의 공통된 특질을 파악해서 기업경영에 활용하는 것이죠. 문제는 통계자료로 활용된 빅데이터입니다.



1. What is Big Data?


빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말합니다. 사전적 의미는 ‘방대한 자료’ 정도가 되지만 IT 업계에서는 데이터 자체만을 지칭하는 것보다 ‘다양한 형태로 구성된 방대한 크기의 데이터로부터 경제적으로 필요한 가치를 추출할 수 있는 기술’로 이해하는 경향이 큰 것 같습니다. 데이터 그 자체보다 데이터를 활용하는 기술이라는 동적인 측면에서 빅데이터를 이해하는 것이죠. 기업의 관점에서는 ‘가치를 생성할 수 있는 데이터’를 빅데이터라고 해석하기도 합니다.



2. 빅데이터의 특징


미국 코네티컷 주에 본사를 둔 IT분야의 리서치 기업 가트너는 빅데이터의 주된 특징으로 크기, 다양성, 속도 등을 꼽았습니다.


① 크기(Volume)는 데이터의 물리적 크기를 뜻하며, 크기는 기업 데이터, 웹 데이터, 센서 데이터 등 PB(=1,204TB) 규모로 확장된 데이터를 말합니다.


② 다양성(Variety)은 데이터의 형태를 뜻하며, 기존 기업 데이터 환경에서 사용하는 관계형 데이터베이스(RDB)에 저장된 데이터, 웹 로그(Web log: 웹 서버에 남은 사용자 데이터)나 기기 데이터, 비디오나 이미지 같은 비정형 데이터 등 데이터의 형태에 따라 그 종류가 나뉩니다.


③ 속도(Velocity)는 데이터 처리 능력을 뜻하며, 데이터를 수집 · 가공 · 분석하는 일련의 과정을 실시간 또는 일정 주기에 맞춰 처리할 수 있어야 합니다.




3. 빅데이터(Big Data)와 개인정보보호


빅데이터의 기술적인 특징이 강조된다고 하더라도, 빅데이터도 기본적으로는 데이터의 집합입니다. 그 중에서 가장 큰 비중을 차지하는 것은 아마도 개인정보일 것입니다.


미국계 다국적 통계업체 IMS 헬스코리아가 약 43억 건의 조제정보를 약학정보원으로부터 불법적으로 사들인 사건이 있었습니다. 검찰 조사 결과 약학정보원은 2011년 1월부터 지난해 11월까지 전국 약 1만 800개 약국에 공급한 경영관리 프로그램을 활용해서 조제정보를 불법적으로 수집한 것으로 드러났습니다. 병원 보험청구심사 프로그램 공급업체인 지누스 역시 2008년 3월부터 건강보험심사평가원에 보험·요양 급여를 청구하는 소프트웨어를 이용해 진료나 처방 정보 약 7억 2000만 건을 불법적으로 수집해 역시 IMS 헬스코리아에 판매한 것으로 나타났습니다. IMS 헬스코리아는 정보를 취득한 대가로 29억원 가량을 지급하였습니다.


약학정보원, 지누스와 IMS 헬스코리아의 개인정보수집행위는 개인정보보호법을 위반한 것으로 판단됩니다.


이 글에서 말하고 싶은 바는 위 회사들의 개인정보보호법 위반행위가 아니라, ‘합법적으로 빅데이터를 활용할 수 있는가’입니다.


현행 개인정보보호법은 식별성 있는 개인에 관한 정보를 개인정보로 보호하고 있습니다.


개인정보보호법 제2조(정의) 이 법에서 사용하는 용어의 뜻은 다음과 같다.


1. "개인정보"란 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다)를 말한다.



그렇다면 비식별화 조치를 취한 정보는 개인정보보호법 적용의 대상이 되지 않아 정보주체의 동의를 받지 않더라도 합법적으로 활용할 수 있습니다. 하지만 식별성이 확보되지 않아 빅데이터의 자료로 활용하기에는 가치가 떨어지는 문제점이 있습니다. 적어도 개인정보의 빅데이터로의 활용은 Compliance와 Availability의 선택문제로 연결되는 것입니다.


아직까지 개인정보보호에 관한 국내법은 Compliance와 Availability를 조화점을 제시하지 않고 있습니다. 2014. 12.에 발표된 방송통신위원회(KCC)의 빅데이터 가이드라인은 Compliance에 무게를 두었습니다.


빅데이터를 활용한 산업의 원활한 성장은 세계적인 추세입니다.


넷플릭스라는 유료 스트리밍서비스를 하는 기업에서는 빅데이터를 활용하여 배우・감독에 대한 고객의 선호도를 조사하였습니다. 그 조사결과를 바탕으로 만들어진 드라마가 바로 하우스 오브 카드(House of Cards)입니다. 한 달에 7.99 달러에 가입자가 원하는 콘텐츠를 무제한으로 제공하는 넷플릭스는 전세계 가입자 4400만 명의 시청이력 데이터를 분석해 회원이 좋아할 만한 콘텐츠를 추천해 주는 서비스를 제공하고 있습니다.


아마존도 아마존을 이용하는 모든 고객의 구매 내역을 데이터베이스에 기록합니다. 이 기록을 빅데이터로 분석해 소비자의 소비취향과 관심사를 파악하여 도서추천 서비스를 제공하고 있습니다.


최근에 KB국민카드가 일본의 한 백화점과 손잡고 빅데이터 기반 실시간 마케팅 체계인 '스마트 오퍼링 시스템'을 통해하여 일본에서 마케팅에 활용하고 있습니다. 추석 연휴 기간인 9월 24~28일 5일간 행사 기간 중 일 800만 건 이상의 방대한 카드 승인 데이터 분석을 기반으로 고객의 카드 이용 등 다양한 행동 데이터를 실시간으로 모니터링해 일본 현지에서 백화점 방문이 예상되는 고객에게는 백화점 이용 시 제공되는 혜택을 담은 휴대전화 문자 메시지를 발송하는 방식입니다.


심지어 알리바바그룹의 회장 마윈은 "1930년대엔 사람들이 '보이지 않는 손'이 시장에 있다고 믿었기 때문에, 그래서 시장경제가 이긴 것"이라며 "하지만 손에 데이터를 쥐고 있는 지금의 우리는 예전에 보이지 않던 그 손을 볼 수 있게 됐다."고 말했습니다. 빅데이터를 활용해 소비자들의 행동패턴과 소비성향을 분석하고, 그에 맞게 자원을 계획적으로 생산, 분배할 수 있다는 그의 생각을 통해 빅데이터의 가치가 어느 정도인지 짐작할 수 있습니다.


이렇게 빅데이터를 마케팅에 활용하는 방식은 점차 보편화 될 것으로 예상되지만 개인정보의 이용은 정보주체의 동의를 받아야 하는 법적 한계가 있습니다. 정보 수집 초기에는 식별성이 없어 정보주체의 동의를 받지 않아도 되는 개인정보들이 빅데이터 처리과정을 거치면서 사후에 식별성을 획득하게 된 경우, Compliance 문제가 발생할 가능성이 클 것으로 예상됩니다. 개인정보처리자는 개인정보를 빅데이터로 활용하기 위해서 처음부터 정보주체의 동의를 얻어야 하는데, 사전동의를 받는 일은 쉬운 일이 아닙니다.


빅데이터의 활용은 산업발전과 개인정보보호라는 두 마리 토끼를 한꺼번에 잡아야 하는 난관에 부딪히게 되었습니다. 이러한 문제를 입법적으로 해결하기 위해서는 사회적 합의가 성립해야 하는데, 결국은 빅데이터 활용으로 인한 산업발전이라는 가치와 개인정보보호라는 가치의 이익형량을 통해 조화를 도모할 것 같습니다.


법무법인 조율 정동근 변호사

지식재산권법 전문변호사 (대한변호사협회)

부동산 전문변호사 (대한변호사협회)

www.ipjd.co.kr


(06606)서울시 서초구 서초대로 301, 19층(서초동, 동익성봉빌딩)

직통전화 : 02-533-5558, 팩스 : 02-3476-7796

E-Mail: jdglaw1@hanmail.net

  

작가의 이전글 허위세금계산서와 영리의 목적
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari