과학하는 마케터를 위한 데이터 Talk
과학하는 마케터를 위한 데이터 Talk
데이터를 다룸에 있어, 개인정보 관련한 리스크를 다루는 것은 가장 중요하고 또 어려운 부분이다. 때문에 대부분의 기업에서는 법적으로 개인정보처리 담당자를 지정하고 국가에 신고해야하는 의무까지 있다.
기존에는 데이터를 개인정보와 비식별정보 (익명정보)로 나누어 해석을 해왔다. 흔히들 웹/앱로그와 같은 행태 정보들을 비식별 정보로 해석하여 온라인 광고 등에서 타겟마케팅 용도로 사용해오고 있다. 하지만 앞서 언급한 것처럼, 많은 경우 개인정보로 해석될 리스크가 항상 존재하여 데이터 활용에 있어 많은 제약이 존재해왔다. 이러한 제약을 완화하기 위해, 과거에도 개인정보의 비식별조치 가이드 등, 개인정보를 어떤 조치에 의해 비식별로 인정할 수 있도록 하는 방법을 정부가 제시하기도 했으나, 사실 제시하는 방식으로 비식별 조치를 이행하고 난 데이터로는 현실적으로 의미있게 활용할 수 없는 경우가 대부분이라 실제 기업에서 유용하게 활용하기에는 한계가 많았다.
데이터 3법에서 추가된 가명정보란, 추가 정보의 사용없이는 특정 개인을 알아볼 수 없게 조치한 정보로서, 개인정보와 익명정보의 중간 개념을 새롭게 명시하였다. 여기서 "개인을 알아볼수 없게 조치한 정보"란, 예를 들어 기존에 개인정보와 결합된 많은 속성들 중에 특정 개인을 지칭할 여지가 있는 속성들을 제거한 정보로서, 과거 한번이라도 개인정보에 결합된 적이 있는 속성은 익명 정보로 보여도 개인정보로 해석하는 것과 달리, 특정 조건에 부합할 경우 개인정보나 익명정보가 아닌 "가명정보"로 해석하여, 이를 통계나 연구 등 한정적인 목적으로 활용할 수 있도록 하였다. 이러한 정의만으로는 가명정보를 이해하기가 어렵기에, 법을 발표하면서 가명정보의 이해를 돕기 위해 다음과 같은 사례를 같이 제시하였다.
상기 예시를 보면, 개인정보와 가명정보, 익명정보의 정의를 쉽게 이해할 수 있다.
기존에는 성명이나 전화번호 같은 개인정보 항목을 제외하고도, 나머지 정보만으로는 같은 속석을 갖는 개인들이 3명 이상이 존재해야만 익명정보로 인정했었다. 그런데, 이러한 3명 이상의 동질 집합 조건이 없더라도, 단순히 이름, 전화번호와 같은 개인정보 속성만 제거하면 통계와 같은 연구 목적으로 활용할 수 있는 가명정보로 해석할 수 있다.
이러한 가명정보는 상업적 목적을 포함하는 통계작성, 연구, 공익 목적 등의 용도로 활용 가능다. 하지만 데이터 3법이 발표되었을 때, 대부분 광고 마케팅에 종사하는 분들께서 관심있었던 포인트는, 바로 가명정보를 온라인 타겟광고에 활용할 수 있는가에 대한 부분이었는데, 결론적으로 가명정보는 온라인 타겟광고에는 활용할 수가 없다. 때문에 데이터의 특성과 비즈니스 활용도에 따라 가명정보가 유용하게 활용될 수도, 혹은 데이터 3법 이전과 별로 차이를 못느낄 수도 있다.
그렇더라도 해당 법의 제정 이후에, 카드사 등 기존에 데이터 활용 자체를 엄두도 못냈던 업종의 데이터를 포함해, 여러 기업들의 데이터를 통합적으로 활용하여 인사이트를 추출할 수 있는 데이터를 제공하게 되었다. 이들 데이터들은 한국데이터거래소 (https://kdx.kr)를 통해 거래되고 있다.
그런데 여기서 한가지 더 의문이 있을 수 있다. 사실 많은 분들께서, 과거에도 어차피 통계 기반의 내부 연구 목적으로는 개인정보를 활용할 수 있지 않았던가 하는 생각이 들 수 있다. 하지만 가명정보의 정의에서는, 데이터를 통한 산업간 융합 등이 촉진될 수 있도록, 가명정보의 이용, 결합 활용에 관한 제도를 명시적으로 신설했다는 데 그 의미가 있다. 즉 내부 용도 뿐 아니라, 적극적 활용을 위해 외부로 제공될 수 있는 조건, 그리고 여러 회사들의 타 가명정보간의 결합 가능성도 열리게 되었다는 데 차이가 있다.
하지만 가명정보 데이터의 결합을 위해서는 국가가 지정한 데이터 전문기관에 의해서만 정보 집합물이 결합될 수 있고, 적정성 평가가 이루어지게 된다. 현재 금융데이터에 대한 데이터 전문기관으로는 신용정보원과 금융보안원 등을 시작으로 민간 금융사 등 지속적으로 추가되고 있다.
그렇다면 이와 같은 가명정보의 활용과 결합으로 인해, 과거와 다른 차원의 산업 발전에 기여할만한 의미있는 데이터 활용 사례가 나올 수 있을까? 가장 많이 언급되는 가명정보의 활용과 결합 사례로 다음 두가지가 있다.
먼저 유동인구와 카드 사용정보를 결합한 여행/관광 등의 지역별 분석이 가능해진다. 이미 기존에도 통신사 기지국 데이터 기반의 유동인구 및 상권 분석은 상품으로 나와 있었다. 여기에 카드 이용정보 등이 결합될 경우, 지역, 연령, 성별 등 고객 특성별 선호 여행지나, 해당 여행지에서 소비하는 소비 패턴 등을 추가로 분석할 수 있다. 유사하게 택배 정보와 은행 등 금융정보가 결합된다면, 소득/자산 그룹에 따른 상권별 소비 패턴 분석이 가능해진다.
그동안 온라인 광고 업계에서 주로 타겟 마케팅에 활용했던 여러 데이터 수집 기술들은, 시간이 지날 수록 개인정보 및 사생활 보호라는 측면에서 사용이 제한되어가는 추세이다. 이미 애플이 IOS에서 IDFA 수집을 차단하기로 했고, 구글 역시 크롬 브라우저에서 3rd party 쿠키 수집을 차단하기로 했다가 결국 포기하는 에피소드로 끝나기는 했지만, 점점 더 개인을 관찰하는 데 사용되는 데이터의 제약은 강화될 것이다. 이러한 Privacy 보호 강화와 함께 전 세계 인구 감소 트랜드, 그리고 MZ세대의 경제 영향력 증가는 새로운 마케팅 패러다임을 불러오고 있다. 이에 대해서는 이후에 다시 살펴보기로 하자.