brunch

You can make anything
by writing

C.S.Lewis

by 블루엔진 Oct 18. 2020

데이터는 석유인가?

누군가에게는 그냥 마실 수 없는 검은 물이다

 데이터의 시대가 왔다. 모두가 데이터를 이야기하고 데이터 중심의 의사결정을 하겠다고 선언한다. 새로운 시대의 석유가 곧 데이터라고 말하지만 오히려 이 비유를 들으면 우리는 이런 생각을 해볼 수 있어야 하지 않을까?


바닥 깊은 곳에 있는 원유를 꺼내서 대규모 정제시설을 통해서 각 용도에 맞게 분리하지 않으면 원유 자체가 무슨 가치가 있지?


 우리가 일상에서 사용하는 다양한 형태가 되기 위해서는 먼저 지하 깊은 곳에 매장되어 있는 원유를 퍼올려야하고, 그 이후 해당 원유는 고도화된 정제시설로 운반되어 그 특성에 맞게 사용처를 분리하게 된다. 그때부터 원유는 상품화된 가치를 가지고, 누군가로부터 돈을 받고 팔 수 있다.

출처 : https://post.naver.com/viewer/postView.nhn?volumeNo=28983427&memberNo=33248639
출처 : http://www.chemi-in.com/404


 그렇다면 데이터는 어떨까? 기본 구조는 동일하지만 굳이 차이점이 있다면 해당 사업의 기본 리소스인 "원유"는 그것이 만들어지기 위해서 자연의 위대한 프로세스에서 인간 1명의 수명에서는 감히 상상할 수 없는 시간적 기다림이 필요하지만, 데이터는 오늘도 계속해서 사람의 행동에 의해서 그것이 수집가능한 형태로만 되어 있다면 지금 이 순간에도 계속 만들어지고 있다는 것이다.


 지금 내가 이 글을 쓰고 있는 모든 것도 결국 카카오 브런치 서버 어딘가에 "로그"로써 어딘가에 기록되고 있으니까.


 최소한 데이터를 활용한다고 얘기하려면 우리 회사는 전략적으로 어떤 데이터를 수집하고 이를 정제하여 실질적으로 활용할 것인가에 대한 명확한 전략이 있어야 하고, 그것이 확정되고나면 반대로 돌아가서 가장 중요한 3가지 질문의 답을 가지고 복잡다단한 데이터 수집 - 정제 - 활용 체계를 만들어내야 한다. 그것이 제대로된 기업이다. 


1) 우리에게 필요한 데이터는 무엇인가?  

2) 우리에게 필요한 데이터를 어떻게 수집할 것인가?

3) 수집한 데이터를 어떻게 분류하고 가공하여 활용할 것인가?


이게 그림으로 그리니까 쉬워보이는거지... 이런 개념조차 명확히 없는 경우가 더 많다.


 만약 당신의 회사가 이 정도의 기초적인 개념은 가지고 의사결정과 데이터 활용 전략을 수립하고 있다면 그것만으로 축하할 일이다. "데이터가 석유야!!" 라고 소리만 지르고, 나를 따르라고 여기저기서 외치지만 정확히 어디로 가야하는지 모르는 사람들이 모여있으면 그 회사의 회의실은 매번 회의때마다 같은 용어로 다른 소리를 하고 있을 것이며, 데이터의 근처에 가보기도 전에 그림만 계속 그리고 있을 것이기 때문이다.


 이러한 전략 수립단계가 확정됐다면 그 다음은 실무적으로 정확한 업무의 세부 정의가 필요한데, 사실 이 지점에서부터 엄청난 장벽에 직면한다. 아래의 데이터 관계도를 보고 이것은 왜 수집하기로 모델링 되어있는 데이터인지 한번 생각해보자. 유심히 살펴보면 이것만 봐서 정확한 목적까지 파악은 어려워도 "업체관리"를 위한 데이터라는 것을 알 수 있다. 그리고 이것이 설계될 때 어떤 질문들이 있었는지 추정해볼 수 있다. 


1) 일단 업체를 관리해야한다.  

2) 주요 생산설비, 납품실적, 영업실적 등을 수집하여 활용해야 한다.

3) 업체를 정의할 때 법인과 업체조직으로 구분이 필요하다

4) 업체와 사업자는 구분해야 하는데, 업체별로 여러개의 사업자를 둘 수도 있기 때문이다.

5) 업체조직에서도 사업조직과 일반조직을 구분해서 관리할 필요가 있다.

....그 외 이렇게 수집한 기타 다양한 이유가 있을 것이다. 


출처 - DB Guide.net / 데이터 전문가 지식포털

 

 그런데 이것을 설계할때부터 엄청난 도전에 직면하게 된다. 일단 개발자가 이러한 DB모델을 설계하기 위해서는 최소 비즈니스 도메인 지식을 기반으로 무엇이 가능한지 현업 실무자가 정의를 해주거나, 최소한 아주 상세한 밑바닥까지의 설명을 통해 이런 정의가 나와야 하는데, 보통 아래와 같은 비즈니스 흐름도 정도를 그려서 가져온다. 

출처 - DB Guide.net / 데이터 전문가 지식포털

그 다음부터 안싸우고(?) 서로 협력하여 유의미한 비즈니스 모델을 설계하기 위해 상호간에 자료를 계속 고도화하는 작업들이 이뤄져야 하는데...


 1) 각자 자신의 기본 업무가 있는 상태에서는 이런 것들을 하나하나 상세하게 파악하고 정의하기 어렵다. 기업이 이미 거대한 경우 사실 담당자 1명이 이런 전체를 설계하는 것, 파악하는 것도 현실적으로 불가능하다. 

 2) 그럼 프로젝트를 하면 된다고 쉽게 말할 수 있겠지만, 그럼 원래 내가 하던 업무는 누가하는가? 프로젝트 추진을 위한 조직 구성과 비용은 누가 "짠!" 하고 해주나?


 사실 위의 비즈니스 흐름도 정도의 개괄 데이터 모델 정도를 잘 그려서 오는 것도 매우 친절한 현업인 회사라면 그 회사는 데이터를 활용하겠다고 하기 전에 조직구조와 각각의 업무 정의부터 다시 하길 바란다. 아마 데이터가 수집되고 있는 전체 비즈니스 프로세스부터 잘못되어 있거나, 아니면 실제로는 아예 "데이터 수집" 자체도 안되고 있을지도 모른다. 회의실에서 이 데이터가 없어요? 라고 물어보자 "현업이 그런 것을 모으라고 정의해준 적 자체가 없다" 라는 공허한 답변을 듣는다면 그 회사는 데이터라는 단어 자체를 입에 올릴 자격이 없다. 


 순서가 조금 꼬였는데, 데이터 수집/활용 프로세스 구축에 대한 이런 디테일의 함정에 빠지기 전에 일단은 다시 돌아와서 그럼 우리에게 어떤 데이터가 가치있는 데이터인지 정의하고, 그것이 비즈니스 모델에 유의미하게 작용할 수 있는지 판단하는게 필요하다. 

사실 특정 카드사의 정보가 유의미성이 별로 없는 이유와도 일맥상통한다. 결제일시/금액말고 뭐 별 정보가 없다..


 기업은 무엇으로 지속가능성을 가지는가? 바로 영업이익이다. 데이터를 활용해야겠다는 것도 결국은 영업이익을 올리겠다는 것을 의미하는데, 그럼 가장 우선 순위의 가치있는 정보가 무엇일까? 


 이 관점에서 크게 매출을 확대하는 방향과 내부 비효율 제거를 통한 비용을 절감하는 2가지로 방향이 나뉠 수 있는데, 오늘은 매출을 확대할 수 있는 방향의 관점에서 얘기를 해보려고 한다. (개인적으로는 후자가 훨씬 쉽고(?) 의미있다고 생각하지만, 자기 치부를 자기가 드러내는 구조를 의사결정하는 경우는 잘 없기 때문에 가장 윗선의 지시와 강력한 드라이브가 없는 이상 잘 안된다는 것이 현실이기도 하기에...)


 고객이 우리의 상품/서비스를 결제할 수 있는 능력이 있는가?


 많은 회사들이 "우리 상품/서비스를 사고 싶어하는 고객을 찾는다" 고 하지만, 그 이전에 더 가치있는 데이터는 바로 이 질문에 대한 데이터다. (이것이 심지어 네이버조차 자산관리조회 서비스를 시작하는 이유다) 


 예를 들어, 누구나 살고 싶어하는 아크로팰리스에 거주한다고 주소 정보를 입력했어도, 이것이 자가인지, 전세인지, 월세인지, 자가라도 대출 레버리지가 얼마나 되는지에 따라서 가처분 소득이 없다면 소비 여력은 차이가 날 수 밖에 없기 떄문이다. 


 그래서 여기서부터 질문이 시작되야한다. 저걸 어떻게 파악하지? 고객한테 직접 입력을 받아도 그게 정확하다는 것을 검증하기가 어려운데....? 자산관리조회 서비스를 제공하는 회사와 제휴해서 동의하는 고객들을 대상으로 해당 데이터를 가져와야하나? 아니면 입력받은 주소 정보를 매핑하여 해당 지역의 추정소득통계데이터를 제공하는 업체의 데이터와 연계하여 타겟팅 마케팅 대상을 추정으로 추출해야할까? 아니면 그냥 잘 사는 지역에 거주하는 사람(이것도 주소 정보가 정확히 입력된다는 전제), 좋은 기업에 근무하는 사람(이것도 직장 정보가 정확히 입력된다는 전제)을 단순 타케팅한다음에 실제 결제 전환율을 볼까? 결국 어떤 의사결정을 하느냐에 따라서 실제 액션 플랜은 달라진다. 


 1) 자산관리조회 서비스를 제공하는 회사와 제휴해서 동의하는 고객의 데이터를 수집하는 경우 

 - 일단 제휴할 업체들과 미팅하고 제공가능한 데이터와 데이터 연계의 기술적 스펙 등을 검토하여 해당 업무에 들어가는 비용을 산정한다.

 - 굳이 해당 고객들이 우리에게 정보를 제공할 행동 동기를 만들기 위한 혜택 비용을 설계해야한다. 

 - 정교화된 타겟팅을 활용해보고 A/B 테스트를 통해 이 정도 비용을 들여야하는지 계속 검증한다. 

 

 2) 추정소득통계데이터를 제공하는 업체의 데이터 연계 이후 타겟팅 마케팅을 하는 경우

 - 고객 개개인의 정보는 아니기에 1)과 같은 수집을 위한 연계 혜택비용은 필요없지만, 업체의 데이터 활용 비용을 산정해야하고, 타겟팅 마케팅 혜택 비용이 들어간다.

 - 1)번보다는 못하겠지만 어쨌든 이를 활용해보고 계속 활용할지 검증한다. 

 

 3) 우리가 입력받는 데이터를 통해 자체 타겟팅을 하는 경우

 - 정교함은 떨어지겠지만, 개별 활동의 반복적인 누적을 통해서 유의미한 인사이트가 있는지 검증한다.


 1), 2)번이 뭔가 하는 것처럼 느껴지고 좋아보일 수 있지만, 저 모든 행위에는 비용이 발생한다. 비용을 발생시켰는데 이것이 매출 향상에 긍정적으로 의미를 주지 못한다면 안하는 것만 못하다는 것 자체가 제대로 분석되고 있는지부터 한번 살펴볼 필요가 있다. 때로는 가만히 있는게 정답일수도 있다는 것이다. 


 보통 그렇기에 이 질문을 간과하는 경우가 있는데, 이것이 우리가 구축해야하는 전체 데이터 수집단계에서 가장 중요한 질문이고, "할 수 있는지, 할 수 있다면 비용에 따라서 DO or Not" 을 결정해야 한다는 것이다. 



 고객이 소비할 능력이 있는 사람인지 알고 싶지만... 사실 현실적으로는 해당 정보는 모으는게 거의 현실적으로 불가능하다. 그럼 당연히 다음 단계에서 던져야 하는 질문은 아래와 같다. 


어떤 고객이 우리의 상품/서비스를 구매/이용할 것인가? 


 사실, 이 질문이 데이터 활용 프로세스에서는 가장 핵심이자 꽃이 되는 질문이다.  아직 데이터가 없는 단계에서는 당연히 일반론적인 직관에 의해서 가설을 정하고 이를 테스트할 수 밖에 없다. 여기서부터는 "간결하고 정확한 정의에 의한 데이터"를 많이 수집해야한다.


 능력이 되는 기업들은 자신들의 채널에 진입하는 순간부터의 고객의 모든 행동을 분석하고 싶어한다. 온라인 기준으로 보면 [로그인을 했다 - 메인 화면에 진입한다 - 검색을 하거나, 프로모션 페이지에 반응하거나 등 - 이런 페이지, 저런 페이지를 본다 - 장바구니에 넣는다 - 그리고 바로 결제한다... 아니 그냥 가네? - 그냥 간 경우 결제를 하러 다시 오는데 쿠폰에 반응한다 - 다시 결제한다] 와 같은 다양한 경우의 수에 따른 순서도를 가지고 이에 대해 유의미한 행동을 측정하기 위해 다양한 방식을 활용한다. 직접 다 설계하기도 하고, 이런 서비스를 제공하는 솔루션을 사용하기도 하고...


 이것도 결국 똑같은 것이다. 저 모든 리드타임에 각 정보를 수집하는데는 비용이 든다. 인건비가 들고 구축비가 들고 운영비가 들어간다. 여기에 들어가는 비용이 유의미한지 판단하는 기준이 필요하고, 그 결론에 따라 전략을 단순하게 틀어버릴 수도 있다. 가장 최소한의 정보만을 가지고 운영하는 것이다. 


 획득된 고객 정보를 가지고 계속해서 유의미한 제안을 반복하고, 그 제안에 반복하여 발생하는 최종 상품/서비스 결제 정보만을 유의미한 정보로 보고, 해당 고객에게 지속적인 리텐션하며 누적하며 활용하는 것도 데이터 활용을 계획하고 있는 기업에서는 자체적인 역량을 하나씩 쌓아나가면서 시도해볼 수 있는 방식이다. 구축/운영/분석할 역량도 없는 상태에서 불필요하게 낭비될 비용을 상품/서비스 고도화에 우선 투자하는 것이 더 유의미할 수 있다는 것을 비교해가며 남들이 하니까 따라하는게 아니라 우리 회사의 전체적인 비즈니스 모델 관점에서 생각하는 것이 중요한 이유다.


 결국 모든 데이터를 모을 수 없다면,
가장 우선적으로 모아야하는 핵심 정보는
"상품/서비스 결제정보" 라는 것을 인식해야 한다.

어차피 고객 역시 최종 목적은 "상품/서비스"를
구매하고 이용하기 위해서 이 모든 행동을 하기 때문이다. 


 데이터 자체가 상품/서비스인 기업이 아니라면 상품/서비스를 판매하는 것이 결국 그 기업의 목적이고 처음에는 누가 우리 상품/서비스를 구매하는지 누적하는 것만으로도 매우 중요한 의미가 있다. 


 개인적으로 이러한 지점때문에 마이데이터 사업자들 중에서도 특히 자산보유정보+상품/서비스결제정도에 대한 데이터를 잘 정제하여 판매하는 회사가 높은 잠재력이 있다고 생각하나, 가명정보는 그 정보를 직접 활용해야 하는 기업 입장에 P.K 값을 기반으로 식별 가능한 정보는 아니기 때문에 사실 잘 계산해보면 일정 규모 이상의 기업에서는 그냥 자체 데이터를 활용하여 오히려 본인들만의 인사이트를 축적해가는 것이 유리하다는 것을 깨닫게 될 것이다. (....물론 그 능력이 있다는 전제하에...)


 그런데 여기서 우리 회사와 같은 고관여재 상품을 판매하는 회사에는 매우 큰 문제가 있다. 상품 결제 정보만으로는 대체 이 고객이 어떤 사람인지 알 수가 없다... 그럼 어떻게 해야하지?


 이것에 대한 어떤 선택을 해야하는지는 글이 너무 길어지는 관계로 다른 글을 통해 정리해보려고 한다. 


 모두가 데이터가 중요하다고 말한다. 맞다. 중요하다. 하지만 이것을 통해서 정확히 하고자 하는 전략적 방향이 무엇이고, 그것을 달성하기 위한 우선 순위는 무엇이며, 마지막으로 할 수 있는가에 대한 명확한 프로세스를 정리하는 것이 중요하다. 


 이 역시 대기업이 상대적으로 어려운 이유는 이 모든 것을 조직에 뿌리내리게 하기 위해서는 일정한 고통이 필요하고, 시스템들 역시 이미 통합적으로 운영하기에는 분야별, 사업영역별로 너무 거대해져서 감히 손대기 어렵기 때문이기도 하다.


 그렇다고 아무것도 하지 않는다면 어떻게 될까? 플라톤의 이데아론의 동굴의 비유를 생각해보자면 세상은 계속 변화하고 있는데, 우리는 편협하게 갇힌 시각으로 세상을 바라보게 되는 것은 아닐까. 


 

매거진의 이전글 자율주행이 현실이 되려면

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari