2020년 추석 연휴, 코로나로 답답한 마음이지만 가족들과 둘러앉아 황해도식 손만두를 만드는 거실 풍경은 변함이 없다. 외할아버지께서 황해도 출신이셔서 나와 외가 식구들은 모두 만두를 먹고 자랐다. 6.25 전쟁 중, 북한 땅에서 의사셨던 외할아버지는 남한 땅으로 목숨을 걸고 내려오셨다. 북녘 땅에 두고 온 부모님과 형제들을 가슴에 묻으셨는지 일찍 심장병으로 돌아가신 외할아버지가 항상 떠오르는 추석 연휴.
만두만큼 정성스러운 음식이 있을까. 맛깔스러운 만두 '한 개'를 만들기 위해 엄청난 '속'이 필요하다. 두부, 김치, 당근, 부추와 당면, 고기 등등 - 다양한 재료가 들어갈수록 더욱 식감과 맛이 풍성해지고 맛있다. 만두피로 정성스럽게 쌓은 만두는 그제야 먹기 좋은 음식이 되지만, 이를 위해서는 다양한 재료와 손질 과정이 필요하다. 어쩌면 만두 속을 만드는 과정은 데이터 분석에 필요한 메타 데이터를 만드는 과정이다.
가족들과 만두를 빚는 상황에서도 마케터라는 정체성을 가진 나의 머릿속엔 온통 '어떻게 하면 메타데이터를 의미 있게 분석할 수 있을까?' 고민하느라 여념이 없었다.
메타데이터를 활용한 데이터 분석기법을 이해하기 위해 먼저 메타데이터 그 뜻을 살펴보자. 메타데이터란, 다른 데이터를 설명해주는 데이터라고 검색엔진에서 정의하고 있는데 전혀 도움이 되지 않는 설명이다.
'데이터를 위한 데이터'라는 의미는, 만두를 위한 속재료라고 비유할 수 있다. 다시 말해 만두처럼 데이터가 상품성을 가지고 유의미해지는 단위가 되기 위해 필요한 만두소 재료가 바로 메타 데이터인 것이다. 다른 말로써는, [데이터 분석]이 가능하기 위해 필요한 [데이터 요소]라고도 정의할 수 있겠다. 그리고 기술적인 영역에서 분석에 필요한 데이터 인프라 및 설계구조까지도 의미한다. 메타 데이터는 설계되는 구조나 체계에 종속된다. 따라서 메타 데이터셋이 다를 경우 각각의 데이터베이스는 다른 단위를 가지게 된다.
의미 있는 분석을 위해서는 앞단에 그에 맞는 데이터베이스를 구축, 설계하는 과정이 필수다. 필자는 이를 만두 속을 준비하는 과정으로 비유한다. 맛있는 '데이터 속'을 만드는 레시피를 공유한다.
메타 데이터는 쉽게 설명하면 [데이터 항목]과 그에 따른 [데이터 값]라고 정의할 수 있다. 데이터 분석 목표를 고려하여 잘게 쪼갤 항목들을 깊이 있게 쪼갤 수(Break-down) 있어야 한다. 유튜브에 올린 동영상 시청에 대해 분석하려고 하는 상황을 가정해보자. 어떤 항목들이 필요할까?
영상 조회를 분석하기 위한 메타 데이터(예시)
[영상 조회 수]
[영상 클릭 조회 수]
[25% 영상 조회 수]
[50% 영상 조회 수]
[75% 영상 조회 수]
[완전 영상 조회 수]
누락된 메타 데이터를 추후에 추가할 수도 있지만 가능하면 데이터를 최초 설계할 때 누락된 항목 없이 최대한 자세하게 리스팅(Listing)하는 것이 좋다. 물론 모든 메타 데이터는 분석 목적에 연관(related)되며 필요한(necessary) 항목들이어야 하겠다.
두 번째로 중요한 것은, 항목별 데이터 값이 동일한 지 검증하는 단계가 필요하다. 예를 들어, 어떤 동영상의 경우 영상을 클릭할 때부터 영상이 재생되는 경우가 있는가 하면, 어떤 경우 사용자 경험(UX)상 영상이 자동으로 재생되는 경우가 있다. 이 두 값은 물론 데이터 항목 상으론 [영상 조회수]다. 그러나 소비자가 영상을 클릭해서 재생한 영상 조회수는, 자동 재생된 그것보다 한 단계 더 발전된 소비자 참여(클릭 후 동영상 재생)를 내포하고 있다. 표면상 데이터 항목은 동일하지만 값의 '속성'이 대등하가도 보기 어려운 것이다. 이러한 경우 메타데이터를 분리, [영상 조회 수]와 [영상 클릭 조회 수]로써 데이터 항목을 구별할 필요가 있다. 이러한 과정이 바로 메타 데이터를 같은 기준, 같은 값, 더 나아가 같은 구조(Hierchy)로 조정하는 과정이다.
위 예시로 든 메타 데이터 중에서, 영상을 Quartile(25%) 단위로 재생 수준을 평가하는 항목이 있다. 이러한 메타 데이터가 필요한 이유가 무엇인지 깊이 있게 생각해본 적이 있을까? 만약 특정 영상 구간에서 갑자기 재생 수치가 떨어질 경우, 해당 영역에서 어떤 이유로 영상 흥미가 떨어졌는지를 분석해볼 수 있다. 이러한 분석 내용은 다음 콘텐츠나 콘텐츠를 연출하는 데 있어서 중요한 참고가 될 수 있다.
메타 데이터(만두 속)를 쪼개는 과정에서, 각각의 데이터 항목들이 어떻게 의미 있는 데이터 분석(만두)이 될 수 있을지를 상상하거나 예측하는 과정이 필요하다는 것을 잊지 말자!
통합적 설계가 필요한 이유는, 아무리 구체적으로 잘게 메타 데이터를 쪼갠다 할지라도 만약 다른 데이터와 연결되어 더 큰 가치를 만들어낼 수 없다면 해당 메타 데이터는 무용지물이 되고 만다. 물론 각각의 메타 데이터는 데이터 분석 목표와 연결되며 필수 불가결한 구조를 가져야 한다. 각각의 메타 데이터는 분석 목표를 고려하여 촘촘히 누락 없이 쪼개지면서도, 동시에 분석 목표와 연결되며 통합적으로 분할되어야 한다.
웹사이트 내 트래픽을 분석하려는 목적을 가지고 다음과 같은 메타 데이터를 구분할 수 있는 트랙킹 코드가 준비되었다고 가정해보자.
웹사이트 사용자 이용현황 분석을 위한 트랙킹 코드에 포함된 메타데이터(예시)
Code 1 : 202011 / SNS / Entertainment / Reach / Video_30s
Code 2 : 202011 / Facebook / Entertainment / Websiteclick / Video_30s
Code 3 : 202011 / YouTube / 2035-Female / Pre-roll / Video_30s
첫 번째 메타 데이터 항목으로 SNS라고 구분한 반면, 두 번째에서는 메타 데이터의 구분자를 Facebook으로 정의했다. 이럴 경우, 첫 번째 메타데이터에서 구체적으로 어떤 SNS을 의미하는지 알 수가 없다. 동일한 계층으로 메타 데이터 항목을 설정하여 데이터 값들을 동일한 기준으로 축적, 분석할 수 있는 구조를 반드시 고려해야 한다. 이럴 경우, SNS 값을 Instagram으로 고칠 경우, 30초짜리 영상의 반응을 각 매체별로 분석할 수 있는 구조가 마련된다. 이처럼 같은 레벨로 메타 데이터 항목을 구분을 해두지 않으면 데이터 값을 펼치기가 어렵다.
두 번째로 2번째 태그와 3번째 태그를 비교해보자. 두 태그의 경우 집행 매체 카테고리가 각각 SNS와 비디오로 다르지만 두 매체에서 영상 소재가 얼마나 페이스북과 유튜브라는 같은 계층의 마케팅 채널에서 유사한 반응을 보였는지 비교분석이 가능해진다.
자, 그렇다면 메타 데이터를 활용하여 본격적으로 데이터를 분석하는 방식을 알아보자. 마치 사전 단계에서 만두 속을 건강하고 맛있게 만들었다면 이제는 만두피를 활용하여 만두를 이 모양 저 모양으로 빚는 과정에 해당한다. 얼마나 많이 만두 속을 다양한 재료(items) 넣으냐, 얼마나 넣으냐(volume) 따라 만두 모양이 달라진다. 만두는 사람이 맛있게 먹을 때 비로소 가치가 있는 것처럼, 메타 데이터 역시 의미 있는 정보를 제공할 수 있는 데이터가 될 때 비로소 가치롭다.
항상 동일한 메타 데이터만 사용한다는 편견을 버리자. 그것은 한마디로 왜 분석이 필요한지 제대로 정의되지 않은 목표라고 할 수 있다. 한마디로 분석을 위한 분석, 죽은 분석이다. 이렇게 형식적이고 반복적으로 답습하듯이 하는 데이터 분석은 필히 경계해야 한다.
마케팅 목표에 따라 필요한 메타 데이터 항목이 달라진다. 목표는 동일하다 할지라도, 해당 매체에서 목표로 하는 항목이 무엇인지에 따라 필요한 메타 데이터 항목과 그 값이 달라진다. 필자는 이것을 데이터 다이내믹스(Data Dynamics)라고 정의하고 싶다. 무엇을 분석할지에 따라 필요한 메타 데이터를 적재적소 선택하는 일, 이를 위해서 사전에 메타 데이터를 촘촘하게 쪼개 놓는 사전작업이 필요하다.
다양한 메타 데이터들을 만나고 이를 다양한 각도에서 분석하면서 느낀 것이 있다. 바로 메타 데이터 분석은 한마디로, '무엇을 어디까지 묶어서 기준으로 삼고, 그 해당 값들을 펼쳐볼 것인가'라는 고민에서 출발한다는 점이다. 무엇을 묶느냐에 따라 데이터 각도가 달라지고, 그에 따라 인사이트가 마치 스펙트럼처럼 펼쳐진다. 사실 그 데이터의 다양한 스펙트럼을 경험하면서 희열을 느꼈다면 그때부터가 빅데이터 분석 매력에 빠지게 되는 첫 단계다.
그러나 모든 메타 데이터 분석은 결국 분석가뿐만 아니라 해당 분석을 받아보는 광고주 또는 클라이언트, 의사결정권자에게 가치 있는 내용을 전달해야 하기에 의사결정이나 행동까지 나아가야 한다. 데이터 분석을 하게 되다 보면 데이터를 정리하고 사실만을 요약하고 끝나는 경우가 많다. 모든 메타 데이터 분석의 목적은 [데이터 가치 전달]을 목표로 이루어진다는 사실을 명심하자.
데이터를 수집하고 설계, 분석하는 일이 궁극적으로 마케터에게 유의미한 인사이트를 제공하는 것을 목표로 한다는 사실을 잊어서는 안 된다. 메타 데이터를 이쁘게 정리하고 구조화하는 과정에서 너무 힘을 뺀 나머지 그 이후에 데이터 분석이나 인사이트 도출까지 나아가지 못하는 경우가 흔하다. 데이터베이스가 세팅되었다면 그 이후 시점에서는 데이터 분석 역량을 키워내고 다양한 인사이트를 뽑아내는 단계로 넘어가야 한다.
여기서 중요한 것이, 마케팅이나 비즈니스 관점에서 의사결정을 할 수 있는 데이터로 전환하는 작업이다. 쉽게 마케팅 지출 대비 매출을 계산하는 ROAS(Revenue out of Ad Spending)와 같은 개념이다. 설령 직접적인 구매금액이 데이터로 들어오진 않는다 할지라도, 구매 가능성이 높은 메타데이터 항목을 구매 단위로 환산시켜서 마케팅이나 비즈니스 가치로 치환시킬 수 있다. 예를 들어, 이메일 구독하기 버튼을 클릭하여 이메일을 구독하게 된 수치를 메타 데이터로 잡을 수 있다. 이후 이메일 열람을 통해 구매까지 이어지는 확률 - 물론 높지 않을 수 있지만 - 을 적용하여 구매 가능성을 예측해볼 수도 있고, 아예 구매(가능성) 금액을 산정해볼 수도 있다. 실제로 구매금액과 매칭 되진 않더라도 구매 추이를 데이터의 그것과 비교해서 유사성을 발견할 수 있다.
자동차와 같이 고관여 제품의 경우, 이러한 구매전환 가능성을 촘촘하게 트랙킹 하기도 한다. 신차 관련 영상을 통해 홈페이지로 유입되고 관련 [카탈로그] 버튼을 다운로드하거나 [가격표] 버튼을 클릭할 경우, 해당 소비자는 구매 가능성이 높은 소비자이기 때문이다. 이때 해당 메타데이터는 마케팅 영역에서 세일즈 영역으로 전환되어 추가적인 액션이 취해져야 한다. 예를 들어, 시승을 할 수 있는 정보를 제공한다든지 고객응대를 할 수 있는 담당자 정보를 함께 제공함으로써 구매로 전환시킬 수 있는 가능성을 높여나가는 고객 대응이 필요하다. 이처럼 데이터 분석에서 그치지 않고 이를 적극적이고 공격적으로 활용하여 의사를 결정하거나 실용 단계에서 넥스트 전략으로 활용할 수 있는 역량까지 갖추어야 하겠다.
갑자기 메타 데이터와 같이 딱딱한 내용에 만두 이야기가 나와서 당황했을 독자분들이 조금은 편하게 메타 데이터 개념을 이해해보셨을지 모르겠다. 요약하자면 메타 데이터 분석이란, 필요한 [만두 속] 재료들을 준비해서 잘게 잘게 자르고 이를 가치 있는 최소 단위의 분석 데이터 즉 [만두]를 만들어내는 것을 의미한다.
마지막으로 이야기하고 싶은 것이 있다. 세세한 데이터를 들여다보면 결국 그 데이터 안에 갇히는 경우가 있다. 물론 메타 데이터를 들여다 보기에도 벅차고 아직은 무궁무진한 인사이트를 발견할 단계의 마케터라면 아직 와 닿지 않을 수도 있겠다. 그러나 데이터에서 볼 수 없는 것이 있다. 아이러니하게도, 큰 흐름의 변화를 만들어내는 힘은 데이터밖에 있다는 것이다. 외부에서 새로운 동력이 만들어져야 새로운 데이터가 만들어지고, 새로운 분석과 가치가 계속해서 재생산된다.
21세기 빅데이터 시대 - 마치 데이터가 인간 세계를 지배할 것 같고 휩쓸 것 같으면서도 결국 신이 주신 인간의 창조력은 여전히 빛나고 있다. 나는 그것이 가장 가치 있는 메타데이터를 만들어내는 근원이라고 믿는다.
* 작가의 생각과 글에 대한 무단 도용은 저작권 위법혐의로 처벌받을 수 있습니다.
* 현재 <일상에서 발견하는 마케팅 이야기> 브런치 매거진은 디아이매거진, 디지털인사이트, 아이보스에 정기칼럼으로 연재 중입니다.
* 더 많은 콘텐츠를 보길 원하시는 분은 프로필에서 [구독하기]를 눌러주세요.
* 마케팅 1:1 개인 및 그룹 스터디를 운영 중입니다. 프로필 링크를 참고해주세요.