데이터를 분석하기 전까지는
9월 3일 오전, 벌써 몇 달 전 일이다. 하루는 몇 년 전부터 운영해 온 브랜드가 제법 매출도 나오고 잘 나간다는 클라이언트와 미팅을 가졌다. 창업 후 생존을 위해 정신없이 뛰어다녔고, 그러자 매출 규모도 커지고 구성원들의 수도 늘어나서 이제는 브랜드의 비전과 핵심 가치 등을 고민하는 단계였다. 몇 차례 고민 끝에 클라이언트는 브랜드의 방향을 확실하게 해야겠다는 결정을 내렸고, 나는 본격적으로 마케팅 전략 수립에 착수했다.
항상 해왔던 대로 가장 먼저 어디서 어떻게 해당 브랜드와 관련된 데이터를 확보할 수 있는지부터 점검했다. 내가 모을 수 있는 데이터와 그 데이터의 접근 방법을 확보할 수 있는지가 중요하기 때문이다. 다행히도 이번 클라이언트는 데이터를 기반으로 의사 결정을 하고 성과를 내려는 의지가 확실했다. 전체를 살펴볼 수 있도록 여러 데이터에 액세스 권한을 자유롭게 열어주셨다.
마케팅 전략의 방향성과 의사 결정해야 할 사안들을 이번엔 데이터를 기반으로 한다면 조금 더 수월하게 파악할 수 있을 것이라 생각했다. 이전에 다른 프로젝트에서 브랜드 가치 정립과 마케팅 전략 수립을 경험해 본 터라 자신 있었다. 그런데 그때는 맞았지만, 지금은 틀렸다.
가장 먼저 맞이한 문제는 데이터가 내가 원하는 형태로 존재하지 않는 경우가 허다하다는 것이다.
대기업처럼 고객 데이터 플랫폼(CDP)을 구축해서 여러 소스에서 온 자사 고객 데이터를 일관성 있게 관리하기 어려운 상황이 훨씬 더 많기 때문이다. 이번 프로젝트를 처음 시작할 때 고객들의 반응과 목소리가 가장 궁금했었는데, 고객 리뷰와 해시태그 데이터들을 쭉 뽑아서 살펴보려니 여의치 않았다.
리뷰들은 네이버 플레이스, 카카오맵, 구글 등에 여기저기 중구난방으로 작성되고 있어서 사람들이 주로 어떤 평가를 어디에서 어떻게 남기는지 경향을 확인할 방법이 없었다. 매체마다 리뷰 작성 방식과 시각화 방법이 다른 것도 혼란스러웠다. 네이버는 직접 작성하는 댓글 본문 외에 체크 표시로 장점과 단점을 표시할 수 있었고, 다른 매체와는 다른 방식이었다. 5개 만점의 별점이 있는 곳도 있었고 없는 곳도 있었다.
그리고 생각보다 기대했던 데이터가 전부 있지 않거나 아예 데이터가 없는 경우도 있었다.
좋은 분석은 좋은 질문에서 시작된다고 한다. 그런데 여타 브랜드들도 상황은 똑같겠지만, 궁금한 것은 많았으나 선뜻 해당 데이터를 찾을 수 없었다. 매장에 방문하는 일 평균 방문객 수는 얼마나 될까? 재방문하는 고객들의 비율은? 평균 고객 대기 시간은 어느 정도일까? 주로 몇 명의 고객이 한 테이블을 이루지? 어떤 제품군을 주로 구매하실까? 등등.. 우리가 상상할 수 있는 모든 것이 데이터로 존재할 수 있지만, 그 데이터가 실제로 제대로 쌓이고 있는지와 조회하고 분석할 수 있는지는 또 다른 문제다.
결국 어떤 데이터를 확보할 수 있는지 빨리 판단한 후, 얻을 수 없다면 유사한 데이터로 대체하거나 종합적인 분석 결과를 조각 모음해서 인사이트를 도출해 내야 한다는 것을 깨달았다.
우선 고객 반응 분석부터 시작하자면, 여러 리뷰들과 해시태그들을 자연어 처리까지 하는 과정은 내 수준에선 어려웠다. 하지만 하나의 엑셀 또는 스프레드 시트에 데이터를 쌓아두고 간단한 텍스트 전처리 과정을 거친다면, 어느 정도 유의미한 인사이트를 도출해 낼 수 있을 것이라 생각했다.
긍정적인 반응과 부정적인 반응이라 판단할 수 있는 키워드를 정리했고, 리뷰마다 각 키워드를 포함하고 있다면 점수를 매기는 방식으로 분석했다. 예를 들어 부정적인 키워드는 "맛없", "별로", "평범", "그닥" 등이 있을 것이고, 아래와 같은 함수로 설정 후 적용한다면 해당 키워드를 포함한 리뷰의 부정적 반응 점수가 올라갈 것이다. 이렇듯 현장 환경과 대행 여건 등을 고려했을 때 어떻게든 현재 있는 데이터와 현실적인 방식으로 큰 관점부터 작게 시작했다.
Ex) =IF(OR(ISNUMBER(SEARCH("맛없",C3)),ISNUMBER(SEARCH("별로",C3)),ISNUMBER(SEARCH("평범",C3)),ISNUMBER(SEARCH("그닥",C3)),ISNUMBER(SEARCH("그다지",C3))),1,"")
그다음으로 방문객 유형 분석은 조금 더 복잡했다. 확보 가능한 데이터는 매장별 영수증 데이터가 전부였다. 주문 고유 번호와 결제시각, 결제 품목, 매출 정보 등은 있었지만 순수하게 날 것 그 자체였다.
우선 주문 건당 결제 품목들에 따라 몇 인 고객인지를 특정했다. 정교한 분석보단 전체적인 흐름 파악이 중요했기에, 커피 2잔을 주문했다면 2인 고객, 커피 3잔에 디저트 1개라면 3~4인 고객으로 추정하는 방식을 활용했다.
그리고 최초 주문 시간과 마지막 나갈 때 결제 시각의 차이를 바탕으로 평균 체류 시간을 추정했고, 회전율이 어느 정도이고 왜 이렇게 많은 고객 컴플레인이 긴 고객 대기시간에 대해서 발생하는지 원인을 분석했다.
이를 바탕으로 해서 가장 선호하는 제품 조합, 가장 많이 방문하고 찾는 시간대, 요일, 객단가, 평균 대기시간들을 찾아냈고 루커 스튜디오(구 데이터 스튜디오)로 시각화했다.
이렇듯 시장 조사나 비즈니스 분석을 통해 브랜드 전략과 핵심 가치를 제안할 때, 데이터는 전체적인 흐름을 살펴보고 의사 결정할 수 있는 기반이 될 수 있다. 하지만 아무리 데이터로 의사 결정을 하고 성과를 내려는 의지가 확실하게 있다 하더라도, 항상 고품질의 데이터를 얻는 것은 어렵다.
필요한 데이터를 얻을 수 없거나 데이터의 질이 낮은 경우 때로는 성격이 유사하고 비교 가능한 인사이트를 얻을 수 있는 다른 데이터로 대체해야 할 때도 있다. 이렇게 데이터 수집과 분석, 전달에 필요한 적절한 도구와 기술을 보유한다면 최대한 정확하고 신뢰할 수 있는 데이터를 기반으로 중요한 브랜드 전략과 의사 결정을 내릴 수 있지 않을까.