brunch

You can make anything
by writing

C.S.Lewis

by Peter Jun 17. 2020

브랜딩과 텍스트 마이닝

빅데이터보다는 양질의 데이터를 향해

몇 년 전까지만 해도 브랜딩은 잡히지 않는 것이었습니다. 대부분 장기적인 마케팅 플랜 위에 포지셔닝이라는 다소 모호한 개념이 브랜딩의 주류를 차지하고 있었습니다. 물론 아직도 '효과' 등으로 불리는 고전적인 브랜딩 원칙들은 상당히 유효합니다. 사람들이 브랜드를 인식하는 구조 자체가 많이 바뀌지 않았기 때문이죠. 여전히 세그먼트에 최초 진입해 고객 인지 속에 높은 산성을 구축한 브랜드는 브랜딩의 후광을 힘입을 수 있으며 패밀리 네임을 제품 광고에 함께 보여줌으로써 제품 이상의 매력을 고객이 느끼게 만들어 줍니다. 크기나 가격의 빈 틈을 파고들어 나름의 시장의 최초가 되는 것도 아직 유효하죠.



그렇지만 브랜딩을 만져보고 경험하는 방식은 몇 년 전과 많이 달라졌습니다. 아쉽게도 과거에는 일부 말 잘하는 사람들이 실무를 떠나 이런 책 읽은 이야기 몇 개로 실무의 브랜딩까지 다 알 수 있는 것처럼 말하고 다니고는 했습니다. 다니지 않더라도 일부 기업의 마케팅 임원이지만 정말 시장에서 우리 고객이 어떤 생각을 하는지에 대해 제대로 알고 있지 못한 사람들이 있었습니다. 단지 유행을 좋아하고 외모에 공을 들이고 말을 잘하면 마케팅 일을 맡고 여기에 책 읽은 이야기를 좀 곁들이면 몇 년간은 실적의 압박 속에서도 살아남고는 했죠.



하지만 이제 그런 시대는 지나가고 있습니다.
데이터 덕분이죠.



저는 여러 아티클을 통해서 데이터를 통해 실제 브랜딩을 측정하고 활용하는 방법들을 말해왔습니다. 방치되어 있는 CRM 데이터와 제품 데이터와의 결합을 통해 의도한 브랜딩이 정확히 먹히고 있는지 확인하는 것을 제안하기도 했고 최근 몇 년간 관심이 높았던 소셜 데이터를 통한 브랜딩에 대해서도 이야기하였습니다. 오늘 할 이야기는 여기의 연장 선상에 있습니다. 바로 상품평 분석이나 소셜 미디어 분석을 통한 브랜드 분석에 대한 것입니다.





설문 조사가 아닙니다



잊지 말아야 할 첫 번째 내용은 설문 조사의 프레임으로 텍스트 마이닝 결과를 바라보지 않아야 한다는 것입니다. 과거 기업에서 고객의 취향이나 우선순위 등을 묻기 위해 정교한 질문으로 짜 만든 설문 조사는 현재 회사 관리자급에서는 실무를 했던 고객 조사의 대표적인 방법이었습니다. 여기 중요한 것은 응답자의 선택에 따른 빈도와 대답의 일관성 등이 있겠죠. 많은 주관적 진술을 담을 수 없는 설문조사는 결국 빈도의 차이에 의해 유의미한 결과인지를 결정해야 했고 빈도는 결국 인사이트를 얻는 절대적인 숫자로 인식되었습니다.



하지만 고객이 온라인에 남기는 글은 빈도로 인사이트를 얻기 어렵습니다. 우선 앞서 글을 남긴 사람을 동조화 하는 성향이 강합니다. 특히 커뮤니티라면 하나의 주장이 전체를 끌고 가는 효과가 강하고 큰 의미 없이 시류에 동조하기 위해 글을 쓰는 경우도 많습니다. 빈도로 해석하기에는 실체보다 너무 큰 비중으로 치우치는 결과가 나오기 쉽다는 말이죠. 더군다나 설문조사와 달리 공 들여 온라인에 글을 써야 하는 동기가 다들 다르다는 특징이 있습니다. 모두의 말이 같은 진정성을 갖고 있지 않기에 단순 빈도로는 정확한 마음을 알기 어렵습니다. 불용어 처리 이야기는 제외하고라도 정말 도메인에서 필요로 하는 인사이트는 빈도가 적당히 적은 곳에서 구체적인 표현으로 많이 나오는 것을 모두 알고 있어야 합니다.



그럼에도 불구하고 여전히 크롤링 데이터 등에서 빈도를 강조하는 사람들이 있습니다. 온라인에서 사람들이 글을 어떻게 남기는지 생각이 부족해서입니다. 물론 빈도가 어느 정도는 중요합니다. 단순히 몇 명이 남긴 말로 전체의 의견을 대표한다고 하는 것은 데이터를 분석하는 취지와도 맞지 않습니다. 하지만 우리가 몰랐던 핵심적인 고객 니즈를 찾는 게 이 조사의 핵심임을 놓쳐서는 안 될 것입니다.




많은 양이 아닌 정확한 원천 정보



데이터를 모르는 사람은 양에 집착합니다. '빅'데이터. 단순히 몇 만개가 아닌, 몇십, 몇 백만 개의 글을 통해 인사이트를 얻으면 더 좋은 인사이트를 얻었다고 일종의 비례식으로 생각하는 사람들이 있습니다. 역시 설문조사처럼 양에 매몰된 비 전문가입니다. 혹시 양으로만 셀링 포인트를 삼아서 데이터 분석 솔루션을 판매한다는 업체는 다시 검증해 봐야 합니다. 고객의 이런 점을 정확히 알고 있으니까요.



하지만 데이터를 다루어 본 사람은 원천 데이터의 정확성을 더욱 중요하게 생각합니다. 가장 안 좋은 케이스는 너무 다양한 채널을 한 통에 담아서 고객의 모습이 흐릿해지는 것입니다. 많은 양의 정보를 담는 것은 좋으나 일정 양의 허들이 있어서 할 수 없이 다양한 곳의 정보를 담아서 온다면 당연히 여러 채널의 다양한 고객 평균 모습들은 더욱 물에 물탄 것처럼 흐릿해집니다. 정말 알고 싶은 고객 집단을 뚜렷하게 뽑아서 목소리를 드는 게 브랜딩과 관련된 텍스트 마이닝 설계의 핵심인데 외부 조건에 의해 근간이 흔들리게 되는 셈이죠. 의외로 이런 일이 많습니다. 충성 고객이 모인 집단의 상품평과 네이버 고객 상품평을 한 데 섞어 놓고 분석하면 우리가 찾는 고객과는 상관없는 고객의 모든 유형들이 소리를 냅니다. 평균의 함정이죠. 



브랜딩의 기본 원칙인 뾰족한 고객, 뾰족한 시장을 먼저 선점하는 것처럼 목소리도 거기서 들어야 합니다. 만약 다양한 채널에서 듣고 싶다면 다양한 결과고 각각 받아 보는 게 정답입니다. 한 번에 많은 양을 넣어야 KPI가 되는 이런 일은 더는 없었으면 좋겠습니다.




사람을 이해하는 것이 목적



텍스트 마이닝만큼 분석 분야 중에서 사람 손을 많이 타는 것도 없는 것 같습니다. 사전을 만들거나 결과 해석에 컴퓨팅 이상의 사람 손이 들어갑니다. 다른 머신러닝 과제 중에서 사람이 프로세스에 개입하는 비중이 이렇게 높은 분야도 드물 겁니다. 왜냐하면 사람의 언어로 다시 결과를 돌려줘야 유의미하기 때문이죠. 이 점을 간과하면 텍스트 마이닝은 '잘 보고 갑니다'로 그치고 맙니다. 한 때 유행했던 워드 클라우드는 신기한 것이었으나 당장 어떻게 쓰지 생각하면 결과물이 적었던 것처럼 사람이 현업에 쓸 모습으로 바꾸려면 적당한 해석을 거치게 됩니다. 그 해석을 미리 분류에 적용하면 단어 사전이 되는 거겠죠.



그래서 시스템 구축을 하는 순간 텍스트 마이닝은 사람과 점점 멀어지는 시스템이 되는 사례가 많습니다. 오히려 컨설팅에 더 적합하다고 개인적으로 생각합니다. 케이스를 정해 놓고 필요한 것을 중점적으로 단어를 찾아 해석하는 것까지 가는 게 더 높은 효율을 뽑을 수 있죠. 단순히 감정 단어, 한 문장에 같이 쓰인 명사 이렇게 찾으면 90도까지는 끓었지만 결국 100도가 되지 않는 중간 결과물로 그쳐서 현업에 적용이 어려울 수 있습니다. 분석가에게 일정 부분의 자유도가 있어야 하고 그래서 현업에 대한 이해가 중요한 분야라고 생각합니다.



결과물의 형태 역시 브랜딩에 대한 고객의 이해 관점에서 접근하는 게 좋다고 생각합니다. 물론 일부 제품과 서비스에 대한 고객의 디테일한 이야기가 도움이 됩니다. 하지만 그것은 이 좋은 결과의 일부만 활용한 것이라고 생각합니다. 고객의 입에서 들을 수 있는 가장 좋은 결과물은 한 고객이 이것과 우리 것의 차이를 어떻게 생각하는지를 분석하는 것이라고 생각합니다. 그런 데이터는 어디에도 없기 때문이죠. 고객이 어떻게 이것과 저것을 생각하느냐는 기껏해야 구매 데이터의 일부 조각 수준입니다. 다른 데이터 원천에서 얻을 수 없는 인사이트를 통해 브랜드 사이의 비교가 가능하고 포지셔닝을 어떻게 다시 구축할지를 모색할 수 있습니다.



일부 산업에서 다시 유행처럼 번지는 텍스트 기반 데이터 분석이 오랜 기간 브랜드에 도움이 되기 위해서는 이런 어젠다를 생각하면서 설계부터 하는 것이 어떤지 생각해 보는 것도 좋겠습니다. 적어도 말 몇 마디에 브랜드 앞 날이 달라지는 과거와는 결별해야 하니까요.





작가의 다른 콘텐츠


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari