brunch

You can make anything
by writing

C.S.Lewis

by 김광수 비에이티 Jun 17. 2018

책 보고 배우는 데이터 분석-웹데이터 분석학(1)

웹데이터 분석학 Chap1 Reveiw

아비나쉬 카우쉭의 <웹 데이터 분석학>은 <실전 웹사이트 분석 A to Z>의 후속작이다. 디지털 마케팅에서 중요한 부분을 차지하는 데이터 분석은 대부분 매체 데이터, 구글 애널리틱스를 활용한 웹로그 데이터 분석에 치중한다. 이러한 데이터들은 유저의 클릭을 기반으로 하며 <웹 데이터 분석학>에서는 클릭스트림 데이터라 명명하고 있다. 사실 클릭스트림 데이터를 분석하는 것 만으로도 이후의 액션을 선택하는데 있어서 많은 도움이 된다. 디지털 마케팅 에이전시에서 광고주의 성과를 향상시키는 법은 CTR, CVR 두 비율 데이터를 개선시키는데 초점을 맞추고 있다. 클릭스트림 데이터를 분석하는 것은 CTR을 개선하는데 효과적이며, CVR을 향상시키는 것은 웹로그 데이터 분석을 통해 콘텐츠 및 상품, 프로모션에 대한 반응률을 개선시키는 방식으로 움직인다. 이번에 다루려고 하는 <웹 데이터 분석학>은 클릭스트림을 넘어서 가용 데이터 종류를 확장하는 과정을 다루는 책이다.


웹 데이터 분석 산업의 현황

최근 15년 간에 걸쳐 다양한 무료 웹 분석 솔루션들이 등장하였다. 특히 구글 애널리틱스는 웹을 기반으로 하는 모든 서비스에서 사용되고 있으며, 각 담당자가 활용할 수 있는 뎁스와는 상관없이 최소한 "접속해서 데이터를 볼 수는 있게" 되었다. 

구글 애널리틱스의 가장 큰 영향은 방대한 데이터의 민주주의를 일으켰다는 점이다. 누구나 몇 라인의 자바스크립트 코드를 웹사이트 각주 파일에 집어 넣으면 사용하기 쉬운 리포팅 도구를 가질 수 있다.
-p. 31


웹 데이터 분석 돌아보기: 웹 데이터 분석 2.0과의 만남

웹 데이터를 분석하면서 마주치게 되는 가장 큰 문제점은, 어느 정도 보다 보면 더이상 크게 활용할 만한 인사이트를 도출하기 힘들다는 것이다. 검색광고에서 특정 카피를 보고 클릭하는 유저가 줄어들면 카피를 변경하고, 배너광고에서 클릭이 줄어들면 배너 디자인을 새롭게 한다. 특정 페이지에서의 이탈률이 높다면 페이지 내 콘텐츠, 이미지, 카피 등을 변경하고, 위치를 조정하여 숫자의 변화를 관찰한다. 이 과정을 반복하면서 성과를 조금씩 개선하고 결과적으로 기존 대비 일정 수준 이상의 개선을 이루게 된다. 하지만 위 과정에서 활용하는 클릭스트림 데이터는 행동의 이유에 대해서는 알려주지 않는다. 행동의 이유를 밝혀내기 위한 인사이트를 도출하기 위해서는, 마케터 개인의 경험과 추론에  80% 이상 기대야 한다.


그림 1.1 웹 분석 1.0의 옛날 방식, p. 34

"왜"가 빠져있는 클릭스트림 데이터 만으로는 인사이트를 얻기가 힘들다는 것이다. 이 책에서 이야기 하는 웹 데이터 분석 2.0은 다음과 같은 새로운 정의를 제시한다.


데이터 분석이란,

웹사이트와 경쟁자 정보를 통해 얻어지는 정성적/정량적인 데이터의 분석이다.

현재 고객과 잠재 고객의 온라인 경험을 지속적으로 개선할 수 있게 도와줘야 한다.

그 분석이 온/오프라인에서 우리가 바라는 결과를 가져올 수 있어야 한다.


사실 위 정의만으로는 "그래서 어떻게 해야 하는데?"라는 물음이 해소되지는 않는다. 하단의 더 세분화 된 그림과 물음을 통해 어떤 것을 보고 어떻게 분석해야 하는지에 대한 꼭지를 얻어 갈 수 있다.

 그림 1.2 웹 데이터 분석 2.0의 최신 패러다임 p.35

클릭스트림 영역이 5개의 세부 영역으로 나뉘어지는 것을 볼 수 있다. 각각의 세부 영역은 5가지의 질문에 대답할 수 있도록 만들어 주며, 구글 애널리틱스를 제외한 클릭스트림 솔루션, 테크노크라티, 옴니추어 등 여타의 솔루션을 통해 근거를 얻을 수 있다. 최근에 들어서 히트맵 분석 솔루션인 핫자(Hotjar, www.hatjar.com)나 온사이트 마케팅 솔루션 그루비 등 국내외 솔루션들이 출시 되었고 충분히 시간을 들이면 책에 소개되어있는 솔루션 외에도 효과적인 툴 들을 손쉽게 찾아낼 수 있을 것이다.


각각의 세부영역을 통해 던질 수 있는 물음은 다음과 같다.

클릭스트림: 어떤 일이 일어나는가?

다중 결과 분석: 얼마나 많이 일어나는가?

실험과 테스트: 왜 일어 나는가?

소비자 의견: 왜 일어 나는가?

경쟁 정보 분석: 경쟁자에게는 무슨 일이 일어나는가? 


클릭스트림: 어떤 일이 일어나는가?

구글 애널리틱스와 같은 웹로그 분석 솔루션을 통해 웹사이트의 클릭 레벨 데이터를 분석한다.  Page View와 캠페인 성과, 방문자 수, 체류시간, 이탈률, 소스/매체 등의 데이터를 살펴볼 수 있다. 이벤트 설정 방법을 알고 있다면 사이트 상의 모든 행동을 분석할 수 있다. 대개 구글 애널리틱스의 클릭스트림 데이터만 세부적으로 볼 수 있어도 "데이터 좀 본다"는 이야기를 들을 수 있다.


다중 결과 분석: 얼마나 많이 일어나는가?

사실 이 부분은 Chap.1만을 봐서는 정확히 어떤 말을 하고 있는지 알기 힘들다. 책에서 점차 자세히 설명해 줄 것으로 예상한다. 대략적으로 미리 예상해 본다면, 매출 증대, 비용 감소, 고객 만족도와 충성도 증대라는 Revenue에 직접적으로 영향을 줄 수 있는 지표들을 관측하는 방법에 대해 이야기 할 것 같다. 그동안 실무를 하면서 클릭스트림 데이터 만으로 알아내기 힘든 부분이 있었고, 그에 대한 해결책이 제시되기를 바라는 마음도 있다. 


실험과 테스트: 왜 일어나는가?

유명한 A/B 테스트 도구인 구글 옵티마이저, 옴니추어의 테스트앤타깃, 오토노미의 옵티모스트 등(사실 필자에겐 구글 옵티마이저를 제외한 나머지 솔루션은 익숙하지 않다.)을 사용한다. 그로스해킹 과정에서 반드시 필요한 실험의 설계와 결과 관찰, 피드백의 루프를 만드는 것이다. 실험과 테스트는 CRO 테스트 라고도 불리우며, 이는 앞서 말한 CTR과 CVR이란 두 개의 축 중 CVR 개선에 목적을 두고 있다. 최근에는 개인적으로 "그루비"라는 온사이트 마케팅 솔루션에 관심을 두고 있다. 매우 드라마틱한 결과의 개선을 얻을 수도 있을 것이라 예상된다. 


테스트 도구가 가장 훌륭한 친구가 될 수 있는 숨겨진 막강한 이유가 있다. 바로 좀 더 빨리 실패한다는 점이다. TV나 라디오, 잡지, 대형 매장 등에서의 실패는 값비싼 대가를 치러야 한다. 그러나 온라인에서의 실패는 싸고 신속하다.
p. 38


소비자 의견: 왜 일어나는가?

웹 분석 도구는 기록된 사실만 리포팅 한다. 구글 애널리틱스는 utm 파라미터를 지정하여 내가 원하는 단위로 데이터를 분류해서 볼 수 있게 해주는 아주 유용한 도구이며, 실시간으로 유저의 유입을 볼 수 있는 도구이다. 하지만 이 사람들이 대체 왜 이러고 있는지를 알 수는 없다. Chap.1에는 소비자 의견을 묻는 자세한 방법에 대해서는 나와 있지 않으나, 필자는 실무는 진행하면서 앞서 한번 이야기 한 "핫자"라는 솔루션을 통해 사이트 내에서 간단한 설문조사를 진행하고 있다.

그림 1.3 Hotjar Repsonse Window, 출처: www.hotjar.com

좌측에 삽입한 이미지는 홈페이지 리뉴얼 만족도에 대해 간단한 리커트 5점 척도를 활용하여 설문조사를 한 결과이다. 아주 손쉽게 결과를 시각화하여 보여주고 있다. 더 자세한 설문조사 설계를 통해 왜 이런 응답을 했는지에 대해서도 연계하여 조사를 진행할 수도 있다. 핫자에 포함되어 있는 서비스 중Heatmap 서비스는 각각의 유저가 특정 페이지 상에서 어떤 지점을 더 많이 클릭하는지, 스크롤을 얼만큼 내리고 이탈하는지 등을 볼 수 있다.



경쟁 정보 분석: 경쟁자에게는 무슨 일이 일어나는가? 

경쟁 정보 분석은 그리 익숙한 개념은 아니다. 구글 애널리틱스에서 벤치마크 기능을 통해 시장 평균 대비 자사의 반응률을 비교하기는 하지만, 그 외에 더 깊은 활용방안은 아직까지 접해보지 못했다. Chap.1에서는 앞으로 이 부분에 대해서 자세히 설명할 것 같은 뉘앙스를 내포하고 있다. 짧게 소개한 것은 www.compete.com이다. 경쟁사와 자사의 웹사이트 성과를 바로 비교할 수 있다...고 하였으나 2016년 12월 이후로 서비스를 중단한 상태다. 유사한 서비스는 Simillar Web(https://pro.similarweb.com)이 있다. 전반적인 경쟁사 유입 현황을 살펴보기에는 무료 버전을 사용해 보는 것도 나쁘지 않을 것 같다. 책에서는 랭키닷컴이나 닐슨의 코리안클릭을 추천하고 있는데, 사실 어느 것을 사용하더라도 경쟁 정보 분석 분야에서는 무료버전의 성능이 서비스 마다 크게 차이가 나는 것 같지는 않다.


그 외의 더 구조화 된 데이터들을 보려면

저자는 SEO를 위해 맥사마인(http://www.maxamine.com/contact/)을, 매트릭스 분석을 위해 코라디언트(http://www.bmc.com/it-solutions/application-performance-management.html)를 추천한다. 둘 다 유료 솔루션으로 제공되는 것으로 보이는데, 결과적으로 종합적인 성과개선을 위해서는 이와 비슷한 형태의 솔루션을 도입할 필요는 있어 보인다.


전략적 명제와 전술적 이동

저자는 우리 모두에게 웹 분석 전략을 진화시키는데 있어 가장 큰 도전이 사고방식이라고 말한다.

현대의 캐즘(Chasm)을 건너는 데 기술이나 도구가 중요했던 적은 거의 없다. 중요한 것은 갇혀 있는 마음가짐이다.
-p. 41

클릭스트림 데이터에 "왜"를 넣고, 단순 리포팅을 넘어 분석을 늘려야 한다. HiPPO(회사에서 가장 돈을 많이 가져가는 사람, 즉 경영진이나 임원진을 뜻한다.)의 감을 넘어선 연속적인 행동(설문, 테스트, 행동 타겟팅, 키워드 최적화)이 지속적인 서비스 개선으로 이어져야 한다고 말한다.


그동안 디지털 마케팅 분야에 종사하면서, 그리 많지는 않으나 여러 종류의 인더스트리와 회사를 에이전시와 광고주의 입장에서 운영해왔다. 입장은 변화하여 왔으나 지속적으로 의사결정을 뒷받침 하는 "적절한 데이터의 부재"를 느껴왔다. 어쩌면 데이터는 계속 있어왔지만 경험와 지식의 부족으로 데이터를 찾아내어 읽는 방법을 몰랐던 것일 수도 있다. 어디서 부터 어떻게 보고 무엇부터 해야하나 라는 막막함은 이 분야를 처음 접했을 때나 지금이나 완전히 해결하기 힘든 문제인 것 같다. "어디서 부터 어떻게 보고 무엇부터 해야하나"라는 생각을 저자는 "다중성 문제"라고 말한다. 앞서 말한 5가지 핵심 축을 기반으로 각 물음을 효과적으로 풀어내기 위해서 "다중성"이란 개념을 잘 이해해야 한다는 것이다. 다시 말하면, 다양하고 효과적인 도구를 활용해 다양한 유형의 정성적/정량적인 데이터 원천에 접근하여 의사결정을 해야한다.


마지막으로 저자가 안내하는 비즈니스 규모별 고려해야 하는 필수 요소와 우선순위, 최소영역을 살펴보고 Chap.1 리뷰를 마치도록 하겠다.


소규모 비즈니스: 클릭스트림, 다중성, 소비자 의견

중간 규모 비즈니스: 다중성, 클릭스트림, 소비자 의견, 테스트

대규모 비즈니스: 소비자 의견, 다중성, 클릭스트림, 테스트, 경쟁 정보 분석, 깊은 후방 분석(코라디언트 활용), 사이트 구조 분석(맥사마인 활용)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari