회사에서 데이터 러닝 세션을 진행하다 #1
매우 기초적인 내용을 담고 있습니다. 무엇보다 '개발자' 대상이 아닌, 저와 같은 상경계열 및 인문학, 비전공자를 대상으로 합니다. 이미 많이 알고 계신 분들에게는 시간 낭비가 될 수 있으니 '뒤로가기' 버튼을 눌러주시고, 따뜻한 격려나 지식 나눔은 댓글로 남겨주세요 :)
회사에서 타부서 직원들을 대상으로 Google Analytics 를 가르쳐주게 되었다. 사실 내가 주도한 것은 아니고, 대표님이 "우리 데이터 공부하는 스터디 모아봐요" 해서 "와 신난다~" 하고 들어갔는데 내가 튜터였다......
공식 웹사이트 (https://analyticsacademy.withgoogle.com/course/1) 에서 친절하게 모든 기능과 강의를 제공하고 Youtube 에서 "Google Analytics" 만 찾아도 수많은 영상이 나오기에 '떠먹여주는' 강의를 하고 싶지는 않았다. (이 글을 읽는 많은 분이 그러하듯 필자도 책과 인터넷 강의로 찾아가며 익힘)
무엇보다 내가 차근차근 학습하듯 배운 케이스가 아니고, 당장 Tool 받아서 필요한 것 위주로 클릭 해보며 실무에서 익힌 케이스라 누군가를 가르쳐준다는 것도 부담스러운 게 사실이었다. (공식 Google Academy 보다 커리큘럼이 좋기 힘듦)
하지만 한 두번의 '도움닫기'로 누군가 Google Analytics 를 더욱 친숙하게 여기게 되고, 원하는 주제로 심화 학습을 하는 계기가 된다면 의미가 있다고 생각했다. 내가 투자한 1시간이 10명의 1시간씩을 아낄 수 있다면 Knowledge Sharing 은 회사에도 큰 도움이 될 것이다. 그래서 Google Analytics 와 Zeppelin 을 포함하여 총 5~10번 정도의 스터디 모임을 진행해보기로 했다.
"예습과 고민이 있어야 공부에 깊이가 있고, 노력없이 듣는 강의는 결국 한 귀로 흘러간다" 라는 신조가 있어 일부러라도 사전에 기본 Dimension & Metric 을 읽어오도록 참석자에게 URL 을 보냈다.
"웹로그 분석툴" 이라는데 웹로그는 무엇인지, UI 는 대략 어떻게 생겼는지 등.
1. GA 는 무엇하는 것? 기능 알아보기
2. GA 분석의 기본이자, 치트키 Dimension & Metrics
3. 주의사항
이 중에서 브런치 #1 에서는 1번 Overview 와 2번 Dimension 과 Metrics 위주로 다뤄보고자 한다. 데이터팀에서 '원만한 협업을 위해' 드린 3번 주의사항/당부말씀에 관한 것은 간단히 서술하고 따로 모아 포스팅할 예정이다.
GA는 많이 알고 있듯 '웹로그(Web Log)'를 분석하는 툴이다. 로그 데이터를 한 데 모아 잘 정돈하여 통계내어 보여주는 것은 물론 Channel 분석과 전환 분석, Goal Setting (나열하자면 끝도 없다) 등 유용한 기능이 많아 커머스 외 개인 블로그에서도 그 활용 가치가 높다.
여기서 '로그(Log)'라 함은, 서버에 저장된 데모 정보, 아이디 등과 다르게 '컴퓨터, 서버 등에서 서비스 플레이 정보를 시간에 따라 남기는 기록' 이라고 생각하면 쉽다. Data Table(표에 정리된 데이터)보다는 Trace(자취)에 가깝다고 봐야 하나. 그래서 웹로그를 모아 통계화된 데이터로 보여주는 GA 는 서버에 저장된 데이터 테이블에서 칼럼을 가져와서 보여주는 MySQL 이나 Zeppelin 과는 활용도가 조금 다르다. (언젠가 GA와 Zeppelin 의 활용 사례를 따로 정리해야 할 것 같다)
아래 링크에 들어가면, Google Analytics 활용 예시와 간단한 UI를 구경할 수 있다.
(https://www.google.com/intl/ko_ALL/analytics/index.html)
9 Awesome Things You Can Do With Google Analytics 5
(https://blog.kissmetrics.com/awesome-google-analytics/)
우리 회사의 경우 로그를 서버에서 직접 찾아서 분석하려면 jplog 라고 하는 복잡한 로그 '무더기'를 뒤져야 하는데, 존경하는 호상님/Jeff님 등의 시니어 개발자분들만 자유자재로 활용하고, 비개발자가 직접 jplog map 을 탐색하기에는 한계가 있다. 그래서 클릭 몇 번에 직관적인 UI 로 로그들을 통계내어 보여주는 GA 는 정말 꿀같은 툴이라고 볼 수 있다.
이렇게 잘 만들어진 GA도 처음에 배우는 이들에게는 뭔가 복잡하게 느껴질 수 있다. 마치 거대한 책장 혹은 서고 앞에 섰는데 원하는 정보인 '한 권의 책'을 뽑아들지 못하는 심정이랄까. 이럴 때는 내가 원하는 책이 사회/문화/경제/예술/역사 등 카테고리 중에서 어디에 속하는지, 제목은 어떤 자음으로 시작하는지 등을 알면 Index 를 찾기가 쉽다.
그래서 나는 Dimension (측정기준) 과 Metrics (측정항목)를 정확히 아는 것은, '분석의 기본이자 치트키'라고 말하고 싶다.
Dimension 은 분석대상이 되는 객체, Metrics 는 숫자로 발생하는 카운트라 이해하면 쉽다. 설치수, 방문수, 주문수 등의 숫자는 Metrics 로서 단일 존재만으로 그 어떤 의미도 없다는 특징이 있다. 분석의 대상이 되는 기간, 데모그래픽 정보, 시스템, 유입경로 등 분석의 기준인 Dimension 이 있어야 비로소 의미를 지닌다.
이 Dimension & Metrics 구조를 이해하면 업무 중에 발생하는 궁금증을 해소하기 위한 데이터를 신속히 획득하는 스킬을 쌓을 수가 있다.
EX 1. 페이스북 마케팅 프로모션으로 들어오는 유입수(=클릭수)가 얼마나 되는지 알고싶다
☞ 마케터가 궁금할 수 있는 부분이다.
여기서 내 궁금증을 해소해 줄 데이터는 '클릭수'이다. 이 클릭수가 바로 Metric이고, 페이스북 마케팅 프로모션의 이름은 Dimension 이 된다. Google Analytics 의 리포트 이름은 대부분 Dimension 명칭을 따라간다. 캠페인 리포트 어디쯤을 보면 Facebook 캠페인 URL 이 붙은 Dimension 을 찾을 수 있을 것이다.
Ex 2. 스마트폰 기종별로 유저가 얼마나 들어오는지 알고싶다
☞ 디자이너가 궁금할 수 있는 부분이다. 스마트폰 기종마다 해상도나 스크린 사이즈가 다르기 때문에, 가장 많이 쓰는 스펙으로 디자인을 하고 싶을 수 있다.
이 질문에서 Dimension 은 '스마트폰 기종'이다. Metrics 은 '유저 유입수'일 것이다. 위 데이터는 모바일 기기 리포트 조회 탭 어딘가를 찾으면 된다.
어차피 데이터 분석가가 아닌 기획자, 마케터, 디자이너가 GA의 모든 기능을 개발자처럼 상세하게 쓸 일은 적고, 유용한 기능만 신속히 찾아가면 되는데 이 때 스스로 자신이 원하는 데이터의 Dimension 과 Metrics 를 정의해보는 것은 마치 서고 앞에서 내가 찾을 책의 Index 를 명확히 하는 것과 같다.
그리고 Dimension 과 Metrics 는 비단 GA에서뿐 아니라 "데이터로 사고하고 소통하는 첫걸음" 일수도 있다. 간혹 자신이 원하는 데이터가 무엇인지 '아는 것 같기도 모르는 것 같기도' 한 상태로 와서 모호하게 설명하거나 Scope을 정의지 못하는 경우가 있다. 협업하는 입장에서는 '상대의 의도'를 알아차리기 위해 따로 시간을 할애해야할 뿐만 아니라 불필요한 에너지를 쓰게 된다.
그런데 자신이 원하는 데이터를 한 줄로 적어본 다음, Dimension 과 Metrics 를 옆에 분리해서 적는 연습을 하면 데이터 요청이 깔끔해질뿐만 아니라 데이터 작업에 대한 예측력도 높아진다. "아 이 데이터는 이벤트액션을 보면 나오겠구나" 혹은 "이 데이터는 GA로는 뽑기 어렵겠구나"를 판단할 수 있게 된다.
이 부분은 여러 번의 포스팅으로 나눌 수도 있을만큼, 할 말이 많아 별도로 다시 서술하고자 한다. 처음 데이터 툴을 접하는 경우 소위 "숫자의 맹신"에 빠질 수 있다. 데이터환경이 '업무의 근간'이 되는 전략기획 애널리스트로서의 영혼을 잔뜩 담아, 산발적인 데이터가 비즈니스 의사결정을 오히려 방해하는 일을 막고, BI 팀과 개발팀의 업무과중을 막기 위한 당부를 했다.
1. "크다/작다", "좋다/나쁘다" 등의 의사결정을 할 때는 반드시 아래 2가지를 사전에 데이터팀과 확인할 것
제대로 된 Dimension, Metrics, Segment 를 썼는지
(GA는 기간에 따라 샘플링된 결과를 보여주므로) 해당 데이터의 정확도, 신뢰도를 어떻게 봐야할지
2. 신규 트래커나 Custom-Dimension 이 필요하면 BI팀과 협의할 것
트래커를 '많이' 혹은 '모두' 심는다고 능사가 아니며, 이 또한 개발의 Cost를 야기하기 때문에, 기존에 세팅된 Rule 을 먼저 확인하기
반드시 사전에 담당팀과 논의하고 우선순위를 조정해 커뮤니케이션 채널 단일화에 협조하기
세션 #2 에서는 예제 중심으로 가기로 했다.
궁금했던 질문을 가져오세요
15년 6월, 박장시 선생님의 데이터분석입문 7기 강의를 들을 때에도 "여러분이 회사에서 분석해보고 싶었던 주제를 해결하겠다는 마음으로 강의에 임하면, 습득 속도가 빠릅니다" 라는 말씀을 들은 적이 있다. 실제로 R이나 SQL 을 익힐 때도 '무엇을 하겠다'는 목표로 필요한 기능 위주로 익히니 막연하지 않았다.
그래서 평소 속한 팀에서 혹은 개인이 궁금했던 것, GA로 보고 싶었던 데이터 예제를 정리해서 한 개씩 올려달라는 과제를 드렸다. 그래야 'Dimension&Metrics 는 제대로 찾았는지', '데이터 보는 목적에 맞는 Metrics 를 선정한건지', 'GA로 해결 못하는 부분을 가져온 것은 아닌지' 피드백을 주고 직접 GA 화면을 보면서 어떻게 찾아들어가는지 설명하기 수월할 것이다.
슬라이드의 Ex 1 번은 일부러 차후 세션에서 대화할 거리를 감안하여 예시로 작성해보았다. "스마트폰 운영체제(OS) 중 어떤 것을 먼저 리뉴얼할까?" 라는 물음이 생겼을 때, 막연하게 사고하는 전형적인 유형은 "이용이 많은 거 먼저 하지 뭐"이다. 그런데 여기서의 '이용' 또한 Clarify 하면 '가입자가 많은 순' 혹은 '접속량이 많은 순', '평균 접속시간이 긴 순', 'Screenview가 많은 순' 등 다양한 Metrics 로 나눠질 수 있다.
이 중에 어떤 Dimension(기준)과 어떤 Metric (측정항목)을 쓰는 것이 좋을지는 상황마다 다르겠지만, 다양한 사례를 놓고 대화와 토론을 해볼 예정이다.
(= 우리는 성인이다. 공부는 스스로의 노력을 보태서. 적극적으로.)
참고문헌
https://www.google.com/analytics/
https://analyticsacademy.withgoogle.com/course/1 (추천)
http://www.lunametrics.com/blog/2009/06/22/dimensions-metrics-difference/
와이즈트래커 김명재님
https://www.optimizesmart.com/complete-guide-to-dimensions-and-metrics-in-google-analytics/
https://megalytic.com/blog/learning-to-use-the-google-analytics-ecommerce-reports