데이터를 분석하는 사람들은 남들은 어떤 방식으로 분석을 시도하고 접근하는지 궁금해한다. 이럴 때 참고하면 좋은 사이트가 바로 ‘아비나쉬 카우쉭’의 블로그다. 이 분은 데이터에 대한 통찰력이 뛰어나고 글도 잘 써서 업계에서는 ‘웹분석의 아버지’로 불린다. 분석에 대한 방향성과 인사이트를 얻고 싶다면 즐겨찾기 하시길 추천드린다. 그가 예전에 집필한 ‘웹 데이터 분석학’이라는 책을 보면서 사수가 없는 상황에서 분석에 대한 이론과 지식 습득에 많은 도움을 받았다. 그가 최근에 발행한 글 중 ‘분석 보고서 수준을 높이는 방법’이라는 콘텐츠가 있다. 그가 작성한 글과 개인적으로 생각을 보태서 소개해볼까 한다. (원문에 대한 링크는 글 하단 참고)
회사에서 분석 보고서를 작성하는 사람들은 데이터 분석 직군 혹은 마케터 일 가능성이 높다. 데이터 분석 팀이 조직에 세팅된 케이스는 흔치 않다. 모두가 데이터가 중요하다고 하지만 정작 투자는 하지 않는다. 대표의 강한 의지가 없으면 불가능한 이유다. 그런 이유로 대부분 마케터가 광고 집행 및 그에 따른 성과를 분석하게 된다. 물론 데이터 팀이 세팅되어 있다면 직접 보고서를 쓴다. 일단 보고서를 작성하는 이유부터 생각해보자. 보고서는 왜 작성하는 걸까. 현재 어떤 상황인지 공유하고 앞으로 무엇을 해야 할지 결정하는데 도움이 되는 자료가 바로 보고서다. 보고서 자체를 쓰느라 시간이 많이 들면 안 된다. 보고서를 쓰는 이유는 액션을 하기 위해서인데 액션은 사실 때를 놓치면 의미가 없는 경우가 종종 있다.
그는 아무리 일목요연하게 정리된 보고서라도 보는 사람이 관심이 없으면 의미 없다고 얘기한다. 분석 보고서를 작성하려면 해야 될 일이 많다. 정확한 데이터를 수집해야 하고, 수집된 데이터에서 필요 없는 부분은 제거해야 하며, 그렇게 나온 데이터를 보기 좋게 가공해야 한다. 그리고 그에 따른 본인의 의견을 추가해야 한다. 보고서는 자신이 만족하려고 쓰는 문서가 아니다. 받는 사람이 명확하게 존재한다. 사람들이 분석 보고서에 관심을 갖게 하기 위해 필수로 갖춰야 할 요소를 종합해서 3가지로 얘기해보려 한다.
대표님, 이번 주 매출은 3천만원입니다. 전환율은 2%, 방문자는 5만 명이고 평균 체류시간은 3분입니다.
신입사원 A군은 대표님에게 온라인 쇼핑몰 주간 현황에 대한 보고를 했다. 여러분이 만약 대표라면 어떤 반응을 보일 것인가. 나라면 저렇게 보고를 하게 만든 팀장을 째려볼 것 같다. 위 보고에서 문제점을 한번 찾아보자. 현황은 대략 알겠으나 지표만 있고 비교할 대상이 없다. 전주보다 지표가 개선되었는지, 어디서 유입된 방문자가 구매를 했는지 등의 내용이 빠져 있다. 다시 말해 맥락이 없다.
대표님, 이번 주 매출은 3천만원이고, 전환율은 2%입니다. 매출은 전주 대비 30% 올랐고 전환율도 20%나 개선되었습니다. 신규로 집행한 페이스북 광고를 통해 60%의 매출이 발생했고 체류시간도 평균 대비 30%나 높았네요. 코로나로 인해 유기농 식품에 사람들의 관심이 증가한 것도 전환에 기여한 것으로 판단됩니다. 반면 네이버 배너 광고는 페북 광고 대비 클릭률은 높아서 신규 방문자가 다수 유입되었지만, 전환율과 체류시간이 평균 대비 40%나 낮게 확인되었습니다.
이렇게 보고를 했다면 대표는 할 말이라도 있었을 것이다. 상품을 도대체 누가 샀는지 좀 더 데이터 탐색을 해보라던지, 페이스북 광고 캠페인을 유지하면서 카피만 바꿔 본다던지, 네이버 배너 광고는 어떤 소재가 성과가 낮았는지 전체적으로 낮았는지 파악해서 추가 액션을 실행하라는 식으로 지시를 했을 것이다. A군이 위와 같이 보고를 하면서 세그먼트 단위로 추가 분석을 한다거나 다른 부서에서 어떤 이벤트가 있었는지, 숫자를 텍스트가 아닌 대시보드 형태로 보고했다면 좀 더 완성도 높은 보고서가 되었을 것이다. 그리고 가장 중요한 액션 플랜을 덧붙였다면 그는 앞으로 대표의 신임을 받을 가능성이 높다.
보고서의 수준을 높이려면 자신이 얼마나 영리한지 보여주기 위해 존재하는 데이터는 무자비하게 제거해야 한다. (그는 원문에서 살인자가 되라고 언급한다) 특정 데이터를 수집하기 위해서 최신 기술을 사용했는지에 대해 대표는 전혀 관심이 없다. 데이터를 보고 어떤 의사결정을 내려야 할지가 중요할 뿐. 수많은 지표를 자랑하고 싶은 담당자의 굴뚝같은 마음은 알겠으나, 핵심 지표만 추려서 보고를 해야 이해하기 쉽고 수준 높은 보고서가 된다. 보고서를 숫자로 얘기해야 하는 건 맞지만 숫자만 가득한 보고서는 쓸모가 없다. 숫자로 보고서를 가득 채우는 순간부터 사람들은 당신의 보고서에 집중하지 않는다. 보고서를 쓰기 위해사용한 시간을 버린 것이나 다름없다.
지표를 많이 넣지 말고 데이터에 따른 의견을 추가하는 게 그의 입장에서 의사 결정하기 수월할 것이다. 올바른 판단을 하기 위해서는 고객이 어떤 행동을 하는지를 솔직하게 보고서에 드러내야 한다. 그게 데이터 분석을 하는 당신이 해야 할 역할이다. 분석가는 때로는 용감해져야 한다.
경영진은 약어를 싫어한다. 분석가들만 이해할 수 있는 단어를 적절한 단어로 변경하는 게 현명하다. 약어를 넣어야 한다면 보고서 하단에 약어가 어떤 의미인지 적어줘야 한다. 기본적인 실수는 보고서의 품질을 떨어뜨린다. 항상 본인이 작성한 보고서를 출력해서 확인하는 게 좋다. 모니터로 봤을 때와 출력을 했을 때 보이지 않던 실수를 발견할 수 있다. 보고를 하기 전에 동료에게 내용에 대한 피드백을 받으면 생각지 못했던 부분을 확인할 수 있다. 아래 내용은 기본 중에 기본이니 반드시 숙지해야 한다.
3개월 동안의 일일 그래프는 거의 항상 쓸모가 없음 (이럴 땐 주간 혹은 월간 그래프를 넣을 것)
누적 막대 차트에서 끔찍한 색상을 사용하지 말 것 (흰색 배경에 희미한 노란색 막대기라면 정말 최악)
일관된 글꼴과 글꼴 크기를 사용할 것
테이블의 모든 셀이 동일한 정렬을 갖추도록 할 것
숫자를 표시하는 기준을 동일하게 할 것 (매출을 표시할 때 3.5M과 964K 이런 식으로 표기하면 안 됨)
보고서 장표가 많이 있는 경우는 1개 장표에 하나의 차트만 넣는 것을 권장
팩트만 나열된 분석 보고서는 문서로서의 가치가 높지 않다. 왜냐하면 그런 보고서는 현재 자동화된 보고서로 많은 실무자가 받아보고 있으며, 머신러닝 기술이 발달함에 따라 보고서의 품질도 맥락을 고려한 형태로 발전하고 있다. 이를테면 구글 애널리틱스 신규 버전에서는 수집된 데이터를 기반으로 인사이트 정보를 제공하고 있으며, 전환 데이터가 일정 수준 쌓이면 어떤 유저가 이탈하고 전환할 가능성이 있는지를 데이터에 기반해서 알려준다. 다시 말하면, 보고서를 작성할 때 분석이 빠진 팩트만 공유되는 보고서는 더 이상 필요 없다는 얘기다.
몇 년 전부터 유망 직종에 항상 데이터 분석가는 순위권에 있다. 하지만 그 안에서도 도태되는 분석가는 분명 생길 것이다. 아직 전체적인 맥락을 고려한 종합 의견을 인공지능이 내는 건 한계가 있다. 인간이 로봇과 경쟁해야 하는 건 이제 어쩔 수 없는 현실이고, 그렇다면 그들이 할 수 없는 부분에서 경쟁력을 확보해야 한다. 이제는 로봇까지도 경쟁 상대라는 사실이 허무하지만 너무 낙담할 필요는 없다고 생각한다. 인공지능과 솔루션을 잘 활용한다면 예전에는 할 수 없었던 분석이 가능해졌고 자신의 가치를 높일 수 있는 방법이 많아졌다. 분석가에게 필요한 자질은 데이터를 남들이 이해할 수 있게 결과를 스토리텔링하는 역량과 새로운 것에 대한 학습을 두려워하지 않는 자세가 아닐까.
카이로스님이 브런치에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.