기획자는 어떤 관점으로 데이터를 바라보는데 집중해야 하는가.
데이터가 중요하다는 것은 모두 알고 있다. 그러나 모두가 데이터 전문가가 될 수는 없다.
그렇다면 IT 서비스 기획자에게 데이터란 무엇이어야 할까?
데이터, 그 자체보다는 기획자의 시선에서 봐야 하는 데이터에 대한 관점을 기록한다.
국내 최초이자 최대 빅데이터 전문기업이라 불리는 곳에서 면접을 봤다.
“데이터가 뭐라고 생각하세요?”
면접관이 질문했다.
“제가 생각하는 데이터는~(블라블라)“
성실하게 데이터의 필요성을 답했다.
그러자 이런 답변이 돌아왔다.
“사실 데이터는 아무것도 아니에요. 지금 이 순간에도 계속해서 생기고 쌓이죠. 중요한 건 인사이트예요. “
그렇다. 데이터는 숫자일 뿐이다.
그 데이터를 다루는 사람의 관점이 중요한 것이었다.
데이터는 숫자일 뿐
결국 면접을 위해 데이터 관련 지식들을 꽤나 공부해 갔지만, 합격에 가장 도움이 됐던 답변은 나만의 인사이트가 있었던 기획이었다.
“어떻게 그런 서비스를 떠올렸나요?”
“~ 이런 문제가 있어서 해결하고자 했습니다.”
“정말 좋은 아이디어네요.”
결국 데이터를 분석할 줄 아는 기획자란 ‘쿼리를 짤 수 있느냐’, ‘데이터 관련 지식이 있느냐’보다는 인사이트를 얻기 위해 데이터를 도구로 잘 활용할 수 있는 기획자를 의미한다.
데이터를 추출하기만 하면 뭐라도 인사이트를 얻을 게 있다고 생각할 수도 있지만, 실제로는 유의미한 인사이트를 얻으려면 데이터를 통해 얻고자 하는 목표 또는 가설이 우선 되어야 할 때가 더 많다.
보고하기 위해 회사에서 데이터를 보다 보면 "월평균 방문자“ 그래프를 보며 ’3월에는 방문자 수가 떨어졌고, 4월에는 올랐다. 3월에 떨어진 이유가 뭘까?'를 찾게 될 수도 있다. 하지만 이렇게 분석하는 것은 눈에 보이는 통계 그래프를 단순히 읽고 보고할만한 명분을 찾기 위해 시간을 들이게 된다.
방문자 수 데이터는 유동적이고 n% 떨어진 것이 반드시 비즈니스에 부정적 영향을 주지 않을 수도 있다. 또 특정 월에 데이터가 떨어지는 것이 항상 명백한 이유가 있지도 않다. 그리고 이유가 있다고 해도 기획으로 인해 플랫폼에서 컨트롤할 수 있는 것이 아니라면 그 분석은 유의미하지도 않다.
예를 들어, 음원 사이트의 방문자 수가 특정 월에 올랐다. 그 달에 유명 아티스트가 음반을 냈다. 그러면 이번 달은 그 가수로 인해 방문자 수가 오른 것이라고 인사이트를 도출하고 분석을 끝낼 것인가? 또는 채용 사이트의 특정 월 방문자 수가 작년 대비 급감했다. 알고 보니 올해는 삼성기업이 공채를 하지 않는다. 그럼 방문자 수가 오르기 위해 삼성이 공채를 할 때까지 기다려야 할까?
관심을 가지고 데이터의 추이를 보는 것은 물론 중요하다. 하지만 데이터를 분석하여 유의미한 인사이트를 얻고 주요 의사결정에 활용하기 위해서는 데이터를 통해 얻고자 하는 목표가 무엇이고 무엇을 행할 것인가에 대한 고민이 있을 때 분석이 더 유의미하다는 것이다.
방금 전 사례를 다시 예를 들어보자. 유명 아티스트가 음반을 내는 달에는 방문자 수가 오른다. 자연스러운 현상이다. 그러면 그 유동성을 활용해서 플랫폼은 뭘 할 수 있을까? 그 시기를 이용하여 새로운 서비스를 출시할 수 있다. 그렇다면 월평균 방문자 수 데이터를 분석할 때도 '서비스 론칭을 하기 좋은 시기'를 찾는다는 목표를 가질 수도 있다.
한편 ”유명아티스트가 음반을 발매하지 않은 달은 방문자 수가 떨어진다.“는 가설을 세운 후 데이터를 보았는데 그렇지 않은 달이 있다면 그 달은 어떤 요소가 상쇄하는 데이터를 만들어냈는지 살펴볼 수 있다.
이처럼 서비스 데이터가 오르면 좋은 것, 떨어지면 나쁜 것이라는 이분법적인 생각으로 오른 이유, 떨어진 이유를 찾는데 집착하기보다는 작은 변화라도 분석 내용을 통해 Next 의사결정에 활용할 수 있도록 가설과 목표를 먼저 세우고 데이터를 들여다보자.
나는 떠다니는 데이터 조각들을 모아 새로운 한 판을 짜는 프로젝트를 좋아한다.
대학원에서 데이터다이닝 프로젝트를 진행하며 서울시 공공데이터의 지역 별 상권데이터를 분석했다. 자영업 창업(가게)을 희망하는 이들에게 소위 '성공할 수 있는 지역'에 대한 정보를 줄 수 있을 것이라고 생각했기 때문이다. 특정 분야에 있어 벤치마킹 해야 하는 상권이 어딘지 또는 해당 분야를 찾는 유동인구가 많아 성공 확률이 높은 상권을 특정할 수 있는 인사이트가 나올지 기대가 됐다.
실제로 프로젝트를 통해 특정 분야의 경쟁 업체 수가 적은 지역은 어디인지, 특정 분야의 매출이 높은 지역이 있는지(유명한 가게의 독점 매출인지 또는 해당 분야를 찾는 유동인구가 많은 상권인지), 최근 특정 분야의 상권이 형성되고 있는 지역은 어디인지 등 다양한 인사이트를 얻을 수 있었다. 누구에게나 열려 있는 공공데이터를 통해서 말이다.
그런데 그 과정에서 '이 데이터를 보면 알 수 있을 것이다.'라는 확신을 가지고 분석을 했을 때는 오히려 원하는 값을 얻지 못했지만 예상하지 못한 데이터들을 보던 중 의외의 연결고리가 지어지기도 했다.
서비스 데이터를 분석할 때도 중점 관리 데이터를 지속적으로 분석하는 것도 중요하지만 여기서 더 나아가서 평소에는 보지 않았던 데이터들도 종종 추출하여 새로운 인사이트를 줄 수 있을지 다양하게 비교하며 연결 지어보길 권한다.
리쿠르팅 플랫폼에서 근무하며 빅데이터를 활용한 통계 서비스를 담당했다.
수백만의 사람들이 모인 플랫폼. 수백만의 정보를 토대로 통계 데이터를 산출하면 특정 기업에 합격할 수 있는 스펙의 통계와 기업과 기업 간의 커리어 패스 정보를 도출할 수 있다.
예를 들어, A 기업과 B 기업을 다닌 a와 B기업과 C 기업을 다닌 c 그리고 B 기업과 d 기업을 다닌 c의 데이터로는 연결 고리를 얻기 어렵지만, A기업에서 B 기업을 간 사람이 100명, A 기업에서 C 기업을 간 사람이 50명, A 기업에서 D 기업을 간 시람이 500명이라면 어떨까?
떠다니는 수백만의 데이터들이 서로 연결되며 유의미한 연결고리들이 만들어지고 또 다른 인사이트가 생기는 것이다.
그러나 무조건 데이터의 수가 많아야 유의미한 것은 아니다.
쓸모없는 데이터들이 섞여 들어오면 인사이트 얻는 것을 방해하는 통계가 될 수 있다.
예를 들었던 기업 간 커리어 패스 예시를 생각해 보자. 30년 전, A 기업에서 B 기업으로 이직한 사람의 수가 1만 명이었다. 그러나 최근 5년 동안은 A 기업에서 B 기업으로 이직한 사람의 수가 0명이다. 그렇다면 아무리 데이터 수가 많아도 과거 데이터보다는 최신 데이터를 사용해야 시대의 흐름을 반영할 수 있다.
이와 같은 데이터의 최신성뿐만 아니라, 거짓된 내용으로 작성된 데이터들도 섞여 있을 수 있고 과거와 달라진 양식으로 인해 혼재된 데이터들도 있을 수 있다.
특히 데이터를 분류해 내는 카테고리에 있어, 시간이 흐르다 보면 큰 차이를 보일 때가 많다. 예를 들어, 과거 10년 동안 PM이라는 직무의 별도 카테고리가 없었다면? 그동안 어떤 카테고리로 데이터가 들어왔을까. 대체할 수 있는 카테고리는 무엇일까.
이처럼 유의미한 데이터들만 건져내고 서로 매핑되지 않은 데이터들을 재정비해주는 작업들은 데이터를 통해 유의미한 인사이트를 얻기 위해 반드시 필요하다.
이러한 데이터 분석을 위해 기획자는 쿼리 작성 법을 알아야 할까?
기존에 시스템에 쌓이고 있는 데이터라면 1) 개발자 또는 데이터 부서를 통해 요구할 수도 있고 사내 시스템에 따라 2) 기획자가 직접 쿼리를 작성해 데이터를 볼 수도 있다.
어느 쪽이든 장단점이 있다.
직접 쿼리를 날릴 수 있다면 필요한 데이터를 바로바로 볼 수 있지만 복잡한 쿼리를 작성하는데 어려움이 있을 수 있고, 요청을 해야 한다면 쿼리를 직접 짤 필요는 없지만 밀려 있는 요청들로 인해 시일이 소요될 수 있다.
그래서 데이터 시스템이 잘 구축된 회사의 경우, 솔루션을 통해 몇 번의 클릭으로 기획자가 원하는 데이터 조합들을 산출하도록 되어 있어 직접 쿼리를 날릴 일이 없으면서도 바로 데이터 결과 값을 볼 수 있다.
쿼리를 작성할 수 있고 없고가 중요하기보단 어떤 데이터를 통해 어떤 인사이트를 얻을 수 있을지, 그 인사이트들을 어떻게 기획에 적용할 것인가가 더 중요하다.
만약 데이터가 쌓이지도 않고 있는 서비스를 담당해야 한다면 곤란하다.
의사결정에 필요한 데이터들은 이제라도 쌓을 수 있도록 정비하자.
‘있으면 있는 대로, 없으면 없는 대로’식은 곤란하다. 데이터가 있어야 의사결정의 근거가 될 수 있고 데이터가 남아야 나의 기획이 실효성이 있었는지 객관적으로 판단할 수 있다.
의사결정을 위한 데이터가 없다면 감으로 기획하거나 잘된 서비스를 따라 하거나, 눈치 보며 상사의 의견에 맞추고는 이번에는 어쩔 수 없었다며 변명만 늘어놓게 될지도 모른다.
또 객관적으로 볼 수 있는 서비스 데이터가 없다면 수많은 시간과 리소스를 들여 론칭해도 해당 기획이 성과가 있었는지, 나의 기획이 사용자들에게 얼마나 가치 있었는지 그 누구에게도 객관적으로 설득하지 못한다.
그렇기 때문에 반드시 필요한 데이터가 수집될 수 있도록 한다. 실무에 있어서는 무엇이 필요할지 아래의 글을 참고해 보자.
https://brunch.co.kr/@candigka/19
종합하면 기획자에게 데이터란, 결국 의사결정과 설득을 위한 활용할 수 있는 도구이며 기획자에게 필요한 건 데이터 그 자체보다는 데이터를 읽어낼 수 있는 데이터리터러시 능력이다.
시간이 허락한다면 열정을 가지고 데이터 자체를 공부하는 것 또한 도움이 될 수 있지만, 기획자의 시선에서 데이터를 본다면 매일 보던 데이터일지라도 가설과 목표를 먼저 세워보고 다른 관점에서 바라보기, 처음 추출한 데이터를 중점 데이터와 연결 지어 생각해 보기 등을 먼저 시도하며 데이터를 분석해 보길 바란다.