brunch

You can make anything
by writing

C.S.Lewis

by ASH Mar 02. 2022

스타벅스, 하이브 데이터 분석가의 데이터 활용 기술

데이터 쓰기의 기술에서 뽑은 119개의 핵심 파트 (1)

최근 들어서 데이터 관련한 책을 더 많이 읽고 있다. 데이터 책을 읽는 것만으로는 데이터 분석을 잘하게 되지는 않는다. 다만 데이터 분석 시 염두에 둬야 할 내용들을 계속 스스로 상기하기 위해 데이터 관련한 책을 읽는다.


이 책은 스타벅스커피코리아 1호 데이터 사이언티스트이자 현재는 하이브 데이터랩 랩장인 차현나 데이터 팀장이 쓴 책이다. 이 책은 굉장히 쉽게 읽을 수 있다. 데이터 분석을 넘어 그냥 일을 하면서 느끼지만, 특정 분야에서 경험으로 아는 암묵지를 명시지로 풀어낸다는 것은 정말 그 분야에 대해 치열하게 고민하고, 깊게 생각하지 않으면 할 수 없는 일이다. 특히 명시지를 누구나 이해하기 쉽게 풀어쓰는 것은 더욱 어려운 일이다.


그래서 책을 읽으며 저자가 스타벅스와 하이브에서 얼마나 데이터 관련해서 치열하게 고민하고, 깊게 생각했는지를 느낄 수 있었다. 데이터 분석 입문 도서로 추천할 만한 책이다.


* 직접 구매해서 읽고 쓰는 내돈내산 후기입니다. :)




질문하기: 궁금한 것이 있어야 데이터 분석이 시작된다


1. 궁금한 것이 없는 사람들은 데이터 분석을 시작할 수가 없다. 궁금하지 않은데 왜 데이터를 찾고 분석하고 현상을 파악하겠는가? 궁금하지 않은 이유는 다양하지만 간단하다. 관심이 없거나, 지금 상황에 만족하기 때문이다. 지금 상황에 별 생각이 없으니 바꾸고 싶은 것도 없고, 나아지고 싶은 것도 없고, 문제점도 보이지 않는다. 지금 하는 일에 아무것도 궁금하지 않다면, 이 일을 하는 것 자체가 즐겁지 않을 확률이 높다.


2. 분석은 생각을 촘촘하게 채워가는 과정이다. 질문은 아는 것과 모르는 것을 명확히 하고 모르는 부분을 채워가는 시작점이다. 모르는 것을 채워가면서 생각을 단계적으로 분류하고 명확하게 만들 수 있다.



문장 쪼개기: 비전문가에게 가장 유용한 사고방식 훈련


3. 문장을 쪼갠다는 것은, 머릿속에 떠오른 질문을 데이터 단위로 분해하는 것이다. 이는 분석을 시작할 때 매우 유용하며, 데이터를 잘 모르는 사람도 연습할 수 있다.


4. 데이터라는 건 신기하게도, 하나의 질문을 채우고 나면 또 다른 궁금증이 생긴다. 때로는 그 과정을 멈추고 일단락 지어야 할 때가 있을 정도다. 꼬리에 꼬리를 무는 모든 질문에 답을 하다 보면 오히려 길을 잃을 때가 있기 때문에, 프로젝트의 규모와 기간에 맞추어 데이터 결과물을 정리하는 것이다.


5. 일상에서 문장 쪼개기 연습하기. 일상적인 일 사이에서 범위를 정하고, 의미를 구체화하면 나중에 데이터를 분석할 때 분명히 도움이 된다.



데이터 찾기: 어디서 어떻게 데이터를 확보할 것인가


6. 각자 처한 상황과 보유한 데이터에는 차이가 있다. 그리고 프로젝트마다 필요한 데이터가 달라진다. 중요한 것은, 그 데이터를 어떻게든 모으고 조합해 결과물을 내야 한다는 것이다. 어떤 방식으로 모으고 조합해야 하는지 정답은 없다. 지금 보유한 데이터로 최선의 결과물을 내면 된다. 평소 데이터를 최대한 많이 모아 정리하고 분석에 집중할 수 있는 환경을 만든다면 더 좋은 결과물을 많이 낼 수 있다.


7. 조직마다 구할 수 있는 데이터가 다르다. 어떤 데이터를 확보할 수 있는지 판단하고, 만약 권한이 없다면 얻을 방법은 없는지, 얻을 수 없다면 유사한 데이터로 대체하는 방법을 치열하게 고민해야 한다.


8. 4가지 데이터 유형. 작은 단위로 나뉘어진 의미 있는 데이터를 ‘로그 데이터'라고 한다. 어떤 사람이 모바일 앱을 클릭하고, 로그인하고, 상품을 둘러보고, 장바구니에 담고, 결제를 하고, 로그아웃을 하는 순간이 저절로 기록되는 것이 로그 데이터다.


9. 이 로그 데이터를 잘 정리해놓은 ‘데이터 테이블'이 있다. 이 테이블은 어떻게 정리하느냐에 따라서 크고 작은 단위로 얼마든지 만들어낼 수 있는데, 로그 데이터를 전처리한 것을 다시 정리할 수도 있다.


10. ‘대시보드', 혹은 비즈니스 인텔리전스라고 불리는 BI는 변형하기가 어려운 형태이지만 데이터를 모르는 사람도 잘 다룰 수 있다. 대시보드의 장점은 매일 보고 싶은 수치가 있을 때 만들어놓으면 일일이 데이터를 처리하지 않아도 된다는 점이다. 미리 정해 놓은 차트나 표로 데이터를 수시로 볼 수 있기 때문에 이상 신호나 변화를 감지하는 데 도움이 된다.


11. 일반인이 가장 접하기 쉬운 형식은 ‘보고서'다. 이미 어떠한 데이터 전문가가 데이터를 분석하고, 의미를 찾아 인간의 언어로 정리해놓은 문서다.



데이터 분석하기: 관점을 세우고 작은 것부터 시작한다


12. 데이터라는 커다란 개념에 빠져 허우적거리기보다는 특정 분석 주제를 가지고 시작해야, 훨씬 빠르게 구체적인 결과물을 손에 쥘 수 있다. (p.52)


13. 빅데이터로만 성과를 낼 수 있는 것은 아니다. 데이터로 의사결정을 하는 조직문화, 데이터로 성과를 내려고 하는 의지는 데이터의 크기와 무관하다. 조직 내에 데이터가 전혀 없어도, 검색으로 얻은 데이터를 활용해서라도 자신의 의사결정에 확신을 가진 사람이라면 데이터로 성과를 낼 수 있다.


14. 데이터는 모두에게 도움을 준다. 그러나 데이터로 아무나 성과를 내는 것은 아니다. 기술의 장벽이나 어려운 모델링, 더 나은 실력만으로 데이터 성과를 평가할 수는 없다고 생각한다. 아주 작은 데이터라도 잘 활용해 더 나은 의사결정을 했다면 그 데이터는 살아 있는 데이터다. 살아 있는 데이터가 될 수 있도록 활용하는 사람이, 데이터로 성과를 낼 수 있다.


15. 크게 보고 작게 시작한다. 여러 관점에서 데이터를 분석하면 하나의 숫자가 절대적으로 맞지 않는다는 것을 알게 된다. 혹은 하나의 숫자 혹은 지표가 여러 관점에서 보아도 의미 있는 숫자라는 것도 알게 된다.


16. 데이터 분석은 큰 관점부터, 작게 시작해야 한다. 우선 큰  관점부터 만들어보자. 데이터 중 가장 구하기 쉽고 전체를 조망할 수 있는 숫자를 펼쳐보기를 권한다. 작게 시작하자는 것은, 일단 아주 간단한 라인 차트부터 만들어보자는 말이다.


17. 성장 가능한 데이터 분석을 하려면, 일단 아주 간단한 것부터 직접 그려보는 것에서 시작해야 한다. 테이블 하나로도 다양한 차트와 관점으로 분석이 가능하다는 것을 직접 경험해보아야 한다. 거기서부터 시작해야 더 나아간 분석을 할 수 있다.


18. 누구나 쉽게 데이터에 접근하기 때문에 자꾸 어려운 데이터 분석의 영역도 자신이 직접, 아니 금방 할 수 있을 것이라고 착각하는 경우가 많다. 그러나 어려운 모델을 만드는 일은 여전히 전문가의 영역으로 남을 확률이 높다.



데이터 퍼즐 맞추기: 낱낱의 분석을 모아 인사이트를 만든다


19. 하나의 숫자만을 이용하는 경우엔 편협한 사고를 하게 되거나, 미처 다른 측면을 보지 못할 수 있다.


20. 아주 흔히 듣는 질문 중에 ‘어떤 지표나 어떤 데이터 소스를 많이 활용하느냐'는 것이 있다. 이런 질문을 하는 사람은 데이터 분석을 단편적으로 바라보는 것이다. 하나의 숫자만으로 ‘짜잔!’하고 변화가 일어난다고 믿는 것이다.


21. 데이터로 스토리텔링을 해야 한다. 우리는 데이터를 통해 속담과 같은 하나의 인사이트 넘치는 문장을 발견하길 원한다. 그러나 그 속담은 한순간에 만들어진 문장이 아니다. 수많은 결과물이 쌓여 하나의 이야기가 되고, 그 이야기의 핵심이 다시 한 문장의 속담처럼 전해지게 되는 것이다.


22. 한 단위의 데이터 분석을 통해 인사이트 넘치는 속담을 얻을 것이라고 기대하지 말자. 여러 단위의 분석을 진행한 뒤에, 그 분석을 이어 이야기를 먼저 만들어보자. 이야기를 만들어가면서 미처 생각하지 못한 점, 변화를 이끌어낼 지점을 찾아내는 연습을 해야 한다.


23. 데이터로 스토리텔링을 한 다음, 실제로 시장에 적용한 뒤 성공을 해야 속담이 만들어진다. 데이터에 대한 경험이 낮은 개인/기업이 처음부터 데이터로부터 엄청난 인사이트가 나올 것이라고 기대하면 거듭되는 실망 속에 제자리걸음만 하게 된다.


24. 분석 결과 분류하기. 낱개의 분석을 진행했다면, 이제 분석 결과를 분류한다. 이 낱개의 분석 결과 중 비슷한 것, 흐름상 인접한 곳에 놓여야 하는 것을 분류해야 한다.


25. 분류한 내용 재배열 하기. 낱개의 분석 내용을 분류했다면, 이제 숫자로 하는 분석이 아닌 인문학적인 머리로 생각할 시간이다. 이 낱개의 분석들이 가리키는 방향은 무엇인가? 이 분석 내용과 저 분석 내용은 서로 상충되는데, 잘못된 것은 없는가? 이런 생각이 정리되도록 분석 결과를 재배열한다. 논리적으로 이야기가 정리될 때까지 이리저리 분석 결과를 맞춰보는 과정이 필요하다. 따라서 이 과정을 ‘퍼즐 맞추는 단계'라고 표현한다.


26. 이 퍼즐을 맞추는 과정의 역량 차이는 분석 경험의 차이라고도 볼 수 있다. 분석 결과를 우리 회사나 내 사업에 적용하도록 논리적으로 사고하는 것은 하루아침에 되는 일이 아니다. 경험이 없으면 퍼즐 맞추기가 매우 어렵게 느껴진다.


27. 퍼즐을 맞추다 보면 반드시 빈 부분이 보인다. 이때 추가 분석을 진행한다. 데이터는 참 신기하게도, 하나의 궁금증에 대한 답을 찾고 나면 또 다른 질문이 생긴다.


28. 그 질문들에 답을 하다 보면 어느 순간 스스로 숫자에 잠식되고 만다. 어디서 끝내야 할지 모를 정도로 수많은 질문과 데이터 분석 결과물 사이에 매몰된다. 그럴 때는 기한 안에 할 수 있는 질문과 답의 단위로 한계를 정해주어야 한다. 끝없이 생기는 질문에 끝없이 답하다 보면 성과를 낼 수 있는 데이터 결과물을 만들기 어려워지기 때문이다.


29. 가장 중요한 것은 데이터에서 얻은 인사이트를 배경으로 시장의 변화를 이끌어내는 액션을 실행하는 것이라는 점을 잊지 말자.



변화를 만들 제언하기: 스토리로 방향을 제시한다


30. 데이터 분석을 하고, 맥락을 알아내는 것만으로는 충분하지 않다. 물론 아는 것과 모르는 것은 천지 차이다. 아는 것만으로도 의미 있는 것이 있다. 그러나 알고 난 뒤에는 행동을 해야 한다. 그 행동이 변화를 가져오고, 그 변화로 인해 기업과 사업이 유지된다.


31. 자신이 하는 의사결정이 어떤 의미인지 제대로 알고 확신하는 것이 중요하다. 자신이 데이터를 기반으로 이해를 하고, 자기 의사결정에 확신을 갖기 위해 데이터를 본다고 해도 과언이 아니다.


32. 그래서 기계가 대신 하든, 외부 컨설팅을 맡기든, 이 블랙박스의 전체 그림은 알 필요가 있다. 어떤 데이터가 들어가고 어떤 데이터가 나오는지는 이해해야 한다. 블랙박스 안의 내용을 몰라도 되는 세상은 오겠지만, 앞과 뒤의 의사결정은 여전히 인간의 몫이다. 따라서 데이터를 이해하고 사고할 줄 아는 역량은 더욱 중요해진다.


33. 중요한 것은 데이터로 어떤 의사결정을 하느냐다. 데이터를 보고 방향성을 어디로 잡고, 어떤 변화를 제언하는지가 데이터 분석의 최종적인 결과물이 될 것이다. 이 변화를 위한 핵심을 잡아내는 인력이 데이터 분석 역량을 가진 사람이라고 볼 수 있다.


34. 변화를 위한 제언을 하는 것은 균형을 잡는 일과 비슷하다. 우선 너무 뜬구름 잡는 이야기를 해서는 안 된다. 데이터를 바탕으로 구체적이고 현실적인 제언을 해야 한다.


35. 방향성과 디테일, 그 사이의 균형. 데이터 제언을 한다는 것은 모순된 요청사항 사이의 균형을 잡는 일과 같다. 너무 두루뭉술해서도 안 되고, 너무 지엽적이거나 현장의 전문성을 침해해서도 안 된다. 그러면서도 현장의 변화를 가져올 만한 구체적인 제언을 한다는 것은 정말 어려운 일이다. 그래서 분석 경험이 많은 사람이 잘 해낼 수 있는 영역이라고 보는 것이다.



데이터에 옷 입히기: 청자에 맞추어 스토리를 공유한다  


36. 반복적으로 확인 가능한 데이터는 단순 추출보다는 대시보드를 적극 활용해야 한다. 데이터 전문가가 단순 반복 추출을 하는데 공수를 들이는 시간을 최소화하기 위해, 조금 더 시간을 들여 아예 대시보드를 만드는 것이다.


37. 데이터 결과물을 문서로 전달해서 이해하고 활용한다면 좋겠지만, 실제로 변화를 만들어내기 위해서는 이해관계자가 한데 모여 논의하는 과정이 필요하다.



액션 아이템 만들기: 구체적이고 실현 가능한 플랜을 만든다


38. 데이터로 제언을 한 후, 실제로 ‘무엇을 할지' 액션 아이템을 만들어야 한다. 사실 이 부분은 데이터 전문가보다는 실무 전문가가 더 잘한다. 제품 개발, 마케팅, 소비자에게 전달하는 방식과 홍보 방법 등이 액션 아이템에 속하기 때문이다.


39. 데이터로 제언을 만든 다음, 반드시 액션 아이템을 만드는 실무 협의를 진행해야 한다. 그러지 않으면 데이터는 상식으로 끝나버린다. 이는 ‘데이터 기반 의사결정'이 실행되는 중요한 단계로 실제 시장에 나아갈 방법을 구체화하는 단계다.


40. 방향성과 로드맵을 구체화하라. 의사결정 지점마다 데이터를 통해 좀 더 확신을 얻는 것이 ‘데이터 기반 의사결정'의 태도라고 볼 수 있다.


41. 데이터 기반 의사결정을 하고자 하는 기업의 문화나 관련 프로젝트에서 가장 중요한 것은 ‘의사결정자의 의지'다.


42. 모두가 있는 자리에서 열린 토론을 한다. 내 경험상, 대표 및 팀장 이상의 의사결정자가 모두 배석한 자리에서 공론화되어 토론을 진행할 때 가장 강력한 성과를 낼 수 있었다.


43. 데이터에 반감을 가진 논의조차도 의미가 있다. 객관적으로 자료가 부족한지, 프로젝트를 진행하는 데에 반감이 있는 조직은 어디인지, 어려움이 무엇인지 허심탄회하게 이야기하는 자리가 될 수도 있다. 데이터가 부족하다면 피드백을 듣고 궁금한 점을 추가로 분석하면 된다. 만약 이 추가 분석을 끝없이 제공해도 지속적으로 반대 의견을 내놓는다면, 막연히 데이터를 두려워하는 조직이 어디인지 분명하게 드러난다. 데이터 자체를 거부하고 경험만으로 업무를 진행하겠다고 고집을 부리는 조직은 장기적으로 도태될 수밖에 없다.


44. 액션 아이템은 실현 가능해야 한다. 방향성을 골자로 하는 제언과 달리, 액션 아이템은 실제 실행을 염두에 두고 구체적으로 작성해야 한다. 실행 기한이나 일정도 병기하는 것이 좋다.


45. 현장의 변화 만들기: 시장에 실제로 적용하고 데이터화한다. 데이터를 기반으로 인사이트를 얻고, 제언하고, 액션 아이템을 기획했다면 이제 실제로 시장의 변화를 시도해볼 차례다. 거창한 변화를 가져오라는 것이 아니다. 데이터로 의사결정을 했을 때 실제로 무엇이 검증되는지 체득하는 과정이라고 생각하면 된다.


46. 극단적으로 말하면, 데이터를 기반으로 기획한 액션 아이템이 실패할 수도 있다. 그렇지만 감수할 수 있을 정도의 실패를 미리 각오하고, 왜 성공하고 실패했는지 데이터로 바라본다는 자세로 실행에 옮겨야 한다. 실패했다고 다시는 데이터로 프로젝트를 기획하지 않겠다는 생각은 하지 않는 것이 좋다.


47. 실제로 데이터와 현실이 잘 맞지 않는 경우가 간혹 있다. 이럴 때 어떤 점을 간과했는지, ‘질문-데이터-분석-인사이트-제언-액션 아이템-현실' 사이에서 어느 지점이 잘못되었는지 파악해야 한다. 다시 말하지만, 잘못은 언제든지 발생할 수 있다. 그래서 최대한 많은 데이터를 찾고 퍼즐을 맞추어 잘못된 부분이 최소화되도록 노력해야 하는 것이다. 그럼에도 불구하고 실패했다면, 원인이 무엇인지 알아야 한다. 실패의 원인을 알아야 다음의 실패를 피할 수 있기 때문이다.


48. 현장의 목소리를 들어야 한다. 데이터로 보는 것보다 실제로 체감하는 경험을 무시할 수 없다. 제품을 만드는 데 어떤 부분이 불편한지, 어떻게 하면 효율적으로 운영할지 알아내기 위해 생각하는 과정이 필요하다. 이때 다른 사람이 만든 데이터가 필요하다기보다는 오히려 자기 경험을 데이터화하는 과정이 필요하다.


49. 개성을 지키기 위해 고집부려야 할 부분과 개선할 부분을 구분해야 한다. 아무리 오래 걸려도 지켜야 할 것이 있고, 효율을 위해 개선할 것이 있다. 이 모두는 데이터로 가시화할 수 있고, 스스로 생각하는 능력을 키워나가는 데 도움이 된다.


50. 소비자의 반응 포착하기: 성과를 검증하고 성장 동력으로 삼는다. 현장에서 느끼는 소비자의 반응은 데이터만으로 알아낼 수 없는 부분을 메울 수 있는 소중한 정보다.


51. 소비자의 반응은 바로 매출과 직결된다. 얼마나 매출을 올렸는지도 중요하지만, 왜 그 매출이 나왔는지를 뜯어보아야 한다. 따라서 기획 의도에 대한 측정 방법도 미리 기획해 놓는 것이 좋다. 기획대로 되었는지 확인하고 검증할 방법을 마련해두는 것이다.


52. 기업에겐 소비자가 가장 소중하다. 소비자를 알기 위해 데이터를 분석하다고 해도 과언이 아니다. 매출 분석은 결국 그 돈을 지불한 소비자에 대한 이해가 근본이 되어야 한다. 소비자의 반응을 빨리 잡아채야, 무엇이 잘되고 있고 잘못되고 있는지 알 수 있다.


53. 소비자를 알기 위해 힘껏 애써야 한다. 소비자를 조종하기 위해서가 아니라, 소비자가 무엇을 원하는지 알기 위해서다. 소비자가 원하는 것을 제공하고, 소비자가 귀찮아하거나 싫어하는 점을 알아내 제품과 서비스를 개선해야 한다.


54. 따라서 제품이나 서비스 출시와 함께 소비자의 반응을 잡을 방법을 미리 기획해 놓아야 한다. 나중에 알려고 해도 흘러가버린 소비자의 반응을 잡지 못하는 일이 생긴다. 소비자의 어떤 반응이 원하는 반응인지 미리 기획하고, 반응을 집계하기 위한 방법도 고안해놓아야 한다. 그래야 데이터로부터 나온 제품과 서비스의 성과를 정확하게 측정할 수 있다.


55. 성과 리뷰 세미나를 다시 한번 열자. 누구 한 사람의 책임을 묻고자 하는 자리가 아니라, 소비자의 마음을 어떻게 얻었고 왜 얻지 못했는지 회고하는 자리다. 데이터가 자신을 돕는 것이 아니라, 잘잘못을 따지고 질책하는 수단이라고 생각한다면 데이터를 가지고 다시 일하고 싶어지지 않을 것이다.


56. 성과 리뷰 세미나에 담길 주요 내용은 실적을 기본으로 하되, 애초에 기획했던 내용에 대한 검증이 주가 되어야 한다. 우리가 타깃으로 했던 소비자가 실제로 구매를 했는지, 실적은 좋았지만 의외로 우리가 타깃으로 했던 소비자가 아니라 다른 소비층을 건드린 것은 아니었는지 등을 검토한다.


57. 소비자의 반응을 다시 한번 확인해야 데이터가 새로운 성장 동력이 된다. 성공과 실패 여부를 떠나, 기업이 소비자 중심으로 더욱 발전하는 모습으로 변모할 수 있다.


58. 데이터가 개인의 성과를 측정하고 책임을 묻는 데 사용된다는 조직 분위기를 없애야 한다. 데이터 자체에 대한 거부감과 두려움이 생기기 때문이다. 데이터에 대한 거부감을 들여다보면, 의사결정자가 질책하는 것에 대해 두려움을 느끼는 경우가 많다. 이 두려움 탓에 데이터 활용이나 데이터 조직의 활동 자체를 거부하거나 비협조적인 자세가 나오기도 한다. 이를 바꾸기 위해서는 다시 한번, 의사결정자들의 과감한 결단과 의지가 필요하다. 단순하게 직원의 실적과 순위 매기기 수단으로만 데이터를 사용한다면, 그 조직에서는 앞으로도 데이터가 잘 활용되기 어려울 것이다.


59. 따라서 기업이 더 나은 방향으로 나아가기 위한 성장 동력으로 데이터를 가감 없이 활용하는 것을 명시하면서, 평가 수단으로 사용하지 않으려고 노력해야 한다. 데이터가 사람을 위해 일하는 것이지, 데이터가 사람을 평가하고 괴롭히는 존재라고 인식되어서는 안 된다.

매거진의 이전글 중요한 건 운이 올때까지 버틸 수 있느냐는 거예요
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari