'데이터 분석 공부하는데 읽으면 좋은 책 추천해주세요', '데이터 공부 어떻게 해야되는지 자료 추천 해주세요'라는 말을 많이 듣습니다. 그때마다 yes24를 뒤적이며 링크를 보내드렸는데요. 뒤적이던 링크들 중 제 책장에 아직도 살아남아있는 책 몇 권을 소개해보려고 합니다.
책을 추천하는 대상은 '데이터를 공부하는 사람들'입니다. 데이터 분석가가 아니더라도 요즘엔 데이터 공부하는 사람들이 많습니다. 기획자도, 마케터도, 개발자도 데이터를 보면서 일하는 세상이잖아요. 그래서 추천 대상을 '데이터 분석가가 되고 싶은 사람'으로 좁히지 않았고, 추천하는 책들 또한 쉽고 재미있는 입문서를 위주로 담았습니다.
중학교 수준의 수학만 알면 쉽게 시작할 수 있고, 무엇보다 통계학 책처럼 안 생겨서 좋아합니다. 평균, 분산, 표준편차, 정규분포, 가설검정 등 데이터 분석을 하는데 필요한 통계 지식은 다 들어있습니다.
"A/B 테스트에 대해서 이해하려면 어느정도 통계학 지식이 있으면 될까요?"
라는 질문을 종종 받는데, 그 때마다 이 책을 추천하고 있습니다. 그리고 '평균'보다는 '분산'에 대해서 자세하게 설명해놓은 저자의 신념이 마음에 들었습니다. 건조하게 쓰여진 통계학 책 보다는 이렇게 저자의 스타일이 드러나는 책이 훨씬 재밌게 읽히는 것 같아요.
이 책을 읽어보고 '뭐야 통계학 할 만 하잖아?' 하신 분들에게는 서울대 경제학부 류근관 교수의 <경제통계학 1부 : 그림과 수치를 이용한 자료의 정리> 강의를 들어보시는 것을 추천합니다. K-MOOC에서 무료로 들으실 수 있고 1부 이후로 <경제통계학 2부 - 통계적 추론을 위한 개념, 도구, 사례>, <경제통계학 3부 - 표본조사와 통계적 추론> 까지 알차게 구성되어 있습니다. 개인적으로는 통계학과에서 가르치는 통계학보다 경제학과와 같이 응용 분야에서 가르치는 통계학이 더 재미있다고 생각합니다.
다음 책은 현재 마이리얼트립 그로스실 실장으로 있는 양승화님이 쓰신 『그로스 해킹: 데이터와 실험을 통해 성장하는 서비스를 만드는 방법』 입니다. 데이터를 통해 서비스를 어떻게 성장시킬 수 있는지 기본기를 다질 수 있는 책입니다. 브런치를 운영하시니까 책 읽을 때 같이 둘러보시면 도움이 많이 될 것 같습니다.
AARRR, 리텐션, Stickiness, LTV 같은 그로스 분석 용어들에 익숙하지 않다면 꼭 첫 책으로 읽어보시길 추천합니다. 설명이 쉽고 자세해서 사전지식 없이도 이해할 수 있다는 것이 장점입니다. 개인적으로 처음 읽을 때 AARRR 파트 중에서 Acquisition 파트는 흐린 눈을 하고 대충 읽었었는데, 데이터리안 법인을 세우고 다시 한 번 읽으면서 많이 배웠습니다. 인프런에서 강의로도 같은 내용을 보실 수 있습니다.
세 번째 추천 책은 『린 분석: 성공을 예측하는 31가지 사례와 13가지 패턴』 입니다. 데이터 분석 공부하는 사람들이라면 한 번쯤은 꼭 들어봤을 책이지만, 막상 펼치려니 엄두가 안나서 미뤄두기도 많이 미뤄두기도 하는 것 같습니다. 그럴 때에는 스터디를 만들어보는건 어떨까요? 저는 스터디에서 일주일에 한 챕터씩 요약을 맡아 3~4명의 스터디원들과 함께 읽었을 때 이 책을 처음으로 끝까지 읽을 수 있었어요. 그리고 그런 노력을 한 보람이 있는 책이라는 생각을 했습니다.
OMTM(One Metric That Matters), 인게이지먼트(Engagement), 사용자 이탈(Churn), 인게이지먼트 퍼널(Engagement Funnel), 전환율(Conversion Rate), CTR(Click Through Rate), MVP(Minimum Viable Product) 등 전문 용어의 홍수 속에서 살아남고 싶다면 또는 내가 분석하고 있는 이 서비스가 가장 효율적인 경로로 빠르게 성장하기를 바라고 있다면 꼭 읽어보길 바랍니다. 숫자가 비즈니스에서 얼마나 정확한 나침반 역할을 해 줄 수 있는지, 소모적인 논쟁 끝에 나오는 의사결정이 아니라 진짜 임팩트를 내는 의사결정은 어떤 분석 끝에 나오는지 힌트를 주는 책입니다.
『데이터 분석가의 숫자유감』은 데이터 분석 업무 상식(?) 만화입니다. 업력이 긴 데이터 분석가님이 쓰셔서 그런지 에피소드 하나하나 주옥같습니다. 만화로 그려서 술술 넘어가는 것이 장점입니다. 에피소드들도 회사에서 진짜 있을만한 이야기들로 꾸려져있어 데이터 분석가라면 과몰입에 주의하시길 바랍니다.
개인적으로는 사용자의 인구 통계에 기반한 데이터 분석과 의사결정이 왜 낡은 분석인지, 그렇다면 앞으로는 성연령이 아니라 어떤 데이터를 봐야하는지에 대해서 이야기하는 <10화. 인구통계학 정보의 효용성: 이 광고는 30대의 여성을 대상으로 타기팅했습니다?>를 재밌게 읽었습니다.
p235
인구 통계학 정보는 간단하고 모두가 이해하기 쉬워서 어디에나 잘 통용되어 왔다. 그러다 보니 과거에는 이를 사용한 전략이 그럭저럭 유효했고, 인구통계학적 페르소나를 굳이 깰 필요가 없었다. 하지만 오늘날 많은 서비스는 온라인 상에서 이루어지고, 그 위에서 활동하는 소비자들은 자신들이 무엇에 관심을 가지고 있고 무엇을 하고 싶어 하는지에 대한 데이터를 끊임없이 흘리고 있다. (중략) 하지만 많은 사람들이 기존의 손쉬운 인구통계학적 페르소나에 갇혀, 많은 기회를 흘려보내고 있다.
앞으로도 한국에 있는 데이터 분석가들이 책을 많이 내주면 좋겠어요. 데이터리안도 힘내보겠습니다(?)
마지막으로 추천하는 책은 『헬로 데이터 과학』 입니다. 'MS 본사 데이터 과학자가 알려주는'이라는 수식어가 붙어있는데 지금은 네이버 서치 데이터 과학 & 분석팀 팀장으로 있는 김진영님이 쓰신 책입니다. 역시 개인 블로그를 운영하고 있습니다. 최근에 저자가 데이터 분석 또는 데이터 분석 조직과 관련해 어떤 고민들을 하고 있는지 업데이트가 자주 올라오니 책 보다는 최신 소식이 궁금하신 분들은 블로그부터 둘러보셔도 좋을 것 같습니다.
엑셀로 예시를 적어놓아서 누구나 쉽게 따라할 수 있지만 내용은 가볍지 않습니다. 데이터 분석 포트폴리오를 만들고 싶은 학생분들에게도 좋은 아이디어 창고가 되어줄 것 같네요. 업무에서 사용하는 데이터 분석 뿐만 아니라, 생활에서도 데이터 분석을 녹여보고 싶은 분들에게도 추천합니다. (저는 업무로 데이터 분석을 하는 사람이라서 과연 생활에서까지 데이터 분석을 하고 싶은 사람이 정말로 있는가...! 커다란 의문이 있긴 하지만요.)
우리가 하는 데이터 분석은 실험실 데이터가 아닙니다. 사용자들은 통제된 실험실과는 달리 우리 마음처럼 움직여주지 않습니다.
이런 상황에서는 '이 실험이 통계적으로 엄밀하게 설계되었냐?'보다도 '지금 이 실험을 하는게 맞냐?'는 질문이 종종 훨씬 중요합니다. '이 실험의 결과가 통계적으로 오차 범위 이내인가?'보다 '이 정도 차이면 감수하고 B로 결정할 수 있냐?'라는 질문이 더 중요한 순간도 매일 찾아옵니다. 그렇기에 데이터를 공부하는 사람들에게 추천하는 책 목록은 기초 통계학 책 뿐만 아니라 이 숫자들을 비즈니스에 어떻게 활용할 것인지에 대한 책들을 아울러야겠다고 생각했습니다.
'데이터... 중요하다고는 하는데 어떻게 공부해야 할지 잘 모르겠다.'고 생각하며 길을 잃은 것 같다고 느끼는 분들에게 도움이 됐기를 바랍니다. 그리고 제가 좋아하는 이 책들이 여러분들에게 어떻게 읽히고 있는지도 궁금합니다. 댓글이나 contact@datarian.io 계정으로 책 읽어본 후기 보내주시면 재밌게 읽어보겠습니다.
더 다양한 실무자들의 데이터 분석 사례, 실무 노하우, 커리어 이야기가 듣고 싶으신가요?
월간 데이터리안 세미나 이번 달에는 어떤 주제로 진행되는지 궁금하시다면, 아래 링크를 확인해주세요.
이번 기회에 데이터 분석 체계적으로 공부해보고 싶으신가요?
퍼널 분석, 리텐션 분석 등 실무에서 자주 쓰이는 분석 기법을 한번에 배울 수 있는 GA4 데이터 분석 캠프, SQL 데이터 분석 캠프 커리큘럼을 확인해보세요.