《데이터 분석가의 숫자유감》 리뷰
데이터 분석가의 숫자유감
저자 권정민(지은이), 주형(만화)
출판사 골든래빗
출간일 2021.08.10
페이지 344
데이터 분야에서 일하면서 가끔 통계의 벽에 부딪힐 때가 있다. 사실 데이터 분야에서 통계 지식은 아주 중요하다. 도메인에 따라 추가적으로 필요로 하는 지식이 다를 수는 있지만 일반적으로는 개발이나 통계 베이스를 선호한다. 개발 관련 지식을 배울 수 있는 기회는 많은 반면 통계는 그렇지 않다. 우선 데이터 문해력을 키우고 싶었던 와중에 데이터리안의 추천으로 이 책을 만났다.
결론적으로 말하면 책 표지에 있는 '만화로 배우는 업무 데이터 분석 상식'이라는 소개에 걸맞은 책이다. 업무에서 데이터를 접할 때 빠지기 쉬운 함정(?)을 에피소드 형식으로 풀어냈는데, 이 함정의 내용이 현실에서 정말 자주 일어나는 오류들이라 무한 공감을 하면서 읽었다.
주로 데이터 분석가인 권대리가 데이터 분석에 대해 잘 모르는 마케팅 본부장에게 알기 쉽게 설명해서 이해시키는 흐름으로 각 장이 이어진다. 읽으면서 재미있었던 건, 어떤 에피소드에서는 권대리에게 이입했다가도 어떨 때는 마케팅 본부장처럼 데이터를 잘못 파악했던 경험이 떠오르기도 했다는 점이다. 양쪽의 입장을 모두 이해하는 사람으로서, 이들 사이의 간극을 잘 좁혀주는 사람이 되고 싶다는 생각이 들었다.
통계적 지식이 전혀 없는 사람이 읽어도 이해할 수 있게끔 현업에서 흔히 일어나는 사례를 들어 설명하고 있어서 책장 넘기는 속도가 엄청 빨랐다. 실제로 매일 고객 데이터를 가지고 업무를 하는 입장에서 공감 가는 내용이 많았다.
상관관계와 인과 관계는 다르다는 것, 별점을 매기는 기준이 천차만별이기 때문에 정량적 데이터 분석의 대상으로 삼기엔 어렵다는 것, 확률은 지나간 사건의 결과를 보상해주지 않는다는 것(가챠 아이템을 여러 번 돌린다고 해서 희소 아이템이 나올 확률이 올라가는 것은 아니라는 것) 등 머리로는 어렴풋이 알고 있었지만 명확하게 정리되지 않았던 개념들도 여럿 실려 있어서 도움이 되었다.
책의 마지막 부분에서 데이터 문해력을 다루고 있는 점도 인상적이었다. 너도나도 데이터의 중요성을 말하는 시대다. 그만큼 자칫하면 사실을 더 효과적으로 왜곡시키는 도구가 될 수도 있다. 언론사의 의도적 그래프 오용 사례는 물론 객관적인 것처럼 '보이는' 숫자를 방패로 잘못된 논리를 주장하는 경우도 허다하다. 데이터가 객관적이라는 건 환상이다. 데이터를 분석하는 방법과 기준은 다양하고, 그중에서 어떤 것을 선택하는지에 따라 완전히 다른 결과를 볼 수 있다. 데이터 분석가가 아니어도 데이터 문해력이 필요한 이유다. 여러 모로 즐거운 독서였다.