한빛미디어, 이상석 지음
데이터에 관심을 가져오다, 최근 읽게 된 한빛미디어의 <데이터 드리븐 리포트>. 파이썬을 활용하여 데이터 실습도 할 수 있다. 무엇보다 왜 주니어가 읽기 좋은 책이라고 느꼈냐면, 회사 생활의 기본 중의 기본이라고 생각하는 보고서 작성법에 대해 데이터 관점으로 접근하여 보고서를 어떻게 써야 하는지 상세하게 알 수 있다.
여기저기서 '데이터 드리븐'을 외치고 있는데, 진짜 데이터 드리븐 보고서는 무엇일까? 숫자가 들어갔다고 해서, 직관과 경험을 배제했다고 해서, 어렵고 화려한 분석도구를 썼다고 해서 데이터 드리븐 보고인 것은 아니다. 데이터 드리븐 보고는 문제를 명확히 정의해 측정하고자 하는 것이 명확해야 한다. 그리고 문제 해결을 위해 작성한다는 것을 잊지 말아야 한다. 결론적으로 내가 풀고 싶은 문제를 정의하고, 문제 해결을 위해 숫자를 활용하여 직관과 경험을 녹여내는 것이 데이터 드리븐 보고다.
모든 데이터 드리븐 보고는 위 이미지와 같이 진행된다. 목표를 설정하고, 필요한 데이터를 선정하고, 적절한 분석 방법을 결정한 후 해석 및 검증 그리고 보고하는 과정이다. 이때 분석 목표 설정 과정이 굉장히 중요한데(실무에서도 피부로 체감하는 부분), 분석 목적이 무엇인지 확실히 알아야 출구를 안다는 부분이 인상적이었다. 분석에 대한 업무를 요청받았을 때, 상사와의 얼라인이 되어있지 않으면 다시 전체 과정을 거쳐야 한다는 점에서 '오버 커뮤니케이션'의 중요성도 알 수 있었기 때문이다. 책에서도 이 부분에 대해 '의사결정자에게 최대한 많이 질문하라'는 강조를 보면서 납득을 하지 않을 수 없었다.
이후에 계획서를 작성할 때에는 필수 요소를 확인할 수 있다. 데이터 분석 계획서에는 아래와 같은 항목들이 들어가야 한다.
범위 설정하기
어떤 범위까지의 데이터를 모을 것인지, 몇 년 간의 데이터인지, 대상은 어디까지인지
가설/목표 설정하기
'당신이 원하는 결과는 ~인가요?'를 확정하는 단계. 추론과 예측 또는 직관을 데이터로 검증하는 단계다. 간단한 시각화를 통해 인사이트를 해석할 수 있으면 좋다.
어떤 데이터를 사용할 것인지 정의하기
가설에서 설정한 종속변수(y), 독립변수(x)를 어떤 데이터에서 가져올지 설명한다.
분석 도구 설정하기
파이썬, R의 통계 라이브러리, 태블로 또는 파워BI를 활용해 데이터 시각화를 할 수 있다.
기대효과(정량/정성) 정의하기
- 정량적 기대효과 : 판매 수익, 고객 유지율 또는 웹사이트 트래픽의 변화와 같은 수치 또는 통계분석을 통해 측정됨
- 정성적 기대효과 : 고객 만족도, 브랜드 인지도 또는 직원 몰입 등으로 측정됨
---> 이해관계자에게 분석의 예상 효과를 명확하게 정의, 전달하는 것이 아주 중요하다.
이후에는 데이터를 선정하고, 분석 방법을 결정 및 해석, 검증하는 단계를 거치면 된다.
데이터 드리븐 보고 절차에 관해 전반적인 '데이터 드리븐 보고'에 대해 알았다면, 3장부터는 실습을 통해 본격적으로 데이터와 친해지는 시간을 가질 수 있다. EDA와 기술통계, 데이터 시각화, 가설검정, 선형회귀분석, 분류예측 등 여러 가지 데이터 이해 방법에 따른 분석법을 확인할 수 있다. 깃헙 활용, 중간 중간 ChatGPT를 활용해서 응용되는 모습들도 볼 수 있다. 전반적으로 "데이터 분석을 이런 툴로 이렇게 하는구나-" 알 수 있는 지점들이다. 개인적으로 EDA 및 토픽 모델링 등 처음 보는 개념들이 많았는데, 상세한 예시나 실습 과정을 통해 어떻게 결론을 도출해내는지 알 수 있어 매우 흥미로운 지점이었다. 데이터 분석에 대해 관심 있는 분들이 꼭 읽어봤으면 하는 부분도 여기에서 많이 느낄 수 있었다.
그러나 전문적인 데이터 분석을 해보지 않은 나로서는 마지막 4장 - 데이터 드리븐 커뮤니케이션 부분이 유독 인상 깊었는데, 이유는 다음과 같다. 우리가 결국 데이터 드리븐 리포트로 어떤 결과를 도출해내고, 어떤 목적을 달성하고 싶은가?와 연관되어 있기 때문이다. 데이터 드리븐 리포트로 결국 커뮤니케이션을 해야 하는데, 커뮤니케이션의 핵심은 인사이트가 있는 스토리를 전달하는 것이다. 내가 이 보고서를 통해 설득하고 싶은 것을 잘 설득할 수 있는지 확인하고, 그렇게 쓰는 것. 이것이 우리가 직장생활을 하면서 쓰는 보고서의 핵심과 모두 일맥상통하지 않을까.
그렇기 때문에 전반적으로 사회생활을 막 시작한, 주니어들이 읽으면 참 좋은 책이라고 느꼈다. 모든 프로젝트의 마무리는 보고서이지 않은가. 우리가 이 프로젝트를 왜 시작했고, 어떻게 진행했고, 그래서 결과는 어땠고, 다음번엔 어떻게 할 것인지를 보여주는 문서이기 때문에. 누구든, 보고서를 쓰는 것에 막막해있다면 거기다 데이터 분석에 대해 실습을 해보고 싶다면, 이 책을 추천한다.
https://m.hanbit.co.kr/store/books/book_view.html?p_code=B5932813354