마케터가 읽은 퍼포먼스 마케팅/데이터 분석 책 추천 2

by 이내

헬로 데이터 과학.jpg

제목 : 헬로 데이터 과학

저자 : 김진영

출판사 : 한빛미디어


책은 스몰 데이터로 기계학습이나 여러 사례를 바탕으로 생각하는 데이터 과학을 설명한다. 그리고 엑셀과 R로 데이터 과학을 살펴보고, 탐색적 데이터 분석 및 통계적 추론을 활용할 수 있도록 작성되어 있다. 필자는 기술로서의 데이터 과학보다 사고방식으로서의 데이터 과학을 강조하고 싶다고 말했다. 추가적으로 데이터를 가장 잘 활용할 수 있는 엑셀 활용법에 대해 잘 설명되어 있다. 생활 데이터와 엑셀로 추가적인 데이터 활용법을 확인할 수 있어서 좋았다. 개인적으로 이 책이 이론적인 부분과 함께 실무적인 내용도 포함되어 있어서 많은 도움을 얻을 수 있는 책이라고 생각이 들었다.


"BI(Business Intelligence)란 기업이 보유한 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스를 말한다. 문제 정의에서 시작하라. 스몰데이터로 시작하라. 주변에 있는 도구로 시작하라. 간단한 분석기법으로 시작하라.

데이터 분석 단계 ① 주어진 데이터를 탐색하며 다양한 패턴을 발견하고 가설을 세우는 단계(탐색적 데이터 분석) ② 현상에 대한 가설을 다양한 실험으로 검정해 보는 단계(통계적 추론) ③ 우리가 관심을 갖는 현상을 예측하는 단계(기계학습)

개인/공개 데이터로 공부하는 데이터 과학 : 문제 정의하기-데이터 수집하기- 탐색적 데이터 분석 (KOSIS홈페이지 등) / 데이터 검증-데이터 스토리텔링"


비즈니스 데이터 분석의 실무.jpg

제목 : 비전공자도 배워서 바로 쓰는 비즈니스 데이터 분석 실무 (엑셀 파워쿼리와 파워피벗을 활용한 업무 디지털 전환(DT) 성공 가이드)

저자 : 김진, 최정아, 이정주

출판사 : 마소캠퍼스


엑셀은 데이터를 수집하고 전처리, 분석, 시각화하는 데이터 사이언스의 모든 과정을 가장 쉽고 간결하게 수행할 수 있는 도구이다. 이 책은 엑셀의 강력한 도구인 피벗 테이블과 파워쿼리를 활용하여 기초적인 함수와 서식 기능으로는 다루기 어려운 복잡한 데이터를 제어하는 능력을 갖추도록 돕는다. 이 책은 엑셀 파워쿼리와 파워피벗 활용법을 알려준다.


BI란 기업이 보유한 수많은 데이터를 정리하고 분석하여 의사결정에 활용하는 일련의 프로세스를 뜻한다. BI는 크게 인프라, 정보전달, 전략, 분석, 확장의 5가지 영역으로 구성된다. 엑셀 BI의 첫 번째 요소는 파워쿼리이다. 파워쿼리는 다양한 유형의 데이터를 검색하고 연결 및 결합하여 분석에 적합한 형태로 전처리하는 전문 분석도구이다. 활용도가 높은 두 번째 요소는 파워피벗이다. 파워피벗은 방대한 데이터를 빠르게 분석하고 모델링한다. 파워피벗을 이용하면 속도 저하 없이 1억 건 이상의 데이터를 처리 가능하다.


엑셀 함수를 활용하면 어려운 공식으로 작성하여 적용해야 하지만, 책에서는 파워쿼리를 통해 간단한 데이터 정리를 할 수 있는 방법을 소개한다. 이렇게 책에는 회사에서 많이 사용하는 전처리 방법을 예시와 함께 설명하고 있어 이해하기 쉽게 읽을 수 있었다. 파워쿼리를 직접 활용하는 직장인이라면 바로 적용할 수 있을 정도로 사진과 함께 보여주고 있어 유용하다는 생각이 들었다.


엑셀에서 가장 많이 사용하는 함수는 바로 vlookup일 것이다. 이 함수의 문제점은 데이터를 물리적으로 연결하는 데서 기인한다. 각 셀의 데이터를 모두 한 자리에 모으기 위해 데이터를 중복 추가하고, 다량의 연산을 반복하며 부하가 걸린다. 결과적으로 몇십만 건 이상의 데이터를 처리하기 어려워진다. 따라서 엑셀은 물리적 마스터 데이터셋의 약점을 보완하여 셀 하나하나의 값이 아닌 필드 단위로 데이터를 논리적으로 연결하는 방법을 제공한다. 이렇듯 논리적으로 데이터를 연결하는 방식을 다른 말로 데이터 모델링이라 한다.

keyword
작가의 이전글밈에서 마케팅으로, 침착맨×롯데리아 콜라보 광고