제목 : 감으로만 일하던 김 팀장은 어떻게 데이터 좀 아는 팀장이 되었나 (비전공자를 위한 데이터 분석 속성 스쿨)
저자 : 황보현우, 김철수
출판사 : 한빛비즈
'왜 보통 직장인을 위한 데이터 분석 책이 없을까?'라는 질문에서 시작된 책이라는 소개글이 인상적이었다. 이 책은 통계학을 기반으로 데이터 분석에 대한 내용이 담겨 있다. 회귀분석, 변수 등 데이터의 내용과 함께 실제 적용 사례가 함께 나오다 보니 이해하는 데 어려움이 없었다.
이 책은 데이터 분석을 이용하여 해석하는 것을 중점으로 두고 있기 때문에 어떤 통계학 식을 확실히 이해하고 외우는 것에 초점을 두고 있지는 않다. 통계식을 어떻게 회사 안의 데이터에 접목하여 해석할 수 있을지가 관건이다. 그래서 비전공자이지만 데이터를 잘 알고 싶고 데이터 분석을 업무에 접목하고 싶다면 꼭 필요한 책이라고 생각한다.
책에서는 데이터 분석에서 중요한 것은 프로그래밍이나 알고리즘, 소프트웨어가 아니라, 현상을 현실에 맞게 해석하고 의사결정에 반영하는 일임을 강조한다. 책에서는 회사 내 인사총무팀, 해외영업본부, 비서실, 회원관리팀 등 여러 부서의 데이터 문제를 해결하면서 데이터 분석 방법론을 배우는 과정을 담았다. 로지스틱회귀, 의사결정나무, k-평균 군집 분석, 주성분 분석 등 다양한 분석 방법론을 통해 현장에서 어떤 문제를 해결할 수 있는지, 그리고 데이터 분석 시에 어떤 이슈에 주의를 기울여야 하는지를 익힐 수 있다.
"예측은 결과를 맞히는 게임이고, 추론은 원인과 결과 간 관계를 파악하는 게임이다. 추론은 직관에 의한 추론과 데이터 분석에 근거한 추론으로 나뉜다. 직관에 의한 추론은 방향이나 현상을 대략적으로 설명할 수 있다. 데이터 분석에 근거한 추론은 그러한 방향의 기울기나 현상의 변화 정도를 구체적인 값으로 제시할 수 있다. 비즈니스에서 합리적인 의사결정을 하려면 데이터 분석에 근거한 추론을 해야 한다."
제목 : 데이터 분석의 힘 (많은 숫자들은 어떻게 전략이 되는가)
저자 : 이토 고이치로
출판사 : 인플루엔셜
작가는 '데이터 분석을 위해서는 어떤 사고법과 기술이 필요할까?'라는 질문과 함께 무엇보다 '일반인이 쉽게 이해할 수 있는 입문서가 있다면 유용하지 않을까'하는 생각에서 이 책을 쓰게 되었다고 한다. 이 책은 필자가 보스턴에서 활동하는 일본인 연구자들의 모임에서 강연한 자료를 바탕으로, 시카고대학에서 강의하고 연구한 내용을 덧붙인 것이다. 말하자면 경제학의 실증 분석 분야를 구체적인 방법론과 사례에 초점을 맞추어 작성되었다고 한다.
이 책을 읽고 인과관계와 상관관계에 대해 다시 생각해 보게 되었다. 마케터 일을 하면서 데이터를 확인하고 해당 데이터를 바탕으로 제안할 때, 인과관계가 얼마나 중요한지 잘 알고 있다. 어떠한 인과관계로 해당 제안을 진행하는지 정확히 표현하는 것이 매우 중요하다고 생각한다. 이러한 나의 고민과 생각의 폭을 넓혀준 것이 바로 이 책이었다. 내가 왜 제안하는 것에 힘이 들었고 고민이 많았는지, 인과관계에 대해 다시금 생각해 볼 수 있었고, 여러 사례를 통해서 어떤 데이터를 보고 분석을 해야 할지 팁을 얻을 수 있었다. 데이터 분석을 다시 확인해보고 싶을 때 다시 읽어볼 것이다. 데이터 분석의 첫걸음을 떼고 싶은 분들, 그리고 통계 식은 잘 모르지만 데이터 분석으로 일을 하고 싶은 분들에게 추천하고 싶다.
"인과관계를 입증하기 어려운 이유로는 다른 요인이 영향을 미쳤을 가능성이 있고, 인과관계가 반대일 가능성이 있으며, 인과관계는 상관관계와 다르기 때문이다. 즉, 비즈니스 현장에서 의사결정의 열쇠가 되는 것은 인과관계이지 상관관계가 아니다.
인과관계를 오인하면 문제가 되기 때문에 상관관계와 인과관계를 구분하는 방법을 사용한다. 잠복변수 V(분석에서 놓치거나 고려하지 않은 변수)를 최대한 모은 다음 통계분석에 의해 V의 영향을 배제하는 것이다. 하지만 한계가 존재한다. 문제는 데이터 수가 아니라 편향이다. 빅데이터는 지금까지 설명한 인과관계의 문제를 근본적으로 해결해주지 않는다. 지금까지 설명한 인과관계의 문제는 통계학 용어로 편향(bias)이라고 불린다. 영어 바이어스(bias)를 직역하면 '분석으로 얻은 추정치의 치우침'이라는 뜻이다. 인과관계를 측정하는 가장 좋은 데이터 분석 방법인 RCT(무작위비교시행) : A와 B 집단을 비교한다는 의미에서 A/B 테스트라고 부른다."
제목: 데이터 쓰기의 기술 (따라 하면 끝나는 단계별 데이터 분석 10)
저자 : 차현나
출판사 : 청림출판
이 책과 같은 시리즈인 <데이터 읽기의 기술>에서 아쉬운 마음에 읽었던 <데이터 쓰기의 기술>! 데이터 읽기 책은 소비자의 마음에 집중해야 한다는 내용을 바탕으로 개념적인 부분이 많았다면, 데이터 쓰기 책의 경우에는 사례 속에서 어떻게 데이터를 디자인하고 스토리텔링할 수 있는지를 알려준다. 개인적으로 쓰기의 기술 책을 더 추천하며, 이 책은 이후에도 재독 해서 나만의 것으로 만들어야겠다고 생각이 들었다.
문장을 보고 어떤 데이터를 생각해야 하는지, 도출하는 방법부터 결국 데이터에서 중요한 의사결정 부분까지 강조한 책이라고 할 수 있다. 데이터를 기반으로 기업에서 어떤 부분을 중요하게 생각해야 할지 정리된 책으로, 퍼포먼스 마케터가 아니더라도 데이터를 적용하고 싶은 직무에게는 필요한 내용이라고 생각했다.
"가장 중요한 것은 데이터에서 얻은 인사이트를 배경으로 시장의 변화를 이끌어내는 액션을 실행하는 것이라는 점을 잊지 말자. 데이터는 1회 분석이 아니라 지속적인 사고 과정의 흐름과 함께한다.
분석은 생각을 촘촘하게 채워가는 과정이다. 분석을 시작하려면 질문이 많아야 한다. 질문은 아는 것과 모르 는 것을 명확히 하고 모르는 부분을 채워가는 시작점이다. 질문 이 있다는 건 왜 이런 일이 일어나는 거지? 즉 자신이 모르는 점에 대한 호기심이 생겼다는 의미다. 모르는 것을 채워가면서 생각을 단계적으로 분류하고 명확하게 만들 수 있다.
데이터 쓰기의 가장 첫 번째 걸음, 문장 쪼개기로, 문장을 구성하는 단어들을 데이터 단위로 쪼갤 수 있다. 이것과 함께 가장 중요한 것은 데이터에서 얻은 인사이트를 배경으로 시장의 변화를 이끌어내는 액션을 실행하는 것이라는 점을 잊지 말자."