차현나 지음
| 추천의 글 (전 카카오데이터팀 이사)
어떤 분야를 공부하다 보면 처음에는 기술에 집착하게 됩니다. ... 그러나 시간이 지나 그런 것들이 익숙해지면 알게 됩니다. 그것들은 매우 지엽적인 것이고 결국은 내가 무엇을 만들고, 그리고 싶은지를 파악하는 능력이야말로 가장 핵심이고 본질이라는 사실을요.
작년, 미국에서 Data Management 일을 하면서 데이터에 흥미가 커졌다. 졸업 이후 백지가 되어버린 SQL을 기초부터 다시 공부하다가 실습하려니 서버 DB 권한을 IT 측에 요청해야 해서 흐지부지 되었다. 현재, 스타트업에서 마케팅을 총괄하면서 SQL 스킬이 절실해진 찰나. 목적 있는 데이터를 뽑고 인사이트를 찾기 위해서 우선 SQL부터 통달해야 한다고 생각했다. 스킬이 생기면 나머지는 따라올 것 같았다. 하지만 SQL은 수단이지 본질은 아니었다.
'관점'이라는 것은 '암묵지'의 영역이기 때문입니다. 암묵지란 내가 알고 있으나 말로 표현하기 어려운, 내게 체계화된 지식을 말합니다.
| 소비자 마음은 영수증 한 장에 들어있다
데이터가 정비되어 있지 않으면 분석은 끝없이 꼬여만 갈 것이다. 이 데이터가 맞는지 맞춰보다가 시간을 다 허비할 수도 있다. '쓰레기를 넣으면 쓰레기가 나온다'라는 표현처럼, 영수증 단위의 데이터가 틀리는데 총계가 맞을 리 없다.
'쓰레기를 넣으면 쓰레기가 나온다.' 그리고 '정확하지 않은 기준을 넣어도 쓰레기가 나온다.' 대량 데이터를 다루면서 깨달은 점은, 차라리 눈에 띄는 '함수 오류'는 참 고마운 일이라는 것. 문제없어 보이던 리포트의 수치들을 검토하다가 함수 식의 셀 참조가 잘못되어 결괏값이 맞지 않거나 작년 3월과 지난 3월의 세일즈를 비교하려는데 작년 2월 데이터가 뽑혀있던 경우들이 많았기 때문이다. 뜯어보지 않았다면 몰랐을 일이다. 잘못된 데이터를 분석하며 찾은 인사이트는 비용 손해도 발생시킬 수 있는 쓰레기 그 이상이 될 수도 있다.
| 소비자의 마음은 날씨에 따라 달라진다
(비 오는 날) 우산 때문에 소비를 안 한다고 하면 '당연한 소리 아니야?'라고 여길지도 모르겠다. 그러한 당연한 소리를 합리적으로 증명하는 것이 데이터 분석가가 할 일이라고 생각한다.
'당연한 소리를 합리적으로 숫자로 증명하는 것.' 모호하게 직감으로 판단하기보다 데이터로 정확하게 알고 깨닫는 것. 생각해보면 Data Analysis 분야 외에 일상적인 삶에서도 적용할 필요가 있다. 확실한 근거가 있기 전에는 '사실'이라고 확정하지 말 것. 쉽게 판단하고 결론짓지 말 것.
| 소비자의 마음은 거짓말을 한다
"사람들은 보여주기 전까지 자신들이 원하는 것이 무엇인지 모른다"라며 소비자 조사를 하지 않았다는 스티브 잡스의 의견은 여기서도 일부 맞는 말이다.
나도 모르던 나의 취향을 발견하는 순간이기도 하다. 누군가의 아이디어X디자인은 '나'를 알아가는 데 도움이 되기도 한다.
| 데이터가 알려주는 소비자의 마음 10가지
누군가가 생각하고 스스로 적는 것은 그 사람 입장에서 다분히 주관적이다. 기업이 의도한 질문에 대해 응답자는 각자 다른 생각을 가지고 답한다. 그 응답을 받아 든 기업은 단 하나의 가능성으로 응답을 해석한다. 거기서 기업과 소비자의 동상이몽이 일어난다.
| 데이터 앞에서 해야 할 질문 10가지
각기 다른 소비자의 마음을 알아차리긴 어렵다. 그러나 되도록 왜 소비자가 이런 행동을 하는지 파악하려는 노력은 필요하다. 이 매장에 무슨 문제가 생긴 걸까? 자신이 잘 아는 하나의 원인으로 자꾸 귀결시키려고 하지 말자. 운이 좋게 그 원인이 맞을 수도 있지만, 전혀 아닌 경우도 있다.
'A는 계산적인 사람일 것이다.'라고 거의 확신하다시피 생각하고 A를 보면, 내가 생각하는 '계산적인 사람'의 특징을 A의 행동에서 찾고, 조금만 비슷한 행동을 보이면 '역시, 맞네.'라고 판단 후 'A는 계산적이다.'라고 결론을 내버리는 경우가 있다. 선입견은 편협한 시각을 갖고, 잘못된 방향을 인지 못한 채로 가는 지름길이다.
생각과 적용
성별이나 나이와 같은 인구 데이터보다 소비자의 행동 패턴 분석이 더 효율적인 인사이트를 도출함을 깨달았다. 20대, 30대로 그룹핑하기에는 너무 다양한 취향들이 존재한다는 것. 새로운 재미를 주는 취미들이 생겨남에 따라 취향의 색깔도 늘어났다. 또한, 거래 내역 확인과 환불의 용도로만 생각했던 영수증 정보로 수많은 데이터들이 움직이는 점이 흥미롭다.
책에 대하여 다소 아쉬운 마음은, 현재 데이터 분석을 향해 첫 비탈길을 걷고 있는 자로서 저자가 데이터 사이언티스트로서 추천하는 툴도 소개되어 있기를 기대했었는데 없었던 점이 아쉽다.