179. 데이터 천재들은 어떻게 기획하고 분석할까?

데이터천재2.jpg

이 책은 최인아 책방 추천 책이고 최인아 대표님 인스타에서 발견하게 되어서 읽게 되었다. 그런데 사실 비전문가와 일반인을 위한 입문서라고 하지만 조금은 어려운 책이라는 생각이 들었다. 그래도 최근 이슈가 되고 데이터 리터러시의 중요성 때문에 끝까지 완독을 했다.

우리는 일상의 대부분이 데이터로 기록되는 시대에 살고 있다. SNS을 비롯해 검색기록, 구매내역 등 크고 작은 행동 하나하나가 모두 데이터다. 이때 매일 생성하는 데이터는 모여서 방대한 빅데이터가 되고, 빅데이터 속 숨어 있는 인사이트는 우리가 더 나은 선택을 할 수 있게 한다.그러나 데이터는 그 자체로 정답을 주지는 않는다. 데이터를 근거로 맥락을 분석하고 현실의 문제를 해결할 때 비로소 데이터가 효용을 갖기 때문이다. 그렇다면 우리는 데이터를 어떻게 바라보고 활용해야 할까? 이 책은 그러한 물음에 대한 응답이다.


데이터 사이의 맥락을 파악해 어떤 목적으로 어떻게 데이터를 분석해야 하는지, 생활 속 빅데이터가 어떻게 활용되고 있는지 등은 물론 실제 기업의 사례를 소개하며 데이터 활용법을 상세히 알려준다. 특히 이 책은 문과생들에게 '인사이트' 와 '가치' 를 발견할 수 있는 자신의 인문학적 강점을 뾰족하게 세워나가면서 책을 읽어볼 것을 권한다.


이 책은 총 6부로 구성이 되는데 개인적으로 일상에서 가장 빈번하게 접하는 텍스트 데이터를 다룬 6부가 가장 인상적이었다. 텍스트 데이터가 왜 중요한지, 텍스트 데이터는 다른 데이터와 어떤 차이가 있는지를 설명한다. 특별한 사전 지식이 없어도 수행할 수 있는 직관적인 분석 방법들을 통해 텍스트 데이터에서 정보를 추출하고, 의사결정에 활용하는 일련의 과정을 소개한다. 무엇보다 텍스트 데이터의 특성을 이해하고, 적절한 분석 방법을 선택하는 것이 의사결정자에게 가장 중요한 점이라는 기본 명제를 독자들에게 전달한다. 우리가 접하는 데이터는 날이 갈수록 기하급수적으로 증가하고 있는데 대부분인 80% 이상의 비중을 차지하는 것이 텍스트 데이터라고 한다.


데이터 텍스트는 머신 학습 없이 데이터 자체에서 인사이트를 뽑아내는 분석에 강점을 보인다. 따라서 등장 빈도에 기반한 간단한 분석만으로도 상당히 유의미한 결과를 도출할 수 있다. 가장 널리 사용되는 빈도 분석 중 하나로 워드 클라우드 Word Cloud 를 꼽을 수 있다. 워드 클라우드는 텍스트 데이터에 등장하는 단어의 등장 빈도를 크기, 색상 등 표현 요소의 차이로 시각화하는 방법이다. 단순한 기법이지만 정보를 한눈에 파악하기 쉽고 활용할 방법에 따라 꽤나 유의미한 결과 도출이 가능한다. 관련 이슈에 대한 종합적인 정보 수집이 가능하다는 측면에서 가장 기본적으로 사용되는 방법이다.

만약에 데이터 분석에 대한 책이 부담스러운 분들께서는 6부 텍스트 데이터에 대한 챕터만 읽어보시길 권한다. 이 부분만 읽어도 업무에 큰 도움을 받을 수 있을 것 같다.

keyword
매거진의 이전글178. 애쓰지 않아도