brunch

『문과생, 데이터 사이언티스트 되다』

「데이터를 비즈니스에 활용하고 싶은 이들을 위하나 가장 쉬운 안내서」

by 안서조

이 책의 부제목은 「데이터를 비즈니스에 활용하고 싶은 이들을 위하나 가장 쉬운 안내서」이다. 인공지능과 빅데이터가 요즘 세상을 지배하는 화두이다. 이 책을 읽은 동기다.


‘데이터 사이언티스트’ 생소한 직업이다. ‘기술을 이용해 데이터를 분석하고 인사이트를 전달하는 일’을 하는 사람이라고 한다. 구체적으로 사람들이 데이터를 중심으로 의사결정을 할 수 있도록 돕고, 데이터를 바탕으로 제품 개발에 필요한 논리를 만든다. 시장의 반응을 분석해 무엇이 잘되고 있고, 잘못되고 있는지 신호를 잡아내는 역할도 한다. 데이터에서 아이디어를 얻은 제품이 나오는 것도 보고, 데이터에서 소비자의 마음을 찾아내 서비스가 개선되는 과정에도 함께한다.


데이터는 사람들이 주장을 객관적으로 받아들이게 하는 힘이 있다. 반드시 어려운 숫자를 보여주지 않더라도 논리적인 사고의 흐름 속에서 의문이 생기는 부분을 데이터가 채워 줄 수 있다. 데이터를 많이 가진 기업일수록 더 정확한 의사결정을 할 수 있고, 더 나은 데이터를 제시하는 사람은 더 논리적인 사람으로 인식된다.


데이터 전문가라고 할 수 있는 사람은 기술 역량이 뛰어난 데이터 엔지니어, 분석과 모델링을 주로 하는 데이터 애널리스트, 기획과 전략 방향 설정에 집중하는 비즈니스 애널리스트, 브래드와 제품의 성장 원인을 추적해 찾고 효율을 극대화하는 그로스 해커 등도 데이터 사이언티스트와 연관이 있다.


데이터 애널리스트는 금융권에서도 사용되는 이름이다. 데이터를 분석해 시장 전망과 같은 수치를 만든다. 데이터 엔지니어에 비해 높은 기술력이 요구되지는 않는다. 비즈니스 애널리스트는 데이터 애널리스트와 유사하지만, 경영 측면에서 의사결정을 내리기 위한 전략 기획 관련 지표들을 주로 분석한다.


그로스 해커는 성장Growth과 해커Hacker의 합성어로 데이터 사이언티스트처럼 새로운 개념으로 등장한 직업이다. 기업의 성장과 판매를 높이는 요인을 해커처럼 파헤쳐 기업의 성장률이나 판매율을 높일 수 있는 방법을 찾는 데 집중한다.


데이터 사이언티스트는 현실과 데이터를 연결하는 데 중점을 두고, 기업에 필요한 비즈니스 인사이트나 마케팅 아이디어를 얻기 위해, 혹은 웹/앱에서 판매를 높일 수 있는 모델을 만들기 위해 데이터를 활용할 줄 알아야 한다. 현장 실무에 대한 사업 감각도 있어야 하고 통계 지식도 있어야 하며 데이터 분석을 구현해 내는 기술까지 이해할 수 있어야 한다.


데이터 사이언티스트는 3가지 영역, 데이터를 분석하는 ‘기술’, 상황에 맞게 ‘통계’를 적용할 수 있는 지식, 분석의 결과를 해석하고 전달하는 ‘인문학적’ 역량을 각각 일부라도 갖춰야 한다.


데이터 분석의 첫 단계는 인간의 언어에서 시작된 질문을 어떻게 숫자로 만들어 낼지 탐색하는 일이다. 데이터 사이언티스트가 갖고 있는 것은 이미 정리된 데이터가 아니라 작은 단위의 데이터인 경우가 많다. 월 매출이 아니라 영수증 단위의 데이터가 주어진다. 이 영수증들을 어떻게 조합해야 원하는 결과물을 얻을 수 있을지 아이디어를 내야 한다. 그리고 이를 직접 코딩으로 풀어낼 수 있어야 한다.


데이터 사이언티스트는 다음과 같은 마인드가 있어야 한다.

향상심, 더 나아지고 싶다는 마음. 더 나은 해결책, 더 나은 기술, 더 나은 역량을 갖기 위해 노력과 시간을 투자해야 한다. 지금보다 나은 결과를 내기 위해 시간, 금전, 노력 이 모든 면에서 자신에게 아낌없이 투자한다. 향상심은 부족함을 느끼는 데서 시작된다. 자신이 모르는 것이 있다고 생각하면 향상심이 생긴다.


호기심, 사이언티스트에게는 현실을 데이터로 변환하는 역량이 필요하다. 이 역량은 현실에 대한 호기심에서 시작한다. 모든 현상을 궁금해하지 않는 사람은 그 현상을 더 낫게 만들 가능성이 희박하다. 주변의 온갖 것에 ‘왜?’라는 질문을 던질 줄 알아야 한다. 그래야 그 질문에 답하기 위해 데이터를 찾아볼 수 있고 그 데이터에서 답을 찾아내 현실을 바꿀 단초를 제공할 수 있다.


사교성, 데이터를 만지는 일을 하다 보면 사람과 일하는 시간보다 컴퓨터와 일하는 시간이 더 많다. 시간이 촉박할 때 사람들과 전혀 교류하지 않고 숫자를 단지 숫자로만 보기도 하는데 그런 분석 결과물은 의사결정을 위한 공감을 얻기 어렵다. 데이터를 분석한 뒤 다시 현실에 도움이 되게 쓰기 위해서는 현장에 있는 사람들과 친해져야 한다. 고객이 원하는 분석을 하기 위해서는 영업조직과 친밀해야 한다. 데이터가 실제로 살아 움직이게 하려면 현실의 문제를 다루고 있어야 하며 데이터가 다시 현실에 좋은 영향을 미치게 해야 한다.


주도권, 데이터에 대한 주인 의식. 남이 시키는 일을 수동적으로 하는 것이 아니라 스스로 데이터의 주인이 되는 것. 기존에는 데이터 팀이 타 부서의 요청에 응대하는 방식으로 일하는 경우가 많았다. 상부상조할 수 있지만, 이런 일이 데이터 사이언티시트의 주요 업무가 돼서는 안 된다. 나에게 데이터 주도권이 있다는 의식을 갖고 적극적으로 분석하는 자세가 필요하다.


경험, 기획과 변형, 해석의 바탕. 짧은 시간 안에 얻기 어려운 역량은 데이터 기획과 해석에 대한 ‘경험’이다. 경험치가 필요한 첫째 단계는 기획이다. 어떤 종류의 문제를 풀기 위해 어떤 방법을 써야 할지 선택하는 단계다. 둘째, 데이터를 변형하는 데도 경험치가 필요하다. 원하는 결과를 얻기 위해 어떻게 데이터를 바꿔야 하는지 결정하는 것은 처음 데이터 분석을 시작한 사람에게는 어려운 문제다. 마지막으로 경험치가 가장 많이 요구되는 단계는 데이터 해석이다. 어떤 경우에도 최종 해석하는 역할은 인간이 맡게 된다. 분석이 간소화되고 쉬운 세상이 된다 해도 결과를 해석하는 경험은 반드시 필요하다. 해석은 데이터 사이언티스트의 일 가운데 화룡점정이라 해도 과언이 아니다. 경험이 많을수록 데이터 안에서 더 풍성한 얘기를 찾아낼 수 있다.


빅데이터라고 하면 바다와 같은 정보 속에서 생각지도 못했던 진주를 발견할 것으로 생각한다. 일반적으로 데이터는 목적을 가져야만 제대로 활용될 수 있다. 프로젝트의 목적이 뚜렷하지 않고 성과를 낼 만한 것을 찾는다면 몇 년이 흘러도 손에 잡히는 결과를 얻지 못할 수 있다. 프로젝트의 목적을 명확하게 그려야 한다. 창의적인 탐색을 위해 구체적인 결과물까지 정하지는 않더라도 최소한 구체적인 키워드는 있어야 한다.


코딩의 기본은 논리력이다. 단 한 글자 단 한 줄만 잘못돼도 원하는 결과를 얻지 못할 수 있다. 남이 작성한 질문을 가져다 쓸 때도 자신이 원하는 방법으로 수정해야 하는 경우가 있고, 스스로 수백 수천 줄의 질문을 논리적인 단계에 따라 한 줄 한 줄 정성껏 작성해야 하는 경우도 많다. 낱개의 블록을 이렇게 쌓으면 이런 모양이 나오고, 저렇게 쌓으면 저런 모양이 나온다는 것을 상상할 수 있어야 하나하나 흩어져 있는 데이터를 모아 결과물을 만들 수 있다.


자신이 가치를 두고 있는 속성과 하는 일의 속성이 맞닿아 있는 지점을 아는 것이 중요하다. 그래야 그 일을 해야 할 이유를 갖게 된다.


데이터 사이언티스트가 되고 싶은 사람은 입문서로 읽어 볼 만한 책이다.


끝까지 읽어주셔서 감사합니다! 애독자 여러분들의 '응원하기'는 작품 연재에 큰 힘이 됩니다.

sticker sticker

책 소개


『문과생, 데이터 사이언티스트 되다』 차현나 지음. 2020.06.01. 도서출판길벗. 222쪽. 15,000원.


차현나. 이화여자대학교 사회과학대학에서 학사, 석사, 박사학위를 받았다. 성균관대학교에서 소비자심리학과 광고심리학을 가르쳤다. 스타벅스커피코리아 1호 데이터 사이언티스트.



keyword