brunch

You can make anything
by writing

C.S.Lewis

by Jin Young Kim Nov 06. 2015

데이터 마인드를 키우는 습관 (1)

균형 잡힌 데이터 전문가로 성장하는 방법

지난 글에서는 데이터 마인드의 개념과, 이를 식당 경영이라는 분야에 적용하는 사례를 알아보았다.  역사 속 위인들이 계산기도 없던 시절, 종이와 연필로 데이터를 수집하고 분석하고 시각화하여 사회 문제를 해결하고 인격을  수양하는 데 사용했다는 점을 살펴보았다. 김사장과 조카의 대화를 통해서 망해가는 식당이 비교적 간단한 매출 및 고객 데이터 분석으로 어떻게 다시 일어설 수 있는지 살펴보았다.  이처럼 데이터 마인드를 기르는 것이 관련 기술을 습득하는 것보다 선행되어야 한다는 것이 필자의 견해다. 


데이터를 활용하기 위해서는 수집, 분석, 활용, 공유 등 여러 단계를 거쳐야 한다. 따라서 데이터 마인드는 생활 속에서 데이터와 문제를 발견하는 수집 마인드, 주어진 데이터를 다양한 관점에서 바라보고 적절한 결론을 유도하는 분석 마인드, 데이터를 통해 얻은 결론을 받아들이고 실천에 옮기는 활용 마인드, 마지막으로 분석 및 실천의 결과를 소통하고 이를 통해 배우는 공유 마인드로 나누어 생각해볼 수 있다. 그렇다면 이런 데이터 마인드를 갖기 위해 어떻게 해야 할까?


필자는 데이터 마인드를 갖기 위한 방법으로 '데이터 습관'을 이야기하고 싶다. 데이터 습관은 데이터 마인드를 함양하기 위한 행동 양식이다. 습관이 제 2의 천성이라는 말처럼 일상과 업무 속에서 꾸준히 데이터 습관을 기르는 것이 데이터 마인드를 갖는 유일한 방법이라는 생각이다. 이런 데이터 습관의 구체적인 모습은 데이터 마인드의 구성요소에 따라 나누어 생각해볼 수 있을 것이다. 이번 글에서는 그 첫번째 순서로 수집 마인드와 분석 마인드를 키우는 데이터 습관에 대해 알아보자.


수집 마인드를 키우는 데이터 습관

생활 속에서 데이터와 문제를 발견하는 자세가 수집 마인드라면, 수집 마인드를 기르기 위해서는 꾸준히 데이터화할 수 있는 현상과 데이터로 해결 가능한 문제를 탐색하는 데이터 습관을 길러야 할 것이다. 이런 말을 들으면 수집 마인드가 형성되지 않은 여러분은 '아니, 데이터를 어디서 찾으라는 말이냐'고 생각할 것이다. 대부분의 사람들이 체중이나 온도계와 같은 잘 알려진 측정 방법을 통해서만 데이터를 모아 왔을 것이니 말이다.


하지만 필자가 지난 글에서 언급한 대로 삶과 업무의 모든 요소는 잠재적인 데이터화의 대상이. 자신에게 중요한 모든 현상은 어떤 식으로든 흔적을 남길 테니, 그 흔적을 찾으면 어떤 현상도 측정될 수 있는 것이다. 예컨대 MRI는 자기장과 신체의 수소 양성자간의 반응을 바탕으로 눈으로 관찰하기 어려운 신체의 다양한 이상 징후를 밝혀낸다. 자동화된 측정 장치가 없는 경우 설문 등으로 직원 및 고객의 만족도와 같은 주관적인 느낌을 측정하는 방법도 있다. 


특히 스마트폰 및 웨어러블 기기의 발달로 데이터 수집의 비용은 내려가고 그 영역은 확대되는 추세다. 특히 개인 데이터 수집에 대한 영감을 얻고 싶다면 자신의 삶에 관한 데이터를 수집 및 분석하는 사람들의 커뮤니티인 Quantified Self의 툴 가이드 페이지를 살펴보도록 하자. 건강, 돈, 생산성, 인간관계, 심지어는 전기 소비량까지 온갖 대상을 데이터화하는 도구를 만날 수 있다. 

삶의 모든 영역을 데이터화 할수있게 도와주는 도구들을 소개

물론 아직 아무도 시도해본 적이 없는 현상을 데이터화하는 것은 쉬운 일이 아니다. 하지만 대항해시대의 유럽이 신대륙 발견으로 엄청난 부를 축적했듯이 데이터화에 있어서도 미지의 영역을 개척하는 사람에게는 그만한 보상이 따른다. '머니볼'로 잘 알려진 오클랜드 구단의 빌리 빈(Billy Beane) 단장은 다른 메이저리그 구단이 스카우터의 '감'에 의존하고 있을 때, 팀 승리와 직결되는 출루율과 같은 지표에서 월등한 선수들을 낮은 비용에 스카우트하여 양키스의 1/3에도 못 미치는 예산으로 메이저리그 정상급의 팀을 만들었다.


데이터 수집 마인드를 키우는데 또 다른 장벽은 '빅데이터'붐의 영향으로 많은 데이터가 필요하다고 믿는 것이다. 필자의 예전 글에서 강조했듯, 빅데이터에 집착하기보다는 스몰 데이터에서 출발하여 필요에 따라 데이터의 크기를 키워나가는 접근 방법이 같은 시간과 노력으로 최고의 결과를 만드는 방법이다. 특히 아예 데이터 수집부터 시작해야 하는 경우는 더욱 그렇다. 수집 비용도 비용이거니와 제대로 된 데이터를 수집하기 위해서는 지속적인 고민과 개선 노력이 필요하기 때문이다.


요약하면 수집 마인드를 키우는 방법은 끊임없이 주변에서 데이터와 데이터로 해결 가능한 문제를 발견하는 습관을 갖는 것이다. 물론 모든 문제를 데이터로 풀어야 된다는 말은 아니다. 하지만 배움의 차원에서 평소 자신이 관심을 갖는 문제와 관련된 현상을 사소한 것이라도 꾸준히 기록하고 이를 문제 해결과 연관 지어 보는 습관을 기르자. 이런 훈련이 되어있는 사람은 실제 문제가 주어졌을 때 데이터를 효과적으로 수집하는 방법을 찾을 수 있을 것이다.


또한 모든 데이터를 직접 수집해야 하는 것은 아니다. 최근에는 공공 및 기업의 많은 데이터가 다양한 형태로 공유되어 있다. 이런 공개 데이터셋을 잘 활용하는 것도 (자신이 해결하고자 하는 문제와 관련되는 데이터셋을 찾을 수 있다면) 직접 데이터를 수집하는데 드는 노력을 아끼는 좋은 방법이다. 그게 아니라도 다양한 유형의 데이터의 친숙해지는 것은 데이터 전문가가 되는데 중요한 과정이다. 관심있는 독자는 필자의 홈페이지에서 주요 공개 데이터셋의 목록을 살펴보도록 하자. 


분석 마인드를 키우는 데이터 습관

수집이 데이터 활용의 첫걸음이라면 분석은 주어진 데이터로 결론을 내리는 단계다. 데이터 수집과 마찬가지로 분석도 끊임없는 연습이 필요하다. 우선 수집 마인드를 갖고 데이터를 자주 모으는 사람이라면 자연스럽게 자신이 모은 데이터를 분석할 기회도 많이 얻을 것이다. 하지만 자신이 직접 모으지 않더라도 최근에는 다양한 공개 데이터를 구할 수 있다. 사회 현상 등에 관한 호기심을 이런 공개 데이터를 통해 풀어보는 것도 좋은 습관이다. 


이렇게 다양한 분석 경험을 쌓다 보면 데이터라는 도구를 사용하여 복잡다단한 현상을 이해하는 즐거움과 보람을 깨닫게 된다. 필자의 데이터 과학 입문기에서 다루었듯, 전자공학을 전공하던 필자를 데이터의 세계로 이끈 것은 필자가 보내는 시간의 질을 직접 만든 달력에  기록하면서부터다. 물론 분석 과정에는 시행착오와 어려움도 많지만, 이를 이겨내는 과정에서 분석가로서의 맷집(?)이 길러진다고나 할까? 또한 필자는 최근 우리나라의 높은 자살률의 실태를 OECD 및 통계청에서 구한 공공 데이터로 풀어보기도 하였다. 


직접 분석을 해보는 것 만큼이나 중요한 것이 다른 사람의 분석 과정이나 결과를 비평하는 습관이다. 분석이라면 거창하게 들리지만 사실 현대인이 보고 듣고 접하는 정보의 상당 부분은 누군가가 데이터를 수집하고 분석해서 얻은 결과물이다. 자신이 몸담은 회사에서 데이터 관련 업무를 하는 경우에는 말할 것도 없다. 이런 습관을 기르기 위해서 데이터에서 어떤 결론을 유도하는 신문 기사 하나를 읽더라도 그냥 받아들이지 않고 다음 관점에서 생각해보자. 

- 기사에 사용된 데이터는 어떻게 얻어진 것인가?
- 데이터에서 결론을 유도하는 과정은 설득력이 있는가?
- 분석 과정을 전달하는 표나 시각화의 사용은 적절한가?

이처럼 기존의 분석 결과를 평가할 수 있는 능력은 자신의 분석 작업에도 적용될 것이다. 즉, 실력 있는 데이터 분석가가 되기 위해서는 먼저 현명한 데이터 소비자가 되어야 하는 것이다. 이처럼 자신에게 쏟아지는 수많은 정보 가운데 옥석을 가리는 능력은 누군가의 분석 결과를 토대로 결론을 내려야 할 때 필수적이다. 이는 또한 데이터 분석가와 한 팀을 이루어 일을 하는 경우에도 유용한 능력이다. 데이터 과학자/분석가의 입장에서 자신의 분석에 날카로운 지적을 해주는 팀원처럼 고마운 존재는 없기 때문이다. 

데이터 과학자에게 가장 소중한 존재는 사려깊은 비평을 해주는 동료다. (사진: Jawbone의 데이터 과학자들)

맺음말

여기까지 읽은 독자들은 '그럼 데이터를 다루는 기술은 필요 없다는 거냐'고 생각할지도 모른다. 필자는 기술의 필요성을 부인하는 것은 아니다. 단지 많은 분들이 데이터 마인드를 기르려는 노력 없이 엑셀이나 R과 같은 툴을 익히거나 고급 통계를 공부하는 것으로 데이터 전문가가 될 수 있다고 믿는 것을 바로잡고 싶은 것이다. 툴 사용법이나 통계 지식은 데이터를 다루는 구체적인 방법(HOW)을 알려줄 뿐, 데이터 수집 및 분석의 방향성을 제시하지는 못한다. 데이터를 다루는 기술에 관심이 있는 독자들은 필자의 홈페이지를 참고하기 바란다.


이해를 돕기 위해 데이터 전문가가 갖추어야 할 다양한 역량을 신체 각 부분에 비유해보자. 데이터 마인드는 머리, 데이터 기술은 손발에 비유할 수 있다. 따라서 데이터 마인드 없이 기술만 익히려는 접근 방법은 두뇌에 비해 신체가 기형적으로 발달하는 결과를 낳는다. 데이터를 가지고 이런저런 시도는 해볼 수 있지만 문제의 본질에 접근하지 못하고 노력만 낭비할 가능성이 크다. 지금까지 데이터를 다루는 기술을 열심히 공부했다면 이제 데이터 마인드를 키우기 위해 노력해보는 것은 어떨까?


또한 데이터를 처음 시작하는 분들께는 복잡한 이론이나 기술에 너무 기죽지 말고 자신이 데이터를 통해 얻고자 하는 목표와 해결하고자 하는 문제를 명확히 하는데 집중하기를 권하고 싶다. 문제에 집중하다 보면 무슨 데이터를 어떻게 모아야 할지, 그리고 이런 데이터를 어떤 이론과 도구를 사용해 분석해야 할지 깨달을 수 있을 것이다.  데이터 관련 도구와 이론을 공부하는 것은 이처럼 동기와 방향이 명확해진 후 시작해도 늦지 않다. 달이 (해결하고자 하는 문제) 아닌 달을 가리키는 손가락에 (도구와 이론) 집중하는 오류를 피해야 할 것이다.


추신: 독자 여러분들의 데이터 습관은 무엇인가요? 이 글에 내용에 대한 의견 및 궁금증이 있으시다면 댓글로 알려주세요. 데이터에 관한 더 많은 이야기를 제 블로그와 페이스북에서 만나실 수 있습니다.

매거진의 이전글 우리 식당 김사장이 데이터 과학자가 된 사연은?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari