저희는 이러한 철학을 기반으로 교육을 운영하고 있습니다.
<데잇걸즈가 생각하는 데이터 사이언스>
Data science is an interdisciplinary field that uses scientific methods, processes, algorithms and systems to extract knowledge and insights from data in various forms, both structured and unstructured, similar to data mining.
위키피디아에 나온 데이터 사이언스의 정의입니다.
데이터 사이언스의 본질은 무엇일까요?
데이터를 기반으로 하는 문제해결 능력. 이것이 데이터 과학의 목표이자 본질이라고 생각합니다. 데이터를 과학적 사고와 방법을 통해 분석하고 결과를 만들어내는 것이지요. 데이터 과학은 과정이자 목표가 될 수 있는 셈입니다.데이터 과학이 어렵게 느껴지는 것은 끊임없이 빠르게 발전하는 속도 때문일 것이라 생각합니다. 관련된 여러 자료들은 데이터 과학을 하기 위해서는 프로그래밍, 수학, 딥러닝 등이 필수인 것처럼 이야기합니다. 머신러닝과 딥러닝에 대한 각종 기사는 이러한 인식을 심화시킵니다.
데이터 과학은 이처럼 복잡한 것일까요? ‘헬로 데이터 과학’의 저자인 김진영씨에 따르면 데이터 과학은 데이터에 기반한 방법으로 현실 세계의 문제를 해결하는 것이라고 합니다. 따라서 자신이 해결하고자 하는 문제의 성격이 어떤 도구와 도구와 분석기법을 사용해야 하는지 결정한다고 이야기합니다. 더불어, 데이터를 활용해 문제를 인식하고 해결하는 능력인 데이터 지능이 앞으로의 시대에서 필요한 능력이라고 역설합니다.
Computer science
Math, Statistics
Machine learning
Domain expertise
Communication
Presentation skills
Data visualization
일반적으로 데이터 사이언티스트에게 요구하는 역량들입니다. 이것을 갖추면 데이터 사이언티스트가 되는 것일까요? 이 모든 것을 갖춘 사람을 찾을 수 있을까요? 어쩌면 우리가 데이터 사이언티스트에 대해 가지고 있는 그림이 현실 속에서 그다지 가능하지 않은 환상인지도 모릅니다. 데이터 사이언티스트라는 직함이 아닌 역할은 과연 가능한 것일까요? 오히려 그 단어가 이 일의 본질을 흐리고 있지는 않나 생각해봅니다.
문제해결을 위한 데이터 활용은 반드시 '빅데이터'를 필요로 하지는 않습니다. 오히려 '빅데이터'의 환상에 빠져 문제해결을 위한 분석, 프로세스, 커뮤니케이션에 소홀히 하는 것은 아닌지 돌아봐야 한다고 생각합니다. 소위 '빅데이터'를 가진 곳은 얼마나 될까요. 단순히 크기가 큰 것이 아닌 잘 정제된 '빅데이터'를 가진 곳은 또 얼마나 있을까요. 핵심은 데이터의 크기가 아니라, 데이터를 '과학적 사고'와 '과학적 방법'을 통해 바라보고 실마리를 찾는 것이라 생각합니다. 기술을 위한 기술이 아니라 문제해결을 위한 데이터 사이언스가 사회에 기여하고, 때로는 이러한 적정기술이 문제를 해결합니다.
우리는 지나치게 많은 기술 요구사항을 가지고, 기술 그 자체를 바라보는지도 모르겠습니다. 도구와 목적이 바뀐 모양입니다. 빅데이터 관련 업계가 전반적으로 지나치게 엔지니어링에 치우져있다는 생각을 하기도 합니다. 통계를 활용하며 더 쉽고 우아하게 풀 수 있는 문제들을 과도한 엔지니어링으로만 풀어내려는 시도가 많지는 않았나 고민해 봅니다.
오히려 기본에 충실한 분석가, 기초 역량이 탄탄한 데이터 종사자를 찾기 힘든 것이 업계의 현실이 아닌가 생각합니다. 유행을 쫓느라 본질을 놓치지 않았는지요. 이러한 데이터 업에 대한 몰이해가 조직에서 데이터 전문가의 역량성장과 심리적 안정을 해치는 요소로 작용했을 수도 있다는 생각도 해봅니다. 그래서, 주니어일수록 통계와 같은 기본에 충실하고, 협업을 잘하며, 그것을 위한 커뮤니케이션에 능해야 한다고 생각합니다.
컨설팅회사 맥킨지는 2016년에 <The age of analytics: Competing in a data-driven world>라는 보고서를 통해서 , 분석역량이 데이터 기반 시대에서 경쟁력이 된다고 이야기하고 있습니다. 이 보고서와 같이, 데이터와 관련된 화두가 쏟아지는 지금이야말로, 데이터 분석 역량이 가장 경쟁력이 된다고 저희는 생각하고 있습니다.