그런데 데이터과학자가 뭐야?
데이터과학자는 쉽게 말해 통계학을 할줄 알고 통계학을 코딩으로 구현할 수 있는 사람을 말한다.
데이터싸이언스, 빅데이터, 데이터애널리틱스가 모두 쉽게 말해 통계학이라고 생각하면 되고 최근에 각광받는 머신러닝/인공지능은 통계학에서 한 발 더 나아가서 컴퓨터를 통해 통계학이 할 수 없었던 분야를 좀 더 개척했다고 보면 된다. 종합하면 데이터과학자는 통계학과 머신러닝을 이해하고 코딩으로 구현할 줄 아는 사람.
통계. 한국에서는 각종 통계가 많다. 일자리 통계, 수출입통계, 결혼 등 가족통계(일명 센서스조사) 등등. 이런 것들은 통계라고 하기는 하는데 사실 통계학 분야라기보다는 각종 조사를 좀 보기 좋게 표를 만들어 둔 것을 통계라고 한다. 데이터과학자가 말하는 통계는 Statistics 즉, 통계학이다. 이제 여기서부턴 수학과의 차이를 설명해야 하니 더 자세한 설명은 그만하도록 하고..
엄밀한 분류는 존재하지 않는다. 모든 것을 포괄하는 의미로 데이터 과학자(Data Scientist)라고 하는데, 좀 더 들여다보면 Data Analyst(소위 애널리스트), Data Scientist(데이터 과학, 즉 데이터 연구), Data Architect(이쪽은 사실 엄연히 말하면 데이터베이스전문가 또는 엔지니어- 개인적으로 Data Science로 생각하진 않음). 애널리스트는 좀 더 사업모델과 가까우며 마케팅, 전략 쪽에서 긴밀하게 그때 그때 필요한 분석을 수행해주는 사람이다. 빠른 판단력과 부지런한 리포트 생성능력이 중요할 듯. 데이터과학자는 데이터를 가지고 회사의 상품으로 연결할 수 있는 모델들, 이를테면 인공지능 알고리즘, 통계를 활용한 추천시스템 구축 등 좀 더 긴 호흡으로 일하는 사람들이다. 보통 애널리스트들은 학부출신부터 석사출신이 많을 수 있고, 데이터과학자는 박사출신들이 많을 수 있다. 일의 특성상 그렇다. 그런데 회사마다 직책의 이름이 다를 수 있으니 그저 참고만 하면 된다.
먼저 쉬운 방법. 데이터과학 학원 강의를 1년 정도 꾸준히 수강하면서 연습하기. 그리고 자신만의 데이터분석을 5개 이상해서 남들에게 설명해보기. 이 정도면 데이터분석가(Data Analyst) 포지션에 지원하는데 무리가 없다고 본다. 다만 취업할 땐 눈을 좀 낮추어서 스타트업이나 전통적인 제조,중소기업같은 곳도 염두를 두어야 한다. 다들 빅데이터라고 해서 어디든 될 것 같은데 실상 취업문턱이 낮지는 않다.
좀 더 어려운 방법. 이제 올해, 내년부터 설립되는 서울대학교의 빅데이터대학원, 카이스트, 고려대의 인공지능대학원 같은 과정에서 석사를 마친다면 아주 훌륭한 데이터과학자가 될 수 있을 것 같다. 꼭 빅데이터 대학원, 인공지능대학원이 아니더라도 좋은 통계학과 대학원을 진학하는 것도 거의 동일한 결과를 보장한다. 차이점은 아마 (좀 더 실용적인) 인공지능의 지식쪽에 있을 것 같다. 통계학과는 아직 인공지능이 약하다. 컴퓨터공학과에 진학하여 인공지능 담당 연구실에서 공부하는 것도 매우 좋은 길이다(이 쪽은 반대로 통계가 조금 약할 것이다). 학부에서도 마찬가지다. 꼭 대학원을 안가도 학부에서 충분히 공부하고 이해하고 졸업한다면 통계학과/컴퓨터공학과 출신(추가로 수학과/산업공학과도 가능하다고 본다)은 충분히 데이터과학자가 될 수 있다. 단, 쉽진 않을 것이다.
데이터과학자로 유명한 곳은 의심할 나위없이, 구글, 페이스북, 넷플릭스다. 이들 모두 굉장히 수준 높은 데이터과학자만을 뽑는다. 테크 회사 특성상 이 분들의 수준은 교수님들과 비교해도 실용적 측면에서 뒤지지 않는다. 박사출신이 대부분. 다음으로 전통적인 제조업/유통업도 데이터과학자를 뽑는다. 삼성, 애플, 월마트, 보잉 이런 회사들도 모두 데이터분석에 미래를 걸고 있다. 어떤 분야가 좋은지는 각자의 선택이다. 마지막으로 스타트업이다. 스타트업은 문화 특성상 데이터분석에 관심이 많다. 태생이 그렇다. 팀은 크지 않지만 들어가면 자신이 원하는 데이터분석을 A-Z 다 해볼 수도 있을 것 같다. 한 가지 빼먹었는데 요즘 등장하는 Analytics/AI 컨설팅. 이건 데이터분석 역량이 좀 부족한 회사들을 상대로 데이터분석 전문가들이 외부에서 서비스를 제공해준다. 이미 Boston, Mckinsey, Bain과 같은 전통적인 전략컨설팅회사도 빅데이터분석 자회사를 만들고 데이터과학자를 뽑고 있을 뿐만 아니라 아예 빅데이터분석만 전문으로 하는 컨설팅 업체가 정말로, 아주 많이 생기고 있다.
이정도면 데이터과학자에 대한 Outline이 되었으리고 본다.
사람들이 생각하는 것과 조금 다를지도 모른다.
그래서 조금 오해가 있긴 하지만 한 마디로 그냥 내가 편하게 말할 때는 이렇게 얘기한다.
"통계학자가 된다고 생각하면 돼."