문송이도 이해하는 데이터 사이언스
앞선 글을 보신 분이라면
빅데이터, 그리고 데이터 사이언스에 관한 기본적인 개념과 방향은 이해하셨으리라 생각합니다. 하지만 한편으로는 이런 생각이 든 분도 계시지 않았을까 싶네요. 바로
그래, 빅데이터가 주목 받는 건 알겠어. 그런데 도대체 그걸 어떤 사람들이 분석하는 건데?
라는 궁금증 말이죠. 이번 글에서는 이러한 의문을 가진 분들을 위해 데이터 분석과 관련된 직무에 대해 알아보고자 합니다.
데이터 분석과 관련된 직업군은 생각보다 다양합니다. 데이터 분석가를 비롯해 수리경제학자, 인구통계학자, 재정분석가, 마케팅 리서처 등 분야 또한 굉장히 다양하죠. 전 세계적으로 가장 활발하게 운영되고 있는 비즈니스 네트워크 사이트 ‘링크드인(LinkedIn.com)’에 따르면, 이미 데이터에 관련된 구인 타이틀의 종류만 5,000여 개에 달하는 상황입니다. 다음은 데이터 분석과 관련된 구인 타이틀의 실제 예시들입니다.
Chief Scientist, Global Head of Analytics (데이터 분석 글로벌 책임자 겸 최고위 과학자)
Chief Credit&Analytics Officer (신용 및 데이터 분석 담당 최고책임자)
Chief Actuary of Geospatial Analytics and Modeling (보험 모델과 지리공간 데이터 분석 담당 최고책임자)
Director - Predictive Analytics (예측 분석 담당 본부장)
Director - Marketing Analytics (마케팅 데이터 분석 담당 본부장)
Director of Health Analytics (의료 데이터 분석 담당 본부장)
Director, Head of Forensic Data Analytics (범죄 데이터 분석 담당 본부장)
Director, Gamification Analytics Platform, Information Analytics&Innovation (게임과 데이터 분석 플랫폼, 정보 분석 및 혁신 담당 본부장)
이름에서 알 수 있는 것처럼 데이터 분석 분야의 전문가들은 굳이 ‘데이터 사이언티스트’ 혹은 ‘데이터 분석가’ 같은 이름이 붙지 않더라도 다양한 분야와 영역에서 아주 오랫동안 일해왔습니다.
그럼 내친 김에 궁금증 하나만 더 해결해 보도록 하죠. 대체 ‘데이터 사이언티스트’와 ‘데이터 분석가’는 무엇이 다른 걸까요? 2018년 발행된 <데이터 과학 무엇을 하는가?>의 저자이자 데이터 전문가 그룹인 엔코아의 서비스 센터장인 김옥기 씨는 이를 다음과 같은 예로 둘의 차이점을 설명합니다.
데이터 과학자는 통계 분석가가 될 수 있지만, 통계 분석가가 데이터 과학자가 되려면 준비과정이 좀 더 필요하다.
데이터 분석가는 자신이 맡은 분야와 영역의 데이터 ‘분석’에 주로 관여하는 사람들을 말합니다. 가공, 분석, 활용, 평가, 의사결정이라는 데이터 전반의 프로세스에 참여할 기회는 극히 제한적이죠. 이들에게 주어진 역할은 주로 탐색적 현황 파악과 상관관계 분석, 원인 분석 등이며, 분석의 원천이 되는 데이터의 품질 관리 및 전처리 가공 작업에 관여하기도 합니다.
반면 데이터 사이언티스트는 이보다 더 폭넓은 범위에서 데이터를 다루는 사람들입니다. 앞서 언급한 데이터 활용 프로세스 전반에 참여하며, 문제의 가능성을 예측하고, 그 해결방안을 도출하거나 새로운 인사이트를 도출하는 사람들이죠. 다시 말해, 과거 데이터를 바탕으로 한 일반적인 기초 통계를 통해 전반적인 상황을 파악하는 ‘현황분석’과 과거와 현재 데이터에 기초하여 실제 존재하고 있지만 모르는 사실을 추적정하거나 가까운 미래에 발생할 가능성이 있는 사안을 추측하는 ‘예측분석’, 그리고 분석 모델의 실제 실행 시 가장 바람직한 결과가 예상되는 모델이 무엇인지를 분석하는 ‘최적화 분석’ 전반을 아우르는 사람들이 바로 데이터 사이언티스트라 할 수 있는 겁니다.