최근에 데이터 과학 관련 영상을 챙겨보고 있다. 커리어 변신을 할 계획은 없지만 데이터 관련 소양은 갖출 필요가 있겠다 싶었다. 그러다 문득 데이터 분석가와 데이터 과학자에는 어떤 차이가 있을까라는 의문이 들었다. 어렴풋이는 알 것만 같으면서도 모르겠어서, 이번 기회에 나만의 언어로 정리해두려 한다(물론 사전적/업계의 정의가 있기는 하지만).
데이터 분석가는 현재 해결해야 할 문제에 집중한다. 지금까지의 데이터를 기반으로 중요 수치를 뽑아내는 일, 알기 쉽게 요약하고 시각 자료를 만드는 역할을 맡는다. 유튜브로 치면 '한국어 영상에 영어 자막을 달았을 때의 조회수 차이' 같은 주제를 파고드는 것이다. 조회수 차이는 어떻게 되는지, 시청자 성별이나 국가에 따라 차이가 있는지, 다른 언어와는 어떤 차이점이 있는지를 분석한다. 분석한 내용을 토대로 자막 기능을 강화해야 할지 말지에 대한 결정을 더 쉽게 내리도록 도와주는 것이다. 주로 즉각적이고 손에 와닿지만 다른 팀이 분석하기에는 버거운 문제를 조사한다.
데이터 과학자는 미래를 예측하는 역할을 맡는다. 가장 와닿는 예시로 유튜브 추천 영상 알고리즘이 있다. 사용자가 좋아할 만한 영상을 추천하는 것은 복잡한 문제다. "어떤 영상을 좋아하세요?"라고 물어봤을 때 확실하게 대답할 수 있는 사람은 생각보다 많지 않다. 자기 자신의 취향도 모르는데, 그 취향을 알아내는 기계를 만들어야 하는 것이다. 따라서 데이터 과학자에게는 통계나 분석 스킬뿐만 아니라 코딩 및 사업에 대한 이해까지, 복합적 능력이 요구된다.
어떤 키워드로 검색했는가, 지금까지 어떤 영상을 봤는가, 어떤 영상에 댓글을 달았는가, 플레이리스트는 어떻게 구성되어있는가, 남들이 많이 보는 영상을 챙겨보는 편인가 등 수많은 요소를 고려해야 한다. 그 많은 요소들을 다 고려해야 하는지도 고려해야 하고, 고려한 요소들을 어떻게 묶을 것인지도 고려해야 한다. 데이터를 모으고 분석해 미래를 풀어나갈 모델을 만들고, 그 모델을 발전시키는 일을 한다.
.
.
.
나는 데이터 분석가도 아니고 과학자도 아니다. 데이터에 대해서 깊게 알지 못하는 사람이다. 그런 사람의 눈으로 알아본 차이점이기 때문에 더 와닿게 설명이 되었으면 좋겠다.