+ 꼭 컴공, 통계학 전공이어야 하나요?
이전 글에서도 이야기했듯이 데이터를 다루는 직군은 과거에도 존재했었습니다. 단지, 불리는 이름이 조금씩 달랐고 활용하는 툴이 요즘처럼 다양하진 않았을 뿐입니다. 데이터를 "다루는" 직군은 크게 두 가지로 나눌 수 있겠습니다. (요즘에는 미묘하게 경계선 상에 걸쳐져 있다거나 기존 카테고리에서부터 별도로 분리되어서 표현하기 애매한 직군도 있지만요)
구축하는 사람과 분석하는 사람일 텐데요. 이 두 가지 분류를 보다 쉬운 해석을 위해 '집 짓는 사람'과 '집을 예쁘게 꾸미는 사람'으로 구분해보았습니다. 집은 긴 시간의 공사 끝에 결국 우리에게 안락하고 만족할만한 구조의 공간을 가져다줍니다. 단번에 안락한 공간을 얻을 수 없듯이, 데이터를 이용하여 인사이트를 얻고 비즈니스에 활용하여 대박을 터뜨리기까지의 과정에서 연관된 직군은 다양합니다.
데이터라는 준비물을 어떻게 수집할지, 어떻게 쌓을지, 어떻게 관리할지를 감안하고 설계하는 역할을 하는 직군입니다. 기초 공사를 다지는 역할이죠. 과거에는 DBA(DataBase Architect)와 같은 직군으로 불려 왔습니다. 집의 바닥을 다지고 기둥을 세우고, 지붕을 얹는 일이 완성되면 예쁘게 꾸미는 사람 차례가 될 것입니다.
이 직군을 과거에는 Business Analyst 또는 통계 전문가로 불렀습니다. 통계, 수에 대한 이해력을 바탕으로 정량적으로, 정성적으로 분석을 진행하고 궁극적으로는 비즈니스 개선을 도웁니다. 기초 공사를 통해 예쁘게 저장되어 있는 데이터 그 자체는 아직까지 의미가 없습니다. 이를 의미 있게 바꿔주는 역할이고, '수에 대한 감이 좋은 기획자' 정도로 생각하시면 좋겠네요.
시간이 지나면서 다양한 데이터가 쌓이고, 활용할 수 있는 툴이 증가하고, 기술이 진화되면서 데이터 관련 직군도 세분화되기 시작했습니다.
과거와 유사하게 두 분류로 나뉘는 것은 맞지만, 각 카테고리별 영역이 세분화되면서 직군 간의 하는 일을 명확하게 선을 그어 나누기는 어려워졌습니다. 그래서 종종 회사마다 직군을 일컫는 명칭이 다르기도 해서 본인이 예상하는 업무 영역이 있다면 '자격 요건'과 '주로 하는 일'을 재차 확인해봐야 합니다. 예를 들어 A 회사는 Data Analyst라는 직군으로 데이터를 분석해서 인사이트를 도출하는 역할을 요구하고, B 회사는 Data Analyst라는 직군으로 Data Analyst(데이터 분석) + Data Scientist(신기술 연구하여 새로운 분석 모델 적용)의 역할을 요구하는 경우도 있습니다.
Data Engineer는 여전히 '집을 짓는 사람'이고, 데이터 파이프라인(데이터 흐름의 구조)을 잡는 사람을 말하고 기존의 DBA와 겹치는 영역도 존재할 수도 있지만(Database에 대한 이해와 지식이 있는 분이라면요. 하지만 많은 부분이 연결되어 있기 때문에 결국 DB에 대한 지식이 있을 수밖에 없다고 생각합니다.) 분석을 하거나 예측 모델을 만드는 부분을 이 분들에게 요구하지는 않습니다.
DBA와 Data Analyst는 앞서 설명하였고, 새롭게 보이는 직군이 Machine Learning Engineer와 Data Scientist이겠습니다.
관련도 정도를 표현하자면
Data Analyst ~ Data Scientist ~ Machine Learning Engineer 이겠습니다.
굳이 왜 이렇게 나누기 시작했냐고 물으신다면, 해야 되는 일이 점차 많아져서 그렇다고 말씀드리고 싶습니다. 한 직군이 수행하기 이제는 너무나 많은 양이라 분리하기 시작한 것이지요.
Data Analyst이면서 예측 모델을 만드는 일도 많이들 수행합니다. 하지만 여기서 조금 더 나아가 요즘 나오는 논문들을 읽고 코드를 짜서 우리 비즈니스 모델에 적용해보고 그 효과를 분석하는 일은 Data Scientist가 수행하게 됩니다. 들어보셨을 법한 ML(Machine Learning)/ DL(Deep Learning) Model을 적용해보는 직군입니다.
그리고 여기서 조금 더 개발자스러운 역할, 즉 Data Scientist가 만든 모델을(혹은 Machine Learning Engineer가 직접 만든 모델을) 시스템 효율 관점에서 개선한다거나 서비스에 적용하여 배포하는 일에 치우쳐져 있으면 Machine Learning Engineer라고 부릅니다. '집 짓는 사람'과 '예쁘게 꾸미는 사람'의 중간인 '리모델링하는 사람'으로 볼 수도 있겠네요.
Data Scientist는 Data Analyst 관점에서 본다면 개발자보단 연구자스럽다는 표현이 맞겠고, Data Engineer관점에서 Machine Learning Engineer도 연구자에 가까운 개발자라는 표현이 적절하겠습니다.
개발에 관심 있으시다면 Data Engineer
개발과 신기술(ML, DL)을 접하고 싶으시다면 Machine Learning Engineer
기획자 역할을 하는 영역이 궁금하시다면 Data Analyst
ML, DL 모델 개발/적용에 관심이 있으시다면 Data Scientist
로 커리어를 가져가시는 편이 좋겠습니다.
다시 한번 당부드리는 말씀은 이 정의는 저의 경험을 통한 해석입니다. 되도록이면 일반적인 내용으로 다루려 하였지만, 회사마다 정의하는 내용도 다르고 요구하는 역량도 보다 세분화될 수 있으니 자세한 내용은 꼭 찾아보시길 바랍니다!
본 매거진의 주제가 '(뻔하지 않은) 데이터 분석 입문서'이기 때문에 앞으로의 연재 글에서는 '데이터 분석가'가 하는 일, 가져야 되는 역량을 경험에 대해 자세히 다룰 예정입니다. '기획자'의 역할이라고 한 단어로만 표현하였지만 여러 의미가 담겨 있고, 그 의미를 보다 많은 분들이 쉽게 이해하실 수 있도록 풀어나가도록 하겠습니다.
이 질문은 제가 정말 정말 정말(x100) 많이 받는 질문이라 이번 글에 함께 넣었습니다. 몇 년 전에는 크게 상관이 없다고 생각했었는데, 현실적으로 저와 제 주위 사람들 경험을 비추어 보았을 때 위에 말한 전공이 아니면 접근하기 조금은 어려울 수도 있습니다. 접했던 지식이 달라서인데요.
우리가 어떤 지식을 처음 배울 때 어려움을 겪는 가장 큰 이유는 단어에 익숙하지 않아 겁을 먹어서 라고 생각합니다. 이 장벽을 넘지 못하면 안타깝게도 포기하는 경우가 많습니다. 본인이 무엇을 모르고 있고 무엇을 알아야 되는지 조금이나마 그림이 그려지신다거나 평소 새로운 지식 습득에 스트레스가 크지 않으신 분이라면 충분히 가능하다고 말씀드리고 싶습니다. 구조를 알면 이해하기 쉽지만 또 한 편으로는 구조를 알고 나서 스스로 배워나가야 할 내용이 아주 많은 분야입니다. 데이터에 대한 열의가 있으신 분이라면 이 과정도 매우 기쁘게 받아들일 것이라 생각합니다.
제 주위에도 문과를 전공하고서 Data analyst, Machine Learning Engineer, Data Scientist 등 다양한 분들이 전공과는 다른 직군에 종사하고 계십니다. 남들과 다른 자산(asset)을 보유했기 때문에 더 좋은 성과를 보이시는 분들도 계시고요. 공통점을 본다면 다들 데이터 관련한 업무를 시도해보고 본인에게 맞는지(잘하는지, 재밌어하는지, 이거면 밤을 새워도 지치지 않는지) 판단한 다음 커리어를 전환하신 경우입니다. 전공만으로 판단하긴 어려우니, 이 참에 한 번 시도해보시는 것이 어떨지 제언드립니다.