brunch

You can make anything
by writing

C.S.Lewis

by 스토너 Mar 05. 2021

데이터 분석? 나는 속아서 이쪽 길로 왔다


저는 5년차 디지털 마케터였고 변화를 원했습니다. 올어라운드에 가까운 제너럴리스트에서 전문성 있는 스페셜리스트가 되고자 했습니다. 


인스타나 페이스북 광고에서 데이터 사이언티스트 부트캠프를 거쳐서 커리어점프를 하는 전직 마케터분들의 인터뷰를 보고 희망을 얻었습니다. 마케팅이라는 도메인 지식을 가지고 데이터분석가가 된다면 새로운 세상이 펼쳐지리라 생각했습니다.


데이터 엔지니어인 남편은 이쪽 분야는 떠오르는 블루칩이 될 것이며 공급이 수요를 못따라가니 도전해 볼만한 가치가 있다고 했습니다. 남편이 개발자이니 프로그래밍적으로 도움을 받을 수 있을거라 기대해서 더 쉽게 도전할 수 있었던 것이었습니다.



데이터 분석가 하면 뭔가 professional한 이미지가 있다 그러나 현실은..

수학과, 통계학과, 컴퓨터 공학과 출신을
우대하는 이유가 있다

직접 데이터 분석에 뛰어들고 보니 상상과는 다른 현실에 부딪쳤습니다. 데이터를 수집하는 데 있어서의 실력은 웹크롤링을 할 수 있냐 등을 제외하면 다 비슷비슷합니다.


하지만 분석 방법에 있어서 통계학 지식과 프로그래밍 능력은 매우매우 중요합니다. 가장 기초 체력이 되는 능력은 문과생들이 그토록 두려워하는 수학적 사고력입니다. (논리적 사고라고 하면 마음은 조금 더 편해집니다만)


기초체력이라 할 수 있는 이과적 지식이 없다면 누구라도 맞닥뜨리는 당황스러움은 문과생들에게 공포와 걱정이었을 겁니다. 당장 직무 우대란을 놓고 보아도 수학과, 통계학과, 컴퓨터공학과 출신, 석사 우대란 항목이 떡하니 붙어있으니까요


물론 저는 '문과'라서, '비전공자'라서 라는 말을 좋아하지 않습니다. 문과출신이어도 비전공자 출신이어도 노력여하에 따라 얼마든지 전공자들과 나란히 일을 할 수 있고 해보지도 않고 자신감부터 저하시키는 말이라고 여겨지니까요.


대학 4년 전공을 했다고 해서 잘한다기 보다는 그 시간을 어떻게 공부하면서 보냈느냐에 따라 결과가 달라진다고 생각합니다. 그렇다해도 4년을 열심히 공부하며 보냈던 통계학과, 컴퓨터공학 학생을 단시간 내에 똑같이 따라잡기란 쉽지 않은 것도 사실입니다. 어쩔 수 없는 절대적인 시간의 물리적 법칙이 있습니다. 그렇기 때문에 많은 문과생, 비전공자가 초반에 쉽게 좌절하거나 포기하는 일이 발생합니다. 저 역시도 많은 스트레스를 받으며 공부를 하기 시작했습니다.




그렇다면 비전공자, 문과생들이 현실적으로
당면하게 되는 어려움은 무엇일까요?



한정된 시간 대비 많은 공부량


저는 서른 둘에 데이터분석가가 되기 위해 본격적으로 통계지식과 프로그래밍 언어를 배우기 시작했습니다. 

통계쪽도 프로그래밍쪽도 어느 하나 만만하지 않은 분야가 아니었습니다. 


중요한 점은 제가 시간이 많지 않다는 거였습니다. 제가 경력직이고 나이가 있다보니 대학생이나 입사할 때 신입인 취업준비생이 아니기 때문에 이직이나 전직 시 공백기간이 길어지면 길어질수록 불리한 점이 있었습니다. 즉 짧은 시간안에 최대한 많은 지식을 흡수해서 내것으로 만들어야 했습니다. 전직 시 바로 실무에 투입할 수 있게요. 


가장 기본인 기초 통계지식부터 머신러닝 학습을 위한 지도학습인 분류, 회귀 비지도학습인 클러스터링, 차원축소와 알고리즘 종류인 앙상블트리, 로지스틱회귀 등  배워야할 범위는 결코 작지 않습니다. 


한가지 이론만 파도 그 안에 녹여져 있는 지식과 깊이는 퍼내도 퍼내도 끝없는 강물처럼 방대합니다. 데이터 분석가가 수요가 있다고 하지만 서서히 증가하는 추세이고 겉핥기로 배운 기초적인 실력자를 데리고 업무를 한다는 것은 뽑는 사람도 수지가 맞지 않는 일입니다.


대충 배운 실력으로 입사를 한다고 해도 일을 하면서 스트레스 받게되고 취업을 한다해도 오래가지 않아 금방 퇴사를 밟는 수순이 될 게 뻔했습니다.


전문가라는 타이틀은 그리 쉽게 주어지지 않는다


저절로 조급해지는 마음


가장 중요한 하드스킬인 프로그래밍은 시간만 무작정 투입한다고 해서 느는 분야가 아니었습니다.  당장 프로그래밍 언어만 해도 뭐부터 배워야할 지 모를 정도로 기술이 무척 많습니다. 방대한 양의 데이터를 가공하는 데 필요한 필수 프로그래밍 언어는 파이썬이고 통계툴인 R도 잘하면 좋습니다. 


백엔드 프론트 엔드를 잘 알아야 데이터가 어떻게 수집될 수 있고 뒤에서 어떻게 작동하는지 이해할 수 있고요. 데이터 베이스 파이프라인 설계도 공부해야 합니다. Java, python, javasqript Spring vue, node.js, php, DataBase, SQL 등등..거기에 매일 새로운 서비스와 기술이 업데이트 되고 있습니다. 


분산형 빅데이터 분석 플랫폼인 하둡과  컨테이너 오케스트레이션 프레임워크인 쿠버네티스도 요즘 데이터 분석을 공부하는 사람이라면 꼭 알아두어야 부분입니다. 저는 성격이 급했고 짧은 시간 안에 빠른 성장을 하길 원했습니다. 당장의 프로그래밍 실력을 키우는 것보다 눈 앞의 과제를 해결하는 데 급급했습니다. 


그 결과 교육과정 졸업 시 막상 기초 함수를 짜는 것도 힘겨워하는 자신을 발견할 수 있었습니다. 느리더라도 기초는 확실히 잡고 시작해야 처음엔 느리더라도 나중에 실력이 향상되는 속도가 빨라진다는 것을 뒤늦게서야 알게 된 것입니다.


공부..공부...도대체가 끝이 없다...




그럼에도 불구하고 도전할 가치가 있다


프로그래밍에 관심이 있고 뒤늦게 시작하려고 하는 분들에게 괜히 힘 빼는 말을 하려는 건 아닙니다. 뒤늦게 배우면서 자신의 성향과 너무 잘맞아 하루하루 배우는 게 즐겁고 금방 실력이 쭉쭉 느는 분들도 계실거구요.


다만 저는 비전공자, 30대에도 프로그래밍에 도전할 수 있다거나 데이터 분석가가 될 수 있다고 유혹하면서 섣부른 희망을 불어넣고 싶진 않습니다. 현실적으로 어떤 어려움이 있는지 하나 하나 따져보고 그래도 도전해볼만한 가치가 있는지 생각해보는 시간이었으면 합니다. 


저 역시도 현재진행형 도전 중인 사람이니까요 :)

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari