brunch

You can make anything
by writing

C.S.Lewis

by 기억하기쉬운 May 16. 2020

문과 출신도 데이터 분석가가 될 수 있을까?

개인적 경험을 바탕으로 본 문과 출신이 신입 데이터 분석가로 취업하는 법

안녕하세요!

행정학도로 대학에 입학해서 한동안 공시를 준비하다가 지금은 국내 통신사 데이터 분석가로 일하고 있는 '기억하기쉬운'입니다. 문과 계열 대학생 분들이나 취준생분들이 '데이터 분석가'라는 직업에 대해 관심은 많지만 어떤 식으로 취업을 준비해야 할지 모르겠다는 이야기를 여러 루트를 통해 듣고는 합니다. 일반화할 수는 없지만, 저 또한 문과에서 복수전공과 대학원을 통해 전공을 바꾼 입장에서 데이터 분석에 대한 개인적인 경험과 생각을 나누고자 합니다!^^

첫 번째 에피소드는 문과와 데이터 분석가에 대한 내용입니다.


<목차>

1. 문과란 무엇인가?

    - 전공계열 / 수학; 보여주는 이과, 설득하는 문과

2. 데이터 분석가에게 전공보다 중요한 것은?

    - 도메인 지식과 분석 경험

3. 문과 출신 데이터 분석가의 장/단점은?

    - 모델 이해는 느릴 지라도 눈높이 설명과 해석이 강점!



1. 문과란 무엇인가?


일단, 문과 출신 데이터 분석가라는 이야기를 하기에 앞서 '문과'에 대해 간단히 짚고 넘어가고자 합니다.

일단, 문/이과는 영미권에는 없고 우리나라, 일본 등에서 있는 특이한 개념이라고 합니다. 정규 교육과정에는 존재하지 않지만, 고등학교 2학년에 들어가면서  문과반과 이과반이 나뉘고 수학을 배우는 양, 어떤 탐구 영역(사회 / 과학)을 배울 지 등이 달라집니다. 대학에 올 때도 교차지원은 가능하지만 문과는 인문 / 사회 / 경영경제계열학과로, 이과는 자연 / 공학 / 의약학계열로 주로 진학을 하게 됩니다.

뼈 속까지 문과인 저가 생각하기에는 문과와 이과의 결정적인 차이를 '보여주는가? 설득하는가? 의 차이'라고 생각합니다. 예를 들어, 수학 공식을 증명하거나 설계를 통해 공정을 효율적으로 바꾸거나, 프로그램을 짜는 데에는 추가적인 설명이 필요하지 않습니다. 말이 되고, 실제로 작동을 하고 결과가 개선이 되었다면 더 이상의 설명이 필요할까요? 반면에, 새로운 서비스 / 광고 기획을 하거나, 정책의 당위를 설득하거나 글이나 작품을 만들어가는 데에 있어서는 '이게 왜 중요하고, 유명한 사람들은 뭐라고 했으며, 유사 사례는 무엇이 있으며,  예상되는 결과는 어떻게 해석할 수 있는지' 앞 뒤에 부연 설명이 필요합니다. 정답이 있을지 없을지는 모르기도 하고 사람마다 다른 답을 내놓기 때문에 자신의 답을 다른 사람들에게 설득하는 작업은 문과가 거쳐야 할 필연이라고 생각합니다.

많은 분들이 아무래도 데이터 분석을 할 때 사용되는 여러 통계 모델들을 이해하는 데에 선형대수, 행렬 연산 등의 수학이 사용되니 '데이터 분석 또한 이과 출신들의 영역이 아닌가?' 하는 생각을 많이 하는 거 같습니다. 그럼 데이터 분석가가 되기 위해서는 이과 계열 전공을 선택해야만 하는 걸까요? 문과의 강점을 가지고 분석가로 일할 수 있는 역할은 무엇이 있을까요?



2. 데이터 분석가에게 전공보다 중요한 것은?


먼저, 짚고 넘어가야 할 것은 데이터 분석에서 중요한 3요소는 분석 모형 및 통계 지식, 컴퓨터 프로그래밍과 엔지니어링, 도메인 지식입니다. 여기서 말하는 도메인 지식이란 분석을 설계하고 데이터와 분석 결과를 해석하는 데에 필요한 배경 지식으로 볼 수 있습니다. 



[데이터 사이언스의 핵심 컨셉, Michael Barber]


개인적으로는 '데이터 분석가에게 전공이 크게 중요한가?' 싶습니다. 제가 공부했던 행정학과 통계학과 마찬가지로 데이터 분석이란 '도구적 성격'이 강하고 각자가 알고 있는 도메인 지식과 분석 경험이 '분석가의 개성'이 되기  때문입니다. 예를 들어 행정학을 보면 영미권의 대학에선 학부에 행정학과가 드물고, 대학원에서 함께 공부를 하며 각자의 배경에 따라 교육행정, 도시개발행정, 환경행정 등의 분야를 깊게 다루게 된다고 합니다. 마찬가지로, 통계학 또한 큰 틀에서는 하나로 묶이지만 세부적으로는 임상실험 설계, 실험, 역학조사와 샘플링, 제조 공정 관리, 국가 경제 시계열 분석, 사회 실험 및 설문조사 설계 및 분석 등 서비스되는 영역에 따라 전문적인 분석 기술과 해석 방법이 존재합니다. 또한 데이터도 변수가 무엇을 의미하는지 해석해야 하고, 데이터마다 적절한 분석 모형과 적용할 수 없는 모형이 존재할 수 있습니다. 그러다 보니 분석 스킬과 컴퓨터 활용 능력이 아무리 뛰어난 분석가라고 하더라도 생소한 분야의 생소한 데이터를 다루기는 쉽지 않스빈다. 반면, 해당 분야를 잘 알고 있는 분석가는 비록 통계학 지식이 부족하고 코딩이 부족하더라도 쉬운 분석 툴을 사용하거나 해서 부족한 부분을 채워나가면 더 나은 결과를 보여주기도 합니다. 실제로 의사, 역사학도, 축산학과 전공의 분들이 자신만의 개성으로 일하시는 분야에서 멋진 분석 결과물을 공유해주신 것이 인상 깊었습니다.

그렇게 생각하면 '데이터 분석가가 되기 위해 필수적으로 가야 되는 학과나 코스'는 없다고 봐야 할 듯합니다.  정작 전공보다 중요하다고 느끼는 건 앞서 언급한 도메인 지식과 더불어 '데이터를 바라보는 감각'이라고 생각합니다. 너무 추상적이니 지금 생각나는 것들을 정리해보자면 아래와 같습니다.


< 데이터 감각과 관련된 질문>

- 데이터를 받고 처음 점검해야 하는 것들?

- 데이터 형태에 따라 적용할 수 있는 시각화?

- 결측치를 제외하고 분석할지? 아니면 어떤 값으로 대체할지?

- 새롭게 해석해낼 수 있는 파생변수가 있는지?

- 데이터를 이해하고 예측하는 데에 적절한 모델은 무엇인지?

- 데이터 분석을 소비할 고객에게 어떠한 정보를 제공하고 설명해 줄 것인지?


이런 것들은 통계학과 등에서 여러 과목들을 통해 이론적으로 배우기는 하지만, 실질적으로는 데이터를 붙들고 여러 가지를 고민하는 시간을 통해 길러지는 것 같습니다. 다른 사람들의 분석 리포트나 경험담을 통해 전수받는 것도 크긴 하지만, 새로운 데이터를 본다면 결국 자신이 '데이터의 어떤 부분을 바라보고, 어떻게 바꾸고, 어떻게 설명할 것인가?'에 대해 하나하나 결정해야 하기 때문이죠. 그런 점에서 통계학과나 산업공학과, 소위 말하는 '데이터 분석가가 되기 위한 학과'에서 정규 과정을 통해 안정적으로 시간을 확보해서 데이터를 보는 게 편하기는 하지만 도메인 지식이 있고, 데이터를 다뤄본 시간이 많으시다면, 다른 분야의 전문가분들도 '필수 스킬'들만 갖추면 충분히 데이터 분석가라고 볼 수 있지 않을까요? 



3. 문과 출신 데이터 분석가의 장/단점은?


'그럼 아무나 분석을 할 줄 알면, 데이터 분석가가 되는 건가요?'라는 질문이 나올 수도 있을 거 같습니다. 어느 분야든 데이터를 많이 보고 여러 고민을 하면 데이터 분석가가 될 수 있다고 했으니깐요. 하지만 데이터 분석가로서 회사에서 기회를 잡는 것 또한 다른 문제라고 생각합니다. 내가 아무리 능력이 있고 몇몇 분야의 데이터를 다뤄봤어도 분석가로 취업을 해서 기회를 잡는 건 쉽지 않습니다... 특히, 아직 취업을 준비 중인 문과 학생과 취준생 입장에서는 앞선 이야기들이 뜬구름 잡는 이야기로 느껴질 수 있을 듯합니다. 그럼 문과 출신 데이터 분석가라도 자신이 어필할 수 있는 부분을 최대한 강조해서 면접과 자소서에 녹여내야겠지요. 

일단, 원론적인 이야기부터 하면, 문과 출신 데이터 분석가는 모델에 대한 이해는 조금 떨어질 수도 있지만 분석의 고객에게 이를 전달하는 역할에 집중하고 경쟁력을 갖춰야 한다고 생각합니다. 많은 ML(Machine Learning) / DL(Deep Learning) 모델을 이해하고 데이터에 적합한 모델을 선택하는 일은 많은 공부와 경험이 필요한 일입니다. 그리고 여기에는 수학적인 이해도가 필요합니다. 그래서 데이터 분석가가 되기 위한 여러 준비과정에서 수학을 강조하고 있는 것이지요. 한 명의 데이터 분석가로서 바로 서기 위해서는 이러한 내용들을 따라잡는 것도 필요하지만 일단은 자신이 잘할 수 있는 것에 집중하는 게 먼저라고 생각합니다. 데이터 분석 결과가 와 닿지 않는 분석 고객, 예를 들어, 기업의 의사결정자, 일반인들에게 데이터 분석의 목적과 과정을 설명하고 이 분석이 왜 중요하고 무엇을 의미하는 지를 설명할 때는 그들과 같은 입장에서 있어 봤던 분석가가 더 낫지 않을까요? CEO 보고 때 모델의 수식을 써놓고 이해 못하는 CEO에 대해 한숨 쉬고 있을 수는 없으니깐요..ㅋㅋㅋ 개인차가 더 큰 부분이기는 하지만, 문과에서 글쓰기와 발표 기회를 더 많이 가지게 되고, 소통하는 역량을 기를 기회가 많으니 수학에 대한 이해가 약하다면, 이해한 내용을 잘 설명할 수 있는 능력을 기르는 데에 집중해야 한다고 생각합니다. 실제로 이제는 많은 기업에서 'Auto ML'이라고 해서 데이터를 넣으면 자동으로 최적의 모델을 찾아주는 도구들을 적용하고 있기 때문에 모델을 선정하는 '모델러'가 많이 필요한 상황은 아닙니다. 오히려 분석 과제를 기획하고 분석 결과를 해석해서 보고하는 분석가 자리가 더 많이 필요한 상황이죠. 이러한 환경변화에 맞춰서 자신이 잘할 수 있는 것에 집중해보는 것은 어떨까요?


마치며

저는 개인적으로 자소서와 면접을 준비하면서, 개인정보를 민감하게 다루고 정부 정책에 영향을 받는 통신사에는 기왕 분석 역량이 비슷하다면 행정학 출신의 통계 석사가 더 필요할 것이라고 어필했고 이 부분이 면접에서 긍정적으로 작용했다고 생각합니다. 그리고 최근 '마이 데이터', '데이터 크롤링 관련 저작권' 이슈를 바라볼 때도 그나마 빠르게 흘러가는 상황을 파악하는 데에도 제가 행정학을 공부한 내용들이 도움이 되고 있습니다.

'저는 수학을 잘 못하고 통계학이나 산업공학은 공부해본 적이 없는데 데이터 분석가가 될 수 있나요?'라고 질문을 한다면 저는 이렇게 대답하려고 합니다. 

'데이터를 분석하는 데에 필요한 기초가 부족하면 쉽지 않을 거고 능력을 인정받기 위해 더 많은 레퍼런스들을 제출해야 할 것입니다. 하지만 이를 이겨내고 자신만의 캐릭터를 발전시키고 강점에 집중한다면 유일무이한 분석가로서 활동할 수 있을 겁니다.'

마지막으로 하고 싶은 말은, '문과든 이과든 처음엔 모두가 다 어렵다는 말입니다.' 처음 통계학과 복수전공을 시작해서 통계학 수업을 듣고 데이터 분석을 시작할 때는 다들 다 이해하고 할 줄 아는데 저만 못하는 줄 알았습니다. 그런데 시간이 지나고 주변을 돌아볼 여유가 생기다 보니 어려운 내용은 남들도 어렵고, 어차피 정말 잘하는 사람은 따라잡을 수 없으니 내가 배워갈 것에 집중하고 할 수 있는 것을 늘려가는 데에 집중하게 되었습니다. 아직도 분석을 배워나가고 있지만 재미있는 작업 같고 더 많은 분들이 자신만의 시각으로 데이터 분석을 해보셨으면 합니다.


아무쪼록  다음에는 '통계학 석사와 데이터 분석'이란 주제로, '대학원 경험'과 '석/박사 커리어가 취업을 하는 데 필요한 지' 대해 다뤄보려고 합니다.


글 읽어주셔서 감사합니다.^^



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari