brunch

You can make anything
by writing

C.S.Lewis

by 허주부 Jan 11. 2019

데이터 분석가의 일상은?

우아한형제들 권정민 데이터 분석가 특강 후기

2018년 7월 26일의 기록입니다 - Photo by ev on Unsplash


사실 이 시간에 글을 쓰는 건, 합리적이지 않아요. 그 이유는 첫째 내일 9시까지 성수역 패스트캠퍼스에 가야 하기 때문이며, 둘째 글을 쓰는 대신 nosql 퀴즈를 준비하거나, 팀 프로젝트를 진행하는 것이 나에게 더욱 유익하기 때문이지요. 이외에도 내일 수업에 지장을 줄 것이다, 요즘 잠이 부족했다 등, 오밤 글쓰기가 비합리적인 이유는 많습니다. 그런데도 글을 쓰는 이유는, 지금은 잘 모르지만 끝나면 ... 알지 않을까요?


각설하고. 패스트캠퍼스는 수강생에게, 스쿨 과정 중 현업자와 만날 수 있는 기회를 제공합니다. 지금까지 카카오뱅크, 솔리드웨어, 지속가능발전소에서 데이터 분석가 혹은 엔지니어가 자신의 분야, 직무에 대해서 소개했지요. 산업, 기업, 현업자의 경력에 따라 차이는 있었지만 모두 유익한 강의였습니다. 빡센 데이터사이언스스쿨 과정을 듣다 보면, 내가 왜 강의를 듣고 코드를 짜고 있는지 잊을 때가 종종 있는데요. 그럴 때, 현업자 특강은 수강생으로 하여금 강의, 프로젝트, 테스트라는 굴레에서 벗어나 먼 미래를 보도록 합니다. 물론, 그 순간은 무척 짧지만.


오늘은 우아한 형제들의 데이터 분석가, 권정민님이 왔어요. 정민님은 SK Planet, 포스텍, (어딘지 모를) 스타트업, 그리고 우아한 형제들 등 여러 기업을 넘나들며 데이터 분석 업무를 하셨다고 해요. 다양한 산업, 여러 기업에서 1x이라는 적잖은 시간 동안 근무한 만큼 정민님이 말하는 필드의 이야기에는 힘이 있었습니다. 정민님의, 폭포처럼 쏟아지는 이야기를 들으며, 덕분에 데이터사이언티스트가 21세기 가장 섹시한 직업이라는 말이 얼마나 구라인지 깨달은 건 덤이고요. 다음은 깨달음 나눔입니다.








시작하기 전 약간 밑밥 깔면, 데이터 관련 직무는 일반화하기 어렵습니다. 그 이유는 산업에 따라, 기업 규모에 따라, 그리고 의사 결정권자의 데이터에 대한 이해도 혹은 니즈에 따라 데이터 관련 직무가 상이하기 때문이지요. 그러나 데이터 직무를 꿰뚫는 공통분모는 존재합니다.




첫째, 데이터 관련 직무는 터프하다.


당신은 데이터 생태계에 첫 발을 디딘 데이터 꿈나무입니다. 스쿨을 막 수료한 당신은, 알고리즘을 활용하여 모델을 만들고, 데이터를 돌리고, 인사이트를 도출하고, 나아가 회사에 전사적 변화가 나타나는, (동료와 상사는 당신을 우러러보는) 그런 상황을 상상할지도 몰라요.(ㅋㅋㅋㅋ) 그러나 현실은 무척 다릅니다. 1x년차 데이터 분석가 정민님에 따르면, 데이터 분석가의 일상은 데이터를 정제하고, 정제하고, 또 정제하는 것의 반복입니다.(ㅠㅠ) 게다가 데이터를 아예 구할 수 없는 상황이면, 다른 부서와 소모적 커뮤니케이션을 감수하면서도 데이터를 확보해야 하지요. 물론, 데이터 정제 작업 후 모델링을 할 수 있지만, 그 비율은 정말 많아야 4 대 6, 적으면 2 대 8 수준입니다.(스타트업의 경우, 0에 수렴하지 않을까요..?) 원하는 일을 하기 위해, 반복 작업에 많은 시간을 쏟아야 하는 셈입니다.




둘째, 여전히 전통 통계 모델, 분석 툴에 대한 역량을 요구하는 산업, 기업이 있다.


데이터사이언스스쿨 과정은 선형대수, 미적분(최적화), 확률론, 파이썬(+패키지)부터 다양한 머신러닝 모델까지 배웁니다. 어렵사리 배운 만큼, 다양한 모델을 현업에 적용하고 싶은 마음이 굴뚝 같을지도 모릅니다. 그러나 필드에서는 최신 머신러닝 모델을 활용하기 어려울 수도 있습니다. 그 이유는 데이터 분석으로 도출한 인사이트를 비즈니스에 적용하기 위해서는, 설명력(근거)을 갖춰야 하기 때문입니다. 험난한 비즈니스 월드에서는, 뛰어난 퍼포먼스도 중요하지만 그 퍼포먼스를 검증할 수 있는 안전 장치도 중요합니다. 실제로 카카오뱅크 데이터 분석가에 따르면, 협업에서는 오픈소스 툴(R, python)을 활용한 모델의 퍼포먼스에 대해서 그 누구도 책임을 지지 못하기에 퍼포먼스를 보증하고 책임질 수 있는 sass를 활용하는 경우가 종종 있다고 합니다. R, Python 뿐만 배우고 만족해서는 안 된다는 말이지요.(물론 이건 R, python을 사용하지 않는 기업을 거르면 해결되는 문제! .... ㅠㅠ)




셋째, 수학, 코딩 능력이 전부가 아니다.


구글에 “data scientist”라고 검색하면, 모던 데이터 사이언티스트가 갖추면 좋은 역량을 명시한 인포그래픽을 볼 수 있습니다. 크게 수학(통계학), 프로그래밍(데이터베이스), 도메인지식으로 나눌 수 있는데, 특히 수학과 프로그래밍은 데이터 사이언티스트가 되기 위한 필수 요건입니다. 그러나 여느 산업 분야처럼, 위 두 가지 역량이 전부는 아닙니다.


앞서 언급한 것처럼 데이터 사이언스 분야는 터프합니다. 건전하고 타당한 결과(명제)를 획득하기 위해서는, 꾸준히 노동력을 투입하여 데이터 수집, 정제 작업을 해야 하기 때문입니다. 그뿐만 아니라, 계속해서 새로운 지식, 기술이 쏟아지기 때문에 바쁜 와중에도 끊임없이 배워야 합니다. 그래서 이 직무를 지속적으로 하기 위해서는 역량도 중요하지만 겸손과 인내가 필요하다고 하네요.








특강이 끝나고 1주일이 흘렀습니다. 지금 다시 정리하고 보니, 내가 무슨 영화를 누리자고 데이터사이언스 분야에 들어와서 영고(영원한 고통)을 받나 싶습니다. 솔직히 저는 난해한 수식을 단번에 이해하는 수학 고수도, 한번 본 코드를 곧바로 적용할 수 있는 코딩 고수도, 그렇다고 실험 설계 능력이 쩐다고 할 수도 없으니깐요.


하지만 이미 스쿨 드랍 시기는 지났고, 이제 할 수 있는 건 자기 합리화 뿐. 매번 그랬던 것처럼, 뒤통수 쓰다듬으면서 끝낼 수밖에요. 나는 수학, 플밍은 잘하지 못하지만 문서(똥글)은 잘 만든다! 나는 혼자서는 개ㅈ밥이지만, 같이 일하고 만드는 건 잘한다! 헛.

매거진의 이전글 다시, 복기
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari