기획일을 하던 문과생이 거대함에 접근한 여정
빅데이터는 허상이야
라는 말이 심심찮게 들려왔다.
역설적이게도 '허상이야'라는 말과 함께 대용량의 데이터를 활용하기 위한 방안으로 데이터 분석, 데이터 사이언스에 대한 수요는 지속적으로 증가했다. 필자가 처음 '빅데이터'라는 용어에 관심을 가진 것은 2015년이었다. 그 때부터 시작되었다, 대체 데이터란 무엇인가?
'빅데이터'라는 용어를 처음 알고 '데이터 사이언스'라는 용어를 알기 까지 시간이 꽤나 걸렸다. 데이터를 분석하는 것에 관심은 있었지만, 어떤 분야와 일이 있는지 찾아보지는 않았기 때문이다. 회사에서 SQL을 조금씩 배우고, 데이터 추출을 해보고, 통계 분석을 하면서 비로소 '빅데이터' 분야의 직업을 가져야겠다는 생각이 들었다. 데이터 관련된 일을 배우고싶었고, 이 분야에서 커리어를 쌓고싶었다.
데이터 관련 일을 하고싶어요!
이 말을 뱉었을 때 주변에서 돌아온 말은 '그래서 무엇을 하고싶은데?' 였다. 막연하게 데이터 관련 일이면 다 좋다고 생각했었는데, 지금와서 생각해보면 굉장히 모호한 말이었다. '데이터'라는 말에는 다양한 업무 분야가 있었으며, 도메인만 따지더라도 굉장히 광범위했기 때문이다. 엔지리어링을 하는 친구는 '데이터 엔지니어가 하고싶어?' 라고 물었고, 컴퓨터 과학을 공부한 친구는 '딥러닝이 하고싶어?' 라고 물었다. 대학원을 다니던 친구는 '데이터 관련 학과가 요즘엔 많아'라는 말을 해줬다. 데이터는 무엇이고, 대체 나는 뭘 공부하고 어떤 일을 찾아야할까? 이 물음이 그 당시의 나의 혼란함 가운에 자리 잡았다.
무작정 시작해야지
모를 때는 무엇을 해야하는가? 눈 앞에 보이는 것을 일단 하면 된다. '데이터'라는 말일 들어가는 것을 일단 해보기로했다. 아무것도 모르니 주워들은 것을 검색해서 강의를 들어봤다. hadoop, AB test, python. 관심을 가진 첫 해에 수강한 온라인 강의의 키워드들이다. 개별의 강의를 들으면서 '데이터 사이언스'라는 말을 처음 접하게 되었다. 국내에 여러 강의 플랫폼이 데이터 사이언스 코스를 운영하고 있다는 것도 알게되었다. 해당 대학원들이 각광을 받고있다는 것도 알게되었다. 그렇다면 내가 하려는 것은 '데이터 사이언스인가..?'
드디어 시작된 데이터 사이언스에 대한 고민
'데이터 사이언스'라는 말을 교육 플랫폼, 대학원에서 쓰고 있었기 때문에 데이터 유관된 분야를 모두 데이터 사이언스라고 부르는 것인가? 라는 생각이 들었다. 그렇다면 나는 데이터 사이언스를 해야하는 것인가? 데이터 사이언스는 뭐지? 라는 질문도 꼬리의 꼬리를 물고 생겨났다.
가장 큰 것은 '데이터 사이언스란 무엇인가?' 였다. 혹자는 머신러닝이라고 했고, 혹자는 머신러닝과 딥러닝을 아우르는 개념이라고했다. 다른 이는 데이터를 다루는 일을 데이터 사이언스라고 말하기도 했다. 이에 대한 개념을 잡는 데에 도움이 되었던 강의를 듣게 되었다. 서울대 데이터사이언스 대학원 세미나 강의였다. (서울대 데이터사이언스 대학원 홈페이지에 가면 세미나 강의를 들을 수 있다) 결론적으로 데이터 사이언스는 데이터로 과학을 하는 학문이다. 수백, 수억의 데이터 가운데 의미를 찾고, 문제의 답을 찾기 위한 방법을 연구하는 것이다. 이 의미를 찾기 위한 방안으로 알고리즘을 도메인에 맞춰 최적화 하는 방안을 연구하기도 하고, 새로운 머신러닝 기법을 찾아내기도 한다. 필요하다면 딥러닝을 사용할 수도 있다. 데이터 사이언스의 목적은 단순히 '새로운 머신러닝 기법을 찾아내는 것'이 아니라, 데이터를 활용할 수 있는 '방법'을 연구하고 찾아내는 것이기 때문이다.
강의를 듣고, 유관 논문을 읽으며 생각을 정리했다. 그리고, 내가 원하는 방향이 바로 '데이터 사이언스'임을 깨달았다. '데이터로 무엇을 하고싶은가?' 생각했던 해답을 '데이터 사이언스' 연구를 하며 찾아갈 수 있을 것이란 확신이 들었기 때문이다. 자, 드디어 길을 찾았다. 그리고 시작해야 할 단계가 왔다. 무엇부터 시작할 수 있지?
시작합니다 드디어
필자가 데이터 사이언스 공부를 하겠다고 결심을 한지 이제 1년 반 정도가 지났다. 지금의 상태를 이야기하자면, 아직 대학원에 진학하지 못했다. 대학원에 진학하기 전에 개인적으로 공부가 필요한 분야가 있었기 때문이다. 그렇다고해서 아무것도 준비하지 않았나? 라고 묻는다면 당연히 대답은 '아니다' 다. 1년 반이란 기간 동안 회사를 다니며 준비를 하며 바쁘게 지냈다. 그리고 올 해 돌아오는 10월, 드디어 대학원에 가려고 한다. 준비하던 것을 마무리하고 새로운 도전을 하는 시기이기에, 그 간의 준비 과정과 앞으로의 대학원 준비를 글로 정리하려 한다.
말머리에 이야기를 하려다가, 이 글을 끝까지 읽는 분들을 위해서 마지막에 필자의 상황을 좀 더 적는다. 필자는 문과 출신으로, 광고, 홍보, 기획일을 해왔다. 데이터 관련 일을 하고싶다는 막연한 생각으로 SQL, Python 공부를 혼자 하고, 좋은 기회를 만나 데이터분석 파트로 업무를 바꿨다. IT 부서에서 유일한 문과생으로 일을 한 적도 있었고, 매일 새로운 인프라쪽 업무를 이해해보려 우당탕탕한 나날을 보내기도 했다. 필자의 시작은 미약했고, 아직 가야 할 길도 멀다. 새로운 시작을 하는 많은 이들이 동일하게 느끼듯이. 그래도 아직 인생의 길이 많이 남았기에, 그리고 계속 버티다 보면 무언가를 이룰 수 있다는 생각으로 지금의 길을 지속해보려 한다. 이 글이 누군가에게 용기가 되길, 함께 걸어갈 수 있는 힘이 되길 바라며 정리를 시작한다.