brunch

You can make anything
by writing

C.S.Lewis

by 최혁재 Oct 08. 2018

공짜로 데이터 사이언스 배우기

커버이미지: Photo by Franki Chamaki on Unsplash


증권사와 자산운용사에서 일하다 흥미를 잃어 그만두고 데이터 사이언스를 공부하고 있습니다. 처음에는 패스트캠퍼스니 데이터사이언스스쿨이니 하는 학원을 다닐까도 생각해 봤지만, 월 100만 원은 족히 드는 교육과정에 등록하는 건 수입이 끊긴 백수 입장에서 어려웠습니다. 다행히 인터넷에는 무료 거나 극히 저렴한 양질의 콘텐츠가 넘쳐난다는 사실을 금방 알게 됐습니다. 아쉽게도 대부분 영어로 된 미국 콘텐츠긴 하지만 말이죠.


지난 3개월 동안 Dataquest.io의 Data Scientist in Python Path를 마쳤고, Udemy에서 'Python for Financial Analysis and Algorithm Trading', 'Python and Django Full Stack Web Developer Bootcamp'를 수강했고, 지금은 Coursera에서 Andrew Ng의 Machine Learning을 수강 중입니다. 엄밀히 말하면 '공짜'는 아니었지만, Dataquest는 월 5만 원 정도였고 Udemy 강의들은 과정 당 아메리카노 3잔 정도 가격이니 공짜나 다름없다고 생각합니다. 새삼 이렇게 마음만 먹으면 배울 자료들이 차고 넘치는 세상에 살고 있다는 사실이 진심으로 감사하게 다가옵니다.


계획 상 아직 갈 길이 멀고 배울게 너무 많아 고민이긴 합니다만, <혼자 배우는 데이터 사이언스> 매거진을 통해서 제가 가고 있는 길을 여러분과 나눠보려고 합니다. 


이번 글에서는 Medium.com 에 올라온 유명한 글을 요약 소개함과 동시에 제 경험을 조금 얹어보겠습니다. 원문은 Harrison Jansma의 How To Learn Data Science If You're Broke입니다.




글쓴이 Harrison은 데이터 사이언티스트가 되고 싶었지만 학교나 학원에 다닐 돈이 없었다. 그래서 낮에는 데이케어(탁아소?)에서 최저임금을 받고 일하고 이 외 시간에는 하루 6~8시간씩 온라인 공짜 자료들을 이용해 데이터 사이언스를 공부했다고 한다. 수개월간 노력한 끝에 개인 블로그도 시작하게 됐고, 본인의 글이 유명한 데이터 사이언스 온라인 저널에 기고되기도 했다. 결국 이런 노력이 좋은 포트폴리오로 이어졌고, 지금은 전액 장학금을 지원받고 컴퓨터공학 석사과정에 진학해 공부 중이다.


결국 Harrison 경우에는 스스로 끝까지 공부해서 데이터 사이언스가 된 경우는 아니다. 혼자 공부하던 노력이 장학금으로 연결돼 돈 없이 대학원을 간 케이스긴 하지만 어쨌든 돈 안 드는 길인건 맞으니까, 그가 전해주는 '공짜로 데이터 사이언티스 되는 팁 5가지'를 들어보자.


Photo by Max van den Oetelaar on Unsplash


1. 배워야 할 콘텐츠가 쏟아지는 속도는 당신이 배우는 속도보다 빠를 것이다.


구글링을 해보면 데이터 사이언스 관련 교육자료나 기사는 차고 넘쳐난다. 그래서 곁길로 새기 쉽다. 예를 들어 Logistic Regression 공부를 시작해서 관련 자료를 찾다 보면 Support Vector Machine, Naive Bayes 등 여타 머신러닝 알고리즘들이 눈에 들어온다. 다 재밌을 것 같고 Logistic Regression 만 배우면 안 될 것 같다. 다 좋은 알고리즘들이라고 하니 다 배우고 싶다. 그래서 Logistic Regression 도 제대로 공부하기 전에 이런저런 알고리즘 종류들만 훑어보다 하루가 다 가곤 한다.


그래서 Harrison이 추천한 방법은 좋은 콘텐츠 저장 시스템을 구축하라는 거다. 그냥 즐겨찾기 관리를 잘 하라는 말이다. 안 그래도 넘쳐나는 인터넷 자료들에 머리가 아프던 차에 나도 바로 적용해봤다.


별거 아닌 팁 같지만 따라 해 보면 정말 실용적이다. 무엇보다도 이제 새로운 콘텐츠를 만나도 삼천포로 바로 빠지기보다는 바로바로 즐겨찾기에 저장해 두는 습관이 생겼다. 그리고 지금 하고 있는 공부를 우선 끝낸다. 그러다 공부하기 싫고 그냥 웹서핑이 좀 하고 싶고 그럴 때 즐겨찾기를 훑어보면서 새로운 콘텐츠들을 탐험하고 필터링하고 흡수한다. 넘쳐나는 컨턴츠의 바다에서 파도에 휩쓸려가지 않으려면 꼭 즐겨찾기 관리를 잘 하도록 하자.


2. 괴로워하지 말자. 이건 스프린트가 아니라 마라톤이다.


이건 뭐 별다른 설명은 필요 없을 듯하다. 개인적으로는 지금 3개월 정도까지는 지치지 않고 점점 더 재밌어 지기만 해서 스프린트 중이다. 이건 어쩌면 내가 데이터 사이언스 딱 하나만 하는 게 아니라, 웹개발을 같이 공부하고 있어서 그런지도 모른다. 그리고 이번 주까지 MBA 지원하느라 애도 많이 먹었기 때문에 온전히 데이터 사이언스만 해온 것은 아니다. 하나만 하면 금방 질리는 성격인데, 여러 가지를 동시에 해서 아직 스프린트가 즐거운지도 모르겠다.


3. 배우고 적용하고 반복하자.


이것도 2번처럼 당연한 얘기지만 실행하기는 어려운 얘기다. 내 경우에 항상 마음에 갈등이 생기는 경우는 이럴 때다. 한편으로는 기초를 탄탄히 쌓고 싶어서 학습에 시간을 더 쏟고 싶고, 반대로는 실제 프로젝트를 빨리 해야만 더 효율적으로 배울 수 있을 것 같을 때. 한정적인 내 시간 중 얼마만큼을 강의를 듣고 책을 보는 학습에 쓸지, 또 나머지 시간 중 얼마는 개인 프로젝트에 쓸지 하는 문제는 항상 풀기 어려운 숙제다.


정답은 없겠지만, 난 개인적으로 배움에서 항상 기초를 가장 중요하게 생각한다. 빨리 적용하면서, 수정하면서, dirty 하게 배우는 것도 많은 사람들이 추천하는 방법이긴 하지만, 내 성격 상 모래 위에 집을 짓는 그 느낌이 너무 싫다. 반석을 잘 닦고 그다음에 멋지게 짓고 싶다. 욕심인 건 알지만... 아직은 더 기초에 집중하고 싶다. 아마 11월부터는 제대로 개인 프로젝트를 시작해서 여태껏 배운 것들을 적용해 볼 수 있을 것 같다.


4. 포트폴리오를 만들자. 무조건.


https://harrisonjansma.com/archive


블로그를 꼭 운영하고 여기에 포트폴리오를 공유하라는 조언은 이미 귀가 닳도록 들었다. 관련 전공자가 아니면서 이 분야로 취업하려면 이 방법이 최고라고. 물론 이런 조언은 다 미국인들이 해 준거고 그래서 미국 사정에 맞는 것 같다. 실질적으로 우리나라에서 데이터 사이언스를 새로 공부하는 사람들에게 개인 블로그와 포트폴리오가 커리어적으로 얼마나 도움이 될지는 모르겠다. 나도 newbie니까.


아무튼 내 경우엔 미국 취업을 목표로 하고 있기 때문에 Harrison의 블로그를 벤치마킹해서 심플하고 깔끔한 개인 포트폴리오 퍼블리쉬용 블로그를 제작 중이다. 블로그 제작 자체가 좋은 Django 웹개발 프로젝트기도 하기 때문에 일석이조를 기대하고 있다.


5. Data Science + __________ = 성공적인 커리어


Harrison의 마지막 조언이다. 데이터 사이언스는 그 자체로는 tool이기 때문에, 자기가 가진 다른 전문성에 접목했을 때 힘이 발휘된다는 이야기다. 지금까지 쌓아놓은 다른 전문성이 없다면 지금이라도 시작하면 된다. 데이터 사이언스를 배우면서 프로젝트를 할 때 내가 관심 있는 분야에 집중하면 된다. 그럼 학습에도 도움이 되고 관심 있는 분야에 대한 지식을 쌓고 전문성을 키워나갈 계기도 될 수 있을 테니.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari