2016년 10월 26일
글의 요지를 잘 이해 못 하시는 분들이 계시는 것 같아서 - 데이터 사이언티스트가 되려면 학벌 높아야 한다는 말이 아니었습니다.
- 학벌이 좋아야 하는 유일한 케이스: "데이터 사이언티스트" 구인 광고에 이력서 넣으실 거면, 그게 좋은 테크 직장이라면, 신입으로서 빡센 학벌/박사급 논문이 필요합니다. 그리고 이건 어렵습니다. 구글 딥마인드 취업 생각하시면 됩니다.
- 하지만 데이터 사이언스 업무는 거의 어딜 가나 있습니다. 문제는 그렇게 대단한 데이터 사이언스 과목 공부 안 해도 웬만한 개발자, 웬만한 이공계 출신, 웬만한 리서치 경험자, 웬만한 BI 업무 및 데이터 분석 경력 있는 사람이라면 웬만한 데이터 분석 다 한다는 겁니다. 그렇기 때문에 '데이터 사이언스 자리는 많으나 정작 구인 광고 내는 곳은 상대적으로 없는' 상황이 생깁니다. 간간히 나오는 공고는 뭐 이거저거 다 하라는 식으로, "네가 다 알아서 해" 성격이 꽤 많고요. 여기에 맞추려고 하면 안 됨.
- 제일 쉬운 루트는, 개발자로 들어가서 데이터 관련 일 좀 더 하면서 슬슬 그쪽으로 옮겨가는 방법(제가 택한 방법), 컴사 비전공자라면 어떤 한 분야(경영, 마케팅 뭐 등등)에 익숙해져서 이 동네 KPI는 내가 좀 알고, 엑셀에서 이런 데이터 모아서 이렇게 분석해서 사장님한테 프레젠테이션할 자신 있다 정도로 그 분야의 전문 지식을 쌓은 다음에 데이터 수집 및 처리 관련 코스, 혹은 통계와 기계학습 기초만 좀 더 보강하면 웬만한 데이터 사이언티스트 따귀 후려칠 수 있습니다.
- 스타트업이나 아주 작은 회사, 혹은 아직도 데이터 파이프라인을 만들지 않은 회사를 제외하고 데이터 엔지니어 쪽은 분석일과 완전히 다릅니다. 빅 데이터를 왜 하고 싶으세요? 데이터 분석해서 뭔가 의미를 찾고 싶으세요? 그러면 분석 쪽입니다. 엄청난 양의 데이터를 모으고 처리하고 관리하고 쉽게 찾을 수 있게 만드는 쪽에 더 관심 많으세요? 데이터 엔지니어링입니다. 분석 쪽이면 딱히 컴사 안 해도 됩니다. 통계/수학/경영이 더 유리합니다. 그냥 어느 한 분야만 잘 알아도 됩니다. 극한 예로는 치킨집 사장님이 엑셀로 데이터 잘 분석하셔서 판매량 증가한다면 훌륭한 데이터 사이언티스트입니다. 물론 분석 쪽이죠. 온라인 게이밍 회사에서 게임 내 데이터를 수집하고, 그걸 실시간으로 처리해서 BI팀으로 넘기고, 하루하루 정리하는 배치 프로그램 돌린다고요. 그러면 데이터 엔지니어링입니다. 컴사 추천합니다.
이미 컴사 학사 없으시고 개발자가 아니라면 보통 분석 쪽으로 가실 겁니다. 파이선이나 R 배우는 것도 중요하지만, 어떤 한 분야에서 어떤 데이터를 어떻게 분석하고 어떻게 사용하는지를 더 잘 아는 게 도움이 됩니다. 리테일에서 주로 재는 KPI(재고 관리 관련 수치라든지), 온라인 게임에서 재는 KPI, 온라인 마케팅에서 재는 것들 등등을 알면, 컴사 학사 하나도 없고 엑셀만 다룰 줄 알아도 괜찮습니다. 그 분야 데이터를 이해하는 게 백 배 더 유리합니다. 파이선, R 같은 건, 내가 뭘 하고 싶은지만 알면 몇 주 몇 달 해서 필요한 만큼은 합니다. (아님 주위 데이터 엔지니어를 들들 볶... 쿨럭.) 그런데 저에게 물어보시는 분들은 보통 그냥 "빅데이터"를 하겠다는 막연한 마음만 있지 분석 쪽인지, 엔지니어링인지, 시각화인지 잘 모르시더라고요. 그래서 결정하는 걸 도와드립니다. 아 착해라.
25세 넘으시고 컴사 학사 없으시고 개발자 아니세요? 상당히 확실하게 분석 쪽입니다. 그리고 분석은 빅데이터랑 솔직히 큰 상관없습니다. 빅데이터를 스몰 데이터로 만들어서 분석 가능하게 하는 게 엔지니어링 팀 몫입니다. 데이터 수집 클리닝 잘하는 방법 배우시면 됩니다. 근데 분석은 데이터 엔지니어링보다 돈 덜 받나요 라고 물으신다면, 페이 범위가 엔지니어링보다 훨씬 넓기는 하다고 말씀드릴 수 있습니다. 하지만 아마 최하도, 최고도, 분석 쪽에서 나올 걸요. 데이터 엔지니어링은 중간 쪽에 좀 더 몰려있겠죠. 평균은 더 높을지 몰라도.
빡센 학위, 자격증 하나만 하면 떡하니 취업해서 평생 먹고 살겠다 - 이런 거 없습니다. 요즘 세상에 철밥통이 어디 있습니까. 그나마 제일 안정적인 사람들이 실력 있는 개발자입니다. 멀리 보시는 거라면 개발일 추천하고, 나이 좀 있으시거나 이미 다른 분야에 학위가 있으시다면, 어떤 비즈니스 문제를 어떻게 풀 것인가, 내가 잘 아는 분야에서 어떻게 써먹을 수 있는가를 먼저 고민하신 다음에 그 고민을 해결할 수 있는 기술(R이든지 기계학습이든지)을 배우시는 게 맞습니다. 임상 데이터 분석하는 법을 잘 아는데 여기에 기계학습까지 접목해서 어떤 사람이 어떤 반응을 보일지, 혹은 랜덤으로 나눠진 그룹의 위험도를 예측할 수 있다 뭐 그러면 그쪽으로 가시면 되겠죠(의학 부분은 통계 빡세게 잘 하셔야 합니다). 실시간 장시 분석 및 빠른 알고리듬 트레이딩이라면 통계보다는 코딩 쪽이 더 유리하겠죠. 같은 금융 쪽이라도 빠른 알고리듬 트레이딩이 아니라 포트폴리오 관리 이런 거라면 통계/계리/수학 쪽 자리가 더 많을 거고요. 온라인 게임 내에서 얼마나 유저가 재미있게 하는지, 어느 정도 플레이 한 사람들이 돈을 쓸 가능성이 높은지 등등을 잘 안다면 그냥 그거 분석 전문 하시는 게 좋습니다.
결론.
"이런이런 문제가 있는데 이걸 R로 풀어봐" -> 데이터 사이언티스트에게 이렇게 물어볼 회사 없을 겁니다. "매출 올리려는데 어떤 걸 재서 모니터링 하는지 알아봐" "고객 만족도를 올리려면 어떤 KPI를 모니터 하는 게 좋을까"-> 이게 더 맞습니다. 이 문제를 엑셀로 풀 수 있다면 어우 대단하십니다. 빅데이터 안 해도 됩니다. 엑셀로 풀 걸 왜 데이터 파이프라인을 만듭니까. 뭘 어떻게 해야 하는지만 알고 결과 내면 땡입니다. 그리고 일 시작하면 누가 석사 있는지 박사 있는지 노관심 안물안궁.
자 그럼 이전 글 링크:
데이터 사이언티스트가 되는 법
https://www.facebook.com/londonyangpa/posts/1733828373569309
난 죽어도 데이터 사이언티스트 신입으로 들어가야겠다면
https://www.facebook.com/londonyangpa/posts/1818597445092401
빅데이터에 대한 환상
https://www.facebook.com/londonyangpa/posts/1706984092920404