brunch

You can make anything
by writing

- C.S.Lewis -

by Jin Young Kim Feb 03. 2020

실전 머신러닝 부트캠프

제가 실리콘밸리에서 직접 가르치는 '실전 머신러닝 부트캠프'에 초대합니다

바야흐로 데이터 부트캠프의 전성시대다. 데이터 과학자 / 인공지능 전문가가 유망한 직업군으로 자리잡으면서 데이터 관련 직종에 취업하려는 학생들, 그리고 다른 분야 / 전공에서 전직하려는 사람들의 수요까지 합쳐져 데이터 부트캠프는 문전성시를 이루고 있다. 무엇보다 시간이 소중한 취업 준비생들에게 단기간에 취업에 필요한 실력을 갖추게 해준다는 메시지는 강렬하다. 하지만, 많은 부트캠프 프로그램 가운데 실제로 현업 전문가가 직접 참여하는 곳은 많지 않다.  


지난 글에서 현업에서 일하는 데이터 과학자들이 왜 컨텐츠를 만들어야 하는지를 이야기했는데, 필자가 지금까지 그렇게 데이터 관련 컨텐츠 제작에 열을 올렸던 것은 1) 배우고 일하는 과정에서 자연스럽케 컨텐츠가 생산되고, 2) 현업 실무자로서 제대로 된 컨텐츠를 만들 수 있다는 자신감이 있었기 때문이다. 그동안 회사 프로젝트를 바탕으로 논문 및 컨퍼런스 튜토리얼을 가르치고, 헬로데이터과학 출간, 그리고 데이터지능 팟캐스트 진행 등 힘 닿는데까지 노력했다. 


하지만, 일하면서 남는 시간에 틈틈히 컨텐츠 제작을 하는 어려움을 느낀 것도 사실이었다. 필자가 원래 생각한 모델은 팟캐스트에 출연한 분야별 전문가들이, 팟캐스트를 시작으로 제대로 된 강의 컨텐츠도 제공할 수 있는 플랫폼이었지만, 필자를 포함해 다들 본인 일로도 바쁜 사람들에게 쉬운 일은 아니었다. 사실, 책을 쓰면서 느낀 점이지만, 제대로 된 컨텐츠 제작은 컨텐츠를 갖고있는 사람과 컨텐츠 전문 제작자가 팀으로 같이 움직여야 하는 일이라는 생각도 했다.   


다행히 최근에 좋은 파트너를 찾아 데이터 관련 부트캠프로 약 8000명의 수강생을 배출한 DSSchool과 본격적인 교육 컨텐츠 제작에 나서기로 했다. 우선 DSSchool과 필자가 함께하는 첫 프로젝트로 3월에 실리콘밸리에서 ‘실전 머신러닝’을 주제로 부트캠프를 진행한다. 이번 부트캠프에서는 DSSchool의 이미 검증된 커리큘럼에 필자가 MS와 Snap에서 배우고 경험한 실전 노하우를 접목시켜, 취업 및 실무에 바로 활용할 수 있는 머신러닝 학습 경험을 제공할 생각이다. 


부트캠프 등록 페이지 바로가기


왜 부트캠프인가?

지난 글에서 소개한대로 데이터 과학 관련 컨텐츠에는 다양한 형태가 있으며, 필자는 그동안 책 및 논문 집필, 팟캐스트, 세미나 등 다양한 형태의 컨텐츠를 만들어 왔다. 하지만, 구직 및 전직과 같이 구체적이고 중요한 니즈를 가진 분들에게 좀더 집중적인 도움을 줄 수 있는 컨텐츠를 제작하고 싶다는 생각을 했다. 마침 데이터 부트캠프 운영에 전문성을 갖춘 DSSchool을 만나 이번에 첫 부트캠프를 시작하게 되었다.


필자 개인적으로는 부트캠프 컨텐츠를 만들며 그동안 데이터과학 및 머신러닝 실무자로서 배운 노하우를 일관성있는 컨텐츠로 정리할 수 있는 기회를 얻고자 한다. 부트캠프 컨텐츠의 MS시절의 사내 교육, 그리고 SIGIR 컨퍼런스 튜토리얼, 각종 세미나에서 부분적으로는 다루어온 내용이지만, 블로그 포스트와 책이 다르듯이 책임감을 가지고 제대로 된 컨텐츠를 만드는 경험은 본인에게도 큰 도움이 된다는 생각이다.


실전 머신러닝 부트캠프

이번 부트캠프를 준비하면서 국내외 수많은 부트캠프 및 교육 프로그램을 살펴 보았는데, 대부분의 경우 이론 중심, 그것도 텍스트북 수준의 커리큘럼을 제공하고 있었다. 물론 처음 시작하는 입장에서 기초를 잘 닦아서 나쁠 것은 없지만, 현업에서 데이터 사이언티스트 및 머신러닝 엔지니어로 일하기 위한 스킬셋이 상당히 다른 것은 부인할 수 없는 사실이다. 본 수업의 차별점은 다음 몇가지로 요약할 수 있다.


ML은 강력하지만 항상 올바른 솔루션은 아니다. 본 수업에서는 ML 도입의 ROI를 추산하고 ML을 사용하지 않아야 할 때와 ML을 사용해야 할 때를 나누어 설명한다.

실제 데이터는 지저분하므로 다양한 전처리를필요로 하며, 이런 전처리는 종종 모델링의 성패를 좌우한다. 본 수업의 상당 부분은 다양한 ML 관련 데이터 문제 및 솔루션에 할애한다.

기본 ML 모델을 작성하는 것은 쉽지만 실무에서는 모델을 디버깅하고 반복하는 방법을 이해해야한다. 본 수업에서는 ML 모델에 대한 다양한 진단 및 디버깅 전략을 다룬다

Kaggle은 훌륭한 학습 자료이지만, 실제 ML 프로젝트와는 다르다. 본 수업에서는 최고의 Kaggle 경쟁 업체로부터 교훈을 얻되, Kaggle과 실무의 차이도 설명한다.

끊임없이 변화하는 ML 분야에서 일하기 위해서는 평생 학습자로서의 준비를 갖추어야 한다. 본 수업에서는 ML 분야의 최신 기술 동향 및 이를 따라갈 수 있는 노하우를 소개한다.


부트캠프의 구체적은 내용은 수업 Syllabus를 참조 바란다. 보시다시피 4일치고는 상당히 빡빡한 분량이지만, 필자가 그동안 실무에 머신러닝을 적용하면서 느꼈던 수많은 고민을 최대한 담으려고 애썼다. 이번 수업을 준비하며 최근까지 나온 머신러닝 관련 학습자료를 최대한 반영하려 애썼으니, 이번 수업에 참여할 수 없는 분이라면 Syllabus에 링크된 자료를 탐독하는 것으로도 많은 것을 얻을 수 있으리라 본다. 


맺음말

부트캠프 등록은 아래 페이지에서 가능하다. 현장 강의인만큼 20명 안팎으로 인원 제한이 있으므로 참여를 원하는 분은 바로 등록하기 바란다! 이번 부트캠프 및 향후에 있을 비슷한 프로그램에 관한 소식은 필자의 메일링 리스트에도 공지할 생각이다. 혹시 더 궁금한 부분은 DSSchool 지원팀이나 (support@dsschool.co.kr) 필자에게 (lifidea at gmail) 메일로 문의하기 바란다. 


부트캠프 등록 페이지 바로가기


부트캠프 관련 FAQ

수업료가 거의 1,000$이면 비싼게 아닌가? 무료로 공부할 수 있는 방법은 없나?

사실 본 부트캠프 이전에 필자는 무료 부트캠프를 소규모로 진행하였다. 강의에 대한 반응은 좋았지만, 참가자 분들 가운데 과제로 주어진 프로젝트를 끝낸 분은 많지 않았다. 필자가 느낀 점은 역시 제대로 된 댓가를 치르는 사람들이 제대로 공부를 한다는 점이었다. 


물론 부트캠프 이외에도 열의과 기본을 갖춘 사람들이 데이터 과학을 공부할 수 있는 방법을 얼마든지 있다. (필자의 홈페이지 참조) 부트캠프는 단지 잘 정제된 컨텐츠를 압축적으로 전달하여 좀더 빠른 시간에 원하는 수준에 도달할 수 있게 해주는 수단이다. 또한, 적지않은 금액을 지불하고 실제 수업을 듣는 과정에서 얻어지는 동기부여와 깨달음도 있으리라 본다.


또한 필자는 본 부트캠프를 시작으로, DSSchool과 함께 데이터 과학 및 머신러닝 관련된 다양한 분야의 현업 종사자들이 본인들의 컨텐츠를 공유할 수 있는 플랫폼을 만들어갈 생각이다. 최대한 많은 수의 전문가들의 참여를 이끌어내기 위해서도 컨텐츠 창작자들에게 적절한 보상이 주어져야 한다고 생각한다. 


매거진의 이전글 현업 데이터 과학자가 컨텐츠를 만들어야 하는 이유

매거진 선택

키워드 선택 0 / 3 0
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari