데이터 과학자를 꿈꾸며
최선: 어떤 것을 준비해야겠다는 강한 느낌이 온다면, 그걸 해라.
차선, 하지만 여전히 멋진 것: 만약에 리크루터가 조언을 주었다면, 그걸 해라.
마지막 방법: 어디서부터 시작해야 할지 모르겠다면, 아래 내용 중에서 하나를 선택하길 추천한다.
1. 코딩
해설서를 펼쳐라(for example). 자료구조나 문자열 다루기 같은 기초적인 영역의 6가지 기초 사항을 읽어라. 연습 문제 2개를 풀 수 있는 프로그램을 짜고 설명해보아라.
2. 데이터 엔지니어링
해설서를 펼쳐라. WHERE 절과 같은 조건과 JOIN과 같은 기초적인 영역의 6가지 기초사항을 읽어라. 3개 문제에 대해 SQL 쿼리를 써서 설명해라.
3. 확률과 통계
입문서의 앞 절반을 펼쳐라. 모든 중요 정의와 방정식을 읽어라. 2개 연습 문제 대한 답을 쓰고 설명해라.
4. 머신러닝 그리고 알고리즘
Steven Skiena's Algorithm Design Handbook의 첫 3 챕터를 펼쳐라. 익숙지 않은 두 개의 섹션을 읽어라. 당신이 익숙한 머신러닝 알고리즘에 대해 그림을 가지고 설명해라.
1. 선택하기. 프로젝트를 선택해라. 이 프로젝트는 하나 또는 두 개의 갭이 있는 스킬을 사용하게 해야 한다. 이것은 아마도 어렵겠지만, 과대평가할 필요는 없다. 유스 케이스는 우스울 수 있다. 결과도 하찮을 수 있다. 오직 필요한 것은 하나다. 이 프로젝트가 당신이 배우려는 스킬을 요구한다는 것이다.
2. 실행하기. 이 부분이 재밌는 부분이다. 당신의 이 작고 귀여운 프로젝트를 완성하기 위해선, 당신은 어떤 것이든 배우려고 노력할 것이고, 이는 작게나마 실전 경험이 된다. 인터넷 검색, 시행착오, 아마도 몇 번의 눈물까지도 엄청 많이 겪을 것이다. 이것들은 매우 좋다. 자기 주도 학습은 고통스럽지만, 새로운 스킬을 키우는 가장 빠른 방법이다. 포기하지 마라.
3. 멈추기. 프로젝트는 그들만의 생명을 가지는 경향이 있다. 그리고 이와는 사랑에 빠지기 쉽다. 10시간 뒤에는 당신 스스로를 강제로 멈추게 해야 한다. 그렇지 않으면 당신은 다른 갭들을 무시하게 되는 위험에 처할 수 있다. 만약 그 프로젝트를 죽일 수 없다면, 최소한 인터뷰가 끝난 후까지 보류해라. 인터뷰가 끝나면 돌아와서 열정적인 프로젝트를 다시 해라.
4. 보고하기. 프로젝트를 큰소리로 설명하기 전까지는 당신은 아무것도 끝낸 게 없다. 풀려고 했던 문제는 무엇인가? 사용한 접근법은 무엇인가? 어떻게 그게 작동했는가? 배운 건 무엇인가? 다음번엔 무엇을 다르게 할 것인가? 이게 당신이 얻을 수 있는 최고의 인터뷰 연습이다.