데이터 사이언스 대학원에 진학을 목표로 하고 있습니다. 저는 지금 휴학 중이고 1년 뒤 3학년으로 복학하는데요. 휴학 기간 동안 영어와 데이터 사이언스 분야 공부를 하려고 합니다만, 공부 순서를 잘 모르겠습니다.
제 생각에는 Python, R을 이용한 데이터 분석 실습 / 머신러닝 이론 및 코딩 응용 / 어학 성적 / 통계학 / 수학 대충 이렇게 해야 할 것 같은데 어느 것부터 시작해야 할지 모르겠습니다.
현재 파이썬 기본 문법 아는 수준입니다. 1년 공부 커리큘럼을 어떻게 짜야 할까요?
보내 주신 질문은 잘 읽어 보았습니다. 일단 결론부터 드리자면, 통계학과 수학이 가장 기초가 됩니다. 데이터 사이언스에서 활용되는 머신러닝 기법들이 대부분 통계학의 데이터 마이닝에 기반을 두고 있고, 딥러닝의 신경망 또한 수학과 통계학의 범주에서 크게 벗어나지 않습니다.
이 두 가지 학업이 선행되지 않으면, 말씀 주셨던 R/Python 언어의 코딩은 크게 도움이 되지 않습니다. 대부분의 데이터 관련 대학원 과정에서 통계학과 수학을 반드시 다루고 있고, 그만큼 중요성이 크기 때문입니다. 최근 R/Python 공통으로 대부분의 이론들을 구현해 놓은 패키지들도 있는 상태라, 실제 활용 자체는 어렵지 않습니다. 다만 기초가 되는 이론들에 대해 잘 알고 있어야 "응용"이 가능한 만큼 가장 먼저 선행되어야 할 것은 통계학과 수학 영역입니다.
공부가 된 다음에는 R/Python 본인의 선호에 따라 혹은 두 가지 모두 활용하셔도 무방합니다. 지도 교수님의 성향이 될 수도 있는데, 통계학에 기반을 둔 교수님을 R을 딥러닝에 기반을 두고 가르치시는 분은 Python을 선호할 가능성이 큽니다. 본인의 진로에 따라 결정하셔도 될 것 같고, 실무적으론 둘 다 하실 수 있으면 많은 도움이 될 것으로 보입니다.
어학의 경우에는 (중략)