오랜만에 글을 올리네요. 그동안 졸업 준비, 구직 활동하느라 블로그 활동이 뜸했는데, 데이터 사이언스 컨설팅 쪽으로 구직을 성공했다는 소식을 전해드릴 수 있어 다행이라고 생각합니다. 아직 비자 신청 등의 문제로 정식 입사는 7월 말이나 가능할 것 같네요. 이제 남은 한 학기는 여유 있게 졸업논문 작성하며 마무리할 수 있을 것 같아 남는 시간에는 블로그에 조금 더 성의 있게 작성하고자 합니다. 그동안 성원해주신 많은 분들께 감사드린다는 말씀 전해드리고 싶고, 오늘은 데이터 사이언스에 관심 있으신 분들이 듣기 좋은 영어로 된 데이터 사이언스 팟캐스트 몇 개를 소개하고자 합니다. (한국어로는 제가 찾은 적이 없어서 잘 모르겠네요, 혹시 좋은 한국어 데이터 관련 팟캐스트 아시는 분들은 알려주시면 감사하겠습니다!)
[Data Skeptic]
주제: 데이터 사이언스, 머신 러닝, AI
난이도: 중상
팟캐스트 길이: 15 ~ 30분
누구: 데이터 사이언스 최신 뉴스와 technical 저변 지식을 얻고 싶은 데이터 분석가
2014 년에 생긴 데이터 사이언스 팟캐스트로, 호스트 Kyle Polich가 데이터 사이언스 관련 주제를 매 에피소드마다 소개해준다. UIC 컴퓨터 공학 학부를 졸업하고 같은 학교 Artificial Intelligence 석사를 취득했기에 Kyle 은 일찍이 데이터 사이언스 분야에서 많은 경험을 쌓았다. 그래서 팟캐스트가 처음 데이터 사이언스를 접하는 분들에게는 조금 technical 하게 느껴질 수 있지만, 매 에피소드마다 데이터 사이언스라는 큰 분야에 속하는 다양한 주제/이슈들을 게스트를 초청해 인터뷰 형식으로 풀어나가기 때문에 폭넓은 지식을 쌓기에 좋다. 예를 들면, 마이크로 소프트 Azure팀원 인터뷰를 통해 최근 마이크로소프트에서 집중하고 있는 데이터 사이언스 기술들에 대해 소개하는 에피소드부터 P vs NP 문제 (컴퓨터 공학에서 자주 나오는 문제를 정의하는 방식 중 하나)에 대해 토론하는 에피소드가 있다. 혹시나 팟캐스트에서 들은 내용이 완벽하게 이해가 되지 않는다면 블로그를 통해 다시 읽어볼 수 있다.
[Data Stories ]
주제: 데이터 사이언스, 데이터 시각화
난이도: 중
팟캐스트 길이: 40분 +
누구: Data Visualization 관련 최신 소식을 듣고 싶은 데이터 분석가
Enrico Bertini, Moritz Stefaner 두 명의 호스트가 진행하는 데이터 사이언스 팟캐스트. Enrico는 현재 NYU 교수로 data visualization 분야를 연구하고 있고, Moritz는 프리랜서로 데이터 시각화 관련 프로젝트를 진행하고 있다. 이 팟캐스트 역시 게스트를 초대해 다양한 데이터 시각화 기법과 새로운 분야에서 사용하고 있는 도표와 도구들에 대해 설명한다. 이 팟캐스트는 통계학이나 컴퓨터공학 지식이 없어도 청취할 수 있지만, 에피스드들이 대부분 길기 때문에 필자도 관심 있는 부분만 듣는다. 좋은 데이터 분석가의 주요 요건 중 하나가 이과 배경이 없는 사람들에게 분석 콘셉트를 쉽게 설명할 수 있는 능력이다. 그러기 위해서 필요한 능력이 data visualization 이기에 이 팟캐스트를 추천한다. 하지만 이 팟캐스트가 도표나 테이블을 만드는 법을 설명하는 것은 아니라는 것 참고 바란다.
[Linear Digressions]
주제: 데이터 사이언스, 머신 러닝
난이도: 중하
팟캐스트 길이: 10분 ~ 20분
누구: Data Science 입문하시는 분
이 데이터 사이언스 팟캐스트 역시 Ben과 Katie 두 명의 호스트가 진행한다. Ben은 현재 페이스북 UI Engineer로 근무 중이다 (Katie의 현재 Civis 데이터 사이언스 컨설팅 회사에 근무 중인 듯 하나 정확한 직업은 불분명). 두 명은 온라인 강의 회사 Udacity에서 처음 만나 이 팟캐스트를 시작했다. 데이터 사이언스 분야에 입문하시는 분들이 제일 듣기 쉬운 팟캐스트 중 하나다. 수학적 콘셉트를 심도 있게 다루기보다는, 비즈니스적인 관점에서 어떤 영향을 주는지에 조금 더 초점을 맞췄기 때문이다. 또한, 길이도 다른 팟캐스트보다 짧기에 출퇴근 스낵용 콘텐츠로 적합하다. 다른 팟캐스트와 달리 케스트에 대한 의존도가 낮으며, 두 호스트가 친한 친구기 때문에 편안한 분위기 속에서 진행된다.
[Partially Derivative]
주제: 데이터 사이언스, 머신 러닝, AI
난이도: 하
팟캐스트 길이: 20분 ~ 40분
누구: Data Science 입문하시는 분
이 데이터 사이언스 팟케시트는 Chris, Vidya, Jonathon 세명의 호스트가 진행한다. (이분야는 대부분 풀타임 팟캐스트 진행자가 아니기에 두 명 이상의 호스트가 많은 것 같다). 이 팟캐스트의 흥미로운 점은, 진행자 Jonathon이 백악관과 백악관 data science advisor이었다는 점이다. 그래서 그런지, 수학적인 것보다 데이터 사이언스가 미래에 어떤 정책인 변화를 가져올지에 대해 언급하는 에피스도가 많다. 그리고 데이터 사이언스를 공부하지 않는 사람도 이해하기 쉽게 현실 속의 예를 잘 찾아서 사용한다. 안타깝게도 2018년 현재 팟캐스트 활동을 중단하고 있지만 관심 있는 사람은 2017년 에피소드를 찾아 청취하길 바란다.
[마무리하며… ]
물론 이 팟캐스트 이외에도, The Digital Analytics Power Hour, Learning Machines 101 등 여러 데이터 사이언스 팟캐스트 가 존재합니다. 하지만 어떤 팟캐스트는 필자가 이해하기에는 너무 수학적이거나, 너무 한쪽 분야에만 집중하는 경향이 있으니 본인의 관심 분야와 지식수준에 맞게 고르시길 바랍니다. 저 개인적으로는 팟캐스트를 통해 현재 실생활에서 어떻게 데이터 사이언스가 사용되고 있는지와 어떤 기법들을 제 현재 관심분야에 대입할 수 있는지에 대해 고민합니다. 학교에서 가르칠 수 있는 것은 극히 일부분이기 때문이죠. 혹시나 독자분들 중에 괜찮은 데이터 사이언스 팟캐스트 아시는 분은 추천 부탁드릴게요!