머신 러닝을 공부하는 사람들에게 무조건 추천하는 강의는 코세라에서 무료로 제공하는 앤드류 응의 머신 러닝 강의입니다. 하지만, 많은 사람들이 영어 장벽과 코딩 실습에 부딪혀 끝까지 수료하지 못합니다. 이 책은 독자들이 앤드류 응의 머신 러닝 강의를 제대로 공부하고 수료하도록 길잡이 역할을 합니다. 이 책과 강의를 병행한다면 3 개월 안에 과정을 완료하고 수료증을 받을 수 있습니다.
머신 러닝 분야에서 프로그래밍 언어는 학습 알고리즘을 완벽하게 이해하기 위한 도구일 뿐입니다. 개발자가 아니라면 복잡한 파이썬이나 자바를 공부할 필요가 없습니다. 심지어 오렌지와 같은 프로그램은 단 한 줄의 코딩도 없이 클릭 몇 번으로 학습 알고리즘을 훈련시키고 결과를 도출합니다. 옥타브 / 매트랩 프로그램은 매우 단순한 언어로 쉽게 배우고 바로 응용할 수 있고, 독자들은 간단한 실습으로 학습 알고리즘의 원리를 파악할 수 있습니다. 다른 프로그래밍 언어들은 복잡하기 때문에 머신 러닝을 공부하는 시간보다 코딩 오류를 해결하는 시간이 더 많이 걸립니다. 또한, 머신러닝 전문가들은 학습 알고리즘 시제품이나 프로토타입을 빠르게 구현하기 위해 옥타브 / 매트랩 프로그램을 사용합니다. 옥타브 / 매트랩 언어로 시제품을 구현하고 제대로 동작하는 것을 확인하고 다른 프로그래밍 언어로 학습 알고리즘을 구현합니다.
카카오 브런치는 수학 공식을 표현하기 위한 위 첨자, 아래 첨자, 분수 등을 지원하지 않습니다. 수식이 제대로 표현되지 못하므로 책을 캡처를 떠서 정리합니다. 이것도 귀찮군요. 역시 수학 공식은 다른 툴을 써야겠습니다.
왜 머신 러닝 책에서 선형 대수를 설명할까요? 선형 대수를 알지 못하면 머신 러닝 알고리즘을 구현할 수 없기 때문입니다. 지금까지 단변수 선형 회귀를 배웠습니다. 실제 데이터셋에 단변수 선형 회귀를 구현할 수 없다면 로지스틱 회귀와 인공 신경망도 구현할 수 없습니다. 우리는 목수가 되기 위해 통과 망치의 기능과 사용법을 익히는 것을 넘어 잘 사용하는 법을 배웁니다. 우리가 머신 러닝 전문가 또는 데이터 사이언티스트가 되기 위해 반드시 선형 대수와 옥타브 프로그램을 익혀야 합니다. 다행히도 데이터 사이언티스트는 선형 대수를 깊이 공부할 필요가 없습니다. 학습 알고리즘을 구현하기 위해 필요한 것들만 익힙니다.