한빛미디어. 출간 : 2021년 09월 06일. 독서 : 10월 3-4주
본 책의 머리말에도 적혀있는데, 이 책은독자가 프고그래밍에 어느정도 익숙하다는 가정하에 쓰여져 있고, 제예재코드는 주로 파이썬을 사용하여 설명하고 있다. 파이썬과 R을 전문적이진 않지만 바이오 분야의 전공자로서 그나마 조금 다루고 사용해볼 수 있었따.
[PART I 올바른 머신러닝 접근 방법 모색]
CHAPTER 1 제품의 목표를 머신러닝 문제내용 로 표현하기
CHAPTER 2 계획 수립하기
[PART II 초기 프로토타입 제작]
CHAPTER 3 엔드투엔드 파이프라인 만들기
CHAPTER 4 초기 데이터셋 준비하기
[PART III 모델 반복]
CHAPTER 5 모델 훈련과 평가
CHAPTER 6 머신러닝 문제 디버깅
CHAPTER 7 분류기를 사용한 글쓰기 추천
[PART IV 배포와 모니터링]
CHAPTER 8 모델 배포 시 고려 사항
CHAPTER 9 배포 방식 선택
CHAPTER 10 모델 안전장치 만들기
CHAPTER 11 모니터링과 모델 업데이트
이 책은 실용적인 머신러닝에 대해 다루고 있다. 검색엔진, 소셜 플랫폼 추천 시스템, 번역 서비스, 사진에서 얼굴 감지 시스템 등 다양하게 사용되고 있는 머신러닝을 배울 수 있고, 활용 예제코드가 수록되어 있다.
머신서링의 전체 과정에 대해 이 책에서는 아래의 단계로 소개하고 있다.
1. 올바른 머신러닝 접근 방법 모색
2. 초기 프로토 타입 제작.
3. 모델 반복
4. 배포와 모니터링
머신러닝의 반복 루프는 분석, 접근방법 선택, 수현, 측정을 통해 이루어 진다.
머신러닝에서는. 모델 파이프라인 성능이 나쁘다면 모델의 품질 때문인지, 버그 때문인지 알수 있는 가장 좋은 방법은 점진적인 방식을 따르는 것이며, 데이터 흐름부터 시작해서 훈련능력, 마지막으로 일반화 추론의 디버깅을 진행하는 것이다.
위와 같은 내용들이 다양한 예제들과 함께 실용적으로 쓰여진 책으로 머신러니에 대해 상당한 전문 지식이 있어야 소화가 가능한 책이다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."