김송규 저 | 좋은습관연구소
(34p) "내가 갖고 있는 문제는 꼭 데이터로만 해결이 가능한가?, 이 문제를 해결하는데 데이터 사이언스가 반드시 필요한가? 다시 한번 강조하지만, 데이터 분석이든 뭐든 시작하기에 앞서 문제의 본질부터 파악하는 것이 첫 번째 단추라는 것을 잊지 말아야 한다."
<데이터 사이언스 일반>
1) Garbage in, Garbage out.
2) 분석 자체보다 분석 과정 전체를 보는 것이 훨씬 중요하다.
3) 웬만한 건 고등학교 수준의 통계학만으로도 가능하다.
4) 모든 데이터 사이언스는 "측정 → 수집 → 분석"의 단계를 따른다.
<데이터 측정>
5) 데이터 사이언스 실무에서 가장 중요한 것은 측정이다.
6) 측정에는 측정 장비와 스케일을 포함한다.
7) 그래서 중요한 것이 스케일이다.
8) 데이터 사이언스를 위해 필요한 기초 과목은 (실험) 물리이다.
9) 대체 지표로 측정한 것은 가짜다.
<데이터 수집>
10) 데이터 수집에는 전처리 과정을 포함한다.
11) 전처리에서 중요한 기초 과목은 신호처리이다.
<데이터 분석>
12) 되도록이면 적은 데이터를 모으는 게 바람직하다.
13) 가장 좋은 해결은 데이터 분석 없이 문제를 해결하는 것이다.
14) 데이터 사이언스는 만병통치약이 아니다.
15) 데이터 분석이 강력한 한방일 필요는 없다.