완벽한 논문을 위한 R 프로그래밍 분석
논문 작성 시 그리 복잡한 머신러닝은 사실 필요없다. 나에게 필요한 것은 그 중 Logistic regression 정도가 된다.
그러지만 어느정도 전반적인 지식을 쌓기 위해 공부하던 도중, 머신러닝(지도학습) 분석 프로세스의 공통적인 패턴이 보여서, 나름 아래와 같이 정리해 보았다.
보통 지도학습 머신러닝의 정확도를 검증할때 위의 다섯가지 방법을 고루 써야 한다고 한다. 그 이유는 같은 데이터라도 특정 방법을 사용할 경우 학습 데이터와 테스트 데이터의 차이가 굉장히 큰 경우도 있고, 또 자신이 선호하는 방법으로만 쓴다면 정확도 검증에서의 유의미성이 없기 때문이다.
이것들의 실전 응용방안은 앞으로 계속 배워야 할듯하다...!