brunch

You can make anything
by writing

C.S.Lewis

by Raphael Lee Apr 15. 2016

분석이란 걸 위한 통계 완전 기초

딸바보 잡부의 이야기

 들어가며.


 오래전부터 작성하고 싶었던 글이었음에도 적절한 공간을 찾지 못해 보류해왔던(사실은 게을러서 못 했던) 글을 이 곳을 알게 되어 이렇게 시작합니다.

 불과 얼마 전 빅데이터에 열광하고, 근래에 머신러닝에 열광하는 분들에게 보내고 싶은 내용들을 정리하려 합니다.

 최신 트렌드라는 허상에 빠져 교육 듣고 기법을 공부해도 기본적인 것을 모르면 주도적으로 쓰지 못하고 다른 누군가가 시킨 것단지 구현하게 됩니다.

 그래서, 분석을 하는 사람들은 모두 산수를 잘한다는 전제를 하고 필자가 실전에서 익혀서 약간씩 정리했던 내용을 이곳을 빌어 공유합니다.

 앞으로 전개할 내용에 대한 목차는 다음과 같습니다. (쓰면서 수정이 일어날 수 있습니다.)

 글에는 필자의 성격이 그대로 묻어나온다는 말처럼, 글이 건조하더라도 양해해 주시고 덧글 등으로 질문을 해주시면 아는 한도 내에서 답변드리겠습니다.

 모르는 건 알려드릴 수가 없습니다.^^;


<< 목차 >>

Chapter 1. 통계 기본 함수

Chapter 2. 표준화/정규화

Chapter 3. 데이터 전처리

Chapter 4. 클러스터링, 장바구니

Chapter 5. 의사결정나무(Decision Tree), 회귀분석(Regression), 신경망분석(Neural Network)

Chapter 6. 모형평가, WoE



 이 연재가 완료되고 나면, 업무 시스템의 대략적인 Architecture 구조, BA/DA/AA/TA 구분 및 특성, Data 영역, Server application 영역, Client application 영역 등의 순으로 글을 작성해 나갈 예정입니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari