무엇이 먼저냐
http://www.yes24.com/Product/Goods/91614222
데이터를 보고 결론을 찾는 훈련을 해야 하는 이유는 또 있다.
‘강사님? 강사님께서는 주로 어떤 분석 기법을 사용하세요? 그리고 어떤 툴을 사용해서 분석을 하세요?’
‘글세요? 분석 기법은 그때그때 도출될 결론에 따라 다르죠. 툴은….. 소싯적에는 주로 SPSS를 활용했는데 지금은 주로 R을 사용하죠. 근데 솔직히 데이터 분석의 최종 목적지를 향해 갈 때는 주로 엑셀을 많이 활용해요. 직접 VBA 코딩해서 처리하는 경우가 많죠.’
대답은 했지만, 우리는 분석 기법과 분석 도구에 얽매이지 말자.
먼저 분석 기법(혹은 방법론)에 대해 이야기해보면, 분석 기법은 결과에 종속되기 마련이다. 예측을 할 때는, 패턴을 찾을 때는, 분류나 군집 분석을 할 때는, 원하는 결론을 도출하기 위해 방법론은 결정된다.
따라서 앞서 말한 데이터를 보고 그로부터 결론을 찾는 훈련을 하게 되면 자연스럽게 방법론도 익혀 나갈 수 있다. 해당 결론을 위해 방법론을 선택해야 하니까 말이다.
이미 익숙한 분석 기법이라면 아는 만큼 사용하면 되고 모르면 그때 익혀 나가면 된다.
닭이 먼저냐? 달걀이 먼저냐의 문제일 수 있겠지만 굳이 분석 기법에 얽매여 공부할 필요가 있을까 생각이 되어하는 이야기다.
물론 꼭 필요하고 중요한 분석 기법에 대해서는 사전에 미리 익혀 두는 것이 나쁘지 않다.
아니 미리 선행학습이 되어야 하는 분석 기법은 분명 있다.
여기서 말한 미리 앞서 가지 말라는 분석 기법은 꽤나 복잡하고 특정 상황에서나 사용할 법한 기법에 목매지 말라는 이야기다. 모르면 그때 가서 공부하고 익히면 된다.
다음으로 분석 도구인데, 이건 두 말하면 잔소리다.
가끔 주변에 데이터 분석 공부하는 학생들 보면 온갖 툴을 다 익히고 있는 모습을 종종 보게 된다.
‘학생, 왜 그러게 많은 툴을 공부해? 한 가지만 확실히 해도 되는데’
‘아 혹시 몰라서요. 그리고 많이 아는 것이 나쁜 건 아니니까 시간 될 때 미리 해두는 거죠.’
단언컨대, 배움과 실무는 틀리다. 현장에 나가면 당신이 아는 툴 사용법은 아주 극히 일부분이라는 것을 깨닫는데 그리 많은 시간이 소요되지 않는다.
사전에 미리 공부하는 것이 나쁘다는 얘기가 아니다. 사전에 미리 학습하는 자세는 바람직하다.
여기서 말하고 싶은 점은 이거 아니면 안 된다는 생각으로 접근해서 너무 많은 시간과 노력을 낭비할 필요가 없다는 것이다.
분석 도구의 사용은 정확히 경험이다.
실무에서 선배들에게 배우고 여러 분석을 진행하다 보면 자연스럽게 시간에 흐름에 따라 실력이 증가한다.
미리 걱정하고 많은 시간 투자할 필요 없다.
그러니 분석 도구 잘 모른다고 너무 상심 안 해도 된다. 자신감을 가져라.
분석 도구에 얽매여 많은 시간 투자할 거면 차라리 그 시간에 알고리즘 공부를 할 것을 권유드린다.
그러면 이런 질문을 한다.
‘아니 그때 가서 익히면 늦지 않아요? 익숙해야 활용 가능 한데…… 그리고 또 이미 알고 있는 사람들보다 늦게 되잖아요.’
맞는 말이다. 이건 이견이 없다. 사전에 미리 아는 것만큼 좋은 게 있을까?
그래서 데이터를 보고 결론을 찾은 훈련은 끊임없이 하라는 것이다. 다른 사람보다 늦지 않기 위해서 말이다.
이런 훈련 거듭되면 충분하게 방법론 및 도구 익힐 수 있다.
내가 익힌 어렵고 복잡한 분석 기법과 도구를 언제 어느 시점에 사용할지 알 수 없다.
어렵게 익힌 분석 기법과 분석 도구 영원히 사용 안 할 수도 있다.
그건 조직에 따라 요구가 다양하고 다르기 때문이다.
가장 결정적인 이유는 분석 기법과 도구에 목 매이면 자꾸 결론을 내가 아는 범위 내로 한정해서 유도하는 오류를 범하게 된다.
이미 말했다. 결론을 미리 정하고 하는 분석은 전혀 색다른 시선이 아니라고.