기초가 중요합니다.
최근에는 정말 데이터 분석하기 편해졌다는 생각이 많이 든다.
이건 비단 나뿐만 아니라 선배 데이터 쟁이들도 공통적으로 하는 이야기다.
데이터만 확보되면 프로그램이 알아서 결과를 도출해 준다.
그래서 데이터 분석을 진행하는 과정보다 데이터를 찾는 과정이 더 중요하게 대두되는 현실이다.
입력되는 데이터가 정확해야 출력되는 데이터도 정확하니까 이해가 되기는 한다.
그런데 정확한 데이터를 찾은 일과 수집된 데이터를 분석하는 과정까지도 많은 노력을 기울였던 내게는 현 상황은 ‘이게 정말 데이터 분석이 맞는 거야?’라는 의구심이 들기도 한다.
솔직히, 그 혜택을 나도 받고 있으니 뭐라 할 상황은 아니다.
최근 오픈 소스를 통해 다양한 분석을 수행해 주는 ‘R’이라는 프로그램이 있다. 나 역시도 최근 대부분의 분석을 ‘R’에서 수행하고 있을 만큼 그 인기가 높다.
한 번은 ‘R을 통한 빅데이터 분석’이라는 단기 과정에서 학생들에게 수업을 진행했을 때 일이다.
이런 수업은 엄밀히 데이터 분석을 공부하는 건 아니다. R 프로그래밍 기법을 배우는 것이다.
학생들에게 데이터 분석에서 가장 중요한 부분은 기본적인 개념을 이해하는 것이고 프로그램은 시간이 지나면 자연스럽게 활용 가능해진다고 부연 설명을 하고 있는데 한 학생이 내게 이런 말을 했다.
‘선생님, 요즘 프로그램이 다 알아서 분석해 주는데 굳이 고리타분한 수학적 개념까지 이해할 필요가 있을까요?’
‘그래도 기초가 탄탄한 것과 그렇지 못한 건 다르지 않을까요? 뭐 굳이 할 필요도 없긴 하죠. 그냥 제 생각일 뿐이에요’
대답은 했지만 속으로 이런 질문을 하고 있었다.
‘여러분이 지금 R을 통해 도출한 그 결과가 맞는 건가요? 얼마나 믿을 수 있어요?’
데이터 분석가인지 프로그래머인지 분간하기 힘든 세상이다.
학원, 학교 어디에서도 기본을 깊이 있게 다루지 않는다.
앞으로 더 필요가 없어지는 세상이 될 것이다.
데이터 분석가를 양성하는 것이 아닌 데이터 분석 프로그래머를 양성하는 현실이다.
그래도 난 소신을 가지고 주장한다.
사상누각이 되지 않으려면, 그리고 데이터 과학자라는 섹시한 직업을 갖고 싶다면 기본에 충실하시길 바란다.
수학의 전 분야도 아니다. 단지 평균과 확률에 대한 개념과 이해 정도만 바랄 뿐이다.
그리고 마지막으로 이런 말을 하고 싶다.
‘여러분, 그래도 명색이 데이터로 밥을 먹고사는데, 적어도 평균에 대해서는 명쾌하게 설명이 돼야 되지 않겠어요? 기초가 중요합니다.’
http://www.yes24.com/Product/Goods/91614222