이과생과 문과생의 만남.
요즘 핫한 직업이다. 수많은 데이터와 숫자를 해석해서 활용가치가 높은 어떤 의미를 찾아내는 일. 그냥 쌓여 있는 여기 저기 데이터를 한데 모아서 연결관계를 찾아내고 앞으로 어떤 일이 일어날지 예측하는 업무이다. 우선 데이터를 쌓아야 하고, 피처를 설계하여 모델링하고, 그 결과를 확인해서 가설에 맞지 않으면 다른 모델링을 설계하여 데이터를 뽑는 일을 반복해야 한다. 단순히 데이터를 분석하는 '분석가' 또는 효율성을 높이기 위해 분석 프로세스의 틀을 잡는 '데이터 엔지니어나'와는 다르게 ‘데이터 사이언티스트’라고 불리우기를 원하며, 실리콘밸리에서도 높은 몸 값에 팔리는 분위기다.
이용자 Demo, 그들이 검색한 키워드, 다녔던 장소, 방문했던 웹사이트를 묶어서 쌓아 두어야고, 나아가 서로 다른 영역에 있는 기업과 기업의 데이터를 합치면 엄청난 가치가 될 것이라고 믿는다. Data를 디지털 시대의 New Oil이라고 하지 않는가. 데이터가 없는 기업은 곧 죽을 것처럼 묘사되며, 데이터만 있으면, 세상의 변화를 발견하고, 고객의 사고를 이해할 수 있다고 생각한다.
하지만, 데이터만으로는 아무것도 생기지 않는다. 중요한 것은 데이터를 읽는 '직감력' 또는 '영감'. 무궁무진한 상상력이 꼭 필요하다.
비 오는날 저녁에는 크림치즈빵이 맑은 날 대비 100% 많이 팔린다고들 한다. 비, 저녁, 크림치즈빵. 도대체 무슨 관계인가? 정답은 없다. 상상의 나래를 펴보자. 비 오는 날 유독 빵집에서 할인행사를 하나? 비 오는 날 저녁 학생들이 집에 오면서 출출해서 빵을 사먹는다? 비 오는 날 저녁 회식 끝나고 오는 아빠가 달달한 크림치즈를 안주거리로 사오는 것일까? 아니면, 비 오는 날은 축축하니 낮에 안팔린 치즈크림빵을 떨이하는 가정 주부가 있는 것일까? 꼬리에 꼬리를 무는 질문을 하면서 추가 데이터를 조사하는 과정. 그 과정에서 데이터의 가치가 나오는 것이다. 가정과 가설에 따라 데이터를 분석하면서 의미를 찾아가는 과정. 문과생과 이과생이 만날 때, 진정한 데이터 사이언스가 가능한 것이다.
'Data Company'라고 선언하고 데이터 쌓기에만 급급하지 말았으면 한다.