데이터 분석
데이터 과학자라는 용어를 ‘우리 모두의 백과사전 위키백과’에서 검색해 보니 의외로 그 정의가 없다. 그런데 이런 설명은 있다.
‘빅데이터 분석가(Big Data Analyst)는 빅데이터 전문가로 ‘디지털 사이언티스트(Digital Scientist)’ 혹은 ‘데이터 과학자’(Data Scientist)로 불리는 전문가이다.’
아 ~~ 그러니까 데이터 과학자는 빅데이터 분석가를 의미하는 거였구나. 나도 처음 알았다.
근데 어쩐담. 앞으로의 글들은 빅데이터 분석가에 대해 언급할 건 아닌데.
하지만 요즘은 나도 어딜 가든 빅데이터의 굴레에서 좀처럼 벗어나기 힘든 것이 사실이다.
한 번은 오산에 위치한 어느 고등학교에서 ‘데이터 과학자에게 듣는 데이터 과학의 세계’라는 거창한 이름의 특강을 진행한 적이 있었다. 그때 한 학생이 내게 이런 질문을 했다.
‘선생님, 빅데이터가 뭔가요?’
다소 불량한 자세로 듣던 그 친구의 기습적인 질문이 조금은 거북스러웠지만, 강연 내내 나오는 빅데이터란 용어가 궁금했겠거니 생각을 하고 나는 이렇게 대답을 해주었다.
‘그러네요, 우리가 빅데이터에 대한 정의는 논하지 않았네요. 글쎄요…… 빅데이터에 대한 정의는 학자마다 기관마다 다양하긴 하죠. 보편적으로 3V라고 해서 크기(Voume)가 크고, 다양(Variety)하고, 처리 속도(Velocity)가 빠른 것을 의미하죠. 이 외에도 참 많은 이야기가 있어요. 근데 저는 개인적으로 인간이 다룰 수 없는 데이터를 빠르게 처리해서 가치를 창출하는 과정을 통칭해서 빅데이터라 할 수 있지 않을까 싶네요’
‘선생님, 인간이 다룰 수 없는 데이터가 있나요?’
‘아 이건 정답이 아니에요. 완전히 저만의 생각인 거죠. 인간이 다루면 통계죠, 인간이 다룰 수 없으니 기계의 힘을 빌리는 거라 생각해요, 물론 기계도 인간이 주입한 논리적 코드에 의해 움직이긴 하지만요’
딱히 그 학생 아니어도, 누가 내게 빅데이터에 대해 물어본 들, 나의 대답은 항상 위와 같이 똑같다. 단, 다시 강조하지만 나만의 생각일 뿐이다.
그런 의미에서 위키백과에서 말한 빅데이터 분석가가 곧 데이터 과학자라는 해석은 일리가 있어 보인다. 인간이 다룰 수 없으니 데이터 자체가 연구 대상이 되니까 말이다.
‘연구’하면 소스라치게 놀라는 나를 생각하면 역시나 난 데이터 과학자는 아닌 것 같다. 데이터 쟁이가 확실히 어울린다.
‘난 이미 틀렸어. 너 먼저 가. 너라도 확실하게 데이터 과학자가 되죠……’
‘에이, 그럼 뭐야? 실망인데…… 데이터 과학자가 되는 방법 알려주는 거 아니었어?’
‘응 아니었어. 미안해. 하지만…… 데이터 분석을 업으로 할 거라면 한 번은 읽어줘. 과학자는 아니어도 ‘데이터 분석 좀 할 줄 아는데’ 소리는 듣게 해 줄게’이 것이 이 글의 목적이다.