brunch

You can make anything
by writing

C.S.Lewis

by Maven Sep 21. 2021

"데이터 사이언티스트"에 대한 오해

빅데이터하면 다 데싸인가요?

빅데이터 관련된 일을 하면 다 데이터 사이언티스트인가요?

네, 사실 저도 그랬으면 좋겠습니다...


요즘은 이 산업이 인기를 끌어서인지, 코로나19로 인해 빅데이터가 더 부각되어서인지

가끔 강연을 다닐때마다 '데이터 사이언티스트'(이후 '데싸')라는 칭호(?)를 듣고는 하는데

저도 딱히 부정하지는 않습니다. 좋잖아요, 듣기에~


그런데 우리끼리 얘기지만, 

빅데이터를 한다고 다 '데싸'라는 호칭을 부여받으면 안되지 않을까요?

저는 너무 무분별하게 '데싸'라는 용어가 오용되거나 남용되는 걸 원하지 않습니다.

(물론 오용되거나 남용되더라도 저에게 붙여지면서 저의 허접한 위상이 올라가는 건 반기지만요. ㅋ)


그에 대해서는 몇 가지 이유가 있습니다.


1. 우리는 아직 데싸를 얘기할만큼 시장이 성숙되지 않았습니다.

    회사에서 데싸라고 명함에 파주면 주고 받을 때 있어 보이기는 하겠지만,

    사실 누군가 데싸가 어떤 일을 하는 사람인가요? 라고 물으면 공통되게 대답할 수 있는

    직무 정의를 내리지 못했습니다. 

   아? 데이터를 코딩해서 추출하고 정제, 가공하고 인사이트를 추출하는 일이라고요?

   그게 엔지니어와 분석가랑은 어떻게 다르죠...?


2. 시장이 성숙되지 않은 시점에서 과도하게 특정 용어로 일부 직무를 포장하는 행위는

   시장 성장에 전혀 도움이 되지 않습니다.

   빅데이터 시장의 성숙, 그러니까 대한민국이라는 IT강국에서 차세대 먹거리의 기반이 되는,

   빅데이터 전문가를 양성해서 글로벌 시장의 본격적인 선진국으로 자리매김하겠다는 포부는

   절대 거품으로 도배되어서는 안된다는 게 제 생각입니다.

   직무를 포장하는 용어는 때로는, 의도와 달리 과도하게 사용되어 허상을 만들어 내는 듯 합니다.


  물론 해당 직무를 잘 알고 계신 분들에게는 아무것도 아닌, 그저 직업이나 직무를 구분하는 용어겠지만

  해당 분야에 대한 대중적 인식이 명확하게 자리잡고 있지 않은 상황에서 해당 직무가 단순히 트렌드이기
  때문에 특별하게 Naming을 한뒤, 있어 보이게만 포장하는 것은 시장 성장에도, 적합한 인재 영입에도

  전혀 도움이 되지 않는다는게 제 오랜, 그리고 편협한 생각입니다.


3. 용어를 자세히 봅시다.

   데이터 사이언티스트, 그러니까 '데이터 과학자'는 과학자라는 직무에서 파생되어 '데이터'가 붙은게

   아닙니다. 데이터는 존재했는데 거기에 '과학자'가 붙은 것이지요. 이 이면에는 빅데이터라는 것이

   원인이 되었습니다. 기존의 Small Data는 고작해야 엑셀로 처리할 수 있는 수준이었기에 컴퓨터 사양만

   받쳐준다면 처리 가능했는데, 이제는 프로그래밍, 즉 코딩을 통해 해결해야 할 정도로 용량이 커지다보니

   '과학자'라는 말이 붙은 겁니다. 그런데 코딩으로 데이터를 처리할 때와 엑셀로 처리할 때 방법론이 크게

   달라질까요? 사실 그렇지는 않습니다. 데이터를 쪼개고 합치고 일부를 꺼내어서 다른 변수와 합치고 하는

   가공 과정이나 통계적인 기법에 의해 분석하는 방법론들은 모두 엑셀에서도 가능합니다.

   다만, 용량이 커서 엑셀에서 처리하기 힘들어졌을 뿐이죠.



제가 최근에 배운 말중에 "디자인 공학"이라는 용어가 있습니다. 사실, 디자인 과학이라고 해도 되고, 공학이라는 표현을 써도 되는데 어쨌든 둘 다, 감각적으로만 창조했던 디자인이라는 영역을 좀 더 과학적으로 접근해보자는 시도에서 비롯되었다고 합니다. 예를 들면, 어떤 디자이너가 디자인을 창조했는데 소비자들의 반응이 이례적이었다는 거죠. 어떤 소비자들은 고급스럽다, 스타일리쉬하다, 멋있다 등의 찬사를 보냈는데, 그게 마침 그 기업이 제품에 담고 싶은 이미지였었나 봐요. 그 디자인은 생산부서와 협업을 통해 제품으로 출시가 되었을테니까 기업 입장에서는 도대체 어떤 요소가 소비자들에게 고급스럽다는 이미지를 심어주었을지 궁금했던거죠. 어떤 규칙이나 공식이 있다면 다음에도 이와 유사한 형태로 적용해보고 싶을테니까요. 그래서 이런 궁금증을 가지고 디자이너와 인터뷰를 하면 명확한 답을 얻지 못한다는 겁니다. 소위 "과학적이지 않다"는 것이죠. 정의 내릴 수도, 규칙이나 공식으로 승화할 수도 없기 때문입니다. 영감(Inspiration)의 영역이었으니까요. 그래서 등장한 게 디자인 과학, 디자인 공학입니다. 디자인을 공학적으로 풀어서 모두가 공감할 수 있는 규칙으로 정의 내려 보자는 시도인거죠. 그래서 대학에서는 요즘 디자인 공학, 디자인 융합을 모토로하는 학과가 생길 정도라고 하네요. 


 그런데 이건 디자인의 영역이 바뀐건가요? 아닐 것입니다. 디자인을 대하는 태도가 달라진 것이죠. 


 데이터도 마찬가지입니다. 코딩을 배우면, 데이터 분석을 코딩으로 할 수 있으면 데이터 분석가에서 데이터 과학자가 되는 것인가요? 데이터의 종류가 바뀌었고, 데이터를 바라보는 관점이 바뀐 것입니다. 그러니까 빅데이터라는 새로운 데이터를 다룰 줄 아는 분석가가 필요한 것이지, 데이터 과학자라고 하는, 즉 데이터 분석가와 직무가 달라야 하는 새로운 직무가 생긴 것은 아닐 것입니다. 


 새로운 데이터의 특성도 제대로 이해하지 못하고 있는 상황에서 무턱대고 데이터를 코딩이라는 프로그래밍으로 다룰 줄 아는 사람들을 '데이터 사이언티스트'라고 명명하고 실제 그들에게는 데이터 분석과 해석, 견해를 통한 Insight를 요구하는 지금의 형국은, 물론 빅데이터 시대를 갑작스럽게 맞이한데 따른 '오해'에서 비롯될수는 있다고 생각되나, 조금은 진지한 논의가 필요한 시점인 듯 합니다.

 그들을 명명하는 용어는, 그 다음에 해도 전혀 늦지 않아요.


 데이터 사이언티스트가 되려면 어떻게 해야 하는지를 물어보는 많은 취업준비생들이 

 데이터 사이언티스트를 데이터 분석가의 다음 과정, Next Level로 인식하는 경우가 많습니다.


 기업의 무분별한 용어 남용과 아카데미에서의 인원 모집을 위해 커뮤니케이션 메시지 중 하나로 활용되고 있는 이 용어에 대해, 조금은 진정하고 바라볼 필요가 있지는 않을까?











매거진의 이전글 여러분, 코딩 잘해도 빅데이터 분석 못해요
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari