지록위마 - 사슴을 가리켜 말이라 하다
[시리즈 이전 글]
https://brunch.co.kr/@8d1b089f514b4d5/73
https://brunch.co.kr/@8d1b089f514b4d5/74
https://brunch.co.kr/@8d1b089f514b4d5/75
https://brunch.co.kr/@8d1b089f514b4d5/76
진짜 데이터 과학자라면 겪는 고충
지난 진짜 데이터 과학자라면 겪는 고충 4편에서는 우이독경, 쇠귀에 경 읽기라는 고충에 대해 살펴보았습니다. 이해하기 어려운 말을 이해할 의지가 없는 사람들에게 주구장창 설명해야 하는 데이터 과학자는 분명 부담스러운 책임감에 놓여있을 수밖에 없습니다. 하지만 모든 데이터 과학자들이 이런 부담감과 고충을 느끼는 것은 아닙니다. 어떤 직업이던 진짜 자기 일에 애정과 열의가 있는 사람이 있는 반면, 어떤 사람들은 단순히 직업을 나의 돈벌이 수단 그 이상도 이하도 아닌 것으로 치부하곤 합니다. 당연히 데이터 과학자 중에도 데이터 과학을 단순히 돈벌이 내지는 타이틀 정도로만 생각하는 사람이 있고 그런 사람들은 앞선 고충으로부터 자유로울 확률이 높습니다.
이는 이번 시리즈의 제목에 굳이 '진짜'라는 단어를 추가한 이유이기도 합니다. 모든 데이터 과학자들이 항상 고충을 겪는 것은 아닙니다. 데이터 과학에 큰 열정과 책임을 가지고 있지 않은 사람이라면 시리즈 전체에서 이야기한 부담을 느낄 이유가 없습니다. 그리고 데이터 과학은 어쩌면 가장 유망하며 트렌디한 분야 중 하나이기 때문에, 이러한 책임감 없는 '진짜'로 포장하는 '가짜'들이 가장 많은 분야이기도 합니다. 가짜 데이터 과학자는 당연히 데이터 과학 분야에 열의도 없을뿐더러 기본적인 역량도 갖추지 못한 경우가 많습니다. 결국, 진짜 데이터 과학자는 언제나 가짜 데이터 과학자와 동일선상에 놓여 비교를 당해야 하는 입장이 될 수밖에 없습니다.
가짜 데이터 과학자
가짜 데이터 과학자의 한 가지 특징이라고 한다면, 데이터 과학 분야에 대한 역량이 다소 부족함에도 불구하고 본인이 데이터 과학자라고 홍보하기를 좋아한다는 점입니다. 결론적으로 진짜 데이터 과학자는 가짜 데이터 과학자를 보며 불편한 마음을 가질 수밖에 없습니다. 가짜 데이터 과학자들이 진행하는 부실한 데이터 과학 프로젝트를 진짜 데이터 과학자는 그저 지켜볼 수밖에 없습니다. 여기에 더해 부실한 프로젝트를 포장과 홍보로 보완하는 행태 역시도 그저 지켜볼 수밖에 없습니다. 지록위마, 사슴을 가리켜 말이라 한다는 뜻입니다. 가짜 데이터 과학자를 보며 진짜 데이터 과학자라고 치켜세워주고 또 이에 동조해야 하는 것은 진짜 데이터 과학자라면 절대 피할 수 없는 고충입니다.
데이터 과학자 타이틀 얻기
진짜 데이터 과학자들이 가짜 데이터 과학자들의 역량 부족이나 과한 포장하기를 그저 방관할 수밖에 없는 고충의 가장 큰 원인은 가짜 데이터 과학자들이 생겨나기 쉽다는 점입니다. 데이터 과학자라는 타이틀을 얻기 위해서는 어떤 단계가 필요할까요? 그저 회사에 취직하여 데이터 과학이라는 타이틀이 붙여진 부서에서 일을 하면 됩니다. 이는 의사, 변호사 등 일반적인 전문직과 같이 혹독한 인증 과정을 필요로 하지 않기 때문에 생기는 어쩔 수 없는 일일수도 있습니다. 아쉽게도 현재의 현실은 데이터를 다루는 모든 기업에서 데이터를 만지는 사람들은 데이터 과학자라고 칭하고 있습니다.
여기에 더해 데이터 과학자는 기업에서 채용 수요가 지속적으로 발생하고 있는 분야 중 하나입니다. 그렇기 때문에 취업 한파라고 불리고 있는 요즘 시대에 적어도 데이터 과학 분야는 꾸준하게 인재 탐색과 채용이 일어나고 있습니다. 하지만 데이터 과학자가 되기 위한 역량과 마인드셋을 갖추는 것은 어렵습니다. 그렇기에 진짜 데이터 과학자의 자질을 갖춘 사람도 흔치 않을 수밖에 없습니다. 결국 수많은 인재채용 수요가 있는 상황에서 그 수요를 메꾸기 위해서는 가짜 데이터 과학자가 채용 자리를 차지할 수밖에 없습니다. 즉, 어찌 보면 가짜 데이터 과학자가 생겨나 판을 치는 것에는 구조적인 문제 역시 원인으로 작용하고 있는 상황입니다.
데이터 과학자 간 역량 차이
다시 한번 말하지만 데이터 과학자가 되기 위해 갖추어야 하는 역량은 매우 많습니다. 그렇기에 진짜 데이터 과학자들도 부족한 영역이 있을 수 있습니다. 그리고 당연히 데이터 과학자들 사이에서도 그 역량에는 어느 정도 차이가 있을 수밖에 없습니다. 어쩔 수 없이 진짜 데이터 과학자는 상대적으로 높은 역량을 지니고 가짜 데이터 과학자는 낮은 역량을 지닐 수밖에 없습니다. 때로는 데이터 과학자라고 불리는 사람들 중에서도 머신러닝에 대한 기본적인 개념이나 대표 알고리즘에 대한 이해가 전혀 없거나, 통계적 분석 기법에 대한 지식이 전무한 사람도 있습니다. 데이터 과학 분야의 기본 구성요소를 생각할 때 절대 데이터 과학자라고 불리면 안되는 사람이라고 할 수 있습니다.
이러한 가짜 데이터 과학자의 역량 부족은 오롯이 진짜 데이터 과학자의 업무 불편함으로 이어질 수밖에 없습니다. 옆 동료의 역량이 부족하다면 진짜 데이터 과학자는 가짜 데이터 과학자에게 늘 설명을 해줄 수밖에 없습니다. 설명의 대상은 통계, 머신러닝, 딥러닝, 프로그래밍 등 다양한 대상이 될 수 있습니다. 때로는 이것이 설명 수준이 아니라 강의 수준이 될 수도 있습니다. 만약 같이 협업을 진행한다면 가짜 데이터 과학자의 부족함을 진짜 데이터 과학자가 메꿔주어야 합니다. 같은 조직에서 같은 업무를 하는 동등한 입장임에도 누군가가 희생을 해야 하는 고충이 뒤따를 수밖에 없습니다.
데이터 과학 성과 부풀리기
나의 역량은 우수하다
말이 되고 싶어 하는 사슴들의 특징이라고 한다면 본인이 말이 맞다고 잘 홍보하고 다닌다는 점입니다. 어떻게 생각하면, 데이터 과학 역량을 갖추지 못한 채로 데이터 과학자 타이틀을 얻었다는 것 자체가 본인의 셀프 홍보를 잘한다는 사람이라는 것을 의미하기도 합니다. 물론 자기 스스로를 잘 홍보하는 것 역시 최근 시대에 중요한 역량인 것은 맞습니다. 하지만 적어도 그 홍보에 거짓이나 심한 과장이 있어서는 안됩니다. 많은 사람들은 데이터 과학자가 되기 위하여 데이터 분석이나 머신러닝 모델을 만든 경험이 있다고 어필하곤 합니다. 하지만 단언컨대 데이터 과학 프로젝트 경험을 홍보하는 사람들 중, 본인의 역량이 아닌 오직 타인의 역량으로 프로젝트를 진행한 사람이 절반 이상은 될 것입니다.
자연스럽게 가짜 데이터 과학자들은 여러 경험을 기반으로 데이터 과학 역량 역시 스스로 우수하다고 홍보할 수밖에 없습니다. 스스로 데이터 분석의 시작부터 끝까지를 책임질 프로그래밍 역량을 보유하고 있는 것은 물론, 여러 분석 모델들의 작동 원리, 데이터 문제인식과 해결방안 제안에서의 중요한 점 등을 모두 인지하고 있다고 말하곤 합니다. 당연히 이 모든 것을 습득하는 것은 절대 쉬운 일이 아닙니다. 진짜 데이터 과학자들은 모두 저 역량들을 확보하기 위해 많은 시간과 노력을 기울이고 있습니다. 하지만 진짜 데이터 과학자들이 해당 역량을 확보하기 위해 쏟았던 몇 년의 시간이 가짜 데이터 과학자들의 몇 분의 말솜씨로 동격화되는 것을 보면 허탈함을 느끼지 않을 수 없습니다.
나의 작업 결과는 우수하다
본인이 진행했던 프로젝트나 과제 경험을 보기 좋게 정리하고 이야기하는 것은 정말 중요한 역량입니다. 하지만 데이터 과학 분야에서 희한하게도 그러한 역량이 높은 것은 항상 가짜 데이터 과학자들인 경우가 많습니다. 부족한 역량으로 데이터 과학자라는 타이틀을 얻은 홍보 실력이 뒷받침되어 있기 때문에 그럴 수도 있습니다. 여기서 진짜 데이터 과학자들 역시 하나 주의해야 할 점은 데이터 과학 역량을 쌓는 것도 중요하지만 이것의 의의나 활용성을 잘 정리하고 이야기하는 능력도 잘 갖추어야 한다는 것입니다. 아직까지의 현실은 데이터 과학 시각으로 훌륭하게 평가받아야 할 결과물이 상대적으로 저평가를 받고 그 반대의 경우가 고평가를 받는 경우가 너무 많습니다.
이에 대해 쉽게 이해해보면 실제로는 B, C급 정도의 평가를 받아 마땅한 데이터 과학 프로젝트가 A등급을 받고 S, A급 정도의 평가를 받아 마땅한 데이터 과학 프로젝트가 B, C급 정도의 평가를 받는 경우가 많다는 점입니다. 데이터 과학 분야는 상대적으로 최근에서야 조명을 받기 시작했습니다. 그래서 어떤 기업이든 평가를 담당하는 시니어 위치의 사람이라면 데이터 과학에 대해 체계적으로 교육을 받았을 확률이 적습니다. 그렇기에 데이터 문제 해결에 관한 역량보다는 데이터 과학자들의 결과 보고서나 홍보 문구를 듣고 모든 것을 판단할 수밖에 없습니다. 진짜 역량보다는 윗사람이 듣고 싶어 하는 말만을 해주는 사람이 더 훌륭한 데이터 과학자로 평가받고 있는 현실입니다.
나의 업무에 진심인 사람
결국 데이터 과학 분야에는 너무도 많은 가짜 데이터 과학자가 있었고 그 가짜들 때문에 진짜 데이터 과학자는 억울한 상황에 놓일 수밖에 없었습니다. 어찌 보면 데이터 과학에 대한 열의보다는 타이틀 그 자체 때문에 데이터 과학 분야로 너무 많은 사람이 유입되어 생긴 일일수 있습니다. 진짜 데이터 과학자는 늘 본인의 업무에 진심입니다. 그렇기에 본인처럼 업무에 진심인 사람들과 많이 소통하기를 원합니다. 말이라면 사슴이 아닌 말과 소통을 하고 싶어 할 것입니다. 이번 진짜 데이터 과학자라면 겪는 고충 시리즈에서는 데이터 과학자의 화려한 겉 이면의 고충을 살펴보았습니다. 어떤 직업이든 고충은 있을 수밖에 없습니다. 마냥 데이터 과학 분야를 완벽하고 뜨거운 분야로만 상상하는 오해 역시도 줄어들어야 합니다.