실무를 해본 뒤 느껴진 진짜 차이
"박사님, 그런데 왜 데이터 사이언티스트가 되셨어요?"
내 이력을 어느 정도 알고 있는 분들은 어김없이 이 질문을 하신다. 그럴 때마다 나는 잠시 그때의 시점에서 생각해 본다. 전기공학을 공부하며 초소형 디바이스를 연구하며 박사과정을 지낸 시절부터 지금까지 어떻게 살았는지. 그리고 데이터 사이언티스트로서 이제는 꽤 쌓인 실무 경험과 관리자 경험을 바탕으로 더 현실적이고 구체적인 답을 할 수 있게 되었다.
어쩌다 마음을 먹게 되었는지는 이전 글에서 어수룩하게나마 적어 보았다.
https://brunch.co.kr/@drvector/2
더불어 꼭 이어지는 질문도 있다.
"박사학위 때 했던 것을 포기하는 게 아깝지 않으세요?"
우선 나는 박사학위 때 했던 것을 포기했다고 생각하지 않는다. 오히려 박사학위 때 해봤던 것을 더 확장해서 내 전문분야가 확장되었다고 생각한다.
박사과정에서 훈련한 가장 핵심적인 역량은 바로 '문제 해결 능력'이다. 물론 모든 박사과정이 다 그렇지 않을 수는 있겠지만 적어도 내가 나의 지도교수님으로부터 배울 수 있었던 가장 큰 능력이다. 문제를 명확히 정의하고, 가능한 원인을 파악하며, 다양한 관점에서 문제를 바라보고, 여러 가능성이 있는 해결책을 고려한 후, 우선순위를 매겨서 실행하는 과정. 이 프로세스를 여러 가지 문제들을 만날 때마다 다양하게 경험했고, 지도교수님께서 어떠한 해결책을 선택하시는지도 지켜보았고, 그래서 연구 성과들이 나오는 것을 체감할 수 있었다.
이러한 문제 해결 프로세스는 데이터 사이언티스트로 일하면서도 그대로 적용된다. 연구실에서 실험을 설계하고 가설을 세우던 경험이, 비즈니스 문제를 데이터로 접근할 때 그대로 살아나는 것이다. 결국 분야만 바뀌었지 본질적인 사고방식과 문제 해결을 위한 접근법은 동일하다는 것을 깨달았다.
그럼에도 불구하고 두 분야, 전기공학과 데이터 사이언스,는 닮은 점도 있고 다른 점도 있다.
데이터 수집 → 데이터 정제 → 시각화 및 해석 → 액션 아이템 도출
위 과정은 디바이스(소자) 연구개발을 할 때나 데이터를 다루는 지금이나 동일하다. 문제의 크기나 문제가 놓인 환경의 복잡도는 다를 수 있는데, 어떤 형태로든 위와 같은 과정을 거치게 된다. 그래서 데이터 사이언티스트가 처음 되었을 때에도 훨씬 빠르게 실무를 익힐 수 있었다.
특히 결과 해석과 액션 아이템 도출 부분에서는 오히려 나에게 강점이 있다고 생각되었다. 대학원을 다니는 내내 실험 결과를 해석하고 다음 방향을 설정하던 경험이 충분히 쌓여서 그대로 활용할 수 있었기 때문이다.
가장 크게 다르다고 느꼈던 부분은 바로 데이터 수집 과정이었다.
대학원의 연구실에서는 모든 것이 통제된 환경이었다. 실험조건과 변수를 통제할 수 있었고, 내가 보고자 하는 데이터를 얻기 위해 조건과 변수를 설정하고 그에 맞게 수집, 측정, 계산할 수 있었다. 그리고 그 조건과 변수를 바꾸어 가며 실험을 진행하고 그렇게 얻어진 데이터에서 시작했다. 따라서 데이터 정제는 간단히 쓰레기값만 제거하거나, 노이즈만 제거해도 깔끔한 데이터를 얻을 수 있었다.
반면, 데이터 사이언스에서는 대부분의 경우, 데이터가 일단 무작정 쌓여 있는 데이터에서 시작한다. 통제되지 않은 실제 환경에서 데이터가 쌓여 있고, 그 데이터를 (회사의 경우) 사내 데이터베이스에 잘 저장한 뒤, 그것을 활용한다. 마치 광산에서 보석을 캐내듯, 수많은 데이터 더미에서 의미 있는 정보를 찾아내는 것에서 시작한다. 이 과정이 대학원 연구실에서 했던 과정으로 치면 실험 조건과 변수를 설정하는 과정에 대비되는 부분이다.
이렇게 데이터 수집 환경이 다르다 보니, 데이터 사이언스에서는 데이터 정제 과정이 중요하다. 잘 정의된 조건을 세우고, 쓸모없는 데이터는 걸러내고, 비어 있는 데이터는 논리적 근거로 채워주어야 한다. 있는 데이터를 잘 합성하여 의미 있는 다른 요소로 만드는 것도 중요하다. 퀄리티 좋은 데이터가 있어야 뭘 하든 좋은 아웃풋이 나온다는 것을 여러 가지 프로젝트를 통해 경험했다. 퀄리티를 판단할 수 있는 능력, 그리고 퀄리티 좋은 데이터로 만드는 능력을 쌓아야 훌륭한 데이터 사이언티스트로서 갖추어야 할 능력이라고 생각한다.
회사들이 채용 과정에서 가장 질문을 많이 하는 부분 중 하나는 바로 기술적 경험이다. "Python 다룰 줄 아세요?", "Tensorflow 써보셨나요?", "시각화는 Tableau나 Power BI 중 뭘 쓸 줄 아세요?" 같은 질문들.
솔직히 말하면, 이런 특정 도구를 써봤는지 여부는 경력자에게 있어 그렇게 중요하지 않다고 생각한다.
대학원 연구실에서 MATLAB, LabVIEW, COMSOL, Cadence 같은 전문 소프트웨어를 다루던 경험이 있다 보니, Python, SQL, Tableau 같은 데이터 분석 도구로 전환하는 것은 생각보다 빠르게 적응할 수 있었다. (물론 각 소프트웨어들의 성격은 아예 정말 다르다.) 프로그래밍 언어나 분석 도구의 문법과 사용법은 조금만 쓰다 보면 익힐 수 있지만, 그 도구를 활용해 문제를 정의하고 해결하는 사고방식은 하루아침에 만들어지지 않기 때문이다.
도구는 결국 도구일 뿐이다. 진짜 중요한 것은 그 도구로 무엇을 할 것인지, 어떤 문제를 어떻게 해결할 것인지에 대한 사고방식과 접근법이다.
"언제 가장 보람을 느끼나요?"
내가 정의한 문제를, 내가 설계한 과정으로, 내가 실험하고 분석한 결과가 실제 비즈니스에 눈에 보이는 성과로 이어질 때. 그 순간이 가장 짜릿하다.
대학원 연구실에서도 실험이 성공했을 때의 기쁨이 있었는데, 데이터 과학에서의 성취감은 또 다르게 다가온다. 내 분석 결과가 회사의 매출 증대로 이어지거나, 고객 만족도 향상으로 연결되거나, 비용 절감으로 나타날 때의 뿌듯함은 말로 표현하기 어렵다. 내가 쓸모 있는 사람이라는 자신감도 솟아난다.
최근에는 각 산업 분야에서 데이터로 할 수 있는 일이 폭발적으로 늘어나고 있다. AI와 머신러닝의 발달로 과거에는 불가능했던 것들이 현실화되고 있고, 앞으로도 가능성은 무궁무진해 보인다.
요약하면, 나는 공학박사라는 정체성을 버린 게 아니라 확장했다. 데이터 사이언티스트라는 새로운 정체성을 더한 것이다.
공학을 공부하면서 습득한 사고방식을 데이터 사이언스에 접목하니, 더욱 다차원의 문제 해결이 가능해졌다. 기술적 백그라운드가 있으니 엔지니어팀과의 소통도 원활하고, 동시에 비즈니스 임팩트를 만들어내는 데이터 분석도 할 수 있다.
그리고 무엇보다 여전히 배우고 성장하는 것이 즐겁다. 새로운 알고리즘을 접할 때의 설렘, 복잡한 데이터 속에서 패턴을 발견했을 때의 짜릿함, 내 분석이 실제 의사결정에 영향을 미칠 때의 보람.
"박사님은 왜 데이터 사이언티스트가 되셨나요?"
이 질문에 자신 있게 답할 수 있다. 포기한 게 아니라 확장했고, 버린 게 아니라 더했으며, 끝낸 게 아니라 새로 시작했다고.
그리고 이 여정은 아직 끝나지 않았다.
앞으로도 계속될 나의 배움과 성장이 기대된다.