직업적 한계
아니 전 글들에서 데이터 과학 분야의 직업들이 21세기에 가장 섹시한 직업이라면서요? 그런 직업에게 직업적인 한계가 어디 있겠냐만은, 정말 많다.
AI를 만드는 AI
2018년 마이크로소프트가 세계 최대의 오픈소스 커뮤니티 깃허브 (GitHub)를 75억 달러에 인수했다. 깃허브는 대략 5600만 명의 사용자 (개발자나 데이터를 다루는 사람들, 즉 코더들)를 보유하고 있는 세계 최대 놀이터이다. 인수 당시만 해도 말이 많았고, 왜 인수했는지 의아해하는 사람들이 많았는데, 작년 6월에 공개한 깃허브의 코드 작성을 돕는 코파일럿 (Copilot)을 보고 마이크로소프트의 비전을 알 수 있었다.
코파일럿은 개발자가 기본 코드 몇 개만 입력을 하면, 그간 사용자들의 코드들을 바탕으로 나머지 부분을 완성시켜주는 AI이다. 나도 프리뷰 모델에 당첨이 되어서 사용을 해 보았지만, 그 완성도는 기괴할 정도로 놀라웠다. 물론 많은 개발자들이 아직 너무 미흡한 단계다 vs 이 정도면 훌륭하다 등의 반응으로 갈리지만, 적어도 나는 후자의 느낌으로 이용했었다. 왜냐하면, 지금은 미흡한 코딩일지라도 우리가 코드를 정정해 나아가면, 이 빌어먹을 AI는 그런 수정들을 거름 삶아 더 나은 알고리즘으로 배우는 형식이기 때문이다.
그동안 사용자들의 인풋을 바탕으로 작동되는 인공지능이기에, 아직 라이센스니 법적 관련 문제들로 얘기가 많지만, 그럼에도 나는 인공지능으로 인해 다른 직업들 보다도 데이터 관련 직업들이 오히려 먼저 사라질 수도 있겠다는 생각을 지울 수가 없다.
소프트 스킬
위와 같은 외적인 한계를 제외하고도, 내적인 한계를 하나 꼽자면 소프트 스킬일 것이다. 실력 있는 데이터 전문가를 규정하는 여러 가지 기준들이 있겠지만, 내 개인적인 생각에 기술적인 부분은 전제조건이고 (기술적으로 뛰어난 사람들은 차고 넘친다) 소프트 스킬을 잘 갖춘 사람이 정말 뛰어난 인재라고 생각한다. 팀워크, 리더십, 발표 능력과 같이 직업적인 것뿐만 아니라 회사에서의 인간관계라던지 시시콜콜한 잡담 등도 포함이 된다. 그중에서 가장 중요한 능력은 발표 능력일 것인데, 회사의 어떠한 문제를 풀기 위해서 어떠한 과정들을 거쳐서 결과에 도출했는지, 또 그 인사이트가 어떻게 회사에 도움을 줄 수 있는지 등과 같은 여정을 스토리텔링으로 잘 풀어내는 능력이 되겠다.
하지만 말이 쉽지, 이런 쪽은 사람 그 자체와 관련이 많기 때문에 배우기 가장 어려운 게 이런 부분이다. 내가 나고 자라기를 소심하고 내성적으로 태어났다면 수십 명 앞에서 나의 데이터 프로젝트의 결과를 발표하는 게 누구는 죽기보다 싫을 수도 있다. 내가 지금 있는 회사는 미팅이나 발표를 정말 많이 하는데 (이건 유럽 회사들 특징인 것 같기는 하지만), 이 부분을 견디지 못해서 이직을 하거나 심지어는 직업을 바꾸는 동료들도 여럿 보았다.
발표를 잘한다는 것은 자신감 있게 나의 것을 얘기하는 부분을 넘어서 저기 앉아있는 원수 덩어리들을 이해시켜야 한다는 뜻이다. 생각보다 많은 데이터 전문가가 자신들의 언어를 모든 사람들이 이해할 수 있을 것이라고 생각하고,
이러쿵저러쿵해서 통계적으로 피어슨 값이 이랬고 클러스터링 값이 x라서 뭐가 저랬길래 결과가 이렇게 나왔다!
라는 식의 발표를 하는 경우가 왕왕 있다. 하지만 대부분의 사람들이 알고 싶은 건 초등학생도 이해할 만큼 간단하게 정리된 결론이다. 예를 들어서, 내가 최근에 깨달은 것은, 회사의 높은 사람들이 궁금해하는 것은 대부분 돈과 관련된 것들이기에, 이런 식의 발표가 훨씬 낫다.
데이터 분석 결과 x 캠페인보다는 y 캠페인을 z 방향으로 진행시키는 게 회사에 더 큰 이익을 가져오기에 탁월하다!
그다음에 이 결과에 대해서 자세히 알고 싶은 사람들에게 위에 말처럼 디테일한 부분을 설명해주면 된다. 물론 100번 발표하면 1번 있을까 말까 하지만 말이다.
끝마치며
더 적으려면 얼마든지 있겠지만, 외적인 한계와 내적인 한계를 하나씩만 적어보았다. 이 글 포함 총 4개의 데이터와 관련한 딜레마를 적으면서 내가 전하고 싶은 메시지는 간단하다. 이렇게나 어려운 부분이 많으니까 꿈도 꾸지 마세요 같은 것이 아니라, 이왕 시작할 거면 오히려 이런 부분들을 알고 시작하셨으면 좋겠다는 마음이다. 이런 디테일한 부분은 정말 관심이 있어서 제대로 찾아보거나, 주위에 현업에 종사하는 사람이 있거나, 그런 사람들에게 물어보지 않으면 수면 위로 드러나지 않는 부분들이다. 그럼에도 불구하고, 아무런 도메인 지식 없이 그저 뜨는 직업이라는 이유 하나만으로 뛰어드는 사람이 정말 많다. 하지만, 그렇게 된다면 그동안 적었듯, 이 직업의 무게에 대해 어느 순간 깨닫고, 그로 인해 좌절하는 순간이 올 것이다. 실제로도 많은 사람들이 무턱대고 시작했다가 통계와 맞닥뜨리는 순간 포기한다던지, 혹은 프로그래밍을 배우는 단계에서 포기한다.
언제부터인가 인간은 대부분 성인이 되는 시점부터 선택과 결정의 연속이라는 생각이 들었다. 그것이 작던 크던, 그러한 선택들이 모여서 결국엔 나의 인생을 형성한다. 그러므로, 내가 인생에 있어서 어떠한 중요한 선택을 하면 그것에 책임감과 자부심을 느끼고, 누군가 왜 그런 선택을 했냐고 물었을 때, 자신 있게 대답할 수 있는 사람이 되고 싶었다. 데이터 과학자나 분석가가 되고 싶다는 그 선택이, 겉으로 보기에 괜찮아 보여서 한 것이 아닌, 본인의 소신이 만든 결정이기를 희망해본다. 또 그 결정에 이 글들이 조금이라도 도움을 드렸으면!