: 어쩔 수 없이 실전에 강해야 하는 현직자가 하는 데이터 분석 공부
IT 업계에서 제일 무서운 사람은 회사 다니면서 전직을 하거나 대학원을 준비하는 사람이다. 물론 반어법이다. 진짜로다가 멋지지만 내가 할 수 있다고 생각한 적은 없다. 직무무관 이 업계는 꽤나 야근을 많이 하기 때문에 자신의 시간을 내서 어떤 전문성을 갖추는 것은 정말로 어려운 일이기 때문이다. 대체로 내 직업에 대해서 과몰입하고 진지한 편이기 때문에 이 블로그도 사실 처음에는 일에 대한 이야기를 쓰려다가 난데 없이 텃밭 글이 조회수가 터지면서 일기장처럼 쓸 수 있는 신기한 동기가 생겼다. 그래서 입으로만 공부하기를 어언 9년차, 이제는 내 마음 속의 짐을 덜어 버리고 제일 무서운 사람이 되리라는 다짐으로 데이터 분석 공부를 하게 되었다. 그러니까 이 글을 공부 일기이지 이렇게 해라라는 것이 아니다. 내가 이렇게 해라라고 말할 수 있는 분야에 대해서는 다른 글에서 적겠다(과연?). 하여튼 여기는 내가 어떻게 일하기 싫어서 트위스트 추는지와 공부는 어찌하는지에 대한 기록이다.
공부가 언제 제일 재밌냐면 풀었던 문제가 맞을 때가 아니라 행복회로 돌리면서 이미 맘속으로 연간 계획을 세웠을 때이다(그렇다 나는 ENFJ다). 그리고 이 성격에 직업이 프로덕트 매니저가 되게 되면 그 누구의 손도 안타고 사고실험과 같이 완벽히 통제된 아름다운 계획을 보면 심장이 반응한다. 지금부터 나의 백지 상태의 상상을 살펴보자.
그러려면 일단 내가 데이터 분석을 왜 공부하려는지에 대해서 살펴 봐야한다. 첫번째로는 도구의 문제이다. 나는 기본적으로 보고서의 최종 파일형식은 엑셀이 되는게 좋다고 믿는 편이다. 기본적으로 보고서는 단일 편집자가 아니라 복수 편집자가 발생하기 때문에 전직원이 내가 쓰는 SQL, Pandas를 다룰 줄 알지 않는 이상 범용적인 툴로 수정할 수 있게 제공하는 것이 맞다. 그럼에도 불구하고 엑셀이 생각보다 유약하다는 것은 커머스나 핀테크 서비스를 하면 금방 알 수 있다. 10만행 데이터에 수식 한번 돌리고 화장실 다녀오면 노트북이 힘들어서 꺼져버려있는가 하면 맥마저도 바람개비를 열심히 돌리고 있다. 끔찍하다. '이번 주에 본인인증 완료한 사람들 중에 1주일 내에 거래한 사람 몇 명이나 돼?'라고 구체적으로 질문이 들어오지도 않지만 이렇게나 확실하고 명료한 요구사항에 대해서 마저도 엑셀로 돌리면 수십분이 걸린다. 비효율적이고 무엇보다 정돈되어 있지 않아서 짜증이 난다. 하지만 SQL 으로 처음 작업하고 어이가 없던 그 순간을 잊지 못한다. 다섯번인가 돌렸다지 아마? 응? 끝났다고? 느낌이었다. 그렇게 데이터를 정리하고 나면 허망하게도 아직은 엑셀로 돌아온다. 내가 시각화가 익숙하지 않기도 하고 엑셀 특유의 시각화 문법에 보고서의 독자가 익숙한 경우가 많다. 수정사항도 그것을 바탕으로 주는 경우가 많기 때문에 결국 엑셀로 오긴 한다. 하지만 30분할 일을 60분 하는 것은 시간 단위로 돈 받는 사무직 노동자에게는 어림도 없는 소리. 그래서 배운다! 그리고 이제 시각화 공부도 하면 되지! 하지만 우선순위가 낮다.
두번째로는 통계학 기본에 대한 공부가 필요하기 때문이다. 통계에 대해서 기본적인 학습이 되어 있는 경우는 사회과학 전공을 해서 관련 상식이 있거나 관련 학과를 졸업한 경우가 많은 듯하다. 나는 영어영문과 + 교직이수 그러니까 말하자면 인간 인문학이다(아님). IT 업계에 대대적으로 데이터 분석 바람이 불면서 다들 숫자를 봐야한다는 경각심이 든 것 같다. 문제는 숫자를 본다는게 말그래도 숫자를 본다는 뜻이 아니다. 이를테면 A/B 테스트를 한다고 가정할 때 각기 다른 전환율의 차이가 유의미한 차이인지에 대해서 어떻게 파악할 수 있을까? 전환율이 0.5% 높은 것이 더 목표 지향적인 기능이 확실한가? 지금도 계속 이런 의문이 있는 와중에 불현듯 헉? 이거 내가 통계 몰라서 그런거 아닌가? 하는 생각이 들었다. 사실 이제 시작하는 단계이기 때문에 통계를 배운다고 달라질지에 대해서는 모르겠다. 하지만 확실한 건 데이터 기반 의사결정을 할 때 공부를 하고 싶었던 것이 SQL 명령문을 더 기깔나게 쓰는 것이 아니라실제로 유효한 결정을 내리기 위한 이론적인 준거를 갖추고 싶어서이니까. 그리고 아마도 나는 미적분이 교육과정에 빠져 있었고 배워야 하는지 아닌지도 모르겠지만 이산수학 마저 모두 모르쇠이기 때문에 이번 기회에 겉이라도 핥아 보면 좋다고 생각했다.
공부를 하려는 이유는 아니지만 나는 공부를 했을 때 보람을 느끼려면 실무에 무조건 써먹어야 한다. 결과물이 없는 상황을 가장 낯설어 하는 나에게 이렇게 저렇게 하는 방법론을 써먹지도 못한다면 사실 배우지 않는게 낫다. 그런데 운 좋게도 현직자로 매일매일 사용자들이 온 서비스에 족적과 지문을 남긴다. 덕분에 나는 내가 배운 추리기법을 십분 활용해서 사용자를 검거?할 수 있다. 사실 알려는 사람은 이미 아는 이야기겠지만 내가 찾아내면 나는 그렇게 신날 수가 없다. 갑자기 모든 것이 논리적인 귀결을 맺는 기분이 들고 맞아 떨어진다 챡챡챡.
내가 정말 공부하기 싫어서 몸을 베베 비틀 때에는 이 글을 다시 읽어보고 다짐을 되새겨 봐야겠다. 다음 글에서는 올해 공부를 어떻게 하고 있는지에 대해서 기록해 보겠다. 놀랍게도 공부를 하고 있다는 점. 아주 거북이 걸음식으로 천천히.