내가 데이터 분석가로 사는 방법 #1
이번 포스팅에서는 필자가 데이터 분석가로서 살아가는 방법을 담고자 한다. 조금은 방대해질 것 같아서 3부작으로 기획을 하였고, 이번 1부에서는 일반적인 이야기를 다루기로 하였다. 2부에서는 구체적으로 게임 회사에서의 데이터 조직에서 어떤 일들을 해야 하는지를 다룰 것이고, 마지막 3부에서는 이런 일들을 하기 위한 제반 조건들, 이를테면 어떤 공부가 필요한지와 같은 일종의 '꿀팁'들을 공유하면서 대장정을 마칠 것이다. 요약하면 대략 다음과 같은 구성이 될 것이다. (구성해놓고 보니 그 아름다운 Why, How, What의 모양이 그려진다.)
1부: 데이터 과학자의 존재 이유
2부: 게임 회사에서의 데이터 분석 생존기
3부: 생존 필수품 - 좋은 툴과 방법론
이제 이야기를 시작해보자.
"데이터, 거품인 것 같기도 하고 hot한 듯 또 손에 잘 안잡히고 시장도 성숙하지도 않고..밥값은 해야겠고.. 도대체 우리의 존재 가치와 이유는 어디에서 나오는 것일까요?"
다른 말로 하면, 우리가 정말 필요할까? 근원적 질문을 해보자. 우리 없이도 잘 굴러갈 것 같은데.. 그렇다면 사실 그 조직 및 직무는 그 회사에서 필요가 없다. 남들 다 하니까 우리도 엣지 있게 데이터 조직 같은 뭐 그런 것 있어야 되지 않나? 그것 또한 말도 안된다.
이 질문에 답하기 전에, 먼저 간단히 짚고 넘어가야 할 문제들이 있다.
2-1. 데이터 과학자는 딜러(dealer)가 아니라 서포터(supporter)이다.
(필자가 게임 업계 종사자이다보니 앞으로 게임 용어를 자주 사용할 것이니 잘 따라와주길 바란다.)
게임에는 킬과 어시 개념이 있다. (당신이 리그오브레전드나 각종 FPS 게임을 안다면 익숙할 것이다. 축구에서의 골과 어시스트를 생각해도 좋다.) 업무로 치환해보면 일을 실제로 주도한 쪽이 kill, 그리고 그 일을 달성하도록 옆에서 서포팅(혹은 숟가락을 살포시 얹은)한 쪽이 assist라고 하자. 이런 맥락에서 다음과 같은 사실을 간과하지 말자.
어차피 킬은 우리가 먹는 것이 아니다. 데이터 과학자는 어시로 먹고 사는 것이다.
문제는 그 어시를 잘 먹어야 한다는 점이다.
"나의 분석이 바로 반영이 되고 액션과 매출로 이어져서..." 등의 온갖 무언의 압박이 도사릴 수는 있다.
그런데 꼭 그런 걱정은 할 필요가 없다. 원래 분석 자체가 돈이 되는 것은 아니기 때문이다.
실제로 돈이 되는 것은 액션 이후가 된다(가령 콘텐츠 업데이트라든지, 상품 기획이라든지).
다시 말하지만 분석은 어시이다. 슬프지만 어시이다. 그래서 우린 딜러가 아닌 서포터이다.
그런데 캐리(carry)하는 서포터는 될 수 있다. 희망은 있다. (서포터는 게임에서 꼭 필요한 포지션이다!)
예전에 데이터 분야에 계신 한 분의 언급을 인용하자면 데이터 분석이란 베이스라인을 조금씩 높이고 지식을 아카이빙하는 과정(그럼으로써 오류를 다시 범하지 않도록 하는)이라고했다. 백번 공감한다. 우리의 역할은 액션을 위한 일종의 강한 레퍼런스 혹은 근거(evidence)를 제공하는 것이다. 데이터 과학 분야에서 유명하신 하용호님의 말을 빌리면, 우리가 돌을 던지려고 하는데 각도와 힘에 대한 정보(데이터 또는 트레이닝 셋)가 있으니, 다음 번에 던질 때는 좀 더 목표에 근접하게 맞힐 수 있을 것이라는 믿음이다. 이것은 대단히 중요하다. 막 던지지 않게 해주는 것이 데이터 분석인 것이다.
2-2.우리의 역할은 영양가 있는 데이터를 제공하는 것이다.
다시 말하지만, 우리가 하는 일 '자체'는 돈이 되지 않는다. 월급을 받지만, 도대체 우리 데이터 과학자가 밥값을 하는 원리는 무엇일까?
우리의 일은 무엇으로 교환되는가?
만두집을 생각해보자. 인력을 고용했다. 우리는 이 사람에게 기대하는 역할이 무엇일까? 고객이 주문하면 만두를 시간 내에 일정 개수 맛있게 빚어내고, 테이블에 갖다 드리는 것이다. 혹은 배달이 밀렸는데 신속하게 오토바이 끌고 나가서 배달하고 오는 것이다. 명확하다. 확실히 '일'을 한 것이다. 데이터 과학자라는 역할이 애매한 이유는 바로 이런 점에 있다. 간혹 밖에서 지인들을 만나면 항상 듣는 질문이 있다."너가 그곳에서 하는 일이 도대체 뭐야?" 정곡을 찔리는 말이다. 만두는 돈이 된다. 아니 만두 자체가 돈이다. 경제 관점에서 만두는 명확한 상품이고, 그것은 재화로 '교환'된다. 그럼 우리가 하는 일도 무엇인가로 교환되어야 말이 맞지 않겠나?
커뮤니케이션의 중요성
질문을 바꿔보면 우리 데이터 과학자(또는 분석가)가 한 일(생산해낸 그 무엇)은 어떤 가치로 교환되는가? 손에 잡히는가? 그것을 형상화하는 일이 필요한 것이다. 대표적인 예가 보고서이다. 그래서 커뮤니케이션 능력이 중요하다. 그 어떤 멋있는 직업을 갖고 있어도 (그것이 의사가 됐든 교수가 됐든) 모든 일은 생산품으로 귀결된다. 의사는 의술이라는 서비스로, 교수도 교육을 통한 지식 전달과 후학 양성. 모든 것이 '형상화'가 가능하다.
그럼 데이터 과학자는? 데이터로? 만두 = 데이터? 안 된다. 데이터는 만두피 정도이다. 그냥 만두는 데이터 추출이다. 맛있는 만두, 영양가 있는 만두여야 한다. 그래야 고객이 찾는 것이다. 간단하지 아니한가? 그래서 데이터는 돈이 되어야 한다(정확히는 매출로 '이어져야 한다')는 말이 그것이다. 우리에게는 어찌 보면 컨설팅 능력도 필요하다. 이 만두를 왜 먹어야 하는지, 왜 중요한지를 끊임없이 설득할 수 있어야 한다. 가령 당신이 이 만두를 지속적으로 먹으면 (이 지표 혹은 KPI를 지속적으로 모니터링하면) 무엇인가 나아질 것(매출이 오르든 리텐션이 오르든 무엇인가 좋은 일이 일어날 것)이다 라고 자신있게 말할 수 있어야 한다. 그래야 당신이 야근하면서 그 지저분한 밀가루 묻은 손(지저분한 데이터 핸들링)이 보람이 있는 것이다. 그리고 고객은 당신을 다시 찾는다. 왜냐하면 만두가 맛있기 때문이다. 그 만두를 먹고 나서 건강이 좋아졌든 근육이 됐든 무엇인가 좋은 일이 일어났기 때문이다. 우리의 존재 이유는 바로 이런 맥락에 있다는 것을 명심해야 한다.
데이터 분야에서 잘한다는 기준은?
신입에게 기대하는 바는 사실상 별로 없다. 데이터 전처리(만두 빚기. 정말 단순 손기술. 맛있을 것이라는 기대는 안한다). 맛은 그 다음 문제다. 낮은 연차에 맛을 기대하진 말자. 저 때는 손님(클라이언트)은 배고프다고 보채고, 엉성하더라도 일단 만들어서(요청한 데이터) 드려야 한다.
그렇다면 데이터 분야에서 도대체 잘한다는 기준은 무엇인가? 만두를 잘 빚는다는 것은 정말 명확하다. 모양이 고르게 예쁘고, 맛있게 만들고, 영양가 있고, 정갈하게 깔끔한 그릇에 플레이팅 및 딜리버리 되는 것. 너무 명쾌하다. 그럼 데이터 분석 또는 데이터 과학을 잘한다는 것은 무엇일까? "저 사람은 데이터 과학 분야에서 알아준대." 뭘 알아줘? 도대체 왜? 뭘 했길래? 그 사람은 봐야할 데이터, 중요한 데이터를 적재적소에 잘 제공하는 사람인 것이다. 쉽게 말해 무엇을 봐야할지 알려주는 사람.
이 관점에서 이상적인 것은 바로 업계 표준 또는 magic number를 찾는 것이다. 데이터 분석이라는 것이 wow한 통찰을 제공하면 좋겠지만 드물다. 이미 현업에서 도메인 지식으로 (소위 직관으로 알려진 바로 그것) 잘 아는 사실을 재확인하는 것에 불과하기 때문이다. 게임이나 제품 기획을 통째로 뒤집어 갈아 엎을 만한 데이터 분석은 사실상 어렵다. 서포터로 게임 판세를 뒤집기는 어렵다는 것이다.
그러나 가령 이탈의 적절한 threshold를 찾는다든지, 가격을 얼마로 하면 좋겠다든지, pvp는 몇 대 몇이 적당하다든지 따위의 그 '적절한 값' 내지는 '황금 숫자'를 내놓을 수 있으면 그 사람은 존재 가치를 증명하고도 남는다. 아니 이것은 정말 어렵고 힘든 일이다. 이걸 다 잘했으면 벌써 업계에서 통용하고 있을텐데, 그렇지도 않다. 그래서 어렵다. 이를테면 황금 만두 레시피를 개발하는 일이라고 보면 된다. 모든 만두 업계에서 이 레시피 하나로 통하는 뭐 그런 것 말이다. 그것을 우리 데이터 과학자가 할 수 있다. 머신러닝하면서 좋은 feature를 찾는 것도 중요한 공헌이고, (실제 한 모바일 게임의 분석 사례) A/B 테스트 했는데 7일 말고 3일 뒤에 푸쉬 보냈더니 리텐션이 좋았다더라 하는 그런 '카더라' 지식도 쌓이면 다 쓸데가 있다. 아니 실제로 그걸 적용해서 봤더니 정말 게임이 나아지면 당신은 밥값을 한 것이다. (그러나 주의할 것은 손님의 입맛, 손님 자체, 웰빙 바람 등 무수히 많은 환경적 변수들이 있고 게임 자체도 그 안에서 상황이 무수히 변하기 때문에 고정된 황금 숫자 또는 영원한 지식은 없다. 지식도 업데이트가 되어야 한다.) 그렇게 계속 건수를 올리면 된다. 쉽지는 않겠지만, 그것이 바로 우리의 존재 이유가 아닐까.
지금까지 데이터 과학자 또는 분석가의 존재 이유, 필요한 자질 그리고 역할기대에 대해서 가볍게 살펴보았다. 데이터 과학 분야에 뛰어든지 얼마 되지 않은 사람들이 자신의 일의 의미에 대하여 방황할 때, 이 글이 조금이나마 도움이 되길 바란다. 필자 또한 이 글을 쓰면서 다시 한번 의미를 되새기고 성찰하게 되었다. 다음에는 게임 조직에서 데이터 과학으로 살아남는 방법에 대하여 구체적으로 깊게 다루어 볼 예정이다. 이 글을 읽는 당신이 해당 분야 또는 업계의 종사자라면 공감할 수도, 혹은 다른 의견이 있을 수도 있다고 본다. 그런 피드백은 언제든지 환영이다.