brunch

You can make anything
by writing

C.S.Lewis

by MC 튼살 Apr 27. 2018

게임회사에서 데이터과학자로 생존하기

내가 데이터 분석가로 사는 방법 #1


1. 들어가며


3부작으로 기획해 놓고 막상 2부를 지금에서야 올리는 것을 다소 부끄럽게 생각한다. 이리저리 바빴다...는 것은 핑계이고 필자가 잠깐 게을러진 모양이다. 각설하고, 2부를 시작하도록 하겠다. 약속한 바와 같이 2부에서는 게임 회사 내 데이터 조직에서는 구체적으로 어떤 일들을 함으로써 성과를 내야 되는지를 다루고자 한다.


나는 데이터 과학자라는 이름이 다소 거창하다는 생각이 든다. 데이터라는 재료로 맛있는 분석 요리를 만드는 요리사에 가깝다는 생각이 최근에 들어서, 차라리 데이터 셰프라고 하는 것이 낫겠다 싶었다. 이러한 관점에서 필자의 개인적 의견으로는 좋은 데이터 과학자란 분석 레시피를 자동화하는 것 뿐만 아니라, 조직의 데이터 역량을 전반적으로 배양하는 것에 이바지 하는 것이다. 단순하게 이야기하면 모두가 똑똑해지고 데이터와 친숙해지는 길을 열어주는 길잡이 역할을 하는 것이다. 데이터를 해석하는 센스와 더불어 데이터를 '잘' 요청할 수 있도록 역량을 키우는 것이다. 잘 요청한다는 것은 또 무엇인가?(요리사에게 주문을 '잘' 한다는 것은 무엇인가?) 그 데이터를 보면 정말로 십년 묵은 궁금증이 풀리는지 혹은 의사결정을 할 수 있는지가 명확할 때 좋은 요청이라고 말할 수 있겠다. 이렇게 함으로써 data-driven thinking을 하나의 문화로 정착시킬 수 있다고 본다.




2. 좋은 레시피란 무엇인가?

2-1. 웬만하면 자동화를 하라고 말하고 싶다.

필자가 입사할 때 물어봤다. "혹시 리포팅 하나요?" 그런데 게임 회사 특성 상 액션 iteration(의사결정 속도)이 빨라서 그럴 시간이 없다고 했다는 것이 기억난다. 그런데 리포팅 해야된다. 자동화해서라도 문서로 남겨야만 한다. 그 이유는 다음과 같다.

첫째, 아카이빙 목적
둘째, 성과 기록 목적

전자는 전사 차원에서 지식이 축적되는 것이므로 모두의 발전을 도모하는 길이고, 후자는 당신이 존재 가치를 증명하는 방법이다. 여기서 이야기하는 리포트는 작게는 컨설팅 업계에서의 보고서를 의미하기도 하지만, 넓게는 BI(business intelligence) 툴, 즉 dashboard까지 포괄한다는 점에 주의하자.


그럼 왜 자동화 해야 하나? 좋은 셰프는 당연히 맛있는 요리를 잘 만드는 것이다. 그런데 스마트한 셰프는 좋은 레시피를 개발해서 고객이 알아서 해먹도록 하는 것이다. 이런 관점에서 필자가 강조하고 싶은 것이 있다. 데이터 과학자에게 있어서 열심히 데이터 분석해서 통찰을 전달하는 것은 기본 소양이지만, reproducible하기까지 한다면 더할 나위 없이 좋은 것이다. 옆에서 부채질 한 두번 해주는 것으로 끝낼 것이 아니라 아예 선풍기를 사다가 놓아주는 것이다.

그것이 내가 생각하는 '제품'이다. 그래서 자동화 한다는 것은 곧 제품화를 의미한다. 고객이 원하는 특별 요리(애드혹 분석)를 제외하고는, 웬만한 것은 자동화해라. 데이터 분석 프로세스를 크게 간소화하고 혁신적으로 만들어줄 것이다.


2-2. 자신만의 KPI(핵심 성과 지표)를 만들어라.


미리 이야기하는데 이것은 정말 어려운 일이다. 사실은 많은 게임 회사들이 이미 중요하게 보는 단골 KPI들이 있다. 익히 들어봤을 법한  DAU, PU, PUR, ARPPU 등이 그것이다. 그런데 남들 다 아는 이런 지표들이 당신의 존재 가치를 증명해줄까? 애석하게도 그렇지 못하다. 필자가 예를 들어보겠다. 만약 여러분의 제품이 social 요소가 중요한 게임이라면 대강 아래와 같은 지표들을 뽑아볼 수 있을 것이다.

  -average number of games played with friends

  -average number of messages sent to friends

그런데 이렇게만 보면 평범해 보인다. 왜일까? 기준이 없기 때문이다. 그래서 도메인 지식과 해당 게임에 대한 이해도가 접목이 될 필요가 있다. 이를테면 '우리 게임에서는 하루에 최소 5판은 해야 코어 유저라고 할 수 있지' 라든지, '우리 게임에서는 일주일에 50통의 쪽지는 보내야 코어 유저라고 할 수 있지' 같은 것이다. 여기서 5판과 50통은 어떤 것을 '상징'할 수도, 아닐 수도 있다. 5판이 매일 미션 보상의 임계값일 수도 있고, 50통은 그냥 개발자가 별 생각 없이 경험과 직관에 의해 '정해버린' 숫자여도 좋다. 이렇게 하고나면 좀 더 응용해서 다음과 같은 지표도 추가해볼 수 있지 않을까?

  -number of users who played five or more games

  -number of users who sent fifty or more messages to friends

그래서 하루에 최소 5판도 안하는 유저가 계속 늘어나는 것을 위험 신호로 받아들일 수도 있는 것이다. 이처럼 자신의 게임에 대한 건강도를 체크하는 방법은 다양해질 수 있다. 게임을 많이 플레이 해보면 이런 아이디어를 얼마든지 제안할 수 있다. 물론 이런 방식의 단점이 있다면, 너무 game specific 해질 수 있다는 점이다.


2-3. A/B 테스트를 하자.

끊임없이 실험을 할 것을 권장한다. 가령 어떤 손님에게는 똑같은 김치만두인데 청양고추를 넣고 어떤 손님에게는 넣지 않는다면 다음날 어떤 손님이 다시 찾아올까? 따위의 문제를 풀어보자는 말이다.

만약 청양고추의 반응이 별로라면 여러분은 청양고추를 더 이상 구비할 필요가 없으므로 재료값을 아낄 수 있고 품질도 원상복귀 시킬 수 있다.


2-4. 퍼널(Funnel)을 활용하자.

퍼널을 활용해보지 않은 사람들은 이 툴의 강력함을 실감하지 못할 수 있다. 문제는 퍼널을 디자인하기가 쉽지 않다는 것이다. 잘만 디자인한다면 문제가 되는 구간(전환율이 저조한 구간)을 빠르게 파악해서 액션을 취할 수 있다. 대표적인 예를 들자면 (모바일 게임 기준) 튜토리얼을 포함한 유저의 초기 경험 같은 것이 있겠다. 어느 단계에서 유저 유실이 발생하는지를 진단한 후, 그에 알맞은 조치를 취하면 된다.


2-5. 유저 grouping을 하자.

유저 분류는 다음과 같은 점에서 매우 유용하다.

첫째, 마케팅을 하더라도 targeting이 가능해진다.
둘째, 분석 시 요건을 명확하게 할 수 있다.
셋째, 그룹 간 이동을 추적하여 액션을 취할 수 있다.

게임 회사에서 유저 그룹을 나눠보자면 심심치 않게 나오는 것이 바로 라이트 / 미들 / 헤비 유저인 것 같다. 그런데 이게 말이 쉽지 어느 누가 두부 썰듯이 깔끔하게 구분할 수 있을까? 단순히 플레이 타임만으로 이들을 나눌 수 있을까? 혹은 과금 액수로? 어려운 문제다.

게임에 대한 충성도 말고도 다양한 방식으로 그룹을 분류하는 것을 시도하는 것을 권한다. 특히 위에서 언급한 '그룹 간 이동을 추적'한다는 관점에서 게임의 성과를 모니터링할 수 있다.





3. 마치며


끝으로 분석에 대한 바람직한 태도를 몇 가지 추천하고 싶다.

1.새로운 것에 집착하지 않을 것을 권하고 싶다. 

고객도 모르고 나도 몰랐던 사실에 집착한 나머지, 분석이 산으로 갈 수도 있다.

2.진단 first

처음부터 가설을 세밀하게 내리지 말고, EDA(탐색적 데이터 분석)를 적극적으로 하면서 데이터와 친숙해지는 것부터 시작했으면 좋겠다. 여기서 두 가지 관점이 있는데, 하나는 '진단'이고 다른 하나는 '창조'이다.

진단의 예시는 이렇다. 이마에 손을 대보니 열이 나는 것을 확인(진단)했다. 왜일까? 먹었던 음식에 원인이 있을 것이라는 '가정'을 세운다. 어제 먹은 음식들 목록을 살펴보니, 그 안에 돼지 고기가 있었다. 그런데 요즘 콜레라가 발병했다는 뉴스 보도(결과에 대한 해석)를 접했다. 대략 이런 흐름이다.

그런데 아픈 곳이 한 군데도 없다면? 이때는 '개선'이 아니라 '창조'의 영역이다. 즉, 이미 잘하고 있는데 '더 잘할 수 있는' 여지를 찾는 것이다. 즉 '제안'을 하는 것이 된다. 대부분의 분석이 사후 진단(이미 몸에서 열이 나는데 원인을 추적하는 것)에 가깝다면 이것은 좀 다른 접근이다.


많은 이야기들을 짧게 압축한 가운데 도움이 되었으면 하는 바람이 있다. 다음 3부에서는 데이터 과학자가 되기 위한 준비를 함에 있어서 몇 가지 TIP을 공유할 예정이다.





브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari