Kings.com사의 캔디 크러쉬 빅데이터 분석/ 구축 사례
Kings.com사의 캔디 크러쉬의 빅데이터 분석 사례에 대해 알아보겠습니다. 캔디 크러쉬는 전 세계에서 많은 사랑을 받고 있는 무료 배포 게임으로 어마어마한 성장률을 보이며 유럽 내 가장 큰 온라인 게임 업체가 되었습니다. 게임 산업에서는 데이터 분석을 통하여 지속적인 게임을 개발, 업데이트, 버그 수정, 게임 안전성 확보, 사기 치트 방지 시스템 등을 끊임없이 반복하고 있습니다.
캔디크러쉬의 King.com은 데이터량의 폭발적인 증가와 함께 어떻게 데이터 분석을 활용 및 어떻게 데이터 분석 환경을 구축하였는지 간략하게 알아보도록 하겠습니다.
게임 회사에서 분석을 하는 가장 핵심 데이터중 하나는 바로 고객 데이터입니다. 예를 들어, 게임 유저의 연령대는 어떻게 되는지, 유저는 남성인지 여성인지, 게임을 이용하는 시간은 언제인지, 게임 시간은 어떻게 되는지 구체적으로 캔디 크러쉬의 경우 유저가 어떤 스테이지에서 몇 번 실패했으며, 얼마나 많은 시도를 하였고, 얼마나 오랫동안 특정 스테이지에서 머물고 있는지, 혹시 고객이 특정 스테이지에서 포기하지는 않는지?
게임 패턴을 분석하여 게임을 조금 더 재미있고 스릴 있게, 그리고 이러한 타겟 고객들을 대상으로 수익을 창출합니다. 이미 유료 아이템 상점이 있고 아이템들은 언제든지 상점에 방문하여 구입이 가능하지만 데이터 분석을 통해 잠재고객을 타겟팅, 유료 아이템의 결제율을 높여 수익성을 높이는 것입니다. 예를 들면, 특정 횟수로 연속 특정 스테이지에서 실패하였을 때, 오랜 시간을 같은 스테이지에서 헤매고 있을 때, 나머지 3알의 캔디를 남기고 실패하였을 때.. 한참 짜증이 밀려올 때쯤.. 프로모션 팝업 페이지가 열리며 유료 아이템 일반 상점의 절반 가격으로 특정 고객에게 프로모션 창을 띄워 유료 아이템 결제를 유도합니다. 결국 엄지 손가락으로 결제를 하고 골치 아픈 Stage를 클리어할 수 있게 되죠! 유저와 게임사 모두에게 Win Win 인가요? 왠지 패배한 느낌은 무엇인지.. 알수없지만..
자, 이제 King.com사에서 기존 분석 환경에서 어떻게 새로운 데이터 분석 환경을 구축하였는지 그리고 그 장점은 무엇인지 살펴보도록 하겠습니다. King.com은 캐주얼 게임업계의 글로벌 리더로 매달 4천만 이상의 유저와 30억이 넘는 게임 횟수를 자랑하며 King.com은 캔디 크러쉬 외에도 150종이 넘는 게임을 14개의 멀티 언어와 함께 모바일, 페이스북, 구글 안드로이드 등을 통해 게임 서비스를 제공하고 있습니다.
Kings.com은 약 2억 건의 rows of data를 매일 생산해내며 데이터량은 매년 두배 이상 기하급수적으로 늘어나고 있습니다.
IT부서에서는 기존 전통적인 데이터 분석 방식 - 1. 각 현업 부서에서 특정 데이터 검색 및 요청 > 2. Raw Data 입수 > 3. 수작업 정제 및 검증 - 으로는 각각 다른 현업부서의 요청으로 Query를 돌려 데이터를 전달하는 것이 주 업무가 되어버렸으며 데이터량의 증가와 수많은 요청에 따라 결국 현업의 요청을 처리를 못하게 되었고 현업에서는 의사결정을 제시간에 내리지 못하여 결국 전체 비즈니스에 심각한 영향을 끼치게 되었습니다.
King.com에서는 급격하게 증가하는 유저수와 데이터의 량과 그리고 사업 확장과 함께 빅데이터 프로젝트로 하둡과 하이브 기반 환경의 시스템 플랫폼을 1차적으로 구축하여 막대 한량의 데이터를 저장/프로세싱을 효과적으로 할 수 있게 되었으며 현업에서는 엄청나게 다양한 데이터를 분석할 수 있게 되었고, 이전에는 환경적으로 꿈도 못 꾸던 다양한 분석과 연구를 하게 되었지만 여전히 여러 가지 이슈와 함께 현업들의 요청들을 모두 따라갈 수 없었으며 특정 이슈들은 아래와 같습니다.
HIVE의 느린 퍼포먼스 이슈 (현업의 요구를 따라가지 못함)
Simple한 분석 환경 / 리포팅 시스템의 부재
대부분의 기업 의사결정자인 현업이 쉽게 사용이 가능한 실시간 셀프 서비스 시각화 분석 환경의 부재 - No Data Insight to Business Users
King.com에서는 해당 이슈와 함께 System에 대한 이해가 부족한 현업 서포트를 하기위해 BI를 도입, IT 부서에서는 게임 운영의 퍼포먼스에 영향이 없으며 다양한 부서의 현업 (LOB) 들에게 쉽게 사용이 가능한 셀프서비스 분석 및 데이터 거버넌스가 보장된 데이터 분석 환경을 제공, 다양한 부서 현업이 직접 원하는 데이터에 접근, 데이터 검색/추출하여 데이터 분석에 활용 가능, 현업에서 수백 개의 디멘존 (Dimensions)을 지속적으로 연관 분석하여 데이터 간의 Insight를 찾아 의사결정에 데이터 분석 환경을 제공하게 되었습니다.
결과적으로 King.com에서는 HIVE의 사전 정의된 병렬구조 쿼리 방식에 국한하지 않고 Qlik의 연관 분석 엔진과 함께 수백 개의 디멘존을 유연하게 연관분석이 가능하게 되었으며 Qlik의 In-memory 인메모리 기반 엔진으로 Zero wait time 즉, Real-time 분석 환경을 현업에게 제공하여 데이터 기반의 빠른 의사결정이 가능하게 되었습니다.
•매일 1.6B 이상의 레코드가 Hadoop에 저장— 그중 211M 레코드가 매일 추출되어 Qlikview에 적재 및 분석에 활용
추가적으로 Qlik 도입으로 가장 Benefit은 서로 다른 시스템의 다양한 데이터 소스 추출/취합하여 통합 분석이 가능하게 되었다는 것입니다. King.com의 Mats-Olov Eriksson (DW 담당 본부장)에 따르면 Qlik의 연관 분석 엔진을 통하여 King.com의 하둡 베이스 빅데이터 플랫폼 별개로 다양한 데이터 소스를 추출/취합 Qlikview에 리로딩하여 통합 분석이 가능하게 되어 팀 전체가 메타데이터 기반의 Business Unit이 되었다고 평가하였습니다.
Mats-Olov Eriksson의 King.com의 빅데이터 구축에 대한 3분 인터뷰 영상 - 여기 클릭
현재 King.com에서는 Qlik을 빅데이터팀 이외에 전체의 Business line에 도입하여 아래와 같이 활용하고 있습니다.
King.com의 임원들은 KPI metrics로 구성된 대시보드를 통하여 데이터 기반의 의사결정
마케팅 부서에서는 다양한 디멘존 데이터를 연관 분석하여 타겟 마케팅에 활용
Finance 팀에서는 처음으로 모든 마케팅 캠페인에 대한 ROI 분석이 가능하게 되었음
제품 개발팀에서는 Customer Behavior 분석을 하여 게임 개발에 활용
IT팀에서는 데이터 구조에 대한 연관성 및 구조에 대한 이해와 함께 데이터 분석 환경을 제공
King.com에서는 현재 100개 이상의 Qlik Application을 모든 유저가 매일 접속 및 업무에 활용
매일 생성되는 2 billion rows of data (20억건) 데이터를 관리
Qlik의 첫 번째 대시보드를 일주일만 구축 성공
여기까지 캔디크러쉬 개발사인 King.com의 빅데이터 분석/구축 사례를 살펴보았습니다.
#데이터 #데이터분석 #데이터과학자 #빅데이터 #하둡 #하이브 #HIVE #통계분석 #데이터시각화 #캔디크러쉬 #KING.COM #게임분석 #모바일게임 #게임 #캐주얼게임 #아웃스탠딩 #Qlik #qliksense #Qlikkorea #통계분석학 #IT #IT트렌드 #NoSQL #연관분석