마이리얼트립 데이터 조직의 성장기록
(마이리얼트립 Product Blog에 기고한 글입니다)
+
안녕하세요. 마이리얼트립 그로스실에서 일하는 양승화입니다. 데이터가 흐르는 조직을 만들기 위한 마이리얼트립의 노력들을 예전에 소개해 드렸는데요. (벌써 2년 전이네요!) 이 글에서는 Data-Driven Company를 만들기 위해 그동안 진행해 온 일들의 성과와 앞으로의 과제에 대해서 이야기를 해 보려고 합니다.
마이리얼트립이 사내 SQL 스터디를 진행한다는 사실은 여러 채널을 통해서 알려져 있는데요. 저희는 이 스터디를 이벤트성으로 한번 하고 끝내지 않고 기수제(!)로 꾸준히 진행하고 있습니다. 여러 번의 스터디 경험이 쌓이면서 커리큘럼도 점점 탄탄해지고 있는데요. 가볍게 한두 시간 교육을 진행하고 끝나는 게 아니라, 스터디를 수료하면 실제 업무에 SQL을 활용할 수 있는 것을 목표로 아래와 같이 꽤 시간을 들여서 intensive하게 스터디를 진행합니다. (스터디 참여자들은 아래 과정을 모두 완료해야 수료할 수 있어요)
SQL 문법 기초 강의 3시간
SQL 문법 동영상 강의 자율학습 8시간 (+a)
분석용 테이블 스키마 & BI 툴 사용법 강의 2시간
중간 과제 제출 5회
최종 과제 제출
스터디를 지속적으로 진행하는 것 자체가 Data-Driven 분위기를 만드는 데 크게 기여하고 있고, 구성원들이 실제로 스터디를 통해 데이터와 친숙해지고 이를 적극적으로 업무에 활용하고 있어요. 한 번의 스터디에서 완벽하게 학습하지 못했다면 스스로 재수, 3수를 해서 스터디를 수료하는 문화도 생겼습니다. 신규 입사자에게는 SQL 스터디가 회사의 데이터에 대한 이해도를 높이고, 팀 내 다른 멤버들과 눈높이를 맞추는 온보딩 세션처럼 활용되기도 합니다. 지금까지 7기의 스터디를 진행했고, 누적 100명이 넘는 SQL 스터디 수료자가 나왔는데요. 몇 분의 수강 후기를 아래에 짧게 소개합니다.
여행자경험팀의 중요 지표인 ‘업무 효율화를 통한 불필요한 CS 인입 감소’ 방법에 대해 고민하던 시기에, 데이터를 직접 추출해서 업무에 활용할 수 있는 사내 SQL 교육이 열린다는 사실을 접해 참여하게 됐습니다. 교육 및 실습을 업무와 병행하면서 진행하다 보니 어려움도 있었지만, 교육시간을 통해 효율화에 필요한 데이터를 추출할 수 있는 방법을 하나 둘씩 배우다 보니 흥미를 느껴, 별도로 책도 구매해서 추가적으로 공부도 열심히 했었던 것 같습니다.
교육 이후 공급처 별 취소 데이터와 주요 문의 유형에 대한 지표를 확인하며 고객 CS를 체계화해서 분석하는데 적극 활용하고 있습니다. 무엇보다 긍정적인 변화는 다른 부서와 업무 논의를 할 때 근거 데이터를 직접 만들어서 제시할 수 있는 스킬이 생긴 점입니다. 또한 기존에 수작업으로 처리하던 작업들을 리대시를 통해 손쉽게 데이터로 추출하여 훨씬 효율적으로 업무를 할 수 있게 되었습니다. 앞으로 더 많은 노력이 필요하겠지만 SQL 교육으로 인해 많은 것들이 달라진 걸 느끼고 있고, 이런 교육 기회를 만들어준 데이터분석팀에 다시 한번 감사 인사를 드리고 싶습니다.
(여행자경험팀 안OO님)
사업부서인 만큼 거래액과 상품 관련 데이터를 봐야할 일이 많은데 마침 직접 데이터를 추출할 수 있는 SQL 교육이 열려 수강하게 되었습니다. 비개발자인만큼 데이터부분에 지식이 전혀 없어 걱정했지만 필요한 지식은 온라인 강의로 빠르게 습득하고 실무데이터 기반으로 바로 실습하여 수강 중에도 실무에 큰 도움이 되었습니다. 스터디 중 매일 제출하는 과제가 어려워 다소 부담스러웠지만, 끝까지 포기하지 않고 수료할 수 있었습니다. 수료 후 간단한 데이터는 직접 추출하고, 데이터를 활용하여 여러 가지 새로운 시도를 하고 있습니다. 실제 업무에서 지역별 매출 추이를 보며 새롭게 떠오르는 지역이 있는지 확인하여 소싱 우선 지역을 정하거나, 상품별 리드타임을 추출하여 각 상품별 어울리는 채널로 마케팅을 요청할 때 SQL을 활용합니다. 또한 팀의 목표치에 얼만큼 도달했는지 daily, weekly, monthly로 한눈에 볼 수 있는 대시보드를 만들어 활용하고 있습니다. 이전에는 직관이나 감으로 진행했던 일들을 이제는 데이터 기반으로 진행할 수 있고, 데이터를 바탕으로 타 부서와의 협업을 더욱 수월하게 이끌어낼 수 있게 되었다는 점에서 크게 도움이 되었습니다.
(BD-Experiences팀 차OO님)
사실 교육을 접한 시기가 입사 초기였기 때문에 무엇이든 배워보고 싶은 막연한 마음으로 스터디에 참여하였습니다. 당시 사업팀 소속으로 담당하고 있던 지역, 상품, 파트너별 예약건과 거래액 데이터를 확인하는 등 활용할 수 있는 범위가 넓다는 것을 깨닫고 더 열심히 참여하게 되었습니다. 스터디 기간 동안 업무 시간 외에 퇴근 후 스스로 공부해야 할 시간을 확보해야 하고, 개인적으로 예정해둔 휴가 일정과 겹쳐 벼락치기로 과제를 제출했던 기억이 있습니다. 피곤하긴 했지만 끈질기게 시도하는 과정에서 성취감을 느끼기도 했고, 비록 결과가 잘 나오지 않더라도 여러 방법을 시도해보는 과정 자체가 공부가 되었다고 생각합니다.
현재는 플랫폼경험팀 소속으로 쿼리를 통해 상품별 캘린더 오픈율이나 상품 만료 기한을 확인하여 상품을 미리 업데이트하고 있습니다. 최근 유연환불규정이라는 정책을 시범적으로 도입했는데 이를 시행하기 전후 예약 수과 결제전환율을 비교해보는 데도 SQL을 활용합니다. 무엇보다 의사결정을 해야할 때 근거로 제시할 수 있는 데이터가 무엇인지 고민해보고 스스로 추출해볼 수 있다는 점이 뿌듯합니다.
(플랫폼경험팀 이OO님)
마이리얼트립은 redash라는 BI툴을 전사적으로 사용하고 있고, 누구든 자유롭게 쿼리와 대시보드를 생성해서 활용하고 공유할 수 있습니다. 특히 각 사업부서에서 필요한 지표를 모아놓은 대시보드의 경우, 하나하나 데이터분석팀에 요청하지 않고 스스로 핵심지표를 정의해서 직접 대시보드를 만들도록 독려합니다. (물론 기술적으로 어려운 부분은 데이터분석팀이 지원합니다)
간단한 데이터 추출이나 반복적인 대시보드 제작을 각 부서에서 스스로 할 수 있기 때문에, 데이터분석팀은 크로스셀, 탐색경험 개선과 같은 Cross-Functional한 주제나 검색/추천 로직개선 등 기술적인 문제에 더 집중할 수 있습니다. 실제로 사내 BI툴에서 만들어진 대시보드를 보면 데이터분석팀 외 멤버들이 만들어서 활용하고 있는 것들이 훨씬 많고, 주제도 엄청나게 다양한 것을 확인할 수 있습니다.
실제로 이러한 부서별 핵심지표 선정과 대시보드 관리를 응원하기 위해서, 팀별 대시보드 Competition과 같은 이벤트를 진행하기도 했습니다. 재고관리 데이터를 효율적으로 집계해서 보여준 커머스사업팀이 1등을 하며 두둑한 회식비를 받아갔던 기억이 나네요.
마이리얼트립 데이터분석팀이 생긴 시점에는 transaction에 대한 데이터만 볼 수 있는 상태였는데요. (이마저도 별도 분석용 데이터마트는 없었음 ㅠㅜ) 보다 입체적인 데이터를 확인하기 위해서, 다양한 소스의 데이터를 가져오고 가공하는 데이터 파이프라인 구축을 지속적으로 진행했습니다. 초기에는 데이터분석팀 자체적으로 진행했지만, 중간에 데이터 엔지니어분들이 합류하면서 훨씬 더 고도화된 데이터 파이프라인을 만들 수 있었습니다. 대표적인 것들 몇 가지를 소개하면 아래와 같습니다.
모바일앱 로그 수집/분석: 이전에 별도 포스팅으로 소개해 드렸는데요. Firebase 기반의 앱 로그 분석 체계를 만들었습니다. 앱에 접속한 마이리얼트립 사용자들의 상세한 Use Flow를 파악하는데 큰 도움이 되었습니다.
마케팅 데이터 파이프라인: 마찬가지로 이전에 별도 포스팅으로 소개했는데, 페이스북과 네이버 구글 등 주요 마케팅 플랫폼 API를 연동해서 굉장히 상세한 레벨로 마케팅 성과분석을 할 수 있는 시스템을 만들었습니다. 마이리얼트립에서는 네이버 광고의 검색어 하나의 성과도 모든 구성원이 확인할 수 있습니다. 또한 Appsflyer, Braze 등 마케팅 분석과 자동화 툴의 데이터도 raw level로 쌓고 확인할 수 있는 구조를 만들었습니다.
호텔/여행자보험 등 외부 transaction 파이프라인: 마이리얼트립에서 제공하는 여행 카테고리 일부는 마이리얼트립이 아닌 Affiliate 제휴사에서 예약과 결제를 진행하는데요. 이 데이터들을 잘 받아와서 내부 예약 Mart와 통합하는 작업도 완료되었습니다.
항공 데이터 파이프라인: 누군가 레거시(legacy)시스템의 끝판왕을 물어보면 저는 항공이라고 말할 것 같네요 ㅠㅜ 수십 년(?)간 쌓여온 복잡한 로직, 수동으로 처리하는 다양한 업무, 알아보기 힘든 데이터, 스키마를 파악하기 어려운 수백 개의 테이블이 뒤섞인… 정말 어떻게 손대야 할지 막막한 분야였는데요. 분석팀 멤버들이 항공 서비스 로직을 하나하나 익히고, 데이터 엔지니어 분들과 함께 필요한 데이터 한땀 한땀 정리해서 항공 데이터 마트를 완성하면서 큰 마침표를 한번 찍었습니다. 국내에서 항공 데이터를 그 어떤 회사보다 잘 정리해서 보유한 회사라고 자신있게 말씀드릴 수 있어요.
데이터 분석가 업무의 80%는 데이터를 수집하고 전처리하는 데 사용된다는 어느 설문조사 결과가 떠오르네요. 물론 데이터플랫폼팀이 생기고 데이터 엔지니어분들의 지원이 많아지면서, 이런 업무들을 훨씬 더 수월하게 진행하고 있긴 합니다. 무엇보다 좋은 분석 환경은 공짜로 주어지는 게 아니라는 점을 다들 이해하고 있고, 분석가와 엔지니어 모두 이러한 환경을 만들기 위해 노력하고 있습니다.
데이터를 잘 쌓아도, 결국 그걸 잘 활용해서 프로덕트 개선까지 연결되어야 의미가 있겠죠? (마이리얼트립에서는 데이터 분석 보고서…는 쓰지 않습니다. 어쨌든 결과적으로 프로덕트가 개선되었는지, 혹은 업무 프로세스가 변화했는지가 중요하니까요.) 대외비라 하나하나 자세하게 공유하긴 어렵지만, 서비스 메인화면을 구성하는 것부터 티켓 재고를 관리하는 것까지 서비스 곳곳에서 데이터가 굉장히 잘 활용되고 있습니다.
앱 주요 화면의 클릭지표를 바탕으로 UI/UX 개선 방향을 정의하고 성과를 측정합니다.
예약 데이터를 바탕으로 추천 상품을 선정하고, 서비스와 마케팅의 다양한 접점에서 크로스셀을 유도합니다.
사업부별, 상품유형별 마케팅 비용과 take-rate을 측정하고 관리함으로써 전사 수익 지표를 촘촘하게 관리합니다.
CS를 통해 인입된 문의 유형과 내용을 분석해서 서비스 개선 우선순위를 제안하고, 반복되는 업무를 자동화 시킵니다.
항공 예약데이터 분석을 통해 노선별 할인율을 관리하고, 볼륨 인센티브 전략을 수립합니다.
새로운 운영정책(eg.유연환불정책)을 전면적으로 도입하기에 앞서 미리 테스트를 진행하고 그 효과와 리스크를 점검합니다.
티겟 판매 데이터 예측을 통해 재고를 관리하고 주문 시점과 볼륨을 선택합니다.
(…등등등)
많은 회사들이 데이터 접근성을 폭넓게 보장하기 어려운 이유로 ‘보안’을 드는데요. 데이터 접근성과 보안은 양립할 수 없는 주제일까요? 저희는 그렇지 않다고 생각합니다. 마이리얼트립은 ‘높은 수준의 데이터 접근성’과 ‘높은 수준의 개인정보 보호’를 모두 갖추기 위해서 노력해왔고, 결과적으로 안전하게 고객 데이터를 관리하면서 동시에 데이터를 전 직원이 잘 활용하는 회사를 만들고 있습니다. 마이리얼트립은 올해 여행업계 최초로 ISMS-P 인증을 받았습니다. 물론 이 과정에서는 데이터 조직 뿐 아니라 개발 조직과 비즈니스 조직 모두가 하나되어서 인증 심사를 준비했었구요. 데이터 관리와 활용에 대해 높은 수준의 컨센서스가 전사적으로 확보되어 있습니다.
2021년을 준비하면서, 마이리얼트립 데이터 조직의 지향점을 새삼 생각해보고 있습니다. 그동안 해 왔던 것들이 시즌 1이었다면, 이제는 더 흥미로운 시즌 2가 기다리고 있다고 생각합니다. 마이리얼트립이 지향하는 No 1. Travel-Tech Leader가 되기 위해서는 무엇보다 데이터 활용이 중요하다는 걸 알고 있고, 앞으로도 지속적으로 많은 투자를 할 생각입니다. 무엇보다 마이리얼트립에는 데이터에 기반해서 풀어야 하는 새로운 문제들이 많이 기다리고 있습니다. 마이리얼트립 데이터 조직에서 바라보고 있는 시즌 2 로드맵에는 아래와 같은 내용들이 포함되어 있습니다.
마이리얼트립 모바일앱의 경우 지금도 로그 단위 분석이 가능하지만, 웹 사용자에 대해서는 아직도 Google Analytics 등을 이용한 aggregated data에 의존하는 부분이 많습니다. 마케팅이나 CRM 액션의 랜딩이 웹서비스인 경우가 많은데, 웹 로그를 상세히 볼 수 없는 부분이 늘 아쉬웠습니다. 실제로 사업부서에서 Use Flow 관련해서 물어보시는 질문의 많은 부분이 이 부분에 대한 데이터이기도 하구요. 현재 데이터플랫폼팀 주도로 웹 로그플랫폼 구축 프로젝트를 진행하고 있습니다. 로그플랫폼이 한 단계 업그레이드되면 훨씬 더 디테일한 정보들을 바탕으로 Product와 Business의 문제들을 잘 풀어낼 수 있을 거라고 기대합니다.
로그플랫폼이 본격적으로 활용되면 웹과 앱의 행동 데이터를 통합해서 볼 수 있기 때문에 지금보다 훨씬 더 개인화된 추천과 상품 탐색 경험을 제공할 수 있습니다. 마이리얼트립에 있는 상품이 3만개가 넘어가면서, 진짜 좋은 상품인데 잘 알려지지 않아서 내부적으로 아쉬운 경우가 너무 많았거든요. 더불어서 Appsflyer, Braze 등의 3rd party 툴을 이용한 퍼포먼스/CRM 마케팅 고도화 측면에서도 여전히 하고 싶은 게 많습니다. 맥락에 맞는 디퍼드 딥링킹 사용, User Segment에 기반한 CRM 자동화 등등 재미있고 도전적인 주제가 줄 서서 기다리고 있네요.
그동안 Firebase의 remote config나 Google Optimize 등을 통해서 A/B 테스트를 진행해 왔는데, 아무래도 실험 결과 raw data를 취합하고 통계적 유의미성을 체크하고… 하는 과정에서 데이터분석가 개개인의 인풋이 많이 들어갔던 게 사실입니다. 앞으로는 A/B 테스트 활용 빈도를 더 늘리고 이를 통한 UI/UX 개선을 빠르게 진행하기 위해 본격적으로 A/B테스트 툴 도입을 고려하고 있습니다. 더 많은 가설을 더 빠르게 테스트함으로써 제품 개선 속도가 훨씬 더 빨라질 것으로 기대합니다.
수집하는 데이터의 종류가 늘어나고 지속적으로 서비스가 업데이트되면서, 신뢰할 수 있는 데이터를 잘 쌓고 관리하는 일이 굉장히 중요해졌습니다. 최근에는 내부적으로 마케팅에서 활용하는 다양한 이벤트와 카탈로그 소스를 전체적으로 점검하면서 데이터 정합성 체크를 했는데요. 웹/앱 로그 역시 변경분에 대한 관리를 꾸준히 진행해서 항상 믿을 수 있는 데이터 기반으로 분석할 수 있도록 노력을 기울이려고 합니다. 분석 환경이 고도화될수록, 로그 정합성에 대한 투자가 꼭 필요하다고 생각합니다. Garbage In Garbage Out!
이상으로 마이리얼트립 데이터 조직의 지난 발자취와 앞으로의 목표에 대해서 간단히 소개해 드렸습니다.
마이리얼트립이 우리나라에서 데이터 분석이나 모델링을 가장 잘 하는 회사…라고 말할 수는 없지만 ^^;;; 데이터에 기반해서 주어진 문제를 풀고, 이를 서비스에 반영하려고 끊임없이 노력하는 회사라고는 자신있게 이야기 할 수 있습니다. 여행과 관련한 다양한 데이터를 만날 수 있고, 커머스 서비스가 가지는 일반적인 데이터(회원, 상품, 결제)도 살펴볼 수 있는 흥미로운 비즈니스 모델을 가지고 있습니다. 무엇보다 데이터 엔지니어와 데이터 분석가의 협업이 정말 잘 이루어지고 있기 때문에, 데이터 분석가로 일하기에 정말 좋은 회사라고 생각합니다.
혹시 마이리얼트립 데이터분석팀에서 함께 하고 싶다면, 지금 열려있는 채용 포지션을 놓치지 마세요! 즐겁게 일하고, 함께 성장해요.