[코드스테이츠 PMB 10기] 파이썬으로 데이터 분석 및 시각화 하기
마이 리얼 트립은 여행 가이드 상품, 항공 티켓, 숙박, 액티비티 예약 등 올인원 여행 상품 판매 서비스이다. 창업 당시 마이 리얼 트립이 발견한 문제점은 항공, 숙박에 비해 현지에서 즐길 수 있는 액티비티에 초점을 맞춘 상품은 없다는 것이었다. 이 부분에서는 패키지여행이나 자유 여행에서 모두 불편한 점을 가지고 있었는데 패키지여행에서는 타이트한 일정에 맞물려 낮은 경험의 퀄리티가 문제였고, 자유여행에서는 현지 정보를 알기 위해서 많은 검색을 해야 한다는 것과 활동을 일일이 예약을 해야 한다는 것이었다. 마이 리얼 트립에서는 가이드가 진행하게 만족도 높은 경험을 줄 수 있는 현지 투어에 집중했고, 그다음 현지에서 즐길 수 있는 활동과 시설의 티켓까지 범위를 확대하였다. 이렇게 고객이 겪는 문제를 정의하고 해결함으로써 마이 리얼 트립의 핵심 기능을 만들어 냈다.
그리고 '최대한 다양한 현지 경험 상품을 중개하자'라는 비즈니스 목표를 세우고 여행 상품을 확보하기 위해 노력했다. 우선 최저가 비교는 물론이고, 겪어보지 않은 경험에 대해 신뢰를 주기 위해 약 50만 개 이상 양질의 리뷰를 유저에게 보여줬고, 여행자 취향에 맞춘 여행 상품의 가짓수를 늘렸다. 이 모든 전략들이 여행업에서 경쟁우위를 가질 수 있는 전략이 되었다.
코로나라는 변수가 생기기 이전까지 여행 업계는 큰 호황을 누리고 있었고, 마이 리얼 트립은 월 거래액 520억 원을 찍으며 역대 최고치를 기록하면서 2020년 거래액 1조 원을 바라보고 있었다. 하지만 코로나가 확산되면서 매출이 급격히 하락했고 위기를 극복하기 위해 새로운 전략을 세워야 했다.
마이 리얼 트립은 위기를 기회로 만들었다. 해외여행 상품을 주력으로 했던 마이 리얼 트립은 국내 여행 중 그나마 해외여행과 비슷한 제주도를 집중적으로 상품을 내기 시작했고 가장 많은 제주 관련 상품을 갖추게 되었다. 제주도 여행은 최저가 항공권으로 모객을 하고 숙소, 액티비티, 투어 등을 추천하는 방식이 통했고, 회사 매출 전체 80%를 차지하게 되었다. 국내 여행이라도 제주도는 꽤 큰 비중을 차지하는 시장이었다. 2800만 명인 해외 출국자들 수에 비해 제주도 입도 객 수는 1300만 명으로 코로나 이전 수준으로 예약 건수를 내고 있었기 때문이다. 그리고 단일 노선 중 공급이 충분했고 코로나 이후 해외 대신 제주 여행을 가려는 수요가 늘어서 제주도 사업은 빠르게 매출을 회복하는데 좋은 전략이 되었다.
코로나 전과 후를 비교했을 때 하늘길이 막히고 폐쇄적인 환경이 되면서 여행자 수요가 급락한 건 사실이나 국내 여행은 새로운 기회의 장이 되었다. 실제 데이터를 통해서 국내 여행 현황 데이터를 분석하고 시각화해보았다. 그리고 마이 리얼 트립 Pm이라고 생각하고 새로운 인사이트를 도출하였다.
데이터는 통계청 국가통계포털에서 다운로드했고, 파이썬으로 탐색적 데이터 분석(EDA)을 해보았다.
먼저 사용할 라이브러리를 import 해왔다. 데이터 전처리에는 pandas, numpy를 사용했고, 시각화 및 분석에는 matplotlib, seaborn, plotly를 사용하였다.
2017-2021 월간 국내선, 국제선 탑승객 수를 비교했을 때 코로나가 전 세계적으로 확산되었던 시점인 2020년 2월 이후부터 국제선, 국내선 모두 이용률이 절벽 수준으로 급감했다. 예상했던 수치이지만 그래프로 보니 더 체감되는 부분이었다. 국제선은 이용률이 떨어진 후 2021년 12월까지 회복이 되지 못하는 모습을 보였으나 국내선의 경우 2020년 8월쯤부터는 어느 정도 회복된 모습이었다.
그렇다면 국내 여행 현황은 어떨까? 국내 당일 여행과 숙박 여행 횟수를 분석해 보았다. 해당 데이터는 2018년부터 2020년 12월까지 제공되었지만 코로나 전과 후를 비교할 수 있었다. 당일 여행과 숙박 여행 모두 2020년 2월 이후 급감했는데 숙박여행 수가 더 떨어진 것을 알 수 있었다.
회복세는 당일여행 횟수에서는 위축되었다가 이전과 비슷한 수준으로 회복하는 모습이었고, 숙박여행은 2019년 최고점을 기록했을 때 보다 현저히 낮은 횟수를 보여주고 있었다. 따라서 더 긴 시간을 요구하고, 거리 두기 등의 방역 정책으로 인해 숙박 여행이 코로나에 의한 타격이 더 심한 것을 알 수 있다.
코로나가 당일 여행과 숙박 여행의 여행지 별 여행객 수에 영향이 큰지 분석해 보았다.
각 연도별 선 그래프를 보면 당일 여행의 경우 전체적인 여행 지역 별 방문 횟수가 비슷한 수치였다.
그러나 특이한 점은 아래 그래프에서 확인할 수 있었다.
위 그래프는 코로나 전과 후의 지역 별 여행객 수의 차이를 나타낸다. 주목할 점은 경기도의 경우 코로나 이후 방문 수가 오히려 더 늘어난 것을 확인할 수 있다. 이는 당일 여행으로 가깝게 다녀올 수 있는 지역에 대한 선호도가 급증했음을 의미한다.
그리고 숙박 여행의 경우 또 다른 결과를 보였다.
숙박 여행의 경우 코로나 이후인 2020년에 전체적으로 줄어든 것을 볼 수 있었다.
그리고 아래 그래프에서 코로나 전과 후를 비교해 보았다.
코로나 전과 후를 비교했을 때 특히 부산과 강원도의 선호도가 급격히 떨어진 것을 볼 수 있었다. 이는 기존 수치가 높았기 때문에 그래프 상 감소된 수치가 더 부각되어 보이는 것으로 판단된다.
1-2번까지의 분석 결과를 토대로 효율적인 여행 상품을 기획하기 위해, 더 많은 수익을 가져올 수 있는 국내 숙박 여행을 타깃으로 성별에 따른 여행지 선호도를 분석하였다. 위의 두 그래프는 성별에 따른 지역별 여행객 방문 수를 비교한 것이다.
그 아래의 그래프는 성 별 여행객 수의 차이를 보여준다.
y 축의 0을 기준으로 양의 값을 가지는 지역은 여성이 더 많이 방문한 지역이며, 음의 값을 가지는 지역은 남성이 더 많이 방문한 지역이다. 전자의 경우 제주도를 예시로 들 수 있고, 후자의 경우 경기도를 예시로 들 수 있다. 한 마디로 새로운 여행 상품은 여성은 제주도, 남성은 경기도 위주로 기획하는 것이 더 효율적인 방향이 될 것이다.
코로나 이후 여행객들이 줄었다는 것은 알고 있었지만 실제 데이터를 분석하고 시각화해보니 더 확연한 차이를 알 수 있었다. 코로나가 확산된 직후는 국내, 해외여행 이용률 모두 위축되었지만 국내 여행은 서서히 회복되는 모습을 보였고 국내 여행으로 초점을 맞춘 마이 리얼 트립의 전략이 새로운 비즈니스 모델이 될 수 있다는 예측은 데이터로도 정확한 판단이라는 것을 검증할 수 있었다.
현재 마이 리얼 트립 메인 화면에 국내 기준으로 서울, 제주도 여행 상품을 최상위에 노출시키고 있다.
서울 근교, 경기권을 선호하는 남성 고객과 제주도 여행을 선호하는 여성 고객의 니즈를 잘 파악해 다양한 테마의 여행 상품, 티켓, 호캉스 숙박 등 해당 여행지 위주로 전략적인 접근을 한 것으로 판단된다.
하지만 정확히 말하면 제주도를 제외한 국내 여행 상품은 거의 서울과 경기 일부 지역에만 집중해서 노출되고 있다. 사용자가 어떤 콘텐츠를 클릭했는지에 따라 노출되는 상품이 바뀌어서 다를 수 있지만 나머지 지방 지역은 후순위에 두고 있었다.
다양한 선택지를 제공하기 위해 경기권에서 할 수 있는 체험, 액티비티, 전시 관람 등 상품을 제공하고, 서울 경기권의 편리한 교통 인프라를 활용해서 당일 기차 여행과 코로나 안심 숙소로 안내 등 코로나 걱정과 시간적 부담 없이 다녀올 수 있는 여행 상품을 개발하는 것도 해외여행 수익의 부재를 채울 수 있는데 도움이 될 것이라고 생각한다. 그리고 지방 지역에서 근교로 여행 가는 고객들을 잡기 위한 연구도 필요할 것 같다.
또 남의 집, 트레바리와 같은 장소 기반 커뮤니티 서비스와 제휴를 해서 현지 라이브 투어를 통해 여행을 가고 싶은 사람들이 모임으로써 같이 여행하는 기분을 느끼고 현지 문화를 체험하거나, 언어를 배워보는 등 투어뿐만 아니라 직접적인 경험을 할 수 있는 새로운 관광 상품을 제공하면 좋겠다.
참조
https://biz.chosun.com/it-science/ict/2022/01/01/3MAHKERPAVCGLC5RTYCQLAT6KM/