brunch

You can make anything
by writing

C.S.Lewis

by 감자윤 Nov 09. 2021

Kaggle로 여행산업이 주력해야 할
고객 분석해 보기

[코드스테이츠 PMB 8기] 6주차 Daily project (4)



코로나19 팬더믹 사태로 전 세계적의 관광 업계가 위축되었다. 유엔세계관광기구(UNWTO)에 따르면 실제 전 세계 관광객 수가 30년 전인 1990년 수준으로 급감하였다고 한다.


이미지 출처 : 한경 (유엔세계관광기구)



금방 끝날 것이라 기대했던 코로나19는 2년째 계속되며, 결국 전 세계는 위드 코로나 시대를 선언하게 되었다. 위드 코로나 시대에 다가서면서 사람들은 일상과 함께 경기 회복을 기대하게 되었다.


그리고 그와 함께 가장 큰 타격을 입었던 여행 산업도 재개하기 위해 빠른 움직임을 보이고 있는 추세이다.

특히 백신 접종 완료자는 사실상 격리 면제 대상자로 선정되면서 해외 여행객 증가에 대한 기대감도 높아지고 있는 상황이다.


하지만 코로나는 우리 삶에 사라진 것이 아니라는 점을 잊지 말아야 한다.

이에 여행 업계는 적극적으로 다시 정상 궤도에 오르기 위해 여러 가지 노력이 필요하겠지만, 그와 함께 코로나19와 같은 예기치 못한 팬더믹 상황에 대비해야 할 것이라 본다.


그리고 그 대비에는 사업 확장 등과 같은 여러 방책이 있겠지만, 여행 업계의 주 고객층이 누구인지 확실히 다시 확인해보는 것도 필요하다 생각한다. 코로나19가 극심할 때는 모두 이동과 만남을 최소화하는데 집중해야 했다. 하지만 현재와 같이 위드 코로나를 맞이하는 상황에 속에서 주변 변화에 크게 영향을 받지 않고 꾸준히 여행을 소비하고자 하는 주력층을 파악하는 것이 중요하다는 것이다. 그들을 붙잡는 것이 앞으로 또 맞이할 수 있는 예기치 못한 변화 속에서 여행 업계의 리스크를 최소화할 수 있는 방법 중 하나가 될 수 있다고 본다.


그렇다면 어떤 고객층이 여행 소비 주력층이 될 수 있을까?


정확하지는 않지만 캐글(Kaggle)에서 제공하는 데이터를 기반으로 이를 한 번 파악해 보고자 했다.



캐글(Kaggle)이란?

캐글은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 2017년 3월 구글에 인수되었다.

(출처 : 위키백과)





Tour & Travels Customer Churn Prediction 데이터를 통해
이탈률이 저조한 고객층 분석하기


캐글(Kaggle)의 'Datasets'에 들어가 보면 다양한 데이터들이 존재한다. 그중 여행 소비 주력층을 확인해 볼 수 있는 'Tour & Travels Customer Churn Prediction' 데이터를 분석해 보려 한다.



출처 : Kaggle (우측 :  실제 raw data 이미지)





우선 분석하기 전 실제 주력 소비자가 될 타겟층이 누구일지 고민해 보며 '가설'을 먼저 설정하기로 했다.




가설 설정 1.

소득이 높을수록 이탈할 확률이 낮을 것이다.


'Tour & Travels Customer Churn Prediction' 데이터는 '여행 이탈' 고객에 대한 정보이므로 이탈이 많지 않은 고객층이 곧 소비 주력층이 될 것이다. 이에 첫 번째 가설로 소득이 높은 고객층이 여행에 대한 니즈가 변동 없이, 꾸준히 높을 것이라 예측했다. 고소득자들은 상대적으로 경제 침체에 대해 큰 영향을 받지 않을 것이라 생각했기 때문이다.




가설 설정 2.

나이가 높을수록 이탈하는 고객은 적을 것이다.


두 번째 가설은 '나이'로 설정했다. 즉 나이가 높을수록 여행에 대한 니즈가 변동 없이 높을 것이라 생각했다. 위 가설이 맞다면 해당 데이터로는 나이가 높을수록 이탈률이 낮을 것이다. 결국 나이가 많을수록 경제적으로 더 안정될 확률이 높기 때문에 이는 가설 1과도 연관성이 있다고 본다.








그렇다면 이제는 위 가설들을 확인해 보기 위해

'Tour & Travels Customer Churn Prediction' 데이터에서 필요한 부분들을 추출하여 시각화해 볼 차례다.




가설 검증 1.

잠재 여행 소비 주력층 = Middle income (중위소득계층)




위 데이터 시각화 차트(막대그래프)는 소득 수준을 'High income', 'Middle income', 'Low income' 총 3가지로 분류한 것이다. 소득순 준별 이탈한 고객과 이탈하지 않은 고객의 수가 표시되어 있다. 여행 서비스를 가장 많이 이용하는 고객층은 'Middle income'(409명)이지만, 고객 이탈이 가장 적은 것도 'Middle income'층이다. 즉 'Middle income'의 고객 7%만 이탈하고, 나머지 93%는 그대로 여행 서비스를 이용하고 있는 것을 확인할 수 있다.


반면 'High income'층은 고객 이탈자가 유지자보다 많다는 것을 직관적으로 확인할 수 있다. 약 58%가 고객 이탈을 함으로써 3종류의 소득 수준 중 여행 소비에 있어 가장 많은 이탈과 변동을 보여준다고 해석할 수 있다.


출처 : 한국문화관광연구원 (포스트 코로나19에 따른 국내여행 조사 결과 보고서, 2020. 06)


실제 자료인 2020년에 한국문화관광연구원에서 발표한 '포스트 코로나19에 따른 국내여행 조사 결과 보고서' 내용에서도 월평균 소득이 높은 가구보다 소득이 낮은 가구에서 여행 횟수가 줄지 않고, 오히려 늘은 모습까지 확인할 수 있었다.


이에 첫 번째 가설이었던 '소득이 높을수록 이탈할 확률이 낮을 것이다'는 틀린 가설일 확률이 높다.




가설 검증 2.

잠재 여행 소비 주력층 = 30대 초반 (30대)






'Tour & Travels Customer Churn Prediction' 데이터에서 제공하는 연령은 27살부터 38살까지이다.

30대를 넘어 4050 세대의 데이터도 함께 있었다면 더 정확한 가설 검증이 가능했겠지만, 우선은 주어진 데이터를 정리해 차트로 시각화해 보았다.


위 차트를 보면 가장 고객 이탈이 없는 연령은 30세다. 20세보다 확실히 낮은 이탈률이다.


그러나 이것만으로 '나이가 높을수록 이탈하는 고객은 적을 것이다'라고 세웠던 두 번째 가설이 확실하게 맞는 가설이라 판단할 수 없다. 30대 후반과 비교했을 때 오히려 30세의 고객들의 이탈률이 현저히 낮기 때문이다. 또한 'Tour & Travels Customer Churn Prediction' 데이터가 모수가 적다는 것과 20대 데이터 수가 상대적으로 부족하다는 점을 함께 고려해 데이터를 바라 볼 필요가 있다.



출처 : 한국문화관광연구원 (포스트 코로나19에 따른 국내여행 조사 결과 보고서, 2020. 06)


한국문화관광연구원의 코로나19 이후 국내여행 보고서를 통해 한번 더 확인해 보면 30대뿐만 아니라 40대에서, 더 넓게는 50대까지 여행 소비가 실질적으로 많이 발생했다는 것을 확인할 수 있다.


그렇기 때문에 가설 2는 확실히 틀렸다고 단정 짓기보다 한번 더 검증할 필요가 있다고 본다.







마무리 정리 및 Comment


캐글(Kaggle) 내 'Tour & Travels Customer Churn Prediction' 데이터는 정확히 언제쯤의 데이터인지 표시되어 있지 않다. 다만 약 8일 전에 업로드된 데이터로써 코로나 19 상황 전의, 오래된 데이터는 아니라고 생각한다. 그런 면에서 명확하지는 않지만 어느 정도 가설 1,2를 검증해 볼 수 있었고, 두 가설 모두 틀렸다고 잠정 결론을 내릴 수 있었다.


다만 가설 2 '나이가 높을수록 여행 서비스에 대해 이탈자가 적을 것이다'는 데이터의 양 자체가 적었기에 다시 한번 검증할 필요가 있다고 보았다.


이에 대해 재검증은 아니지만 보다 최근 관련 자료를 하나 더 찾아보았다.



이미지 출처 : ZDNet Korea (지마켓, 2021.09)



해당 자료는 G마켓과 옥션에서 올 9월의 국제선 항공 매출 결과를 분석한 내용이다. 그 내용을 보면 국제선 항공권 매출도 대부분이 30~50대 연령층에게 나온다는 것을 확인할 수 있다.


위에서 본 한국문화관광연구원 보고서와 약 10개월이라는 기간의 간극이 있지만, 모두 코로나19 발생 이후의 내용이라는 점과 국내외 여행 주 고객층이 30대 이상이라는 점의 공통점을 발견할 수 있는 자료들이었다.


결론적으로 여행 소비에 있어서 30대 이상 고객들이 꾸준히 주력층이 되고 있다고 말할 수 있다. 이에 재검증을 하게 된다면 그때는 30대~50대 사이의 여행 소비 패턴을 보다 자세히 살펴보는 것이 필요하다.


거기서 인사이트를 얻어 여행사와 관련 업계는 해당 소비 주력층을 위한 여행 서비스 및 상품 등을 출시하는 것이 좋다고 본다. 물론 MZ세대들의 여행 소비도 늘어나고 있기에 그에 맞는 상품을 내놓으려 하는 여행사가 많지만, 여행 니즈에 대한 변동이 크지 않은 큰손인 주 고객층의 여행 만족도를 높이는 것도 놓치지 말아야 한다고 생각한다.





※ 참고 자료

- 한국문화관광연구원

- 한경, 끝없이 추락하는 관광산업.."코로나 1년 만에 30년 전 수준으로", 이선우기자, 2021.01.30

- 전자신문, 위드 코로나 앞둔 유통·여행업계, 대면소비 공략 맞춤전략 짠다, 박준호기자, 2021.10.27

- 연합뉴스, 국내여행 '큰손'은 30대...작년 120만원 가까이 썼다, 이태수기자, 2020.11.02

- ZDNet Korea, 지마켓·옥션, 국제선 항공권 매출↑..."위드 코로나 기대감 때문" 백봉삼기자, 2021.10.19

매거진의 이전글 중국과 K뷰티 시장은 화해(hwahae)할 수 있을까?

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari