brunch

비행 만족도에 대한 가설을 검증해보자

[코드스테이츠 PMB 12] 원하는 데이터를 시각화해보자

by 서경


PM으로의 직무 피봇팅을 준비하며 다양하고 낯선 툴을 마주하게 된다. 이번 과제를 수행할때도 마찬가지다. JD에서 많이 보던 tableau도, 데이터를 얻기 위한 루트도 나에겐 너무나도 신선한 정보들이었다. 하지만 #가보자고 정신으로 툴을 공부해보고자 한다.




1. 데이터 확보하기


오늘 글에서 다룰 과제는 이렇다. 공공 데이터 중 원하는 데이터를 가설에 기반하여 시각화 해보기. 여행을 너무 좋아하는 나는 수 많은 데이터 중 단연코 비행기, 여행에 대한 데이터에 집중하게 되었다. 무료로 데이터를 받을 수 있는 곳들은 아래와 같이 다양한데 나는 내가 원하는 종류의 데이터를 얻기 위해 그 중 kaggle을 선택했다.


[무료 데이터 확보 사이트]

1. kaggle : 해외 기반 데이터 보유

2. 공공 데이터 포털 : 국내 공공 데이터 보유

3. dacon : 실제 대회에서 제공하는 데이터와 다양한 데이터 교육 정보 보유


kaggle 에는 정말 수많은 데이터가 있다. 그 중에서 내가 선택한 데이터는 'Airline passenger satisfaction (part1, 2)' 이다. 이 파일이 보유한 데이터는 아래와 같다. 모두 공통적으로 0점은 not rated, 1-5점은 해당하는 정도를 의미한다.



1. Age: the actual age of the passenger
2. Class: business, economy, economy plus
3. Gender: male or female
4. Customer type: regular or non-regular airline customer
5. Type of travel: the purpose of the passenger's flight
6. Flight distance
7. Inflight wifi service: satisfaction level with Wi-Fi service on board
8. Departure/Arrival time convenient: time satisfaction level
9. Ease of Online booking: online booking satisfaction rate
10. Gate location: level of satisfaction with the gate location
11. Food and drink: food and drink satisfaction level
12. Online boarding: satisfaction level with online boarding
13. Seat comfort: seat satisfaction level
14. Inflight entertainment: satisfaction with inflight entertainment
15. On-board service: level of satisfaction with on-board service
16. Leg room service: level of satisfaction with leg room service
17. Baggage handling: level of satisfaction with baggage handling
18. Checkin service: level of satisfaction with checkin service
19. Inflight service: level of satisfaction with inflight service
20. Cleanliness: level of satisfaction with cleanliness
21. Departure delay in minutes
22. Arrival delay in minutes


와, 정말 데이터의 홍수. 여기서 어떤 가설을 세우고 증명해볼 수 있을지 고민해봤다. 그래서 고객의 비행 경험에 대한 퍼널을 생각해보고 해당 퍼널 별로 알아볼 수 있는 만족도를 생각해보았다. 비행 전에 경험할 수 있는 정보와 비행 중에 겪는 상황에 대해서 가설을 설정해보았다.




비행 중 상황 가설1. 장거리 여행객일 수록 비행 만족도가 낮을 것이다


[확인 데이터]

- Flight distance

- satisfaction rate : 단어로 적인 내용을 숫자화함 (만족은 1, 보통이거나 만족하지 않으면 0)


스크린샷 2022-09-08 오후 9.12.55.png


거리가 멀어질 수록 비행 만족도가 낮아지는 것을 알 수 있다. 구글 데이터 스튜디오와의 싸움 끝에 얻어낸.. 아무래도 긴 비행이다 보니 모두가 동일하게 느낀 응답률이라고 생각한다.





비행 중 상황 가설2. 장거리 여행객일 수록 leg room 서비스에 만족할 것이다


[확인 데이터]

- Flight distance

- Leg room service: level of satisfaction with leg room service


스크린샷 2022-09-08 오후 9.28.00.png

만족도 5점 만점으로 거리가 긴 여행객일 수록 레그룸 서비스에 대하여 만족도가 높은 것을 알 수 있다. 장시간 비행을 해야 하므로 편하게 앉고자 하는 니즈가 있다는 것을 알 수 있다.




비행 후 상황 가설3. 여행 목적이 비즈니스일 경우 짐을 빨리 찾을 수록 만족도가 높을 것이다


[확인 데이터]

- Type of travel: the purpose of the passenger's flight

- Baggage handling: level of satisfaction with baggage handling

스크린샷 2022-09-08 오후 9.33.46.png


다소 미세하지만 비즈니스 여행객일 경우 짐에 대한 만족도가 더 강한 것을 알 수 있다. 아무래도 비즈니스 여행객은 짐안에 비즈니스를 위한 물품 (컴퓨터, 서류 등)이 있기 때문에 짐을 중요하게 생각하고 있다는 인사이트를 도출 할 수 있다.




데이터 시각화에 대하여 더 많은 공부가 필요함을 느낄 수 있었던 과제였다.


#코드스테이츠 #PM부트캠프



keyword
매거진의 이전글문과 기획자의 SQL 공부하기-2