brunch

You can make anything
by writing

C.S.Lewis

by 서경 Sep 08. 2022

비행 만족도에 대한 가설을 검증해보자

[코드스테이츠 PMB 12] 원하는 데이터를 시각화해보자


PM으로의 직무 피봇팅을 준비하며 다양하고 낯선 툴을 마주하게 된다. 이번 과제를 수행할때도 마찬가지다. JD에서 많이 보던 tableau도, 데이터를 얻기 위한 루트도 나에겐 너무나도 신선한 정보들이었다. 하지만 #가보자고 정신으로 툴을 공부해보고자 한다. 




1. 데이터 확보하기 


오늘 글에서 다룰 과제는 이렇다. 공공 데이터 중 원하는 데이터를 가설에 기반하여 시각화 해보기. 여행을 너무 좋아하는 나는 수 많은 데이터 중 단연코 비행기, 여행에 대한 데이터에 집중하게 되었다. 무료로 데이터를 받을 수 있는 곳들은 아래와 같이 다양한데 나는 내가 원하는 종류의 데이터를 얻기 위해 그 중 kaggle을 선택했다. 


[무료 데이터 확보 사이트]

1. kaggle : 해외 기반 데이터 보유

2. 공공 데이터 포털 : 국내 공공 데이터 보유

3. dacon : 실제 대회에서 제공하는 데이터와 다양한 데이터 교육 정보 보유


kaggle 에는 정말 수많은 데이터가 있다. 그 중에서 내가 선택한 데이터는 'Airline passenger satisfaction (part1, 2)' 이다. 이 파일이 보유한 데이터는 아래와 같다. 모두 공통적으로 0점은 not rated, 1-5점은 해당하는 정도를 의미한다. 



1. Age: the actual age of the passenger
2. Class: business, economy, economy plus 
3. Gender: male or female
4. Customer type: regular or non-regular airline customer
5. Type of travel: the purpose of the passenger's flight
6. Flight distance
7. Inflight wifi service: satisfaction level with Wi-Fi service on board 
8. Departure/Arrival time convenient: time satisfaction level
9. Ease of Online booking: online booking satisfaction rate 
10. Gate location: level of satisfaction with the gate location
11. Food and drink: food and drink satisfaction level
12. Online boarding: satisfaction level with online boarding 
13. Seat comfort: seat satisfaction level 
14. Inflight entertainment: satisfaction with inflight entertainment 
15. On-board service: level of satisfaction with on-board service 
16. Leg room service: level of satisfaction with leg room service 
17. Baggage handling: level of satisfaction with baggage handling 
18. Checkin service: level of satisfaction with checkin service 
19. Inflight service: level of satisfaction with inflight service 
20. Cleanliness: level of satisfaction with cleanliness 
21. Departure delay in minutes
22. Arrival delay in minutes


와, 정말 데이터의 홍수. 여기서 어떤 가설을 세우고 증명해볼 수 있을지 고민해봤다. 그래서 고객의 비행 경험에 대한 퍼널을 생각해보고 해당 퍼널 별로 알아볼 수 있는 만족도를 생각해보았다. 비행 전에 경험할 수 있는 정보와 비행 중에 겪는 상황에 대해서 가설을 설정해보았다. 




비행 중 상황 가설1. 장거리 여행객일 수록 비행 만족도가 낮을 것이다


[확인 데이터]

Flight distance

- satisfaction rate : 단어로 적인 내용을 숫자화함 (만족은 1, 보통이거나 만족하지 않으면 0)



거리가 멀어질 수록 비행 만족도가 낮아지는 것을 알 수 있다. 구글 데이터 스튜디오와의 싸움 끝에 얻어낸.. 아무래도 긴 비행이다 보니 모두가 동일하게 느낀 응답률이라고 생각한다. 





비행 중 상황 가설2. 장거리 여행객일 수록 leg room 서비스에 만족할 것이다


[확인 데이터]

- Flight distance

- Leg room service: level of satisfaction with leg room service 


만족도 5점 만점으로 거리가 긴 여행객일 수록 레그룸 서비스에 대하여 만족도가 높은 것을 알 수 있다. 장시간 비행을 해야 하므로 편하게 앉고자 하는 니즈가 있다는 것을 알 수 있다.




비행 후 상황 가설3. 여행 목적이 비즈니스일 경우 짐을 빨리 찾을 수록 만족도가 높을 것이다

 

[확인 데이터]

- Type of travel: the purpose of the passenger's flight

- Baggage handling: level of satisfaction with baggage handling 


다소 미세하지만 비즈니스 여행객일 경우 짐에 대한 만족도가 더 강한 것을 알 수 있다. 아무래도 비즈니스 여행객은 짐안에 비즈니스를 위한 물품 (컴퓨터, 서류 등)이 있기 때문에 짐을 중요하게 생각하고 있다는 인사이트를 도출 할 수 있다. 




데이터 시각화에 대하여 더 많은 공부가 필요함을 느낄 수 있었던 과제였다. 


#코드스테이츠 #PM부트캠프



매거진의 이전글 문과 기획자의 SQL 공부하기-2
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari