나도 해보는 공공데이터 분석 및 시각화 6
문의 및 어려운 사항, 의견에 대해서는 fermat39@naver.com (김영하)로 부탁드립니다!
해당 데이터 파일에 2016, 2017, 2018, 2019, 2020, 2021, 2022 총 7개 연도가 있는 것을 알 수 있습니다.
그런데...
과연 각 연도별로 1~12월까지 총 12개 월이 있을까요?
항상 데이터는 의심해 보아야 합니다. 즉, 우리가 확인하지 않는 것은 확정을 하면 안 됩니다.;
그럼 각 연도별로 12개월씩이 있는지 확인해 볼까요?
판다스에는 groupby()라는 함수가 있습니다. 데이터를 지정한 컬럼을 기준으로 그룹을 만들고 거기에 맞는 통계량을 계산합니다.
그래서 위에서 보셨듯이 "연도"로 그룹을 만들고 그 안에서 월의 갯수을 계산한 결과를 보니 2022년은 총 10개 월이 있다고 나오네요!
그럼 과연 그럴까요?