brunch

You can make anything
by writing

C.S.Lewis

by 김영하 Aug 05. 2023

그룹별로 계산해보기!

나도 해보는 공공데이터 분석 및 시각화 6

문의 및 어려운 사항, 의견에 대해서는 fermat39@naver.com (김영하)로 부탁드립니다!


해당 데이터 파일에 2016, 2017, 2018, 2019, 2020, 2021, 2022 총 7개 연도가 있는 것을 알 수 있습니다.


그런데...


과연 각 연도별로 1~12월까지 총 12개 월이 있을까요?


항상 데이터는 의심해 보아야 합니다. 즉, 우리가 확인하지 않는 것은 확정을 하면 안 됩니다.;


그럼 각 연도별로 12개월씩이 있는지 확인해 볼까요?


판다스에는 groupby()라는 함수가 있습니다. 데이터를 지정한 컬럼을 기준으로 그룹을 만들고 거기에 맞는 통계량을 계산합니다.


그래서 위에서 보셨듯이 "연도"로 그룹을 만들고 그 안에서 월의 갯수을 계산한 결과를 보니 2022년은 총 10개 월이 있다고 나오네요!


그럼 과연 그럴까요?

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari