brunch

You can make anything
by writing

C.S.Lewis

by 브래드 Dec 18. 2022

데이터 분석은 토대요,  마무리는 시각화다

feat. pandas에서 데이터 프레임 시각화하기

안녕하세요, 브래드입니다.


오늘은 파이썬 학습의 연장선으로 pandas에서 데이터 프레임을 시각화하는 방법을 함께 공부해보아요.



Plot 함수

plot 함수 활용(1)_라인형

먼저 데이터를 시각화하기 전, 한글 폰트 및 사용할 라이브러리를 import 해줍니다. 그리고 시각화할 데이터를 불러옵니다.


plot 함수데이터 집합을 도표나 그래프로 표시하는 것을 의미합니다. pandas 내에서의 plot은 matplotlib의 plot을 import 하여 사용합니다.


pandas 내에서 plot 함수는 kind 옵션을 사용하여 다양한 그래프로 시각화할 수 있습니다. 활용할 수 있는 옵션 값은 다음과 같습니다.

- 라인형(line)
- 바형(bar)
- 히스토그램(hist)
- 박스형(box)
- 파이형(pie)
- 산점도(scatter)
- 영역형(area)


기본 함수식은 df.plot(kind='나타낼 옵션', figsize=(가로길이,세로길이), title='title 입력')입니다.


위의 예시에서는 df.plot(kind='line', figsize=(10,5), title='gmv 추세')를 출력하여 gmv 추세라는 제목을 가진 가로 10, 세로 5의 크기로 한 그래프가 들어갈 틀 및 라인형 그래프를 보여준 모습입니다.




plot 함수 활용(2)_라인형

만약, 특정한 컬럼의 데이터만 보고 싶다면 df 다음에 ['컬럼명']을 입력하여 해당 컬럼만 시각화할 수 있도록 만들어줄 수 있습니다.




plot 함수 활용(3)_바형

다음은 데이터 시각화 옵션을 바형으로 나타낸 모습입니다.


예시에서는 각 카테고리별 gmv 값의 평균을 구한 후 바형으로 나타냈습니다.

bar_df.plot(kind='bar', figsize=(10,5), title='카테고리별 평균 매출')을 출력하여 카테고리별 평균 매출이라는 제목을 가진 가로 10, 세로 5 크기로 한 데이터가 들어갈 틀 및 바형을 나타낸 모습입니다.




plot 함수 활용(4)_히스토그램형

히스토그램형을 통해 데이터 값의 분포를 확인할 수 있습니다.


df.plot(kind='hist', figsize=(10,5), title='빈도수')를 출력하여 나타내었으며, 추가로 간격을 의미하는 bins=20을 입력하여 데이터 간의 간격을 넓혀 시각적으로 더욱 보기 좋게 구현했습니다.




 

plot 함수 활용(5)_파이형

다음으로 파이형입니다.


먼저 파이형으로 나타낼 컬럼을 pie.df = df['category'].value.counts()를 통해 정의해준 후, 앞서 진행했던 식과 같이 plot 함수를 활용한 식을 입력해줍니다.


특히, 식 뒷부분에 autopct='%.1f%%'을 입력하여 소수점 첫째 자리까지 나타내 줄 수 있습니다.




지금까지 pandas에서 데이터 프레임 시각화하는 방법으로 plot 함수를 활용하는 방법을 함께 알아보았습니다.


다음 시간부터는 여러 시각화 라이브러리를 활용하여 데이터를 시각화하는 작업을 함께 공부해보아요.


브래드였습니다. 감사합니다.

매거진의 이전글 파이썬으로 데이터 전처리하기(10)
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari