brunch

You can make anything
by writing

C.S.Lewis

by Youjin Shin ㅣ 신유진 Oct 17. 2023

파이차트 제대로 사용하기

데이터시각화 사용법


파이차트는 데이터 시각화의 한 방법으로, 전체 데이터 중 각 항목의 비율을 원의 조각으로 나타냅니다. 각 항목의 비율이 조각의 각도에 비례하여 표현되어, 이 모습이 마치 파이 같습니다. 아마 가장 접하기 쉬운 데이터 시각화의 한 형태가 아닐까 합니다. 하지만, 파이차트를 사용할 때 몇 가지 주의해야 할 점이 있는데요. 이 글에서는 파이차트를 제대로 사용하는 법에 대해 알아보겠습니다.





비율의 합은 100%이어야 한다


다음은 2012년 폭스뉴스에서 사용한 파이차트입니다. 각 항목을 하나씩 살펴보면, 전체의 합이 100%를 훨씬 뛰어넘는다는 것을 알 수 있습니다. 이는 중복 답변을 포함했기 때문인데요, 이러한 경우에는 파이차트를 사용하면 안 되겠죠. 이렇게 우리는 종종 전체의 합이 100%가 아닌 파이차트를 만나게 되는데요. 이는 파이차트의 잘못된 사용 예입니다.


파이차트는 각 항목의 "비율"을 표현하는 도구입니다. 따라서 항목들의 합은 전체를 나타내는 100%와 일치해야 합니다. 또한, 우리는 파이차트를 볼 때 직관적으로 전체가 100%라고 인식합니다. 때문에 파이차트의 합이 100%가 아닌 경우, 데이터에 대한 왜곡된 인식이 생길 수 있습니다.


Source: FlowingData (https://flowingdata.com/2009/11/26/fox-news-makes-the-best-pie-chart-ever/)





항목의 수가 너무 많지 않아야 한다


아래의 차트는 자신의 아이가 ‘Wanna Know Something?’ (알려줄까?)라고 했을 때, 본인이 알게 되었던 것이 무엇인지를 7일에 걸쳐 기록한 결과입니다. 마인크래프트에서부터 스펀지밥, 수학, 동물 등 정말 많은 것을 알게 되었네요. 데이터의 내용은 재미있지만, 파이차트를 보면 도대체 그 내용을 파악하기가 쉽지 않습니다.


파이차트의 항목이 너무 많으면 각 항목의 차이를 구분하기 어려워집니다. 이는 우리가 각도의 차이를 쉽게 구별하지 못하기 때문인데요. 파이차트 내에서 미세한 각도 차이를 구분하는 것이 어렵기 때문에, 데이터를 정확하게 해석하는 것이 어려워집니다. 때문에 파이차트를 사용할 때에는 항목의 수가 약 5개 이내로 한정적이어서 육안으로 어느 정도 구별이 가능할 때에만 사용하는 것이 좋습니다. 시각적으로 해석하지 못하는 차트는 차트의 의미가 없겠죠?


출처: Reddit (https://www.reddit.com/r/dataisbeautiful/comments/ijs7s3/oc_what_im_about_to_learn_about






3D 파이차트는 피하기


스티브잡스가 2008년 미국에서의 스마트폰 시장 점유율을 파이차트로 설명하고 있습니다. 차트는 3D로 약간 기울어져 있네요. 차트를 보면 애플의 시장 점유율은 19.5%입니다. 이는 기타(Other)에 해당하는 부분인 21.2%보다 더 크게 보입니다. 애플의 시장 점유율이 실제보다 과장되어 인식되네요. 이는 바로 파이차트가 3D로 기울어져있기 때문입니다. 이처럼 3D 파이차트는 데이터의 시각적 왜곡을 일으킬 수 있습니다.


출처: engadget (https://www.engadget.com/2008-01-15-live-from-macworld-2008-steve-jobs-keynote.html)





대부분 막대그래프가 더 낫다


1980년대에 클리브랜드(William S. Cleveland)와 맥길(Robert McGill)은 그래픽으로 어떻게 정보를 잘 전달할 수 있는지에 대한 연구를 진행했습니다. 그들의 주요 발견 중 하나는 사람들이 어떤 시각정보를 다른 시각정보에 비해 좀 더 정확하게 인식할 수 있다는 것이었는데요. 이는 다음의 순서로 보입니다.

 

공통 스케일상의 위치 (예: scatter plot)

동일하지만 정렬되지 않은 스케일상의 위치 (예: multiple scatter plots)

길이 (예: bar chart)

각도 및 기울기 (예: pie chart)

면적 (예: bubbles)

체적, 밀도, 색상의 진하기 (예: heatmap)

색상 색조 (예: newsmap)


각도에 비해 길이를 좀 더 정확히 인식한다고 나와있네요. 어떤 항목의 비율을 비교할 때, 막대그래프 혹은 파이 차트를 사용하는데요. 위의 순서에 따르면 사람들은 파이 차트에 비해 막대그래프로 표현된 정보를 좀 더 정확하게 인식할 수 있습니다.


아래는 ‘Wanna Know Something?’라는 제목의 파이차트를 막대그래프로 표현한 것입니다. 파이차트에 비해 각 항목의 비율 차이를 훨씬 수월하게 인식할 수 있는 것 같지 않나요? 대부분의 경우, 파이차트를 통해 시각화할 수 있는 정보를 바 그래프로 나타냈을 때, 우리는 이를 좀 더 쉽고 직관적으로 이해할 수 있습니다.



출처: Datawrapper (https://www.datawrapper.de/)





자, 정리해 보겠습니다.


파이차트,   

비율의 합은 100%이어야 한다

항목의 수가 너무 많지 않아야 한다

3D 파이차트는 피하기

대부분 막대그래프가 더 낫다


파이차트는 데이터의 비율을 시각적으로 표현하기에 효과적인 방법입니다. 하지만 올바르게 사용하지 않으면 정보의 왜곡이나 잘못된 해석을 초래할 수 있습니다. 위의 주의사항을 참고하여 파이차트를 효과적으로 사용해 보세요!





출처

FlowingData (https://flowingdata.com/2009/11/26/fox-news-makes-the-best-pie-chart-ever/)

 Reddit (https://www.reddit.com/r/dataisbeautiful/comments/ijs7s3/oc_what_im_about_to_learn_about_after_my_kid_says/)

Engadget (https://www.engadget.com/2008-01-15-live-from-macworld-2008-steve-jobs-keynote.html)

Datawrapper (https://www.datawrapper.de/)

Graphical perception (http://euclid.psych.yorku.ca/www/psy6135/papers/ClevelandMcGill1984.pdf)

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari