brunch

You can make anything
by writing

C.S.Lewis

by SSEN Nov 06. 2020

엑셀로 데이터 그리기

데이터 시각화 원리 리뷰 02

(전편은 아래 링크에서 볼 수 있습니다)

https://brunch.co.kr/@gkicarus/89


데이터 시각화 원리. 조르즈 카몽이스 지음 | 이혜연 옮김 | 에이콘 출판 | 2017년 06월


이 책을 전에도 한번 읽은 적이 있다. 

그때는 그래프나 데이터 시각화의 이론적인 면에만 집중할 때여서 정작 그래프를 그린 툴에는 집중을 못했다. 

이번에 이 책에 사용된 그래프는 거의 모두 엑셀로 그렸다는 것에 초점을 맞춰서 읽어보았다. 오늘의 포스팅은 엑셀에서 그린 그래프 분석!


8. 질서의 개념(그림 8.2)

아래의 그래프는 실무에서도 꼭 한번 쓰고 싶은 그래프다. 막대그래프에서 각 수치를 파악하는 것과 동시에 가장 앞에 점으로 구성된 그래프를 하나 더 삽입하여 한 줄에 전체 데이터들을 나열하여 값이 어떻게 분포되어 있는지 볼 수 있는 그래프. 산점도+막대그래프라고 생각하면 될 것 같다. 책에 삽입된 차트의 원본 데이터와 그래프 서식으로 만드는 방법을 확인했다.

엑셀에서 그리는 그래프는 1. 어느 구역의 데이터를 입력하고 2. 어떻게 디자인하느냐에 따라 스타일이 달라진다. 저자는 산점도는 꺾은선 그래프를 사용하여 그렸으나 첫 번째 값을 제외한 표식은 없음으로 지정하여 보이지 않게 했다. 막대그래프와 산점도 사이의 연결선을 유지하기 위해 각 막대그래프까지는 산점도의 값을 같게 입력하고 나머지는 공란(=NA())로 처리했다.


8. 질서의 개념(그림 8.9)

★이번 그래프는 그래프의 내용을 정확히 기억하지 못하는 관계로 그리는 법에 초점을 더 맞춰봅니다.. 이래서 이론 책은 생각날 때마다 봐야 해..ㅜ.ㅜ


아래 두 가지 그래프는 같은 데이터를 기반으로 하고 있다. 아일랜드의 시간별 GDP를 표현한 것으로, 왼쪽은 일반적인 막대그래프로 표현하고, 나머지 하나는 EU 평균값과 비교할 수 있도록 EU 평균값도 선의 형태로 추가하였다.(Euro로 되어 있는 회색 박스 구간의 의미를 잘 모르겠다.+별도로 찾아봤는데, 2002년은 공동통화인 유로화 도입으로 유로존-Euro zone-이 탄생한 해라고 한다. 이것과 연관 있는 내용인 듯.)


이 그래프를 소개하는 것은 그래프 상에서 y축 값 차이를 어떻게 표현해야 적절할 지에 해답이 되는 것이어서 다. 실제로 막대그래프를 표현할 때 많이 일어나는 문제인데,  아래 왼쪽 그래프의 08~11 구간까지의 변화를 좀 더 확실하게 보여주거나 실제로 GDP가 이 전해에 비해 큰 비율로 증가한 97년 증가 폭을 강조하기 위한 장치가 필요하다. 구간 상의 변화를 보여주기 위해 가장 많이 편집하는 것은 y축 값의 구간인데, 지금처럼 0~200까지가 아니라 45~200 정도로만 바꿔도 막대그래프 높이의 차이는 어마하게 벌어진다. 또한 대부분의 막대그래프 왜곡이 이 y축 값 조정으로 인해 일어나므로 가장 조심해야 할 편집법이기도 하다.


그래서 나온 대안이 오른쪽의 그래프이다. 원본 파일에는 2005=100으로 잡고 시작하라고 했지만 아무리 생각해도 그래프가 처음 시작하는 1995년의 데이터가 시작, 즉 100인 것 같다. 그리고 바로 직전의 데이터를 기준으로 하여 몇 퍼센트나 늘거나 줄었는지를 계산하면 축 값을 백분율로 변경하여 해가 갈수록 변화하는 막대그래프 수치를 얻을 수 있다.


엑셀에서 오른쪽 그래프를 살펴보면 재밌는 장치를 살펴볼 수 있는데, 첫 번째는 EU-28(유럽연합 28개국, 영국 탈퇴 전으로 현재는 EU-27로 표현됨)의 GDP를 표현하는 검은 막대이다. 이 막대는 표식이 있는 꺾은선 그래프에서 표식의 형태를 선으로 바꾼 결과이다. 표식 사이의 선은 '없음'으로 처리했다.



두 번째는 그래프 종류에서 보이는 [DummyEuro]의 존재. 그래프의 Euro라고 표시되어 있는 회색의 사각형인데, 정확히는 이 그래프는 위아래 두 가지 방향으로 뻗어있다. 이 그래프의 목적은 오로지 구간 표시. 붙어있는 막대그래프의 채우기 색에 투명도를 줘서 원래의 그래프도 표현하고 배경도 보여주는 방식으로 표현했다. 직접 그려서 그래프에 배치하는 성격인 나는 생각해내기 어려웠던 방식.  




개인적으로 공부하려고 만들어본 포스팅인데 생각보다 그래프에 들어간 공이 엄청나 보인다. 고로 이 리뷰는 한 두개 정도 더 만들 생각. 원본 차트는 아래에서 확인할 수 있으니 궁금한 분들은 직접 다운로드 후 분석해 보시길.


http://www.dataatworkbook.com/data-work-08-sense-order-data-comparison-charts/


매거진의 이전글 데이터 시각화에 적용된 게슈탈트 법칙
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari