태블로를 이용하면 정말 다양한 데이터들을 가져와 시각화 할 수 있다.
엑셀, 텍스트 파일부터 구글 애널리틱스(태블로에서 구글 애널리틱스 데이터 가져오는 방법), SQL Server, Amazon Redshift, 그리고 소셜미디어(태블로에서 소셜미디어 데이터 가져오는 방법) 까지 다양하다.
그 중에 가장 기본적이면서, 자주 사용하는 파일인 ‘엑셀' 데이터에 관해 이야기해 보자.
만약, 엑셀 내 데이터가 정리가 잘 되어있다면, 태블로에서 바로 가져오면 특별한 문제가 없다.
하지만 데이터가 정리가 잘 안되어있다면?
여기서 정리가 '잘 되었다/안되었다’라는 말은 태블로 안으로 데이터를 가져오기에 '편하게/불편하게' 되어있는 데이터라는 뜻이다. 즉, 엑셀 데이터 안이 ‘열’을 기준으로 되어 있으면 정리가 ‘잘 되어 있는 것’이고, 그렇지 않고 행과 열이 복잡하게 되어 있는 경우는 정리가 ‘잘 안 되어 있는 것’이다.
('시도별/성별/날짜/실업률’, 4개의 열을 기준으로 되어있다.)
항상 그런 것은 아니지만, 보통 공공데이터를 다운받으면 데이터를 보기에는 잘 되어있으나, 태블로로 바로 가져오기에는 조금 불편한 데이터들이 많다. 그래서 데이터를 가져오기 전에 데이터를 정제해야 하는데, 데이터 정제를 도와줄 도구가 있을까?
엑셀에서 'Tableau Add-in'을 사용해보자!
'Tableau Add-in'을 이용해서 정리가 잘 안되어있는 데이터를 '태블로형 데이터'로 만들어 볼 것이다.
(‘태블로형 데이터’란, 태블로에서 가져오기 좋은 정제된 데이터를 말한다.)
◆ ‘Tableau Add-in’(링크 클릭)을 다운받자.
◆ 링크를 클릭하면, 태블로 사이트가 나오는데, 오른쪽에 ‘tableau_data_tool.zip’을 다운받자.
◆ 그리고 엑셀에서 ‘파일 - 옵션 - Add -Ins’에서 아래 ‘Excel Add-ins’를 선택하고 옆에 ‘Go’를 클릭하자.
◆ ‘Add-Ins’에서 ‘Tableau7’을 선택하고 ‘OK’를 클릭하자.
그러면 아래와 같이 엑셀 내에 ‘Tableau’ 탭이 생긴다.
(나의 엑셀은 영어버전이라 한글버전과 조금 다를 수 있지만, 기본적으로 엑셀은 비슷하기 때문에, 한글 버전도 같은 방식으로 따라하면 될 것이다.)
내가 사용할 데이터는 '국가통계포털'에서 제공하는 ‘실업률’ 데이터다.
'(전국)실업률-2016년 10월’인데, 그 데이터에서 ‘실업률’만 빼고 나머지(경제활동인구, 고용률 등)는 전부 제거 했다.
다운받은 데이터는 아래와 같다.
◆ 위 데이터에서 ‘계’를 포함한 행을 제거하자.
◆ ‘실업률 (%)’ 행(2번째 행)을 제거하자.
그래서 아래와 같은 데이터로 만들자.
위 데이터를 다운받은 ‘Tableau Add-in’을 이용해서 '태블로형 데이터'로 만들어보자.
◆ 엑셀 탭 중에서 ‘Tableau’를 클릭하자.
◆ ‘Reshape data’를 클릭하자.
◆ ‘Reshape Data’에서 아래 ‘Example’과 같이 ‘첫번째 값’(이 경우에는 ‘$C$2’) 셀을 선택하고 ‘OK’를 클릭하자.
그러면 아래와 같이 '태블로형 데이터'가 나온다.
◆ ‘Col3’을 ‘날짜’, ‘Col4’를 ‘실업률’이라고 바꾸자.
최종 데이터는 처음에 다운받은 엑셀파일과 비교했을 때와는 다른 '태블로형 데이터'가 되었다.
태블로에서 최종 데이터를 가져오면 아래와 같다.
이와 같이 ‘Tableau Add-in’을 이용하면 공공데이터 및 다양한 엑셀파일 데이터를 쉽게 정제하여 태블로에 쉽게 가져올 수 있는 '태블로형 데이터'로 만들 수 있다.