데이터시각화 사용법
데이터의 양이 늘어나고 복잡해지면서, 데이터를 좀 더 쉽게 이해하고 인사이트를 발견하는 것의 필요성이 높아지고 있습니다. 이러한 이유로 데이터 시각화가 많이 활용되고 있는데요. 데이터가 시각화되어 전달되면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 하지만, 어떤 데이터 시각화는 좀처럼 정보를 파악하기가 쉽지 않습니다. 무엇이 차이를 가를까요?
다양한 데이터 시각화를 자료로 활용하고 있는 혁신의 숲(https://www.innoforest.co.kr/) 사례로 분석해봤습니다. 혁신의 숲은 스타트업의 투자유치, 고용현황, 재무 등의 데이터를 제공하고, 이를 분석하여 스타트업의 성장을 예측하는 성장 분석 플랫폼입니다. 각 기업에 대한 정보 뿐 아니라 스타트업 전체의 생태계를 이해할 수 있도록 돕습니다. 이렇게 유용한 정보를 제공하고 있지만, 데이터 시각화를 통한 정보전달에서 아쉬운 점들이 보입니다. 이 글에서는 혁신의 숲에서 제공하는 데이터 시각화를 살펴보고, 정보를 좀 더 쉽고 직관적으로 전달할 수 있도록 업데이트해 보았습니다.
아래의 시각화는 마켓컬리의 성장을 한 눈에 볼 수 있는 타임라인 카테고리입니다. 트래픽, 소비자 거래지수, 고용인원, 투자유치라는 네가지 데이터가 함께 제공됩니다. 각각의 데이터는 다른 단위로 구성되어있고 Y축 스케일 또한 다릅니다. 이러한 데이터들이 하나의 차트에서 보여질 경우, 데이터 간의 상관관계를 잘못 이해할 수 있습니다.
각각의 라인 그래프가 어떤 정보를 의미하는지 알려면 차트 아래에 작은 텍스트로 된 설명을 읽어야 하네요. 또한, 라인 별로 다 다른 색을 사용하여 시각적으로 너무 많은 정보가 함께 전달되고있어 차트가 복잡해 보입니다.
이를 다음과 같이 업데이트해 보았습니다. 소비자 거래지수, 트래픽, 고용인원 데이터를 각각 따로 시각화하였습니다. 투자 유치 정보의 경우, 다른 데이터가 제공하는 정보를 해석하는데 도움을 줄 수 있기 때문에 각 시각화에 점선으로 표시하였습니다.
어떤 내용의 차트인지를 보여주기 위해 차트 제목을 추가하였습니다. 날짜는 연도수만 나타내어, 데이터가 제공하는 기간을 쉽게 파악할 수 있도록 하였습니다. 차트에 따르면 두번째 투자유치 이후 소비자 거래지수가 낮아진 것으로 보이네요. 마켓컬리의 주요 지표들이 시간에 따라 어떻게 변했는지 좀 더 눈에 잘 들어오는 것 같나요?
. 수많은 다른 데이터들이 하나의 차트에서 보여질 경우, 데이터 간의 상관관계를 잘못 이해할 수 있습니다.
. 많은 색의 사용 등 불필요하게 많은 시각정보를 제공하면 시각화를 직관적으로 이해하기 어렵습니다.
. 눈금이 많으면 오히려 데이터값을 읽는 데 어려움을 줄 수 있습니다.
더불어 각각의 차트가 제공하는 정보를 이해하기 쉽게 도와주는 제목 혹은 주석 등을 적절히 활용하는 것이 필요해 보입니다. 이러한 개선이 이루어진다면, 시각화를 통해 정보를 좀 더 직관적이고 이해하기 쉽게 전달할 수 있을거라 생각합니다.
*노트: 위의 작가가 만든 이미지는 원본에서 이미지를 복사하여 만든 것으로 실제 데이터와 차이가 있을 수 있습니다
자세한 아래의 내용은 아웃스탠딩 원문에서 확인할 수 있습니다.
1. 타임라인
2. 소셜분석
3. 소비자 거래분석
https://outstanding.kr/datainnoforest20230518