brunch

You can make anything
by writing

C.S.Lewis

by Youjin Shin ㅣ 신유진 Mar 24. 2023

성공적인 데이터 시각화를 돕는 4가지 기술

데이터시각화 사용법


데이터 시각화는 데이터에서 발견한 정보를 시각적으로 이해할 수 있도록 그래픽 형태로 표현한 것을 말합니다. 이런 데이터 시각화는 언제부터 시작되었을까요? 정확한 시점을 알기는 어렵지만, 그 역사는 생각보다 많이 거슬러 올라갑니다. 우리에게 백의의 천사로 익숙한 나이팅게일은 간호사면서 통계학자였고, 무엇보다 데이터 시각화의 선구자였습니다. 그 중 가장 유명한 시각화는 아래의 '로즈 다이어그램(Rose Diagram)'입니다.


출처: Science News 



1858년도에 만들어진 이 다이어그램은 당시 크림전쟁에서 사망한 병사들의 수와 그 원인을 보여줍니다. 사망 원인 별로 면적이 붉은색 (부상으로 인한 사망), 파란색 (예방 가능한 질병), 검은색 (그 외)으로 나누어집니다. 이 시각화를 통해 전염병 등의 예방 가능한 질병으로 인한 사망자 수가 많다는 것을 확인할 수 있죠.


그렇다면 오늘날의 데이터 시각화는 로즈 다이어그램과 어떤 부분이 다를까요? 이는 기술의 발전과 큰 연관이 있습니다. 많은 양의 데이터를 분석 및 시각화할 수 있게 되었고, 인터랙션을 통해 사용자가 정보를 직접 탐색하는 것이 가능해졌으며, 증강현실을 통해 데이터 시각화를 경험할 수 있도록 합니다. 성공적인 데이터 시각화를 위해 이러한 기술을 어떻게 활용하면 좋을지 사례들을 통해 자세히 살펴보겠습니다.





시각화에 인터랙션을 더하다

1) 데이터 탐색을 가능하게 하다


Étienne-Jules Marey, France: Paris-Lyon Train Schedule, 1885 (출처: 나이팅게일 매거진)


위의 이미지는 2019년 나이팅게일 매거진에서 발행한 아티클의 한 부분으로, 1885년 파리(Paris)역에서 리옹(Lyon)역까지 하루 동안의 기차 시간표를 시각화한 것입니다. 세로축에 기차역 이름이 적혀있고, 가로축에 오전 6시부터 다음날 오전 6시까지의 시간이 표시되어 있습니다. 파리에서 오전 6시 반에 출발한 기차가 오후 약 7시 반쯤 리옹역에 도착하는 것을 알 수 있습니다. 파리역의 막차는 밤 11시 반에 있네요. 많은 정보들을 이 시각화를 통해 알 수 있습니다. 다만, 이 정보를 찾아내는 과정이 직관적이지는 않습니다. 가령, 파리에서 출발한 기차가 언제 어느 역을 통과하는지 알려면, 직접 색연필 등으로 선을 따라가면서 알아내야 합니다.


오늘날의 데이터 시각화는 인터랙션을 통해, 이러한 문제를 해결하고 시각화 내에서 정보를 쉽게 탐색할 수 있도록 도와줍니다. 다음은 2014년도에 만들어진 보스턴의 지하철 노선도 시각화(Visualizing MBTA data)입니다. 오른쪽에 있는 시각화를 위의 이미지와 비교하면, 가로축과 세로축이 바뀌었을 뿐 기본적인 시각화 방법은 동일한 것을 알 수 있습니다.


출처: Visualizing MBTA data


오른쪽 시각화 위에 마우스를 올려봅니다. 그럼 마우스 위치에 해당하는 시간(6:53 am)이 표시되고, 이 시간의 지하철 위치가 왼쪽의 지하철 노선도에 표시됩니다. 마우스를 위아래로 움직이면, 시간에 따른 지하철의 이동을 왼쪽에 애니메이션으로 확인할 수 있습니다. 즉, 데이터를 두 개의 다른 방식으로 시각화한 후, 인터랙션을 통해 이 시각화들을 함께 연결시켜 보여줌으로써 사용자가 좀 더 풍부한 정보를 파악할 수 있도록 돕습니다.


오늘날에는 시간표 뿐 아니라 언제 얼마나 많은 사람들이 지하철을 이용했고, 시간표에 비해 얼마나 지연이 많이 일어났는지 등의 정보도 알 수 있습니다. 즉, 수집하는 데이터의 종류도 다양해졌습니다.


출처: Visualizing MBTA data


위의 시각화는 특정 날짜의 지하철 혼잡 및 지연 정도를 보여줍니다. 목요일(Thu, Feb 6) 오후 5시 14분 지점을 마우스로 클릭해보았습니다. 분당 1,005명의 지하철 승객이 다니며, 시간표에 비해 46% 느리게 운행된다는 정보가 텍스트로 표시됩니다. 그리고 이 정보가 왼쪽 지하철 노선도에 시각화되네요. 노선이 뚱뚱할 수록 혼잡하고, 붉은색일 수록 지연이 많은 것을 의미합니다. 왼쪽 위의 빨간색 노선이 가장 혼잡하며 지연이 많이 이루어지는 것을 알 수 있습니다.


인터랙션은 독자들이 수동적으로 정보를 이해하는 것에서 그치는 것이 아니라, 스스로 정보를 찾고 탐색할 수 있도록 돕습니다. 인터랙션이 데이터 시각화에 더해진 경우를 우리 일상에서도 쉽게 찾아볼 수 있습니다. 유튜브 크리에이터들은 유튜브에서 제공하는 인터랙티브 대쉬보드를 통해 퍼포먼스를 모니터링하고, 채널의 성장을 위해 개선해야할 점이 무엇인지 인사이트를 얻을 수 있습니다. 데이터 시각화를 이용하여 정보탐색을 가능하게 하는 경우, 어떤 인터랙션을 통해 어떤 정보를 찾을 수 있도록 할지 고민하는 것이 필요합니다.





자세한 아래의 내용은 아웃스탠딩 원문에서 확인할 수 있습니다.

1. 시각화에 인터랙션을 더하다 

    (1) 데이터 탐색을 가능하게 하다

    (2) 데이터 시각화를 이용한 스토리텔링

2. 시각화의 형태가 다양해지다

3. 실시간 시각화로 데이터를 모니터링하다

4. 증강현실을 통해 데이터 시각화를 경험하다


https://outstanding.kr/datavisualtech20230324


매거진의 이전글 링크드인 피치덱, ‘데이터 시각화’로 개선하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari