brunch

데이터 시각화 소개

대표적 사례와 의미

by Styleboost
MIT 연구 결과에 따르면 이미지는 우리가 글보다 6만 배나 빠르게 인지할 수 있으며, 그 처리 속도는 단 0.013초에서 0.033초에 불과합니다. 또한, 우리가 뇌로 받아들이는 정보의 90%는 시각적인 형태로 이루어져 있어, 이미지의 영향력이 매우 크다는 것을 알 수 있습니다.

시각 자료는 정보를 빠르게 전달하는 것 외에도, 메시지에 대한 신뢰도를 높이는 데 효과적입니다. 단순히 글자나 숫자로 정보를 제시하는 것보다 차트와 같은 시각 자료를 활용하면 사람들은 정보를 훨씬 더 신뢰하게 됩니다. 예를 들어, 68% 정도의 사람들이 단어나 숫자를 통해 제시된 정보를 신뢰한다면, 간단한 차트를 활용했을 때 그 신뢰도는 97%까지 상승할 수 있습니다.

시각적인 자료를 효과적으로 사용한다면, 정말 놀라운 결과를 얻을 수 있습니다.


데이터 시각화는 사람이 데이터를 더 쉽게 이해하고 분석할 수 있도록, 지도나 그래프처럼 시각적인 형태로 정보를 바꿔 보여주는 것을 말합니다. 복잡하고 방대한 데이터 속에서 숨겨진 패턴이나 흐름, 그리고 특이한 값을 보다 명확하게 파악할 수 있도록 돕는 데 중요한 역할을 합니다. 데이터 시각화의 역사에서 중요한 의미를 갖는 대표적인 사례 몇 가지로 시작해 보겠습니다.


Charles Minard의 나폴레옹 행진 지도 (Napoleon March Map)

이미지 출처: wikipedia

1812년, 나폴레옹은 모스크바를 점령하려 대규모 군대를 이끌고 진격했지만, 47만 명에 달했던 병력 중 극히 일부인 만 명 정도만이 살아 돌아왔습니다. 이 차트는 특정 작전의 전개 과정을 보여주는데, 역사상 가장 널리 알려진 시각 자료 중 하나로 손꼽힙니다. 지도는 나폴레옹 군대가 이동했던 경로를 상세히 보여줍니다. 선의 굵기는 군인의 규모를 나타내고, 색깔은 이동 방향을 나타냅니다. (노란색은 모스크바로 향하는 방향, 검은색은 돌아오는 방향입니다.)


차트 중간 하단에는 급격하게 낮아지는 겨울 기온을 나타내는 간략한 온도 그래프가 자리하고 있습니다. 이 그래프는 간결하면서도 세부적인 정보를 담아 여정의 어려움을 효과적으로 보여줍니다.


이 차트는 워낙 유명하다 보니 비판적인 시각도 많지만, 여전히 성공적이고 영향력 있는 차트라는 점은 분명합니다. 각 데이터 항목에 담긴 풍부하고 자세한 정보는 흥미로운 이야기를 만들어내고 궁금증을 자아냅니다.


John Snow의 1854년 브로드 거리 콜레라 발병 지도 (Broad Street Cholera Outbreak Map)

이미지 출처: wikipedia

존 스노우 콜레라 지도는 지도 위에 점으로 데이터를 표현 (Dot map)을 시각화를 했던 차트입니다. 런던의 한 지역에서 콜레라로 사망한 사람 수를 각 가구별로 막대그래프로 나타냈습니다. 이 막대들의 밀집도와 길이를 통해 특정 지역에서 사망자가 유독 높은 이유를 파악할 수 있었습니다.


콜레라 피해가 가장 심했던 집들은 모두 같은 우물물을 식수로 쓰고 있었다는 사실이 밝혀졌습니다. 이는 당시로서는 상당히 획기적인 발견이었습니다. 콜레라 발생이 집중된 지역에 물을 공급하는 해당 우물이 하수로 인해 오염되었던 것입니다. 이러한 사실은 런던 콜레라 발생의 전반적인 추세에 비추어 볼 때, 질병과 오염된 우물 간의 연관성을 명확히 하는 데 기여했습니다.


결국 콜레라를 예방하기 위한 방법은 하수 시설을 정비하고 식수원을 오염으로부터 지키는 것이었습니다. 이러한 해결책을 시각적으로 제시한 것이 효과적이었던 이유는 문제의 핵심 원인을 명확히 드러내고 그에 맞는 해결 방안을 보여주었기 때문입니다. 더욱이 점 지도 (Dot map)와 열 지도 (Heat map)와 같은 시각화 기법이 아직 널리 활용되지 않던 시기에 이러한 시도는 매우 획기적이었습니다. 분석가들이 시각화 기술의 가능성을 확장하여 실용적이고 참신한 결과를 도출했기에 해결책을 찾을 수 있었던 것입니다.


플로렌스 나이팅케일의 크림 전쟁의 사망 원인 (Causes of Mortality in the Crimean War)

이미지 출처: wikipedia

1850년대 크림 전쟁 당시 군인 사망률은 높았는데, 이는 전투로 인한 것뿐만이 아니었습니다. 플로렌스 나이팅게일은 간호사이자 뛰어난 분석가로서, 데이터 시각화 기법을 활용하여 대부분의 사망 원인이 병원의 비위생적인 환경과 미흡한 관리 때문임을 밝혀냈습니다.


나선형 도표에서 빗금 친 영역은 전체 사망자 수를, 짙은 빗금 영역은 전투 중 사망자 수를 보여줍니다. 이를 통해 다른 원인으로 인한 사망이 상당하다는 것을 한눈에 파악할 수 있습니다. 나이팅게일은 의학적 지식과 병원 방문을 통해, 많은 사망의 원인이 열악한 의료 환경이라는 사실을 밝혀냈고, 이는 예방 가능하다는 것을 알게 되었습니다.


그렇다면, 위에서 언급한 데이터 시각화가 왜 중요할까요? 빅데이터처럼 엄청난 양의 데이터를 다루는 분야에서는 데이터를 시각적으로 표현하는 도구와 방법을 활용하여 정보를 분석하고, 이를 바탕으로 중요한 결정을 내리는 것이 매우 중요해졌습니다.


데이터 접근성을 높여 사람들이 쉽게 이해하고 해석하고 활용할 수 있도록 돕는 것이 중요하며, 구체적으로는 다음과 같은 데 기여할 수 있습니다.

반복되는 형태 (패턴)와 방향성을 찾아낼 수 있습니다. 데이터 시각화를 활용하면 데이터 안의 패턴, 추세, 그리고 이상치를 파악하는 데 유용합니다.

더 효과적인 선택을 도와줍니다. 최신 정보를 시각적으로 제시하는 데이터 시각화는 의사 결정권자가 더욱 신속하고 효과적으로 판단을 내릴 수 있도록 지원합니다.

시간을 아낄 수 있습니다. 데이터 분석 속도를 높여 차트를 해석하는 것보다 빠르게 통찰력을 얻도록 도와줍니다.

까다로운 개념을 설명하기 좋습니다. 데이터 시각화를 통해 기술적 이해 관계자뿐만 아니라 비기술적 이해 관계자도 복잡한 아이디어, 추세, 결과를 쉽게 이해할 수 있습니다.

참여도를 향상해 줍니다. 데이터 시각화를 통해 사용자들은 더 쉽게 정보를 이해하고, 시각화에 더욱 집중할 수 있습니다.

이해력을 높이는 데 도움이 됩니다. 사람의 뇌는 정보를 시각적으로 표현하면 뇌에서 처리 속도가 빨라져 이해도와 기억력이 향상됩니다.


데이터 시각화 디자인은 데이터 인식과 이해에 큰 영향을 미칩니다. 따라서 축의 왜곡, 부적절한 차트 선택, 편향된 레이블 등 오해를 일으키는 디자인 요소는 사용자에게 잘못된 정보를 전달하고, 그릇된 결론으로 이어지게 할 수 있습니다. 시각화 디자인을 신중하게 검토하여 데이터가 정확하게 표현되고 올바른 해석을 돕는지 확인하는 것이 중요합니다.


다음 글에서는 다양한 데이터 시각화의 활용법을 구체적인 예시와 함께 살펴보겠습니다.



keyword