데이터 시각화, 단순화, 추상화 3단계 실습
대출 이자 갚느라고 쓸 돈이 없다
전세계적으로 고금리가 계속 이어지면서 여기저기서 힘들다고 말합니다. 코로나 19 때문에 빚내어 사업을 지탱했거나, 내 집마련을 한 경우, 집안에 큰일이 있었던 사람들 모두 마찬가지입니다. 한편으로는 해외여행도 잘 다니고 세일할 때마다 가지고 싶었던 물건들을 잘 사는 사람들도 있어 보입니다. 뉴스에서는 연일 가계대출이 또 사상 최고치를 경신했다는 말, 위험하다는 말만 계속 해댑니다. 도대체, 이 빚이란 것은 나만 있는 걸까요? 또 다들 얼마나 가지고 있는 것일까요?
이번 시간에는 정부기관인 통계청에서 2024년 3월 28일 발표한 "임금근로자 부채" 통계 데이터에 대해 함께 알아보면서 내 데이터로 시각화를 넘어 인포그래픽으로 넘어가는 3단계 과정에 대해 알아보고자 합니다.
이번 주제는 생성형 AI를 활용한 문과생 데이터 분석 리포트 만들기를 테마로 작성되었습니다. 사용된 단계별 데이터 시각화는 엑셀파일을 통해 무료로 제공해 드리며, 해당 코드는 깃허브를 참고해 주시기 바랍니다.
데이터 시각화는 인간의 시각 또는 지각능력을 바탕으로 데이터에 대한 이해와 설득에 도움을 주기 위, 그림이나 도형 등 그래픽 요소들을 이용해서 데이터를 묘사하고 표현하는 것을 말합니다. 우리는 그런데 인간의 시각적 능력과 지각인지 능력에 대한 이해가 먼저 이뤄져야 한다는 사실을 간과하고 있는지 모릅니다. 이러한 측면에서 데이터를 효과적으로 전달하기 위한 시각화 → 단순화 → 추상화 3단계에 대해 알아보겠습니다.
시각화 → 단순화 → 추상화
3단계
가장 먼저 데이터 시각화에 대한 기본 요건들을 살펴보고자 합니다. 데이터 시각화에서 중요한 요소는 "데이터 이해"와 분석결과의 "정확한 전달"에 있습니다. 각각에 대해 예를 들어 살펴보겠습니다.
① 데이터를 이해할 수 있도록 표현한다.
데이터 시각화는 복잡한 데이터를 이해하기 쉽고 직관적으로 만들어줍니다. 그래프나 차트를 통해 데이터의 패턴, 추세, 이상치 등을 빠르게 파악할 수 있습니다.
② 분석결과를 정확히 전달한다.
데이터 시각화는 단순히 데이터를 표시하는 것 이상으로, 메시지를 전달하고 분석 결과를 명확히 보여줍니다. 제목, 범례, 축 레이블 등을 활용하여 중요한 내용을 강조하고, 적절한 시각화 기법을 사용하여 분석 결과를 명확히 전달합니다.
엄밀히 말하면 데이터 시각화를 단순화하는 것입니다. 여기서는 심리인지학에서 유명한 게슈탈트의 원리를 이용할 예정입니다만 과정상 어려운 용어는 생략하고 그 개념에 대해 간단히 두 가지만 풀어서 전달드리려고 합니다.
① 불필요한 요소의 삭제한다.
데이터 시각화를 단순화하는 것은 중요한 요소만 남기고 불필요한 요소를 제거하는 것입니다. 축, 범례, 테두리 등과 같은 요소를 삭제하여 시각적인 잡음을 줄이고, 데이터에 집중할 수 있도록 돕습니다. 예를 들어, 그래프의 배경색을 흰색으로 변경하여 그래프의 주제를 뚜렷하게 만들 수 있습니다.
데이터가 더욱 돋보이게 하라
② 색상의 유사성과 위치의 근접성 등을 활용한다.
유사한 데이터를 유사한 형태나 색상으로 표현하고, 서로 근접한 요소들을 연결하여 이해하기 쉽도록 합니다. 동일한 색상이나 위치를 사용하여 관련 있는 데이터들을 시각적으로 그룹화하고, 연결선을 통해 관계를 강조할 수 있습니다.
색상이 같으면, 같은 것
가까이 있으면, 동일한 것
데이터 추상화는 단순히 데이터를 전달하는 것 이상으로, 사람들의 관심을 끌 수 있는 미적 요소를 활용합니다. 색상, 폰트, 그림 등의 디자인을 사용하여 시각적인 흥미를 유발하고, 시각적으로 매력적인 차트나 그래프를 만듭니다. 예를 들어, 밝고 생동감 있는 색상을 사용하여 주목성을 높일 수 있습니다.
① 미적 요소를 활용하여 관심을 유발한다.
단순히 데이터의 표식을 활용할 때에도 ●, ◆, ★ 와 같은 일반적이 표식이 아닌, 데이터가 의미하는 바에 대한 아이콘이나 도형이 좋습니다. 예를 들어 아래에서 대출금액을 일반적인 막대나 표식으로 사용하기보다는, 돈을 상징하는 표식으로 바꿔줌으로써 보는 사람이 "아, 이건 돈(금액) 이구나!"라고 단박에 알아차릴 수 있습니다.
② 공감 가는 이야기와 시선을 끌 수 있는 그림을 삽입한다.
데이터 시각화는 그림과 미적요소를 통해 감성적인 시선이나 이야기를 담을 수 있습니다. 특정 이벤트나 추세에 대한 감정적 반응을 나타내거나, 데이터가 전달하는 이야기를 표현할 수 있습니다. 예를 들어, 주제에 맞는 일러스트를 삽입하거나, 내러티브 형 이야기를 들려줄 수 있습니다.
예를 들면 아래에서 "평균 대출금액이 1.7% 감소했다."에서 1.7%가 감소한 것에 초점을 맞추기보다는 "통계 작성 이래로 처음이다"에 집중하도록 만듭니다.
우리가 가지고 있는 데이터를 인포그래픽으로 발전시켜 나가는 데이터 시각화 → 단순화 → 추상화 3단계를 정리하면 다음과 같습니다. 데이터 시각화(Data Visualization)는 데이터를 이해하고, 분석 결과를 명확히 전달한다. 데이터 단순화(Data Simplification)는 불필요한 요소를 제거하고, 데이터의 집중을 돕는다. 데이터 추상화(Data Abstraction)는 그림을 통해 관심을 유발하고, 감성적 시선과 이야기를 전달한다입니다.
아무쪼록 데이터에 폭넓은 사고를 바탕으로 여러분들의 업무와 가정, 개인 앞에 주어진 문제에 대해 합리적인 의사결정에 도움이 되셨으면 좋겠습니다. 감사합니다.