brunch

You can make anything
by writing

C.S.Lewis

by 여행하는 기획자 Jan 17. 2023

시각화가 필요한 이유와 시각화 방법

데이터 시각화 프로세스

MBTI를 하면 늘 J의 성향이 나와서 그런지 늘 계획을 한다. 수년간 내 일상을 계획하였고 최근 몇 년간은 디지털로 일상을 계획하고 있다. 최근 단순히 계획했던 것을 차트 형태로 보고 있다. 단순히 내 일상을 그래프 하나만으로 시각화하였지만 무척 직관적으로 내 일주일 생활 리듬이 보였다. 무슨 요일에 가장 책을 열심히 읽는지, 언제 늘어지게 TV를 보는지 금세 파악이 되었고 대책을 마련할 수 있었다. 계획을 세우며 일상을 살아간 지 10년 만에 나의 패턴을 처음으로 깨닫게 된 순간이었다. 그동안 무수한 일상 속 데이터가 쌓였지만 데이터로 만든 차트 하나로 금세 나의 패턴이 파악되었다. 많은 사람들은 나와 같이 데이터 자체로 반응하지 않는다. 데이터가 이야기하는 스토리, 시각적인 언어에 반응을 한다. 




데이터 시각화는 왜 필요한 것일까?



우리의 뇌는 글자보다 이미지에 반응한다. 

이미 데이터는 풍부하다. 도처에 깔려있다. 지금 이 순간에도 내가 어디를 갔었는지, 무엇을 먹었는지, 얼마나 걸었는지 계속 데이터가 쌓이고 있다.  담당하는 조직답게 어마어마한 가전 데이터들을 살펴볼 수 있었다. 문제는 너무 방대한 데이터 탓에 의사결정을 내리기도 어렵고 인사이트 도출도 힘들다는 점이다. 수많은 글자 정보를 시각적으로 변환하면 인간은 보다 쉽고 직관적으로 데이터를 이해할 수 있게 된다. 


코로나 블루 키워드 시각화


동일한 눈높이로 이해할 수 있게 된다.

현상에 대해 새로운 생각과 더 나은 해결 방안을 고민하기 위해서는 모두가 현상을 정확히 이해하고 있어야 한다. 이를 위해 어느 부서 누구라도 같은 눈높이로 데이터의 이해가 필요하다. 데이터 분석 기술이 아무리 뛰어나도 기술을 이해하지 못한다면 활용되지 못한다. 소수만 이해를 하고 있으면 기술은 전파되기가 쉽지 않다. 기술이 사람을 향하도록 만들면서 모두가 동일한 눈높이로 이해하기 위해 시각화가 필요하다. 


데이터 변화 속도를 실시간으로 따라잡을 수 있다.  

데이터는 고정값이 아니다. 매초, 매시간 움직이고 변화한다. 시시각각 변화하면서 양도 많다. 데이터가 변화하기 시작하면 실시간으로 파악하기가 어려워진다. 시시각각 변화하는 데이터를 쉽게 이해하기 위해서는 시각화가 무엇보다 중요하다. 


빨리 대처할 수 있게 한다. 

데이터 시각화를 통해 현상을 이해하면서 예측을 할 수 있다. 직관적으로 현상과 예측 상황을 이해하면서 결과에 따라 빠르게 대처하고 행동할 수 있다. 빠르게 대응하면서 위험상황을 조기에 바로 잡을 수 있다. 많은 분야의 데이터들이 서로 합쳐질 땐 복잡도가 더 늘어나면서 현상 파악이 어려워진다. 복잡한 데이터끼리의 결합이라도 시각화를 통해 빠르게 현상을 이해하고 보다 빨리 대처할 수 있게 된다. 




데이터 시각화 프로세스 


그렇다면 데이터 시각화를 어떻게 진행하면 좋을까? 아무런 정보도 없고 방향성도 없는 상태에서 대뜸 데이터 시각화를 해갖고 오라면 상당히 당황스러울 수 있다. 어찌 보면 굉장히 큰 프로젝트가 될 수 있어 막연하고 방대할 수 있다. 이때 이미 다른 연구자들은 데이터 시각화를 어떠한 형태로 진행하는지 참조해 보면 실무적으로 진행하는 시각화 업무를 대입시켜 볼 수 있다. 


The Seven Stages of Visualization (Fry, 2004)


벤 플라이는 데이터 시각화 방법을 총 7단계로 나눠 소개하고 있다. 7단계는 데이터 획득에서부터 - 분석 - 선별 - 데이터마이닝 - 표현 - 개선 - 상호작용까지 이루어진다. 데이터를 획득한 뒤 각 데이터별 분석이 필요하다. 데이터를 가공하기 쉽도록 어떠한 구조를 제공하는 형태가 필요하다. 즉 데이터 분석이 용이한 형태로 변경해야 한다. 분석 단계에서는 원하는 인사이트를 얻기 위해 문자와 숫자의 형태를 조작해야 하는 경우도 발생한다. 경우에 따라선 데이터 필터를 통해 필요 없는 데이터는 삭제를 해야 한다. 이후 데이터 마이닝이 시작된다. 즉 간단한 형태로 데이터 통계 분석이 들어간다. 시각적 표현을 결정하고 최대, 최소값으로 매핑을 한다. 이후 정제를 하여 사용자가 주기적으로 옵션을 넣고 빼고를 하여 인터랙션을 하는 과정을 거친다. 


네트워크 관계 시각화

시각화를 할 때마다 각 프로세스를 무조건적으로 따를 필요는 없다. 하지만 현재 현업의 수준이나 해야 하는 시각화의 수준이 전체 어느 단계에 위치하였는지 알게 된다면 앞으로 해야 할 일을 파악하는데 도움이 된다. 


데이터는 너무 많고 데이터를 분석하는 기술은 날마다 발전하고 있다. 이제 수집한 데이터 안에서 어떻게 인사이트를 찾을 것인지, 분석 기술을 어떻게 활용할지가 남은 숙제이다. 시각화를 잘 이끌고 표현할 수 있다면 인사이트를 도출하고 기술을 보여주는데 큰 도움이 될 수 있다. 다만 시각화는 "시각화를 하세요." 해서 뚝딱 나올 수 있는 문제는 아니다. 한 사람이 할 수 있는 문제도 아니다. 조직적으로 기술을 다루는 사람, 디자인을 다루는 사람 모두가 아울러 시각화를 고민할 필요가 있다. 



매거진의 이전글 데이터는 어떻게 돈이 될 수 있을까
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari