데이터를 분석하고 인사이트를 전달하는 방법
아침에 옷을 입기 전, 온도를 확인한다.
어제보다 온도가 낮다는 것을 인지한 후, 전날보다 따뜻하게 입고 나간다.
데이터 기반 의사 결정이란 말을 들어보았을 것입니다. 기업에서 사업 전략을 수립하거나 기존 업무에서 다양한 의사결정을 수행할 때, 데이터를 기반으로 근거와 이유를 가지고 의사결정을 할 수 있습니다. 어렵게 느껴질 수 있지만, 위의 온도 이야기처럼 우리는 일상생활에서도 데이터를 기반하여 우리의 행동을 결정해 온 것을 알 수 있습니다.
고객을 대상으로 제품을 판매하는 기업의 입장에서, 지금 시대처럼 데이터를 활용하기 좋은 환경은 없었습니다. 누구나 컴퓨터와 스마트폰을 통해 제품을 구매하고 있으며, 이를 기반으로 기업은 구매 데이터뿐만 아니라 고객의 행동 데이터까지 수집할 수 있는 환경이 구축된 것입니다. 그리고 이렇게 모인 데이터를 분석하여 실제 매출에 도움이 될 수 있는 인사이트를 발견할 수 있다면, 기업은 우리가 온도를 체크하고 어떻게 옷을 입을지 고민하는 것처럼 내일은 어떤 물건이 잘 팔릴 것인지를 예상할 수 있게 되는 것입니다. 따라서, 그 어느 시대보다 데이터 분석의 수요는 증가하였으며, 방대한 양의 데이터를 처리하는 방법과 이러한 빅데이터를 분석하는 기술은 계속해서 발전하고 있습니다.
결국, 데이터의 활용 목적은 효율적이고 전략적인 의사 결정의 기반이라고 할 수 있을 것입니다. 그렇다면, 데이터 시각화는 여기서 어떤 역할을 할 수 있을까요?
위에서 데이터 분석의 목적은 데이터를 기반으로 의사 결정을 수행하기 위함에 있다고 설명했습니다. 이때, 많은 이해관계자가 얽혀 있는 기업에서의 데이터 같은 경우에는, 데이터로부터 인사이트를 발견하는 실무자와, 의사 결정권을 가진 임원이나 직원이 따로 존재할 수 있을 것입니다. 따라서, 인사이트를 전달하는 입장에서는 데이터에 숨어 있던 인사이트를 쉽게 전달하고, 상대방을 설득해야 하는 입장에 있는 것입니다.
그리고, 데이터를 시각화한다면 더 쉽고 빠르게 인지할 수 있게 되는 것입니다.
예를 들어, 아래의 이미지는 한 지역의 상품 카테고리별 매출 및 이익의 수치를 나타낸 데이터입니다.
이 데이터 테이블로부터 어떤 지역과 상품 카테고리에서 손해가 나타나는지 보고한다면, 데이터를 보는 사람은 값을 하나씩 확인하며 손해가 난 값의 지역과 상품 카테고리를 확인해야 할 것입니다.
하지만 색상을 활용하여 간단한 시각화를 수행하면 어떻게 인지할 수 있을까요?
색상이라는 요소를 활용하여 데이터를 시각화함으로써, 특정 값들은 더 빠르게 인지되며, 쉽게 어떠한 범주와 지역에서 수익에 손해가 있는지 파악할 수 있습니다.
이처럼, 데이터 시각화는 사람의 시각을 자극하여 인지할 수 있는 특성들을 사용합니다. 그리고 이러한 특성을 사전 주의적 특성이라고 합니다. 이에 대해서는 다음 글에서 정리해 보겠습니다.
데이터를 시각화하는 두 번째 이유는 데이터를 분석하는 목적 그 자체에 있습니다. 데이터를 시각적으로 분석하게 되면, 데이터를 통계적으로만 분석하였을 때 발견하기 어려운 인사이트를 찾아낼 수도 있습니다.
이를 가장 잘 보여주는 사례를 소개하겠습니다.
아래의 4개의 데이터 표는 앤스컴 콰르텟(Anscombe's quartet)이라고 하는 데이터셋입니다. 통계학자인 프란시스 앤스컴(Francis Anscombe)이 데이터 시각화가 단순 경향만을 보여주는 것이 아니라는 것을 설명하기 위해 사용하였습니다.
각기 다른 x, y 좌표의 데이터로 이루어진 4개의 데이터셋이지만, 우측의 표를 보면 4개의 데이터셋은 모두 동일한 평균, 표본 분산, 상관계수 등과 같은 통계치를 포함합니다.
기본적인 통계치로는 4개의 데이터셋의 차이를 발견하기 어려워 보이지만, 만약 이 좌표 데이터를 시각화한다면 어떻게 될까요?
각 데이터를 산점도 차트로 시각화하게 되면, 각 차트의 시각적인 특성이 드러납니다. 우리는 이처럼 데이터의 시각적인 분석을 통해, 통계치만으로는 발견하기 어려웠던 데이터의 특징을 발견할 수 있는 것입니다.
본 포스팅은 전자책 - 엑셀 데이터로 실습하는 Tableau 데이터 시각화와 디자인에서 일부 발췌하였습니다.