데이터에서 인사이트를 도출하는 기술 - 크기, 추세, 관계, 비
곧바로 핵심을 요약하여 말씀드리면,
데이터에서 인사이트를 도출하는 데이터 분석 선택지 차트는 다음과 같습니다.
제가 강조하는 데이터 분석의 목적, “무엇을 말하고자 하는가”에 대한 질문에 답변할 수 있으신가요?
그렇다면 이제 여러분들은 데이터에 맞는 시각화 차트를 선택할 차례입니다.
우리가 바라보는 데이터에서 인사이트를 도출하는 방법은 크게 4가지가 있습니다.
크기, 추세, 관계(종종 편차), 그리고 비율이 그것입니다.
각 방법은 다시 데이터를 서로 더하거나(+) 빼고(-), 기준을 제시하거나, 다시 그룹으로 나누는 등의 방법을 사용합니다. 때로는 강조나 예측 등의 기법을 쓰기도 합니다. 우리는 데이터 분석 리포트 작성방법 매거진의 "데이터에서 인사이트를 찾아라" 아래 콘텐츠에서 이 4가지 기술에 대해 알아보았습니다.
https://brunch.co.kr/@writerjeong/212
매출액이나 방문고객수와 같은 데이터의 크기를 ①"비교" 할 것인지, 아니면 시간에 따른 판매량이나 재고의 변화 ②"추세"를 파악할 것인지, 아니면 두 가지 서로 다른 변수나 특성 간의 ③"관계" 또는 분포를 볼 것인지, 그리고 전체를 구성하는 데이터의 ④"비율"을 보여줄 것인지 결정해야 합니다. 이때, 데이터별로 단 하나의 시각화 방법만 있지 않고, 다양한 방법을 융합해서 표현할 수도 있습니다.
지난 콘텐츠가 이러한 개념에 집중했다면, 이번에는 크기 / 추세 / 관계 / 비율 4가지 방법에 대한 데이터 분석 템플릿 파일을 통해 학습해 보겠습니다.
첫 번째는 “크기”입니다.
샘플로 들어있는 데이터는 어느 회사의 2024년 분기별 제품 매출금액입니다.
앞으로 분석결과에 대한 예시는 목적(Purpose) , 제목(Title) , 인사이트(Insight) 순으로 표준화하여 정리해 드리겠습니다.
- 목적(Purpose) -
데이터 시각화의 목적은 회사에 있는 두 가지 제품이 연간 매출과 분기 매출 목표를 모두 초과 달성했다 고 어필하기 위함입니다. 목적이 명확하다면 매출액의 크기를 비교해야 하는데요. 크기 비교에 가장 효과적인 막대그래프를 사용하였습니다.
- 제목(Title) -
템플릿 활용을 위해 가장 상단부터 설명드리면, 맨 위에는 제목이 있는데요. 차트나 그래프의 제목은 데이터, 기간, 목적을 묶어서 써주시면 됩니다. 예시처럼 2024년(기간) + 분기별 제품 매출금액(데이터) + 비교(목적)입니다.
- 인사이트(Insight) -
다음은 말하고자 하는 바에 대해 데이터가 의미하는 "있는 그대로의 사실"을 적어주는 부분입니다.
기본적으로 데이터 분석 결과는 "데이터를 보고 알 수 있는 사실"을 전달합니다. 이때 A데이터는 B 데이터의 1.5배라는 식의 구체적 수치를 활용한 비교, 최대(Max)/최소(Min) 시점, 평균 등의 통계를 비교하는 것이 좋습니다.
또한 이 부분에서는 데이터에서 표현하지 못하는 부분을 숫자로 담는다면 더욱 효과적입니다. 예를 들어, 위 차트는 분기별 매출액을 표현할 수 있지만, 전체 매출액 합계는 표현할 수 없습니다. 따라서 각 제품별 연간 매출 총액을 표현하면, 추가적인 정보를 제공할 수 있습니다. 여러분들만의 데이터로 바꿔주시면서 시각화 템플릿을 활용해 보시기 바랍니다.
두 번째는 추세입니다.
제가 가지고 온 샘플은 서울시의 편의점수 데이터인데요.
- 목적(Purpose) -
분석의 목적은 서울시의 편의점의 수가 증가했다는 메시지를 전달하기 위함입니다.
- 제목(Title) -
앞서 진행했던 순서대로 먼저 데이터 분석 목적에 맞는 제목을 설정합니다.
제목은 데이터(연도별 서울시 편의점수) + 목적(증감 추세) + 기간(2006~2021)을 설정합니다.
- 인사이트(Insight) -
다음은 메시지 부분인데요. 데이터 분석의 결과로 편의점수가 계속 증가하는 추세를 관찰할 수 있듯이 기간 내 4배가량 증가했고, 해당 수치 데이터를 다시 한번 요약해서 강조하는 방식을 사용했습니다.
수치를 나타나내는 부분의 색상인데요. 눈치채셨나요?
앞선 막대그래프에서도 마찬가지였지만, 차트에 보여진 데이터와 같은 색상을 사용하고, 왼쪽/오른쪽을 2006/2021년 순서로 배치되게 끔하여 색상과 위치의 게슈탈트의 원리 중, 유사성을 적용한 것입니다. 이처럼 데이터를 표현하는 기술에 대해서는 다음 칼럼을 참고해 주시면 감사하겠습니다.
https://brunch.co.kr/@writerjeong/227
세 번째는 관계의 대표 사례입니다.
예제로 가지고 온 데이터는 월별 제품의 판매수량입니다.
- 목적(Purpose) -
이번 분석의 목적은 무엇일까요?
데이터 분석의 목적은 각 제품별 판매수량에 대한 분기별 상관관계를 분석하기 위함입니다. 데이터로 설명할 수 있는 관계는 상관관계가 대표적입니다. 그리고 데이터의 평균과 흩어진 정도인 분산과 편차를 통해 분포를 확인할 수 있습니다. 이때 데이터(변수)가 둘 이상의 항목을 가진다면 둘의 관계를 파악할 수 있습니다.
- 제목(Title) -
제목은 기간(2024)년 + 데이터(월별 제품 판매수량) + 목적(분기별 상관관계)입니다.
- 인사이트(Insight) -
데이터 분석 결과는 올해 월별 제품 판매수량에서 제품 2와 제품 3의 상관관계가 있음을 언급합니다. 특히 이 보고서에서는 2분기를 주목해보고 있는데요. 평상시와 다르게 4, 5, 6월에는 제품 2와 제품 1의 상관관계가 눈에 띄게 보입니다. 이러한 결과를 바탕으로 홍보, 마케팅, 상품 배치 등 다양한 전략으로 연결할 수가 있습니다.
마지막은 비율 그래프입니다.
이번 예제는 제품별 판매량에 대한 변화를 연도별로 조사한 데이터입니다.
- 목적(Purpose) -
데이터 분석의 목적은 회사 전체 제품 판매량 중에서 제품별 비율이 어떻게 변화했는지를 확인하기 위한 그래프입니다.
- 제목(Title) -
제목은 데이터(제품별 판매량) + 목적(비율 변화) + 기간(2020~2023)을 고려하여 다음과 같이 만들어주었습니다. 제목에 포함되는 분석의 목적은 제품별 판매량의 연도별 비율 변화를 파악하기 위함입니다.
- 인사이트(Insight) -
2020년부터 2023년까지 제품별 판매 비율의 변화를 보여줍니다. 이때 증감을 직접적으로 분석하는 대상인 제품 1을 맨 아래 배치한 점에 주목해 주시기 바랍니다. 누적막대그래프에서 맨 아래 영역은 주목하고자 하는 대상이 되어야 합니다. 왜냐하면 기준 0에서 출발하는 유일한 영역이기 때문이니다.
이렇게 강조되는 데이터에 대해 증가세를 추가로 파악하고, 그래프에서는 알기 어려운 데이터인 구체적 수치, 최종 판매량 및 매출금액을 추가해 주었습니다.
이상 우리는 데이터에서 인사이트를 도출하는 4가지 방법에 대해 이해하고 실습을 진행했습니다. 언제나 여러분들께서 가장 먼저 해야 할 일은 "무엇을 말하고자 하는지?"에 대해 정의하는 것입니다. 그리고 크기, 추세, 관계와 편차, 그리고 비율 중에서 어떻게 보여줄 수 있는 지를 선택하면 됩니다. 그에 따라 오늘 배운 내용과 엑셀 템플릿을 바탕으로 본인 만의 데이터를 활용하여 시각화를 완료할 수 있습니다. 그 방법은 단 한 가지만 존재하는 것이 아니며, 4가지를 다양하게 융합하여 선택할 수 있수도 있습니다.
정리하면, 무엇을 말하고자 하는가? 목적을 설정하고, 크기, 추세, 관계, 비율을 파악하기 위해서, 데이터들을 서로 더하고 빼고 나누고 나름의 기준을 수립해서, 의사결정에 정말 도움이 되는 시각화 리포트틀 만드시기 바랍니다. 감사합니다.