brunch

You can make anything
by writing

C.S.Lewis

by Desearch Lab Mar 02. 2023

연속형과 불연속형

날짜 데이터로 라인 차트 그리기

데이터의 또 다른 구분 방법은 연속형과 불연속형입니다.

이전 포스팅에서 데이터를 차원값과 측정값으로 나누어 볼 수 있었습니다.

이번에는 새로운 데이터 분류 방식인 연속형 - Continuos와 불연속형 - Discrete을 이야기해 보겠습니다.


태블로에서는 연속형 값을 초록색으로 구분하고, 불연속형 값을 파란색으로 구분합니다.

연속형과 불연속형 데이터


위의 이미지로부터 매출, 이익, 수량과 같은 측정값은 연속하며,

카테고리, 지역, 고객 이름과 같은 차원은 불연속 하는 것을 알 수 있습니다.


하지만 이게 끝일까요?

얼핏 모든 차원값은 불연속형이며, 측정값은 연속형이라고 생각할 수 있지만, 차원과 측정값을 각각 불연속형과 연속형 데이터로 활용하는 경우가 많은 것이지, 꼭 차원값은 불연속형이며 측정값은 연속형이진 않습니다.


태블로에서도 불연속형 데이터와 연속형 데이터를 서로 변경하는 것이 가능합니다.

불연속형 데이터를 연속형으로 변경

연속형 데이터 또한, 불연속형으로 변경하는 것이 가능합니다.

연속형 데이터를 불연속형으로 변경


날짜 데이터로 라인 차트를 그려보며 태블로 안에서 연속형과 불연속형 데이터의 차이를 알아보겠습니다.

날짜는 연속형과 불연속형 데이터로 활용될 수 있습니다.


먼저 불연속형의 날짜 데이터입니다.

열에 날짜 데이터를 올린 후, 행에 매출의 합을 집계한 필드를 올렸습니다.

날짜 데이터를 행이나 열에 올리게 되면 태블로에서는 자동으로 year로 집계를 시작합니다.


파란색으로 표시된 날짜 데이터는 불연속형입니다. 

불연속형 날짜


날짜 데이터 필드를 오른쪽 버튼 클릭하면 년, 분기, 월, 일, 주차, 요일, 시간, 분, 초 등의 단위로 설정할 수 있습니다. 그런데 특이한 것이 동일한 년, 분기, 월, 일이 아래 이미지처럼 반복되어 나타납니다.


현재 상단의 year에 선택되어 있는데, 하단의 year를 선택해 보겠습니다.

날짜 데이터의 다양한 설정


그래프의 모양은 달라진 것 같지 않습니다. 하지만 차트가 갑자기 가로로 늘어난 것을 볼 수 있습니다.

축이 길어진 게 불연속형과 연속형의 차이일까요? 정확히는 불연속형 데이터가 열에 사용되었을 때는 머리말 - Header로 사용되었지만, 연속형 데이터가 열에 사용되었을 때는 머리말과 축 - Axis의 역할을 합니다.

축은 연속형 데이터가 구성할 수 있는 것입니다.

축과 관련된 기능은 향후 더 자세히 다뤄보겠습니다.


또 다른 차이는 없을까요?

이번엔 분기별 날짜 데이터로 비교해 보겠습니다.

마찬가지로 파란색 분기 필드는 불연속형이며, 초록색 분기 필드는 연속형입니다.

불연속 분기 데이터와 연속 분기 데이터


이번엔 차트의 차이점이 확실하게 보입니다.

불연속형 분기 날짜 데이터는 1분기, 2분기, 3분기, 4분기의 머리말을 볼 수 있지만,

연속형 분기 날짜 데이터는 각 연도별 1-4분기가 이어지고 있습니다.


날짜 데이터 설정 상단에 있는 년, 분기, 월, 일은 각각의 날짜를 분리하여 표현하지만, 하단의 날짜 데이터는 말 그대로 연속하는 시간으로써 표현하고 있는 것입니다.


연속형과 불연속형 이야기를 잠시 접어두고, 이번엔 새로운 그래프를 그려보겠습니다.

분기별 매출이 어떻게 상승하고 하락하는지는 확인하였는데, 이를 카테고리별로도 나눠볼 수 있을까요?


카테고리 필드를 마우스로 끌어당겨, Marks의 Color 카드 위로 올려줍니다.

이제 카테고리별 매출 데이터를 동시 그려주는 라인 차트를 제작하였습니다.

카테고리를 색으로 구분한 라인 차트


차원에 대한 설명을 기억하시나요?

차원은 측정값을 묶어줍니다.

여기서 우리는 행과 열에 올린 필드들이 집계하는 시각화한 데이터를, 마크에 새로운 차원을 올림으로써 차원이 포함하고 있는 카테고리별로 측정값을 묶어줄 수 있다는 것을 알 수 있습니다.


이어서 바로 새로운 차트를 제작해 볼까요?

오른쪽에는 Show Me라는 메뉴가 있습니다.

이 메뉴를 클릭하면 다양한 샘플 차트들이 나타나고, 해당 차트를 그리기 위해 필요한 데이터 종류와 수를 설명하고 있습니다.


여기서 영역 차트를 클릭합니다.

영역 차트

알록달록한 영역차트가 완성되었습니다.


이처럼 태블로는 다양한 방법으로 데이터를 시각화하며, 사용자가 데이터를 새로운 시각으로 볼 수 있도록 도와줍니다.


물론 모든 시각화가 효율적이라고 말하긴 어렵습니다. 영역차트만 하더라도 각각 카테고리의 구성 비율을 확인하는 것이 어려우며, 총매출의 추이를 확인하는 중, 대략저인 카테고리의 비중을 확인하는 목적으로 시각화하는 것이 적합할 것입니다.


하지만 태블로의 가장 큰 장점은, 우선 해볼 수 있다는 것입니다. 이 시각화 방법이 효율적이지 않을지 알기 어렵다 하더라도, 쉽게 만들어 직접 보고 판단할 수 있습니다.


이번 포스팅에서는 연속형 데이터와 불연속형 데이터 차이를 설명드리며, 바로 라인차트와 영역차트까지 그려보았습니다. 굵직한 내용을 중심으로 이야기하였습니다만, 연속형과 불연속형 데이터의 활용도는 정말 다양합니다.


이미 태블로를 자유롭게 만져보신 분들 중엔, 사실 연도와 분기를 함께 표현한 연속형 날짜 데이터도 불연속 하게 설정할 수 있다는 것을 알았을 것입니다. 하지만 이러한 내용은, 앞으로 각각 데이터의 활용도를 이야기하면서 자연스럽게 알아가게 될 내용으로 너무 걱정하지 않으셔도 괜찮습니다.


현업에서는 태블로를 데이터 분석과는 조금 다른 목적인 대시보드 화면 개발 도구로써도 활용합니다. 실제 데이터를 데이터로서 활용하는 것이 아닌, 각각의 필드를 개발 코드처럼 활용하여 원하는 화면을 구현할 수 있다는 것입니다. 이런 경우에는 연속형 데이터를 고의로 불연속형으로 사용하여 원하는 화면을 구현해야 할 수 있는 것이죠.


제가 태블로 개발자로서 연속형과 불연속형을 이해하고 활용하는 방법은, 각각의 데이터를 하나씩 분리되는 데이터, 혹은 이어지는 데이터로써 이용할 것인가에 대한 여부라고 할 수 있습니다.

데이터 자체가 불연속형이거나 연속형을 띠는 것이 아닌, 데이터를 활용해 시각화를 개발하려는 개발자가 이 데이터를 어떻게 활용할 것인지에 대해 생각하는 것이죠.


이후 포스팅을 통해 개발 도구로서의 태블로 또한 설명드리겠습니다.


                    

작가의 이전글 태블로에 데이터 연결하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari