feat. 태블로, 계산필드 만들기 / 함수 활용
안녕하세요, 브래드입니다.
오늘은 데이터 시각화 툴인 태블로에서 우리가 보고 싶은 데이터를 계산 필드를 활용하여 직접 만들어보고, 함수를 함께 공부해볼게요.
계산필드는 데이터 원본에는 없는 컬럼인데, 새로운 컬럼을 추가함으로써 데이터를 좀 더 풍부하게 만들어줄 수 있는 기능입니다.
계산필드를 시작할 수 있는 방법은 두 가지가 존재합니다. 첫 번째 방법으로는 데이터 패널의 빈 공간에서 우클릭하면 계산된 필드를 만들 수 있는 창이 나옵니다.
두 번째 방법은 데이터 필드 윗부분에 세모를 눌러서 계산된 필드 만들기를 클릭하여 창을 나오게 하는 것입니다. 보통 이 방법을 많이 사용합니다.
계산필드 창을 만들면 다음과 같은 이미지처럼 메모장 같은 창을 볼 수 있습니다.
제목 수정도 가능하고, 제목 아래에 빈 공간에는 우리가 직접 수식을 입력하는 공간입니다. 그리고 오른쪽에 있는 세모를 눌러 함수 식을 불러올 수도 있습니다.
계산필드를 활용하여 상품이익률을 만들어보겠습니다. 상품이익률 혹은 매출 등 각 회사마다 구하는 방법이 상이하므로 참고해주시면 좋을 것 같습니다.
상품이익률을 구하기 위해 예시에선 상품이익과 매출을 각각 가져와줍니다. 직접 타이핑하거나 컬럼명을 가져오는 것도 하나의 방법입니다.
태블로에서 나눗셈을 할 때, 집계된 결과로 진행해야 하므로 각각을 SUM을 씌워서 계산을 진행해줍니다.
위에서 계산필드를 활용하여 상품이익률 식을 만든 후, 생성된 컬럼을 측정값에 옮겨 값을 보려고 했는데 확인해보니 상품이익률이 0으로 나오는 것을 볼 수 있습니다.
이는 태블로는 디폴트가 정수이기 때문입니다. 따라서 %로 바꿔주는 작업이 필요합니다.
따라서 데이터 패널에서의 상품이익률을 우클릭하여 - 기본 속성 - 숫자형식 - 백분율을 들어가 소수 자릿수를 0으로 만들면 우리가 원하는 %를 확인할 수 있습니다.
본격적으로 태블로에서 자주 활용하는 함수에 대해 학습해보겠습니다. 먼저 매출을 만 원 단위로 볼 수 있게 계산필드를 활용하는 방법을 알아볼게요.
제목을 알아보기 쉽도록 매출(만 원)로 수정해주고, 필드에 (매출)/10000을 입력하여 측정값 컬럼을 새로 생성해줍니다.
이후 컬럼을 시트에 드래그하여 매출(만 원) 컬럼을 확인할 수 있습니다.
만 원 단위로 매출을 구했는데, 뒷부분에 굳이 보고 싶지 않은 원 단위까지 나온다면 해당 단위를 지워주고 싶은 생각을 가질 수 있습니다.
따라서, 깔끔하게 반올림을 진행하기 위해선 매출(만 원) 칼럼 우클릭 - 편집 - 계산식 입력을 진행해줍니다. 계산식은 ROUND(SUM(매출))/10000,-1) 을 입력하여 반올림을 진행해줍니다.
우선 반올림 함수는 ROUND 함수이므로 직접 입력하거나 함수 검색을 진행하여 생성해줍니다. 그리고 여기서 중요한 점은, 각각의 원본 형식이 아닌 집계된 매출 값에서 10000으로 나누고 반올림을 진행해야 하므로 매출에 SUM을 진행해줘야 합니다.
또한, 10의 자리 반올림을 위해선 끝 인수에 -1을 입력해줘야 합니다.
추가로 SUM과 SUM의 이중 집계 등은 태블로에서 에러로 받아들이기 때문에 계산 필드 작성 시에 유의할 필요가 있습니다.
다음 예시로 상품명을 포함하는 식을 만들어보겠습니다. 이를 위해선 먼저 CONTAINS 함수를 활용하여 문자열에 부분 문자열이 포함되어 있으면 TRUE를 반환하도록 만들어줍니다.
그리고 IF 및 THEN, ELSE IF, ELSE(앞서 작성한 조건들에 아무것도 걸리지 않으면 이걸로 반환해줘라는 뜻), END를 입력하여 식을 완성해줍니다.
위 이미지에서 수식 첫 줄과 두 번째 줄을 해석하면 '만약에 상품명에 깜찍이 들어가 있으면 깜찍 컨셉을 반환해주고, 그렇지 않고 기본이 들어가 있으면 기본 아이템으로 반환해줘'라고 해석할 수 있습니다.
각각의 상품 개수를 확인하는 식을 만들기 위해선 COUNTD 함수를 활용해야 합니다. COUNTD는 COUNT와 다르게 중복 값을 포함하지 않기 때문에 고유한 값을 확인할 수 있습니다.
이번에는 연령대별 매출액을 확인하는 데 NULL 값이 보이는 것을 알 수 있습니다. NULL로 보이는 값을 NA로 바꿔주기 위해 계산필드를 활용해보겠습니다.
AGE BAND가 NULL이면 NA로 바꿔주는 계산식 작성을 위해 IFNULL 함수를 활용해줍니다. 전체 식을 작성해보면 IFNULL((AGE BAND), 'NA')로 작성할 수 있습니다.
특히 NA는 문자이므로 반드시 NA를 작은따옴표로 감싸줘야만 올바른 계산이 진행됩니다.
연령 뒤에 '~세'를 추가해주기 위해선 계산 필드를 다시 열어 +로 '세'를 이어줘야 합니다.
태블로에서는 +가 이어주는 기능을 한다고 생각하면 됩니다.
계산필드를 활용하여 각 연령대별로 묶은 후 값을 확인할 수도 있습니다.
각 연령대별로 묶기 위하여 IF를 활용하여 다음과 같이 식을 작성해줄 수 있습니다.
IF (AGE BAND) = '20~24' THEN '20대'
ELSEIF (AGE BAND) = '25~29' THEN '20대'
ELSEIF (AGE BAND) = '30~34' THEN '30대'
ELSEIF (AGE BAND) = '35~39' THEN '30대'
ELSEIF (AGE BAND) = '40~44' THEN '40대'
ELSE 'NA'
END
20대, 30대, 40대 별로 묶은 후 여기에 해당되지 않는 값은 NA로 설정하고 마지막에 END를 입력하여 수식을 완성해줍니다.
이를 통해 각 연령대별로 묶은 데이터를 확인할 수 있습니다.
지금까지 데이터 시각화를 위한 태블로에 대한 학습으로, 태블로 내에서 계산 필드를 직접 다뤄보고 함수를 활용해보는 시간을 가져보았습니다.
다음 시간에도 이어서 태블로 함수에 대해 함께 공부해보겠습니다.
브래드였습니다. 감사합니다.