brunch

You can make anything
by writing

C.S.Lewis

by HEARTCOUNT팀 Jul 15. 2021

HEARTCOUNT는 처음이라서

하트카운트를 처음 사용하시는 분들을 위한 안내서

하트카운트 HEARTCOUNT 기능 소개


실무자가 주체적으로(데이터 전문가의 도움을 받지 않고) 데이터에 담겨있는 유용한 패턴을 찾아 문제해결에 활용하도록 도와주는 HEARTCOUNT를 처음 사용하시는 분들을 위한 안내서입니다. 아기자기한 기능들은 스스로 발견하는 기쁨을 누리시라고 본 안내서에는 굵직굵직한 기능들 중심으로 정리하였습니다.


실무자 관점에서 데이터 분석을 전략/운영과 관련한 주요 질문들에 대한 정량적이고 확률적인 답을 찾는 과정이라고 했을 때 질문의 종류에 따른 HEARTCOUNT의 주요 기능은 아래 그림과 같습니다.

주요 지표(KPI)의 차이가 어디서(What) 크게 발생했는지, 왜(Why) 차이가 발생했는지, 어떻게(How) 지표를 최적화할지 등 질문에 따라 적절한 기능을 사용하시면 됩니다.  


0. 로그인하기

먼저, 여기를 클릭하여 하트카운트를 시작해보세요!

누구나, 구글 계정만 있다면, 무료로 모든 시각화 기능을 사용할 수 있습니다.

로그인 후 아래 방법들을 직접 따라하며 첫 분석 캠페인을 만들어보세요.


TIP1) 하트카운트는 최초 로그인시 Get Started 튜토리얼을 제공하고 있습니다. 해당 튜토리얼을 따라하며 기본적인 캠페인 생성(데이터셋 업로드) 및 시각화 방법을 익힐 수 있습니다. 튜토리얼은 우측 상단의 USER 프로필 이미지를 클릭하면 언제든 다시 재생할 수 있습니다.

TIP2) 좌측 메뉴 최상단의 LEARN탭을 클릭하여 사용에 필요한 모든 도움말/문서를 확인할 수 있습니다. 하트카운트 **커뮤니티**로도 이동 가능합니다.

TIP3) 하트카운트의 커뮤니티 DATA HERO를 적극 활용해보세요. 데이터 분석 그리고 하트카운트와 관련된 기초 강의/실습 예제/아티클 등이 공식 페이지를 통해 제공합니다. 슬랙에 가입하시면, 신규 콘텐츠 업데이트 소식을 정기적으로 전달받을 수 있으며 하트카운트 사용 관련 피드백을 가장 빠르게 받으실 수 있습니다. 다른 사용자들은 어떻게 하트카운트를 활용하고 있는지 커뮤니티를 통해 확인해보세요.




1. 캠페인 생성하기(데이터 업로드)

하트카운트에 업로드하기 좋은 데이터셋의 예시

업로드할 수 있는 데이터는 테이블 형식의 엑셀 또는 csv 파일입니다.

하트카운트는 각 칼럼(열)을 변수로 인식하여 변수 간의 관계를 분석하는 도구이기 때문에,

엑셀 데이터셋은 아래와 같은 형태를 갖추고 있어야 분석하기에 좋습니다.  

한 칼럼은 한 변수로 맞추어주세요.

첫 번째 행에는 변수명을 입력해주세요.

칼럼에 수치형 변수와 범주형 변수가 섞여 있진 않은지 확인해주세요.


데이터셋이 마땅치 않다면, 샘플 데이터셋으로 분석을 시작해보세요.

HEARTCOUNT - 캠페인 생성 - 샘플데이터셋 사용하기

캠페인 생성 단계에서 [샘플 데이터셋 사용하기]를 클릭하고 총 5개의 샘플(매출 데이터셋(Superstore), 서베이 데이터셋, HR 데이터셋, 한스로슬링 데이터셋, 타이타닉 데이터셋) 중 선택할 수 있습니다. 실습에 참고할 수 있는 USE CASE도 함께 제공합니다.


캠페인 생성에 대한 더 자세한 설명이 필요하다면,

이 문서를 참고해보세요.


+) 궁금해하실만한 정보들  

변수명_bin, 변수명_percentile이 뭔가요?

하트카운트 무료 VS 유료 뭐가 다른가요?

(강의 VOD)분석하기 좋은 데이터셋, 변수의 종류 이해하기



2. 데이터 시각화 (EDA 수행)

HEARTCOUNT - 스마트 플롯 - scatterplot을 통한 상관 관계 확인


데이터 시각화는 개별 관측값(엑셀의 레코드)이나 요약값(평균, 총합)을 점, 선, 면(도형)과 같은 시각적 요소를 사용해서 크기, 위치, 색상에 변화를 주어 표현하는 일입니다.


데이터를 시각(미학)적으로 풀어내는 일은 그 과정을 통해 데이터에 대한 호기심을 키울 수 있고 데이터에 담긴 패턴에 대한 보다 직관적인 이해를 가능하게 해준다는 순기능도 있지만 몇 가지 주의할 점도 있습니다.


대표적으로 아래 두 가지를 꼽을 수 있습니다.

1. 수동 분석의 한계(시간과 가설의 제약)로 인해 제한된 시간 안에 몇가지 뻔할 수도 있는 가설들을 시각적으로 살펴본 후 해당 가설을 검증하는 수준에서 그치기 쉽다.  

2. 동일한 시각화 결과에 대해 다양하고 분분한 해석이 가능하여 의사결정에 실질적인 도움이 되지 못한다.


하트카운트의 대표적인 데이터 시각화 기능인 스마트플롯은 데이터 시각화의 보편적인 문법을 따르고 있고, 데이터에 담겨 있는 질서를 찾고자 하는 호기심만 있다면 어렵지 않게 스스로 사용법을 익힐 수 있습니다. 필요하면 아래 사용법 정도를 참고하면서 직접 사용해 보시면 좋겠습니다.


스마트 플롯을 통해 데이터를 이리저리 살펴보는 EDA 작업(Exploratory Data Analysis)을 수행해보실 수 있습니다. 대표적인 기능을 각각의 관련 가이드/활용 사례와 함께 살펴 보세요.  

Scatterplot을 이용한 두 변수(X, Y) 간의 상관 관계 확인하기

Boxplot, 신뢰구간을 이용한 불확실성 확인하기

시간의 흐름이 담긴 데이터에서 계절성 파악하기

EDA에 대하여 with Hansrosling dataset




3. KPI(주요 지표) 자동 분석 


EDA를 통해 데이터셋을 충분히 파악했다면, 내가 중점적으로 보고 싶은 혹은 우리 조직의 지표(Metric)인 변수를 KPI로 설정해보세요. (ex. 매출, 성과 점수 등)


KPI 등록 및 자동 분석은 '캠페인 저장' 버튼을 클릭하여 캠페인을 계정에 저장한 후 가능합니다. 무료 사용자의 경우 'Upgrade' 버튼을 클릭하여 크레딧(캠페인 1개 = 크레딧 1개)을 충전/유료 결제 하거나 1개월 무료 체험을 통해 15개의 크레딧을 사용해보세요.


KPI 등록 후 아래와 같은 기능을 이용해보시는 것을 추천드립니다.


SMART DISCOVERY_하트카운트의 추천 확인하기

어디서부터 분석해야 할 지 모르겠다면, 대시보드의 Smart Discovery를 확인해보세요. HEARTCOUNT는 자체 SMART DISCOVERY 엔진을 통해 사용자가 설정한 KPI에 대해 모든 경우의 수로 분석한 후 괄목할만한 주요 결과들과 주어진 KPI를 최대화할 수 있는 조건을 알려드립니다.





대체 매출이 왜 갑자기 떨어진건데? Why_ KPI의 변화에 영향을 끼친 요인 알아보기

'요인 분석'과 '익스플레이너' 기능을 통해 KPI의 변화 요인으로 어떤 변수들이 작용했는지 통계적 수치와 함께 확인해보세요.


요인 분석 화면에서는 선택된 KPI(medical_cost)에 대해 변수 하나(단순회귀), 변수 두개의 조합(다중회귀)으로 회귀분석을 각각 수행하여 통계적으로 유의미한 결과를 중요도(Adjusted R²) 순으로 보여 드립니다.  


선형회귀 분석에 대해 보다 자세히 알고 싶으면 여기 클릭


참고) 표에 나온 통계 개념
• R²(결정계수): 종속변수(KPI)의 차이를 설명하는 정도를 나타내는 통계치; 아래 그림에서는 흡연여부(smoker)와 나이(age_bin)가 의료비 청구금액(medical cost) 차이 중 72% 설명할 수 있다는 의미.
• Adjusted R²: R²값을 변수의 갯수와 분석 대상 레코드 갯수 등을 반영하여 조정한 값
• P-Value: 해당 분석 결과가 우연에 의한 결과일 확률 (통상 0.05보다 낮으면 우연히 해당 패턴이 나왔을 확률이 5%보다 작으므로 통계적으로 유의미하다고 봄)



만약 통계적 수치가 아직은 부담스럽다면 익스플레이너 기능을 활용하시면 좋습니다.

익스플레이너는 요인 분석 결과를 어려운 통계적 개념을 걷어 내고 일상의 언어로 KPI의 차이를 가져오는 주요 요인을 설명해 드립니다.


[ 익스플레이너 (Explainer) ]

1. 설명(narrative)가 담긴 창 상단의 화살표를 통해 원하는 패턴(요인)으로 바로 이동
2. [Generate New Narrative] 클릭하면 주어진 요인에 대한 다른 관점의 설명 제공
3. [Change Visualization] 클릭하면 다른 시각화 방식으로 데이터 표현

* 익스플레이너 동영상을 보려면 클릭



그럼 어떻게 개선시킬거야? How_KPI 최적화 방법 확인하기

Why에 대한 대답을 데이터를 통해 완성했다면, 이번엔 How를 데이터를 통해 알아볼 차례입니다. 의사결정나무 알고리즘을 활용한 '마이크로 세그먼트' 기능을 통해, KPI의 최소화/최대화 방법을 알아볼 수 있습니다.


decision tree는 서로 다른 두 집단을 분류(classify)하는 규칙을 만들기 위해 사용되는 대표적 기계학습 알고리즘 중 하나입니다.


예를 들면, 특정 마케팅 캠페인에 반응을 한 집단(response=yes)과 반응하지 않은 집단(response=no)을 구분하는 규칙을 만들어 반응할 확률이 높은 집단을 타게팅하는 일에 사용할 수 있습니다. 이익을 최적화하고자 하는 경우 이익 기준으로 상위 20%와 하위 20% 두 집단으로 나누어 두 집단을 분리하는 규칙을 만든 후 상위 20% 분류 규칙을 활용하여 이익을 최대화할 수 있습니다.


해당 알고리즘에 대해 좀더 자세히 알고 싶으면 클릭(영문)


이외에도 두 집단의 차이를 자동 생성되는 수치 및 시각화 차트를 통해 비교 분석할 수 있는 비교분석, 데이터간의 유사도를 확인할 수 있는 스마트 서치 등 다양한 기능들이 있으니 직접 로그인하여 경험해보세요!

HEARTCOUNT - 비교분석 -  임의의 두 집단을 설정하여 어떤 차이가 있는지 비교 분석해보기





실무자를 위한 데이터 자동 분석 솔루션, 하트카운트 사용해보기
여기를 클릭해주세요.
기타 참고할 만한 내용들
- HEARTCOUNT 유튜브
- HEARTCOUNT 사용 가이드
- 기초 이론 강의 VOD, 실습 예제 등 데이터 분석 학습 사이트


하트카운트 뉴스레터 구독하기는 여기를 클릭해주세요.

하트카운트 도입, 견적 및 구축 문의는 여기를 클릭해주세요.
(협업 문의는 support@idk2.co.kr로 부탁드립니다.)

하트카운트 데모 비디오는 여기를 클릭해주세요.

여기를 클릭하여 데이터 분석/시각화 커뮤니티 '데이터 히어로'에 참여하세요.

작가의 이전글 설문(서베이) 데이터 분석
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari