EP 01. 비즈니스 데이터 분석의 기초
[소셜벤처 201 아카데미]는 소셜벤처, 비영리기관 등 임팩트 조직의 실무 역량 향상을 위한 프로그램입니다. 기초 이론이라고 불리는 101을 넘어, 실무에 바로 적용 가능한 직무 기술과 성장 단계에 있는 조직에서 고민할법한 이슈를 '비즈니스 201/ 매니저십 201/ 조직문화 201' 세 가지 모듈로 나누어 다룹니다.
갈수록 데이터의 중요성이 커지고 있다. 데이터 활용은 비즈니스의 필수가 되었지만, 정작 방법을 몰라 헤매는 실무자들이 많다. 이들의 니즈를 충족시켜줄 <비즈니스 성장을 위한 고객 데이터 분석과 활용> 세미나가 헤이그라운드에서 열렸다. 이번 기회에 데이터를 체계적으로 관리해보려는 임팩트 조직 관계자들이 강의실을 가득 채웠다.
세미나는 두손컴퍼니의 강민구 마케팅 팀장이 맡았다. 두손컴퍼니는 현재 ‘이커머스 셀러 맞춤형 물류서비스’인 품고(www.poomgo.com)와 ‘크라우드펀딩 전문 배송 서비스’인 두윙(www.do-wing.com)을 운영하고 있다.
이번 세미나는 3회 차로 진행되었다. 1회 차에서는 데이터 분석 기초와 이론을 통해 데이터를 마케팅에 활용하는 방법. 2, 3회 차에서는 구글 애널리틱스, 구글 태그 매니저, 구글 스프레드시트와 같은 툴을 활용한 데이터 분석을 다룰 예정이다.
간호사로 잘 알려진 나이팅게일은 통계학자이기도 하다. 나이팅게일은 크림전쟁 중 부상으로 인한 사망자보다 병원의 열악한 위생환경으로 인한 사망자가 더 많다는 것을 알게 되고, 이를 개선하기 위한 예산을 마련하고자 했다. 처음에는 글과 표를 이용해 의회 의원들에게 알렸으나 설득은 쉽지 않았다. 그래서 나이팅게일은 더 효과적으로 통계를 전달하고자 로즈 다이어그램을 개발했다. 아래 사례에서 볼 수 있듯이 테이블 형태의 데이터보다 시각화한 형태의 데이터가 설득력이 높다.
이어서 강민구 팀장은 비즈니스 상황을 데이터로 보려는 태도 & 보는 사람이 어떻게 하면 이 데이터를 쉽게 이해할 수 있을까에 대한 고민이 필요하다고 말했다.
데이터는 기본적으로 테이블(Table)이다. 데이터 분석을 하려면 테이블의 형태가 아닌 것도 테이블로 만들어야 한다. 테이블은 행(Row)과 열(Column)으로 구성된다.
-행(Row): 관측이 이루어지는 관측 대상들의 집합
-열(Column): 관측 대상들을 데이터로 정의하는 관측 항목
행은 세로로 이어지만 가로로 묶이고, 열은 가로로 이어지지만 세로로 묶인다. 데이터 분석을 위해서는 우선 행과 열의 개념을 잘 정립해두어야 한다.
데이터 분석은 일반적으로 다음 네 단계의 프로세스를 거친다.
1. 문제 규명 (Identify)
2. 데이터 수집 (Collect Data)
3. 데이터 분석 (Analyze Data)
4. 개선 방안 도출 (Improve)
강민구 팀장은 첫 단계 '문제 규명'의 중요성을 강조했다. 데이터를 시각화하려고 할 때는 ‘내가 이 그래프에서 무엇을 보여주고 싶은지’가 중요하다. 문제에 대한 분명한 관점이 없으면 ‘그래서 이 그래프로 말하고 싶은 게 뭐지?’ 하는 결과를 낳게 된다.
테이블을 만들 때는 ‘어떻게 하면 데이터를 시각화하기 쉬울까’를 고민하는 것이 좋다.
위 예시를 보면, 좌측 테이블보다는 연도를 Column Index로 빼낸 우측 테이블이 그래프로 나타내기 좋다.
데이터를 받으면 무턱대고 분석을 시작하는 경우가 많다. 그런데 Raw data를 받았을 때 이 데이터의 변수가 어떤 형태인가 판단하고 분석하면 훨씬 빠르고 쉽고 정확하게 분석할 수 있다. 변수는 크게 범주형 변수와 수치형 변수로 나눠볼 수 있다.
1. 범주형 변수: 일정한 개수로 정해진 값.
시군구, 성별, 연령대, 국가 이름 등이 해당되며, 막대그래프나 원그래프로 나타내기 쉽다.
막대그래프는 데이터의 빈도와 양의 절댓값을 보여줄 때, 원그래프는 전체량에서 변수별로 상대적인 차이를 보여줄 때 유용하다.
2. 수치형 변수: 숫자로 된 값.
수치형 변수는 다시 이산형 자료와 연속형 자료로 나눠볼 수 있다.
이산형 자료: 일정 기간 동안 발생한 발생 횟수 등 (예: 출생 횟수)
연속형 자료: 온도, 신장, 체중, 혈압 등 연속적인 값을 갖는 데이터
수치형 변수는 Boxplot과 히스토그램으로 시각화하기 좋다. (Boxplot은 최댓값, 최솟값, 중앙값, 특이값, 75% 값, 25% 값 등을 보여준다. 히스토그램은 막대그래프와 비슷하지만 히스토그램은 막대가 서로 붙어 있어서 선 그래프처럼 데이터의 연속성을 파악하기 쉽다.)
강민구 팀장은 통계 기초에 대한 설명을 이어갔다. 모집단은 분석하고자 하는 모든 데이터의 총집합을 말한다. 모집단 전체를 분석하는 것이 가장 정확한 결과를 얻을 수 있지만, 모집단이 지나치게 방대한 경우 모집단의 특성을 대표하는 집단을 만들어 사용하기도 하는데, 이를 표본집단이라 한다. 표본집단 추출방법은 두 가지가 있다.
1. 확률 표본 추출 방법
무작위로 표본을 추출하는 방법으로, 모집단을 대표할 가능성이 높다.
2. 비확률 표본 추출 방법
분석자가 임의로 데이터를 선택하여 추출하는 방법으로, 분석가의 판단이 개입되어 모집단을 대표하지 않을 가능성이 높다.
기술(Descriptive) 통계: 수집한 데이터를 요약·묘사·설명하고 대상들의 속성을 파악하는 것이다. Boxplot (위 이미지 참고)이 대표적인 기술 통계에 해당한다.
추리(Inferential) 통계: 수집한 데이터에서 표본을 추출하고 특성을 파악하여 모집단의 특성을 유추하는 것이다. 추리 통계의 대표적인 예시로는 여론조사와 선거 출구조사가 있다.
정리하자면, 기술 통계는 해석이고, 추리 통계는 예측이다.
기술 통계는 문제 기반으로 분석하는 것이 효과적이다. 우선 문제가 무엇인지, 문제가 발생한 배경은 무엇인지 찾아보는 것이다. 제일 처음에 중요하다고 했던 이야기와 같은 맥락이다.
다음으로는 가설을 세워보는 것이 좋다. 예를 들어 와이셔츠 판매량 감소의 원인을 분석한다고 할 때, ‘성인 남성의 비만율 증가’가 원인이라는 가설을 세웠다면 관련 데이터만 분석해보면 되지만, 가설이 없다면 수많은 데이터를 분석해야 하는 비효율이 발생한다.
비즈니스 목표에 대한 명확한 정의와 지표 설정이 되어있지 않으면 데이터 분석의 방향을 잡기가 어렵다. 강민구 팀장은 비즈니스의 명확한 목표 설정을 위해 OKR과 KPI를 설정할 것을 추천했다.
*OKR에 대해 더 자세히 알고 싶다면 (링크) 클릭!
-OKR: Objective(목표) + Key Results(핵심 결과)
Objective는 꿈에 가까운 최상위 목표이며 Key Results는 목표를 달성하기 위한 핵심 결과를 의미한다.
-KPI(Key Performance Indicator): 기업이나 조직의 목표 달성과 전략을 위한 핵심 성과지표
다음으로는 지표에 대해 다루었다. 데이터 분석에 유용한 지표는 어떤 지표일까?
1. 비교 가능한 지표.
쇼핑몰 방문자 수를 분석하려 한다면 이번 달과 저번 달의 방문자 수를 비교해야 제대로 된 평가를 할 수 있다.
2. 비율 형태의 지표.
‘주문량 10건’이라는 절대수만으로는 인사이트를 도출하기 어렵지만, ‘주문량 10건/방문자 100명’과 같이 비율로 나타내면 유의미한 평가를 할 수 있다.
마지막 내용은 Critical Path다. 웹사이트마다 최종적으로 기대하는 고객 행동이 있다. 커머스 사이트라면 결제 버튼일 것이고, 콘텐츠 사이트라면 구독 버튼일 것이다. 그 마지막 행동까지 거쳐야 하는 핵심 경로를 Critical Path라 한다. Critical Path가 그려져야 각각의 경로를 효율적으로 트래킹 할 수 있고, 어떤 경로에서 전환율이 떨어지는지도 알 수 있다.
오늘 1회 차 세미나는 데이터 분석에 필요한 기초를 다지는 시간이었다. 딱딱하고 어려울 수 있는 내용이었지만, 강민구 팀장은 본인의 실무 경험을 곁들여 각각의 개념을 쉽게 풀어나갔다. 오늘 강의를 통해 데이터 분석이 비즈니스 성장에 얼마나 중요한 요소인지 피부로 느낄 수 있었다.
강의 내용 중에서 특히 인상적이었던 내용은 ‘마인드셋’에 대한 부분이었다. 데이터 분석의 스킬을 익히는 일보다, ‘현상을 데이터로 보는 마인드셋’을 갖추는 일이 우선이라는 말이 기억에 남았다. 이어지는 2회 차 시간에는 본격적으로 데이터 분석 툴을 활용하는 법을 다룰 예정이다.
소셜벤처 201 아카데미 상세 : blog.naver.com/riblog (블로그 내 '소셜벤처 201 아카데미' 카테고리)