지수(Index)는 수량과 비율의 변화를 볼 때 쓰는 숫자(데이터)의 조합이다. 지수를 만들기 위해서는 관찰,측정해야 할 필요가 있는 주제를 정하고, 필요한 데이터를 집계한다. 대표적인 예로 국가 경제력 파악을 위해 다양한 경제요소 데이터를 엮은 GDP(국내총생산지수)가 있다. 지수는 경제 분야에서 많이 쓰이지만, 이외에도 얼마나 살기 좋은 지역인지를 보는 사회안전지수나 재해의 정도를 나타내는 재해지수 등 다방면으로 활용되고 있다.
회사에는 보유한 데이터가 많아 지수를 만들 일이 종종 있다. 최근에는 상권의 현황을 파악하는 데 사용할 지수를 만드는 업무가 있었다. 주제를 정하고 필요한 데이터를 확인하고 도출된 결과를 검수하는 과정에서 문제도 많았다. 본 프로젝트가 다 끝나고 나서야 “아 그때 이걸 챙겼어야 했는데” 라고 생각나는 것들이 있어 남긴다.
1) 목적을 쪼개서 데이터로 연결하기
장 보러 마트에 간 사람은 당장 필요한 것만 사지 않는다. 오늘만 이 가격이라는 할인상품, 1+1에 사은품까지 주는 상품 등에 눈길을 주다 보면 어느새 카트가 꽉 차기 마련이다. 지수를 만들 때도 비슷한 일이 생기고는 한다. 데이터를 보다 보면 “이것도 보면 좋을 것 같은데?” , “저것도 집계해보자” 라는 상황이 생기곤 한다.
하지만 데이터가 많다고 해서 인사이트도 많아지는 건 아니다. 목적에 맞는 데이터를 봐야 한다. 이번 프로젝트의 목적은 “외식업 사업자를 위한 상권평가” 였다. 이 질문을 다시 잘게 쪼개니 아래 그림처럼 세 가지 질문이 나왔고, 필요한 데이터도 금방 선별할 수 있었다. 마트 갈 때 과소비를 하지 않기 위해 장볼 거리를 적어가는 것처럼, 지수를 만들 때도 목적을 적어두면 쓸데없는 고민을 줄일 수 있다.
2) 세부요소가 겹치는 건 없는가?
지수를 만들다 보면 이런저런 수식을 쓰는데, 이 과정에서 겹치는 경우가 있었다. 처음에는 매출액도 지수로 보고 매출 건 수도 지수로 보면 좋겠다고 생각해서 각각 지수로 넣었다. 그런데 막상 보다 보니 공통되는 부분이 있었다.
매출액지수 = 결제 건 수 x 결제 금액
매출 건 수 = 결제 건 수
경우에 따라 그대로 둬도 좋을 때도 있지만, 이 경우에는 별 도움이 안 되어 결국 매출액지수를 뺐다. 지수 산출방식이 복잡할수록 생길 수 있는 일이다. 각 지수를 점검할 때 산출방식에 활용되는 요소도 같이 점검하면 중복을 막을 수 있다.
3) 여럿이 작업한다면 명세서를 미리!
각 지수를 몇 명이 나눠서 데이터를 만들었다. 이 과정에서 점수 형태로 만들어서 개발팀에 빨리 완성형태를 공유하느라 “75점” , “100점” 이런 식으로 숫자+문자 형태로 만든 사람도 있고, 숫자만 넣은 사람도 있었다. 지표를 만들 땐 검수가 필수 절차다. 따라서 검수하기 좋은 형태로 데이터를 만드는 게 필요하다.
하지만 그보다 중요한 건 여럿이 할 땐 미리 데이터 형식과 산출 방식을 정확히 합의하는 것이다. 처음엔 각자 맡은 지수의 1년 치 데이터를 만들자! 라는 말로 시작했다가 뒤늦게 세부 조건을 정리했다. 1년 치 데이터를 본다면 매월 시계열로 데이터를 볼 것인지, 아니면 평균이나 합을 한 행으로 한번에 볼 것인지, 같은 숫자라도 출력 형식은 어떻게 할 것인지에 따라 데이터 형식이 달라진다. 명확한 행동 지침이 있어야 한 번에 효율적으로 작업을 할 수 있다.