비즈니스 분석가는 조직이 최선의 의사결정을 할 수 있도록 지원합니다. 최선의 의사결정을 하기 위해서 필요한 것들은 여러 가지가 있겠지만, 가장 최고는 미래를 아는 것입니다. 인기 드라마였던 '재벌집 막내아들'의 진도준처럼 미래를 아는 것만으로도 다수가 의구심을 가질 때 타이타닉, 아마존에 거액을 투자해서 돈을 버는 것이 대표적입니다.
따라서 비즈니스 분석가는 예측해야합니다. 예측은 설명 Descriptive 분석, 진단 Diagnostic 분석, 예측 Predictive 분석, 처방 Prescriptive 분석 중 난이도와 가치가 높은 분석 중 하나입니다. 만약 분석가가 의미있는 예측을 할 수 있다면, MD는 2024년에 유행할 품목을 미리 선점할 수 있을 것이고, 물류 담당자가 물류센터 등 고정자산을 축소/확장하는 전략을 세울 수도 있을 것입니다.
사실 예측을 깊게 들어가기엔, 시계열 분석 하나가 통계학과 3-4학년 때 듣는 과목이라 다 담기는 어려울 것 같습니다. 이번 글에서는 예측 분석은 주로 어떤 요소를 고려해서 진행되는지와 설령 예측의 정확도가 당장 부족하더라도, 분석가가 끊임없이 예측을 시도해야 하는 이유에 대해서 말해보려고 합니다.
예측적 분석은 과거에 쌓인 데이터와 시계열 분석을 활용해서 미래의 추세를 보는 방법입니다. 시계열 데이터는 정해진 시간 간격으로 관측된 데이터입니다. 일정 기간 동안의 거래액, 가입자 수, 주가 등 다양한 데이터가 이에 해당할 수 있습니다.
그렇다면 시간에 따라 쌓인 데이터에서 어떤 요소를 확인할 수 있을까요? 대표적으로 추세, 계절성, 주기에 대한 것들을 확인할 수 있습니다.
추세(Trend): 시계열 데이터가 장기적으로 증가하거나 감소하는 패턴으로, 미래 값의 경향성을 예측
계절성(Seasonality): 데이터에 주기적인 패턴이 나타나는 경우로, 시기별 변동성을 파악하고 예측
주기(Cycle): 일정 주기로 나타나는 패턴으로, 주기를 분석하면 장기적인 주기성을 이해하고 예측
대부분 시계열 분석은 이런 요소와 여기에 영향을 미치는 원인(독립변수)를 바탕으로 예측이 이루어집니다. 지금도 여러가지 모델이 나오고 있고, 통계학과 3~4학년을 대상으로 하나의 과목으로 운영될만큼 내용이 방대하기 때문에, 이 중 자주 소개되는 모델 몇가지만 언급해보면 다음과 같습니다.
시계열 분해(Time Series Decomposition): 시계열 데이터를 추세, 계절성, 주기, 불규칙성으로 분해하고 각 구성 요소를 분석
자기회귀 모델(Autoregressive Models): 이전 시점의 데이터가 현재 데이터에 영향을 미치는 모델로, ARIMA(AutoRegressive Integrated Moving Average) 모델이 유명
지수평활법(Exponential Smoothing): 최근 관측된 값에 더 큰 가중치를 주고 오래된 값에 작은 가중치를 주는 방식으로 데이터를 평활화하는 방법
회귀분석(Regression Analysis): 다른 변수와의 관계를 분석하여 시계열 데이터를 예측하는 방법
신경망 모델(Neural Network Models): 딥러닝 기술을 활용하여 복잡한 시계열 데이터 패턴을 학습하고 예측하는 방법
분석가는 이런 모델들 중, 오차가 제일 적고 자신의 비즈니스를 잘 표현할 수 있는 모델을 선택해서 활용하게 됩니다.
물론, 시계열 분석에 회의적일 수 있습니다. 특히, 주식을 공부했던 사람들은 워런 버핏, 피터 린치 등의 대가들이 '제발 그딴 거 예측하지 말고, 좋은 기업 사라고!' 하는 이야기를 들어봤을 것이다. 실제 저런 투자의 대가들이 큰 성공을 거두고, 애널리스트들이 예측치를 자주 틀리는 것을 보면 그런 생각이 들 수 있습니다.
그럼에도 아래와 같은 이유에서 분석가는 예측 작업을 반드시 해야 한다고 생각합니다.
1. 예측 정확도의 향상
시계열 분석은 단순한 추측에 데이터라는 근거를 통해서 오차를 조금 더 줄여주는 작업으로 볼 수 있습니다.
A : 7월 의류 매출이 1억이었으니, 8월도 그쯤 하지 않을까
B : 7월 의류 매출은 1억으로 YoY 25% 수준이었어. 작년/재작년을 보면 8월 거래액은 7월보다 확 뛰는 모습으로 나타나네. 그래서 YoY 25%를 적용해서 2억 정도 나올 것 같아.
C : 작년과 재작년의 경우, 마케팅비로 N원을 지출했네. 이번달에 배정된 마케팅비가 M원으로 감소했다 점과 트렌드 및 계절성을 반영하면 아마 1억 5천 정도로 추정되는 것 같아.
여기서 어떤 정보를 가장 신뢰할 수 있을까요? 아마, 세 사람의 경력 및 평판이 비슷하다면 C와 같이 시계열 요소와, 매출과 직접적인 영향 정도가 높은 광고비를 근거로 활용한 주장이 가장 설득력있게 들릴 것입니다. 또한 의사결정과 이후 피드백에도 유용할 것이다. 예상한 것보다 광고비 효율이 안나왔던 원인을 고민해볼 수 있고, 더 나아가 광고 효율이 안나왔던 상품이나 광고 소재를 발견해서 이후에 개선하거나 다른 전략을 세울 수 있을 것입니다.
이처럼 단순한 추정을 하는 것보다, 유의미한 변수들을 결합해서 분석을 시도하면 분석의 정확도는 높아집니다. 설령 이번 분석이 단순 추정보다 낮았다 할지라도, 이후 예측 수준을 더욱 높여주는 쪽으로 개선될 것입니다.
2. 고객과 시장 트렌드 파악
시장의 흐름을 이해하는 것은 매우 중요합니다. '폭풍을 만나면, 돼지도 날라간다'는 말처럼 비즈니스에서 내 역량을 300% 발휘하면서 시장을 거스르는 것보다, 시장의 흐름에 타면서 내 역량을 30%만 발휘할 때가 더 유리할 때가 많기 때문입니다.
예를 들어, 시장 수요가 증가하는 추세의 품목은 할인율을 낮추면서 마진을 더 확보할 수 있을 것이고, 시장 수요가 감소할 것으로 예상되는 품목은 빠르게 할인 판매를 시작하면서 재고 최소화를 할 수 있습니다. 반면 이런 흐름을 모른다면, 감소세에 있는 품목을 더 잘 팔기 위해, 마케팅비를 더 비효율적으로 태우는 등의 의사결정을 할 수 있고, 상승세에 있는 품목을 너무 조기에 크게 할인하면서 마진을 낮출 수 있기 때문입니다.
하지만 이런 트렌드를 읽는 것이 생각보다 어렵습니다. 트렌드에 민감한 마케터들이 이와 관련한 의견을 제시하지만, 요즘은 사람들에게 노출되는 것이 그 사람의 취향과 관련된 것들이 많다보니 '이게 정말 경제적 가치가 있는 트렌드일까'라는 의문점이 생길 수 있습니다. 따라서 트렌드를 예측해보는 시도 속에서, 어떤 것이 지금 상승하는 추세에 있는지, 아니면 시즌성으로 일시적인 것인지 등을 캐치할 수 있게 됩니다.
3. 적절한 목표점(KPI) 설정에 활용
조직 운영에서 KPI, OKR 등 목표 관리는 매우 중요한 요소입니다. 이 과정에서 리더와 구성원과의 적절한 커뮤니케이션이 중요한데, 보통 리더는 목표를 높게 잡고 싶어 하며, 반대로 구성원은 지나치게 높은 것에 대해 거부감을 갖기 마련입니다. 이 갭이 지나치게 커진다면, 구성원은 오히려 의욕을 상실하고, 목표 달성에 실패했을 때도 제대로 된 피드백이 이루어지지 않을 수 있습니다.
따라서 구성원과 합의한 '도전적인 목표 수준'을 잡는 것이 중요한데, 이때 분석가의 예측 분석이 기여할 수 있습니다. 예측되는 결과범위 수준에서 가장 높은 수준, 혹은 가장 높은 수준보다 약간 높게 잡는 등의 방식으로 근거에 기반한 목표 수준을 설정할 수 있게 됩니다.
4. 이슈 발견의 단서로 활용
실무에서 대부분 예측과 크게 벗어나지 않지만, 가끔 크게 벗어나는 경우가 있습니다. 예를 들면, 특정 영역에서 이슈가 생기거나, 새로운 도입한 기능이 대박이 나는 경우입니다. 예를 들면, 특정 서비스에 대한 가입 대비 구매전환율을 N%로 예상 매출을 설정합니다. 이때 예상 매출이 예측 범위보다 크게 상회한다면, 어떤 요인 때문에 가입자가 확 늘었는지 혹은 구매전환율이 늘었는지 등 점검할 수 있게 됩니다. 이런 결과값에 영향을 주는 요인과 그 이슈를 파악하는 것만으로도, 예측 분석을 하는 의미가 있다고 볼 수 있습니다.
이처럼 예측 분석은 반드시 예측에 성공하지 않아도, 비즈니스 의사결정에 다양한 형태로 기여할 수 있습니다. 메타(구 페이스북)에서 제공하는 prophet 모델 등 다양한 오픈소스를 통해서 어렵지 않게 시도할 수 있습니다. 비즈니스에서 의사결정 오차를 줄이고, 구성원의 목표점을 잡거나, 시장 추세를 확인하는 등 긍정적인 부분에서 기여할 수 있으니, 분석가라면 반드시 알아야한다고 생각합니다.