brunch

You can make anything
by writing

C.S.Lewis

by 밸류닥터 구자룡 Dec 07. 2021

이제 나도 셀프서비스 데이터 분석가

우리가 보고 듣고 사용하는 모든 곳에는 이미 수많은 데이터가 있다. 그 데이터의 일부를 내가 생성하기도 한다. 편하고 빠르게 목적지에 도착했다면 아마도 누군가가 제공한 데이터를 이용했을 것이다. 나의 데이터를 누군가가 이용하여 같은 목적을 달성했을 수도 있다. 어디선가 제품을 구매하면서 결제한 신용카드 기록도 내가 생산한 데이터다. 내가 원하든 원하지 않든 데이터는 생성되고 활용되고 있다. 일상에서 그리고 업무에서 데이터 기반으로 접근해야 한다는 무언의 압력을 받는 것은 어쩌면 당연하다.


그런데 나는 데이터를 다루어 본 적이 없다. 실은 다루고 있지만, 의식적으로 다루고 있지 않다고 생각한다. 왜냐하면, 데이터를 수집하고, 분석하고, 그 결과를 바탕으로 의사결정을 한 적이 없기 때문이다. 나는 데이터 과학자도 아니고, 데이터 분석을 한 적도 없으며, 데이터 관련 전문교육도 받은 적이 없다. 이런 나에게 회사에서는 자꾸 데이터를 활용하라고 요구한다. 엄청난 스트레스가 되고 있다. 데이터와는 담을 쌓고 살았는데 느닷없이 데이터를 갖고 오라고 한다. 이제 어떡해야 하나?


데이터 기반 의사결정이 많아지고 있다


데이터로 비즈니스 성과를 높인 사례들이 속속 등장하면서 데이터 기반 의사결정에 대한 관심이 높아지고 있다. 한때 빅데이터 관련 업종에서만 회자 되던 빅데이터라는 용어가 이제는 초등학생들도 알만한 내용이 되면서 비즈니스에서 빅데이터를 활용하지 않고는 비즈니스를 할 수 없을 것 같은 압박이 되고 있다. 빅데이터이냐 아니냐는 중요한 문제가 아니다. 나의 혹은 우리 회사의 비즈니스에서 데이터 없이 의사결정을 할 수 있는가? 또는 데이터 기반으로 의사결정을 하면 보다 생산성을 높이고 고객의 가치를 극대화할 수 있는지가 문제다.


전통적인 제조업의 대표적인 기업인 GE는 항공기 엔진에 센서를 달아 수집된 데이터로 부품의 고장 여부를 미리 파악하고 수리를 한다. 이 덕분에 에미레이트 항공은 계획되지 않은 유지 보수를 50% 줄였다고 한다. 아마존과 넷플릭스는 추천 알고리즘을 통해 고객의 재구매를 유도하고 있다. 쏘카는 고객의 이용 패턴을 분석하여 차종 배치와 쏘카존 개발에 활용하고 있다. 마켓컬리는 데이터분석을 통한 예측주문으로 신선식품 폐기율 1% 미만에 도전하고 있다. 제주공항의 모 면세점은 고객의 동선과 매출을 분석하여 혼잡도를 최소화할 수 있도록 매장 레이아웃과 조닝을 재구성했다. 경기도에 있는 모 로컬푸드 매장에서는 매출 데이터를 분석하여 고객의 구매 자극을 높일 수 있는 요일별 이벤트 상품을 기획했다. 제조 기업부터 서비스 기업까지, 대기업에서 스타트업까지 어떻게 데이터를 활용할 수 있을지 고민하고 있다.


데이터에서 비즈니스의 변화를 일으키고 가치를 창출하는 의사결정은 뉴노멀이 되었으며, 어려운 것도 아니다. 예를 들어, 전기오븐을 사용하여 맛있는 요리를 하여 가족들에게 제공하고 싶은 주부가 있다고 하자. 검색을 통해 맛있어 보이는 쿠키 레시피를 찾았고, 블로거가 제안한 방법으로 오븐을 세팅하고 기다렸는데 실패했다. 주부가 원했던 결과가 아니다. 고객의 가치가 생기지 않은 것이다. 만약 전기오븐 제조사의 기획자나 마케터라고 한다면 어떻게 해야 할까? 고객센터에 접수된 고객의 소리에 요리에 실패했다는 내용이 많다면, 소셜미디어에 요리에 실패했다는 글들이 많다면, 우리 회사 제품이 아니어도 이런 의견에는 분명 어떤 문제가 있을 것이다. 이 문제를 해결하면 진짜 고객이 원하는 가치를 제공할 수 있다. 데이터 분석을 통해 이런 문제를 해결한다면 주문이 밀려들고 고객의 가치뿐만 아니라 우리의 가치도 높아질 것이다.


문제를 인식하고 정의하는 것이 먼저다


문제는 고객이 해결하지 못하고 있는 어떤 것이다. 우리가 제공한 제품이나 서비스에 문제가 있다는 것은 고객의 문제가 아니라 우리의 문제다. 어떻게 하면 문제 해결을 통해 고객의 가치를 높일 수 있을까? 데이터에서 문제 해결을 위한 실마리를 찾을 수 있을까? 이 시점에서 경영자는 또는 관리자는 데이터를 가지고 오라 한다. 데이터로 통찰한 결과를 가지고 오라고 한다. 이제 내가 나설 차례다. 비록 데이터 분석 전문가는 아니지만, 우리 도메인의 전문가이고 마케팅 실무자인 내가 스스로 데이터 분석을 통해 현명한 의사결정을 할 수 있도록 도와야 한다. 이게 나의 업무다.


어느 날 상사가 새로운 사업기획을 해보라고 한다. 요즈음 1인 가구가 증가하고 있으니 1인 가구를 위한 식품으로 무엇이 좋을지, 사업성은 있을지, 사업을 한다면 어떻게 해야 할지 등등. 여기서 1인 가구에서 좋아하는 식품이 무언지를 정의하는 것이 첫째 문제다. 그리고 1인 가구라고 해서 동일한 특성일까를 고민해야 한다. 아마도 1인 가구를 크게 나눈다면 미혼 청년과 독거노인으로 구분이 가능할 것이다. 어떤 집단을 주 타깃고객으로 설정하는가에 따라 모든 접근 방법이 달라진다.


이제 본격적으로 프로젝트를 시작해보자. 어떻게 조사해서 무엇을 분석해야 통찰을 바탕으로 현명한 의사결정을 할 수 있을까? 즉 향후 히트할 제품은 무엇일까? 시장의 크기는 어느 정도 될까?


필요한 데이터를 찾거나 수집하자


데이터가 아무리 많다고 하더라도 내가 필요로 하는 데이터가 없다면 데이터가 없는 것이다. 대부분의 비즈니스에서는 이런 상황에 직면한다. 막상 사용하려고 하면 없는 것이다. 어쩌면 당연한 현상이다. 누가 왜 그런 데이터를 미리 준비해 놓겠는가? 이제부터 데이터를 찾아야 한다. 데이터는 1차 데이터와 2차 데이터로 구분한다. 이미 누군가의 목적으로 나와 있는 데이터는 2차 데이터다. 나의 문제를 풀기 위해 직접 목적에 맞는 데이터를 수집한 것을 1차 데이터라고 한다.


먼저 2차 데이터를 찾아야 한다. 탐색적 접근이 필요한 시점이다. 시장에는 수많은 데이터가 있기 때문에 나에게 가장 근접하게 맞는 데이터를 찾는 과정이 필요하다. 1인 가구의 특성을 이해하고자 한다면 이런 데이터는 어디에 있을까? 우선 통계청(kosis.kr)에 들어가서 인구 추이에 대한 데이터를 확인할 필요가 있다. 아울러 한국데이터거래소(kdx.kr) 같은 데이터거래소에서 관련 데이터를 검색해볼 수 있다. 원본 데이터(raw data)를 확보할 수 있다면 가장 좋다. 데이터거래소에서는 이런 데이터를 무료 혹은 유료로 제공한다. 또는 구글 트랜드나 썸트랜드, 빅카인즈 같은 빅데이터 분석 플랫폼에 들어가서 키워드 검색을 할 수도 있다.


데이터 수집 과정에서 주의가 필요한 부분이 있다. 전문 분석가가 아니기 때문에 쉽게 사용할 수 있는 데이터를 찾을 가능성이 크다. 누군가가 분석해 놓은 혹은 기사화된 자료를 찾아 인용 또는 재인용하게 된다. 한마디로 왜곡된 정보일 수 있는데 어디서 어떤 목적으로 분석한 것인지 잘 모르기 때문이다. 어떤 부분에서 왜곡되어 있는지조차 알 수 없다. 멋진 발표를 하고 싶다면 의도적으로 이런 정보를 활용할 수 있을지 모르나, 존망이 걸린 사업을 고민하면서 출처도, 데이터 수집도, 분석 방법도 불분명한 자료를 사용한다는 것은 많은 한계를 가지고 있다. 나의 문제를 해결할 수 있는 최소한의 필요 데이터만 있으면 된다. 그래서 더욱 데이터의 이면을 뜯어볼 수 있는 원본 데이터가 필요하다.


나에게 딱 맞는 데이터인 1차 데이터는 직접 수집하는 절차와 방법을 고려해야 한다. 2차 데이터가 탐색을 위한 것이었다면, 1차 데이터는 구체적인 의미를 이해할 수 있는 데이터다. 왜라고 했을 때 어느 정도 답을 얻을 수 있는 정보가 들어 있는 1차 데이터를 수집해야 한다. 1인 가구가 어느 정도이고 어떻게 증가하고 있는지는 2차 데이터로 확인이 가능하다. 때에 따라서는 어떤 서베이 자료를 통해 어떤 식품이 인기가 있는지도 파악할 수 있다. 그런데 왜 그 식품을 이용하는지 그 이유에 대해서는 알 수가 없다. 이런 경우에는 직접 물어보거나 관찰을 통해 파악해야 한다. 이런 경우에는 조사 방법을 활용해서 직접 데이터를 수집해야 의사결정을 위한 데이터 분석을 할 수 있다.


분석 마인드와 분석 스킬을 어느 정도 갖추어야 할까?


데이터를 탐색 혹은 수집했다면 이제 분석을 해야 한다. 수집한 데이터 대부분은 범주형과 연속형으로 되어 있는 정형 데이터일 가능성이 크다. 예시한 통계청의 원본 데이터에는 인구센서스 데이터와 함께 설문조사의 데이터를 엑셀이나 CSV 파일로 제공한다. 대부분의 데이터거래소도 이런 유형의 데이터를 제공해 준다. 이런 데이터는 통계분석을 통해 데이터 분석을 할 수 있다. 분석 도구로 전문 통계 패키지도 있지만, 셀프서비스 분석가인 현업실무자에게는 비용과 목적을 고려할 때 적합한 선택이 아니다.


가장 좋은 도구는 손에 익은 도구이고 쉽게 접근이 가능하며 추가적인 비용이 들어가지 않아야 한다. 바로 엑셀의 데이터 분석 기능을 활용하면 된다. 기업에서 엑셀을 사용하여 업무를 하는 사람은 두려움 없이 추가기능을 설치하면 바로 사용할 수 있다. 통계분석의 여러 방법에 대한 진입장벽이 당연히 있다. 그렇지만 그 많은 방법을 다 익힐 필요는 없다. 나에게 가장 필요한 방법을 확인한 다음 그 방법만 주로 익히면 된다.


예를 들어 소비행태를 알고 싶다면 가장 기초적인 빈도 분석과 평균 분석 정도만 알아도 된다. 시장을 세분화하고 싶다면 여기에 고급분석이라고 할 수 있는 분산 분석과 군집 분석 정도 필요한 부분 중심으로 공부하면 된다. 신제품을 출시하기 전에 테스트하고 싶다면 실험법을 사용해야 하고, 이때 실험으로는 A/B 테스트를 사용할 가능성이 높다. 이 데이터를 분석하고자 한다면 T-테스트나 분산분석 정도 익히면 된다.


앞에서 수집한 데이터가 텍스트나 이미지로 되어 있다면 조금 복잡한 상황이 될 수도 있다. 그렇지만 너무 걱정하지 않아도 된다. 이런 데이터를 비정형데이터라고 하는데, 오픈소스의 빅데이터 분석 플랫폼이나 일부 온라인 사이트에서 텍스트마이닝 기능을 제공하고 있다. 뉴스 빅데이터를 분석하고 싶다면 빅카인즈(bigkinds.or.kr)에서 텍스트마이닝이 가능하다. 수집한 원본 데이터를 다운로드하여 엑셀에서 추가분석을 할 수도 있다. 한국데이터거래소에 들어가면 정형데이터를 다운로드할 수 있을 뿐만 아니라 자체 데이터 서비스에서 썸트렌드 분석으로 키워드 분석을 할 수 있다.


중요한 것은 분석 스킬을 연마하기 이전에 분석에 대한 마인드를 갖는 것이다. 분석 마인드는 어떤 내용을 어떤 분석 방법으로 어떻게 분석해야 어떤 결과를 얻을 수 있다는 전체 그림을 그리는 것을 말한다. 왜 분석을 해야 하고 어떻게 하면 될지를 그릴 수 있어야 원하는 결과를 얻을 가능성이 높다. 무작정 분석한다고 원하는 것을 얻을 수 있는 것은 아니다. 이점을 인식해야 한다. 이런 분석과정을 통해 30대 초반 1인 가구에서 유산균 제품에 대한 선호도가 매우 높다는 것을 발견했다고 하자. 그러면 이제 어떻게 해야 할까?


분석을 통해 얻은 통찰을 가치로 전환해야 한다


분석을 한 목적이 무엇일까? 데이터에서 통찰을 얻고 싶은 것이다. 통찰은 사물을 훤히 꿰뚫어 보는 것이다. 데이터 이면에 있는 내용에서 우리의 타깃 고객군에서 유산균에 대해 뭔가 부족한 것을 채워달라는 통찰을 얻었다고 하자. 이제 우리가 가지고 있는 기술과 역량으로 신제품을 기획해야 한다. 그리고 실행을 해야 가치를 만들 수 있다. 물론 실패할 가능성도 있다. 실은 성공 가능성보다 실패 가능성이 훨씬 높지만 우리는 이를 낮추기 위해, 즉 현명한 의사결정을 위해 데이터 분석을 했다. 이제 그 결실을 만들어야 한다. 


실행은 바로 가치를 만들기 위한 결정적인 순간이다. 실행하기 이전까지는 탐색하고 분석을 하는 과정이었기 때문에 추가적인 비용 부담은 크지 않았다. 이제 실행 단계로 들어가면 많은 실제적인 비용이 발생한다. 만약 실패한다면 경영 위기로 내몰릴 수도 있다. 성공한다면 새로운 성장 곡선을 그리는 계기가 될 것이다. 통찰의 진정한 의미는 실행을 통해 고객 가치를 충족시키고 새로운 비즈니스를 만들었을 때 확인할 수 있다.


성공률을 높일 수 있는 현명한 의사결정은 현업실무자가 스스로 데이터를 분석하는 습관에서 출발한다. 경영자가 요구한다고 해서 되는 것이 아니다. 내가 스스로 데이터를 다루는 습관을 들이고 그 결과를 바탕으로 의사결정에 참여하고 실행을 통해 마케팅 활동을 적극적으로 수행해야 한다. 그리고 성공시켜야 데이터 분석의 진정한 가치를 얻을 수 있다.


과거에는 주로 경험에 의한 의사결정을 했다면, 이제는 데이터에 기반한 의사결정이 요구되고 있다. 특정의 어떤 경험으로는 하루가 다르게 바뀌는 빅데이터의 시대에 현명한 의사결정을 할 수 없다. 데이터 속에 숨어있는 미래를 엿볼 수 있는 통찰을 하기 위한 습관이 필요하다. 데이터를 다루는 습관이 들어야 한다.



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari