제대로 된 인사이트는 '빅데이터'라는 말로 생기지 않는다
관리직은 분석하는 일이 많습니다. 현장에서 벌어지는 일을 사무실에서 모두 알 수 없기 때문에 데이터를 통해 인사이트를 얻는 일이 많습니다. 분석은 현장에서는 단편적인 현상으로 드러나는 일을 일체의 흐름과 방향으로 알 수 있게 한다는 데서 현장에 마냥 있는 것에 비해 우수한 인사이트를 도출하는 경우도 많습니다. 잘된 분석은 누구도 알 지 못했지만 실제로는 느리지만 크게 벌어지는 현상을 설명해 줍니다. 지구에 살고 있으면서 지구가 실시간으로 돌고 있는 것을 못 느끼지만 지구 밖에서는 아는 것처럼 분석은 거대한 흐름에 살고 있는 사람들에게 흐름이 무엇인지 알려줄 수 있습니다. 하지만 모든 일에 분석이 유효할 수는 없습니다. 분석도 결국은 가정이 들어가고 분석자의 직관이 개입되는 게 어찌보면 당연합니다. 또 분석의 시기도 중요합니다. 이미 지나버려서 가치가 사라진 내용을 굳이 분석할 필요는 없기 때문입니다. 분석은 앞 일의 예측보다는 과거의 설명에 더 적합하기도 합니다. 결과론적으로 답을 알고 식을 만드는 격이죠.
이런 분석은 최근 비정형 데이터 분석을 할 수 있는 길이 보편적으로 열리면서 더욱 각광받는 키워드가 되었습니다. 기업마다 분석과 관련된 인재를 더욱 강화하고 있고 IT에 관심 없던 회사도 하둡(Hadoop)을 도입하는 등 뭐라도 붙잡고 싶은 기업들에게는 새로운 금맥이라는 평판이 무색하지 않을 정도로 빅데이터 분석에 투자를 아끼지 않고 있습니다. 하지만 도구는 도구일 뿐입니다. 도구는 잘못된 방향을 만나면 오용됩니다. 분석이 그렇습니다. '무엇을 위한' 분석이기 때문입니다. 분석 자체로 아무 의미를 지니지 않습니다. 분석은 반드시 결과의 활용이 먼저 그려질 때 가치가 있고 분석 자체도 명확하게 진행됩니다.
하지만 의욕에 찬 기업들은 가끔 빅데이터로 뭔가 성과를 보여주어야 한다는 과욕에 빠지기도 합니다. 기업의 모든 프로젝트가 보여주기식으로 하면 그릇된 결과로 나타나듯 빅데이터 분석도 그 위기에 직면해 있습니다. 이런 유행이 정치적으로 사내에 이용될 수 있기 때문입니다.
인사이트에 대한 강박을 버려야 합니다
가장 많이 드러나는 분석의 그릇된 현상이기도 합니다. 데이터와 데이터 사이에 무슨 연관성이 있다거나 데이터의 시계열 추이 상 지금이 특별히 어떤 상태임을 뭐라도, 한 줄 이라도 써서 보고하거나 제공합니다. 만약 분석을 했는데 뚜렷한 인사이트가 발견되지 않으면 '이것과 저것 사이에 상관성이 없다' 혹은 '이 데이터와 저 데이터는 무관하다', '지금은 어떤 특별한 상황도 아니다'라고 말하지 않습니다. 어떤 식으로든 다른 방법과 다른 차원의 분석을 해서 뭐라도 있는 거라고 보고서에 써서 내기를 원합니다. 이런 인사이트에 대한 강박은 중요하지 않은 것을 중요한 것으로 만들어 버립니다. 별다른 것이 아니고 오히려 부분적으로 전체를 휘두를 수 있는 것을 정확한 판단이라고 말합니다. 기업은 작은 행동을 하다가 그치고 곧 데이터에 대한 신뢰 자체를 거두게 됩니다.
왜 인사이트가 없으면 없다고 말하면 안되는 것일까요? 마치 증권사 리서치팀 보고서가 대부분 매수 의견을 내는 것처럼 기업은 기껏 만들어 놓은 빅데이터 관련 팀에서 뭐라도 단기간에 잡아와서 새로운 사업을 해내길 간절히 원하고 있습니다. 특히 빅데이터 관련 팀장이 이런 강박에 놓여 있거나 정치적인 인물이라면 이런 현상은 기업을 전략적이지 않은 방향으로 인도합니다. 분석에 따른 새로운 성과의 정의가 왜곡을 낳습니다.
보통 사업의 기회는 큰 인사이트에서 나옵니다. 많은 고객의 변화, 최근 다량의 증거가 있는 주장이 큰 기회를 보통 만듭니다. 사람들이 인지하고 있지는 않지만 실제 일어나고 있는 팩트죠. 물론 큰 인사이트가 나올 때까지 마냥 기다리거나 조사나 분석을 계속 해야 한다는 이야기가 아닙니다. 큰 게 없는 것은 분석에 힘을 뺄 필요가 없다는 말입니다. 이런 것은 다른 데서 분석에 의한 인사이트가 나오거나 분석이 아닌 귀납적인 추론을 하나씩 현실에서 겪어 보면서 알게 되는 것입니다.
하지만 분석가들은 그렇지 않을 때가 있습니다. 가장 모수가 많고 사업에 직접적인 영향을 미치는 변수에서 답을 못 찾을 때 다른 데이터를 찾기 보다는 이미 큰 인사이트가 없는 데이터를 더 세부적으로 쪼갭니다. 변수를 세분화 해서 뭔가라도 할 말을 찾는 것이죠. 결국 나누고 나누다 보면 일정 성향을 띠는 뭐라도 나올 것입니다. 하지만 이런 것은 실제 사업에 쓸모없을 때가 많습니다. 분석을 위한 분석으로 흐를 가능성이 높습니다. 어떤 실행을 해야하는 인사이트가 나온다고 해도 그것으로 파생되는 효과가 작거나 오히려 기존의 큰 전략적 흐름을 저해할 우려가 있습니다. 분석을 하는 담당자와 부서는 분석의 전체적인 목적과 회사의 아젠더 차원에서 결과를 내 놓아야 합니다.
예를 들어 책을 유통하는 기업에서 고객의 구매 데이터를 분석해서 새로운 사업을 구상한다고 가정해서 고객의 자녀 유무에 따라 구매한 책의 권수와 종류가 다른지 분석을 했습니다. 하지만 결과가 고객은 의외로 자녀의 유무에 따른 책의 구매가 전체적인 고객의 성향과 크게 다르지 않다고 나왔습니다. 그렇게 된다면 이런 방향으로 사업을 추진하는 것은 아니고 다른 기준으로 고객을 분류하거나 초점을 맞추어야 한다고 이야기 할 수 있어야 합니다. 하지만 경영진이 자녀 유무에 꽂혀 있다는 이유로 이런 의견은 상부로 올라가지 않습니다. 어떻게든 자녀 유무에 따른 세부 차이를 더 찾거나 전체 고객과 크게 다르지 않는 분포를 보이는 데이터를 크게 차이가 난다고 통계적 검증을 뒤로 한 채 보고하고 맙니다. 경영진의 직관에 맞는 분석 결과를 가져오면 생각이 없는 경영진이라면 자신을 아부해 준 효과가 나는 이 분석을 반기면서 분석 담당자를 크게 칭찬할 것입니다. 만약 세부 데이터를 더 판다고 한다면 자녀 유무에 따른 책의 종류가 아닌 더 세부적인 것을 분석하겠죠. 예를 들면 자녀의 숫자에 따른 책 구매 권수가 차이가 나는지 하는 것 말입니다. 그런데 이런 세부 항목에서 뭔가 차이를 밝혀냈다고 합시다. 자녀가 많으면 서점에 나올 시간이 없으니 한 번 나올 때 많이 사간다고 가정하는 것이죠. 그렇게 된다는 조사 결과는 결국 다둥이 부모에게 대량 구매에 따른 프로모션을 제공하는 마케팅 활동으로 이어질 것입니다. 이것도 의미가 있지만 원래 이거 하려고 시작한 조사가 아니기에 이것이 낳는 효과는 새로운 사업을 하거나 기존의 위기를 바꿀 수 있는 성과로 이어지지 않습니다. 내부에서는 분석을 통해 뭔가라도 새로운 것을 하는 것 같아 희망에 부풀어 있지만 좀 시간이 지나고 새로운 것이라는 시선이 걷히게 되면 분석의 실효성에 대한 담론이 내부에서 나올 것입니다. 결국 분석의 결과는 성과이므로 성과의 크기가 어느 정도 나오지 않는 세부 차원의 분석은 한계가 있습니다.
분석에 의한 오판으로 종종 등장하는 사례 중에 미국의 두 백화점 브랜드인 블루밍데일(Bloomingdale)과 메이시스(Macy's) 가 1950년대 초반에 겪은 내용이 있습니다. 이 시기는 두 백화점 브랜드 모두 기존의 패션과 유행하는 제품 대신 가전제품을 구매하는 고객층이 증가하고 있었습니다. 1위 브랜드인 메이시스는 이런 변화를 달가워 하지 않고 기존의 업태에 맞게 패션과 유행하는 제품으로 고객을 다시 설득시키려고 한 반면, 블루밍데일은 시장의 이런 변화에 맞게 가전 제품을 특화시키면서 시장을 주도하지 못했던 포지션을 바꾸어 전자제품 백화점으로, 이후 패션과 유행하는 제품을 특화시켜 오늘날까지 고유한 브랜딩을 가진 차별화된 백화점으로 살아남았습니다. 메이시스가 지금도 시장을 주도하는 백화점이지만 50년대 후반에는 기회를 하나 날려버린 셈이죠. 데이터 분석은 이 정도 크기의 변화를 이끌어야 실제로 일을 낼 수 있습니다. 결국 분석을 시작할 때 정확한 목적이 정의되어 있지 않으면 분석이 모든 것을 가져올거란 믿음 혹은 방임의 결과로 아무거나 분석의 결과물로 들고 오는 일이 벌어집니다. 정확하게 사업의 방향을 분석을 통해 정하자고 정의하면 분석이 가져올 성과의 크기도 명확해집니다. 이런 의도에서 나오는 블루밍데일 사례의 가전 제품 고객의 증가는 유의미한 결과로 이어질 수 있습니다. 아웃라이어가 나와도 어떤 분석의 레벨에서 나오는지가 중요하기 때문입니다.
분석은 단독 대상의 값으로는 읽는 사람에게 아무런 의미를 주지 못할 때가 많습니다. 예를 들어 우리 회사가 영업이익율을 5%를 내고 있다면 이건 잘하고 있다고 말할 수 있을까요? 그럴 수 없습니다. 비교대상이 없기에 기준을 잡지 못하면 해석해 낼 수 없습니다. 이런 해석의 기준이 개인의 생각이 아닌 정확하게 비교를 통해 이루어 지는 게 중요합니다. 물론 비교의 대상을 잘 선정해야 함은 두말할 것 없이 중요합니다.
분석 데이터 중에 흔하고 잘 활용할 수 있는 것 중 재무제표가 있습니다. 읽는 방법에 대한 연구가 오랜 시간에 걸쳐 이루어졌기 때문에 많은 사람이 이해하고 있습니다. 이런 재무제표도 무엇과 비교하느냐가 중요합니다. 보통은 산업군 평균과 비교할 때 해당 기업이 어느 정도의 숫자를 보여주는가를 중요하게 생각합니다. 비슷한 업태를 가진 기업이 내는 퍼포먼스 대비 얼마나 더 뛰어난가에 대한 분석입니다. 하지만 같은 산업군이지만 사업 모델은 전혀 다를 수 있습니다. 박리다매 전략을 쓰는 기업이나 제조하는 상품은 같으나 파는 채널이 다른 기업을 직접적으로 비교하는 것은 우리 회사 스스로의 전략을 부정하는 일이 되고 사업은 이런 비교를 통해 정체됩니다. 뱁새의 다리가 되어 버립니다. 하지만 현장에서는 단순히 산업군 1위 기업의 지표이기 때문에 비교를 하는 경우가 많습니다. 그 회사와 우리 회사는 전혀 다른 방법으로 수익을 내고 있는데 말이죠. 기업 집단에서는 내부 계열사를 이런 모습으로 바라봅니다. 각 계열사마다 정확하게 어떤 사업 모델을 가지고 있는지에 대한 이해가 결여된 채 단순히 갖고 오는 단기적인 성과만 같은 기준으로 판단하겠다는 것이죠. 이런 분석은 기업을 장기적으로 유지하게 하는데 심각한 방해가 됩니다.
시계열 분석은 어떨까요? 시장 상황의 변화를 놓치고 단순히 과거에 비해, 특히 아름다운 실적이 있었던 과거와 비교하면서 모든 항목을 비교한다면 이것은 경영이 아닌 학부생 수준의 분석을 스스로 하고 있는 것입니다. 바뀐 환경이 원하는 다른 전략은 각 지표들을 어떻게 만들면 더 좋은지 분석가는 알고 있어야 합니다. 단순히 과거의 지표와 비교해서 이 항목이 떨어졌다고 말하는 것은 누구나 할 수 있는 일입니다. 숫자 크기 비교가 뭐 그리 어려운 일입니까? 하지만 분석가는 정황을 이해하고 분석에 반영을 해야 합니다. 그 사이 시장이 이렇게 바뀌어서 지표간의 비교도 이런 관점으로 감안해서 이게 어떻다 정도로 말할 수 있어야 정확한 분석이 이루어집니다. 이렇게 하지 않으면 과거가 현재를 붙잡고 직원들은 불필요한 희망고문 혹은 과거 전략으로의 불필요한 회귀가 반복되면서 사업은 나락으로 떨어집니다.
대조군이 명확하지 않으면 결국 직관이 개입되는 여지가 커집니다. 결국 윗 사람이 생각하는 결과 해석 혹은 대조군 세팅이 되어 버립니다. 이것을 분석가가 자유롭게 말할 수 없다면 이미 그 분석은 하나마나합니다. 기업 내부에서 정치적으로 자신의 의견을 뒷받침 하기 위해 분석을 사용하는 것에 불과합니다. 이런 문제가 반복되는 데에는 외부 정보를 알 수 있는 것에 대한 투자가 결여되어 있기 때문입니다. 그래서 결국 내부 자료에 의존할 수 밖에 없고 경영진의 생각이 분석의 중요한 가설을 세팅하게 되는 것입니다. 외부의 자료는 투자를 통해 획득할 수 있는 일이 많은데 경쟁사의 자료나 고객의 자료에 대한 투자를 하지 않는다면 이 문제는 사라지지 않습니다.
분석을 모르는 사람을 앉혀놓고 직관에 의해 결과를 분석하라는 말이 아닙니다. 분석가가 분석만 알고 사업을 모른다면 쓸모 없다는 이야기입니다. 앞서 작은 세부 항목을 분석해서 쓸모 없는 결과를 만들어내는 것을 이야기 했습니다. 분석가가 사업을 모른 채 사업과 관련된 데이터를 분석하면 이런 일이 벌어집니다. 가장 중요한 것은 어떻게 활용할 것인지에 대한 최종 그림이 머리에 없는 상태로 분석을 한다는 것입니다.
최근 국내 기업에서 빅데이터의 붐으로 분석가를 많이 채용하고 있습니다. 하지만 대부분은 분석만 아는 사람들입니다. 분석하는 대상이 어떤 것이지 글로 아는 사람들입니다. 그러기에 분석은 분석 이상의 영역으로 피곤한 일을 하지 않으려고 하고 사업 파트에 있는 사람들은 분석 기술을 모르기에 뭐라고 말하지도 못하는 상황에서 시간과 돈이 낭비되는 일이 종종 벌어집니다. 때로는 분석하는 데이터의 양과 비율을 함께 보지 않아 엉뚱한 결론을 내 놓기도 하고 당연한 이야기를 분석한 인사이트라고 들고 오기도 합니다.
실제 분석가는 분석의 최종 결과를 스토리로 만들 수 있어야 합니다. 사업에 쓰이려면 이게 어떤 의미를 지니고 이런 일을 하면 이런 효과가 고객이나 우리 내부 프로세스에 생긴다고 말을 할 수 있어야 합니다. 하지만 사업에 대한 무지는 이런 일을 할 수 없게 만듭니다. 사업에 의미가 있는 지표를 살펴볼 수 없습니다. 서로 묻는 과정이 길어지다보면 분석을 다시하게 되고 분석가가 지난 프로젝트에서 주워들은 이야기로 사업 파트와 팽팽한 긴장관계가 필요 이상으로 생기기도 합니다. 결국 해석의 능력이 중요한데 서로 그 부분은 중요하게 다루지 않으면서 분석에 의한 결과가 실행되지 않게 됩니다. 기업 내부에서 이런 일은 너무나도 흔합니다. 심지어 분석을 하는 부서와 분석의 결과물을 실행하느 부서가 분리되어 있다면 분석이 유효한 성과로 이어진다는 보장은 더 없어지게 됩니다. 현장에서는 분석을 조금이라도 아는 사업 리더의 부재가 한 몫을 합니다.
결국 분석은 분석 그 자체로만 존재 할 수 없고 반드시 사업과 연결되는 하나의 지점에서 출발해야 합니다. 그것은 결국 마케터나 기획자가 분석의 중심이 되고 해석의 결론을 내는 역량을 가져야 함을 의미합니다. 빅데이터 분석은 기술자나 통계 전문가에게만 맡길 일이 아니라는 것입니다. 중요한 것은 이들 사이의 거리를 좁히고 의사 소통의 횟수를 줄여서 팩트가 제대로 실행되는 방식을 만드는 것입니다. 이것은 결국 사업과 분석은 분리 될 수 없고 서로가 그것을 함께 할 수 있는 지점으로 다가가야 함을 의미합니다. 쉽게 말해서 안하던 것을 배워야 한다는 것이죠. 하지만 서로의 영역을 서로가 나누고 그 선을 구분하여 분석은 제대로 사업에 활용되지 못합니다. 이것은 데이터를 통해 새로운 성과를 창출 할 수 있다고 믿는 기업 문화에 달려 있습니다. 그것을 인정하느냐, 인정함으로써 그것을 잘 하려고 하느냐, 잘 하려고 하기에 조직이 전체적으로 그것 중심으로 움직일 수 있느냐, 그래서 그것을 운영하는 사람이 정의되어 있고 권한을 가지느냐의 실제적 문제로 이어집니다. 물론 앞서서 말씀드린 대로 강박을 버려야 합니다. 모든 변화는 시나브로 사람의 속으로 체화되기 때문입니다.
작가의 다른 콘텐츠