brunch

You can make anything
by writing

C.S.Lewis

by Tommyhslee Sep 06. 2022

데이터 분석의 본질을 생각해보자

여러 내/외부 관계자분들과 사업 이야기를 나누다 보면 '데이터 분석'에 대한 다양한 견해를 듣게됩니다. 그중 특히 많이들 이야기하시는 것이 회사가 뭔가 특별하고 엄청난 데이터를 보유하고 있을 것이라는 인식인데요, 정작 개발팀이나 데이터 애널리스트분들께 "회사에서 얼마나 특별한 데이터를 취급하고 있나요?"라고 물어본다면 바로 만족할만한 대답을 해주실 분들은 아마 많지 않을 겁니다.


데이터분석이라는 말과 달리 데이터 자체의 특별함에 집착하다보니 생기는 오해같습니다.


사실 저도 스타트업 초기에는 그런 생각을 많이 했습니다. '남들에게는 없는 우리만의 데이터를 쌓아서 시장에 새로운 혁신을 보여줘야 한다'는 강박관념 같은 것인데 비즈니스를 할수록 그런 마법 같은 데이터는 없다는 걸 느끼게 됩니다. 하지만 이 사실을 알면 많은 분들이 소위 말해 '데이터 분석에 별게 없다'고 느끼시는 것 같습니다.


짧은 시간이지만 제가 경험한 것은 데이터분석이 결코 특별한 데이터를 모으는 것이 아니라

수많은 기본 데이터로 보여지는 유저의 행동을 어떤 방식으로 해석할지 고민하고, 교차해보고, 기준을 바꿔가고, 패턴을 분석해나가는 방법에 대한 고민이라는 것이었습니다.


데이터에 대한 맹신과 오해 역시 조심해야 한다는 사실도요. 글을 읽다 보면 행간의 의미를 파악하는 게 중요하다고들 하죠. 데이터 분석도 비슷한 점이 있습니다.


이건 '데이터를 기반으로 혁신한다'라는 말을 하는 대부분의 IT기업들도 비슷할 겁니다. 개발팀은 기본적이지만 반드시 필요한 로데이터를 축적하는데 집중하고 데이터 분석팀이나 전략팀은 이를 활용하여 각자의 원하는 바를 목표로 데이터를 분석하게 되는 거죠.  


예를 들어 유저에게 영상 추천 알고리즘을 만들겠다고 하면, 뭔가 대단한 데이터를 활용하는 게 아니라 게재 날짜, 조회수, 좋아요, 댓글 수, 영상 길이와 같이 콘텐츠의 기본적인 데이터와 업로드 유저의 평균 조회수, 좋아요, 계정 특징 같은 것들을 교차로 분석해 추천 알고리즘을 만들게 됩니다. 여기서 최신 콘텐츠를 추천 우선순위에 놓을건지, 좋아요나 조회수를 우선으로 둘 건지 시계열 조건은 어떻게 활용할 것인지 등등 raw 데이터를 활용한 다양한 해석과 기준 설정에 더 많은 시간을 쏟는 거죠. 세상에 없는 마법 같은 데이터를 찾는데 집중하진 않습니다.


특히 교차 분석은 상당히 큰 인사이트를 만들어냅니다. 한 플랫폼 내에서 단일 유저의 멀티 액션 데이터를 모두 쌓을 수 있다면 설령 그 데이터가 기본적인 인구통계학 정보나 ARPU, 체류시간, 사용 디바이스 같은 것들이어도 이를 교차 분석했을 때 꽤 유용한 분석 결과를 얻게 됩니다.


사람을 하나의 인식 장치로 본다면 우리가 사물을 인식할 때도 단순히 AI처럼 눈으로 보고 이미지로만 분석하는 건 아니죠. 사물을 만져볼 수도 있고 냄새를 맡을 수도 있고 앞뒤 상황을 분석할 수도 있고 배경, 장소, 시간에 따라 사람마다 다른 결과를 도출할 수도 있고요. 하나의 현상과 패턴에 대해 다양한 앵글로 바라보고 각기 다른 영역에서 쌓인 데이터로 판단하고 인사이트를 도출해내는 게 데이터 분석의 가장 재밌는 점이자 힘이 아닐까 싶습니다.


다만 데이터 분석의 한계도 분명 존재하겠죠. 고객의 행동 패턴은 숫자로만 드러나진 않으니까요. 행간의 의미는 숫자에 반영되지 않을 때도 있습니다. 이런 건 아직까지 철저히 사람의 영역이고 감성의 영역인 것 같습니다. 여전히 가야 할 길이 멀죠.


아무튼 데이터 분석에 한계와 본질에 대해 고민하게 되면 오히려 답은 간단해지고 회사가 무엇에 좀 더 집중해야 할지 알 수 있게 됩니다. 데이터 분석에 대한 오해를 피하면서요.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari