재작년 이맘때 모 업체의 온라인 교육플랫폼 프로젝트 기획 회의 도중이었습니다. 준비상황을 공유하던 중에 책임자로 보이는 분이 대뜸 '10대들의 목소리를 모을 수 있는 방법이 있을까? 10대의 욕구를 담아내어 상품화하면 잘 팔릴 거 같은데' 하시더군요.이미 방향을 정해둔 듯한느낌을 받았습니다. 결론부터 말씀드리면 그 프로젝트는 세상에 선보이지 못했습니다.
중간에 담당자도 여러 번 바뀌었고 예산도 고무줄처럼 늘었다 줄었다 했지만 그게 주된 원인은 아니었습니다. 정보를 수집하고 구매를 결정하여 비용을 지불하는 사람과 서비스를 실제로 이용하는 사람이 다르다는 걸 간과하고 무리하게 밀어붙였기 때문입니다. 대한민국에서 교육 관련 서비스는 비용을 부담하는 쪽의 입김이 강합니다. 실사용자의 요구가 있다한들 간접적으로 반영될 수밖에 없습니다. 또한 게시판 같은 수집채널을 만든다 한들 10대들이 거기까지 와서 속내를 얘기할리도 만무하죠. 그것이 수익과 연결될 확률은 더 낮을 겁니다.
사람이 모이면 수익이 된다는 믿음과 데이터의 맥락을 고려하지 않은 기획이 겹친 촌극으로 기억에 남습니다. 제 의견도 듣고 싶어 하시는 눈치길래 '여러 가지로 쉽지 않을 것 같습니다'라고 에둘러 말씀드렸었습니다. 나름 최선을 다했군요.
결론을 정해두고 의견을 물어보면 난감하다
사용자 행동의 일부가 데이터로 남는다
우리의 일상은 대부분 수집되고 있습니다. 스마트폰 사용, SNS 활동, 온라인 쇼핑, 웹 서핑 등 우리가 하는 모든 디지털 활동은 말할 나위가 없지요. 이러한 흔적은 행동 패턴, 선호도, 습관 등을 설명하는 하나의 증거물이 됩니다. 이렇게 모아진 데이터는 개인의 행동을 반영하고, 기업이나 연구자들에게 사용자에 대한 유용한 정보를 제공할 수 있는 단서를 제공합니다.
여기엔 중요한 전제가 하나 있습니다. 이렇게 기록되는 데이터는 사용자의 행동 중 '일부만을 반영'한다는 점입니다. 사용자 행동 가운데 표면적인 부분만이 기록되며, 사용자가 내리는 결정이나 선택의 이면에 있는 진짜 의도는 드러나지 않습니다. SNS에서 사용자가 '좋아요'를 누르는 게시물은 관심사를 어느 정도 반영하지만, 그것이 그 사람의 성격이나 삶의 가치관을 완전히 드러내진 않습니다. 온라인 기사에서 학벌에 따른 차등대우를 지지하는 댓글을 지지한사용자는 댓글의 내용에 공감했기 때문일 수도 있지만, 기저에는 사회적 인정 욕구나 특정 집단에 속하고 싶은 욕망이 깔려 있을 수 있다는 얘기입니다. 물론 기록엔 그저 '좋아요'만 남습니다.
우리의 행동은 때론 충동적이며 수시로 격정적이고 적잖이 욕망에 충실합니다. 합리적인 의사결정 과정을 거친다고 믿지만 그렇지 않은 경우가 더 많습니다. 그렇기 때문에 더 숨기려 들죠. 여러분의 지인이 온라인 쇼핑몰에서 특정 제품을 검색하거나 구매했다고 칩시다. 왜 검색하고 구매했을까요. 가격이 저렴해서? 내가 추천을 해서? 유명 인플루언서가 들고 나와서? 광고가 인상적이어서? 짐작하기 어려우실 겁니다. 직접 물어보면 될 것 같지만 시원하게 답을 주는 경우는 의외로 적습니다. 모든 가능성을 열어놓고 접근해야 합니다.
전 데이터를 빙산에 비유합니다. 드러난 부분보다 그렇지 않은 부분이 더 많거든요. 물론 기록된 결과 자체도 중요하겠지만 그 결과만으로 결론을 내는 건 위험할 수 있습니다. 그 결과는 어디까지나 아래에 깔린 진짜 의도를 파악하는데 필요한 재료로 활용되어야 합니다.
잊지 말자. 데이터는 사용자 행동의 극히 '일부'다
진짜 의도를 파악하는 게 왜 중요한가
사용자의 진짜 의도를 읽어내는 것은 단순한 호기심 차원을 넘어, 비즈니스와 연구에서 핵심적인 역할을 합니다. 기업은 제품과 서비스를 더 효과적으로 마케팅하기 위해, 연구자는 인간의 행동 패턴을 파헤치고 사회적 현상을 이해하기 위해 반드시 필요한 작업입니다. 그렇다면, 주어진 데이터에서 어떻게 진짜 의도를 읽어낼 수 있을까? 여기서 필요한 게 바로 데이터에 숨겨진 '맥락'을 파악하는 것입니다.
사실 데이터는 그 자체로 별다른 의미를 가지지 않습니다. 얼핏 보면 단순한 숫자나 문자열인 경우가 많죠. 하지만 그 데이터에 수집된 맥락이 겹쳐지면 가치가 달라집니다. 예를 들어, 날짜 데이터는 이어지는 시간 속에서 하나의 기록일 뿐이지만, 그 날짜가 연인의 생일이라면 어떨까요. 생일과 특정 날짜를 비교해 보면 나이를 계산할 수 있고, 언제 학업이나 직장생활을 시작했는지 파악할 수 있습니다.때에 따라선 지금 내가 이러고 있을 때가 아니란 직감을 받을 수도 있습니다. 맥락이 가지는 힘이죠.
데이터의 맥락은 데이터가 수집된 상황과 조건, 설정까지 포함합니다. 예를 들어, 온라인 설문을 통해 수집된 고객 데이터와 오프라인 매장에서 대면을 통해 수집된 데이터는 서로 다른 맥락을 가집니다. 전자는 설문조사 디자인과 자기 보고 편향에 의해 영향을 받을 수 있지만, 후자는 대면채널의 경력에 따라 영향을 받을 수 있습니다. 방문고객과 비방문고객의 차이도 분명히 존재하고요. 판매 아이템에 따라선 수집 시간대나 기상상황의 영향을 받을 수도 있습니다. 파일명이나 레이블은 고객 데이터로 같을 수 있지만 그 내용은 완전히 다른 데이터입니다.
데이터의 맥락을 이해하지 못하면, 데이터를 정확하게 해석하고 효과적으로 사용할 수 없습니다. 데이터의 맥락을 무시하면, 데이터의 진정한 가치를 추출할 수 없으며 활용이 제한됩니다. 엉뚱한 데이터를 가지고 올 수도 있죠. 데이터의 일관성과 정확성, 신뢰성과 완전성 역시 확보할 수 없습니다. 이는 데이터의 적합성을 떨어트리고, 의사결정의 신뢰성을 떨어뜨립니다. 잘못된 의사결정이나 분석과정에서 치명적인 오류로 이어질 수 있습니다.
진짜 의도를 파악하지 못하면 불필요한 트러블이 생긴다
Why를 붙이고 생각한다
앞서 분석은 현상의 재구성이란 말씀을 드렸었죠. 현상의 재구성은 숨겨진 맥락을 이해하는 것으로부터 출발하기에 분석가는 주어진 데이터의 맥락을 이해하는 데 모든 역량을 기울여야 합니다. 팁을 하나 드리자면 프로젝트 시작부터 머릿속에 '맥락이해... 맥락이해..' 하며 넣고 있는 게 속 편합니다. 온갖 통계기법과 최신의 도구를 써서 분석을 진행해도 결국은 이 과정으로 돌아오게 되거든요. 데이터가 수집된 이유, 방법, 맥락을 이해하는 작업은 데이터를 정확하게 해석하고 효과적으로 사용하는 데 필수적입니다. 분석가는 데이터의 맥락을 고려하여, 데이터가 전달하는 정보의 의미를 정확하게 이해하고, 이를 바탕으로 더 나은 해법과 의사결정을 내려야 합니다.
데이터의 맥락을 이해하기 위해선 질문을 끊임없이 던져야 합니다. 그렇다면 우리는 어떤 질문을 던져야 할까요.가장 간단하면서 적절한 질문은 'Why?'입니다. 여기서 'Why?'는 받아 든 데이터의 수치에 의존하지 말고 그 수치가 발생한 상황과 그 안에 담긴 발생요인을 함께 고려해봐야 한다는 의미입니다. 저는 크게 심리학적 - 질적 - 문화사회적 - 과거패턴의 4가지의 관점에서 곱씹고 던져봅니다.
1. 심리학적 관점 : 심리와 행동 패턴에 대한 의문에서 출발합니다. 예를 들어, 사용자들이 특정 시간대에 왜 특정 행동을 취하는지에 대해 알고 싶다면 심리적 동기를 추정하고 분석하는 것이 필요합니다.
2. 질적 관점 : 양적 데이터는 큰 틀을 보여주지만, 속내를 읽어내기에는 한계가 있습니다. 후기나 인터뷰와 같은 질적 데이터를 함께 활용해 보세요. 질적 데이터에서 확인된 부분과 양적 데이터가 다른 경우가 꽤 있습니다..
3. 문화적, 사회적 관점 : 인간은 개인의 특성만큼이나 속한 사회와 문화적 배경에 크게 영향을 받습니다. 개인의 특정 행동은 속한 집단의 사회적 규범이나 문화적 가치에 의해 결정될 수 있다는 점을 염두에 두어야 합니다.
4. 과거 패턴과 예측의 관점 : 과거의 패턴을 통해 미래의 행동을 예측할 수 있습니다. 하지만 그 예측이 늘 맞아떨어지는 건 아니기에 주의가 필요합니다. 단순한 반복이 아닌, 일정 부분 인과성이 담보되는 조건을 찾아내고 모니터링하고 있어야 예측의 확률을 높일 수 있습니다.
다 보인다야. Why를 항상 붙이고 다니라
데이터를 제대로 읽어내는 기술은 숫자의 해석을 넘어, 그 숫자에 숨겨진 인간의 복잡한 행동 메커니즘을 이해하는 데서 출발합니다. 사용자 행동의 일부만이 데이터로 남을지라도, 그 속에 담긴 진짜 의도를 파악함으로써 우리는 비로소 현상을 정확히 이해할 수 있게 됩니다. 불완전한 인간의 행동을 깊이 이해하려는 노력만이 방대한 데이터를 제대로 해석하고, 이를 통해 더 나은 결정을 내리는 유일한 방법입니다.