데이터드리븐은 어렵고, 예민하다

by Sam의 기억 궁전


데이터드리븐이라는 말은 조직에 자주 등장하지만, 실제로 조직의 의사결정 과정에 들어가 보면 그 단어는 종종 ‘장식용 수식어’에 가깝다. 진정한 데이터드리븐은 멋진 그래프가 아니라 반복 가능한 실험 문화에서 시작된다. 특히 A/B 테스트는 이 문화의 가장 기본적인 언어인데, 가끔은 지나치게 단순해 보이는 이 언어가 조직 전체의 사고방식을 바꾸는 데 결정적 역할을 한다. 실험가들 사이에서는 “A/B 테스트는 단순해 보이지만, 실제론 인간관계를 제외한 모든 변수를 통제해야 한다”는 말을 버릇처럼 한다.


실험의 핵심은 당연히 데이터지만, 이 데이터가 유효하려면 실험 이전 단계, 즉 실험의 ‘문법’이 엄격하게 정리되어야 한다. 랜덤화의 품질, 실험군 구분, 지표 정의, 최소 효과 크기 설정 등, 겉으로는 사소해 보이는 이 요소들이 실제로는 실험 전체의 신뢰도를 좌우한다.


경험이 쌓인 실험가는 실험 결과보다 먼저 “랜덤화가 제대로 되었는지”를 본다. 왜냐하면 실험 직후 지표가 8% 상승한 것처럼 보이는 순간, 대부분의 실험에서는 “우연히 실험군이 잘 들어온 것”이라는 현실을 수없이 겪어봤기 때문이다. 마치 라면을 끓이는데 물 조절을 실패하고 맛이 이상해졌는데, “스프가 문제였다”고 우기는 초보자의 모습과 비슷하다.


또한 실제로 실험을 수십 차례 반복해 보면, 예상과 달리 결과가 기묘한 패턴을 보일 때가 정말 많다. 예를 들어 어떤 제품에서는 온보딩 플로우를 단축하는 실험을 했더니 전환율이 떨어졌다. 처음엔 모두가 의아해했지만, 결국 기존의 긴 온보딩이 오히려 ‘서비스의 세계관’을 설명해 주는 기능을 하고 있었던 것이다. 이런 경험은 “실험은 정답을 보여주는 도구가 아니라, 조직이 스스로를 이해하게 만드는 거울”임을 깨닫게 한다.


조기 종료는 더욱 비극적이다. 실험을 시작한 지 24시간 만에 전환율이 높게 나타나면 누구나 즉시 결론을 내리고 싶어 한다. 하지만 실험가들은 이를 “초기 요란, 최종 미미” 패턴이라고 부른다. 표본이 충분히 쌓인 뒤 결과가 뒤집히는 경험을 반복하다 보면, 결국 한 가지 법칙을 자연스럽게 체득하게 된다.


결국, 충분한 샘플 없이 보이는 모든 변화는 환상이다.

데이터드리븐이 조직을 변화시키는 진짜 이유는 실험의 성공 때문이 아니라, 실험이 실패할 때 생기는 메커니즘 모델 때문이다. 실패는 조직에게 “왜 이런 결과가 나왔는지”를 물어보게 만들고, 그 질문에 답하려는 과정에서 제품과 사용자 행동에 대한 구조적 이해가 축적된다. 즉, 실패를 반복하다 보면 어느 순간 조직이 ‘실험 중심 언어’를 자연스럽게 구사하기 시작한다. 마치 매운 라면을 여러 번 먹다 보면 스코빌 수치를 몸으로 이해하게 되는 것과 크게 다르지 않다. 결국, A/B 테스트는 결과로 판단되는 기술이 아니라, 생각하는 방식 자체를 변화시키는 철학적 장치에 가깝다. 이때 데이터드리븐이라는 말이 공허한 수식어를 넘어, 조직을 실제로 움직이는 언어가 되는 순간이다.

keyword
작가의 이전글스타트업 ‘나 혼자 회사’의 새로운 표준