우리는 왜 숫자를 보면 안심할까?
엑셀 표에 정리된 값, 대시보드에 올라간 그래프를 보면 ‘객관적’이라고 느끼는 이유는 무엇일까?
이 글은 데이터 분석 기법을 설명하려는 것이 아니다. 통계학 이론을 비판하려는 것도 아니다. 내가 다루고 싶은 것은 더 단순하다. 우리가 현장에서 데이터를 사용할 때, 그 숫자를 어떻게 해석하고 있는가에 대한 질문이다.
나는 데이터를 불신하지 않는다. 오히려 데이터는 현장에서 가장 강력한 도구다. 다만 한 가지 전제가 필요하다. 데이터는 사실을 기록하지만, 진실을 스스로 설명하지는 않는다. 숫자는 맥락 없이 존재하지 않는다. 그리고 그 맥락은 대부분 사람이 만든다.
현장에서 충분히 일어날 수 있는 사례를 하나 보자.
직원 12명의 소규모 제조기업이 있다. 금속 부품을 납품하는 곳이다. 대표는 최근 매출이 15% 감소했다는 보고를 받았다. ERP에서 월별 매출을 정리한 그래프는 명확했다. 전년 동기 대비 하락이다.
대표는 영업팀에 압박을 준다. “영업이 문제다.”
그런데 데이터를 조금 더 들여다보면 어떨까?
거래처 수는 유지되고 있다.
신규 거래처는 오히려 2곳 늘었다.
평균 단가가 12% 낮아졌다.
왜 단가가 낮아졌을까?
원가 상승 때문일까?
경쟁사 덤핑 때문일까?
아니면 특정 대형 거래처의 단가 인하 요구 때문일까?
여기서 데이터는 이미 선택된 결과다. 매출 총액이라는 숫자 하나만 보면 ‘영업 부진’처럼 보인다. 하지만 구성 요소를 나누면 이야기가 달라진다. 더 들어가 보면 특정 거래처 한 곳이 전체 매출의 38%를 차지하고 있고, 그 거래처의 발주 수량이 일시적으로 줄어든 것이 원인이었다.
데이터는 거짓말을 하지 않았다.
하지만 우리가 본 데이터는 전체가 아니었다.
문제는 여기서 시작된다.
우리는 종종 데이터를 ‘중립적인 사실’이라고 부른다. 그러나 데이터는 세 가지 과정을 거친다.
첫째, 무엇을 측정할지 선택한다.
둘째, 어떻게 집계할지 설계한다.
셋째, 어떤 지표를 먼저 보여줄지 결정한다.
이 세 단계는 모두 인간의 판단이다.
따라서 데이터는 완전히 중립적일 수 없다.
데이터 편향은 거창한 알고리즘 이야기만이 아니다.
현장에서 가장 흔한 편향은 ‘측정 편향’이다. 매출만 보고 마진을 보지 않는 것, 수량만 보고 단가를 보지 않는 것, 월별 합계만 보고 고객 구성을 보지 않는 것.
또 다른 문제는 맥락 손실이다.
예를 들어, 생산 불량률이 2%에서 3%로 올랐다고 하자. 숫자만 보면 50% 증가다. 그러나 검사 기준이 강화되었다면 이 상승은 오히려 품질 관리 개선의 결과일 수 있다.
숫자의 착시는 비율에서 더 자주 발생한다.
전환율이 1%에서 2%로 올랐다면 두 배 증가다. 하지만 모집단이 100명인지, 5명인지에 따라 해석은 완전히 달라진다. (모집단 규모에 따른 통계적 유의성 검토 필요)
우리가 흔히 하는 착각은 이것이다.
“데이터는 감정보다 낫다.”
물론 감각만으로 의사결정을 하는 것은 위험하다. 하지만 데이터도 맥락 없이 사용하면 또 다른 감정이 된다. 숫자는 권위를 가진 감정으로 변한다.
정리해보자.
데이터를 이해하려면 최소 세 가지 구조로 나누어 봐야 한다.
측정 구조: 무엇을 수집했는가? 무엇은 빠져 있는가?
집계 구조: 합계인가, 평균인가, 중앙값인가?
해석 구조: 이 숫자가 나온 배경은 무엇인가? 일시적 요인인가, 구조적 변화인가?
이 세 가지를 분리하지 않으면 데이터는 설명이 아니라 오해를 만든다.
현장에서 바로 점검해볼 수 있는 질문은 단순하다.
첫째, 이 숫자는 어떤 기준으로 수집되었는가?
둘째, 이 지표를 구성하는 하위 항목은 무엇인가?
셋째, 최근에 기준이나 환경이 바뀐 것은 없는가?
넷째, 반대 방향의 지표는 무엇을 말하고 있는가?
예를 들어 매출이 감소했다면, 거래처 수, 평균 단가, 재구매율, 원가율을 함께 보아야 한다. 한 지표만 보면 방향이 왜곡된다.
데이터는 필요하다.
하지만 데이터는 설명되지 않으면 위험하다.
숫자는 중립적인 기록일 수 있다.
그러나 우리가 무엇을 보고, 무엇을 먼저 보여주고, 무엇을 해석으로 붙이는지에 따라 완전히 다른 결론이 나온다.
그래서 질문은 이것으로 남는다.
지금 보고 있는 이 숫자는, 정말 현장을 반영하고 있는가?
아니면 우리가 보고 싶은 방식으로 정리된 결과인가?