brunch

2회. 데이터는 사실을 말하지 않는다

숫자 너머의 진실을 읽는 법

by DataSopher
숫자 너머의 진실을 읽는 법.png



데이터는 사실을 말하지 않는다


가끔 이런 착각이 세상을 지배합니다.

“데이터는 거짓말을 하지 않는다.”

분석을 오래 해본 사람들, 기술과 시장을 오랫동안 들여다본 사람들일수록 이 문장을 조용히 뒤집습니다.

데이터는 거짓말을 하지 않지만 우리가 듣고 싶은 것만 말하게 만들 수 있다.

이게 문제의 시작입니다.





1. 데이터는 ‘현상’일 뿐 ‘본질’을 설명하지 않는다


우리가 손에 쥐는 데이터는 언제나 이미 세상에 드러난 결과물입니다.

매출이 떨어졌다, 사용자 수가 증가했다, 시장 점유율이 하락했다

이것은 ‘현상’의 기술이지 ‘이유’의 설명이 아닙니다.


문제는 많은 조직이 이 현상을 인과관계로 착각한다는 점입니다.

숫자는 원인을 말해주지 않습니다.

숫자는 “일어났다”만 말해줄 뿐입니다.


어떤 앱의 이탈률이 10% 증가했다고 해봅시다.

이탈의 원인은 오히려 데이터 밖의 영역에 있을 때가 많습니다.


- UX의 맥락적 불편함

- 외부 경쟁자의 프로모션

- 국가적 이슈로 인한 사용 패턴 변화

- 사람들의 감정, 분위기, 문화적 변곡점


데이터는 이 모든 것의 그림자를 드러낼 뿐이고

우리는 그 그림자를 보고 원본을 추정해야 합니다.

그래서 데이터 분석은 숫자 너머를 추론하는 지적 노동입니다.





2. 데이터는 항상 ‘누군가의 선택’으로 구성된다


데이터가 객관적으로 보이는 이유는 그것이 표 형태로 정리되어 있기 때문입니다.

하지만 그 표에 들어가기까지 수많은 선택이 존재합니다.


- 어떤 데이터를 수집할 것인가

- 어떤 기준으로 정제할 것인가

- 어떤 범위를 남기고 무엇을 제거할 것인가

- 어떤 분석 모델에 태울 것인가


즉 데이터는 자연적으로 생성되는 원석이 아니라

인간의 정의(definition)를 거쳐 만들어지는 구조물입니다.


그래서 “데이터 기반 의사결정(Data-driven decision making)”이라는 말은

정확히 말하면 “데이터를 만든 사람의 사고 기반 의사결정”이라는 표현에 더 가깝습니다.


지표가 왜곡되면 판단이 왜곡되고, 정의가 잘못되면 전략도 엉뚱한 방향으로 달려가죠.





3. 데이터의 가장 큰 적은 ‘편향’이 아니라 ‘침묵’이다


우리의 뇌는 ‘보이는 것’을 전체라고 착각하는 경향이 있습니다.

데이터에서도 마찬가지입니다.

데이터가 말해주는 것보다 더 위험한 것은 데이터가 말하지 않는 것들입니다.


고객 VOC 데이터가 500건 있다고 할게요.

이 500건은 불만을 가진 일부 고객층의 목소리일 뿐

침묵한 95%의 고객이 무엇을 느끼는지는 완전히 알 수 없습니다.


우리가 볼 수 있는 데이터는 전체 시장의 한 단면에 불과합니다.

이 침묵의 영역을 읽지 못하면 분석은 언제나 반쪽짜리가 됩니다.





4. 데이터 분석가는 ‘철학’을 가져야 한다


데이터를 해석한다는 것은 세상을 보는 한 개인의 인식론(Epistemology)이 개입되는 일입니다.


좋은 분석가와 뛰어난 분석가의 차이는 관점입니다.


- 현상을 본질로 착각하지 않는 시선

- 숫자 뒤에 존재하는 사람의 의도와 감정에 대한 이해

- 데이터가 말하지 않는 것까지 질문하는 태도

- 한계를 인정하고 불확실성을 계산하는 겸손함



여기서 철학이 등장합니다.

철학은 “무엇이 사실인가?”를 묻는 학문입니다.


데이터가 말해주는 ‘보이는 사실’과

그 뒤에 숨은 ‘보이지 않는 진실’을 분리하는 힘

이것이 철학적 데이터 해석입니다.





5. 해외 기관들이 왜 ‘데이터 과신(Data Overtrust)’을 가장 위험한 리스크로 지적할까


MIT, World Economic Forum, McKinsey, PwC 등 글로벌 기관들은

잊지 않고 경고합니다.


“데이터는 진실이 아니라 해석의 재료다.”


4가지 리스크를 강조합니다.


- AI 모델은 편향된 데이터를 학습하며 그 편향은 증폭된다.

- 정량 지표에 치우칠수록 정성적 신호를 놓친다.

- 데이터 중심 문화는 오히려 사람의 직관을 마비시킬 수 있다.

- 데이터의 양이 많아질수록 잘못된 상관관계를 인과로 오해한다.


이 기관들이 이야기하는 핵심은 한 가지입니다.

데이터는 탐구하는 도구다.





데이터가 모든 것을 설명한다고 믿을수록

우리는 해석의 오류에 빠집니다.


데이터가 완벽하지 않다는 사실을 인정하는 순간,

훨씬 더 정교한 판단을 할 수 있게 됩니다.


데이터는 지도가 아닙니다.

좌표를 해석해 방향을 정해야 합니다.

데이터는 나침반일 뿐이며,

방향을 선택하는 건 사유하는 인간입니다.






데이터를 다루는 사람에게 가장 중요한 능력은

“해석의 깊이”입니다.



데이터를 사유의 언어로 삼아,

숫자를 넘어 구조를 보고, 구조를 넘어 본질로 들어가는 힘

이 힘이 분석가를 성장시키고, 장기적 판단을 가능하게 합니다.



데이터를 믿지 말라는 말이 아닙니다.

데이터를 과도하게 믿지 말라는 이야기입니다.

진실은 늘 숫자 바깥, 인간의 행동과 맥락 속에 존재합니다.



keyword
이전 01화1회. 인간의 ‘빈자리’를 드러낸다