'인과관계'로 해석되는 '상관관계'

데이터라는 이름 뒤에 숨겨진 엔지니어의 고뇌

by 구형라디오

현장에서 신제품 불량 문제로 고객과 토론을 벌이다 보면, 늘 마주하는 거대한 벽이 하나 있습니다.

바로 '원인'입니다.


사실 현장의 불량은 수많은 변수가 뒤섞인 복합적인 결과물입니다. 모든 것을 논리적으로 설명하기란 불가능에 가까울 때가 많죠. 하지만 비즈니스의 세계에서는 '모른다'거나 '복잡하다'는 말은 무책임으로 치부되곤 합니다. 그래서 우리는 흔히 데이터의 힘을 빌립니다.

X라는 지표를 건드렸더니 Y가 개선되었다는 결과, 그리고 그 사이를 예쁘게 잇는 산점도(Scatter Plot)와 높은 결정계수(R-Square)를 보여주며 승전보를 올립니다.

그 순간, 내 머릿속에는 차가운 목소리가 들려옵니다.

"이건 인과관계(Causality)가 아니라, 그저 상관관계(Correlation)일 뿐이야."



아이스크림과 화상의 역설

우리는 통계의 함정을 설명할 때 흔히 아이스크림 예시를 듭니다. 아이스크림 판매량과 햇빛에 의한 화상 빈도는 매우 높은 상관관계를 보입니다. 하지만 아이스크림을 못 팔게 한다고 해서 사람들의 화상이 줄어들까요? 당연히 아닙니다. 그 뒤에는 '여름'이라는 숨겨진 변수 Z가 존재하기 때문입니다.

수학적으로는 명확하지만, 현실의 업무에서는 이 Z를 인정받기가 참 어렵습니다. 엔지니어조차 때로는 높은 상관계수만으로 모든 것이 설명되기를 기대하곤 하니까요.



경영자가 원하는 '만병통치약'

실무자가 상관관계를 인과관계로 강제로 해석해 보고하는 이유는 명확합니다.

조직의 윗선, 즉 경영진은 '만병통치약'을 원하기 때문입니다.


"이 문제의 치명적인 원인은 딱 이것 하나입니다. 이것만 고치면 해결됩니다."


이 한마디가 주는 안도감은 생각보다 강력합니다. 경영자들에게 복잡한 확률과 변수의 조합을 설명하는 것보다, 명쾌한 원인과 결과의 서사를 들려주는 것이 훨씬 '유능한 보고'로 평가받는 것이 서글픈 현실입니다. 결국 실무자는 본인의 업무적 안위를 위해, 혹은 보고의 효율성을 위해 상관관계를 인과관계라는 화려한 포장지로 감싸게 됩니다.



데이터의 시대, 우리가 잃어버린 것

세상의 모든 이치를 수학적으로 밝혀내려는 시도는 숭고합니다. 하지만 때로는 설명하기 어려운 현상이 있고, 도저히 논리적으로 변명(Excuse)할 수 없는 영역도 존재합니다.

상관관계와 인과관계의 차이를 정확히 아는 사람이 많아졌으면 좋겠습니다. 아니, 설령 그 차이를 알더라도 "지금 우리가 보고 있는 것은 단순한 상관관계일 뿐이며, 진짜 원인은 더 깊은 곳에 있을 수 있다"라고 말할 수 있는 솔직함이 용인되는 조직 문화가 간절합니다.


오늘도 나는 산점도 위에 그려진 예쁜 직선을 보며 자문합니다.

나는 지금 진실을 말하고 있는가, 아니면 보고를 위한 '포장'을 하고 있는가. 데이터의 홍수 속에서 우리가 진짜 찾아야 할 것은, 어쩌면 화려한 그래프가 아니라 '모르는 것을 모른다'고 말할 수 있고 인정할 수 있는 본질에 대한 겸손함이 아닐까 싶습니다.


#상관과계 #인과관계

매거진의 이전글협상의 기술 - 벼랑 끝 전술에 대처하는 법