brunch

데이터 분석가란, 세상의 함수를 찾아내는 사람

함수(Function)는 인과관계를 표현하는 또 하나의 언어

by 이건승

우리가 어떤 현상에서 "원인과 결과"를 이야기할 때, 가장 간단한 모델 중 하나가 바로 함수입니다. 함수란, 어떤 입력(x)이 주어졌을 때 이에 대응하는 출력(y)이 정해지는 규칙을 뜻합니다. 만약 우리가 x를 '원인', y를 '결과'로 본다면, 함수는 인과관계를 수학적으로 표현하는 하나의 방식이 됩니다.


예를 들어볼까요?

7aa77530-2159-49a5-a3fa-ac0bb8336fb7.png
0e82fbba-38c9-423e-a73f-bdb47f6fd671.png

✔️ 식사(x)를 하면 혈당 수치(y)가 상승합니다.

✔️ 차량에 기름(x)을 넣으면 주행 가능한 거리(y)가 늘어납니다.


이처럼 원인(x)이 주어졌을 때 결과(y)가 하나로 명확하게 결정된다면, 우리는 이를 "좋은 인과관계"라고 부를 수 있습니다. 수학적으로도 함수는 하나의 x에 대해 단 하나의 y만 대응해야 합니다. 하지만 현실은 그렇게 단순하지 않습니다. 같은 광고비(x)를 썼더라도, 날씨, 경쟁사 이벤트, 소비자 심리 등 수많은 외부 요인에 따라 매출(y)은 들쑥날쑥할 수 있습니다. 즉, 동일한 원인(x)이라도 결과(y)는 언제나 일정하지 않고, 불확실성을 품게 됩니다.


이런 복잡한 현실을 이해하기 위해, 우리는 인과관계를 이렇게 표현합니다.

y = f(x) + 오차(error)

결과(y)는 원인(x)에 의해 설명될 수 있는 부분과, 동시에 설명할 수 없는 '우연'이나 '숨겨진 요인'에 의한 오차(error)로 구성되어 있습니다.


조금 더 쉽게 비유해 볼까요?

함수만으로 세상을 설명하려는 것은, 복잡한 도시의 길을 지도 한 장에 모두 담으려는 것과 같습니다. 큰 방향은 맞출 수 있지만, 미세한 굴곡이나 공사 구간, 돌발상황까지 완벽하게 반영하기는 어렵습니다. 그래서 우리는 항상 지도를 보면서도 예상치 못한 '변수'를 감안해야 합니다.
함수 + 오차 = 현실의 지도

바로 이것이 우리가 세상을 이해하고 예측할 때 가져야 할 기본 관점입니다.

e49ce458-6461-441e-93bd-e77791db658c.png y = f(x) + ε


데이터 분석가란, 세상의 함수를 찾아내는 사람


이러한 관점은 "데이터 분석가의 일"과도 깊게 맞닿아 있습니다.


데이터 분석가는 단순히 숫자를 모으는 사람이 아닙니다. 분석가는 데이터를 통해 현상을 관찰하고, 그 속에 숨겨진 함수를 찾아내려는 사람입니다. 즉, 수많은 x(원인)와 y(결과) 사이의 관계를 읽어내어, 어떤 메커니즘이 결과를 만들어냈는지를 밝혀내려 합니다.


하지만 여기서 중요한 것은, 현실에는 언제나 '오차(error)'가 존재한다는 사실입니다. 모델이 아무리 정교해도, 세상을 완벽하게 하나의 함수로 설명할 수는 없습니다. 그래서 데이터 분석가는 함수만 찾는 데 그치지 않습니다. 예상치 못한 오차와 불확실성까지 감안하여, 보다 현실에 가까운 인과관계를 이해하려고 노력합니다. 그리고 이 과정을 통해 더 나은 결정을 돕고, 더 나은 결과를 만들어내는 것 — 바로 그것이 데이터 분석가의 본질적인 역할입니다.


결국, 데이터 분석이란

세상의 함수를 찾아내고, 오차를 이해하며, 현실 속 인과를 밝혀 더 나은 변화를 이끄는 일

이라고 할 수 있습니다.


16964ebe-3f5b-4e63-bfb7-5ac4ea16abfc.png
5f28c85a-db2a-4d01-8e12-e9dc0314f398.png
데이터 분석가의 일은, 세상의 함수를 찾아내고 오차를 이해하며, 현실 속 인과를 더 밝혀 나아가는 일이 아닐까?




그래서 데이터 분석가는 항상 스스로에게 두 가지 질문을 던집니다.


이 현상의 함수는 무엇인가?
이 결과의 오차는 어디에서 비롯되었는가?


이 질문에 대한 탐구가 멈추지 않는 한, 우리는 더 깊이 이해하고, 더 나은 결과를 만들어갈 수 있을 것입니다.

keyword