데이터 분석이라는 말이 흔하기 때문에 별생각 없이 말하곤 한다. 나도 자주 분석을 한다라덜지, 분석가라는 말을 자주 사용한다. 그러다가 어느 순간, 과연 분석이라는 단어는 무엇을 지칭하는 것인가라는 생각이 든다. 익숙한 단어도 곰곰이 생각해보면 그 의미를 잘 모른다라는 것을 깨닫는다. 분석이라는 단어가 그렇다.
분석은 사고 과정일까, 어떠한 결과물일까? 예를 들어, 코딩은 과정이고 코드, 혹은 소프트웨어는 결과물이다. 분석한다라고 말을 할 때의 분석은 행동을 의미한다. 그럴 때의 분석은 사고 과정을 의미할 것이다. 분석을 통해 나온 숫자, 그래프, 스토리 등은 결과물일 것이다. 하지만 숫자나 그래프, 스토리가 없다면 분석은 생각으로만 존재할 뿐이지 영향을 주지 못한다. 반대로 분석한다는 사고 과정이 없으면 결과물이 없다. 따라서 지금은 사고 과정 자체에 집중을 해보겠다.
분석한다는 사고 과정에 대해서 조금 더 생각해보자. 분석한다는 사고과정이 “분석”을 뜻한다면, 분석적 사고라는 말과 분석은 동일한 의미일 것이다. 분석적으로 사고한다는 것이 어떤 것을 의미할까? 그것은 과학적 사고, 전략적 사고나 논리적 사고와는 어떻게 다를까? 사실 개념과 개념, 의미와 의미는 완전히 분리되지 않는다. 서로의 겹치는 부분과 겹치지 않는 부분을 통해 그 의미를 더욱 깊이 알아갈 수 있다.
아주 단순한 것을 생각할 때, 분석적 사고를 하지 않는다. 예를 들어, 해가 뜨는 것에 대해 분석적 사고를 하는 사람은 많지 않다. 보는 것이 그대로 명제가 되고 있기 때문이다. 하지만, 어떠한 현상이나 대상을 관찰하지만 그것에 대해서 이해할 수 없을 때 우리는 그 대상을 “복잡하다”라고 이야기한다. 인류는 이러한 복잡한 대상을 이해하기 위해 많은 노력을 해왔다. 철학과 과학에서 복잡한 대상은 단순한 것의 복잡한 연결이라고 보는 경우도 많다.
어쩌면 어렸을 때부터 배운 과학과 철학의 영향으로 복잡한 것을 보았을 때, 그것은 단순한 것들로 이루어져 있고 그 단순한 것들이 서로 어떻게 연결되어 있는지 알 수 있다면 복잡한 것을 이해할 수 있다고 생각하곤 한다. 따라서 분석에는 복잡한 것에 대한 관찰이나 발견이 선행하고, 분석에는 복잡한 것을 단순한 것으로 나누는 과정이 들어있다.
예를 들어, MAU와 같은 사용자 수를 생각해보자. 사용자 수는 시간에 따라 늘기도 하고 줄기도 한다. 만약 사용자 수라는 대상이 복잡하지 않다면 분석이 필요하지 않을 것이다. 예를 들어, 내 가족 10명이 서비스를 사용해줘서 MAU가 10명이 되었다면 분석은 필요하지 않다. 왜냐하면 대상이 복잡하지 않기 때문이다. 복잡하지 않다는 것은 “모름”의 영역이 아니라 “앎”의 영역에 있다는 것을 의미하지 않을까? 따라서 탐험을 할 가치가 있는 것이라고 인식하지 않는다.
하지만 100만 명이 서비스를 사용하고 있다고 해보자. 이 수가 늘거나 줄고 있다면, 10명에 비해 복잡하다고 느낄 수밖에 없다. 100만의 사람들이라는 대상은 앎의 영역이라기보다는 모름의 영역일 가능성이 높기 때문이다. 게다가 100만 명의 사람들이 사용하고 있는 서비스는 10명의 사람들이 사용하고 있는 서비스보다 많은 사람들이 참여해서 만들고 있을 가능성이 크다. 서비스를 사용하는 사람들, 그 사람들 사이의 관계, 서비스를 만드는 사람들, 서비스를 만드는 사람들 사이의 관계로 인해 복잡도는 상당히 커진다.
이렇게 비대해진 복잡도는 기존에 이해 가능했던 것을 이해 불가능한 것으로 만든다. 이해 불가능한 것은 “모른다”의 영역에 있다. 만약 과학이 “모르는 것”을 인정하고 그 모르는 것을 “아는 것”으로 바꾸기 위해 노력하는 것이라면 이때, 우리가 하는 행동은 과학일 것이다. 따라서 복잡한 대상을 이해하는 것이 꼭 “분석”을 필요로 하지 않는다.
하지만, 분석은 그 정의대로 따라가보면 그 개념이 상당히 단순하다. 복잡한 것을 단순한 것으로 나눈다. 즉, 모든 것은 나뉠 수 있다는 가정을 깔고 있기 때문에 단순하다. 그렇기 때문에 보편적으로 빠르고 쉽게 누구나 시작할 수 있는 것이다. 만약 부분들을 만들고 그걸 조립해서 전체를 만들었다면 그 반대의 과정으로 다시 전체에서 부분으로 나누는 것은 어렵지 않을 것이다. 하지만 요리와 같이 화학적 반응을 통해 부분과 부분이 결합해서 전혀 다른 무엇인가가 되었다면 다시 부분으로 나누는 것은 상당이 어려운 일이 된다.
따라서 분석을 시작하는 것은 쉽지만 그 대상이 형성되어 왔던 과정에 따라 분석을 통해 대상을 이해하는 것은 상당히 어려운 일이 될 수도 있다. 그렇다면 분석을 시작하기 전에 분석이 현재 상황에 맞는지 안 맞는지를 알 수 있을까? 그것 또한 사실 어려운 일일 가능성이 크다. 그래도 미리 생각해보자면, 위에서 말한 것처럼 복잡한 대상이 어떠한 개별적인 것을 통해 합쳐진 것을 알 수 있고, 화학적 변화를 통해 더 이상 그 개별적인 것을 구분할 수 없는 것이 아니라면 분석이 유용할 가능성이 크다.
예를 들어, 사용자 수는 개별 사용자의 합으로 만들어진 개념이다. 또한 사용자 수라는 합으로 변화되었을지라도, 개별 사용자로 여전히 구별해서 볼 수 있다. 따라서 분석이 용이한 대상이라고 볼 수 있다. 하지만, 동일한 성질의 것들 100만 개로 나누어 보는 것은 분석일지 몰라도 “모르는 것”을 “아는 것”으로 만들어주는 분석은 아닐 것이다. 따라서 100만 명과 1명의 100만이라는 개념들 사이의 어떤 개념을 찾아내는 것이 분석 과정에서 아주 중요할 것이다.
사실, 100만 명과 1명의 100만이라는 개념들 사이의 어떤 개념은 무수히 많은 존재가 될 수 있다. 분석을 통해 나온 개념이 무수히 많다면 분석을 하지 않는 것과 결과적으로 큰 차이가 없다. 따라서, 어떠한 목적과 방향성에 따라서 최소 구분 단위를 찾아내야 한다. 그것이 분석적 사고에서 가장 어려운 부분일 것이다. 어쩌면 그것을 위해 “왜 복잡한 대상에 대해서 궁금하게 되었는지?” “복잡한 대상을 이해해서 무엇을 하려고 하는 것인지?”에 대한 이해가 필요하고 그런 이해를 위해 논리적 사고와 전략적 사고가 필요할지도 모른다.
실제로 분석가로서 일하면서 많은 분석을 하면서 느낀 것은 입구는 상당히 넓지만 출구는 상당히 좁은 느낌이라는 것이다. 즉, 시작하기는 쉽지만 유의미한 결과로 이어나가는 것은 어려운 일이라는 것이다. 따라서 단지 “분석” 만으로 항상 성공을 만들어내는 것은 어렵다는 생각이 들었다. 분석과 다른 것 (예를 들어 실험)을 적절히 조합하면서 원하는 목적을 달성하는 성공확률을 올리는 방법에 대해서 고민하게 되었다.