brunch

You can make anything
by writing

C.S.Lewis

by 여름비 Sep 26. 2022

데이터는 언제 "존재"하는가

데이터 있다고 없는 것 아니고, 없다고 있는 것 아니다

근래에 링크드인으로 글에 대한 흥미로운 피드백이 왔다. 그 피드백으로 인해, 과연 회사에 언제 데이터가 "존재"한다고 할 수 있는가에 대한 생각을 해보았다.


많은 회사들이 상품 생산, 판매, 재고관리, 그리고 고객 행동에 관한 내부 데이터, 그리고 외부로부터 구매 및 취득한 외부 데이터를 가지고 있다. 설령, 내가 말한 모든 종류의 데이터를 가지고 있지 않더라도, 현시대에서 어떤 회사를 가더라도 그 회사는 적어도 오퍼레이션을 위해서라도 일종의 데이터를 가지고 있을 수 밖이 없다. 따라서 데이터라는 말을 들으면 우리는 쿠팡 및 기타 IT 회사를 떠올리지만, 모든 회사가 생존을 위해 이런저런 형식의 데이터를 가지고 있다. 단지 그것이 가치 있게 사용되는가 아닌가의 차이일 뿐.


하지만, 데이터를 가지고 있다는 것이 데이터가 회사에 존재한다는 의미일까? 나는 그렇지 않다고 생각한다. 데이터의 존재함을 증명하기 위해서는, 데이터 이전에 문제 발굴이 선행되어야 한다. 왜냐하면 데이터는 그 자체로는 의미가 하나도 없고, 어떤 문제를 풀기 위해 사용될 때 비로소 그 쓰임이 "발굴" 되는 것이다. 그리고 그렇게 발굴되고 나서야 비로소 데이터는 그때부터 quality assurance, 데이터 설계, 데이터 모델링 등의 과정을 통해 유의미한 데이터로 거듭난다. 마지막으로 이렇게 정제된 데이터가 사용되어 성과를 올릴 때 우리는 비로소 그 데이터가 회사에 "존재"한다고 할 수 있다.


따라서 어떤 문제 풀지, 그리고 그 문제를 풀기 위해서는 어떤 데이터가 필요한지 정의되어 있지 않은 상태에서 쌓인 데이터, 그리고 문제에 따라 가공되지 않고 만들어진 그대로 엑셀 시트 및 데이터베이스에 쌓인 데이터는 가치적으로 없는 것과 마찬가지이다. 물론, 데이터가 쌓일 때부터 특정 문제의 해결을 고려하여 쌓인다면 그런 데이터는 쌓임과 동시에 유의미하게 존재한다고 할 수 있다. 



이는 조금 틀어서 생각해보면, 내가 어떤 포지션에 있고 그래서 어떤 문제를 풀어야 하는가에 따라, 내 입장에서는 회사에 데이터가 존재하지 않지만, 다른 포지션 입장에서는 데이터가 존재할 수도 있다는 것이다 (이것이 바로 양자물리?)


재미있는 것은, 대부분의 회사의 경우 데이터는 그냥 쌓일 뿐, 그 데이터에 알맞은 문제가 사전에 정의되어 있지 않다는 것이다. 예를 들어 많은 회사들이 GA를 통해 데이터를 쌓는다. GA가 자동으로 데이터를 수집 하기에 굉장히 다양한, 그리고 많은 데이터가 회사에 쌓이기 시작하고, 회사 내부 구성원들은 우리 회사에 데이터가 존재한다고 믿는다. 문제는, 누구도 어떤 목적으로 왜 이런 데이터를 쌓을지 심도 있게 고민하지 않았기 때문에, 회사의 누구도 이것을 어떻게 사용해야 하는지 모르고 그냥 쌓기만 한다는 것이다. 이렇게 사용되지 않고 무작정으로 quality assurance 없이 쌓이는 데이터는, 과연 회사에 존재하는, 즉 무언가 유의미한 가치를 전달할 수 있는 데이터인가? 전혀 아니다.


이런 관점에서 보면, 아무리 데이터가 많이 그리고 다양하게 쌓이는 IT 회사 이더라도, 실질적으로는 회사 내에 데이터가 존재하지 않을 수 있다.


이렇게 문제와 쓰임에 대한 고려 없이 정의된 데이터를 보고 있자면, 회사의 구성원들은 답답함을 느낀다. 우리 회사는 데이터가 많이 있는데, 왜 사용이 되지 않고 있을까? 이전에 GA를 사용하는 회사에 다닐 때 잠깐 느낀 것은, 보통의 경우 아래와 같은 문제들이 연쇄적으로 존재하기 때문이다


1. 회사의 미션이 없다 (어떤 문제를 풀 것인가에 대한 정의)

2. 어떤 문제를 데이터로 풀 수 있는지 아는 사람이 없다 (데이터 활용자 없음)

3. 데이터를 사용하여 의사 결정할 수 있는 환경이 아니다 (모든 데이터가 엑셀 시트에 쌓이고 있다. 데이터 가지고 가면 뭔 소리냐고 한다)

4. 그래서 단계적으로 데이터 환경을 어떻게 만들어 나아갈지 아무도 모른다 (데이터 전략 없음)


위의 문제의 핵심은 무엇일까?

데이터 활용에 대한 전반적인 이해 및 충분한 도메인 지식을 모두 갖추고 있는 사람이 회사 내에 없다는 것이다. 이상적으로는 임원 중 한 명이 그런 사람이면 좋겠지만, 보통의 경우 그렇지 못한 것이 현실이다.


따라서, 만약 내가 위와 같은 데이터가 존재하는지 알 수 없는 환경에 처한다면, 과연 내가 풀고자 하는 문제는 무엇이고, 그 문제가 데이터로 풀 수 있는 문제인지 확인하고, 풀 수 있는 문제라면 과연 데이터를 모으로 사용할 수 있는 환경인지 먼저 알아볼 것이다


참조 : 서비스를 성장시키는 데이터 분석가는 어떻게 일을 하는가





작가의 이전글 회사 종류에 따른 데이터 활용 업무

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari