데이터 거버넌스에 대해 구조적으로 이해할 수 있는 책
데이터 드리븐, 데이터 리터러시, 그로스해킹 등 빅데이터와 분석적 사고방식에 방점을 둔 개념들은 마치 유행처럼 번지기 시작했다. 실무에 그것을 어떻게 적용할지와는 별개로, 관련 콘퍼런스가 열리기도 하고 원체 자료가 많기도 해서 그 중요성과 이론적 내용을 이해하는데 큰 어려움은 없다. 대부분 '어떻게 분석을 할 것인가?', '문제를 해결하기 위해 무엇이 중요한가?'와 같은 질문들을 던지며, 데이터 분석의 입지와 역할을 강조하는 결론으로 귀결된다.
'데이터 거버넌스'라는 개념은 뜨문뜨문 접하기는 했지만, 정확히 그것이 무엇을 의미하는지는 자료가 많지 않다. 그리고 '데이터 거버넌스'가 중요하다고 말하는 사람들에 비해 여전히 '데이터 드리븐'이 중요하다고 말하는 사람이 압도적으로 많다. 데이터 거버넌스가 정확히 무엇인지 제대로 알고자 했을 때, 마침 이 책이 출판되었고 흥미롭게 읽을 수 있었다.
데이터 거버넌스는 일종의 관리체계이다. HR에 조직문화와 내부 인사정책이 있듯, 데이터 관련 업무에는 데이터의 A to Z까지 관리해야 하는 체계가 필요하다. 데이터를 관리의 대상으로 바라보는 이유는, 그 가치와 규모가 점점 거대해지기 때문이다. 데이터 거버넌스는 "데이터를 통해 문제를 해결할 수 있습니다!"와 같은 달달하고 열정적인 느낌보다는, 데이터를 잘 활용할 수 있는 환경을 구축하는 것에 집중한다. 주로 데이터를 분류하는 일, 권한을 관리하는 일, 보안을 강화하는 일, 품질을 높이는 일 등으로 구성된다. 다만 모든 관리업무의 최종 목적은 효과적인 통제 하의 업무 효율을 높이는 것처럼, 데이터 거버넌스 또한 환경을 잘 구축함으로써 전사 구성원들이 데이터 관련 업무에 효율을 높이는 것이 목적이다.
이 책은 관리체계를 구축하기 위한 사람의 역할 / 필요한 기술 / 갖춰야 할 도구 / 조직 내 절차를 설명한다. 일종의 개념 소개서 같은 느낌이라, 확실한 가이드를 제공해 준다는 느낌은 없다. 다만 읽다 보면 "아 우리 회사에서 이러한 것들을 놓치고 있었구나"라고 느끼는 점들은 있을 것이다. 이를테면 데이터의 품질에 대해 검토해 본 적이 있었는지, 레거시 데이터에 저장비용만 지불하고 있지는 않은지, 많은 사람들이 이해하기 쉽도록 데이터 카탈로그와 권한 신청절차가 정리되어 있는지. 규정 위에 문화가 만들어진다고 생각해 보면, 이러한 환경 구축을 먼저 해놓아야 데이터의 가치를 재발견하고, 분석적 사고방식이 구축되지 않을까 싶다. 이 책은 데이터가 많기는 하지만 그걸로 뭘 해야 할지 모르는 회사에게 큰 도움이 될 수 있을 것 같다.
회사에서 나올 수 있는 '데이터'라는 것을 세 가지 영역으로 쪼개면 제품/매출/비용으로 구분할 수 있을 것 같다. 그리고 보통 업계에서 중요시하는 것은 각 영역별 데이터를 교차분석하는 것이다. 틀린 것은 아니지만, 이 방향은 상당히 관리자적 입장이라 할 수 있다. 왜냐하면 분석의 최종 산출물에만 집중하기 때문이고, 그것을 하기까지의 기반 구축작업은 생략되었기 때문이다. 대다수의 분석가와 경영진들은 그 영역을 개발자의 영역이라 생각하는 것 같다. 하지만 데이터의 품질과 권한관리는 비즈니스에 밀접한 사람이 더 잘 판단할 수 있다. 실제로 데이터 거버넌스는 주로 정책결정에 관한 내용이고, 그것을 데이터 엔지니어들과 자주 논의할 뿐이다. 데이터의 가치를 높이려면 환경이 잘 갖춰져야 한다. Data Warehouse만 있다고 해서 환경이 갖춰졌다고 할 수 있는 시기는 지난 것 같다. 진정 '데이터 드리븐'하고 싶다면 우리에게 어떤 데이터가 있고, 그것을 어떻게 관리하고 있는지부터 살펴봐야 할 것이다.