데이터와 분석을 위한 거버넌스 파운데이션이 필요하다.

무엇을 기준으로 데이터 분석을 할것인가를 생각해 보자

Nov 3. 2021

이 글은 제가 NIA [한국지능정보사회진흥원]의 < 디지털서비스 이슈리포트 > 2021년 10월호에 기고한 글입니다. 원본 글 '데이터와 분석을 위한 거버넌스 파운데이션이 필요하다.'를 이곳 브런치에서도 공유합니다.

데이터를 자산으로 통찰력을 얻는 비용을 절감

정부 기관이나 기업 조직의 모든 리더는 데이터가 중요하다는 사실을 알고 있다. 그것이 없이는 조직을 경쟁에서 앞서 나가게 할 디지털 혁신이 있을 수 없다. 새로운 수익원을 창출하는 분석도 할 수 없을 뿐만 아니라 기본적인 사업 운영도 어렵다. 그러나 데이터가 이러한 이니셔티브에 힘을 실어주려면 그 자체가 고품질화되고 및 관련성을 쉽게 이용할 수 있는 분석이 뒷받침되어야 한다. 우수한 데이터 거버넌스는 이러한 데이터의 속성을 통해 가치를 창출할 수 있다.

거버넌스란 업무 프로세스, 정책 및 정보를 만들고 관리하는 지속적인 프로세스이다. 여기에는 비즈니스 결과를 가속하기 위한 전략, 활동, 조직 및 기술이 포함된다. 이러한 관리를 수행하기 위해 조직, 역할 및 책임을 만드는 작업도 포함된다. 데이터 및 분석 거버넌스에 뛰어난 조직은 지속적으로 프로세스를 관리할 수 있다. 거버넌스는 조직의 의사 결정 문화를 데이터 기반으로 전환하는 데 있어 매우 중요하다.

데이터를 다룰 때 일반적으로 두 가지 유형의 거버넌스에 관해 이야기한다. 데이터 및 분석이다. 데이터 및 분석 거버넌스는 데이터를 자산으로 활용하고 통찰력에 드는 시간과 비용을 절감하는 것이다. 데이터 거버넌스는 데이터 정의, 검색, 데이터 품질 및 이 데이터가 어디서 왔는지를 추적하는 계보와 같은 활동을 포함한다. 분석 거버넌스에는 사용된 도구와 이를 관리하는 방법 모두에 초점을 맞춰 조직에 대한 데이터의 가치를 실현하는 작업과 비즈니스를 주도하는 구체적인 측정 및 KPI가 포함된다. 거버넌스 자체를 위해 이런 것들을 관리하는 것은 데이터를 관리하는 것만큼이나 중요하다.

점점 더 많은 정부 기관이나 기업 조직이 데이터 및 분석 거버넌스의 가치를 인식하기 시작하고 있으며, 이와 관련된 이니셔티브도 시작하고 있다. 종종 이러한 이니셔티브는 IT 조직에서 시작하는데, 그것은 데이터 사용 방식에 대한 문제를 인식하고 데이터 품질에 대한 불만을 처리하는 최전선이기 때문이다. 경우에 따라서는 데이터 품질과 필요한 데이터를 찾는 문제에 대한 업무 경험을 가진 비즈니스 사용자부터 시작할 수도 있다.

조직의 관점에선 전체론 적인 거버넌스 프로그램을 만들기 위해서는 두 부문이 모두 참여해야 하며 필요한 다음 단계가 필요하다.

기업 내 데이터 및 분석 거버넌스 현황

데이터 및 분석 이니셔티브가 IT와 비즈니스 부문에서 모두 적극적으로 일어나고 있는 반면에, 거버넌스 구조는 매우 중앙 집중적, 데이터 컨트롤 중심 관점과 적합도 준수라는 측정치로 실행이 된다. 아래의 그림 1는 가트너가 기업 내에서 데이터와 분석 비용 지출에 있어서 IT 부문과 비즈니스 부문의 비교를 나타낸 것이다. 그림에서 빨간색으로 표시한 부분에 집중해 보면, 기업 내에서 데이터와 분석에 투자 비용이 커질수록 IT 부문보다 비즈니스 부문에서 훨씬 더 큰 비용이 투자되는 것을 알 수 있다. 또한, 이것은 기업에서의 투자가 매우 사일로로 이루어지고 있음을 보여준다.

Domain Budget Spent on DA initiatives.png

그림 1 기업 내 데이터 분석 이니셔티브 투자 예산비율 (출처: 가트너)

데이터 및 분석 거버넌스에 대한 정확한 정의를 내리는 것은 그것에 대한 실행 방향을 정하는 데 큰 도움이 된다. 가트너는 “데이터 및 분석 업무(생성, 평가, 소비 및 제어)에 적절함을 보장하기 위한 의사 결정권 및 책임 프레임워크”라고 정의한다. 즉 데이터를 다룰 때 이렇게 다루는 것이, 이런 표를 기반으로 평가 내리는 것이 적절하다고 이야기할 수 있는 권한과 그 권한의 틀이라는 뜻이다. 그러나 이런 정의와 공격적인 투자하고 있다고 해서 그 거버넌스와 데이터를 활용한 기업 업무의 혁신이 성공적이라고 하기엔 아직 성급하다. 가트너의 또 다른 데이터는 데이터 및 분석 거버넌스로부터 기대하는 기대치와 실제 달성한 성과 값에는 매우 큰 차이가 있다는 사실을 보여준다.

그림 2 맨 위의 항목을 보면, 거버넌스를 새로운 비즈니스 모델을 운영하기 위한 차별화 도구로 가치 창출을 기대했던 바는 63%에 해당하지만, 실제 그것을 달성했다고 평가할 수 있는 성과치는 기대한 수치의 35%에 불과하다는 것이다.

그림 2 데이터 분석 거버넌스 기대치와 성과 (출처: 가트너)

그렇다면 왜 이런 차이가 발생하는 것일까?

가장 큰 문제점으로 지적되는 것은 오늘날 대부분의 거버넌스 프로그램이 비효율적이라는 것이다. 이 문제는 종종 데이터 거버넌스의 가치 창출 잠재력을 인식하지 못하는 최고 경영자층에 속하는 C 레벨에서 시작된다. 그 결과, 이는 IT가 실행하는 지원 기능으로 밀려나고 널리 지켜지지 않는 일련의 정책 및 지침이 된다. 조직은 이런 문제를 해결하기 위해 기술을 사용하려고 한다. 데이터 레이크 및 데이터 거버넌스 플랫폼과 같은 기술 솔루션이 도움이 될 수는 있지만 만병통치약이 될 수 있는 게 아니다.

품질을 보장하는 거버넌스가 없으면 기업은 데이터 기반 비즈니스 기회를 놓칠 뿐만 아니라 리소스를 낭비하게 된다. 데이터 처리 및 정리에 고액 연봉을 받는 데이터 과학자가 일하는 분석팀 시간의 절반 이상이 소요될 수 있으며, 이로 인해 확장성이 제한되고 직원들의 동기부여도 크게 되지 않는다. 실제로 조직 전체의 직원 생산성이 저하된다. 2019년 매킨지 글로벌 데이터 혁신 설문 조사는 데이터 품질과 가용성이 떨어지기 때문에 전체 엔터프라이즈 시간의 평균 30%가 부가가치 없는 작업에 사용되었다고 보고한다.

그림 3 저품질, 가용성 부족 데이터로 인한 평균 업무 손실 (출처: 매킨지)

데이터 및 분석 거버넌스에 실제적인 비용 가치를 직접 부여하기는 어렵지만, 간접적인 가치가 매우 크다. 각 분야 선두 기업들은 데이터 에코시스템에서 수백만 달러의 비용을 절감하고 수백만 달러 또는 수십억 달러에 달하는 디지털 및 분석 활용사례를 지원하고 있다. 데이터 거버넌스는 이러한 가치를 포착하는 기업과 그렇지 않은 기업 간의 차이점 중 하나이다. 또한, 거버넌스에 투자를 적게 한 기업은 실제 GDPR과 같은 규제 위험에 노출되어 훨씬 더 큰 비용을 감당해야 할 상황에 부닥칠 수 있다.

효율적인 데이터와 분석을 위한 거버넌스 파운데이션

많은 조직이 데이터 거버넌스를 효과적으로 확장하기 위해 애쓰는 가운데, 일부는 매우 탁월한 성과를 보인다. 예를 들어, 런던에 본사를 둔 글로벌 유통업체 세인즈베리즈(Sainsbury’s)는 수년간 데이터로부터 가치를 얻어내기 위한 노력 후에 전사적 분석 혁신의 일환으로 전체 고위 경영진 팀을 교육하고 데이터 거버넌스에 참여시키는 데 투자했다. 경영 리더들에게 여러 데이터 도메인 또는 비즈니스 데이터 주제 영역을 할당했는데, 이 영역 중 일부는 소비자 트랜잭션 및 직원 데이터와 같은 업무 특성을 이해해야 그 가치를 알 수 있는 데이터였다.

리더들은 데이터 거버넌스의 가치를 파악한 후 도메인 내에서 데이터 소유자와 관리자로서 활동할 대표를 선정하고 데이터 거버넌스 노력을 분석 사용 사례와 연계하고, 업무 스프린트에서는 제공할 수 있는 상위 가치에 따라 우선순위 데이터를 구별했다. 이러한 노력은 성과를 거두기 시작했고, 일반적으로 수년에 걸쳐서 이루어지는 우선순위 데이터 도메인을 수 개월 내로 구축하고 데이터 정리에 과학자들이 소비하는 시간을 줄여 분석 활용사례를 신속하게 제공할 수 있게 되었다.

효과적인 데이터 거버넌스는 조직 설계를 가장 먼저 재고해야 하는데, 일반적인 거버넌스 구조에는 다음과 같은 세 가지 요소가 포함된다.

가. 최고 데이터 책임자(CDO)가 관리하는 ‘데이터 전략’을 갖춘 중앙 데이터 관리 사무소(DMO: Data Management Office)와 전체 방향과 표준을 설정하는 거버넌스 리더

나. 일상적인 작업이 수행되는 데이터 도메인별로 구성된 거버넌스 역할

다. 데이터 전략과 우선순위를 기업 전략에 연결하고, 자금 지원을 승인하고, 문제를 해결하기 위해 도메인 리더와 DMO를 통합하는 데이터 위원회

아래의 그림 4로 그 역할과 상호 관계성을 설명해 본다.

그림 4 세 가지 조직 구성 요소를 포함하는 데이터 거버넌스 모델 모범 사례

이러한 구조는 중앙 관리, 적절한 우선순위 지정 및 일관성의 균형을 맞추는 동시에 데이터를 생성하고 사용하는 직원이 관리를 주도할 수 있는 역할을 제공한다.

이러한 데이터 및 분석 거버넌스 모델 파운데이션이 성공하려면 다음과 같은 6가지의 선행 사항이 필요하다.

1. 최고 경영진의 관심을 확보

데이터 거버넌스를 통한 성공에는 비즈니스 최고 리더의 관심이 절대적으로 필요하다. 처음은 DMO가 최고 경영 리더로부터 요구사항을 이해하고, 현재 데이터 과제와 한계를 강조하고, 데이터 거버넌스의 역할을 설명하는 것이다. 다음 단계는 데이터 거버넌스 위원회를 구성함으로써 거버넌스 전략을 비즈니스 요구에 맞게 조정하고 개선 이니셔티브를 시작하는 것이다.

중요한 것은 탑 다운 하향식 비즈니스 리더십을 도입하면 역할 명확성과 권한 강화와 관련된 일반적인 여러 문제를 피할 수 있다. 비즈니스 측면의 데이터 관리자들은 이러한 노력이 기업 우선순위임을 이해하고 이를 해결하는 데 시간을 할애하게 되고 데이터 소유권을 둘러싼 충돌도 최소화할 수 있다. 영향 측정 지표를 추적하고 보고하는 가운데 최고 경영진의 관심과 지속적인 지원을 제공받게 된다.

2. 기업 내 기본 혁신 테마와 통합

데이터 및 분석 거버넌스 노력이 가치를 창출하도록 하려면 이를 기업 자산의 클라우드화나 디지털 트랜스포메이션과 같이 이미 CEO의 관심을 받고 있는 기업 내 혁신 노력과 직접 연계하는 것이 좋은데, 이것은 데이터 가용성과 품질에 따라 매우 크게 달라진다.

거버넌스를 혁신 테마와 연결하면 고위 리더십의 참여를 단순화하고 조직 구조를 변경할 수 있다. 이러한 이니셔티브는 자체적인 거버넌스가 아니라 데이터 책임과 거버넌스를 제품 팀으로 이전하여 생산 및 소비 시점에 통합하여 실제적인 업무 효율성과 생산성 확대로 연결시킬 수 있다.

3. 데이터 자산의 우선순위 지정 및 중요도에 집중

많은 조직에서 모든 데이터 자산을 한 번에 살펴보면서 전체적인 방식으로 데이터 거버넌스에 접근한다. 그러나 범위가 너무 넓다는 것은 주어진 영역에서 상대적인 진전이 느리고 노력이 비즈니스 요구와 직접 연결되지 않는 위험을 의미한다. 성공하려면 데이터 자산의 우선순위를 도메인별과 각 도메인 내의 데이터별로 지정해야 한다.

도메인 우선순위 지정 외에도 각 데이터 요소에 대한 중요도 수준을 정의하여 각 도메인 내에서 데이터 자산의 우선순위를 지정한다. 대부분의 조직에서는 일반적으로 중요 데이터가 전체 데이터의 10~20%를 넘지 않는다. 거버넌스 노력의 범위가 상당히 좁아지고 가장 중요한 데이터에 초점을 맞추어야 신뢰할 수 있는 결과를 기대할 수 있다.

4. 적절한 수준의 거버넌스를 적용

데이터 및 분석 거버넌스 프로그램은 조직과 업종에 따라 크게 다를 수 있습니다. 주요 조직은 조직에 적합한 거버넌스 정교함의 수준을 채택한 다음 데이터 세트별로 엄격한 수준을 조정하는 “필요 기반” 접근 방식을 채택하는 것이 좋다.

데이터 거버넌스는 기타 규제의 압력에 의해 대부분 은행들이 주도했다는 사실을 깨닫는 것이 중요하다. 대부분의 다른 산업 및 조직은 동일한 수준의 규제 압력에 직면해 있지 않으므로 프로그램 설계는 고유한 규제 수준 및 데이터 복잡성 수준에 맞춰야 한다. 여러 지역에 걸쳐 서로 다른 여러 개의 비즈니스를 보유한 조직은 단일 지역에서만 비즈니스를 운영하는 조직보다 더 복잡한 요구사항을 가지고 있다. 마찬가지로, 데이터 변화의 속도가 빠르거나 기술 자동화의 수준이 낮으면 데이터 복잡성이 증가한다.

조직이 성숙하고 거버넌스 능력과 기술이 계속 발전함에 따라 거버넌스의 범위 설정은 매우 중요하다. 일련의 툴이 데이터 거버넌스 활동을 자동화하기 시작하고 있으며, 적용 범위와 비용 효율성은 시간이 지남에 따라 향상되고 있다. Octopai, Erwin과 같은 플랫폼과 인포매티카(Informatica)나 콜리브라(Collibra)와 같은 시스템은 자동화된 메타데이터 수집, 계보 생성, 데이터 품질 관리 및 기타 거버넌스를 위한 기능을 제공하고 있다.

5. 반복적인 구현 방법을 선택

데이터 거버넌스는 지속적인 반복 방법을 사용하여 가치를 신속하게 창출하고, 도메인에 대한 우선순위를 조정하며, 빠르게 적응할 수 있어야 한다. 핵심은 일상적인 거버넌스에 반복적인 원칙을 채택하는 것이다. 예를 들어, 알려진 데이터 품질 문제가 남아 있는 경우, 매일 검토 및 재평가하여 우선순위가 변경될 때 비즈니스에 미치는 이점을 극대화할 수 있어야 한다.

솔루션이 완벽하지 않더라도 우선 사용 사례를 지원한다. 가치가 입증되면 활용사례 확대를 위한 장기적인 개발이 이루어질 수 있다. 예를 들어, 고객 캠페인을 향상하려면 전사적으로 완전히 통합된 데이터 집합이 아니라 전용 플랫폼에서 맞춤화된 접근 방식이 필요할 수 있다. 데이터 및 분석 거버넌스는 강력한 마스터 데이터 관리뿐만 아니라 가용성 및 품질과 관련된 문제를 해결하는 데 초점을 모은 맞춤형 접근 방식을 지원해야 한다.

6. 데이터와 분석에 대한 열정 유발

임직원들이 데이터 및 분석의 가치와 비전에 열정적으로 헌신할 때, 높은 품질과 안전한 데이터로 기업의 이윤과 생산성을 극대화할 수 있다. 성공적인 조직은 임직원의 올바른 행동을 유도하기 위해 다양한 방법을 사용한다. 많은 선도기업에서는 데이터 지지자를 구축하고 회의론자를 전환하기 위해 투자한다. 또는 대규모 아카데미 접근 방식의 일환으로 데이터 작업에서의 경력 기회에 대한 커뮤니케이션과 함께 교육과 자격 요건을 제공하기도 한다.

이것은 직원들이 데이터와 분석을 일상 업무에서 사용하도록 동기를 부여하고 생산자들은 품질 높은 데이터를 생산하고 공유하도록 장려해야 하므로 거버넌스 전체 프로그램의 가장 어려운 부분이 될 수도 있다.

마무리

데이터 거버넌스는 분석, 디지털 및 기타 혁신 기회를 통해 가치를 포착하는 데 매우 중요한 업무 프로세스이며 기능이다. 많은 기업이 데이터 거버넌스를 제대로 구현하기 위해 애쓰고 있지만, 하나의 조직 기능으로 동작하게 하기보다는 데이터 및 분석 거버넌스를 프레임워크 정책으로 생각하는 것에서 접근하는 것이 효과적이다. 조직의 일상적인 업무 중요 지점을 모두 전략적으로 포함하는 파운데이션을 제공하는 방식으로 전환함으로써 발전할 수 있다.

keyword

매거진의 이전글기업 보안이 플랫폼으로 진화한다.디지털 성장을 위한 폴란드의 클라우드 우선 정책매거진의 다음글