brunch
매거진 논문 리뷰

논문 리뷰 : 데이터 거버넌스 프레임워크, 리뷰/과제

Abraham et al. (2019)

by CalmBeforeStorm

Data governance: A conceptual framework, structured review, and research agenda

Abraham, Rene, Johannes Schneider, and Jan Vom Brocke. "Data governance: A conceptual framework, structured review, and research agenda." International journal of information management 49 (2019): 424-438.


https://www.sciencedirect.com/science/article/abs/pii/S0268401219300787



ABSTRACT


Data governance refers to the exercise of authority and control over the management of data.

데이터 거버넌스는 데이터 관리에 대한 권한과 통제의 실행을 의미한다.


The purpose of data governance is to increase the value of data and minimize data-related cost and risk.

데이터 거버넌스의 목적은 데이터의 가치를 높이고 데이터와 관련된 비용과 위험을 최소화하는 것이다.


Despite data governance gaining in importance in recent years, a holistic view on data governance, which could guide both practitioners and researchers, is missing.

최근 데이터 거버넌스의 중요성이 증가하고 있음에도 불구하고, 실무자와 연구자 모두를 위한 포괄적인 관점이 부족하다.


In this review paper, we aim to close this gap and develop a conceptual framework for data governance, synthesize the literature, and provide a research agenda.

본 리뷰 논문에서는 이러한 격차를 해소하고 데이터 거버넌스를 위한 개념적 프레임워크를 개발하며, 문헌을 종합하고 연구 과제를 제안하는 것을 목표로 한다.


We base our work on a structured literature review including 145 research papers and practitioner publications published during 2001-2019.

이 연구는 2001년부터 2019년까지 발표된 145개의 연구 논문과 실무자 출판물을 포함한 체계적인 문헌 검토를 기반으로 한다.


We identify the major building blocks of data governance and decompose them along six dimensions.

데이터 거버넌스의 주요 구성 요소를 식별하고 이를 여섯 가지 차원으로 분류한다.


The paper supports future research on data governance by identifying five research areas and displaying a total of 15 research questions.

이 논문은 데이터 거버넌스에 관한 다섯 가지 연구 영역을 제시하고 총 15개의 연구 질문을 제시함으로써 향후 연구를 지원한다.


Furthermore, the conceptual framework provides an overview of antecedents, scoping parameters, and governance mechanisms to assist practitioners in approaching data governance in a structured manner.

또한, 개념적 프레임워크는 데이터 거버넌스를 체계적으로 접근할 수 있도록 실무자를 지원하기 위해 선행 요인, 범위 매개변수, 거버넌스 메커니즘에 대한 개요를 제공한다.


Keywords: Data governance, Information governance, Conceptual framework, Literature review, Research agenda




1. Introduction


Data governance is the exercise of authority and control over the management of data (DAMA International, 2009, p. 19).
데이터 거버넌스는 데이터 관리에 대한 권한과 통제를 실행하는 것이다(DAMA International, 2009, p. 19).

It aims at implementing a corporate-wide data agenda (Dyché & Levy, 2006, pp. 150), maximizing the value of data assets in an organization (e.g. Carretero, Gualo, Caballero, & Piattini, 2017, p. 143; Otto, 2011a, p. 241), and managing data-related risks (e.g. DAMA International, 2009, p. 41; Morabito, 2015, p. 99).
이는 기업 전반에 걸친 데이터 의제를 실행하고(Dyché & Levy, 2006, pp. 150), 조직 내 데이터 자산의 가치를 극대화하며(Carretero, Gualo, Caballero, & Piattini, 2017, p. 143; Otto, 2011a, p. 241), 데이터와 관련된 위험을 관리하는 것을 목표로 한다(DAMA International, 2009, p. 41; Morabito, 2015, p. 99).


While data governance used to be a nice-to-have in the past, today it is taking on a higher level of importance in enterprises and governmental institutions (Haneem, Kama, Taskin, Pauleen, & Abu Bakar, 2019, pp. 37).

과거에는 데이터 거버넌스가 부가적인 요소로 여겨졌으나, 오늘날에는 기업과 정부 기관에서 더욱 중요한 역할을 맡게 되었다(Haneem, Kama, Taskin, Pauleen, & Abu Bakar, 2019, pp. 37).


This is due to some key trends.

이는 몇 가지 주요 트렌드 때문이다.


The amount of data created annually on the whole planet is expected to increase from 4.4 zettabytes in 2013 to 44 zettabytes in 2020 (IDC, 2014, p. 2).

전 세계적으로 연간 생성되는 데이터량은 2013년 4.4 제타바이트에서 2020년 44 제타바이트로 증가할 것으로 예상된다(IDC, 2014, p. 2).


The growing data volumes from diverse sources cause data inconsistencies that need to be identified and addressed before decisions are made based on incorrect data.

다양한 출처에서 증가하는 데이터량은 데이터 불일치를 초래하며, 잘못된 데이터에 기반한 의사결정을 하기 전에 이를 식별하고 해결해야 한다.


Companies introduce more self-service reporting and analytics, which create the need for a common understanding of data across the organization.

기업들은 셀프 서비스 보고와 분석을 도입하면서 조직 전체에서 데이터에 대한 공통된 이해가 필요하게 되었다.


The continuing impact of regulatory requirements such as the General Data Protection Regulation (GDPR) increases the pressure on companies to have a strong handle on what data is stored where, and how the data is being used.

유럽 일반 데이터 보호 규정(GDPR)과 같은 규제 요구 사항의 지속적인 영향은 기업들로 하여금 데이터가 어디에 저장되고 어떻게 사용되는지를 철저히 관리해야 한다는 압박을 가중시킨다.


Organizations are forced to overcome their challenges regarding inaccurate and incomplete data (Kim & Cho, 2018, p. 386; Morabito, 2015, p. 97), fragmented enterprise architecture and legacy systems (Nielsen, Persson, & Madsen, 2018, p. 22), and compliance issues related to regulations (Khatri & Brown, 2010, p. 151).

조직들은 부정확하고 불완전한 데이터(Kim & Cho, 2018, p. 386; Morabito, 2015, p. 97), 단편화된 기업 아키텍처와 레거시 시스템(Nielsen, Persson, & Madsen, 2018, p. 22), 그리고 규제와 관련된 준수 문제(Khatri & Brown, 2010, p. 151)를 해결해야 하는 과제에 직면하고 있다.


Despite the growing importance of data governance, the current view on this topic is fragmented.
데이터 거버넌스의 중요성이 커지고 있음에도 불구하고, 현재 이 주제에 대한 관점은 단편적이다.


Publications either address data governance with a focus on specific decision domains such as data quality, data security, and data lifecycle (e.g., Donaldson & Walker, 2004, p. 281; IBM, 2014, p. 26; Otto, 2011c, pp. 5; Tallon, Ramirez, & Short, 2014, p. 142) or comprise smaller reviews to corroborate the conceptual or empirical content (e.g., Brous, Herder, & Janssen, 2016, pp. 304; Lee, Zhu, & Jeffery, 2017, p. 1; Neff, Schosser, Zelt, Uebernickel, & Brenner, 2013, p. 3; Rasouli, Trienekens, Kusters, & Grefen, 2016, p. 1356).
출판물들은 데이터 품질, 데이터 보안, 데이터 수명 주기와 같은 특정 의사결정 영역에 초점을 맞추거나(Donaldson & Walker, 2004, p. 281; IBM, 2014, p. 26; Otto, 2011c, pp. 5; Tallon, Ramirez, & Short, 2014, p. 142), 개념적 또는 경험적 내용을 뒷받침하기 위한 소규모 리뷰(Brous, Herder, & Janssen, 2016, pp. 304; Lee, Zhu, & Jeffery, 2017, p. 1; Neff, Schosser, Zelt, Uebernickel, & Brenner, 2013, p. 3; Rasouli, Trienekens, Kusters, & Grefen, 2016, p. 1356)를 포함한다.


We identified six existing literature reviews related to data governance (Alhassan, Sammon, & Daly, 2016; Alhassan, Sammon, & Daly, 2018; Al-Ruithe, Benkhelifa, & Hameed, 2018; Brous, Janssen, & Vilminko-Heikkinen, 2016; Lillie & Eybers, 2019; Nielsen, 2017).

우리는 데이터 거버넌스와 관련된 6개의 기존 문헌 리뷰를 확인하였다(Alhassan, Sammon, & Daly, 2016; Alhassan, Sammon, & Daly, 2018; Al-Ruithe, Benkhelifa, & Hameed, 2018; Brous, Janssen, & Vilminko-Heikkinen, 2016; Lillie & Eybers, 2019; Nielsen, 2017).


Though they aim to advance the knowledge base regarding data governance, they have some limitations.

이 문헌들은 데이터 거버넌스에 대한 지식 기반을 확장하려는 목적을 가지고 있지만, 몇 가지 한계를 가지고 있다.

Three literature reviews focus on narrowly defined areas of data governance, i.e., cloud data governance (Al-Ruithe et al., 2018a, p. 16), data governance principles (Brous, Janssen et al., 2016, p. 3), and agile capabilities of data governance (Lillie & Eybers, 2019).
세 가지 문헌 리뷰는 좁게 정의된 데이터 거버넌스 영역에 초점을 맞추고 있는데, 이는 클라우드 데이터 거버넌스(Al-Ruithe et al., 2018a, p. 16), 데이터 거버넌스 원칙(Brous, Janssen et al., 2016, p. 3), 그리고 데이터 거버넌스의 애자일 역량(Lillie & Eybers, 2019)을 포함한다.


Nielsen (2017) conducts a classification of research disciplines, methods, and units of analysis concerning data governance with only a minor focus on conceptual areas.
Nielsen(2017)은 데이터 거버넌스와 관련된 연구 분야, 방법론, 분석 단위에 대한 분류를 수행했으나, 개념적 영역에 대한 초점은 적었다.
Both literature reviews conducted by Alhassan et al. present a frequency count of data governance activities.
Alhassan et al.이 수행한 두 가지 문헌 리뷰는 데이터 거버넌스 활동의 빈도수를 제시하였다.


However, they do not provide a detailed description of the underlying data governance concepts.

그러나 이러한 리뷰들은 데이터 거버넌스 개념의 기초적인 설명을 자세히 제공하지 않는다.


Furthermore, the authors do not describe the antecedents and consequences of data governance, which are necessary to understand the factors that motivate the adoption of different data governance practices and the effects of those practices.

또한, 저자들은 데이터 거버넌스의 선행 요인과 결과를 설명하지 않았는데, 이는 다양한 데이터 거버넌스 실천 방식을 채택하게 되는 동기와 그 실천의 영향을 이해하는 데 필수적이다.


To overcome these deficiencies, we attempt to methodologically analyze and synthesize the literature on data governance and provide a firm foundation for future research.

이러한 한계를 극복하기 위해, 우리는 데이터 거버넌스에 관한 문헌을 방법론적으로 분석하고 종합하여 향후 연구를 위한 견고한 기반을 제공하고자 한다.


The following two questions frame our structured literature review of 145 research papers and practitioner publications covering data governance published up to April 2019:

다음 두 가지 질문은 2019년 4월까지 발표된 데이터 거버넌스를 다룬 145개의 연구 논문과 실무자 출판물에 대한 체계적인 문헌 검토의 틀을 제공한다.


What are the building blocks of data governance? Where do we lack in knowledge about data governance?

데이터 거버넌스의 구성 요소는 무엇인가? 데이터 거버넌스에 대한 지식이 부족한 부분은 어디인가?


The remainder of this paper is structured as follows.

이 논문의 나머지 부분은 다음과 같이 구성된다.


First, we explain our literature search and review method.
첫째, 우리는 문헌 검색 및 리뷰 방법을 설명한다.
Second, we describe the conceptual framework of data governance that served as the structure for our review of the state of knowledge.
둘째, 데이터 거버넌스의 개념적 프레임워크를 설명하며, 이는 지식 상태에 대한 리뷰의 구조로 활용되었다.
Third, we present the results of the actual review and synthesis of the data governance literature.
셋째, 데이터 거버넌스 문헌에 대한 실제 리뷰와 종합 결과를 제시한다.
Fourth, we highlight gaps in our understanding of data governance and propose a research agenda, which contains insightful questions for future research.
넷째, 데이터 거버넌스 이해에서의 격차를 강조하고, 향후 연구를 위한 통찰력 있는 질문을 포함한 연구 과제를 제안한다.
Fifth, we conclude with a summary.
다섯째, 요약으로 논문을 마무리한다.



2. Literature search and review


Similar to other existing literature reviews such as Gong and Janssen (2019) and Senyo, Liu, and Effah (2019), our approach comprised a structured, topic-centric literature review.

Gong and Janssen(2019), Senyo, Liu, and Effah(2019)의 기존 문헌 리뷰와 유사하게, 우리의 접근 방식은 체계적이고 주제 중심적인 문헌 검토를 포함하였다.


We aimed to better describe the domain of data governance and synthesize the relevant knowledge as available in peer-reviewed scientific literature as well as in selected practitioner publications.

우리는 데이터 거버넌스의 영역을 더 잘 설명하고, 동료 검토를 거친 과학 문헌과 선정된 실무자 출판물에 포함된 관련 지식을 종합하는 것을 목표로 했다.


In doing so, we followed best practices for literature reviews (Rowe, 2014; vom Brocke et al., 2009; Webster & Watson, 2002; Zorn & Campbell, 2006).

이를 위해 우리는 문헌 리뷰의 모범 사례(Rowe, 2014; vom Brocke et al., 2009; Webster & Watson, 2002; Zorn & Campbell, 2006)를 따랐다.


Fig. 1 summarizes the search process.

그림 1은 검색 과정을 요약하고 있다.


tempImageRclh2N.heic Fig. 1. Literature review search process.

First, we conducted a keyword-based search (Ismagilova, Hughes, Dwivedi, & Raman, 2019, p. 89; Olanrewaju, Hossain, Whiteside, & Mercieca, 2020, p. 91; Rowe, 2014, p. 247).

우선, 우리는 키워드 기반 검색을 수행했다(Ismagilova, Hughes, Dwivedi, & Raman, 2019, p. 89; Olanrewaju, Hossain, Whiteside, & Mercieca, 2020, p. 91; Rowe, 2014, p. 247).


The keyword-based search helped us to avoid bias towards well-known authors or well-cited papers.

키워드 기반 검색은 유명 저자나 많이 인용된 논문에 대한 편향을 피하는 데 도움을 주었다.


Through an initial step of probing searches, we identified “data governance” and “information governance” as search terms.

초기 검색 단계를 통해 우리는 “데이터 거버넌스”와 “정보 거버넌스”를 검색어로 선정하였다.


We included “information governance” as a search term since it is often used interchangeably with “data governance” (e.g., In, Bradley, Bichescu, & Autry, 2019, p. 508; Rasouli, Trienekens et al., 2016, p. 1357; Tallon et al., 2014, p. 142).

“정보 거버넌스”는 종종 “데이터 거버넌스”와 교차적으로 사용되기 때문에 검색어로 포함되었다(In, Bradley, Bichescu, & Autry, 2019, p. 508; Rasouli, Trienekens et al., 2016, p. 1357; Tallon et al., 2014, p. 142).


We used the databases in Table 1 that provide access to peer-reviewed IS journals as well as proceedings of leading conferences such as the European Conference on Information Systems and the Americas Conference on Information Systems.

우리는 표 1에 나열된 데이터베이스를 사용했으며, 이는 동료 검토를 거친 정보 시스템(IS) 저널과 유럽 정보 시스템 학회 및 아메리카스 정보 시스템 학회와 같은 주요 학회의 프로시딩에 접근할 수 있게 해준다.


We included conference papers since recent research may not yet have been, or may never be, published in journals.

최신 연구는 아직 저널에 발표되지 않았거나, 영원히 발표되지 않을 수 있기 때문에 학회 논문도 포함하였다.


We conducted the final keyword-based search in April 2019 covering the period from 2002 to 2019.

우리는 2019년 4월에 2002년부터 2019년까지의 기간을 포함하는 최종 키워드 기반 검색을 수행하였다.


This step resulted in a total of 483 hits across all databases.

이 단계에서 모든 데이터베이스에서 총 483개의 검색 결과가 도출되었다.


Next, we conducted a qualitative assessment consisting of two steps.

다음으로, 두 단계로 구성된 질적 평가를 수행하였다.


First, we filtered articles based on their titles and abstracts and removed those which did not focus on data or information governance.
첫 번째로, 우리는 제목과 초록을 기반으로 논문을 필터링하고, 데이터 또는 정보 거버넌스에 초점을 맞추지 않은 논문을 제외하였다.


We also removed duplicate articles.

중복된 논문 또한 제거하였다.


This step reduced the number of hits to 88.

이 단계에서 검색 결과는 88개로 줄어들었다.


Second, we read those remaining 88 articles and excluded non-scientific journal articles and papers that referred to data governance only in passing.
두 번째로, 남아있는 88개의 논문을 읽고, 과학 저널 논문이 아닌 자료와 데이터 거버넌스를 언급만 한 논문을 제외하였다.


This left 55 papers to be included in the review.

그 결과, 리뷰에 포함될 논문은 55개로 축소되었다.


Second, we conducted a backward and forward search of the above 55 papers (vom Brocke et al., 2009, p. 8).

두 번째로, 위에서 선정한 55개의 논문에 대해 후방 및 전방 검색을 수행하였다(vom Brocke et al., 2009, p. 8).


We again applied the two-step qualitative assessment described above to exclude non-relevant papers.

앞서 설명한 두 단계의 질적 평가를 다시 적용하여 관련성이 낮은 논문을 제외하였다.


However, we expanded the assessment to include seminal books on data governance and publications by industry associations such as the International Organization for Standardization (ISO) and inter-governmental organizations such as the Organisation for Economic Co-operation and Development (OECD).

그러나 데이터 거버넌스의 주요 서적과 국제 표준화 기구(ISO) 및 경제협력개발기구(OECD)와 같은 산업 협회 및 정부 간 기구의 출판물을 포함하도록 평가 범위를 확장하였다.


We added these publications to obtain a comprehensive view of data governance and reduce systematic biases by simply choosing a set of scientific journals and conference papers (Boell & Cecez-Kecmanovic, 2015, p. 166).

이러한 출판물을 추가함으로써 데이터 거버넌스에 대한 포괄적인 관점을 확보하고, 단순히 과학 저널과 학회 논문만을 선택함으로써 발생할 수 있는 체계적 편향을 줄였다(Boell & Cecez-Kecmanovic, 2015, p. 166).


The backward search resulted in 41 relevant papers.

후방 검색 결과, 41개의 관련 논문이 도출되었다.


For the forward search, we used Google Scholar.

전방 검색을 위해 Google Scholar를 사용하였다.


We reviewed an additional 44 relevant papers.

추가로 44개의 관련 논문을 검토하였다.


Third, we considered selected publications not identified through either the keyword-based search or the backward and forward search.
세 번째로, 키워드 기반 검색이나 후방 및 전방 검색을 통해 식별되지 않은 출판물을 선정하여 검토하였다.


These included one scientific paper recommended during the review process and four practitioner publications.

이에는 리뷰 과정 중 추천된 한 편의 과학 논문과 네 편의 실무자 출판물이 포함되었다.


The latter comprised publications by the European Foundation for Quality Management (EFQM), the Information Systems Audit and Control Association (ISACA), and by leading data governance tooling vendors IBM and Informatica (Peyret & Goetz, 2014, pp. 7).

후자의 출판물에는 유럽 품질 경영 재단(EFQM), 정보 시스템 감사 및 통제 협회(ISACA), 그리고 주요 데이터 거버넌스 도구 공급업체인 IBM과 Informatica의 출판물이 포함되었다(Peyret & Goetz, 2014, pp. 7).


The third step resulted in 5 additional publications.

세 번째 단계에서 추가로 5개의 출판물이 선정되었다.


In total, we reviewed 145 publications on data governance.

결과적으로 데이터 거버넌스와 관련하여 총 145개의 출판물을 검토하였다.


Table 1 summarizes the search process and results.

표 1은 검색 과정과 결과를 요약하고 있다.


tempImagehqUCzE.heic Table 1 Overview of the literature search characteristics


Fig. 2 provides an overview of the number of publications found per year.

그림 2는 연도별로 발견된 출판물의 수를 개괄적으로 보여준다.


tempImageXwsaVj.heic Fig. 2. Number of publications per year.


All relevant publications were categorized according to their nature (scientific or practice-oriented) and format (papers in journals and conference proceedings, theses, publications by industry associations and inter-governmental organizations, publications by software vendors and consultants, books).

모든 관련 출판물은 성격(과학적 또는 실무 지향적)과 형식(저널 및 학회 프로시딩 논문, 학위 논문, 산업 협회 및 정부 간 기구 출판물, 소프트웨어 공급업체 및 컨설턴트 출판물, 서적)에 따라 분류되었다.


Table 2 presents an overview of the publications within the scope of this literature review.

표 2는 이 문헌 검토의 범위 내에 있는 출판물의 개요를 제시하고 있다.


tempImageEp2r00.heic Table 2 Sources for state-of-the-art analysis.



3. Data governance definition and framework


As proposed by Zorn and Campbell (2006, p. 175), we provide a working definition of the key term “data governance.”

Zorn과 Campbell(2006, p. 175)이 제안한 바와 같이, 우리는 “데이터 거버넌스”라는 핵심 용어에 대한 작동 정의를 제공한다.


Furthermore, we present a conceptual framework for data governance to structure the review.

또한, 데이터 거버넌스를 개념적으로 구조화하기 위한 프레임워크를 제시한다.


The conceptual framework builds on the rich data we have collected during our literature search process.

이 개념적 프레임워크는 문헌 검색 과정에서 수집한 방대한 데이터를 기반으로 한다.


We did not find a standard definition of data governance in scholarly literature or in the set of practitioner publications.

학술 문헌이나 실무자 출판물에서 데이터 거버넌스에 대한 표준 정의는 발견되지 않았다.


Hence, we analyzed every definition of data governance in our set of papers and used open coding to find common characteristics.

따라서, 우리가 검토한 논문에 포함된 모든 데이터 거버넌스 정의를 분석하고, 개방형 코딩을 사용하여 공통된 특성을 도출하였다.


The analysis led us to the following definition of data governance: Data governance specifies a cross-functional framework for managing data as a strategic enterprise asset.

이 분석을 통해 다음과 같은 데이터 거버넌스 정의를 도출하였다: 데이터 거버넌스는 데이터를 전략적 기업 자산으로 관리하기 위한 범기능적 프레임워크를 명시한다.


In doing so, data governance specifies decision rights and accountabilities for an organization’s decision-making about its data.

이 과정에서 데이터 거버넌스는 조직의 데이터에 관한 의사결정을 위한 의사결정 권한과 책임을 명확히 규정한다.


Furthermore, data governance formalizes data policies, standards, and procedures and monitors compliance.

또한, 데이터 거버넌스는 데이터 정책, 표준, 절차를 공식화하고, 그 준수를 모니터링한다.


This definition (bold text) is our own but corresponds to the characterization of data governance in the reviewed literature.

이 정의는 우리의 독자적 정의이지만, 검토된 문헌에서 나타난 데이터 거버넌스의 특성과 일치한다.


Our definition of data governance has six parts.

우리의 데이터 거버넌스 정의는 여섯 가지 부분으로 구성된다.


First, data governance is a cross-functional effort. It enables collaboration across functional boundaries and data subject areas.
첫째, 데이터 거버넌스는 범기능적 노력이다. 이는 기능 간 경계와 데이터 주제 영역 간의 협력을 가능하게 한다.
Second, data governance is a framework, which provides structure and formalization for the management of data.
둘째, 데이터 거버넌스는 데이터 관리를 위한 구조와 공식화를 제공하는 프레임워크이다.
Third, data governance focuses on data as a strategic enterprise asset. Data is the representation of facts in different formats.
셋째, 데이터 거버넌스는 데이터를 전략적 기업 자산으로 간주한다. 데이터는 다양한 형식으로 표현된 사실의 집합이다.
Fourth, data governance specifies decision rights and accountabilities for an organization’s decision-making about its data.
넷째, 데이터 거버넌스는 조직의 데이터 관련 의사결정에 대한 의사결정 권한과 책임을 명시한다.
It determines what decisions need to be made about data, how these decisions are made, and who in the organization has the rights to make these decisions.
데이터와 관련하여 어떤 의사결정을 내려야 하는지, 이러한 의사결정이 어떻게 이루어지는지, 조직 내에서 누가 이러한 의사결정 권한을 가지는지를 결정한다.
Fifth, data governance develops data policies, standards, and procedures. These artifacts should be consistent with the organization’s strategy and promote desirable behavior in the use of data.
다섯째, 데이터 거버넌스는 데이터 정책, 표준, 절차를 개발한다. 이러한 결과물은 조직의 전략과 일관되어야 하며, 데이터 사용에서 바람직한 행동을 촉진해야 한다.
Finally, data governance monitors compliance. It includes the implementation of controls to ensure that data policies and standards are followed.
마지막으로, 데이터 거버넌스는 준수를 모니터링한다. 이는 데이터 정책과 표준이 준수되도록 보장하기 위한 통제 구현을 포함한다.


This definition also considers the differentiation between data governance and data management made by several authors.

이 정의는 또한 여러 저자들이 제시한 데이터 거버넌스와 데이터 관리 간의 차별화도 고려한다.


Data governance refers to what decisions must be made and who makes those decisions, whereas data management is about making those decisions as part of the day-to-day execution of data governance policies (Dyché & Levy, 2006, pp. 150, Hagmann, 2013, pp. 234, Khatri & Brown, 2010, p. 148; Otto, 2013, p. 96).
데이터 거버넌스는 어떤 의사결정을 내려야 하며, 누가 그러한 결정을 내리는지에 초점을 맞추는 반면, 데이터 관리는 데이터 거버넌스 정책의 일상적 실행의 일환으로 이러한 결정을 실행하는 것을 의미한다(Dyché & Levy, 2006, pp. 150; Hagmann, 2013, pp. 234; Khatri & Brown, 2010, p. 148; Otto, 2013, p. 96).


Table 3 shows how the characteristics of data governance in our definition correspond to the reviewed set of papers.

표 3은 우리가 정의한 데이터 거버넌스의 특성이 검토된 논문 집합과 어떻게 일치하는지를 보여준다.


tempImagejZqBq7.heic Table 3 De nition elements of data governance.


We performed the analysis for all data governance definitions in the papers, and the table provides selected excerpts for illustration.

우리는 논문들에 제시된 모든 데이터 거버넌스 정의를 분석하였으며, 표는 이를 설명하기 위해 선택된 발췌 내용을 제공한다.


We aimed to synthesize the literature according to a conceptual framework that allows us to structure the review of important concepts of data governance.

우리는 데이터 거버넌스의 중요한 개념들을 구조화하여 검토할 수 있도록 하는 개념적 프레임워크에 따라 문헌을 종합하는 것을 목표로 했다.


A conceptual framework “explains, either graphically or in narrative form, the main things to be studied – the key factors, constructs or variables – and the presumed relationships among them” (Miles & Huberman, 1994, p. 18).
개념적 프레임워크는 “그래프나 서술적 형태로 연구 대상인 주요 요소, 구성, 변수와 이들 간의 예상 관계를 설명하는 것”이다(Miles & Huberman, 1994, p. 18).

It brings together the different currents of thought and helps identify directions for future research (Marshall & Rossman, 2011, p. 58).
이는 다양한 사상의 흐름을 통합하고, 향후 연구의 방향성을 식별하는 데 도움을 준다(Marshall & Rossman, 2011, p. 58).

The process of creating this conceptual framework was as follows: We applied open coding analysis techniques suggested by Corbin & Strauss (2015, pp. 220) to identify the concepts regarding data governance.

이 개념적 프레임워크를 생성하는 과정은 다음과 같다: Corbin & Strauss(2015, pp. 220)가 제안한 개방형 코딩 분석 기법을 적용하여 데이터 거버넌스와 관련된 개념들을 식별하였다.


We used a concept matrix as described by Webster & Watson (2002, p. xvii) to synthesize and document the concepts.
Webster & Watson(2002, p. xvii)이 설명한 개념 매트릭스를 사용하여 개념을 종합하고 문서화하였다.


We then mapped these concepts against existing frameworks and found that the IT governance cube of Tiwana, Konsynski, and Venkatraman (2014) and the framework for data decision domains of Khatri and Brown (2010) provided useful starting points for grouping these concepts.

그런 다음, 이러한 개념들을 기존 프레임워크에 매핑하였고, Tiwana, Konsynski, and Venkatraman(2014)의 IT 거버넌스 큐브와 Khatri and Brown(2010)의 데이터 의사결정 도메인 프레임워크가 이 개념들을 그룹화하는 데 유용한 출발점임을 발견하였다.


We used the dimensions proposed in those frameworks to create our conceptual framework for data governance.

우리는 이러한 프레임워크에서 제안된 차원을 사용하여 데이터 거버넌스를 위한 개념적 프레임워크를 생성하였다.


However, we made several changes to the dimensions to suit the needs of our review.

그러나 우리의 리뷰 요구사항에 맞추기 위해 몇 가지 차원을 변경하였다.


Among others, we divided the content dimension of Tiwana et al. into traditional data and big data, and we added data architecture and data storage and infrastructure to the decision domain dimension of Khatri & Brown.

그 중에서, 우리는 Tiwana et al.의 콘텐츠 차원을 전통적 데이터와 빅데이터로 나누었으며, Khatri & Brown의 의사결정 도메인 차원에 데이터 아키텍처와 데이터 저장 및 인프라를 추가하였다.


Fig. 3 shows the final framework that we use in this paper.

그림 3은 이 논문에서 사용된 최종 프레임워크를 보여준다.


tempImageCz4Oki.heic Fig. 3. Conceptual framework for data governance.



The conceptual framework for data governance in Fig. 3 encompasses six dimensions.

그림 3에 제시된 데이터 거버넌스의 개념적 프레임워크는 여섯 가지 차원을 포함한다.


Governance mechanisms represent the core dimension of the framework and encompass structural, procedural, and relational mechanisms.
거버넌스 메커니즘은 프레임워크의 핵심 차원을 나타내며, 구조적, 절차적, 관계적 메커니즘을 포함한다.


The organizational scope determines the organizational expansiveness of data governance and roughly corresponds to the unit of analysis.
조직 범위는 데이터 거버넌스의 조직적 확장성을 결정하며, 대체로 분석 단위에 해당한다.
We differentiate between the intra-organizational and the inter-organizational scope.
우리는 조직 내부와 조직 간 범위를 구분하였다.
The data scope pertains to the data asset an organization needs to govern.
데이터 범위는 조직이 관리해야 할 데이터 자산과 관련이 있다.
We distinguish between traditional data and big data.
우리는 전통적 데이터와 빅데이터를 구분하였다.
The domain scope covers the data decision domains, to which governance mechanisms are applied.
도메인 범위는 거버넌스 메커니즘이 적용되는 데이터 의사결정 도메인을 다룬다.
Antecedents cover the contingency factors, which impact the adoption and implementation of data governance.
선행 요인은 데이터 거버넌스의 채택과 구현에 영향을 미치는 상황적 요인을 포함한다.
We differentiate between internal and external antecedents.
우리는 내부 요인과 외부 요인을 구분하였다.
Finally, consequences contain the effects of data governance.
마지막으로, 결과는 데이터 거버넌스의 효과를 포함한다.
We distinguish between intermediate performance effects and risk management.
우리는 중간 성과 효과와 리스크 관리를 구분하였다.



4. Analysis and review

In this section, we discuss the state of knowledge regarding data governance as documented in the set of reviewed papers.

이 섹션에서는 검토된 논문들에 기록된 데이터 거버넌스에 대한 지식의 현황을 논의한다.


In doing so, we use the structure of the conceptual framework shown in Fig. 3.

이를 위해, 그림 3에 제시된 개념적 프레임워크의 구조를 사용한다.


We break down each dimension of the conceptual framework and provide an overview of findings and insights.

개념적 프레임워크의 각 차원을 분해하고, 발견된 내용과 통찰의 개요를 제공한다.


We begin with the description of the core dimension of the framework, namely the governance mechanisms.

프레임워크의 핵심 차원인 거버넌스 메커니즘에 대한 설명부터 시작한다.


We then present the organizational, data, and domain scope, to which the governance mechanisms are applied.

그런 다음, 거버넌스 메커니즘이 적용되는 조직, 데이터, 도메인 범위를 제시한다.


We continue with the antecedents that influence the setup and configuration of data governance.

이어서 데이터 거버넌스의 설정과 구성을 결정짓는 선행 요인을 논의한다.


We conclude this section with the consequences, which describe the effects of data governance.

이 섹션의 마지막으로 데이터 거버넌스의 효과를 설명하는 결과를 다룬다.


Fig. 4 provides an overview of the concepts per dimension of the conceptual framework.

그림 4는 개념적 프레임워크의 각 차원별 개념을 개괄적으로 보여준다.


tempImage0llBXf.heic Fig. 4. Concepts within the conceptual framework for data governance.



4.1 Governance mechanisms


As part of their data governance approach, companies utilize a mixture of various governance mechanisms.

데이터 거버넌스 접근 방식의 일환으로, 기업들은 다양한 거버넌스 메커니즘의 조합을 활용한다.


These mechanisms help to plan and control data management activities (DAMA International, 2009, p. 21; Informatica, 2012, pp. 17).

이러한 메커니즘은 데이터 관리 활동을 계획하고 통제하는 데 도움을 준다(DAMA International, 2009, p. 21; Informatica, 2012, pp. 17).


Governance mechanisms comprise formal structures connecting business, IT, and data management functions, formal processes and procedures for decision-making and monitoring, and practices supporting the active participation of and collaboration among stakeholders.

거버넌스 메커니즘은 비즈니스, IT, 데이터 관리 기능을 연결하는 공식적 구조, 의사결정 및 모니터링을 위한 공식적 프로세스 및 절차, 그리고 이해관계자 간의 적극적인 참여와 협력을 지원하는 실천 사례를 포함한다.


Following the literature on information technology governance (De Haes & Van Grembergen, 2005, pp. 4; De Haes & Van Grembergen, 2009, pp. 123; Peterson, 2004, pp. 14; Weill & Ross, 2005, p. 28), we distinguish between (a) structural; (b) procedural; and (c) relational governance mechanisms.
정보 기술 거버넌스 관련 문헌에 따라(De Haes & Van Grembergen, 2005, pp. 4; De Haes & Van Grembergen, 2009, pp. 123; Peterson, 2004, pp. 14; Weill & Ross, 2005, p. 28), 우리는 (a) 구조적, (b) 절차적, (c) 관계적 거버넌스 메커니즘으로 구분한다.



4.1.1 Structural mechanisms


Structural governance mechanisms determine reporting structures, governance bodies, and accountabilities (Borgman, Heier, Bahli, & Boekamp, 2016, p. 4903).

구조적 거버넌스 메커니즘은 보고 구조, 거버넌스 조직, 책임성을 결정한다(Borgman, Heier, Bahli, & Boekamp, 2016, p. 4903).


They encompass (i) roles and responsibilities and (ii) the allocation of decision-making authority.

이들은 (i) 역할과 책임, (ii) 의사결정 권한의 할당을 포함한다.


The main roles and governance bodies comprise the executive sponsor, data governance leader, data owner, data steward, data governance council, data governance office, data producer, and the data consumer.

주요 역할과 거버넌스 조직에는 총괄 스폰서, 데이터 거버넌스 리더, 데이터 소유자, 데이터 스튜어드, 데이터 거버넌스 위원회, 데이터 거버넌스 사무국, 데이터 생산자, 데이터 소비자가 포함된다.


The executive sponsor provides strategic direction, business prioritization, and funding for data management initiatives (Informatica, 2012, p. 8; NASCIO, 2008, p. 7; Weber, Otto, & Österle, 2009, p. 11).

총괄 스폰서는 데이터 관리 이니셔티브를 위한 전략적 방향, 비즈니스 우선순위 설정, 자금 지원을 제공한다(Informatica, 2012, p. 8; NASCIO, 2008, p. 7; Weber, Otto, & Österle, 2009, p. 11).


He or she is ideally one of the highest-level executives, i.e., the C-level (Dreibelbis, Hechler, Milman, Oberhofer, & van Run, 2008, p. 492; Informatica, 2012, p. 8; Loshin, 2008, p. 83; Weber et al., 2009, p. 11).

총괄 스폰서는 이상적으로 최고 경영진(C-level)의 일원이어야 한다(Dreibelbis, Hechler, Milman, Oberhofer, & van Run, 2008, p. 492; Informatica, 2012, p. 8; Loshin, 2008, p. 83; Weber et al., 2009, p. 11).


The data governance leader is responsible for the day-to-day management of the data governance program (Loshin, 2008, p. 83).

데이터 거버넌스 리더는 데이터 거버넌스 프로그램의 일상 관리를 책임진다(Loshin, 2008, p. 83).


He or she provides guidance concerning the design, delivery, and maintenance of data and oversees compliance with data policies (Dyché & Levy, 2006, pp. 156; Loshin, 2008, p. 83).

데이터의 설계, 제공, 유지보수에 대한 지침을 제공하며 데이터 정책 준수를 감독한다(Dyché & Levy, 2006, pp. 156; Loshin, 2008, p. 83).


Furthermore, the data governance leader coordinates tasks for data stewards and provides periodic reports on data governance performance (Informatica, 2012, p. 8; Loshin, 2008, p. 83).

또한, 데이터 거버넌스 리더는 데이터 스튜어드의 업무를 조정하며 데이터 거버넌스 성과에 대한 정기 보고서를 제공한다(Informatica, 2012, p. 8; Loshin, 2008, p. 83).


Data owners are often line-of-business executives and accountable for the data assets in their business unit (Cheong & Chang, 2007, pp. 1004; IBM, 2014, pp. 194; Otto, 2011c, p. 7).

데이터 소유자는 일반적으로 사업 부문의 임원으로, 자신이 속한 사업 부문의 데이터 자산에 대해 책임을 진다(Cheong & Chang, 2007, pp. 1004; IBM, 2014, pp. 194; Otto, 2011c, p. 7).


They communicate broad data requirements and risks (IBM, 2014, pp. 194).

그들은 광범위한 데이터 요구사항과 리스크를 전달한다(IBM, 2014, pp. 194).


Data stewards are business leaders or designated subject matter experts who have detailed knowledge about the business and data requirements and who can translate those requirements into technical specifications (e.g., Cheong & Chang, 2007, pp. 1004; DAMA International, 2009, pp. 39; Informatica, 2012, p. 8).

데이터 스튜어드는 비즈니스 리더이거나 지명된 주제 전문가로, 비즈니스와 데이터 요구사항에 대한 상세한 지식을 가지고 있으며 이를 기술 사양으로 변환할 수 있다(Cheong & Chang, 2007, pp. 1004; DAMA International, 2009, pp. 39; Informatica, 2012, p. 8).


Business data stewards are subject matter experts from specific business areas (e.g., Dyché & Levy, 2006, pp. 156; Informatica, 2012, p. 8).

비즈니스 데이터 스튜어드는 특정 비즈니스 영역의 주제 전문가이다(Dyché & Levy, 2006, pp. 156; Informatica, 2012, p. 8).


Technical data stewards are professionals within IT that act as the counterparts of business data stewards (e.g., DAMA International, 2009, pp. 5; Weber et al., 2009, p. 11).

기술 데이터 스튜어드는 IT 부서의 전문가로, 비즈니스 데이터 스튜어드의 대응 역할을 한다(DAMA International, 2009, pp. 5; Weber et al., 2009, p. 11).


The data governance council is a hierarchy-overarching, cross-functional governance body (Otto, 2011b, p. 49; Watson, Fuller, & Ariyachandra, 2004, p. 437).

데이터 거버넌스 위원회는 계층을 초월하는 범기능적 거버넌스 조직이다(Otto, 2011b, p. 49; Watson, Fuller, & Ariyachandra, 2004, p. 437).


It establishes the strategic direction for the entire data governance program and aligns it with organizational goals (e.g., Cheong & Chang, 2007, pp. 1004; Watson et al., 2004, p. 443).

이는 전체 데이터 거버넌스 프로그램의 전략적 방향을 설정하고 이를 조직 목표와 정렬시킨다(Cheong & Chang, 2007, pp. 1004; Watson et al., 2004, p. 443).


Moreover, the data governance council monitors the program including ongoing improvement activities (Dyché & Levy, 2006, pp. 156; Loshin, 2008, p. 83; Thomas, 2006, p. 17).

게다가 데이터 거버넌스 위원회는 지속적 개선 활동을 포함한 프로그램을 모니터링한다(Dyché & Levy, 2006, pp. 156; Loshin, 2008, p. 83; Thomas, 2006, p. 17).


The data governance office is a staff organization that supports the governance and decision-making activities of the data stewardship teams and the data governance council (DAMA International, 2009, pp. 44; Thomas, 2006, p. 18).

데이터 거버넌스 사무국은 데이터 스튜어드십 팀과 데이터 거버넌스 위원회의 거버넌스 및 의사결정 활동을 지원하는 직원 조직이다(DAMA International, 2009, pp. 44; Thomas, 2006, p. 18).


The data governance office establishes communication channels, prepares meetings, coordinates issue resolution, and educates stakeholders (DAMA International, 2009, pp. 31; Thammaboosadee & Dumthanasarn, 2018, p. 2; Thomas, 2006, p. 18).

데이터 거버넌스 사무국은 소통 채널을 구축하고, 회의를 준비하며, 문제 해결을 조정하고, 이해관계자를 교육한다(DAMA International, 2009, pp. 31; Thammaboosadee & Dumthanasarn, 2018, p. 2; Thomas, 2006, p. 18).


The data producer creates the data or aggregates and maintains the data created by others (ISACA, 2013, pp. 27; Kooper, Maes, & Lindgreen, 2011, pp. 197; DAMA International, 2009, pp. 31; Thomas, 2006, p. 17).
데이터 생산자는 데이터를 생성하거나, 다른 사람이 생성한 데이터를 집계하고 유지 관리한다(ISACA, 2013, pp. 27; Kooper, Maes, & Lindgreen, 2011, pp. 197; DAMA International, 2009, pp. 31; Thomas, 2006, p. 17).
The data consumer is the user of the data (ISACA, 2013, pp. 27; Kooper et al., 2011, pp. 197; Thomas, 2006, p. 17).
데이터 소비자는 데이터를 사용하는 사용자이다(ISACA, 2013, pp. 27; Kooper et al., 2011, pp. 197; Thomas, 2006, p. 17).


He or she specifies requirements and reports data-related issues (Cheong & Chang, 2007, pp. 1004).

데이터 소비자는 요구사항을 명시하고 데이터 관련 문제를 보고한다(Cheong & Chang, 2007, pp. 1004).


The allocation of decision-making authority determines which organizational unit has the mandate for action related to data governance (Khatri & Brown, 2010, p. 151; Otto, 2011b, p. 62).
의사결정 권한의 할당은 데이터 거버넌스와 관련된 행동 권한을 가진 조직 단위를 결정한다(Khatri & Brown, 2010, p. 151; Otto, 2011b, p. 62).


We distinguish between hierarchical positioning, functional positioning, and the positioning of decision-making authority on a continuum ranging from centralized to decentralized (Otto, 2011c, p. 6; Wende & Otto, 2007, p. 9).

우리는 의사결정 권한의 배치를 계층적 배치, 기능적 배치, 중앙집권적에서 분권적까지의 연속선상 배치로 구분한다(Otto, 2011c, p. 6; Wende & Otto, 2007, p. 9).


Hierarchical positioning defines at which hierarchical level of an organization the decision-making authority is situated (Otto, 2011c, p. 6).
계층적 배치는 조직의 어느 계층 수준에서 의사결정 권한이 위치하는지를 정의한다(Otto, 2011c, p. 6).

Functional positioning determines which department holds the decision-making authority (e.g., DAMA International, 2009, p. 38; Otto, 2011c, p. 6; Watson et al., 2004, pp. 436).
기능적 배치는 어느 부서가 의사결정 권한을 가지고 있는지를 결정한다(DAMA International, 2009, p. 38; Otto, 2011c, p. 6; Watson et al., 2004, pp. 436).

The positioning of decision-making authority on a continuum determines whether decisions are taken by a central unit, by decentral units, or by both (e.g., Barker, 2016, pp. 70; Begg & Caira, 2012, p. 10; Tallon et al., 2014, p. 147; Weber et al., 2009, p. 5).

의사결정 권한의 연속선상 배치는 중앙 단위, 분산 단위, 또는 양쪽 모두에 의해 결정이 이루어지는지를 결정한다(Barker, 2016, pp. 70; Begg & Caira, 2012, p. 10; Tallon et al., 2014, p. 147; Weber et al., 2009, p. 5).



4.1.2 Procedural mechanisms


Procedural governance mechanisms aim to ensure that data is recorded accurately, held securely, used effectively, and shared appropriately (Borgman et al., 2016, p. 4903).

절차적 거버넌스 메커니즘은 데이터가 정확히 기록되고, 안전하게 보관되며, 효과적으로 사용되고, 적절하게 공유되도록 보장하는 것을 목표로 한다(Borgman et al., 2016, p. 4903).


They comprise (i) the data strategy; (ii) policies; (iii) standards; (iv) processes; (v) procedures; (vi) contractual agreements; (vii) performance measurement; (viii) compliance monitoring; and (ix) issue management.

이 메커니즘은 (i) 데이터 전략, (ii) 정책, (iii) 표준, (iv) 프로세스, (v) 절차, (vi) 계약 합의, (vii) 성과 측정, (viii) 준수 모니터링, (ix) 문제 관리를 포함한다.



Data strategy

The data strategy represents a high-level course of action based on strategic business objectives (e.g., Cheng, Li, Gao, & Liu, 2017, p. 518; DAMA International, 2009, pp. 45; Guetat & Dakhli, 2015, p. 1091).
데이터 전략은 전략적 비즈니스 목표에 기반한 고차원적 실행 방안을 나타낸다(Cheng, Li, Gao, & Liu, 2017, p. 518; DAMA International, 2009, pp. 45; Guetat & Dakhli, 2015, p. 1091).


It consists of a vision statement (Al-Ruithe & Benkhelifa, 2017a, p. 226; Barker, 2016, pp. 68; Informatica, 2012, p. 7), a business case (e.g., Al-Ruithe et al., 2018a, pp. 13; Weber et al., 2009, p. 10), guiding principles (e.g., Brous, Janssen et al., 2016, p. 5; Fu, Wojak, Neagu, Ridley, & Travis, 2011, p. 3; Khatri & Brown, 2010, p. 149), long-term and short-term objectives (Alhassan, Sammon, & Daly, 2019, p. 107; DAMA International, 2009, pp. 45; Weber et al., 2009, p. 10), and an implementation roadmap (DAMA International, 2009, pp. 45; Prasetyo & Surendro, 2015, p. 51).

이는 비전 선언문(Al-Ruithe & Benkhelifa, 2017a, p. 226; Barker, 2016, pp. 68; Informatica, 2012, p. 7), 비즈니스 사례(Al-Ruithe et al., 2018a, pp. 13; Weber et al., 2009, p. 10), 가이드 원칙(Brous, Janssen et al., 2016, p. 5; Fu, Wojak, Neagu, Ridley, & Travis, 2011, p. 3; Khatri & Brown, 2010, p. 149), 장단기 목표(Alhassan, Sammon, & Daly, 2019, p. 107; DAMA International, 2009, pp. 45; Weber et al., 2009, p. 10), 그리고 실행 로드맵(DAMA International, 2009, pp. 45; Prasetyo & Surendro, 2015, p. 51)으로 구성된다.



Data policies

Data policies provide high-level guidelines and rules regarding the creation, acquisition, storage, security, quality, and permissible use of data (e.g., Alhassan et al., 2019, p. 106; DAMA International, 2009, pp. 47; Thompson, Ravindran, & Nicosia, 2015, p. 320).

데이터 정책은 데이터의 생성, 획득, 저장, 보안, 품질, 허용된 사용에 대한 고차원적 지침과 규칙을 제공한다(Alhassan et al., 2019, p. 106; DAMA International, 2009, pp. 47; Thompson, Ravindran, & Nicosia, 2015, p. 320).


Organizations use data policies to communicate key objectives, data accountabilities, roles, responsibilities, and data retention periods (e.g., DAMA International, 2009, pp. 47; Donaldson & Walker, 2004, p. 283; Morabito, 2015, p. 89).

조직은 데이터 정책을 사용하여 주요 목표, 데이터 책임, 역할, 책임, 데이터 보존 기간 등을 전달한다(DAMA International, 2009, pp. 47; Donaldson & Walker, 2004, p. 283; Morabito, 2015, p. 89).



Data standards

Data standards ensure that the data representation and the execution of data-related activities are consistent and normalized throughout the organization (e.g., DAMA International, 2009, pp. 48; Kim & Cho, 2017, p. 387; Palczewska et al., 2013, p. 576).

데이터 표준은 데이터 표현과 데이터 관련 활동의 실행이 조직 전체에서 일관되고 표준화되도록 보장한다(DAMA International, 2009, pp. 48; Kim & Cho, 2017, p. 387; Palczewska et al., 2013, p. 576).


They facilitate interoperability within and across organizations and ensure their fit for purpose (e.g., Cheong & Chang, 2007, p. 1002; DAMA International, 2009, p. 185; Otto, 2012, p. 274).

데이터 표준은 조직 내부 및 조직 간 상호운용성을 촉진하며, 목적에 맞는 적합성을 보장한다(Cheong & Chang, 2007, p. 1002; DAMA International, 2009, p. 185; Otto, 2012, p. 274).


Data standards are defined internally by data stewards and data architects or externally by standardization organizations such as ISO (DAMA International, 2009, pp. 48; Dreibelbis et al., 2008, pp. 493; Hovenga & Grain, 2013, pp. 82; Otto, 2012, p. 274).

데이터 표준은 내부적으로 데이터 스튜어드와 데이터 설계자에 의해 정의되거나 외부적으로 ISO와 같은 표준화 기관에 의해 정의된다(DAMA International, 2009, pp. 48; Dreibelbis et al., 2008, pp. 493; Hovenga & Grain, 2013, pp. 82; Otto, 2012, p. 274).



Data processes

Clear data processes are considered a fundamental element of a successful data governance implementation (Alhassan et al., 2019, p. 105).

명확한 데이터 프로세스는 성공적인 데이터 거버넌스 구현의 근본적인 요소로 간주된다(Alhassan et al., 2019, p. 105).


Processes are standardized, documented, and repeatable methods used to govern data (Al-Ruithe, Benkhelifa, & Hameed, 2018, p. 10; Thomas, 2006, pp. 18).

프로세스는 데이터를 관리하기 위해 사용되는 표준화되고, 문서화된 반복 가능한 방법이다(Al-Ruithe, Benkhelifa, & Hameed, 2018, p. 10; Thomas, 2006, pp. 18).


Examples include processes for developing and maintaining rules for data handling as well as modeling and documenting the data lifecycle (EFQM, 2011, pp. 17; Khatri, 2016, p. 675; Kim & Cho, 2018, p. 40).

예로는 데이터 처리 규칙을 개발하고 유지하는 프로세스, 데이터 라이프사이클을 모델링하고 문서화하는 프로세스 등이 포함된다(EFQM, 2011, pp. 17; Khatri, 2016, p. 675; Kim & Cho, 2018, p. 40).


Further examples comprise processes for the assessment of the current state, processes for the alignment and validation of policies, processes for decision-making, performance measurement, and issue resolution (Dreibelbis et al., 2008, pp. 484; Loshin, 2008, p. 77; Rifaie, Alhajj, & Ridley, 2009, p. 588; Thomas, 2006, pp. 18).

추가적으로, 현재 상태 평가 프로세스, 정책의 정렬 및 검증 프로세스, 의사결정, 성과 측정, 문제 해결 프로세스 등이 있다(Dreibelbis et al., 2008, pp. 484; Loshin, 2008, p. 77; Rifaie, Alhajj, & Ridley, 2009, p. 588; Thomas, 2006, pp. 18).



Procedures

Procedures are “the documented methods, techniques, and steps followed to accomplish a specific activity or task” (DAMA International, 2009, pp. 48).

절차는 “특정 활동이나 작업을 완료하기 위해 따르는 문서화된 방법, 기술, 단계”를 의미한다(DAMA International, 2009, pp. 48).


They vary widely across companies.

절차는 회사마다 크게 다를 수 있다.


For example, procedures describe how to establish accountabilities and decision rights (Thomas, 2006, pp. 18), develop a data model (DAMA International, 2009, pp. 48; Thomas, 2006, pp. 18), or identify and resolve data errors (Rifaie et al., 2009, p. 588; Thomas, 2006, pp. 18).

예를 들어, 절차는 책임과 의사결정 권한을 설정하는 방법(Thomas, 2006, pp. 18), 데이터 모델을 개발하는 방법(DAMA International, 2009, pp. 48; Thomas, 2006, pp. 18), 데이터 오류를 식별하고 해결하는 방법(Rifaie et al., 2009, p. 588; Thomas, 2006, pp. 18)을 설명한다.



Contractual agreements

Data provisioning and data sharing settings require contractual agreements between participating internal departments or external organizations.

데이터 제공 및 데이터 공유 설정은 참여하는 내부 부서 또는 외부 조직 간의 계약 합의를 필요로 한다.


Examples of such agreements are service level agreements (SLA) and data sharing agreements (DSA).
이러한 합의의 예로는 서비스 수준 협정(SLA) 및 데이터 공유 협정(DSA)이 있다.


An SLA defines what data services will be provided by an internal team or a third-party provider, how the services will be provided, and what happens if expectations are not met (Al-Ruithe et al., 2018b, p. 16; Barker, 2016, pp. 44).

SLA는 내부 팀 또는 제3자 제공자가 제공할 데이터 서비스, 서비스 제공 방식, 기대에 미치지 못할 경우의 대응을 정의한다(Al-Ruithe et al., 2018b, p. 16; Barker, 2016, pp. 44).


A DSA determines the legal and data governance aspects before two or more organizations start sharing data (Allen et al., 2014, pp. 1).

DSA는 두 개 이상의 조직이 데이터를 공유하기 전에 법적 및 데이터 거버넌스 측면을 결정한다(Allen et al., 2014, pp. 1).



Performance measurement

Performance measurement aims at assessing the effectiveness of data governance by measuring the level of goal attainment (e.g., Al-Ruithe et al., 2018a, pp. 13; Carretero et al., 2017, p. 143; Otto, 2011b, p. 62; Weber et al., 2009, pp. 10).
성과 측정은 목표 달성 수준을 측정하여 데이터 거버넌스의 효과를 평가하는 것을 목표로 한다(Al-Ruithe et al., 2018a, pp. 13; Carretero et al., 2017, p. 143; Otto, 2011b, p. 62; Weber et al., 2009, pp. 10).


Performance measures on firm-level are based on strategic business goals such as revenue growth, increased profitability, and cost savings (e.g., EFQM, 2011, p. 24; Tallon et al., 2014, p. 166; Thomas, 2006, pp. 14).

기업 수준에서의 성과 측정은 매출 성장, 수익성 증가, 비용 절감과 같은 전략적 비즈니스 목표를 기반으로 한다(EFQM, 2011, p. 24; Tallon et al., 2014, p. 166; Thomas, 2006, pp. 14).


Performance measures on intermediate-level are based on operational business goals or decision domain-specific goals, both derived from strategic business goals on firm-level (Otto, 2011b, p. 62; Panian, 2010, pp. 944; Pierce, Dismute, & Yonke, 2008, p. 31).

중간 수준의 성과 측정은 기업 수준의 전략적 비즈니스 목표에서 파생된 운영 비즈니스 목표 또는 의사결정 도메인별 목표를 기반으로 한다(Otto, 2011b, p. 62; Panian, 2010, pp. 944; Pierce, Dismute, & Yonke, 2008, p. 31).


Performance measures on program-level focus on the progress and impact of the data governance program (EFQM, 2011, pp. 25; Informatica, 2012, pp. 13; Thomas, 2006, pp. 14).

프로그램 수준에서의 성과 측정은 데이터 거버넌스 프로그램의 진행 상황과 영향을 중심으로 한다(EFQM, 2011, pp. 25; Informatica, 2012, pp. 13; Thomas, 2006, pp. 14).



Compliance monitoring

Compliance monitoring aims at tracking and enforcing conformance with regulatory requirements and organizational policies, standards, procedures, and SLAs (e.g., Al-Ruithe et al., 2018a, pp. 13; Bruhn, 2014, p. 3; ISACA, 2013, p. 24).

준수 모니터링은 규제 요구사항 및 조직 정책, 표준, 절차, SLA 준수를 추적하고 이를 강제하는 것을 목표로 한다(Al-Ruithe et al., 2018a, pp. 13; Bruhn, 2014, p. 3; ISACA, 2013, p. 24).


This includes the supervision of data professionals and the oversight of data management projects and services (DAMA International, 2009, p. 21).

이는 데이터 전문가에 대한 감독과 데이터 관리 프로젝트 및 서비스에 대한 감독을 포함한다(DAMA International, 2009, p. 21).


Compliance monitoring encompasses auditing, which aims at providing stakeholders with objective, unbiased assessments and recommendations for improvement (DAMA International, 2009, pp. 159).

준수 모니터링에는 감사가 포함되며, 이는 이해관계자에게 객관적이고 편향되지 않은 평가와 개선을 위한 권장 사항을 제공하는 것을 목표로 한다(DAMA International, 2009, pp. 159).


Based on audit results, companies can take corrective and preventive actions (ISO/IEC, 2005, p. vi).

감사 결과를 기반으로, 기업은 교정 및 예방 조치를 취할 수 있다(ISO/IEC, 2005, p. vi).


Issue management

Issue management refers to the identification, management, and resolution of data-related issues (DAMA International, 2009, pp. 50).

문제 관리는 데이터와 관련된 문제를 식별, 관리, 해결하는 것을 의미한다(DAMA International, 2009, pp. 50).


It includes processes for the standardization of data issues and for issue resolution (DAMA International, 2009, pp. 303; Thomas, 2006, pp. 18) and the identification of persons who are accountable to resolve issues (DAMA International, 2009, p. 307).

이는 데이터 문제의 표준화 및 문제 해결을 위한 프로세스(DAMA International, 2009, pp. 303; Thomas, 2006, pp. 18)와 문제를 해결할 책임이 있는 사람을 식별하는 작업(DAMA International, 2009, p. 307)을 포함한다.


In addition, an escalation process helps to address issues to higher levels of authority (DAMA International, 2009, pp. 50; IBM, 2014, p. 40).

추가적으로, 상향 보고 프로세스를 통해 문제를 더 높은 수준의 권한으로 전달할 수 있다(DAMA International, 2009, pp. 50; IBM, 2014, p. 40).


This enables stakeholders to give feedback, e.g., concerning policy changes to meet new business requirements (DAMA International, 2009, pp. 50; IBM, 2014, p. 40).

이는 이해관계자가 새로운 비즈니스 요구사항을 충족하기 위한 정책 변경 등에 대해 피드백을 제공할 수 있도록 한다(DAMA International, 2009, pp. 50; IBM, 2014, p. 40).



4.1.3 Relational mechanisms


Relational governance mechanisms facilitate collaboration between stakeholders (Borgman et al., 2016, p. 4903).

관계적 거버넌스 메커니즘은 이해관계자 간 협업을 촉진한다(Borgman et al., 2016, p. 4903).


They encompass (i) communication; (ii) training; and (iii) the coordination of decision-making.

이는 (i) 의사소통, (ii) 교육, (iii) 의사결정 조정을 포함한다.


Communication

Communication aims at continuously generating awareness for the data governance program among stakeholders (e.g., Begg & Caira, 2012, p. 10; Cheong & Chang, 2007, p. 1002; Lomas, 2010, p. 188; Watson et al., 2004, p. 443).

의사소통은 데이터 거버넌스 프로그램에 대한 이해관계자의 인식을 지속적으로 생성하는 것을 목표로 한다(Begg & Caira, 2012, p. 10; Cheong & Chang, 2007, p. 1002; Lomas, 2010, p. 188; Watson et al., 2004, p. 443).


Creating awareness is an essential step in establishing shared commitment (Rifaie et al., 2009, p. 589), ensuring buy-in and active participation of stakeholders (DAMA International, 2009, p. 294; EFQM, 2011, p. 17; Young & McConkey, 2012, p. 72), and eliminating resistance to required changes (EFQM, 2011, p. 17; Guetat & Dakhli, 2015, p. 1092; Otto, 2012, pp. 287).

인식을 창출하는 것은 공동의 헌신을 구축(Rifaie et al., 2009, p. 589), 이해관계자의 지지와 적극적 참여를 보장(DAMA International, 2009, p. 294; EFQM, 2011, p. 17; Young & McConkey, 2012, p. 72)하며, 필요한 변화에 대한 저항을 제거(EFQM, 2011, p. 17; Guetat & Dakhli, 2015, p. 1092; Otto, 2012, pp. 287)하는 데 필수적인 단계이다.


Training

Training programs ensure that stakeholders have the necessary knowledge and qualifications to support the implementation of data governance (EFQM, 2011, p. 17; Tallon, Short, & Harkins, 2013, p. 196).

교육 프로그램은 이해관계자들이 데이터 거버넌스 구현을 지원하는 데 필요한 지식과 자격을 갖추도록 보장한다(EFQM, 2011, p. 17; Tallon, Short, & Harkins, 2013, p. 196).


In addition, continuous training helps them act according to data policies, processes, and procedures (Alhassan et al., 2019, p. 104; Randhawa, 2019, pp. 119).

또한, 지속적인 교육은 데이터 정책, 프로세스 및 절차에 따라 행동할 수 있도록 돕는다(Alhassan et al., 2019, p. 104; Randhawa, 2019, pp. 119).


Training can be conducted in the form of computer-based training, classroom training, job-specific and project-related training, and one-on-one coaching (Cave, 2017, p. 125; Watson et al., 2004, pp. 444).

교육은 컴퓨터 기반 교육, 강의실 교육, 직무별 및 프로젝트 관련 교육, 일대일 코칭의 형태로 진행될 수 있다(Cave, 2017, p. 125; Watson et al., 2004, pp. 444).


Communication and training facilitate the creation of an organizational culture that values data assets (Informatica, 2012, p. 16).

의사소통과 교육은 데이터 자산을 중시하는 조직 문화를 조성하는 데 기여한다(Informatica, 2012, p. 16).



Coordination of decision-making

The coordination of decision-making describes practices for alignment across functions.

의사결정 조정은 기능 간 정렬을 위한 실천 방식을 설명한다.


The hierarchical (or vertical) approach is characterized by a pyramid-like structure with decision-making authority located at the top level.

계층적(또는 수직적) 접근 방식은 의사결정 권한이 최상위 수준에 위치한 피라미드형 구조로 특징지어진다.


The main elements of the hierarchical approach include steering and control (Hagmann, 2013, p. 237; Kooper et al., 2011, p. 199).

계층적 접근 방식의 주요 요소에는 조정과 통제가 포함된다(Hagmann, 2013, p. 237; Kooper et al., 2011, p. 199).


The cooperative (or horizontal) approach makes use of collaborative behavior to clarify differences and solve problems (Wende & Otto, 2007, pp. 10).

협력적(또는 수평적) 접근 방식은 협력적 행동을 활용하여 차이를 명확히 하고 문제를 해결한다(Wende & Otto, 2007, pp. 10).


It utilizes formal coordination mechanisms such as working groups, committees, task forces, and integrator roles, but also informal coordination mechanisms such as interdepartmental events, performance reviews across business units, and job rotation (Bruhn, 2014, p. 6; Borgman et al., 2016, p. 4903; Tallon et al., 2014, p. 147; Weber et al., 2009, p. 15).

이 접근 방식은 작업 그룹, 위원회, 태스크포스, 통합 역할과 같은 공식적인 조정 메커니즘을 활용하며, 부서 간 행사, 비즈니스 단위 간 성과 검토, 직무 순환과 같은 비공식적인 조정 메커니즘도 포함한다(Bruhn, 2014, p. 6; Borgman et al., 2016, p. 4903; Tallon et al., 2014, p. 147; Weber et al., 2009, p. 15).



4.2 Organizational scope


The organizational scope represents the expansiveness of data governance and roughly corresponds to the unit of analysis.

조직의 범위는 데이터 거버넌스의 확장성을 나타내며, 대략적으로 분석 단위와 일치한다.


We subdivide the organizational scope into (a) intra-organizational and (b) inter-organizational.

조직의 범위는 (a) 조직 내부와 (b) 조직 간 범위로 세분화된다.


Intra-organizational scope

The intra-organizational scope determines data governance within a single organization.

조직 내부 범위는 단일 조직 내에서의 데이터 거버넌스를 정의한다.


It comprises data governance on the project-level or firm-level (Tiwana et al., 2014, p. 8).

이는 프로젝트 수준 또는 기업 수준의 데이터 거버넌스를 포함한다(Tiwana et al., 2014, p. 8).


Data governance on the project-level focuses on managing the quality and integrity of project-related data (DAMA International, 2009, pp. 52).

프로젝트 수준의 데이터 거버넌스는 프로젝트 관련 데이터의 품질과 무결성을 관리하는 데 중점을 둔다(DAMA International, 2009, pp. 52).


Data governance on the firm-level covers the entire enterprise and coordinates the interests and demands of different stakeholder groups such as business and IT departments (DAMA International, 2009, p. 41; Dyché & Levy, 2006, p. 151; Otto, 2011b, p. 47; Pierce et al., 2008, p. 26; Weber et al., 2009, p. 2).

기업 수준의 데이터 거버넌스는 전체 조직을 포괄하며, 비즈니스 및 IT 부서와 같은 다양한 이해관계자 그룹의 이익과 요구를 조정한다(DAMA International, 2009, p. 41; Dyché & Levy, 2006, p. 151; Otto, 2011b, p. 47; Pierce et al., 2008, p. 26; Weber et al., 2009, p. 2).


Inter-organizational scope

The inter-organizational scope encompasses data governance between firms or even for an ecosystem of firms (Tiwana et al., 2014, p. 8).

조직 간 범위는 기업 간 또는 기업 생태계를 위한 데이터 거버넌스를 포괄한다(Tiwana et al., 2014, p. 8).


Companies increasingly partner with external collaborators such as vendors, industry peers, and public-sector organizations to create new information products (Bruhn, 2014, p. 5; Cheong & Chang, 2007, p. 1002; Lee, Madnick, Wang, Wang, & Zhang, 2014, pp. 7; Rasouli, Trienekens et al., 2016, pp. 1362; Winter & Davidson, 2018, pp. 5).

기업들은 새로운 정보 제품을 창출하기 위해 공급업체, 산업 동료, 공공 부문 조직과 같은 외부 협력자와 점점 더 협력하고 있다(Bruhn, 2014, p. 5; Cheong & Chang, 2007, p. 1002; Lee, Madnick, Wang, Wang, & Zhang, 2014, pp. 7; Rasouli, Trienekens et al., 2016, pp. 1362; Winter & Davidson, 2018, pp. 5).


Although this enables companies to exploit environmental opportunities, it can also result in loss of control on data, unsecured information access, and low-quality information products (e.g., Al-Ruithe et al., 2018a, p. 2; Rasouli, Trienekens et al., 2016, p. 1357).

이는 기업이 환경적 기회를 활용할 수 있게 하지만, 데이터 통제 상실, 정보 접근 보안 미비, 낮은 품질의 정보 제품과 같은 문제를 초래할 수 있다(Al-Ruithe et al., 2018a, p. 2; Rasouli, Trienekens et al., 2016, p. 1357).


To counteract these issues, companies need to set up governance mechanisms such as data integration and usage policies (Bruhn, 2014, pp. 6; Morabito, 2015, p. 86), data exchange standards (Lee et al., 2014, pp. 6; Rasouli, Trienekens et al., 2016, pp. 1362), processes for interaction and collaboration (Panian, 2010, p. 942), service level agreements (Al-Ruithe, Benkhelifa, & Hameed, 2016, pp. 382; IBM, 2014, pp. 26), and data sharing agreements (Allen et al., 2014, p. 1; Bruhn, 2014, p. 3; ISO, 2005, p. 14).

이러한 문제를 해결하기 위해, 기업은 데이터 통합 및 사용 정책(Bruhn, 2014, pp. 6; Morabito, 2015, p. 86), 데이터 교환 표준(Lee et al., 2014, pp. 6; Rasouli, Trienekens et al., 2016, pp. 1362), 상호작용 및 협력을 위한 프로세스(Panian, 2010, p. 942), 서비스 수준 협정(Al-Ruithe, Benkhelifa, & Hameed, 2016, pp. 382; IBM, 2014, pp. 26), 데이터 공유 협정(Allen et al., 2014, p. 1; Bruhn, 2014, p. 3; ISO, 2005, p. 14)과 같은 거버넌스 메커니즘을 구축해야 한다.



4.3 Data scope


Data is the representation of facts in the form of text, numbers, images, sound, or video (DAMA International, 2009, p. 2).

데이터는 텍스트, 숫자, 이미지, 음성, 비디오 형태로 사실을 표현한 것이다(DAMA International, 2009, p. 2).


Every data governance program must specify which type of data is in focus (Weller, 2008, p. 254).

모든 데이터 거버넌스 프로그램은 중점적으로 다룰 데이터 유형을 명확히 지정해야 한다(Weller, 2008, p. 254).


Most data governance articles we analyzed focus on the traditional data space as described by Lee et al. (2014).

분석한 대부분의 데이터 거버넌스 논문은 Lee et al. (2014)에서 설명된 전통적인 데이터 공간에 초점을 맞추고 있다.


However, a few articles also describe data governance in the context of big data, having partially different requirements on data governance than traditional data.

그러나 일부 논문은 빅데이터의 맥락에서 데이터 거버넌스를 설명하며, 전통적인 데이터와는 다소 다른 요구사항을 제시한다.


Corresponding to Lee et al. (2014), we cluster data into the following two categories: (a) traditional data and (b) big data.

Lee et al. (2014)에 따라 데이터는 (a) 전통적인 데이터와 (b) 빅데이터의 두 가지 범주로 분류된다.



Traditional data

Traditional data builds the basis for an organization’s operations (Lee et al., 2014, p. 4).

전통적인 데이터는 조직 운영의 기초를 형성한다(Lee et al., 2014, p. 4).


It comprises master data, transactional data, and reference data.

이는 마스터 데이터, 트랜잭션 데이터, 참조 데이터를 포함한다.


Master data describes the key business objects within an organization (e.g., Loshin, 2008, pp. 6; Otto, 2012, p. 274; Soares, 2013, p. 57).

마스터 데이터는 조직 내 주요 비즈니스 객체를 설명한다(Loshin, 2008, pp. 6; Otto, 2012, p. 274; Soares, 2013, p. 57).


Typical domains of master data are customer, employee, finance, patient, product, location, material, and supplier data (e.g., Dreibelbis et al., 2008, p. 2; Khatri, 2016, p. 681; Loshin, 2008, pp. 6).

마스터 데이터의 일반적인 도메인은 고객, 직원, 재무, 환자, 제품, 위치, 자재, 공급업체 데이터이다(Dreibelbis et al., 2008, p. 2; Khatri, 2016, p. 681; Loshin, 2008, pp. 6).


Transactional data represents records about business transactions in different domains (Dreibelbis et al., 2008, p. 35; IBM, 2014, p. 221).

트랜잭션 데이터는 다양한 도메인에서의 비즈니스 거래 기록을 나타낸다(Dreibelbis et al., 2008, p. 35; IBM, 2014, p. 221).


Examples include customer orders, shipments, product invoices, bills, guest visits, or patient stays (Dreibelbis et al., 2008, p. 35; EFQM, 2011, p. 9; IBM, 2014, p. 221).

예로는 고객 주문, 배송, 제품 송장, 청구서, 방문 기록, 환자 입원 등이 있다(Dreibelbis et al., 2008, p. 35; EFQM, 2011, p. 9; IBM, 2014, p. 221).



Big data

Big data possesses multiple definitions comprising diverse nuances in current literature (De Mauro, Greco, & Grimaldi, 2014, p. 97).

빅데이터는 현재 문헌에서 다양한 뉘앙스를 포함한 여러 정의를 가지고 있다(De Mauro, Greco, & Grimaldi, 2014, p. 97).


The Meta Group report from 2001 presents one of the more prominent definitions of big data comprising data variety, velocity, and volume as the three main dimensions of big data (Laney, 2001, pp. 1).

2001년 Meta Group 보고서는 빅데이터의 주요 세 가지 차원으로 데이터의 다양성, 속도, 규모를 포함하는 빅데이터의 대표적인 정의를 제시한다(Laney, 2001, pp. 1).


Variety refers to the data format, which may be structured, semi-structured, or unstructured (e.g., IBM, 2014, pp. 198; ISACA, 2013, p. 46; Tallon, 2013, p. 37).

다양성은 구조화된 데이터, 반구조화된 데이터, 비구조화된 데이터 형식을 의미한다(IBM, 2014, pp. 198; ISACA, 2013, p. 46; Tallon, 2013, p. 37).


Velocity refers to the high processing rate, which enables organizations to quickly respond to events as they happen (ISACA, 2013, p. 46; Malik, 2013, p. 1).

속도는 높은 처리율을 의미하며, 이를 통해 조직이 발생하는 이벤트에 신속히 대응할 수 있다(ISACA, 2013, p. 46; Malik, 2013, p. 1).


Volume refers to high growth rates of big data (Laney, 2001, p. 1; Tallon, 2013, p. 37).

규모는 빅데이터의 높은 성장률을 나타낸다(Laney, 2001, p. 1; Tallon, 2013, p. 37).


This definition has been expanded to include further dimensions such as veracity and value (Khatri, 2016, p. 677; Lee et al., 2014, pp. 1).

이 정의는 진실성과 가치와 같은 추가적인 차원을 포함하도록 확장되었다(Khatri, 2016, p. 677; Lee et al., 2014, pp. 1).


In addition, broader definitions of big data have emerged stating big data as a “common term for a set of problems and techniques concerning the management and exploitation of very large sets of data” (ISACA, 2013, p. 46).

또한 빅데이터를 “매우 큰 데이터 세트의 관리와 활용과 관련된 문제 및 기술 집합을 지칭하는 일반적인 용어”로 정의하는 포괄적인 정의가 나타났다(ISACA, 2013, p. 46).


Examples of big data comprise web and social media data (e.g., Brous, Janssen, & Herder, 2016, p. 575; Tallon, 2013, p. 37), machine-generated data (e.g., Brous, Janssen et al., 2016, p. 575; Dahlberg & Nokkola, 2015, p. 32), streaming data (e.g., IBM, 2014, p. 16; Tallon, 2013, p. 37), and biometric data (Malik, 2013, p. 1; Soares, 2013, pp. 6).

빅데이터의 예로는 웹 및 소셜 미디어 데이터(Brous, Janssen, & Herder, 2016, p. 575; Tallon, 2013, p. 37), 기계 생성 데이터(Brous, Janssen et al., 2016, p. 575; Dahlberg & Nokkola, 2015, p. 32), 스트리밍 데이터(IBM, 2014, p. 16; Tallon, 2013, p. 37), 생체 데이터(Malik, 2013, p. 1; Soares, 2013, pp. 6)가 있다.


Though the analysis of big data promises potential benefits, it also comes along with risks such as privacy infringements and data inconsistencies (Kim & Cho, 2018, pp. 37; Tse, Chow, Ly, Tong, & Tam, 2018, p. 1633).

빅데이터 분석은 잠재적인 이점을 약속하지만, 개인정보 침해 및 데이터 불일치와 같은 위험도 동반한다(Kim & Cho, 2018, pp. 37; Tse, Chow, Ly, Tong, & Tam, 2018, p. 1633).


Data governance focusing on big data needs to address these new risks without hampering innovation.

빅데이터에 초점을 맞춘 데이터 거버넌스는 혁신을 저해하지 않으면서 이러한 새로운 위험을 해결해야 한다.


It needs to consider new privacy requirements regarding sensitive data (Morabito, 2015, p. 89; Soares, 2013, pp. 2) and find new ways to measure and monitor big data quality (Al-Badi, Tarhini, & Khan, 2018, p. 275).

민감한 데이터와 관련된 새로운 개인정보 요구사항(Morabito, 2015, p. 89; Soares, 2013, pp. 2)을 고려하고, 빅데이터 품질을 측정하고 모니터링할 새로운 방법을 찾아야 한다(Al-Badi, Tarhini, & Khan, 2018, p. 275).


This includes updated data quality criteria such as timeliness, trustfulness, meaningfulness, and sufficiency (Kim & Cho, 2017, p. 388).

여기에는 적시성, 신뢰성, 의미성, 충분성과 같은 업데이트된 데이터 품질 기준이 포함된다(Kim & Cho, 2017, p. 388).


Data governance also needs to assess value and costs of big data and update retention and deletion requirements accordingly (Morabito, 2015, pp. 89; Soares, 2013, p. 2; Tallon, 2013, p. 35).

또한, 데이터 거버넌스는 빅데이터의 가치와 비용을 평가하고, 이에 따라 보존 및 삭제 요구사항을 업데이트해야 한다(Morabito, 2015, pp. 89; Soares, 2013, p. 2; Tallon, 2013, p. 35).


Finally, data governance needs to include new stakeholders such as data scientists and adjust the responsibilities of existing data stewards (Al-Badi et al., 2018, p. 275; Morabito, 2015, p. 89; Soares, 2013, p. 2).

마지막으로, 데이터 거버넌스는 데이터 과학자와 같은 새로운 이해관계자를 포함하고, 기존 데이터 스튜어드의 책임을 조정해야 한다(Al-Badi et al., 2018, p. 275; Morabito, 2015, p. 89; Soares, 2013, p. 2).



4.4 Domain scope

Many data governance programs address goals in two or three areas (Thomas, 2006, pp. 6).

많은 데이터 거버넌스 프로그램은 두세 개의 영역에서 목표를 다룬다(Thomas, 2006, pp. 6).


Corresponding with Khatri & Brown (2010, p. 149), we name these focus areas data decision domains.

Khatri & Brown (2010, p. 149)에 따르면, 이러한 중점 영역을 데이터 의사결정 도메인이라고 부른다.


Based on our analysis, we classify the main data decision domains as follows: (a) data quality; (b) data security; (c) data architecture; (d) data lifecycle; (e) metadata; and (f) data storage and infrastructure.
분석에 따르면, 주요 데이터 의사결정 도메인은 다음과 같이 분류된다: (a) 데이터 품질, (b) 데이터 보안, (c) 데이터 아키텍처, (d) 데이터 생명주기, (e) 메타데이터, (f) 데이터 저장소 및 인프라.


Data quality

Data quality refers to the ability of data to satisfy its usage requirements in a given context (e.g., de Abreu Faria, Maçada, & Kumar, 2013, p. 4439; Khatri & Brown, 2010, p. 150).

데이터 품질은 특정 맥락에서 데이터가 사용 요구를 충족하는 능력을 의미한다(de Abreu Faria, Maçada, & Kumar, 2013, p. 4439; Khatri & Brown, 2010, p. 150).


Data governance with a focus on data quality comprises the development of a data quality strategy (e.g., EFQM, 2011, p. 10; Thomas, 2006, p. 8), the definition of roles and responsibilities, and the determination of data quality management processes (e.g., EFQM, 2011, p. 10; Loshin, 2008, p. 72; Malik, 2013, pp. 8).

데이터 품질에 중점을 둔 데이터 거버넌스는 데이터 품질 전략 개발(EFQM, 2011, p. 10; Thomas, 2006, p. 8), 역할과 책임 정의, 데이터 품질 관리 프로세스 결정(EFQM, 2011, p. 10; Loshin, 2008, p. 72; Malik, 2013, pp. 8)을 포함한다.


Monitoring data quality includes the definition of data quality metrics (e.g., Brous, Herder et al., 2016, p. 305; Dyché & Levy, 2006, pp. 156; Malik, 2013, pp. 8) and the continuous measurement of data quality levels (e.g., DAMA International, 2009, p. 303; Dreibelbis et al., 2008, p. 498; Weber et al., 2009, pp. 10).

데이터 품질 모니터링은 데이터 품질 측정 기준 정의(Brous, Herder et al., 2016, p. 305; Dyché & Levy, 2006, pp. 156; Malik, 2013, pp. 8)와 데이터 품질 수준의 지속적인 측정을 포함한다(DAMA International, 2009, p. 303; Dreibelbis et al., 2008, p. 498; Weber et al., 2009, pp. 10).


Further tasks include the management of data quality issues (DAMA International, 2009, p. 303; Dreibelbis et al., 2008, pp. 498; Rifaie et al., 2009, p. 588).

추가 작업으로는 데이터 품질 문제 관리가 포함된다(DAMA International, 2009, p. 303; Dreibelbis et al., 2008, pp. 498; Rifaie et al., 2009, p. 588).



Data security

Data security refers to the preservation of security requirements concerning the accessibility, authenticity, availability, confidentiality, integrity, privacy, and reliability of data (e.g., Carretero et al., 2017, p. 142; Donaldson & Walker, 2004, p. 281; de Abreu Faria et al., 2013, p. 4439; ISACA, 2013, p. 31).

데이터 보안은 데이터의 접근성, 진본성, 가용성, 기밀성, 무결성, 프라이버시, 신뢰성과 관련된 보안 요구사항의 보존을 의미한다(Carretero et al., 2017, p. 142; Donaldson & Walker, 2004, p. 281; de Abreu Faria et al., 2013, p. 4439; ISACA, 2013, p. 31).


Data governance with a focus on data security includes the execution of risk assessments (e.g., de Abreu Faria et al., 2013, p. 4439; IBM, 2014, pp. 140; Khatri & Brown, 2010, p. 151), the setup of data security roles (DAMA International, 2009, pp. 153; Khatri & Brown, 2010, p. 151), and the definition of data security policies, standards, and procedures (e.g., Khatri & Brown, 2010, p. 149; Morabito, 2015, p. 89).

데이터 보안에 초점을 맞춘 데이터 거버넌스는 위험 평가 수행(de Abreu Faria et al., 2013, p. 4439; IBM, 2014, pp. 140; Khatri & Brown, 2010, p. 151), 데이터 보안 역할 설정(DAMA International, 2009, pp. 153; Khatri & Brown, 2010, p. 151), 데이터 보안 정책, 표준, 절차 정의(Khatri & Brown, 2010, p. 149; Morabito, 2015, p. 89)를 포함한다.


Furthermore, data governance comprises the definition of data security controls (DAMA International, 2009, p. 22; IBM, 2014, pp. 140; Palczewska et al., 2013, p. 573; Tallon et al., 2014, p. 166) and auditing to ensure that the implemented procedures and practices comply with security policies, standards, and guidelines (DAMA International, 2009, pp. 159; Palczewska et al., 2013, p. 571).

또한 데이터 거버넌스는 데이터 보안 통제 정의(DAMA International, 2009, p. 22; IBM, 2014, pp. 140; Palczewska et al., 2013, p. 573; Tallon et al., 2014, p. 166)와 구현된 절차와 관행이 보안 정책, 표준, 가이드라인을 준수하는지 확인하기 위한 감사(DAMA International, 2009, pp. 159; Palczewska et al., 2013, p. 571)를 포함한다.



Data architecture

Data architecture comprises the definition of enterprise data objects (e.g., Dyché & Levy, 2006, pp. 156; EFQM, 2011, p. 19; Thomas, 2006, p. 9) and the development of an enterprise data model on a conceptual, logical, and physical level (e.g., DAMA International, 2009, p. 21; Watson et al., 2004, pp. 437).

데이터 아키텍처는 엔터프라이즈 데이터 객체 정의(Dyché & Levy, 2006, pp. 156; EFQM, 2011, p. 19; Thomas, 2006, p. 9)와 개념적, 논리적, 물리적 수준에서의 엔터프라이즈 데이터 모델 개발(DAMA International, 2009, p. 21; Watson et al., 2004, pp. 437)을 포함한다.


Data governance with a focus on data architecture contains the determination of enterprise data requirements (DAMA International, 2009, p. 19; IBM, 2014, p. 31) and the definition of architectural policies, standards, and guidelines (e.g., DAMA International, 2009, pp. 48; EFQM, 2011, p. 19; Thomas, 2006, p. 9).

데이터 아키텍처에 초점을 맞춘 데이터 거버넌스는 엔터프라이즈 데이터 요구사항 결정(DAMA International, 2009, p. 19; IBM, 2014, p. 31)과 아키텍처 정책, 표준, 가이드라인 정의(DAMA International, 2009, pp. 48; EFQM, 2011, p. 19; Thomas, 2006, p. 9)를 포함한다.


Furthermore, data governance determines the responsibilities of data architects and the data governance council concerning the enterprise data model (DAMA International, 2009, p. 48; Dreibelbis et al., 2008, pp. 493).

또한 데이터 거버넌스는 엔터프라이즈 데이터 모델과 관련하여 데이터 아키텍트 및 데이터 거버넌스 위원회의 책임을 결정한다(DAMA International, 2009, p. 48; Dreibelbis et al., 2008, pp. 493).



Data lifecycle

Data lifecycle represents the approach of defining, collecting, creating, using, maintaining, archiving, and deleting data (e.g., Khatri & Brown, 2010, p. 149; Morabito, 2015, pp. 89).

데이터 생명주기는 데이터를 정의, 수집, 생성, 사용, 유지, 보관, 삭제하는 접근 방식을 의미한다(Khatri & Brown, 2010, p. 149; Morabito, 2015, pp. 89).


Data governance with a focus on data lifecycle comprises the identification of business processes that use data (Carretero et al., 2017, p. 143; EFQM, 2011, pp. 17; Informatica, 2012, pp. 16; ISACA, 2013, p. 34) and the analysis of the information flow to identify potential overlaps in data storage (IBM, 2014, p. 38; Weller, 2008, p. 252).

데이터 생명주기에 중점을 둔 데이터 거버넌스는 데이터를 사용하는 비즈니스 프로세스 식별(Carretero et al., 2017, p. 143; EFQM, 2011, pp. 17; Informatica, 2012, pp. 16; ISACA, 2013, p. 34)과 정보 흐름 분석을 통해 데이터 저장소의 잠재적인 중복을 식별하는 작업을 포함한다(IBM, 2014, p. 38; Weller, 2008, p. 252).


This step further encompasses the derivation of data retention requirements from business needs, regulatory requirements, and accountability demands (e.g., Cousins, 2016, p. 355; ISO, 2001, p. 11; Khatri & Brown, 2010, p. 149).

이 단계는 비즈니스 요구, 규제 요구사항, 책임 요구로부터 데이터 보존 요구사항을 도출하는 작업도 포함한다(Cousins, 2016, p. 355; ISO, 2001, p. 11; Khatri & Brown, 2010, p. 149).


In addition, organizations need to specify when data is authorized for deletion (DAMA International, 2009, p. 246; ISO, 2001, p. 16).

또한 조직은 데이터가 삭제 권한을 부여받는 시점을 명확히 해야 한다(DAMA International, 2009, p. 246; ISO, 2001, p. 16).


Metadata

Metadata is used to classify data sensitivity levels (Cousins, 2016, p. 349), data provenance (Lee et al., 2017, p. 6; Were & Moturi, 2017, p. 582), and data retention periods (Weller, 2008, pp. 256).

메타데이터는 데이터의 민감도 수준(Cousins, 2016, p. 349), 데이터 출처(Lee et al., 2017, p. 6; Were & Moturi, 2017, p. 582), 데이터 보존 기간(Weller, 2008, pp. 256)을 분류하는 데 사용된다.


Data governance with a focus on metadata comprises the delineation of a metadata strategy (DAMA International, 2009, pp. 23; Grimstad & Myrseth, 2011, p. 2; ISO, 2001, p. 6), the definition of common metadata standards (e.g., de Abreu Faria et al., 2013, p. 4439; Khatri & Brown, 2010, p. 149), and the specification of processes to build a metadata repository (e.g., Grimstad & Myrseth, 2011, p. 3; Rasouli, Trienekens et al., 2016, p. 1367).

메타데이터에 초점을 맞춘 데이터 거버넌스는 메타데이터 전략 수립(DAMA International, 2009, pp. 23; Grimstad & Myrseth, 2011, p. 2; ISO, 2001, p. 6), 공통 메타데이터 표준 정의(de Abreu Faria et al., 2013, p. 4439; Khatri & Brown, 2010, p. 149), 메타데이터 저장소 구축 프로세스 명세화(Grimstad & Myrseth, 2011, p. 3; Rasouli, Trienekens et al., 2016, p. 1367)를 포함한다.


Furthermore, data governance defines the roles such as enterprise data architects and data modelers, who are responsible for metadata management (Informatica, 2012, p. 10; Khatri & Brown, 2010, pp. 150).

또한, 데이터 거버넌스는 메타데이터 관리를 담당하는 엔터프라이즈 데이터 아키텍트 및 데이터 모델러와 같은 역할을 정의한다(Informatica, 2012, p. 10; Khatri & Brown, 2010, pp. 150).


Data storage and infrastructure

Data storage and infrastructure focus on IT artifacts that enable effective data management across the organization (Dreibelbis et al., 2008, p. 484; Tallon et al., 2014, p. 149).

데이터 저장소와 인프라는 조직 전체에서 효과적인 데이터 관리를 가능하게 하는 IT 아티팩트에 중점을 둔다(Dreibelbis et al., 2008, p. 484; Tallon et al., 2014, p. 149).


Companies must consider various hardware and software requirements such as functionality, cost, reliability, complexity, capacity, scalability, and maintainability (Al-Ruithe et al., 2018a, pp. 12; Panian, 2010, p. 946; Tallon et al., 2014, p. 149).

기업은 기능성, 비용, 신뢰성, 복잡성, 용량, 확장성, 유지관리성 등 다양한 하드웨어와 소프트웨어 요구사항을 고려해야 한다(Al-Ruithe et al., 2018a, pp. 12; Panian, 2010, p. 946; Tallon et al., 2014, p. 149).


Data governance with a focus on data storage and infrastructure comprises the initial assessment of the application and storage landscape (Dreibelbis et al., 2008, p. 493; Randhawa, 2019, pp. 117) and the planning of software applications and storage capacity to support data quality, data security, and data lifecycle (EFQM, 2011, p. 10; Tallon, 2013, p. 35).

데이터 저장소와 인프라에 중점을 둔 데이터 거버넌스는 애플리케이션 및 저장소 환경의 초기 평가(Dreibelbis et al., 2008, p. 493; Randhawa, 2019, pp. 117)와 데이터 품질, 데이터 보안, 데이터 생명주기를 지원하기 위한 소프트웨어 애플리케이션 및 저장소 용량 계획(EFQM, 2011, p. 10; Tallon, 2013, p. 35)을 포함한다.


Further governance mechanisms include the definition of policies, standards, processes, and procedures regarding storage and distribution of data (e.g., ISO, 2001, p. 14; Palczewska et al., 2013, p. 572; Tallon et al., 2014, p. 163; Weber et al., 2009, p. 12), the control of storage costs (e.g., Soares, 2013, p. 10; Tallon et al., 2014, pp. 164), and the education of stakeholders regarding storage utilization (Tallon, 2013, p. 35).

추가적인 거버넌스 메커니즘으로는 데이터 저장 및 배포와 관련된 정책, 표준, 프로세스 및 절차 정의(ISO, 2001, p. 14; Palczewska et al., 2013, p. 572; Tallon et al., 2014, p. 163; Weber et al., 2009, p. 12), 저장 비용 통제(Soares, 2013, p. 10; Tallon et al., 2014, pp. 164), 저장소 활용에 대한 이해관계자 교육(Tallon, 2013, p. 35)가 포함된다.



4.5 Antecedents

Antecedents describe the external and internal factors that precede or predict the adoption of data governance practices (Tallon et al., 2014, p. 143).

선행 요인은 데이터 거버넌스 실천 채택에 앞서거나 이를 예측하는 외부 및 내부 요인을 설명한다(Tallon et al., 2014, p. 143).


They have an impact on the implementation and the level of adoption of data governance (Tallon et al., 2014, p. 168; Wende & Otto, 2007, p. 11).

이들은 데이터 거버넌스의 실행 및 채택 수준에 영향을 미친다(Tallon et al., 2014, p. 168; Wende & Otto, 2007, p. 11).


In the following, we present the main antecedents categorized into (a) external and (b) internal.

다음은 주요 선행 요인을 (a) 외부 요인과 (b) 내부 요인으로 나누어 제시한다.


External antecedents comprise legal and regulatory requirements (e.g., Al-Ruithe et al., 2018b, p. 18; Dyché & Levy, 2006, pp. 156; Tallon, 2013, p. 36).

외부 선행 요인은 법적 및 규제 요건을 포함한다(Al-Ruithe et al., 2018b, p. 18; Dyché & Levy, 2006, pp. 156; Tallon, 2013, p. 36).


They vary by industry (DAMA International, 2009, p. 153) or by region (IBM, 2014, pp. 17; Tallon, 2013, p. 36).

이 요건은 산업(DAMA International, 2009, p. 153)이나 지역(IBM, 2014, pp. 17; Tallon, 2013, p. 36)에 따라 다르다.


Examples include the Health Information Protection and Portability Act (HIPPA) (e.g., Khatri & Brown, 2010, p. 149; Tallon et al., 2014, p. 156) and the Sarbanes-Oxley Act (SOX) (e.g., Cheong & Chang, 2007, p. 1000; Khatri & Brown, 2010, p. 149).

예로는 건강 정보 보호 및 이동성 법(HIPPA)(Khatri & Brown, 2010, p. 149; Tallon et al., 2014, p. 156)과 Sarbanes-Oxley 법(SOX)(Cheong & Chang, 2007, p. 1000; Khatri & Brown, 2010, p. 149)이 있다.


Legal and regulatory requirements have an impact on the business use and control of data (Khatri & Brown, 2010, p. 149; Kooper et al., 2011, p. 198; Tallon et al., 2014, p. 156), data security and data quality (e.g., Cheong & Chang, 2007, p. 1000; ISO, 2001, pp. 4; Watson et al., 2004, p. 439), as well as data retention and archiving (e.g., Cousins, 2016, p. 355; ISO, 2001, pp. 4; Khatri & Brown, 2010, p. 149).

법적 및 규제 요건은 데이터의 비즈니스 활용과 통제(Khatri & Brown, 2010, p. 149; Kooper et al., 2011, p. 198; Tallon et al., 2014, p. 156), 데이터 보안 및 품질(Cheong & Chang, 2007, p. 1000; ISO, 2001, pp. 4; Watson et al., 2004, p. 439), 데이터 보존 및 보관(Cousins, 2016, p. 355; ISO, 2001, pp. 4; Khatri & Brown, 2010, p. 149)에 영향을 미친다.


Furthermore, highly regulated markets require a more centralized organizational structure than markets with less or no regulations (e.g., Weber et al., 2009, p. 18).

더욱 규제가 심한 시장은 규제가 적거나 없는 시장에 비해 더 중앙집중화된 조직 구조를 필요로 한다(Weber et al., 2009, p. 18).



Internal antecedents contain strategic, organizational, system-related, and cultural factors.
내부 선행 요인은 전략적, 조직적, 시스템 관련, 문화적 요인을 포함한다.

On the strategic level, internal antecedents comprise the organization strategy, IT strategy, and diversification breadth.

전략적 수준에서 내부 선행 요인은 조직 전략, IT 전략, 다각화 범위를 포함한다.


Companies with a profit-oriented organization strategy may adopt a centralized organizational structure, whereas growth-oriented companies benefit from a decentralized setup (Weber et al., 2009, p. 19).

수익 지향적인 조직 전략을 가진 기업은 중앙집중식 조직 구조를 채택할 수 있는 반면, 성장 지향적인 기업은 분산형 설정에서 이점을 얻는다(Weber et al., 2009, p. 19).


Internal antecedents on the organizational level contain the corporate allocation of decision-making authority and the degree of business process harmonization.

조직적 수준에서의 내부 선행 요인은 의사결정 권한의 기업 내 배분과 비즈니스 프로세스 조화 정도를 포함한다.


A centralized corporate approach in business and IT facilitates data governance adoption (Tallon et al., 2014, p. 161).

비즈니스와 IT에서 중앙집중식 기업 접근법은 데이터 거버넌스 채택을 용이하게 한다(Tallon et al., 2014, p. 161).


Companies with globally harmonized processes enable a centralized placement of decision-making authority in contrast to companies with local processes (Weber et al., 2009, p. 18).

글로벌 조화된 프로세스를 가진 기업은 지역 기반 프로세스를 가진 기업과 달리 중앙집중식 의사결정 권한 배치를 가능하게 한다(Weber et al., 2009, p. 18).


Internal antecedents on the system level include IT architecture.

시스템 수준에서의 내부 선행 요인에는 IT 아키텍처가 포함된다.


A high degree of IT standardization and process integration enable the adoption of data governance, whereas the usage of legacy IT systems with its application silos and low degree of process integration hamper data governance adoption (e.g., Tallon et al., 2014, p. 161).

높은 수준의 IT 표준화와 프로세스 통합은 데이터 거버넌스 채택을 가능하게 하지만, 애플리케이션 사일로와 낮은 수준의 프로세스 통합을 특징으로 하는 레거시 IT 시스템의 사용은 데이터 거버넌스 채택을 방해한다(Tallon et al., 2014, p. 161).


Internal antecedents on the cultural level encompass the organization culture, senior management support, and active leadership participation (e.g., Daneshmandnia, 2019, pp. 30; de Abreu Faria et al., 2013, p. 4439; Randhawa, 2019, pp. 107; Silic & Back, 2013, pp. 82).

문화적 수준에서의 내부 선행 요인에는 조직 문화, 고위 경영진의 지원, 적극적인 리더십 참여가 포함된다(Daneshmandnia, 2019, pp. 30; de Abreu Faria et al., 2013, p. 4439; Randhawa, 2019, pp. 107; Silic & Back, 2013, pp. 82).


An organization culture, which promotes the strategic use of information and creates a business vision about data governance, enables the adoption of data governance (Hagmann, 2013, p. 235; Tallon et al., 2014, p. 161).

정보의 전략적 활용을 장려하고 데이터 거버넌스에 대한 비즈니스 비전을 창출하는 조직 문화는 데이터 거버넌스 채택을 가능하게 한다(Hagmann, 2013, p. 235; Tallon et al., 2014, p. 161).



4.6 Consequences

Consequences refer to the outcomes of data governance (Tallon et al., 2014, p. 166; Tiwana et al., 2014, p. 10).

결과는 데이터 거버넌스의 결과를 의미한다(Tallon et al., 2014, p. 166; Tiwana et al., 2014, p. 10).


We identified two types of consequences of data governance: (a) intermediate performance effects and (b) risk management.

데이터 거버넌스의 결과로 두 가지 유형을 식별했다: (a) 중간 성과 효과와 (b) 위험 관리.


Intermediate performance effects occur in different ways.

중간 성과 효과는 다양한 방식으로 발생한다.


Kamioka, Luo, and Tapanainen (2016, p. 7) describe the positive effect of data governance on data utilization level, which contributes to marketing performance by the increased number of sales and customer spending.

Kamioka, Luo, Tapanainen(2016, p. 7)은 데이터 거버넌스가 데이터 활용 수준에 미치는 긍정적인 영향을 설명하며, 이는 판매 수와 고객 지출 증가를 통해 마케팅 성과에 기여한다.


Mikalef, Krogstie, van de Wetering, Pappas, and Giannakos (2018, p. 4917) demonstrate the positive effect of data governance on both a firm’s dynamic and operational capabilities by improving the existing operational mode and leading to renewed means of competing in the market.

Mikalef, Krogstie, van de Wetering, Pappas, Giannakos(2018, p. 4917)은 데이터 거버넌스가 기존 운영 방식을 개선하고 시장에서 경쟁하는 새로운 수단을 제공함으로써 기업의 역동적 및 운영적 역량 모두에 미치는 긍정적인 영향을 입증했다.


Furthermore, data governance is attributed to improving data quality due to increased accuracy, availability, completeness, consistency, and timeliness of data and the limitation of errors due to data inconsistencies (Barker, 2016, pp. 165; Niemi & Laine, 2016, p. 8).
또한, 데이터 거버넌스는 데이터의 정확성, 가용성, 완전성, 일관성, 적시성이 증가하고 데이터 불일치로 인한 오류가 제한되면서 데이터 품질을 개선하는 데 기여한다고 평가된다(Barker, 2016, pp. 165; Niemi & Laine, 2016, p. 8).


Otto (2013, p. 96) even defines data governance effectiveness as the ratio of the number of preventive data quality management measures to the total number of data quality management measures conducted by the company.

Otto(2013, p. 96)는 데이터 거버넌스의 효과성을 기업이 수행한 전체 데이터 품질 관리 조치 중 예방적 데이터 품질 관리 조치의 비율로 정의하기도 한다.


The rationale behind this definition is that a higher number of preventive measures leads to increased data quality and thus to higher effectiveness of data governance.

이 정의의 근거는 예방적 조치의 수가 많을수록 데이터 품질이 향상되고 따라서 데이터 거버넌스의 효과성이 높아진다는 점이다.



Risk management

The second consequence of data governance is the management of data-related risk (e.g., Dreibelbis et al., 2008, pp. 488; Malik, 2013, p. 2; Otto, 2011c, p. 5; Tallon et al., 2014, p. 150).

데이터 거버넌스의 두 번째 결과는 데이터와 관련된 위험 관리이다(Dreibelbis et al., 2008, pp. 488; Malik, 2013, p. 2; Otto, 2011c, p. 5; Tallon et al., 2014, p. 150).


Risks may arise due to non-conformance with information policies or the absence of oversight regarding data quality (Loshin, 2008, pp. 72).

위험은 정보 정책 미준수 또는 데이터 품질에 대한 감독 부재로 인해 발생할 수 있다(Loshin, 2008, pp. 72).


Further risks concern security and privacy breaches (Loshin, 2008, pp. 72; Rifaie et al., 2009, p. 589).

추가적인 위험은 보안 및 프라이버시 침해와 관련이 있다(Loshin, 2008, pp. 72; Rifaie et al., 2009, p. 589).


Data governance reduces these risks by creating risk-mitigating policies and introducing controls for monitoring compliance (Khatri & Brown, 2010, p. 149; Loshin, 2008, p. 77; Thomas, 2006, p. 17).

데이터 거버넌스는 위험 완화 정책을 수립하고 준수를 모니터링하는 통제를 도입함으로써 이러한 위험을 줄인다(Khatri & Brown, 2010, p. 149; Loshin, 2008, p. 77; Thomas, 2006, p. 17).


This includes the supervision of data professionals and the oversight of data management projects and services (DAMA International, 2009, p. 21).

여기에는 데이터 전문가의 감독과 데이터 관리 프로젝트 및 서비스에 대한 관리가 포함된다(DAMA International, 2009, p. 21).


Compliance monitoring encompasses auditing, which aims at providing stakeholders with objective, unbiased assessments and recommendations for improvement (DAMA International, 2009, pp. 159).

준수 모니터링은 이해관계자에게 객관적이고 공정한 평가 및 개선 권고를 제공하는 것을 목표로 하는 감사를 포함한다(DAMA International, 2009, pp. 159).


Based on audit results, companies can take corrective and preventive actions (ISO/IEC, 2005, p. vi).

감사 결과를 바탕으로 기업은 시정 및 예방 조치를 취할 수 있다(ISO/IEC, 2005, p. vi).



5. Research agenda and outlook

The review above provides a conceptual framework for data governance and a comprehensive overview of research findings and insights relevant for data governance to date.

위 리뷰는 데이터 거버넌스에 대한 개념적 프레임워크와 현재까지 데이터 거버넌스와 관련된 연구 결과와 통찰에 대한 포괄적인 개요를 제공한다.


Deriving from particular aspects of our above analysis, we briefly outline an agenda for future research on data governance.

위 분석의 특정 측면에서 도출된 내용을 바탕으로 데이터 거버넌스에 대한 향후 연구를 위한 아젠다를 간략히 제시한다.


Our research agenda comprises five major areas: (1) governance mechanisms; (2) scope of data governance; (3) antecedents of data governance; (4) consequences of data governance; and (5) generalizability and replicability of findings.
우리의 연구 아젠다는 다섯 가지 주요 영역으로 구성된다: (1) 거버넌스 메커니즘, (2) 데이터 거버넌스의 범위, (3) 데이터 거버넌스의 선행 요인, (4) 데이터 거버넌스의 결과, (5) 연구 결과의 일반화 및 재현 가능성.



5.1 Governance mechanisms

Determining the data owner can be a difficult task (Vilminko-Heikkinen & Pekkola, 2019, p. 77).

데이터 소유자를 결정하는 것은 어려운 과제일 수 있다(Vilminko-Heikkinen & Pekkola, 2019, p. 77).


Current literature does not provide a common understanding of the data owner role.

현재 문헌은 데이터 소유자 역할에 대한 공통된 이해를 제공하지 않는다.


First, we found ambiguous definitions regarding the ownership and accountability for data.
첫째, 우리는 데이터의 소유권과 책임성에 관한 모호한 정의를 발견했다.


Some definitions clearly allocate accountability for data to a dedicated data owner role (Otto, 2011c, p. 7), whereas other definitions assign ownership and accountability to the data steward or data producer (Dreibelbis et al., 2008, p. 496; Dyché & Levy, 2006, pp. 156; NASCIO, 2008, p. 10).

일부 정의는 데이터에 대한 책임성을 전담 데이터 소유자 역할에 명확히 할당하는 반면(Otto, 2011c, p. 7), 다른 정의는 데이터 관리자 또는 데이터 생성자에게 소유권과 책임성을 부여한다(Dreibelbis et al., 2008, p. 496; Dyché & Levy, 2006, pp. 156; NASCIO, 2008, p. 10).


Researchers should further analyze in which cases a dedicated data owner role is beneficial.

연구자들은 전담 데이터 소유자 역할이 유익한 경우를 추가로 분석해야 한다.


Second, we lack knowledge of how the data owner is identified.
둘째, 데이터 소유자를 어떻게 식별하는지에 대한 지식이 부족하다.

Do organizations determine the data owner based on the application, where the data is stored, or based on the process, which uses the data?

조직은 데이터가 저장된 애플리케이션을 기준으로 데이터 소유자를 결정하는가, 아니면 데이터를 사용하는 프로세스를 기준으로 결정하는가?


Vilminko-Heikkinen & Pekkola (2019, pp. 80) describe both options in their case study comprising two master data management projects in a Finnish municipality, but the data owner concept and approach remains unclear during both projects.

Vilminko-Heikkinen & Pekkola(2019, pp. 80)는 핀란드 지방자치단체에서의 두 개의 마스터 데이터 관리 프로젝트 사례 연구에서 두 가지 옵션을 설명했지만, 데이터 소유자 개념과 접근법은 두 프로젝트 모두에서 불명확하게 남아 있다.


Third, we know little about the scope of data ownership.
셋째, 데이터 소유권의 범위에 대해 아는 바가 적다.

For a regulation-driven data governance program, the scope might be narrowly defined focusing on key data elements, whereas for an analytics-driven program it might be more meaningful to widen the scope to comprise entire data domains.

규제 주도형 데이터 거버넌스 프로그램에서는 범위가 주요 데이터 요소에 초점을 맞추어 좁게 정의될 수 있는 반면, 분석 주도형 프로그램에서는 전체 데이터 도메인을 포함하도록 범위를 넓히는 것이 더 의미 있을 수 있다.


Future research should conduct a richer analysis on how to define the scope of data ownership, as it might impact the effectiveness of data governance design.

향후 연구에서는 데이터 소유권의 범위를 어떻게 정의할지에 대해 보다 심층적인 분석을 수행해야 하며, 이는 데이터 거버넌스 설계의 효과성에 영향을 미칠 수 있다.


The allocation of decision-making authority also requires further research.
의사결정 권한의 배분 또한 추가 연구가 필요하다.


As part of our review, we identified basic categories regarding the allocation of decision-making authority, i.e. hierarchical positioning, functional positioning, and the positioning of decision-making authority on a continuum ranging from centralized to decentralized.

리뷰의 일환으로 우리는 의사결정 권한 배분과 관련된 기본 범주를 식별했으며, 이는 계층적 위치, 기능적 위치, 중앙집중형에서 분산형까지의 연속선에서 의사결정 권한의 위치를 포함한다.


However, we do not know which allocation of decision-making authority is most suitable under which circumstances.
그러나 어떤 상황에서 어떤 의사결정 권한 배분이 가장 적합한지에 대해서는 알지 못한다.

In case of functional positioning, Otto (2011b, pp. 60) states that business benefits related to data governance are eventually attributed to the data governance organization to a larger extent if the decision-making authority is allocated to a business function.

기능적 위치의 경우, Otto(2011b, pp. 60)는 의사결정 권한이 비즈니스 기능에 할당되면 데이터 거버넌스와 관련된 비즈니스 이익이 데이터 거버넌스 조직에 더 큰 범위로 귀속된다고 언급한다.


However, this proposition requires substantiation through quantitative empirical studies on a larger and more representative sample of companies.

그러나 이 주장은 더 크고 대표적인 기업 샘플을 대상으로 한 정량적 실증 연구를 통해 입증이 필요하다.


Weber et al. (2009, pp. 18) provide a qualitative description of the factors that impact the allocation of decision-making authority on a continuum ranging from centralized to decentralized.

Weber 등(2009, pp. 18)은 중앙집중형에서 분산형까지 연속선상에서 의사결정 권한 배분에 영향을 미치는 요인에 대한 질적 설명을 제공한다.


However, they do not provide empirical evidence of this contingency approach.

그러나 이러한 상황적 접근 방식에 대한 실증적 증거는 제시하지 않는다.


Researchers should conduct further studies to analyze under which circumstances a centralized, decentralized, or hybrid allocation of decision-making authority is most suitable.
연구자들은 어떤 상황에서 중앙집중형, 분산형, 또는 혼합형 의사결정 권한 배분이 가장 적합한지 분석하기 위한 추가 연구를 수행해야 한다.


Understanding how to allocate decision-making authority could greatly improve the effectiveness of data governance.

의사결정 권한을 어떻게 배분할지 이해하는 것은 데이터 거버넌스의 효과성을 크게 향상시킬 수 있다.


Furthermore, data governance is an ongoing program and a continuous improvement process (Cheng et al., 2017, p. 518; DAMA International, 2009, p. 38).

또한 데이터 거버넌스는 지속적인 프로그램이자 지속적인 개선 프로세스이다(Cheng et al., 2017, p. 518; DAMA International, 2009, p. 38).


New internal data needs and changing external demands such as legal and regulatory requirements force data governance to evolve and adapt (Tallon et al., 2014, p. 171; Weber et al., 2009, p. 23).

새로운 내부 데이터 요구 사항과 법적 및 규제 요구 사항과 같은 외부 변화는 데이터 거버넌스를 진화하고 적응하게 만든다(Tallon et al., 2014, p. 171; Weber et al., 2009, p. 23).


However, most of the reviewed publications take a “one-off” perspective on data governance and do not reflect how data governance arrangements might need to change over time.

그러나 검토된 대부분의 문헌은 데이터 거버넌스에 대해 “일회성” 관점을 취하며 데이터 거버넌스 배열이 시간이 지나면서 어떻게 변화해야 하는지를 반영하지 않는다.


We identified a few publications which focus on the evolution of specific data governance concepts such as the evolution of the data governance strategy (Tallon et al., 2013), data ownership (Vilminko-Heikkinen & Pekkola, 2019), and data governance effectiveness (Otto, 2013).

우리는 데이터 거버넌스 전략의 진화(Tallon et al., 2013), 데이터 소유권(Vilminko-Heikkinen & Pekkola, 2019), 데이터 거버넌스 효과성(Otto, 2013)과 같은 특정 데이터 거버넌스 개념의 진화에 초점을 맞춘 몇 가지 문헌을 확인했다.


Future research should build on these results and conduct further qualitative, quantitative, and longitudinal studies to deepen the knowledge about data governance evolution.

향후 연구는 이러한 결과를 기반으로 데이터 거버넌스 진화에 대한 지식을 심화하기 위해 추가적인 질적, 정량적, 종단적 연구를 수행해야 한다.



5.2 Scope of data governance

Data governance for ecosystems of public and private organizations is another promising research area.

공공 및 민간 조직의 생태계를 위한 데이터 거버넌스는 또 다른 유망한 연구 분야이다.


Firms increasingly collaborate with partnering companies, outsourcing vendors, and cloud service providers to manage parts of the data value chain (Bruhn, 2014, pp. 4; Panian, 2010, p. 942).

기업들은 점점 더 파트너 회사, 아웃소싱 벤더, 클라우드 서비스 제공업체와 협력하여 데이터 가치 사슬의 일부를 관리하고 있다(Bruhn, 2014, pp. 4; Panian, 2010, p. 942).


Research institutions team up and form distributed research networks which allow researchers to use data from multiple institutions (Kim et al., 2014, p. 714).

연구 기관은 협력하여 분산된 연구 네트워크를 형성하며, 이를 통해 연구자들이 여러 기관의 데이터를 사용할 수 있게 한다(Kim et al., 2014, p. 714).


Current research has started investigating data governance for specific types of inter-organizational settings such as cloud computing (Al-Ruithe, Benkhelifa, & Hameed, 2016), platform ecosystems (Lee et al., 2017), dynamic business networking (Rasouli, Trienekens et al., 2016), supply chains (In et al., 2019), and inter-organizational data collaborations (van den Broek & van Veenstra, 2015).

현재 연구는 클라우드 컴퓨팅(Al-Ruithe, Benkhelifa, & Hameed, 2016), 플랫폼 생태계(Lee et al., 2017), 동적 비즈니스 네트워킹(Rasouli, Trienekens et al., 2016), 공급망(In et al., 2019), 조직 간 데이터 협력(van den Broek & van Veenstra, 2015)과 같은 특정 유형의 조직 간 환경에서 데이터 거버넌스를 조사하기 시작했다.


However, we do not know much about how organizations ensure data ownership and control in inter-organizational relationships.

그러나 조직이 조직 간 관계에서 데이터 소유권과 통제권을 어떻게 보장하는지에 대해서는 많이 알려져 있지 않다.


Especially the exchange of sensitive data such as personal health information raises new concerns about privacy (Winter & Davidson, 2018, p. 2).

특히 개인 건강 정보와 같은 민감한 데이터 교환은 프라이버시에 대한 새로운 우려를 제기한다(Winter & Davidson, 2018, p. 2).


Future research should investigate which data governance mechanisms can help organizations to retain control over their data in inter-organizational settings.

향후 연구는 조직 간 환경에서 조직이 데이터에 대한 통제권을 유지하는 데 도움이 되는 데이터 거버넌스 메커니즘을 조사해야 한다.


Researchers should also explore governance practices that support individuals and groups in effectively co-determining how their data is governed and (re)used.

연구자들은 또한 개인과 그룹이 자신들의 데이터가 어떻게 관리되고 재사용되는지를 효과적으로 공동 결정할 수 있도록 지원하는 거버넌스 관행을 탐구해야 한다.



For example, additional governance bodies might be required to monitor compliance and balance interests in inter-organizational settings.

예를 들어, 조직 간 환경에서 준수 여부를 모니터링하고 이해관계를 조정하기 위해 추가적인 거버넌스 기구가 필요할 수 있다.


Furthermore, companies need to create a standardized and trustworthy data exchange environment (Cohn, 2015, p. 821; Rasouli, 2016, p. 97; Rasouli, Trienekens et al., 2016, pp. 1362).

또한 기업들은 표준화되고 신뢰할 수 있는 데이터 교환 환경을 조성해야 한다(Cohn, 2015, p. 821; Rasouli, 2016, p. 97; Rasouli, Trienekens et al., 2016, pp. 1362).


Future research should investigate how metadata and other concepts can be used to facilitate interoperability between organizations and traceability of data provenance.

향후 연구는 메타데이터 및 기타 개념이 조직 간 상호운용성을 촉진하고 데이터 출처의 추적 가능성을 어떻게 지원할 수 있는지 조사해야 한다.


Finally, the complexity of ecosystems increases with the number of participating organizations (van den Broek & van Veenstra, 2015, p. 9).

마지막으로, 생태계의 복잡성은 참여 조직의 수가 증가함에 따라 증가한다(van den Broek & van Veenstra, 2015, p. 9).


Researchers should conduct further qualitative studies to explore the most appropriate governance designs for one-to-one, one-to-many, and many-to-many inter-organizational settings.

연구자들은 1:1, 1:다, 다:다 조직 간 환경에 가장 적합한 거버넌스 설계를 탐구하기 위해 추가적인 질적 연구를 수행해야 한다.


Data governance for big data has been a specific focus in research (e.g. Kim & Cho, 2018; Malik, 2013; Winter & Davidson, 2018).

빅데이터를 위한 데이터 거버넌스는 연구에서 특정 초점이 되어 왔다(Kim & Cho, 2018; Malik, 2013; Winter & Davidson, 2018).


As organizations try to integrate and use big data, having an effective data governance design becomes substantive.

조직이 빅데이터를 통합하고 사용하는 과정에서 효과적인 데이터 거버넌스 설계는 본질적인 요소가 된다.


However, no general data governance approach for big data has been agreed upon.

그러나 빅데이터에 대한 일반적인 데이터 거버넌스 접근 방식은 아직 합의되지 않았다.


We identified four major big data challenges and research opportunities regarding data governance.

우리는 데이터 거버넌스와 관련된 빅데이터의 네 가지 주요 과제와 연구 기회를 식별했다.


First, data quality for big data needs to be addressed given the incomplete and often uncertain nature of big data (Lemieux, Gormly, & Rowledge, 2014, p. 129; Malik, 2013, p. 5).

첫째, 빅데이터의 불완전하고 종종 불확실한 특성을 고려할 때, 빅데이터의 데이터 품질 문제가 해결되어야 한다(Lemieux, Gormly, & Rowledge, 2014, p. 129; Malik, 2013, p. 5).


Data quality issues concerning big data could become an increasing risk, as organizations keep on applying data-driven decision-making (Kim & Cho, 2018, p. 386; Morabito, 2015, p. 97).
빅데이터와 관련된 데이터 품질 문제는 조직이 데이터 기반 의사결정을 계속 적용함에 따라 점점 더 큰 위험이 될 수 있다(Kim & Cho, 2018, p. 386; Morabito, 2015, p. 97).
Future research should determine how data quality metrics should be defined for big data and how accurate big data needs to be.
향후 연구는 빅데이터에 대한 데이터 품질 지표를 어떻게 정의해야 하는지와 빅데이터가 얼마나 정확해야 하는지를 규명해야 한다.


Second, big data raises concerns regarding privacy infringements (e.g. Tallon, 2013, p. 37; Winter & Davidson, 2018, p. 2).

둘째, 빅데이터는 프라이버시 침해에 대한 우려를 제기한다(Tallon, 2013, p. 37; Winter & Davidson, 2018, p. 2).


The extent to which organizations can act upon big data insights is still an unresolved issue (Tallon, 2013, p. 37).
조직이 빅데이터 통찰에 따라 행동할 수 있는 범위는 여전히 해결되지 않은 문제이다(Tallon, 2013, p. 37).

For example, combining data sources to reveal new patterns could cause unanticipated exposure of personal habits (IBM, 2014, p. 6).
예를 들어, 데이터 소스를 결합하여 새로운 패턴을 드러내는 것은 개인 습관의 예상치 못한 노출을 초래할 수 있다(IBM, 2014, p. 6).
Researchers should explore governance mechanisms that enable innovation through big data analytics with simultaneous consideration of privacy requirements.
연구자들은 빅데이터 분석을 통한 혁신을 가능하게 하면서 동시에 프라이버시 요구 사항을 고려하는 거버넌스 메커니즘을 탐구해야 한다.
This could include policies determining the ethical and permissible use of big data without violating privacy rights.
이는 프라이버시 권리를 침해하지 않으면서 빅데이터의 윤리적이고 허용 가능한 사용을 결정하는 정책을 포함할 수 있다.


Third, not all data is equally useful, but has varying degrees of value (Malik, 2013, p. 6).

셋째, 모든 데이터가 똑같이 유용하지는 않으며, 데이터는 각기 다른 가치를 지닌다(Malik, 2013, p. 6).


However, the definition of the intrinsic data value and the methods of how to measure it still prompt questions (Kooper et al., 2011, pp. 199; Malik, 2013, p. 11).
그러나 데이터 본질적 가치의 정의와 이를 측정하는 방법은 여전히 의문을 남긴다(Kooper et al., 2011, pp. 199; Malik, 2013, p. 11).
Future research should investigate how to quantify the intrinsic data value.
향후 연구는 데이터 본질적 가치를 어떻게 정량화할 것인지 조사해야 한다.
The results could help companies to adjust data retention policies and determine when to migrate data to low-cost storage tiers and when to delete data.
이 결과는 기업들이 데이터 보존 정책을 조정하고, 데이터를 저비용 스토리지 계층으로 이전하거나 삭제할 시기를 결정하는 데 도움을 줄 수 있다.


Finally, integrating big data with traditional enterprise data poses challenges (Malik, 2013, pp. 4).

마지막으로, 빅데이터와 기존 기업 데이터를 통합하는 것은 과제를 제기한다(Malik, 2013, pp. 4).

Data is often fragmented and stored in incompatible IT systems (Lemieux et al., 2014, p. 129; Morabito, 2015, p. 98).
데이터는 종종 분산되어 있으며 호환되지 않는 IT 시스템에 저장된다(Lemieux et al., 2014, p. 129; Morabito, 2015, p. 98).
The reason for these data silos is often a lack of cross-organizational collaboration (Nielsen et al., 2018, p. 23).
이러한 데이터 사일로의 원인은 종종 조직 간 협업의 부족 때문이다(Nielsen et al., 2018, p. 23).
Researchers should investigate how governance mechanisms can be applied to foster cross-organizational collaboration to deconstruct data silos.
연구자들은 데이터 사일로를 해체하기 위해 조직 간 협업을 촉진하는 데 거버넌스 메커니즘을 어떻게 적용할 수 있는지 조사해야 한다.



5.3 Antecedents of data governance

We found that organizations need to design data governance considering contextual factors.

조직은 상황적 요인을 고려하여 데이터 거버넌스를 설계해야 한다는 것을 발견했다.


Research informing these design decisions will be useful as it helps organizations to tailor data governance according to their specific environment and needs.

이러한 설계 결정을 알리는 연구는 조직이 고유한 환경과 요구 사항에 따라 데이터 거버넌스를 조정할 수 있도록 돕기 때문에 유용할 것이다.


Although these antecedents have received some attention (Tallon et al., 2014; Weber et al., 2009), we do not know much about their relative importance, their interrelations, and their causal chains.
이러한 선행 요인이 어느 정도 주목을 받았지만(Tallon et al., 2014; Weber et al., 2009), 이들의 상대적 중요성, 상호 관계, 인과 관계에 대해 잘 알려져 있지 않다.


We found in the review that many data governance approaches do not consider contextual factors, which seems reductionist and unrealistic.

리뷰에서 많은 데이터 거버넌스 접근 방식이 상황적 요인을 고려하지 않으며, 이는 단순화된 접근으로 보이며 비현실적으로 보인다는 것을 발견했다.


For future research, rather than ignoring the context, it would be useful if researchers analyzed contextual factors and their impact on data governance design and implementation.

향후 연구에서는 맥락을 무시하지 않고 상황적 요인과 그것이 데이터 거버넌스 설계 및 구현에 미치는 영향을 분석하는 것이 유용할 것이다.


This includes the investigation of additional antecedents such as specific industries, firm size, and corporate culture (Begg & Caira, 2012, p. 12; Cave, 2017, pp. 152; NASCIO, 2008, p. 6; Neff et al., 2013, p. 8; Yu & Foster, 2017, p. 345), but also the impact of antecedents on data governance implementation.

이에는 특정 산업, 회사 규모, 기업 문화(Begg & Caira, 2012, p. 12; Cave, 2017, pp. 152; NASCIO, 2008, p. 6; Neff et al., 2013, p. 8; Yu & Foster, 2017, p. 345)와 같은 추가 선행 요인의 조사뿐만 아니라 데이터 거버넌스 구현에 미치는 선행 요인의 영향도 포함된다.


Based on those findings, organizations could decide upon the amount of structure and formality for their data governance design.

이러한 발견을 바탕으로 조직은 데이터 거버넌스 설계에서 구조와 형식성을 어느 정도 포함할지 결정할 수 있다.


Tallon et al. (2014, p. 170) state that some antecedents facilitate the adoption of data governance practices, while others inhibit the adoption.

Tallon et al.(2014, p. 170)는 일부 선행 요인이 데이터 거버넌스 실행을 촉진하는 반면, 다른 요인은 실행을 저해한다고 언급한다.


Future research should determine which antecedents are likely to dominate if organizations concurrently possess both enabling and inhibiting antecedents.

향후 연구는 조직이 촉진 요인과 저해 요인을 동시에 보유할 경우, 어떤 선행 요인이 우세할 가능성이 있는지 규명해야 한다.



5.4 Consequences of data governance


Another relevant but under-researched area comprises the effectiveness of data governance.
또 다른 관련성이 높은 그러나 연구가 부족한 영역은 데이터 거버넌스의 효과성이다.


Current research only provides brief evidence of the intermediate performance effects and the ways how to measure those effects (Kamioka et al., 2016, p. 7; Mikalef et al., 2018, p. 4917; Otto, 2013, p. 96; Tallon et al., 2014, p. 166).
현재 연구는 중간 성과 효과와 이를 측정하는 방법에 대한 간단한 증거만을 제공하고 있다(Kamioka et al., 2016, p. 7; Mikalef et al., 2018, p. 4917; Otto, 2013, p. 96; Tallon et al., 2014, p. 166).


On the other hand, organizations still struggle to provide a compelling use case that links data governance to value generation (Nielsen et al., 2018, p. 24).
반면, 조직은 데이터 거버넌스를 가치 창출과 연결하는 설득력 있는 사용 사례를 제공하는 데 여전히 어려움을 겪고 있다(Nielsen et al., 2018, p. 24).


To fully comprehend data governance, we need to understand how intermediate performance effects impact strategic business outcomes such as revenue growth, cost reduction, and regulatory compliance.

데이터 거버넌스를 완전히 이해하려면 중간 성과 효과가 매출 성장, 비용 절감, 규제 준수와 같은 전략적 비즈니스 결과에 어떻게 영향을 미치는지 이해해야 한다.


Future research should conduct a richer analysis of intermediate-level performance effects and their impact on strategic business outcomes.

향후 연구는 중간 수준 성과 효과와 그것이 전략적 비즈니스 결과에 미치는 영향을 보다 풍부하게 분석해야 한다.


This could be achieved by identifying the causal links between intermediate-level and firm-level performance effects.

이는 중간 수준과 기업 수준 성과 효과 간의 인과적 연결을 식별함으로써 달성할 수 있다.


The findings could help organizations to quantify the benefits of data governance and to derive the business case.

이 발견은 조직이 데이터 거버넌스의 이점을 정량화하고 비즈니스 사례를 도출하는 데 도움을 줄 수 있다.


Furthermore, we presently cannot define the point beyond which users can feel constrained by data governance.

게다가, 현재로서는 사용자가 데이터 거버넌스에 의해 제약을 느낄 수 있는 한계를 정의할 수 없다.


If organizations use too bureaucratic, complex, and restrictive data governance mechanisms, this ‘over-governance’ could lead to a performance decrease by limiting data-led innovations and motivating users to bypass policies and take unnecessary risks with their data.

조직이 지나치게 관료적이고 복잡하며 제한적인 데이터 거버넌스 메커니즘을 사용할 경우, 이러한 ‘과도한 거버넌스’는 데이터 기반 혁신을 제한하고 사용자가 정책을 우회하며 불필요한 데이터 관련 위험을 감수하도록 유도하여 성과 저하로 이어질 수 있다.


Tallon et al. (2014, p. 168) describe this as the curvilinear relationship between data governance and firm performance.

Tallon et al.(2014, p. 168)는 이를 데이터 거버넌스와 기업 성과 간의 곡선형 관계로 설명한다.


Future research should conduct a richer analysis of this curvilinear relationship and the inflection point, which determines the optimal data governance design.

향후 연구는 이러한 곡선형 관계와 최적의 데이터 거버넌스 설계를 결정하는 전환점에 대한 풍부한 분석을 수행해야 한다.


In doing so, researchers should consider the influence of antecedents as well as the organizational, data, and domain scope.

이 과정에서 연구자들은 선행 요인뿐만 아니라 조직적, 데이터 및 도메인 범위의 영향을 고려해야 한다.


5.5 Generalizability and replicability


In addition to the research areas described above, the use of further research methods could unveil new findings.

위에서 설명한 연구 영역 외에도 추가 연구 방법을 활용하면 새로운 발견을 얻을 수 있다.


Prior research mainly conducted single and multiple case studies.

이전 연구는 주로 단일 및 다중 사례 연구를 수행했다.


This may pose limitations in making controlled observations and deductions as well as limitations concerning the replicability and generalizability of the findings (Lee, 1989, p. 35; Tallon et al., 2014, p. 171).

이는 통제된 관찰 및 추론뿐만 아니라 발견의 재현 가능성과 일반화 가능성에 한계를 초래할 수 있다(Lee, 1989, p. 35; Tallon et al., 2014, p. 171).


Transforming the propositions developed in the case studies into testable hypotheses could lay the foundation for further quantitative research (Otto, 2011b, p. 61).

사례 연구에서 개발된 명제를 검증 가능한 가설로 전환하는 것은 추가적인 정량적 연구의 토대를 마련할 수 있다(Otto, 2011b, p. 61).


Researchers should aim at substantiating the propositions on data governance through quantitative empirical studies on a larger and more representative sample of companies (e.g., Otto, 2011b, p. 62; Tallon et al., 2014, p. 171; Weber et al., 2009, p. 23).

연구자들은 데이터 거버넌스에 대한 명제를 보다 크고 대표성 있는 기업 샘플을 대상으로 한 정량적 실증 연구를 통해 입증하는 것을 목표로 삼아야 한다(Otto, 2011b, p. 62; Tallon et al., 2014, p. 171; Weber et al., 2009, p. 23).


In addition, researchers should broaden the sample of study participants.

또한 연구자들은 연구 참가자의 샘플을 확대해야 한다.


Prior case studies selected primarily IT and data management executives as interview partners (Neff et al., 2013, p. 8; Otto, 2011b, p. 51; Tallon et al., 2014, p. 171; Weber et al., 2009, p. 24).

이전 사례 연구는 주로 IT 및 데이터 관리 임원을 인터뷰 대상으로 선택했다(Neff et al., 2013, p. 8; Otto, 2011b, p. 51; Tallon et al., 2014, p. 171; Weber et al., 2009, p. 24).


Future research should include additional stakeholders such as the legal counsel, data architects, application and process owners, and data stewards.

향후 연구는 법률 고문, 데이터 아키텍트, 애플리케이션 및 프로세스 소유자, 데이터 관리자를 포함한 추가 이해관계자를 포함해야 한다.


In doing so, researchers could improve internal validity and gain a holistic understanding concerning the effectiveness, limitations, and challenges of data governance.

이를 통해 연구자들은 데이터 거버넌스의 효과성, 한계 및 도전에 대한 내부 타당성을 개선하고 전체적인 이해를 얻을 수 있을 것이다.


Table 4 outlines the research areas for data governance and lists potential research questions for future research.

표 4는 데이터 거버넌스의 연구 영역을 개괄하고 향후 연구를 위한 잠재적 연구 질문을 제시한다.

tempImagerAVY3F.heic Table 4 Research agenda for data governance.


6. Conclusion


In this study, we conducted a structured literature review, provided an overview of the state-of-the-art of data governance, and identified a research agenda.

본 연구에서는 체계적인 문헌 검토를 수행하여 데이터 거버넌스의 최신 상태를 개괄하고 연구 과제를 도출하였다.


Two research questions framed our literature review: What are the building blocks of data governance? Where do we lack in knowledge about data governance?

문헌 검토는 두 가지 연구 질문으로 구성되었다. 데이터 거버넌스의 구성 요소는 무엇인가? 데이터 거버넌스에 대해 어떤 지식이 부족한가?


We answered the first question by developing a conceptual framework for data governance comprising six dimensions: governance mechanisms, organizational scope, data scope, domain scope, antecedents, and consequences of data governance.

첫 번째 질문에 대해서는 거버넌스 메커니즘, 조직 범위, 데이터 범위, 도메인 범위, 선행 요인, 결과라는 여섯 가지 차원으로 구성된 데이터 거버넌스의 개념적 프레임워크를 개발함으로써 답하였다.


We answered the second question by analyzing gaps within the dimensions of the conceptual framework and deriving areas for which further research is required.

두 번째 질문에 대해서는 개념적 프레임워크의 각 차원에서 존재하는 격차를 분석하고 추가 연구가 필요한 영역을 도출하여 답하였다.


We identified five promising fields for future research: governance mechanisms, the scope of data governance, antecedents of data governance, consequences of data governance, and further research strengthening the generalizability and replicability of findings.

향후 연구를 위한 다섯 가지 유망한 분야를 도출하였다. 거버넌스 메커니즘, 데이터 거버넌스의 범위, 데이터 거버넌스의 선행 요인, 데이터 거버넌스의 결과, 그리고 발견의 일반화 가능성과 재현 가능성을 강화하는 추가 연구이다.


From the perspective of the practitioners’ community, the results of the literature review can be considered valuable as the conceptual framework supports practitioners to approach data governance in a structured manner.

실무자 커뮤니티의 관점에서 문헌 검토의 결과는 개념적 프레임워크가 실무자가 데이터 거버넌스를 체계적으로 접근할 수 있도록 지원하기 때문에 가치 있다고 할 수 있다.


For example, practitioners could first identify the antecedents that affect their organization.

예를 들어, 실무자는 먼저 조직에 영향을 미치는 선행 요인을 식별할 수 있다.


Second, they could determine the organizational scope, data scope, and domain scope for their data governance design.

둘째, 데이터 거버넌스 설계를 위한 조직 범위, 데이터 범위, 도메인 범위를 결정할 수 있다.


Data governance with a focus on data quality for master data is likely to be different than data governance with a focus on data privacy in the context of big data.

마스터 데이터의 데이터 품질에 초점을 맞춘 데이터 거버넌스는 빅데이터 맥락에서 데이터 프라이버시에 초점을 맞춘 데이터 거버넌스와 다를 가능성이 크다.


Based on those previous two steps, practitioners could choose and customize the set of data governance mechanisms most appropriate for their organization.

이전 두 단계를 기반으로 실무자는 조직에 가장 적합한 데이터 거버넌스 메커니즘 세트를 선택하고 맞춤화할 수 있다.


Reflecting on these results will help to avoid approaching the topic prematurely.

이러한 결과를 반영하면 주제를 성급하게 접근하는 것을 피하는 데 도움이 될 것이다.


The conceptual framework also builds the foundation to exploit synergies between decision domains such as data quality and data security.
개념적 프레임워크는 또한 데이터 품질과 데이터 보안과 같은 의사결정 도메인 간의 시너지를 활용하기 위한 기초를 구축한다.


Despite the efforts we have made to present a complete review of data governance literature, the study has its limitations.

데이터 거버넌스 문헌의 완전한 검토를 제시하려는 노력을 기울였음에도, 본 연구에는 한계가 있다.


The major focus of our search process was on the term “data governance” including synonyms, but less on the broader concept of data management.

검색 과정에서 주요 초점은 동의어를 포함한 “데이터 거버넌스”라는 용어에 맞춰졌으며, 데이터 관리의 더 넓은 개념에는 덜 집중되었다.


Future research should review the literature on data management and screen for governance concepts.

향후 연구는 데이터 관리에 관한 문헌을 검토하고 거버넌스 개념을 탐색해야 한다.


Moreover, we included the search term “information governance,” as the term is often used interchangeably with the term “data governance.”

게다가, “정보 거버넌스”라는 검색어를 포함하였는데, 이 용어는 종종 “데이터 거버넌스”와 혼용된다.


However, we identified few publications that differentiate between both terms (de Abreu Faria et al., 2013, p. 4437; Jim & Chang, 2018, p. 203; Kooper et al., 2011, p. 198).

그러나 두 용어를 구분하는 몇몇 출판물만 확인할 수 있었다(de Abreu Faria et al., 2013, p. 4437; Jim & Chang, 2018, p. 203; Kooper et al., 2011, p. 198).


Future research should further investigate the usage of these terms.

향후 연구는 이러한 용어의 사용을 더욱 조사해야 한다.


Due to lack of access, we were not able to use certain scientific databases such as Scopus and Web of Science.

접근 권한 부족으로 인해 Scopus와 Web of Science와 같은 일부 과학 데이터베이스를 사용할 수 없었다.


Though we are convinced that we have compiled most of the studies carried out on this topic, future research should conduct a literature search in those databases.

이 주제에 대해 수행된 대부분의 연구를 수집했다고 확신하지만, 향후 연구는 해당 데이터베이스에서 문헌 검색을 수행해야 한다.


The study did not validate the practical applicability of the conceptual framework.

본 연구는 개념적 프레임워크의 실질적 적용 가능성을 검증하지 않았다.


First, we did not distinguish, which findings describe norms of data governance and which describe the actual practice.

첫째, 데이터 거버넌스의 규범을 설명하는 결과와 실제 관행을 설명하는 결과를 구별하지 않았다.


Future research should conduct expert interviews or case studies to ascertain which data governance concepts are applied in practice.

향후 연구는 전문가 인터뷰 또는 사례 연구를 수행하여 어떤 데이터 거버넌스 개념이 실제로 적용되는지 확인해야 한다.


Second, our conceptual framework does not provide the information on which data governance mechanisms to choose for a given set of antecedents and a given organizational, data, and domain scope.

둘째, 본 연구의 개념적 프레임워크는 특정 선행 요인 집합 및 조직, 데이터, 도메인 범위에 대해 어떤 데이터 거버넌스 메커니즘을 선택해야 하는지에 대한 정보를 제공하지 않는다.


Researchers should conduct a quantitative study to identify the correlations between antecedents, the scoping parameters, and data governance mechanisms.

연구자들은 선행 요인, 범위 매개변수, 데이터 거버넌스 메커니즘 간의 상관관계를 식별하기 위한 정량적 연구를 수행해야 한다.


This could provide further insights on how to configure data governance in a specific environment.

이는 특정 환경에서 데이터 거버넌스를 어떻게 구성할지에 대한 추가적인 통찰을 제공할 수 있다.


With our research agenda, we support the call from Tiwana et al. (2014, p. 9) for more research on the governance of data.

본 연구 과제를 통해 Tiwana et al.(2014, p. 9)이 제기한 데이터 거버넌스에 대한 추가 연구의 필요성을 지원한다.


We provided a comprehensive overview of the topic that is valuable for both researchers and practitioners in the field of data governance.

우리는 데이터 거버넌스 분야의 연구자와 실무자 모두에게 가치 있는 주제에 대한 포괄적인 개요를 제공했다.


We hope that our work facilitates future research on data governance by providing a conceptual foundation.

우리의 연구가 개념적 토대를 제공함으로써 데이터 거버넌스에 대한 향후 연구를 촉진하기를 바란다.

keyword
매거진의 이전글논문 리뷰 : 데이터 거버넌스 활동 - 문헌 분석