Alhassan et al. (2016)
Alhassan, Ibrahim, David Sammon, and Mary Daly. "Data governance activities: an analysis of the literature." Journal of Decision Systems 25.sup1 (2016): 64-75.
https://www.proquest.com/openview/bdc70d3f524b46d588a39588ba1e5d6f/1?pq-origsite=gscholar&cbl=29100
Data governance is an emerging subject in the information system (IS) field.
데이터 거버넌스는 정보 시스템(IS) 분야에서 새롭게 떠오르는 주제이다.
In recent years, the volume of data used within organisations has increased dramatically, playing a critical role in business operations.
최근 몇 년간 조직 내에서 사용되는 데이터의 양이 급격히 증가하였으며, 이는 비즈니스 운영에서 중요한 역할을 하고 있다.
This paper explores the current literature on data governance and is intended to provide a comprehensive analysis of the activities involved in data governance.
본 논문은 데이터 거버넌스에 관한 현재 문헌을 탐구하며, 데이터 거버넌스 활동에 포함된 요소를 포괄적으로 분석하는 것을 목표로 한다.
Six major academic databases in the IS domain were searched using key terms to identify and analyse material reflecting the current state of knowledge.
IS 분야의 주요 학술 데이터베이스 6개를 검색하여 현재 지식 상태를 반영하는 자료를 식별하고 분석하였다.
A systematic procedure was developed to identify 31 papers that explicitly mention data governance activities.
데이터 거버넌스 활동을 명시적으로 언급한 31편의 논문을 식별하기 위해 체계적인 절차가 개발되었다.
Open coding techniques were applied to conduct content analysis, resulting in 110 data governance activities across five decision domains of the data governance framework.
내용 분석을 위해 개방형 코딩 기법이 적용되었으며, 데이터 거버넌스 프레임워크의 다섯 가지 의사결정 영역에서 110개의 데이터 거버넌스 활동이 도출되었다.
These data governance activities are understood as: ‘action’ plus ‘area of governance’ plus ‘decision domain’ e.g. (define data policies for data quality).
이러한 데이터 거버넌스 활동은 ‘행동’ + ‘거버넌스 영역’ + ‘의사결정 영역’의 조합으로 이해되며, 예를 들어 ‘데이터 품질을 위한 데이터 정책 정의’와 같은 형태이다.
Our analysis shows a high volume of data governance activities associated with the ‘defining’ action of the areas of governance across the decision domains with a lack of reported on the ‘implementing’ and ‘monitoring’ actions.
분석 결과, 의사결정 영역 전반에서 ‘정의’ 활동과 관련된 데이터 거버넌스 활동의 비중이 높은 반면, ‘구현’ 및 ‘모니터링’ 활동에 대한 보고는 부족한 것으로 나타났다.
Keywords: Data governance, data governance activities, content analysis, open coding
In recent years, the volume of data used within organisations has increased dramatically, playing a critical role in businesses operations (Tallon, Ramirez, & Short, 2013).
최근 몇 년 동안 조직에서 사용되는 데이터의 양이 급격히 증가하였으며, 이는 비즈니스 운영에서 중요한 역할을 하고 있다(Tallon, Ramirez, & Short, 2013).
In particular, data influence both operational and strategic decisions.
특히 데이터는 운영 및 전략적 의사결정 모두에 영향을 미친다.
How to govern these data has also become critical, for data to be treated as a valuable asset (Khatri & Brown, 2010).
이 데이터를 관리하는 방법도 중요한 문제가 되었으며, 데이터가 가치 있는 자산으로 간주되기 위해 데이터 거버넌스가 필수적이다(Khatri & Brown, 2010).
Data governance has rapidly gained in popularity (Cheong & Chang, 2007; Khatri & Brown, 2010; Weber, Otto, & Österle, 2009) and is considered to be an emerging subject in the information system (IS) field (Hagmann, 2013).
데이터 거버넌스는 빠르게 주목을 받으며(Cheong & Chang, 2007; Khatri & Brown, 2010; Weber, Otto, & Österle, 2009), 정보 시스템(IS) 분야에서 새롭게 부상하는 주제로 간주되고 있다(Hagmann, 2013).
Practitioners also consider data governance as a promising approach for enterprises to improve and maintain the quality and use of their data (Otto, 2011a).
실무자들 또한 데이터 거버넌스를 기업이 데이터의 품질과 활용성을 개선하고 유지하는 데 유망한 접근법으로 평가하고 있다(Otto, 2011a).
It can be argued that data governance, from both the academic and practitioner points of view, should be a universal approach to data accountability, fitting all data aspects and needs of an organisation (Weber et al., 2009; Wende, 2007).
학계와 실무 관점에서 데이터 거버넌스는 조직의 모든 데이터 측면과 요구를 충족시키는 데이터 책임성에 대한 보편적 접근법이 되어야 한다고 주장할 수 있다(Weber et al., 2009; Wende, 2007).
A survey of 200 organisations (Pierce, Dismute, & Yonke, 2008) found that 58% recognised data as a strategic asset.
200개 조직을 대상으로 한 조사에서 58%가 데이터를 전략적 자산으로 인식하는 것으로 나타났다(Pierce, Dismute, & Yonke, 2008).
A recent study by Holt, Ramage, Kear, and Heap (2015) indicated that 45% of their participants within the global community of database and data professionals did not have data governance policies in place.
Holt, Ramage, Kear, 그리고 Heap(2015)의 최근 연구에 따르면, 데이터베이스 및 데이터 전문가 글로벌 커뮤니티 참가자의 45%가 데이터 거버넌스 정책을 수립하지 않은 것으로 나타났다.
Hence, data governance requires more attention from stakeholders (Fisher, 2006).
따라서 데이터 거버넌스는 이해관계자들로부터 더 많은 관심이 요구된다(Fisher, 2006).
This paper aims to contribute to the IS community through a categorization of current academic literature in the domain of data governance, which should assist researchers in understanding the research that has been published around the activities involved in data governance.
본 논문은 데이터 거버넌스 영역에서 현재 학술 문헌을 분류하여 IS 커뮤니티에 기여하는 것을 목표로 하며, 이는 연구자들이 데이터 거버넌스 활동과 관련된 연구를 이해하는 데 도움을 줄 것이다.
These activities highlight the tasks that need to be performed in order to do data governance.
이러한 활동은 데이터 거버넌스를 수행하기 위해 필요한 작업을 강조한다.
This paper is organised as follows: section 2 presents an overview of the data governance literature, section 3 describes the research approach used to conduct the literature review, including the paper selection strategy and the data analysis techniques applied; and section 4 presents the results of our analysis of data governance activities.
본 논문은 다음과 같이 구성된다: 2장은 데이터 거버넌스 문헌 개요를, 3장은 문헌 검토를 수행하기 위해 사용된 연구 접근법(논문 선정 전략 및 데이터 분석 기법 포함)을, 4장은 데이터 거버넌스 활동에 대한 분석 결과를 제시한다.
We conclude by discussing the results and addressing the limitations and recommendations for future work in the area.
결론에서는 결과를 논의하고, 이 분야의 미래 연구를 위한 한계점과 제언을 제시한다.
Data governance is defined as ‘A companywide framework for assigning decision-related rights and duties in order to be able to adequately handle data as a company asset’ (Otto, 2011b; p. 47).
데이터 거버넌스는 ‘데이터를 회사 자산으로 적절히 다룰 수 있도록 의사결정 관련 권리와 의무를 할당하는 회사 전반의 프레임워크’로 정의된다(Otto, 2011b; p. 47).
The main driver for data governance is considering data as an asset of the firm (Panian, 2010).
데이터 거버넌스의 주요 동력은 데이터를 기업의 자산으로 간주하는 것이다(Panian, 2010).
Horne (1995) connected governance with optimal uses of assets, then treated data and information as an asset, which drives the importance of the governance of the data within an organisation.
Horne(1995)은 거버넌스를 자산의 최적 활용과 연결하고 데이터를 자산으로 취급하여 조직 내 데이터 거버넌스의 중요성을 강조하였다.
The concept of data as an asset was developed in a report by the Hawley Committee in 1994, which defined data assets as ‘Data that is or should be documented and that has value or potential value’ (Oppenheim, Stenson, & Wilson, 2003).
데이터를 자산으로 보는 개념은 1994년 Hawley 위원회의 보고서에서 발전되었으며, 데이터 자산을 ‘문서화되어 있거나 문서화되어야 하며, 가치 또는 잠재적 가치를 가진 데이터’로 정의하였다(Oppenheim, Stenson, & Wilson, 2003).
It can be argued that ‘data governance’ is a new term with novel implications for data as an asset.
‘데이터 거버넌스’는 데이터를 자산으로 다루는 새로운 함의를 가진 신조어라고 주장할 수 있다.
However, there are many terms and approaches in the academic literature that deal with data and information under the IS field, such as total data quality management (TDQM) (see Wang, 1998).
그러나 정보 시스템(IS) 분야에서 데이터와 정보를 다루는 학술 문헌에는 전체 데이터 품질 관리(TDQM)(Wang, 1998 참조)와 같은 다양한 용어와 접근법이 존재한다.
Another approach is data quality management (DQM) (see Wang & Strong, 1996), among many more different approaches and terms (Lucas, 2010; Otto, Wende, Schmidt, & Osl, 2007).
또 다른 접근법으로는 데이터 품질 관리(DQM)(Wang & Strong, 1996 참조)가 있으며, 이 외에도 다양한 접근법과 용어가 존재한다(Lucas, 2010; Otto, Wende, Schmidt, & Osl, 2007).
The main difference between the terms ‘governance’ and ‘management’ is that governance refers to the decisions that must be made and who makes these decisions in order to ensure effective management and use of resources, whereas management involves implementing decisions (Fu, Wojak, Neagu, Ridley, & Travis, 2011; Khatri & Brown, 2010).
‘거버넌스’와 ‘관리’라는 용어의 주요 차이점은 거버넌스는 효과적인 자원 관리 및 사용을 보장하기 위해 내려야 할 의사결정과 그 의사결정을 내리는 주체를 의미하는 반면, 관리는 의사결정을 실행하는 것을 의미한다(Fu, Wojak, Neagu, Ridley, & Travis, 2011; Khatri & Brown, 2010).
Hence, management is influenced by governance (Otto, 2011c).
따라서 관리는 거버넌스의 영향을 받는다(Otto, 2011c).
Therefore, we can distinguish between the activities for data governance and the activities required for data management.
따라서 데이터 거버넌스를 위한 활동과 데이터 관리를 위한 활동을 구별할 수 있다.
The definition of data governance indicates who holds the decision rights and accountability regarding an enterprise’s data assets.
데이터 거버넌스의 정의는 기업의 데이터 자산에 대한 의사결정 권한과 책임을 누가 가지는지 명시한다.
Therefore, the decision domains should be identified in order to assign the right responsibilities and duties.
따라서 적절한 책임과 의무를 할당하기 위해 의사결정 영역을 식별해야 한다.
In reviewing the literature relating to data governance frameworks, the framework proposed by Khatri and Brown (2010) was selected to present the decision domains that should be considered for data governance.
데이터 거버넌스 프레임워크와 관련된 문헌을 검토한 결과, Khatri와 Brown(2010)이 제안한 프레임워크가 데이터 거버넌스를 위해 고려해야 할 의사결정 영역을 제시하는 데 적합한 것으로 선정되었다.
The framework contains five interrelated decision domains: 1) data principles, 2) data quality, 3) metadata, 4) data access, and 5) data life cycle as shown in Figure 1.
이 프레임워크는 다섯 개의 상호 연관된 의사결정 영역을 포함한다: 1) 데이터 원칙, 2) 데이터 품질, 3) 메타데이터, 4) 데이터 접근, 5) 데이터 라이프사이클(Figure 1 참조).
These five decision domains follow a similar pattern to the IT governance decision domains proposed by Weill and Ross (2004).
이 다섯 가지 의사결정 영역은 Weill과 Ross(2004)가 제안한 IT 거버넌스 의사결정 영역과 유사한 패턴을 따른다.
Each of the five decision domains addresses a set of core issues which are explained below.
이 다섯 가지 의사결정 영역 각각은 아래에서 설명되는 핵심 문제들을 다룬다.
According to Khatri and Brown (2010), data principles are shown at the top of the framework as they are intended to establish the direction for all other decision domains.
Khatri와 Brown(2010)에 따르면, 데이터 원칙은 프레임워크의 최상단에 표시되며, 이는 다른 모든 의사결정 영역의 방향성을 설정하는 데 목적이 있다.
Hence, the principles set the boundary requirements for uses of data assets, which addresses the enterprise’s standards for data quality.
따라서 이러한 원칙은 데이터 자산 사용에 대한 경계 요건을 설정하며, 이는 기업의 데이터 품질 표준을 다룬다.
The data quality then refines the basis for how data are interpreted (metadata) as well as accessed (data access) by users.
데이터 품질은 데이터를 사용자가 어떻게 해석(메타데이터)하고 접근(데이터 접근)하는지에 대한 기준을 세밀화한다.
Finally, the data life cycle decision defines the production, retention, and retirement of data assets which plays a fundamental role in operationalizing the data principles into the IT infrastructure.
마지막으로 데이터 라이프사이클 의사결정은 데이터 자산의 생성, 보존, 폐기를 정의하며, 이는 데이터 원칙을 IT 인프라로 구현하는 데 근본적인 역할을 한다.
The focus of our literature review is to identify the data governance activities reported in the literature through the lens of the Khatri and Brown (2010) framework.
우리의 문헌 검토는 Khatri와 Brown(2010) 프레임워크의 관점에서 문헌에 보고된 데이터 거버넌스 활동을 식별하는 데 중점을 둔다.
The purpose of this study is to identify and categorise the literature that explicitly mentions data governance activities.
본 연구의 목적은 데이터 거버넌스 활동을 명시적으로 언급한 문헌을 식별하고 분류하는 것이다.
These steps consist of data collection and coding procedures and are explained below.
이 과정은 데이터 수집 및 코딩 절차로 구성되며, 아래에 설명되어 있다.
This step involves deciding what level of analysis should be conducted.
이 단계는 어떤 수준의 분석을 수행할지 결정하는 것을 포함한다.
The level of analysis can be a signal word, a set of words, phrases, or an entire document (Finney & Corbett, 2007).
분석 수준은 단어 신호, 단어 집합, 구문 또는 전체 문서일 수 있다(Finney & Corbett, 2007).
For this research, the level of analysis considered the entire paper.
본 연구에서는 분석 수준으로 전체 논문을 고려하였다.
The data collection phase was initiated by collecting papers through searches of the following databases: the AIS Electronic Library, CiteSeerX, EBSCO Online, Emerald Insight, ScienceDirect, and the ACM Digital Library.
데이터 수집 단계는 다음 데이터베이스를 통해 논문을 검색하여 자료를 수집함으로써 시작되었다: AIS 전자도서관, CiteSeerX, EBSCO Online, Emerald Insight, ScienceDirect, 그리고 ACM Digital Library.
These 6 databases cover the majority of IS journals and conferences (Otto, 2011a).
이 여섯 개 데이터베이스는 IS 저널 및 학회의 대부분을 포함한다(Otto, 2011a).
Search criteria were established in each database using the advanced search function.
고급 검색 기능을 사용하여 각 데이터베이스에서 검색 기준이 설정되었다.
The keyword search criterion of having ‘data governance’ or ‘information governance’ in either the title or abstract was applied on the 16th December 2015, resulting in a total of 230 papers (Table 1).
2015년 12월 16일에 제목 또는 초록에 ‘데이터 거버넌스’ 또는 ‘정보 거버넌스’라는 키워드를 포함하는 기준이 적용되었으며, 총 230편의 논문이 검색되었다(Table 1).
The abstracts of these papers were reviewed; enabling the exclusion of those papers that are not related to the data governance domain (see Table 2).
이 논문들의 초록을 검토하여 데이터 거버넌스 영역과 관련이 없는 논문들을 제외할 수 있었다(Table 2 참조).
It can be seen that 171 of the 230 papers were excluded as a result.
그 결과, 230편의 논문 중 171편이 제외되었다.
The majority of the excluded papers were not peer-reviewed academic papers, but mainly practitioner papers.
제외된 논문의 대부분은 동료 검토를 거친 학술 논문이 아니라 주로 실무자 논문이었다.
In addition, 66 papers were excluded, as they were not related to the data governance domain.
또한, 데이터 거버넌스 영역과 관련이 없는 66편의 논문도 제외되었다.
They had been published to serve a different interest of study that was not related to data governance, although they mentioned data governance in the abstract.
이 논문들은 초록에서 데이터 거버넌스를 언급했지만, 데이터 거버넌스와 관련 없는 다른 연구 관심사를 목적으로 출판되었다.
For example, the (Martin, Simons, Craven, & Betton, 2014) paper, where data governance is mentioned in the context of ‘there is a need for data governance in healthcare’, was not considered to be directly related to the data governance domain or focusing on the study of data governance activities.
예를 들어, Martin, Simons, Craven, & Betton(2014)의 논문은 ‘헬스케어 분야에서 데이터 거버넌스의 필요성이 있다’는 맥락에서 데이터 거버넌스를 언급했지만, 데이터 거버넌스 영역이나 데이터 거버넌스 활동 연구에 직접적으로 관련이 있는 것으로 간주되지 않았다.
Here, researchers should decide whether to code text using a predefined set of concepts or develop a list of concepts incrementally during the process of coding (Finney & Corbett, 2007).
이 단계에서는 연구자가 사전에 정의된 개념 집합을 사용하여 텍스트를 코딩할지, 아니면 코딩 과정에서 점진적으로 개념 목록을 개발할지 결정해야 한다(Finney & Corbett, 2007).
For this research, due to the small number of papers that explicitly contribute to data governance activities, the researchers decided to code concepts inductively that can be interpreted as data governance activities.
본 연구에서는 데이터 거버넌스 활동에 명시적으로 기여하는 논문의 수가 적었기 때문에, 데이터 거버넌스 활동으로 해석될 수 있는 개념들을 귀납적으로 코딩하기로 결정하였다.
Therefore, all the concepts emerged incrementally through the processes of open coding.
따라서 모든 개념은 개방형 코딩 과정을 통해 점진적으로 도출되었다.
After a certain number of concepts have emerged, researchers should decide whether to code the concepts for existence or frequency (Finney & Corbett, 2007).
일정 수의 개념이 도출된 후, 연구자는 개념을 존재 여부로 코딩할지 빈도로 코딩할지 결정해야 한다(Finney & Corbett, 2007).
If the concepts are coded for existence, this involves listing only the concepts that emerge.
개념이 존재 여부로 코딩될 경우, 도출된 개념만 나열하게 된다.
However, coding for frequency makes possible a discussion of saliency and emphasis (Finney & Corbett, 2007).
그러나 빈도로 코딩하면 중요성과 강조점에 대한 논의가 가능해진다(Finney & Corbett, 2007).
For this research, it was decided to code for frequency in order to gain a deeper insight into the concepts that emerged.
본 연구에서는 도출된 개념에 대한 더 깊은 통찰을 얻기 위해 빈도로 코딩하기로 결정하였다.
During this step, researchers should decide whether to code the concepts exactly as they appear, or if they can be coded in some altered or collapsed form (Finney & Corbett, 2007).
이 단계에서는 개념을 원래 나타난 그대로 코딩할지, 아니면 일부 수정하거나 병합된 형태로 코딩할지 결정해야 한다(Finney & Corbett, 2007).
For this research, it was decided to follow open coding analysis techniques suggested by Corbin and Strauss (1990), whereby concepts that appear to be similar are grouped together under a higher-order, more abstract concept called a category.
본 연구에서는 Corbin과 Strauss(1990)가 제안한 개방형 코딩 분석 기법을 따르기로 하였으며, 이 기법에서는 유사해 보이는 개념들이 더 높은 수준의 추상적인 개념인 범주로 묶인다.
It is necessary to define certain translation rules in order to ensure the consistency of the coding procedures (Finney & Corbett, 2007).
코딩 절차의 일관성을 보장하기 위해 특정 번역 규칙을 정의하는 것이 필요하다(Finney & Corbett, 2007).
The following translation rules were established and applied during the coding procedure:
다음과 같은 번역 규칙이 코딩 절차 동안 설정되고 적용되었다:
All papers were read the first time in order to code data governance activities. There should be an imperative verb that indicates that an activity should be taken around data governance.
모든 논문은 데이터 거버넌스 활동을 코딩하기 위해 처음부터 읽혔다. 데이터 거버넌스와 관련하여 수행해야 할 활동을 나타내는 명령형 동사가 있어야 한다.
All the concepts that emerged from the papers were compared to identify similarities and differences in order for them to be labelled together in categories.
논문에서 도출된 모든 개념은 유사점과 차이점을 식별하기 위해 비교되었으며, 이를 범주로 묶기 위해 레이블이 지정되었다.
Once all the papers were coded, the researchers examined the categories that emerged and their properties within the actual text in order to ensure that they reflected the meaning of the actual text.
모든 논문이 코딩된 후, 연구자들은 도출된 범주와 해당 범주의 속성이 실제 텍스트의 의미를 반영하는지 확인하기 위해 이를 검토하였다.
This stage involved determining what to do with information in the text that was not coded (Finney & Corbett, 2007).
이 단계는 텍스트에서 코딩되지 않은 정보에 대해 어떻게 처리할지 결정하는 것을 포함하였다(Finney & Corbett, 2007).
Carley (1993) suggested that deleting irrelevant information can facilitate content analysis procedures by generating simplified text.
Carley(1993)는 관련 없는 정보를 삭제하면 간소화된 텍스트를 생성하여 내용 분석 절차를 용이하게 할 수 있다고 제안하였다.
In this research, the remaining 59 papers received a more in-depth review in order to identify which of the papers explicitly mention data governance activities.
본 연구에서는 나머지 59편의 논문에 대해 보다 심층적인 검토를 통해 데이터 거버넌스 활동을 명시적으로 언급한 논문을 식별하였다.
Of the 59 papers, only 31 explicitly mention the required or recommended data governance activities.
59편의 논문 중 31편만이 필요한 또는 권장되는 데이터 거버넌스 활동을 명시적으로 언급하였다.
These activities are the conditions or things that need to be performed in order to be considered as doing data governance.
이러한 활동은 데이터 거버넌스를 수행하는 것으로 간주되기 위해 필요한 조건 또는 작업이다.
The coding procedure should start following the decision related to irrelevant information and should follow the translation rules identified in step 5 (Finney & Corbett, 2007).
코딩 절차는 관련 없는 정보에 대한 결정 이후에 시작해야 하며, 5단계에서 정의된 번역 규칙을 따라야 한다(Finney & Corbett, 2007).
As mentioned earlier, this research adopted an open coding analysis technique, which is part of a grounded theory approach (Corbin & Strauss, 1990).
앞서 언급했듯이 본 연구는 근거이론 접근법의 일부인 개방형 코딩 분석 기법을 채택하였다(Corbin & Strauss, 1990).
Open coding analysis is widely applied in conducting content analysis for a set of academic papers (see Finney & Corbett, 2007; Goode & Gregor, 2009; Grahlmann, Helms, Hilhorst, Brinkkemper, & van Amerongen, 2012) and is described as ‘the process of breaking down, examining, comparing, conceptualising, and categorising data’ (Corbin & Strauss, 1990, p. 61).
개방형 코딩 분석은 학술 논문 집합에 대해 내용 분석을 수행할 때 널리 적용되며(Finney & Corbett, 2007; Goode & Gregor, 2009; Grahlmann, Helms, Hilhorst, Brinkkemper, & van Amerongen, 2012 참조), ‘데이터를 분해, 검토, 비교, 개념화, 범주화하는 과정’으로 설명된다(Corbin & Strauss, 1990, p. 61).
Open coding refers to a systematic process aimed at identifying key concepts or ideas that might be hidden within the data and are likely related to the phenomenon of interest (Bhattacherjee, 2012).
오픈 코딩은 데이터에 숨겨져 있을 수 있는 핵심 개념이나 아이디어를 식별하고, 연구 대상 현상과 연관될 가능성이 높은 요소를 체계적으로 찾아내는 과정을 의미한다 (Bhattacherjee, 2012).
At the open coding stage, concepts and categories are generated (Glaser, 1992), and as the categories develop, their properties and the dimensions of those properties are identified (Corbin & Strauss, 1990).
오픈 코딩 단계에서는 개념과 범주가 생성되며 (Glaser, 1992), 범주가 발전함에 따라 해당 범주의 속성과 속성의 차원이 식별된다 (Corbin & Strauss, 1990).
Table 3 presents terms relevant to this study as defined by Corbin and Strauss (1990) in the context of open coding, followed by a description of its operationalization.
표 3은 Corbin과 Strauss(1990)가 정의한 이 연구와 관련된 오픈 코딩 용어를 제시하며, 이후 오픈 코딩이 실제로 어떻게 실행되는지에 대한 설명이 이어진다.
Two primary analytical procedures are employed to achieve the objectives of open coding (Corbin & Strauss, 1990; Glaser, 1992): the ‘making of comparisons’ and the ‘asking of questions.’
오픈 코딩의 목표를 달성하기 위해 두 가지 주요 분석 절차가 사용된다 (Corbin & Strauss, 1990; Glaser, 1992): ‘비교하기’와 ‘질문하기’이다.
The first procedure, ‘making of comparisons,’ involves comparing each concept with others to identify similarities and differences.
첫 번째 절차인 ‘비교하기’는 각 개념을 다른 개념과 비교하여 유사점과 차이점을 식별하는 과정을 포함한다.
As argued by Corbin and Strauss (2008), conceptually similar ideas are grouped under higher-level descriptive categories.
Corbin과 Strauss(2008)에 따르면, 개념적으로 유사한 아이디어는 더 상위의 서술적 범주로 묶인다.
Each concept, however, has the potential to highlight different aspects of the same phenomenon based on the analytical procedures applied.
그러나 각 개념은 적용된 분석 절차에 따라 동일한 현상의 다양한 측면을 부각시킬 가능성이 있다.
This type of comparison helps researchers differentiate categories from one another and identify their properties and dimensions (Corbin & Strauss, 2008; Glaser, 1992).
이와 같은 비교는 연구자가 범주 간의 차이를 구별하고 각 범주의 속성과 차원을 식별하는 데 도움을 준다 (Corbin & Strauss, 2008; Glaser, 1992).
The second procedure, ‘asking of questions,’ involves analyzing the emerging concepts to determine what category or property of a category a concept represents (Glaser, 1992).
두 번째 절차인 ‘질문하기’는 도출된 개념을 분석하여 해당 개념이 어떤 범주나 범주의 속성을 나타내는지 결정하는 과정을 포함한다 (Glaser, 1992).
This step requires a close examination of the data through line-by-line coding, compelling the analyst to verify and saturate categories to minimize the likelihood of missing critical categories (Glaser & Holton, 2004).
이 단계는 데이터를 한 줄씩 코딩하며 면밀히 검토하는 작업을 요구하며, 이는 분석자가 범주를 확인하고 포화시켜 중요한 범주를 놓칠 가능성을 최소화하도록 한다 (Glaser & Holton, 2004).
By applying these two procedures, analysts can conceptualize the data and categorize it according to the specific needs of the intended investigation.
이 두 가지 절차를 적용함으로써 분석자는 데이터를 개념화하고, 연구의 특정 요구에 따라 이를 범주화할 수 있다.
After coding the data, researchers should decide how to review and present the results (Finney & Corbett, 2007).
데이터를 코딩한 후, 연구자는 결과를 검토하고 제시하는 방법을 결정해야 한다(Finney & Corbett, 2007).
For this research, a frequency count was the principal method for representing the data governance activities.
본 연구에서는 데이터 거버넌스 활동을 나타내는 주된 방법으로 빈도 계산을 사용하였다.
A total of 59 articles were reviewed, 31 of which explicitly mention data governance activities.
총 59편의 논문이 검토되었으며, 그중 31편이 데이터 거버넌스 활동을 명시적으로 언급하였다.
The 31 papers were classified by paper publication type, either a journal paper or conference proceedings papers, and are listed in Table 4.
31편의 논문은 저널 논문 또는 학회 발표 논문으로 분류되었으며, 이는 Table 4에 나와 있다.
While reviewing and applying the open coding analysis procedure to the 31 selected papers, an MS Excel spreadsheet was developed.
31편의 논문을 검토하고 개방형 코딩 분석 절차를 적용하는 동안 MS Excel 스프레드시트가 개발되었다.
The spreadsheet was constructed to include reference to each open coding stage, including referencing the original text using Mendeley, a document management application.
이 스프레드시트는 각 개방형 코딩 단계에 대한 참조를 포함하도록 구성되었으며, 문서 관리 애플리케이션인 Mendeley를 사용하여 원문을 참조하였다.
The open coding analysis procedure was conducted in an iterative manner (as described in step 7), starting with reading each paper and searching for any action (imperative verbs) (see step 6).
개방형 코딩 분석 절차는 반복적으로 수행되었으며(7단계에서 설명됨), 각 논문을 읽고 행동(명령형 동사)을 검색하는 것으로 시작되었다(6단계 참조).
These concepts were then compared for similarities and differences in order for them to be categorised in higher abstracted categories which are considered to be data governance activities.
이 개념들은 유사점과 차이점을 비교하여 더 높은 수준의 추상적 범주로 분류되었으며, 이는 데이터 거버넌스 활동으로 간주된다.
In maintaining the meaning of the categories, it was decided that each of the categories would consist of the following three constructs: 1) action, 2) area of governance, and 3) the decision domain.
범주의 의미를 유지하기 위해 각 범주는 다음 세 가지 구성 요소로 구성되도록 결정되었다: 1) 행동, 2) 거버넌스 영역, 3) 의사결정 영역.
Table 5 shows the terms used in the coding procedure associated with the number of results counted after reviewing the 31 papers.
Table 5는 31편의 논문을 검토한 후 결과 수를 기반으로 코딩 절차에서 사용된 용어를 보여준다.
This is followed by an explanation of the three constructs.
이후에는 이 세 가지 구성 요소에 대한 설명이 이어진다.
Reviewing the 264 concepts, three ‘actions’ against the ‘areas of data governance’ emerged.
264개의 개념을 검토한 결과, 데이터 거버넌스 영역과 관련된 세 가지 ‘행동’이 도출되었다.
These ‘actions’ indicated the doing of data governance, and were named as follows: 1) define, 2) implement, and 3) monitor.
이 ‘행동’은 데이터 거버넌스를 수행하는 것을 나타내며, 다음과 같이 명명되었다: 1) 정의(define), 2) 구현(implement), 3) 모니터링(monitor).
The researchers found that all the imperative verbs in the concepts could be turned into one of these three actions.
연구자들은 개념에 포함된 모든 명령형 동사가 이 세 가지 행동 중 하나로 변환될 수 있음을 발견하였다.
For example, according to Cheong and Chang (2007 p. 1007), ‘The first step to setting up a formal data governance programme is to determine a Data Governance structure’, in which the verb ‘determine’ can be interpreted as ‘define’.
예를 들어, Cheong과 Chang(2007, p. 1007)에 따르면, ‘공식적인 데이터 거버넌스 프로그램을 설정하는 첫 번째 단계는 데이터 거버넌스 구조를 결정하는 것’이며, 여기서 ‘결정(determine)’이라는 동사는 ‘정의(define)’로 해석될 수 있다.
Another example comes from Weber et al. (2009, p. 4:2): ‘It establishes organisation-wide guidelines and standards,’ in which the verb ‘establish’ can be deemed to mean ‘define’.
또 다른 예로 Weber 외(2009, p. 4:2)의 ‘조직 전체의 지침과 표준을 설정한다’는 문장에서 ‘설정(establish)’이라는 동사는 ‘정의(define)’로 간주될 수 있다.
However, an interpretation of these actions relies upon the context itself.
그러나 이러한 행동의 해석은 맥락 자체에 의존한다.
Therefore, each imperative verb could be interpreted as one of the three actions in one case and to another action in others, such as the verb ‘develop’ in some contexts meaning to ‘define’ and in others can mean ‘implement’.
따라서 명령형 동사는 어떤 경우에는 세 가지 행동 중 하나로, 다른 경우에는 또 다른 행동으로 해석될 수 있다. 예를 들어 ‘개발(develop)’이라는 동사는 어떤 맥락에서는 ‘정의(define)’를 의미할 수 있고, 다른 맥락에서는 ‘구현(implement)’을 의미할 수 있다.
예를 들어, Weber 외(2009, p. 4:6)의 발췌문에서 ‘데이터 거버넌스는 기업 전반의 데이터 정책을 개발하고 구현한다’는 문장에서 ‘개발(develop)’이라는 동사는 ‘정의(define)’를 의미한다.For example, in an excerpt from Weber et al. (2009, p. 4:6), ‘data governance develops and implements corporate-wide data policies,’ the verb ‘develop’ means to ‘define’.
In contrast, in an excerpt from Panian (2010, p. 943), ‘to establish data definitions and taxonomies, define master data, develop enterprise data models,’ the verb ‘develop’ can be interpreted as ‘implement,’ as it is related to implementing a data model.
반면, Panian(2010, p. 943)의 발췌문에서 ‘데이터 정의와 분류 체계를 설정하고, 마스터 데이터를 정의하며, 엔터프라이즈 데이터 모델을 개발한다’는 문장에서 ‘개발(develop)’이라는 동사는 데이터 모델의 구현과 관련이 있으므로 ‘구현(implement)’으로 해석될 수 있다.
Eight ‘areas of governance’ emerged during the comparison procedure for the concepts: 1) data roles and responsibilities, 2) data policies, 3) data processes and procedures, 4) data standards, 5) data strategy, 6) data technologies, 7) data guidelines, and 8) data requirements.
개념 비교 과정에서 여덟 가지 ‘거버넌스 영역’이 도출되었다: 1) 데이터 역할과 책임, 2) 데이터 정책, 3) 데이터 프로세스 및 절차, 4) 데이터 표준, 5) 데이터 전략, 6) 데이터 기술, 7) 데이터 지침, 8) 데이터 요구사항.
Each of the 264 concepts could be placed into one of these areas of governance.
264개의 개념 각각이 이러한 거버넌스 영역 중 하나에 배치될 수 있었다.
The third construct is the ‘decision domain’.
세 번째 구성 요소는 ‘의사결정 영역’이다.
The analysis found that honouring the five decision domains defined by Khatri and Brown (2010) gave in-depth insights into the actual focus of the activity.
분석 결과, Khatri와 Brown(2010)이 정의한 다섯 가지 의사결정 영역을 준수하는 것이 활동의 실제 초점에 대한 심도 있는 통찰을 제공하였다.
However, some of the 264 concepts were reported to cover more than one decision domain, and in some instances all the five decision domains.
그러나 264개의 개념 중 일부는 두 개 이상의 의사결정 영역을 포괄하며, 경우에 따라 다섯 개 의사결정 영역 모두를 포함하기도 한다고 보고되었다.
For example, a concept labelled as ‘define data policies’ without any specified domain was considered to cover all five domains.
예를 들어, 특정 영역이 명시되지 않은 ‘데이터 정책 정의’라는 개념은 다섯 개 영역 모두를 포함하는 것으로 간주되었다.
The illustrative example below shows how the concepts were placed into a category which was considered to be a data governance activity that consisted of the three constructs.
다음 예는 세 가지 구성 요소로 이루어진 데이터 거버넌스 활동으로 간주되는 범주에 개념이 어떻게 배치되었는지를 보여준다.
Wende (2007, p. 417) stated that ‘data governance defines roles, and it assigns responsibilities for decision areas to these roles. It establishes organisation-wide guidelines and standards for DQM.’
Wende(2007, p. 417)는 ‘데이터 거버넌스는 역할을 정의하며, 이 역할에 대한 의사결정 영역의 책임을 할당한다. 이는 DQM에 대한 조직 전반의 지침과 표준을 설정한다’고 언급하였다.
Through coding this excerpt, four concepts emerged, which were placed into categories of data governance activities.
이 발췌문을 코딩하여 네 가지 개념이 도출되었고, 이는 데이터 거버넌스 활동 범주로 배치되었다.
Table 6 illustrates the four concepts and the breakdown of the constructs.
Table 6은 네 가지 개념과 구성 요소의 세부 분류를 보여준다.
During the comparison procedure, using the schema outlined in Table 6, the 264 concepts were reduced to 110 data governance activities as categories.
Table 6에 요약된 스키마를 사용하여 비교 절차를 수행하는 동안, 264개의 개념이 110개의 데이터 거버넌스 활동으로 범주화되었다.
Table 7 illustrates the results of the open coding analysis, including the frequency of the ‘areas of data governance’ under each respective ‘action’ across the five ‘decision domains’ that emerged during the open coding process.
Table 7은 개방형 코딩 과정에서 도출된 다섯 가지 ‘의사결정 영역’ 전반에 걸친 각각의 ‘행동’ 하에서 ‘데이터 거버넌스 영역’의 빈도를 포함하는 개방형 코딩 분석 결과를 보여준다.
In the event that a paper mentioned an activity more than once, the frequency was noted as one, unless that same area was mentioned with different actions or associated with another decision domain.
논문에서 동일한 활동이 여러 번 언급된 경우, 동일한 영역이 다른 행동과 함께 언급되거나 다른 의사결정 영역과 연결되지 않는 한, 빈도는 한 번으로 기록되었다.
Our analysis shows that the highest frequency count for the ‘areas of data governance’ is against the ‘define’ action, specifically, definitions of the data roles and responsibilities, data policies, data processes and procedures, and data standards.
우리의 분석에 따르면, 데이터 거버넌스 영역에서 가장 높은 빈도를 보인 행동은 ‘정의(define)’로, 특히 데이터 역할과 책임, 데이터 정책, 데이터 프로세스 및 절차, 데이터 표준의 정의와 관련이 있다.
The definition of the data quality decision domain is also the highest frequency count.
데이터 품질 의사결정 영역의 정의 또한 가장 높은 빈도를 기록했다.
This is not surprising as data governance is often cited as the key aspect of data governance.
이는 데이터 거버넌스가 데이터 거버넌스의 핵심 요소로 자주 언급되기 때문에 놀라운 결과는 아니다.
In contrast, ‘metadata’ has the lowest frequency count, which suggests that a ‘how data is interpreted’ mindset has not received as much coverage in the academic literature to date.
반면, ‘메타데이터’는 가장 낮은 빈도를 기록했으며, 이는 ‘데이터가 어떻게 해석되는가’라는 사고방식이 학술 문헌에서 아직 충분히 다뤄지지 않았음을 시사한다.
Our analysis also points to a low frequency for ‘implement’ and ‘monitor’ actions. This could indicate a lack of maturity around data governance in practice which penetrates through to our research activities to date, where the majority of the papers are focusing only on the ‘define’ action of the data governance areas.
우리의 분석은 ‘구현(implement)’과 ‘모니터링(monitor)’ 행동의 빈도가 낮다는 점도 지적한다. 이는 데이터 거버넌스가 실무적으로 성숙하지 않았음을 나타낼 수 있으며, 현재까지의 연구 활동에서도 데이터 거버넌스 영역의 ‘정의’ 행동에만 주로 초점이 맞춰져 있음을 보여준다.
Although a ‘define’ action can be considered as a primary action of data governance areas, ‘implement’ and ‘monitor’ should also play an important role in data governance.
‘정의’ 행동이 데이터 거버넌스 영역의 주요 행동으로 간주될 수 있지만, ‘구현’과 ‘모니터링’ 역시 데이터 거버넌스에서 중요한 역할을 해야 한다.
For example, in terms of ‘data processes and procedures’ activities, a small number of papers explicitly mention implementing and monitoring data processes and procedures. However, embedding and controlling data governance processes and procedures in any system should be considered fundamental to a data governance programme in order to make sure these processes and procedures are followed.
예를 들어, ‘데이터 프로세스 및 절차’ 활동의 경우, 데이터를 구현하고 모니터링하는 활동을 명시적으로 언급한 논문은 소수에 불과하다. 하지만 데이터 거버넌스 프로세스와 절차를 시스템에 통합하고 제어하는 것은 이러한 프로세스와 절차가 준수되도록 보장하기 위해 데이터 거버넌스 프로그램의 기본 요소로 간주되어야 한다.
In addition, defining data technologies as an activity for doing data governance has received an acceptable level of attention, specifically for the data life cycle decision domain.
추가적으로, 데이터 거버넌스를 수행하기 위한 활동으로 데이터 기술을 정의하는 것은 특히 데이터 라이프사이클 의사결정 영역에서 적절한 수준의 주목을 받았다.
However, none of the papers considers monitoring data technologies, which, from our point of view, is a shortcoming in the research, as it is critical to monitor the activities related to data technologies in order to manage a data governance programme successfully.
그러나 데이터 기술을 모니터링하는 활동을 다룬 논문은 없었으며, 이는 데이터 거버넌스 프로그램을 성공적으로 관리하기 위해 데이터 기술과 관련된 활동을 모니터링하는 것이 중요하다는 점에서 연구의 한계로 간주된다.
Finally, defining, implementing, and monitoring data roles and responsibilities across all the decision domains as a data governance activity has received a high level of attention.
마지막으로, 모든 의사결정 영역에서 데이터 역할과 책임을 정의하고, 구현하며, 모니터링하는 활동은 데이터 거버넌스 활동으로 높은 수준의 관심을 받았다.
Returning to the definition of data governance, this is about assigning decision-related rights and duties for handling the data in an organisation.
데이터 거버넌스의 정의로 돌아가 보면, 이는 조직 내 데이터를 처리하기 위한 의사결정 관련 권리와 의무를 할당하는 것이다.
Therefore, our analysis supports that actions related to data roles and responsibilities for all the decision domains should be viewed as the primary activity when considering doing data governance.
따라서, 우리의 분석은 모든 의사결정 영역에 걸쳐 데이터 역할과 책임과 관련된 행동이 데이터 거버넌스를 수행할 때 주요 활동으로 간주되어야 함을 뒷받침한다.
Research in the data governance domain is growing in IS, as is the need for research in this area as more organisations consider data as a valuable asset.
정보 시스템(IS) 분야에서 데이터 거버넌스 영역의 연구는 성장하고 있으며, 점점 더 많은 조직이 데이터를 가치 있는 자산으로 간주함에 따라 이 분야의 연구 필요성도 증가하고 있다.
A review of the data governance literature shows that there is a lack of research that explicitly studies activities for governing data.
데이터 거버넌스 문헌 검토 결과, 데이터를 관리하기 위한 활동을 명시적으로 연구한 논문이 부족하다는 점이 드러났다.
Nevertheless, there is some research that contributes to our understanding of data governance through modelling (see Khatri & Brown, 2010; Otto, 2011b; Tallon et al., 2013).
그럼에도 불구하고, 모델링을 통해 데이터 거버넌스에 대한 이해를 돕는 일부 연구가 존재한다(Khatri & Brown, 2010; Otto, 2011b; Tallon 외, 2013 참조).
These studies reveal some progress in exploring the activities that are required for governing data.
이들 연구는 데이터를 관리하기 위해 필요한 활동을 탐구하는 데 있어 일부 진전을 보여준다.
This research study identified and analysed 31 peer-reviewed papers that focus on data governance activities.
본 연구는 데이터 거버넌스 활동에 초점을 맞춘 31편의 동료 검토 논문을 식별하고 분석하였다.
Using a systematic approach through eight steps adopted from Finney and Corbett (2007), the selection process yielded 230 papers that were subject to selection and exclusion criteria, which led to the exclusion of 171.
Finney와 Corbett(2007)에서 채택된 8단계의 체계적인 접근법을 사용하여, 선정 과정에서 230편의 논문이 검토되었고, 이 중 171편이 제외 기준에 따라 제외되었다.
Following a more in-depth review of the remaining 59 papers, 31 were found to serve the research purpose explicitly.
나머지 59편의 논문에 대한 보다 심층적인 검토를 거친 결과, 31편이 연구 목적에 부합하는 것으로 확인되었다.
These 31 papers were analysed using an open coding analysis technique suggested by Corbin and Strauss (1990).
이 31편의 논문은 Corbin과 Strauss(1990)가 제안한 개방형 코딩 분석 기법을 사용하여 분석되었다.
This technique was selected to conduct an in-depth content analysis of the data governance activities mentioned in these papers.
이 기법은 논문에서 언급된 데이터 거버넌스 활동에 대한 심층적인 내용 분석을 수행하기 위해 선택되었다.
This research has two key limitations.
본 연구에는 두 가지 주요 한계가 있다.
Firstly, the focus of the research was only on peer-reviewed academic literature in the data governance area, ignoring practitioners’ publications specifically.
첫째, 연구 초점이 데이터 거버넌스 분야의 동료 검토 학술 문헌에만 맞춰져 있으며, 실무자들의 출판물을 특정적으로 제외하였다.
Institutions such as DAMA and The Data Warehousing Institute (TDWI) may provide further insight into data governance programmes from a practitioner perspective, and future research may highlight differences in theory and practice (DAMA International, 2009).
DAMA와 데이터웨어하우징연구소(TDWI)와 같은 기관은 실무적 관점에서 데이터 거버넌스 프로그램에 대한 추가적인 통찰을 제공할 수 있으며, 향후 연구는 이론과 실무의 차이를 조명할 수 있다(DAMA International, 2009).
Secondly, the research presented in this paper concluded with a frequency count of data governance activities.
둘째, 본 논문에서 제시된 연구는 데이터 거버넌스 활동의 빈도 계산으로 결론을 내렸다.
There was no detailed description for each of the 110 activities identified in this paper due to page length limitations.
페이지 길이 제한으로 인해, 본 논문에서 식별된 110개의 활동 각각에 대한 상세한 설명이 포함되지 않았다.
Finally, as recommendations for further research in the area of data governance activities, the above resulting activities should be validated by conducting field studies, as well as being described in greater detail, in order to be more valuable for researchers as well as practitioners.
마지막으로, 데이터 거버넌스 활동 영역의 후속 연구를 위한 제언으로, 위에서 도출된 활동은 현장 연구를 통해 검증되고 보다 상세하게 기술되어야 하며, 이는 연구자와 실무자 모두에게 더 큰 가치를 제공할 수 있을 것이다.
The results also, as discussed earlier, reflect the lack of research in the ‘implement’ and ‘monitor’ actions of the different data governance areas.
또한, 앞서 논의된 바와 같이, 결과는 데이터 거버넌스의 다양한 영역에서 ‘구현’ 및 ‘모니터링’ 활동에 대한 연구 부족을 반영하고 있다.
Therefore, it is suggested that researchers in the domain of data governance focus more on the data governance activities related to implementing and monitoring over defining.
따라서 데이터 거버넌스 분야의 연구자들은 정의하는 것보다 구현하고 모니터링하는 데이터 거버넌스 활동에 더 초점을 맞출 것을 제안한다.