Janssen, Marijn, et al. (2020)
Janssen, Marijn, et al. "Data governance: Organizing data for trustworthy Artificial Intelligence." Government information quarterly 37.3 (2020): 101493.
https://www.sciencedirect.com/science/article/abs/pii/S0740624X20302719
The rise of Big, Open and Linked Data (BOLD) enables Big Data Algorithmic Systems (BDAS) which are often based on machine learning, neural networks, and other forms of Artificial Intelligence (AI).
빅 데이터, 공개 데이터, 연결된 데이터(BOLD)의 부상은 머신러닝, 신경망, 기타 인공지능(AI) 기술에 기반을 둔 빅 데이터 알고리즘 시스템(BDAS)의 발전을 가능하게 한다.
As such systems are increasingly requested to make decisions that are consequential to individuals, communities, and society at large, their failures cannot be tolerated, and they are subject to stringent regulatory and ethical requirements.
이러한 시스템들이 점점 더 개인, 공동체, 그리고 사회 전체에 중대한 영향을 미치는 결정을 내리도록 요구됨에 따라, 시스템의 실패는 용납될 수 없으며, 엄격한 규제 및 윤리적 요건을 충족해야 한다.
However, they all rely on data which is not only big, open, and linked but varied, dynamic, and streamed at high speeds in real-time.
하지만 이러한 시스템은 크고, 공개적이며, 연결된 데이터에만 의존하지 않고, 다양한 형태로 변화하며 실시간으로 빠르게 스트리밍되는 데이터에도 의존한다.
To overcome such challenges and utilize opportunities for BDAS, organizations are increasingly developing advanced data governance capabilities.
이러한 도전 과제를 극복하고 BDAS의 기회를 활용하기 위해, 조직들은 점점 더 고급 데이터 거버넌스 역량을 개발하고 있다.
This paper reviews challenges and approaches to data governance for such systems, and proposes a framework for data governance for trustworthy BDAS.
이 논문은 이러한 시스템을 위한 데이터 거버넌스의 도전 과제와 접근 방식을 검토하며, 신뢰할 수 있는 BDAS를 위한 데이터 거버넌스 프레임워크를 제안한다.
The framework promotes the stewardship of data, processes and algorithms, the controlled opening of data and algorithms to enable external scrutiny, trusted information sharing within and between organizations, risk-based governance, system-level controls, and data control through shared ownership and self-sovereign identities.
이 프레임워크는 데이터, 프로세스 및 알고리즘의 관리, 외부 검토를 가능하게 하는 데이터 및 알고리즘의 통제된 공개, 조직 내부 및 조직 간 신뢰할 수 있는 정보 공유, 리스크 기반 거버넌스, 시스템 수준의 통제, 그리고 공유 소유권 및 자기주권 신원을 통한 데이터 통제를 촉진한다.
The framework is based on 13 design principles and is proposed incrementally, for a single organization and multiple networked organizations.
이 프레임워크는 13개의 설계 원칙에 기반하며, 단일 조직과 다중 네트워크 조직을 대상으로 점진적으로 제안된다.
Keywords: Big data, Data governance, AI, Algorithmic governance, Information sharing, Artificial Intelligence, Trusted frameworks
키워드: 빅 데이터, 데이터 거버넌스, AI, 알고리즘 거버넌스, 정보 공유, 인공지능, 신뢰 프레임워크
Organizations in general, and public sector organizations in particular, increasingly collect and use Big and Open Linked Data (BOLD) (Janssen, Matheus, & Zuiderwijk, 2015).
일반 조직, 특히 공공 부문 조직은 빅 데이터와 공개된 연결 데이터(BOLD)를 점점 더 많이 수집하고 활용하고 있다 (Janssen, Matheus, & Zuiderwijk, 2015).
The rise of BOLD, combined with machine learning and other forms of Artificial Intelligence (AI), results in the increasing use of Big Data Algorithmic Systems (BDAS).
BOLD의 부상은 머신러닝 및 기타 형태의 인공지능(AI)과 결합되어 빅 데이터 알고리즘 시스템(BDAS)의 활용을 증가시킨다.
Such systems are used to make decisions about: access to affordable loans amid the shortage of credit files; matching of skills and jobs to promote access to employment; implementing admission to schools while helping individuals choose the right school; and mitigating risks of disparities in the treatment of individuals by law enforcement while helping build trust between the public and law enforcement (Executive Office of the President, 2016).
이러한 시스템은 신용 기록 부족 속에서 저렴한 대출 접근성, 기술과 직업 매칭을 통해 고용 기회를 촉진하고, 학교 입학을 구현하며 개인이 적합한 학교를 선택하도록 돕고, 법 집행에 의한 개인 대우의 격차를 줄이는 동시에 대중과 법 집행 간의 신뢰를 구축하는 데 활용된다 (Executive Office of the President, 2016).
The use of BDAS for improving and opening government is met with a lot of enthusiasm.
BDAS를 통한 정부 개선 및 개방은 많은 기대를 받고 있다.
However, BDAS rely heavily on the use of data combined from various sources, some controlled by the organization itself, others controlled by partner organizations, yet others controlled by unknown entities.
그러나 BDAS는 여러 출처에서 결합된 데이터에 크게 의존하며, 일부는 조직 자체에서, 일부는 파트너 조직에서, 또 일부는 알 수 없는 주체에서 통제된다.
Without control over such data to ensure quality and compliance, BDAS would be too risky to be entrusted with consequential decisions.
이러한 데이터의 품질과 준수를 보장하기 위한 통제가 없다면, BDAS는 중대한 결정을 맡기기에는 지나치게 위험할 것이다.
Therefore, many organizations are turning to data governance as a means to exercise control over the quality of their data and over compliance with relevant legal and ethical requirements in order to guarantee the delivery of trustworthy decisions.
따라서 많은 조직이 데이터의 품질과 관련 법적 및 윤리적 요구사항 준수를 통제하여 신뢰할 수 있는 결정을 보장하기 위한 수단으로 데이터 거버넌스를 채택하고 있다.
The concept of trustworthiness, which can be directly controlled or indirectly influenced (Yang & Anguelov, 2013), refers to properties through which a trusted entity is serving the interests of the trustor (Levi & Stoker, 2000).
직접적으로 통제되거나 간접적으로 영향을 받을 수 있는 신뢰성 개념(Yang & Anguelov, 2013)은 신뢰받는 주체가 신뢰자(trustor)의 이익을 제공하는 속성을 의미한다 (Levi & Stoker, 2000).
In the situation under study, the trustor (an organization) entrusts its system (BDAS, which itself uses BOLD and AI) in making sound decisions.
연구 중인 상황에서 신뢰자(조직)는 시스템(BDAS, BOLD 및 AI를 활용하는)을 신뢰하며 올바른 결정을 내리는 역할을 맡긴다.
Data governance is about allocating authority and control over data (Brackett & Earley, 2009) and the exercise of such authority through decision-making in data-related matters (Plotkin, 2013).
데이터 거버넌스는 데이터에 대한 권한과 통제를 할당하고(Brackett & Earley, 2009), 데이터 관련 사안에서 의사결정을 통해 이러한 권한을 행사하는 것을 의미한다(Plotkin, 2013).
To fulfil its goals, data governance should focus not just on data, but on the systems through which data is collected, managed, and used.
데이터 거버넌스의 목표를 달성하려면 데이터뿐만 아니라 데이터를 수집, 관리, 사용하게 하는 시스템에도 초점을 맞춰야 한다.
Specifically, people are essential in these systems (Benfeldt, Persson, & Madsen, 2020); thus, data governance should provide incentives and sanctions to stimulate desirable behavior of the persons involved in collecting, managing, and using data.
특히, 이러한 시스템에서 사람은 필수적이며(Benfeldt, Persson, & Madsen, 2020), 따라서 데이터 거버넌스는 데이터를 수집, 관리, 사용하는 과정에 참여하는 사람들의 바람직한 행동을 유도하기 위해 인센티브와 제재를 제공해야 한다.
Beyond a single organization, data governance depends on collaboration between organizations and persons that make up the system.
단일 조직을 넘어, 데이터 거버넌스는 시스템을 구성하는 조직과 개인 간의 협업에 의존한다.
This multi-organizational context requires trusted frameworks to ensure reliable data-sharing between all organizations involved, that the right data is securely and reliably shared between participating organizations, while complying with General Data Protection Regulation (GDPR) (European Parliament and European Council, 2016) and other relevant laws and regulations.
이 다중 조직 맥락에서는 참여 조직 간에 적합한 데이터를 안전하고 신뢰할 수 있게 공유하고, 이를 통해 모든 조직 간의 신뢰할 수 있는 데이터 공유를 보장하는 신뢰 프레임워크가 필요하며, 이는 GDPR(European Parliament and European Council, 2016) 및 기타 관련 법규를 준수해야 한다.
Consistent with this context, we define data governance as :
이러한 맥락에 따라 데이터 거버넌스를 다음과 같이 정의한다:
Organizations and their personnel defining, applying, and monitoring the patterns of rules and authorities for directing the proper functioning of, and ensuring the accountability for, the entire life-cycle of data and algorithms within and across organizations.
조직과 그 구성원이 데이터와 알고리즘의 전체 라이프사이클에 걸쳐 적절한 기능을 유도하고 책임을 보장하기 위한 규칙과 권한의 패턴을 정의하고 적용하며 모니터링하는 것.
This definition takes into account both data and data processing by AI and other algorithms, considers that both data and algorithms change during their respective life-cycles, accounts for the personnel responsible for creating and using data and algorithms, and adopts a systems (multi-organizational) view.
이 정의는 데이터와 AI 및 기타 알고리즘에 의한 데이터 처리를 모두 고려하며, 데이터와 알고리즘이 각각의 라이프사이클 동안 변화한다는 점, 데이터를 생성하고 사용하는 데 책임이 있는 인원을 포함하고 있으며, 시스템(다중 조직) 관점을 채택한다.
Data governance is a success factor for BDAS (Brous, Janssen, & Krans, 2020) and has an overall positive effect on the performance of organizations that apply BDAS (Zhang, Zhao, & Kumar, 2016).
데이터 거버넌스는 BDAS 성공의 주요 요인이며(Brous, Janssen, & Krans, 2020), BDAS를 적용하는 조직의 성과에 전반적으로 긍정적인 영향을 미친다(Zhang, Zhao, & Kumar, 2016).
The purpose is to increase the value of data and minimize data-related costs and risks (Abraham, Schneider, & vom Brocke, J., 2019).
그 목적은 데이터의 가치를 높이고 데이터 관련 비용과 위험을 최소화하는 것이다(Abraham, Schneider, & vom Brocke, J., 2019).
Given the consequential and repetitive nature of the BDAS decision-making, mistakes in data governance that affect the working of such systems can have profound legal, financial, and social implications on the organizations involved, citizens and businesses, and society at large.
BDAS의 결정이 중대하고 반복적인 특성을 고려할 때, 데이터 거버넌스에서 발생한 실수는 관련 조직, 시민 및 기업, 그리고 전체 사회에 심각한 법적, 재정적, 사회적 영향을 미칠 수 있다.
Such mistakes can result in systemic bias, unlawful decisions, large financial exposures, political crises, lives lost, or any combination thereof.
이러한 실수는 체계적 편향, 불법적 결정, 대규모 재정적 손실, 정치적 위기, 생명 손실 또는 이 모든 요소의 조합으로 이어질 수 있다.
In the interconnected world, where data is collected by (and about) governments, businesses, and citizens, and is processed by different entities using various algorithms, dependencies grow, mistakes accumulate, and accountability is gradually lost in the process.
데이터가 정부, 기업, 시민에 의해(또는 이들에 대해) 수집되고, 다양한 알고리즘을 사용하는 여러 주체에 의해 처리되는 상호 연결된 세계에서는, 의존성이 커지고, 실수가 축적되며, 책임성이 점차 상실된다.
The rationale outlined above directly leads to the goal of this article.
위에서 설명한 논리는 이 논문의 목표로 직접적으로 이어진다.
The goal is threefold.
목표는 세 가지로 구성된다.
First, to define and conceptualize data governance for AI-based BDAS.
첫째, AI 기반 BDAS를 위한 데이터 거버넌스를 정의하고 개념화하는 것이다.
Second, to review the challenges and approaches to such governance.
둘째, 이러한 거버넌스의 도전 과제와 접근 방식을 검토하는 것이다.
Third, to propose the concept of trusted AI-based BDAS and a framework for data governance for such systems.
셋째, 신뢰할 수 있는 AI 기반 BDAS의 개념과 그러한 시스템을 위한 데이터 거버넌스 프레임워크를 제안하는 것이다.
The rest of the article is structured as follows.
논문의 나머지 구조는 다음과 같다.
Section 2 introduces the concept of data governance, followed by data governance for AI-based BDAS.
2장은 데이터 거버넌스의 개념을 소개한 후, AI 기반 BDAS를 위한 데이터 거버넌스를 다룬다.
Different forms of data governance for AI-based BDAS are outlined in Section 3.
3장에서는 AI 기반 BDAS를 위한 데이터 거버넌스의 다양한 형태를 설명한다.
Section 4 formulates the main proposal: trusted AI-based BDAS and a data governance framework for such systems.
4장에서는 주요 제안을 구성하며, 신뢰할 수 있는 AI 기반 BDAS와 그러한 시스템을 위한 데이터 거버넌스 프레임워크를 제시한다.
The proposal consists of: system-level governance model of BDAS in Section 4.1, data stewardship and base registries as the foundation for data governance in Section 4.2, and the trusted framework and self-sovereign identities for data sharing in Section 4.3.
제안은 4.1장에서 BDAS의 시스템 수준 거버넌스 모델, 4.2장에서 데이터 거버넌스를 위한 기반으로서의 데이터 관리 및 기본 레지스트리, 그리고 4.3장에서 데이터 공유를 위한 신뢰 프레임워크 및 자기주권 신원으로 구성된다.
Finally, essential data governance principles are outlined in Section 5.
마지막으로, 5장에서 데이터 거버넌스의 필수 원칙을 설명한다.
Data governance has been given scant attention and is often overlooked by organizations in their efforts to realize BDAS and create Fair, Accountable and Transparent (FAT) algorithms.
데이터 거버넌스는 BDAS를 구현하고 공정성(Fairness), 책임성(Accountability), 투명성(Transparency)을 갖춘 알고리즘(FAT 알고리즘)을 만들려는 조직의 노력 속에서 거의 주목받지 못하고 간과되는 경우가 많다.
Often the focus is on experimenting with AI, but acquiring and preparing data for AI, which often consumes most of the time, is given less consideration.
대개 AI 실험에 중점을 두지만, 대부분의 시간을 소비하는 AI를 위한 데이터 획득과 준비는 상대적으로 덜 고려된다.
However, the ubiquitous nature of data, when using large volumes and varieties of data from multiple sources, the uncertain impact of data flows on data quality, and lack of awareness about the importance of data quality, all complicate governance.
그러나 데이터의 편재적 특성, 여러 출처에서 나온 대량의 다양한 데이터를 사용할 때 데이터 흐름이 데이터 품질에 미치는 불확실한 영향, 그리고 데이터 품질 중요성에 대한 인식 부족은 거버넌스를 더욱 복잡하게 만든다.
Data quality consists of many dimensions including accuracy, timeliness, completeness, consistency, objectivity, believability, and relevance, which all determine whether data is fit for use (Strong, Lee, & Wang, 1997).
데이터 품질은 정확성, 적시성, 완전성, 일관성, 객관성, 신뢰성, 관련성 등 여러 차원으로 구성되며, 이는 모두 데이터가 활용 가능 여부를 결정하는 요소들이다(Strong, Lee, & Wang, 1997).
Data collection and sharing has become easier over the last decade, partly due to interoperability solutions.
지난 10년간 상호운용성 솔루션 덕분에 데이터 수집 및 공유가 한층 용이해졌다.
However, interoperability also facilitates inaccurate data to flow smoothly across systems and contaminate them in an exponential manner (Dasu, 2013).
그러나 상호운용성은 부정확한 데이터가 시스템 간에 원활히 흐르고 이를 기하급수적으로 오염시키는 것을 촉진하기도 한다(Dasu, 2013).
The same technological advancements, with data collected from heterogeneous resources, stored in various ways and having different qualities, make data types and structures increasingly complex (Dasu, 2013).
이와 같은 기술 발전은 이질적인 자원에서 수집되고, 다양한 방식으로 저장되며, 품질이 다른 데이터를 포함하면서 데이터 유형과 구조를 점점 더 복잡하게 만든다(Dasu, 2013).
Besides, vast volumes of data complicate entity resolution – identifying the same real-world entity like, e.g., a person, within a single database (de-duplication) or in multiple databases (record linkage).
또한 방대한 데이터 양은 동일한 실제 엔터티를 식별하는 문제를 복잡하게 하며, 예를 들어, 단일 데이터베이스 내에서의 중복 제거(de-duplication) 또는 여러 데이터베이스 간의 기록 연결(record linkage)을 어렵게 한다.
Furthermore, even if accurate data is stored, data glitches may produce inaccuracies over time.
더 나아가, 정확한 데이터가 저장되더라도 시간이 지남에 따라 데이터 오류로 인해 부정확성이 발생할 수 있다.
These glitches originate from changes in the environment, which produce discrepancies between the reality and how data captures this reality, e.g., after the change of the residential address, the old address remains on record.
이러한 오류는 환경 변화로 인해 발생하며, 현실과 데이터가 이를 반영하는 방식 간의 불일치를 초래한다. 예를 들어, 거주지 주소가 변경된 후에도 이전 주소가 기록에 남아 있는 경우가 있다.
Hence, high levels of information quality are hard to achieve.
따라서 높은 수준의 정보 품질을 달성하기는 어렵다.
While most government organizations recognize today that data is crucial, the creation of a culture which treats data as an asset and which helps public servants make data-driven decisions is challenging (Benfeldt et al., 2020).
대부분의 정부 조직이 오늘날 데이터를 중요한 자산으로 인식하고 있지만, 데이터를 자산으로 간주하며 공무원들이 데이터 기반 결정을 내릴 수 있도록 돕는 문화를 조성하는 것은 여전히 어렵다(Benfeldt et al., 2020).
While data governance should help lower the cost of data management and create value from data, data is often fragmented over many organizations which implement different data policies.
데이터 거버넌스는 데이터 관리 비용을 줄이고 데이터로부터 가치를 창출하는 데 도움을 줘야 하지만, 데이터는 종종 다양한 데이터 정책을 실행하는 여러 조직에 걸쳐 분산되어 있다.
This can result in unclear responsibility, diffused accountability, and unknown data quality, which, in turn, might undermine the fitness-to-use of such data within BDAS.
이로 인해 책임이 불분명하고, 책임성이 분산되며, 데이터 품질이 불확실해질 수 있으며, 이는 결국 BDAS 내에서 이러한 데이터의 활용 가능성을 저해할 수 있다.
BDAS, and the AI algorithms embedded in them, are increasingly used to make consequential decisions.
BDAS와 그 안에 내장된 AI 알고리즘은 점점 더 중요한 결정을 내리는 데 사용되고 있다.
However, such decisions may be incorrect, and responsibility for this may be challenging to determine.
그러나 이러한 결정이 잘못될 수 있으며, 이에 대한 책임 소재를 결정하기는 어렵다.
Low data quality and unclear dependencies between data and algorithms can easily bias or skew the outcomes of the AI algorithms.
낮은 데이터 품질과 데이터 및 알고리즘 간의 불분명한 의존성은 AI 알고리즘의 결과를 쉽게 편향시키거나 왜곡시킬 수 있다.
Shared roles and joint operations performed among departments and organizations may dilute responsibilities.
부서 및 조직 간에 수행되는 역할 공유와 공동 작업은 책임을 희석시킬 수 있다.
For instance, who is responsible when an algorithm provides wrong outputs due to anomalies in data collected through multiple sensors?
예를 들어, 여러 센서를 통해 수집된 데이터의 이상으로 인해 알고리즘이 잘못된 결과를 제공할 경우, 책임은 누구에게 있는가?
The causal relationship between an event and a system failure might be difficult to establish without proper data governance.
적절한 데이터 거버넌스가 없으면 사건과 시스템 오류 간의 인과 관계를 확립하기 어려울 수 있다.
While applying BDAS in consequential decision-making is conditional on data quality, perfect data quality does not exist.
BDAS를 중요한 의사결정에 적용하는 것은 데이터 품질에 달려 있지만, 완벽한 데이터 품질은 존재하지 않는다.
On one side, data providers can argue that data quality never reaches 100% and even include such arguments in data usage agreements.
한편으로는 데이터 제공자가 데이터 품질이 결코 100%에 도달하지 않는다고 주장하며 이를 데이터 사용 계약에 포함시킬 수도 있다.
On another, the BDAS operators might blame poor data quality for arriving at wrong decisions.
반면에 BDAS 운영자는 잘못된 결정의 원인을 낮은 데이터 품질로 돌릴 수 있다.
This raises the challenge of defining and sharing responsibilities between data providers, algorithms providers, and BDAS operators as part of data governance, particularly when multiple organizations engage in such governance jointly.
이 문제는 데이터 제공자, 알고리즘 제공자, 그리고 BDAS 운영자 간의 책임을 정의하고 공유하는 것에 대한 도전을 야기하며, 특히 여러 조직이 공동으로 데이터 거버넌스에 참여할 때 이러한 문제가 더욱 부각된다.
Yet there is limited understanding of what constitutes data governance for BDAS in general and AI-based BDAS in particular, even less how to carry out system-level data governance, between different organizations.
그러나 BDAS 전반에 걸친 데이터 거버넌스와 특히 AI 기반 BDAS의 데이터 거버넌스가 무엇을 구성하는지에 대한 이해가 제한적이며, 서로 다른 조직 간에 시스템 수준의 데이터 거버넌스를 수행하는 방법에 대한 이해는 더욱 부족하다.
Terminologically, the terms governing, governance, and management are all different.
용어적으로, 통치(governing), 거버넌스(governance), 그리고 관리(management)는 모두 서로 다른 의미를 가진다.
Governance is the organizing logic through which the management of data – collection, storage, processing, using, sharing, and destroying – takes place.
거버넌스는 데이터의 관리, 즉 데이터의 수집, 저장, 처리, 사용, 공유, 삭제가 이루어지는 조직적 논리를 의미한다.
Governing comprises activities conducted to create and execute this logic.
통치는 이 논리를 생성하고 실행하기 위해 수행되는 활동을 포함한다.
These include not only the management of data but also decisions made over data: who can make such decisions and therefore influence how data is accessed, controlled, used, and benefited from (Khatri & Brown, 2010), and how data can be used (or potentially used) and by whom.
이는 데이터의 관리뿐만 아니라 데이터에 대한 의사결정을 포함하며, 누가 이러한 결정을 내릴 수 있는지와 따라서 데이터에 어떻게 접근, 통제, 사용, 활용할 수 있는지에 영향을 미치는 방식을 포함한다(Khatri & Brown, 2010).
The scope of usage decisions is essential as they determine what is expected from data governance.
데이터 거버넌스에서 기대되는 것을 결정하는 데 있어 사용 의사결정의 범위는 매우 중요하다.
In any case, designing data governance requires stepping back from the daily routine (Khatri & Brown, 2010).
어쨌든 데이터 거버넌스를 설계하려면 일상적인 루틴에서 벗어나야 한다(Khatri & Brown, 2010).
Conceptually, it transpires that data governance is the exercise of authority and control over the management of data (Brackett & Earley, 2009, p. 19).
개념적으로 데이터 거버넌스는 데이터 관리에 대한 권한과 통제를 행사하는 것을 의미한다(Brackett & Earley, 2009, p. 19).
It can also be viewed as “the exercise of decision-making and authority for data-related matters.
이는 데이터와 관련된 사안에서 의사결정과 권한 행사의 과정으로 볼 수도 있다.
It is a system of decision rights and accountabilities for information-related processes, executed according to the agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods” (Plotkin, 2013, pp. 1–2).
이는 정보 관련 프로세스에 대한 의사결정 권리와 책임 체계로, 합의된 모델에 따라 누가, 어떤 정보로, 어떤 행동을 언제, 어떤 상황에서, 어떤 방법으로 수행할 수 있는지를 기술한 것이다(Plotkin, 2013, pp. 1–2).
Thus the goals of data governance are ensuring the quality and proper use of data, meeting compliance requirements, and helping utilize data to create public value.
따라서 데이터 거버넌스의 목표는 데이터의 품질과 적절한 사용을 보장하고, 준수 요구사항을 충족하며, 데이터를 활용하여 공공 가치를 창출하는 데 기여하는 것이다.
Fulfilling these goals requires mechanisms for personal data protection, security, non-discrimination, and equal treatment; covering the entire life-cycle from creating, to processing, sharing, and destroying data; and addressing technical, institutional, and social implications of data sharing.
이러한 목표를 달성하려면 개인 데이터 보호, 보안, 차별 금지 및 평등한 대우를 위한 메커니즘이 필요하며, 데이터 생성, 처리, 공유, 삭제에 이르는 전체 라이프사이클을 포함해야 하고, 데이터 공유의 기술적, 제도적, 사회적 영향을 다루어야 한다.
Data governance is exercised through policies, incentives, and sanctions, as needed to create an organizational culture where data is treated as an asset, and behavior that supports or violates this treatment is rewarded or sanctioned respectively.
데이터 거버넌스는 데이터가 자산으로 간주되는 조직 문화를 조성하기 위해 필요에 따라 정책, 인센티브, 제재를 통해 실행되며, 이러한 문화를 지원하거나 위반하는 행동에 대해 각각 보상하거나 제재를 가한다.
Data governance includes: standardizing data – creating metadata to be able to integrate datasets and ensure the same interpretation of data; allocating relevant procedures and decision authorities to ensure data stewardship and data quality; monitoring data usage, e.g., ensuring risk assessment before using data to carry out consequential decisions; and monitoring such systems as part of the data life-cycle.
데이터 거버넌스는 다음을 포함한다: 데이터를 통합하고 데이터에 대한 동일한 해석을 보장하기 위한 메타데이터 생성 및 데이터 표준화, 데이터 관리를 위한 적절한 절차와 의사결정 권한 할당, 데이터 활용 위험 평가를 포함한 데이터 사용 모니터링, 그리고 데이터 라이프사이클의 일환으로 시스템을 모니터링하는 것이다.
A common challenge with data governance is that the data flow and logic may not follow the structure of an organization.
데이터 거버넌스에서 흔히 발생하는 문제는 데이터 흐름과 논리가 조직 구조를 따르지 않을 수 있다는 것이다.
The mismatch between organizational structure and data usage can easily result in data silos, duplications, unclear responsibilities, and missing control of data over its entire life-cycle.
조직 구조와 데이터 사용 간의 불일치는 쉽게 데이터 사일로, 중복, 불분명한 책임, 데이터 전체 라이프사이클에 대한 통제 누락으로 이어질 수 있다.
This is particularly the case for BDAS, which are typically crossing departmental boundaries, not bound to any single function or process, and have to deal with data originating in multiple departmental silos.
이는 특히 BDAS에서 두드러지며, BDAS는 일반적으로 부서 경계를 넘나들고, 단일 기능이나 프로세스에 국한되지 않으며, 여러 부서의 사일로에서 기원하는 데이터를 처리해야 한다.
Numerous challenges arise in this scenario.
이러한 시나리오에서는 여러 가지 문제가 발생한다.
There might be a lack of established mechanisms for data governance for dealing with BDAS while involving various organizations.
다양한 조직이 참여하는 BDAS를 다루기 위한 데이터 거버넌스 메커니즘이 확립되어 있지 않을 수 있다.
Another is ad-hoc handling of data without procedures and secure data infrastructure, which might easily result in individual data items being accessible to non-authorized persons.
또 다른 문제는 절차와 안전한 데이터 인프라 없이 데이터를 임시로 처리하는 것으로, 이는 쉽게 비인가자가 개별 데이터 항목에 접근할 수 있게 만든다.
Given such challenges, the choice of the data governance approach is critical, albeit this choice is not always clear or even explicit (Koltay, 2016).
이러한 도전 과제를 고려할 때 데이터 거버넌스 접근 방식을 선택하는 것은 매우 중요하지만, 이 선택이 항상 명확하거나 명시적인 것은 아니다(Koltay, 2016).
Three approaches to data governance are planning and control, organizational, and risk-based.
데이터 거버넌스에는 계획 및 통제 접근법, 조직적 접근법, 그리고 리스크 기반 접근법의 세 가지 방식이 있다.
These approaches are not mutually exclusive and can be used to complement each other.
이들 접근법은 상호 배타적이지 않으며 서로를 보완하는 데 사용할 수 있다.
The three approaches are depicted in Fig. 1 and described below.
이 세 가지 접근법은 그림 1에 나타나 있으며 아래에 설명되어 있다.
While they are typically applied within organizations, they can also be used between organizations.
이 접근법들은 일반적으로 조직 내부에서 적용되지만, 조직 간에서도 사용할 수 있다.
Risk-assessment, defining responsibilities, and joint planning and control can be done between organizations but require the establishment of trusted frameworks.
위험 평가, 책임 정의, 공동 계획 및 통제는 조직 간에서도 수행할 수 있지만, 신뢰 프레임워크의 구축이 필요하다.
The planning and control approach, often used by IT-governance frameworks (De Haes, Van Grembergen, & Debreceny, 2013), is based on the annual cycle of planning and control.
IT 거버넌스 프레임워크에서 자주 사용되는 계획 및 통제 접근법은 연간 계획 및 통제 주기를 기반으로 한다(De Haes, Van Grembergen, & Debreceny, 2013).
In each cycle, objectives are set, budgets are allocated, and projects are defined, implemented, monitored, and evaluated.
각 주기에서 목표가 설정되고, 예산이 배정되며, 프로젝트가 정의, 실행, 모니터링 및 평가된다.
Budgets and other resources are allocated to projects and departments for executing activities, subject to set priorities.
예산과 기타 자원은 설정된 우선순위에 따라 활동을 실행하기 위해 프로젝트와 부서에 할당된다.
In turn, projects and departments must compete.
결과적으로 프로젝트와 부서는 경쟁해야 한다.
Projects are evaluated on their performance and close alignment between business and technology goals.
프로젝트는 성과와 비즈니스 및 기술 목표 간의 밀접한 일치를 기준으로 평가된다.
Planning can initiate infrastructure projects aimed at, for example, improving data quality or exploring the potential and risks of AI-based BDAS in various application areas.
계획은 예를 들어 데이터 품질 개선이나 다양한 응용 분야에서 AI 기반 BDAS의 가능성과 위험을 탐구하는 데 초점을 맞춘 인프라 프로젝트를 시작할 수 있다.
In this approach, data governance is carried out through policies and procedures that are repeatable, verifiable, and auditable.
이 접근법에서는 반복 가능하고, 검증 가능하며, 감사 가능한 정책과 절차를 통해 데이터 거버넌스가 수행된다.
The approach is often criticized for not easily adapting to change (Janssen & van der Voort, 2016).
이 접근법은 변화에 쉽게 적응하지 못한다는 비판을 자주 받는다(Janssen & van der Voort, 2016).
However, continuous monitoring can help adjust project plans and resource allocations on an ongoing basis.
그러나 지속적인 모니터링은 프로젝트 계획과 자원 할당을 지속적으로 조정하는 데 도움을 줄 수 있다.
The organizational approach to data governance emphasizes structure, responsibility, accountability, and reporting (Mullon & Ngoepe, 2019).
데이터 거버넌스에 대한 조직적 접근법은 구조, 책임, 책무, 보고를 강조한다(Mullon & Ngoepe, 2019).
This approach, using the principle of top-level design, sets up organizational structures for data governance and treats data governance as a defining authority (Mullon & Ngoepe, 2019).
이 접근법은 상위 설계 원칙을 사용하여 데이터 거버넌스를 위한 조직 구조를 설정하고, 데이터 거버넌스를 결정 권한으로 간주한다(Mullon & Ngoepe, 2019).
Consistent with this principle, the approach recommends setting up decision-making structures in the areas of data, AI, privacy, or ethics, such as Chief Data Officers (CDO), Chief AI Officers (CAIO), Chief Privacy Officers (CPO), or Chief Ethics Officers (CEO).
이 원칙에 따라 이 접근법은 최고 데이터 책임자(CDO), 최고 AI 책임자(CAIO), 최고 개인정보 책임자(CPO), 최고 윤리 책임자(CEO)와 같은 데이터, AI, 개인정보 보호 또는 윤리 분야의 의사결정 구조를 설정할 것을 권장한다.
Within such structures, it also includes the responsibility for data stewardship (Rosenbaum, 2010).
이러한 구조 내에서 데이터 관리 책임도 포함된다(Rosenbaum, 2010).
With the advent of GDPR and AI, the risk-based approach has gained attention as a way to identify risks of BDAS and introduce appropriate governance mechanisms to address them (Ladley, 2019).
GDPR과 AI의 도래로 인해 리스크 기반 접근법은 BDAS의 위험을 식별하고 이를 해결하기 위한 적절한 거버넌스 메커니즘을 도입하는 방법으로 주목받고 있다(Ladley, 2019).
This approach is often advocated as a foundation for data governance (Rothstein, Borraz, & Huber, 2013) and an effective solution to AI-specific risks such as data or algorithmic errors, data or algorithmic bias, or even data-embedded discrimination (Janssen & Kuk, 2016).
이 접근법은 종종 데이터 거버넌스의 기반으로 옹호되며(Rothstein, Borraz, & Huber, 2013), 데이터 또는 알고리즘 오류, 데이터 또는 알고리즘 편향, 심지어 데이터에 내재된 차별과 같은 AI 특정 위험에 대한 효과적인 해결책으로 간주된다(Janssen & Kuk, 2016).
These problems arise due to, in large part, sensitive attributes embedded in data sets which are used by machine learning algorithms to search for patterns (Beretta et al., 2018).
이러한 문제는 주로 머신러닝 알고리즘이 패턴을 검색하기 위해 사용하는 데이터 세트에 내재된 민감한 속성 때문에 발생한다(Beretta et al., 2018).
Example risks include missing, stolen, outdated, inaccurate, or biased data.
예시로는 누락된 데이터, 도난된 데이터, 오래된 데이터, 부정확한 데이터 또는 편향된 데이터가 포함된다.
Regular assessment is needed to establish such risks and appropriate action undertaken to manage them.
이러한 위험을 확인하고 이를 관리하기 위한 적절한 조치를 취하기 위해 정기적인 평가가 필요하다.
Actions can be taken incidentally, preventively, or both, depending on the governance mechanism.
거버넌스 메커니즘에 따라 우발적, 예방적 조치 또는 이 둘을 조합한 조치가 취해질 수 있다.
For example, each AI project could be subject to a risk audit to anticipate and address the possible undesirable effects of the AI algorithms.
예를 들어, 각 AI 프로젝트는 AI 알고리즘의 바람직하지 않은 영향을 예측하고 이를 해결하기 위해 위험 감사의 대상이 될 수 있다.
These approaches can all be in place and complement each other.
이러한 접근법은 모두 함께 적용될 수 있으며 서로를 보완할 수 있다.
Nevertheless, different governance mechanisms should be introduced with care, as too much governance can result in excessive overhead and lower performance.
그러나 거버넌스가 과도하면 지나치게 많은 간접비용이 발생하고 성능이 저하될 수 있으므로, 다양한 거버넌스 메커니즘은 신중히 도입해야 한다.
Too little governance, however, might result in unclear responsibilities, uncontrolled risks, and not taking the right precautions and actions.
반면에 거버넌스가 부족하면 책임이 불분명해지고, 위험이 통제되지 않으며, 적절한 예방 조치와 대응이 이루어지지 않을 수 있다.
This section has outlined different approaches to data governance for BDAS and their potential implications.
이 섹션에서는 BDAS를 위한 데이터 거버넌스의 다양한 접근법과 그 잠재적 영향을 개괄적으로 설명했다.
The next section focuses on trusted AI-based BDAS and a data governance framework for such systems.
다음 섹션에서는 신뢰할 수 있는 AI 기반 BDAS와 이를 위한 데이터 거버넌스 프레임워크에 초점을 맞춘다.
This section aims to formulate the main proposal of this article: the concept of trusted AI-based BDAS and a framework for data governance for such systems.
이 섹션의 목표는 이 논문의 주요 제안을 구성하는 것으로, 신뢰할 수 있는 AI 기반 BDAS의 개념과 이를 위한 데이터 거버넌스 프레임워크를 제시하는 것이다.
The proposal consists of three elements: system-level governance model for BDAS (Section 4.1), data stewardship and base registries (Section 4.2), and the trusted data-sharing framework based on self-sovereign identities and data-sharing agreements (Section 4.3).
제안은 세 가지 요소로 구성된다: BDAS를 위한 시스템 수준 거버넌스 모델(4.1장), 데이터 관리 및 기본 레지스트리(4.2장), 그리고 자기주권 신원 및 데이터 공유 협약을 기반으로 한 신뢰 데이터 공유 프레임워크(4.3장)이다.
AI comes with immense opportunities but also with risks.
AI는 막대한 기회를 제공하지만, 동시에 위험도 수반한다.
It may violate privacy, discriminate, avoid accountability, manipulate and misinform public opinion, and be used for surveillance.
AI는 개인정보를 침해하거나, 차별을 조장하거나, 책임을 회피하거나, 여론을 조작하고 잘못된 정보를 제공하거나, 감시 목적으로 사용될 수 있다.
For instance, it can recognize faces in photos and video streams to help determine people’s whereabouts and their behavior patterns.
예를 들어, AI는 사진과 영상 스트림에서 얼굴을 인식하여 사람들의 위치와 행동 패턴을 파악하는 데 도움을 줄 수 있다.
AI capabilities generate immense powers, which are dangerous if systems are allowed to expand without proper oversight, accountability, and governance.
AI의 능력은 막대한 힘을 생성하며, 적절한 감독, 책임, 거버넌스 없이 시스템이 확장된다면 이는 위험할 수 있다.
Data is the basis for BDAS, but the outcomes of BDAS should be monitored as well, as they are part of the data life-cycle.
데이터는 BDAS의 기초이지만, BDAS의 결과 역시 데이터 라이프사이클의 일부이므로 모니터링되어야 한다.
Therefore, the entire BDAS should be subject to effective data governance.
따라서 전체 BDAS는 효과적인 데이터 거버넌스의 대상이 되어야 한다.
Data and algorithms can be opened for inspection, although primarily intended for machine processing.
데이터와 알고리즘은 주로 기계 처리용으로 설계되었지만, 검토를 위해 공개될 수 있다.
Even if presented in formats accessible to people, few will be able to understand them, let alone scrutinize.
사람들이 접근할 수 있는 형식으로 제공되더라도 이를 이해하거나 심층 검토할 수 있는 사람은 극히 드물다.
Lacking opportunities for proper public scrutiny, risk assessment, regular audits, sampling protocols, validity and quality checking, clear responsibilities, and other inspection mechanisms are needed.
적절한 공공 검토의 기회가 부족한 경우, 위험 평가, 정기 감사, 샘플링 프로토콜, 유효성과 품질 점검, 명확한 책임, 기타 검사 메커니즘이 필요하다.
Fig. 2 depicts a system-level governance model that enables thinking about data governance within BDAS.
그림 2는 BDAS 내에서 데이터 거버넌스를 고려할 수 있도록 하는 시스템 수준의 거버넌스 모델을 보여준다.
As data and AI are intrinsically connected, the model considers them together.
데이터와 AI는 본질적으로 연결되어 있으므로, 이 모델은 이를 함께 고려한다.
The input data is shown on the left, the output on the right, and algorithmic processing in the middle.
입력 데이터는 왼쪽에, 출력은 오른쪽에, 알고리즘 처리는 중앙에 표시된다.
The model takes into account how BDAS operate with data.
이 모델은 BDAS가 데이터를 활용하는 방식을 고려한다.
Without this, effective governance is not possible.
이것이 없으면 효과적인 거버넌스는 불가능하다.
BDAS enable automatic decision-making within public institutions.
BDAS는 공공 기관 내에서 자동 의사결정을 가능하게 한다.
However, the decision-making authority is hidden from the user directly affected by the outcomes, public officers become merely mediators rather than decision-makers, and automated public services become “hidden bureaucrat” (Wihlborg, Larsson, & Hedström, 2016).
그러나 결정 권한은 결과에 직접 영향을 받는 사용자에게 숨겨지고, 공무원은 의사결정자가 아닌 중재자로 전락하며, 자동화된 공공 서비스는 “보이지 않는 관료”가 된다(Wihlborg, Larsson, & Hedström, 2016).
Hence, accountability should be designed at the system level.
따라서 시스템 수준에서 책임성이 설계되어야 한다.
This system-level accountability design should cover not only the internal working of algorithms, but how their usage is organized, how they are fed with data, how the data is controlled, how the outcomes are checked, and how the entire system is audited.
이 시스템 수준의 책임 설계는 알고리즘의 내부 작동뿐만 아니라, 이들이 어떻게 사용되고 조직되는지, 어떻게 데이터가 제공되는지, 데이터가 어떻게 통제되는지, 결과가 어떻게 확인되는지, 전체 시스템이 어떻게 감사되는지를 포함해야 한다.
As shown at the top of Fig. 2, systems are guided by regulations, for instance, regulations concerning data protection or Freedom of Information (FOI).
그림 2의 상단에 표시된 것처럼 시스템은 데이터 보호 또는 정보 자유(Freedom of Information, FOI)와 관련된 규정을 통해 운영된다.
Within the regulatory context, policies, principles, and procedures are formulated.
이 규제 맥락 내에서 정책, 원칙, 절차가 수립된다.
Policies prescribe how users should or should not behave concerning data and algorithms and specify the means of rewarding or sanctioning such behaviors.
정책은 사용자들이 데이터와 알고리즘과 관련하여 어떻게 행동해야 하며, 어떻게 행동해서는 안 되는지를 규정하고, 이러한 행동을 보상하거나 제재하는 수단을 명시한다.
Principles are normative and directive; they determine the organizing logic of data governance.
원칙은 규범적이며 지시적이며, 데이터 거버넌스의 조직 논리를 결정한다.
The main principles for data governance in BDAS are summarized in Section 5.
BDAS에서의 데이터 거버넌스에 대한 주요 원칙은 5장에서 요약된다.
Data governance is based on the expectations and values of society, which is ultimately affected by the outcomes of BDAS.
데이터 거버넌스는 사회의 기대와 가치를 기반으로 하며, 이는 궁극적으로 BDAS의 결과에 의해 영향을 받는다.
The basis for taking these into account is creating a culture where data is treated as an asset, while regulations and commonly accepted public values are guiding data-based decisions.
이를 고려하기 위한 기반은 데이터를 자산으로 취급하는 문화를 조성하는 것이며, 이와 동시에 규정 및 일반적으로 수용된 공공 가치가 데이터 기반 의사결정을 안내한다.
Furthermore, the professionals involved in gathering and processing data must adhere to professional norms in their respective areas.
또한 데이터를 수집하고 처리하는 데 관여하는 전문가는 각 분야의 전문 규범을 준수해야 한다.
These expectations and values are translated into the planning and control, organizational, or risk-based governance approaches, resulting in the assignment of decision-making authority and the establishment of processes and procedures.
이러한 기대와 가치는 계획 및 통제, 조직적 접근법, 또는 위험 기반 거버넌스 접근법으로 전환되며, 그 결과로 의사결정 권한이 부여되고 프로세스와 절차가 수립된다.
Procedures include the annual planning and control cycles, the introduction of independent ethics committees, the regular audits, taking of data samples, etc.
절차에는 연간 계획 및 통제 주기, 독립 윤리 위원회의 도입, 정기 감사, 데이터 샘플 채취 등이 포함된다.
Controls and audits should be applied to inputs, processes, and outputs in the data usage processes, which all must be monitored using qualitative and quantitative measures.
통제와 감사는 데이터 사용 프로세스에서 입력, 프로세스, 출력에 적용되어야 하며, 모든 것이 질적 및 양적 측정을 통해 모니터링되어야 한다.
The bottom left part of Fig. 2 depicts the learning process through which the AI algorithm is fed with training data to learn to make decisions.
그림 2의 왼쪽 하단은 AI 알고리즘이 훈련 데이터를 받아들이고 의사결정을 학습하는 과정을 보여준다.
Most BDAS are based on a type of machine learning algorithms that identify patterns in data, which they use for descriptive, predictive, or prescriptive goals.
대부분의 BDAS는 데이터에서 패턴을 식별하고 이를 기술적, 예측적, 또는 규범적 목표를 위해 사용하는 일종의 머신러닝 알고리즘에 기반한다.
The risks of training algorithms using historical data are that mistakes, inconsistencies, and bias embedded in such data will be reflected in the working of the algorithms.
과거 데이터를 사용하여 알고리즘을 훈련할 경우, 이러한 데이터에 내재된 실수, 불일치, 편향이 알고리즘의 작동에 반영될 위험이 있다.
Another risk area is poor generalization of the algorithms to situations outside the data upon which they were trained.
또 다른 위험 영역은 알고리즘이 훈련된 데이터 외부의 상황에 대해 일반화를 제대로 하지 못하는 것이다.
Hence, oversight should cover both data quality issues, including the presence of bias, and the fitness of algorithms and the data fed into them to the problems they are asked to address.
따라서 감독은 데이터 품질 문제, 특히 편향의 존재를 포함하여 알고리즘과 제공된 데이터가 해결하려는 문제에 적합한지 여부를 모두 다루어야 한다.
Part of the learning process is also checking the validity of the results, including the determination of false positives and false negatives.
학습 과정의 일부는 결과의 타당성을 확인하는 것이며, 여기에는 false positive(거짓 양성)와 false negative(거짓 음성)를 판별하는 작업도 포함된다.
Although these controls are needed, AI algorithms are often opaque, controls alone are insufficient, and additional governance mechanisms may be required.
이러한 통제가 필요하지만, AI 알고리즘은 종종 불투명하며, 통제만으로는 불충분하고 추가적인 거버넌스 메커니즘이 필요할 수 있다.
AI algorithms and their implementations can range from black-box to white-box approaches.
AI 알고리즘과 그 구현은 블랙박스 접근법에서 화이트박스 접근법까지 다양할 수 있다.
For the sake of accountability and transparency, the causality between inputs and decisions should be explained to guarantee the fairness of the results.
책임성과 투명성을 위해 입력과 결정 간의 인과 관계가 설명되어야 결과의 공정성을 보장할 수 있다.
While people should decide on the rules to be able to explain the causality between data, rules, and decisions, AI algorithms can be used to improve upon these rules and derive new ones.
사람들이 데이터, 규칙, 결정 간의 인과 관계를 설명하기 위해 규칙을 결정해야 하지만, AI 알고리즘은 이러한 규칙을 개선하고 새로운 규칙을 도출하는 데 사용할 수 있다.
These requirements suggest that algorithmic processing should take a white-box rather than a black-box approach.
이러한 요구 사항은 알고리즘 처리에서 블랙박스 접근법보다 화이트박스 접근법을 취해야 한다는 점을 시사한다.
The middle part of Fig. 2 depicts the main elements of the decision-making process.
그림 2의 중간 부분은 의사결정 과정의 주요 요소를 보여준다.
In the ideal scenario, this process should adhere to compliance-by-design, i.e., BDAS should be designed to comply with all relevant norms and regulations.
이상적인 시나리오에서 이 과정은 설계 단계부터 준수를 목표로 해야 하며, 즉 BDAS는 모든 관련 규범과 규정을 준수하도록 설계되어야 한다.
However, this scenario would have to guarantee unambiguous data ownership, monitoring of data sources and data quality, controlled adherence to standards, and compliance with other specific requirements.
그러나 이 시나리오는 명확한 데이터 소유권, 데이터 소스 및 품질 모니터링, 표준에 대한 통제된 준수, 기타 특정 요구사항의 준수를 보장해야 한다.
Various data sources used as inputs should be checked for quality, bias, and other properties.
입력으로 사용되는 다양한 데이터 소스는 품질, 편향, 기타 속성을 확인해야 한다.
As changes to data may easily result in the wrong outcomes produced by the algorithms, the closeness of new data to training data should be evaluated.
데이터 변경은 쉽게 알고리즘에 의해 잘못된 결과를 초래할 수 있으므로, 새로운 데이터가 훈련 데이터와 얼마나 가까운지를 평가해야 한다.
The changing pattern principle suggests investigating the reasons for introducing changes, and any time a change in pattern is discovered, the outcomes should be validated again.
변화 패턴 원칙은 변경 사항의 도입 이유를 조사하며, 패턴의 변화가 발견될 때마다 결과를 다시 검증해야 한다고 제안한다.
This can be done using samples or comparing the outcomes with previous results or manual decisions.
이는 샘플을 사용하거나 결과를 이전 결과 또는 수동 의사결정과 비교하는 방식으로 수행할 수 있다.
Once the results are communicated, the persons involved should have an opportunity to file appeals.
결과가 전달되면 관련자는 이의를 제기할 기회를 가져야 한다.
Such appeals can be used to scrutinize and further improve the BDAS.
이러한 이의 제기는 BDAS를 정밀 검토하고 추가로 개선하는 데 활용될 수 있다.
BDAS are often opaque, and their working is difficult to understand.
BDAS는 종종 불투명하며 그 작동 방식을 이해하기 어렵다.
Similarly to opening data to the public for the sake of transparency and accountability, the AI algorithms can be opened as well.
투명성과 책임성을 위해 데이터를 공개하는 것과 마찬가지로 AI 알고리즘도 공개될 수 있다.
While most people will be unable to make much sense of the algorithms, this would allow auditors, experts, scientists, citizen scientists, and other professionals equipped with proper tools to check the working of the algorithms.
대다수의 사람들은 알고리즘을 이해하기 어려울 것이지만, 이는 감사원, 전문가, 과학자, 시민 과학자 및 적절한 도구를 갖춘 기타 전문가들이 알고리즘의 작동을 확인할 수 있게 한다.
However, the opening of algorithms should be done with care as it might reveal bugs in the working systems, which could be exploited by hackers.
그러나 알고리즘의 공개는 운영 시스템의 버그를 드러내어 해커가 이를 악용할 가능성이 있으므로 신중하게 이루어져야 한다.
Hence, the model assumes that data, algorithms, and processes will be opened to controlled groups for scrutiny.
따라서 이 모델은 데이터, 알고리즘, 프로세스가 통제된 그룹에 한해 검토를 위해 공개될 것임을 전제로 한다.
Data governance contains mechanisms to incentivize correct behaviors and sanction incorrect ones.
데이터 거버넌스는 올바른 행동에 인센티브를 제공하고 잘못된 행동을 제재하는 메커니즘을 포함한다.
Whereas misbehavior and mistakes can be sanctioned, incentives including monetary rewards could be offered for uncovering errors, discrimination, bias, or other undesirable features in data, algorithms acting on such data, and processes governing the use of data and algorithms.
부적절한 행동과 실수는 제재될 수 있으며, 데이터, 알고리즘, 그리고 이를 관리하는 프로세스에서 오류, 차별, 편향 또는 기타 바람직하지 않은 요소를 발견하는 경우 금전적 보상을 포함한 인센티브가 제공될 수 있다.
Such incentives are used in the bug bounty programs that encourage people to spot and report back issues with the software.
이러한 인센티브는 사람들이 소프트웨어의 문제를 찾아내고 이를 보고하도록 장려하는 버그 바운티 프로그램에서 사용된다.
However, incentives cannot replace proper policing by audit organizations.
그러나 인센티브는 감사 조직에 의한 적절한 감시를 대체할 수 없다.
The more controls are embedded in governance processes, the higher auditability and problem detection rates, and the more opportunities for learning and improvement.
거버넌스 프로세스에 통제가 더 많이 포함될수록 감사 가능성과 문제 탐지율이 높아지며, 학습과 개선의 기회가 증가한다.
Creating sound data governance requires a balance between complete control, which is unreachable, and lack of control, which is dangerous, into the mode of governance that is necessary and feasible.
건전한 데이터 거버넌스를 구축하려면 도달할 수 없는 완전한 통제와 위험한 통제 부족 사이에서 필요하고 실행 가능한 거버넌스 모드로 균형을 맞춰야 한다.
Risk-based approaches to data governance are suited to maximize the value created from data while mitigating risks and reducing costs.
데이터 거버넌스에 대한 위험 기반 접근법은 데이터를 통해 생성된 가치를 극대화하면서 위험을 완화하고 비용을 절감하는 데 적합하다.
Controls can play similar preventive and detective roles, guided by socio-technical arrangements within the organizations concerned.
통제는 관련 조직 내의 사회-기술적 배치를 통해 유사한 예방 및 탐지 역할을 수행할 수 있다.
To ensure sound data governance, some organizations appoint Chief Data Officers (CDOs) or Chief Algorithmic Officers (CAOs).
건전한 데이터 거버넌스를 보장하기 위해 일부 조직은 최고 데이터 책임자(CDO) 또는 최고 알고리즘 책임자(CAO)를 임명한다.
In contrast, others keep it within the remit of Chief Information Officers (CIOs), Chief Technology Officers (CTOs), or even Chief Privacy Officers (CPOs).
반면, 다른 조직들은 이를 최고 정보 책임자(CIO), 최고 기술 책임자(CTO), 또는 심지어 최고 개인정보 책임자(CPO)의 범위 내에 유지한다.
The planning and control approach also engages Ethics Committees and related bodies to decide about the use of BDAS.
계획 및 통제 접근법은 또한 BDAS 사용에 대한 결정을 내리기 위해 윤리 위원회 및 관련 기관을 참여시킨다.
Indeed, all public servants should be sensitized and trained to take responsibility for ensuring data quality and proper data sharing.
실제로 모든 공무원은 데이터 품질과 적절한 데이터 공유를 보장하는 책임을 지도록 인식되고 훈련되어야 한다.
The foundation of data governance is responsible data collection.
데이터 거버넌스의 기반은 책임 있는 데이터 수집이다.
If sensitive data, like gender, race, residential address, health status, or political preference, is collected, then it can be misused or abused.
성별, 인종, 거주 주소, 건강 상태 또는 정치적 성향과 같은 민감한 데이터를 수집할 경우, 이는 오용되거나 악용될 수 있다.
As data that is not collected cannot be misused or abused, the collection of data should be minimized.
수집되지 않은 데이터는 오용되거나 악용될 수 없으므로, 데이터 수집은 최소화되어야 한다.
Nevertheless, there are numerous situations where sensitive data must be collected and shared for the sake of transparency, fraud detection, service improvements, or better decisions.
그럼에도 불구하고, 투명성, 사기 탐지, 서비스 개선 또는 더 나은 의사결정을 위해 민감한 데이터를 수집하고 공유해야 하는 경우가 많다.
Such data, once collected, must be secured to guard against misuse or abuse.
이러한 데이터는 수집된 이후에는 오용이나 악용을 방지하기 위해 안전하게 보호되어야 한다.
The ownership of data is often challenging to establish, and multiple persons might claim the rights to it.
데이터의 소유권을 확립하는 것은 종종 어려우며, 여러 사람이 이에 대한 권리를 주장할 수 있다.
An analogy is the ownership of the electricity used in a household, which could be assigned to the house owner, the person currently renting the house, the utility company that provides the electricity, or the government that taxes electricity usage.
비유하자면, 가정에서 사용되는 전기의 소유권은 집주인, 현재 집을 임대 중인 사람, 전기를 제공하는 공공서비스 회사 또는 전기 사용에 세금을 부과하는 정부에 할당될 수 있다.
Furthermore, in law, tangible goods are more natural to own than intangible ones, like data, which can be shared without limits.
게다가 법적으로는 데이터와 같이 제한 없이 공유할 수 있는 무형 자산보다 유형 자산을 소유하는 것이 더 자연스럽다.
In the case of data, the notion of stewardship is preferred over ownership.
데이터의 경우, 소유권보다 관리의 개념이 선호된다.
It draws attention to the provision of trusted and authentic data, to responsible data use and sharing, and to the presence of multiple stewards taking care of similar data.
이는 신뢰할 수 있고 진정성 있는 데이터를 제공하고, 책임감 있는 데이터 사용과 공유를 보장하며, 유사한 데이터를 관리하는 여러 관리자의 존재를 강조한다.
Data stewardship is a team effort where responsibilities and expertise are divided among members, who can manage data on behalf of others.
데이터 관리는 팀 단위의 노력으로, 책임과 전문성이 구성원 간에 분담되며, 이들은 다른 사람을 대신하여 데이터를 관리할 수 있다.
Data stewards should ensure responsible information sharing.
데이터 관리자는 책임 있는 정보 공유를 보장해야 한다.
Plotkin (2013) views data stewardship as a way to formalize accountabilities for managing information resources on behalf of and in the best interest of others.
Plotkin(2013)은 데이터 관리를 타인을 대신하여, 그리고 그들의 최선의 이익을 위해 정보 자원을 관리하는 데 대한 책임을 공식화하는 방법으로 본다.
Dawes (2010) formulated the stewardship and usefulness principles for information sharing: stewardship should assure data quality, validity, and security; manage risks; manage and preserve data; and make public officials and organizations responsible for handling information with care and integrity.
Dawes(2010)은 정보 공유를 위한 관리와 유용성 원칙을 다음과 같이 제시했다: 관리는 데이터 품질, 유효성, 보안을 보장해야 하며, 위험을 관리하고 데이터를 보존하며, 정보를 신중하고 진실되게 처리하도록 공무원과 조직에 책임을 부여해야 한다.
Others emphasize that stewards are also responsible for information security (Cuganesan, Hart, & Steele, 2017).
다른 연구자들은 관리자가 정보 보안에 대한 책임도 가지고 있다고 강조한다(Cuganesan, Hart, & Steele, 2017).
The usefulness principle should ensure that data can be used for innovation, particularly for BDAS.
유용성 원칙은 데이터가 혁신, 특히 BDAS를 위해 활용될 수 있음을 보장해야 한다.
Dawes (2010) further argued that stewardship and usefulness are complementary principles and should guide information-based transparency.
Dawes(2010)는 관리와 유용성이 상호보완적인 원칙이며 정보 기반 투명성을 이끄는 기준이 되어야 한다고 추가로 주장했다.
In contrast, achieving both information usefulness and effective stewardship over information can be competing (Cuganesan et al., 2017).
반면에, 정보의 유용성과 효과적인 관리 모두를 달성하는 것은 상충될 수 있다(Cuganesan et al., 2017).
The stewardship principle might deal with information sharing risks by withholding that information and thus reducing transparency and accountability.
관리 원칙은 정보를 보류함으로써 정보 공유 위험을 다룰 수 있으며, 이는 결과적으로 투명성과 책임성을 저하시킬 수 있다.
The other way around, the usefulness principle could result in data protection being violated by data stewards.
반대로, 유용성 원칙은 데이터 관리자가 데이터 보호를 위반하는 결과를 초래할 수 있다.
From an operational perspective, data should be managed by one organization or department and used by other organizations or departments.
운영 관점에서 데이터는 한 조직 또는 부서에 의해 관리되고, 다른 조직이나 부서에서 사용되어야 한다.
When collecting data, data stewards should follow the principle of collecting data at the source (Hammer, 1990) and separating sensitive and non-sensitive data (Janssen, Matheus, Longo, & Weerakkody, 2017).
데이터를 수집할 때 데이터 관리자는 데이터 소스에서 수집하는 원칙(Hammer, 1990)을 따르고 민감 데이터와 비민감 데이터를 분리해야 한다(Janssen, Matheus, Longo, & Weerakkody, 2017).
The data can be stored in a base registry, which, according to the European Commission (2017, p. 37), is “a trusted and authoritative source of information which can and should be digitally re-used by others, where one organization is responsible and accountable for the collection, use, updating, and preservation of information.”
데이터는 기본 레지스트리에 저장될 수 있으며, 이는 유럽위원회(2017, p. 37)에 따르면 “신뢰할 수 있고 권위 있는 정보 소스로, 디지털 방식으로 재사용될 수 있으며 재사용되어야 하며, 한 조직이 정보의 수집, 사용, 업데이트, 보존에 대한 책임을 지는 것”이다.
When other organizations spot incorrect data, they should report this to the data steward who is in charge of the base registry, and wait for a response from the steward before using this data.
다른 조직이 부정확한 데이터를 발견하면 기본 레지스트리를 담당하는 데이터 관리자에게 이를 보고하고, 해당 데이터를 사용하기 전에 관리자의 응답을 기다려야 한다.
The steward will investigate the issue with the correctness of data and, if needed, update the data and inform the reporting organization, which can then start using this data.
관리자는 데이터의 정확성 문제를 조사하고, 필요하다면 데이터를 업데이트하며 보고한 조직에 이를 알리게 되고, 해당 조직은 이후에 데이터를 사용할 수 있다.
Even if data is pooled and linked at the conceptual level, physical storage and responsibility for data should be distributed to reduce vulnerability.
데이터가 개념적 수준에서 통합되고 연결되더라도, 취약성을 줄이기 위해 데이터의 물리적 저장 및 책임은 분산되어야 한다.
Pooling and linking should ensure that data is interrelated and can easily be combined, if needed.
통합과 연결은 데이터가 상호 연관되어 있고 필요 시 쉽게 결합될 수 있음을 보장해야 한다.
However, governance mechanisms should ensure that data can only be shared if the right conditions, like authorization by multiple persons or approval by the data protection officer, are met.
그러나 거버넌스 메커니즘은 여러 사람의 승인이나 데이터 보호 책임자의 승인을 포함한 적절한 조건이 충족될 때만 데이터가 공유될 수 있음을 보장해야 한다.
When information cannot be shared with another department to avoid violating regulations or due to a conflict of interest, the intra-organizational information barrier called the Chinese wall is used.
규정 위반을 피하거나 이해 충돌로 인해 정보를 다른 부서와 공유할 수 없는 경우, 중국의 만리장성(Chinese wall)으로 불리는 조직 내부 정보 장벽이 사용된다.
A leading principle is to minimize the number of persons having access to data—if somebody does not need to access the data, such access should not be granted.
주요 원칙은 데이터에 접근할 수 있는 사람의 수를 최소화하는 것이다. 누군가가 데이터에 접근할 필요가 없다면 그러한 접근은 허용되지 않아야 한다.
To avoid the situation of a single entity exercising control over data without others’ consent, distributed responsibilities and separation of concerns make systems less vulnerable.
단일 주체가 다른 사람의 동의 없이 데이터를 통제하는 상황을 피하기 위해, 책임 분산과 관심사 분리는 시스템을 덜 취약하게 만든다.
Data stewardship and base registries provide a foundation for data and information sharing.
데이터 관리와 기본 레지스트리는 데이터 및 정보 공유의 기반을 제공한다.
However, mechanisms are needed to ensure responsible data sharing, allowing data sharing when required, but also blocking data sharing when necessary.
그러나 필요한 경우 데이터를 공유할 수 있도록 하면서도, 필요할 때 데이터 공유를 차단할 수 있는 책임 있는 데이터 공유를 보장하는 메커니즘이 필요하다.
For this, trusted data-sharing frameworks are required.
이를 위해 신뢰할 수 있는 데이터 공유 프레임워크가 필요하다.
BDAS often depend on data sources external to the organization, which can be easily manipulated or misused.
BDAS는 종종 조직 외부의 데이터 소스에 의존하며, 이는 쉽게 조작되거나 오용될 수 있다.
Hence, data and algorithms should not be indiscriminately shared with every organization, and organizations should not have access to information that they do not need.
따라서 데이터와 알고리즘은 모든 조직에 무차별적으로 공유되어서는 안 되며, 조직은 필요하지 않은 정보에 접근해서는 안 된다.
For a single organization, these types of decisions are made within the framework of data governance.
단일 조직의 경우, 이러한 결정은 데이터 거버넌스의 틀 안에서 이루어진다.
However, as BDAS often depend on data sources that are external to the organization, there is a need to extend such data governance to cover multiple organizations.
그러나 BDAS가 종종 조직 외부의 데이터 소스에 의존하기 때문에, 이러한 데이터 거버넌스를 여러 조직을 포괄하도록 확장할 필요가 있다.
This extension relies on trusted data-sharing frameworks, or trusted frameworks for short, that guide data exchange within and between participating organizations while ensuring compliance with regulations and the realization of public value.
이 확장은 참여 조직 내 및 조직 간의 데이터 교환을 안내하면서 규정 준수와 공공 가치 실현을 보장하는 신뢰할 수 있는 데이터 공유 프레임워크, 줄여서 신뢰 프레임워크에 의존한다.
Trusted frameworks should ensure that the right data is shared, that such sharing is carried out securely and reliably, and that the sharing complies with regulations like GDPR (European Parliament and European Council, 2016).
신뢰 프레임워크는 적합한 데이터가 공유되고, 이러한 공유가 안전하고 신뢰할 수 있는 방식으로 수행되며, GDPR(European Parliament and European Council, 2016)과 같은 규정을 준수하도록 보장해야 한다.
Trusted frameworks limit access to data to those who are authorized and ensure non-repudiation of the data origin.
신뢰 프레임워크는 데이터 접근을 권한이 부여된 사람으로 제한하며, 데이터 출처의 부인 방지를 보장한다.
A non-repudiation service provides a recipient with proof of origin, which constitutes legally valid evidence that a particular person or organization provided the data.
부인 방지 서비스는 수신자에게 특정 개인이나 조직이 데이터를 제공했다는 법적 유효 증거를 제공한다.
Trusted frameworks are a standard mechanism for governing relationships and are used in payment systems, domain registration systems, or mobile networks to provide roaming services.
신뢰 프레임워크는 관계를 관리하기 위한 표준 메커니즘으로, 결제 시스템, 도메인 등록 시스템, 또는 모바일 네트워크에서 로밍 서비스를 제공하는 데 사용된다.
In information sharing, traditional trusted third parties (TTPs) that use certificates to provide non-repudiation services are being replaced with distributed ledger or blockchain technology (DLT) (Dunphy & Petitcolas, 2018; Ølnes, Ubacht, & Janssen, 2017).
정보 공유에서 부인 방지 서비스를 제공하기 위해 인증서를 사용하는 기존의 신뢰할 수 있는 제3자(TTP)는 분산 원장 또는 블록체인 기술(DLT)로 대체되고 있다(Dunphy & Petitcolas, 2018; Ølnes, Ubacht, & Janssen, 2017).
As DLT ensures decentralized execution, avoiding the creation of a single point of failure or misuse, they are less vulnerable.
DLT는 분산 실행을 보장하여 단일 장애점 또는 오용 지점을 방지하므로 더 적은 취약성을 가진다.
Nevertheless, such a decentralized information-sharing system needs to be guided by proper governance mechanisms.
그럼에도 불구하고, 이러한 분산 정보 공유 시스템은 적절한 거버넌스 메커니즘에 의해 안내될 필요가 있다.
Trusted frameworks need to provide identification, authentication, and authorization services.
신뢰 프레임워크는 식별, 인증, 권한 부여 서비스를 제공해야 한다.
Identification refers to a person or organization claiming to have a particular identity.
식별은 특정 정체성을 가진다고 주장하는 개인 또는 조직을 의미한다.
Authentication ensures that the identified person or organization is what they claim to be, verifying the claim made by the identifying party.
인증은 식별된 개인이나 조직이 자신이 주장하는 바와 일치함을 보장하며, 식별 당사자가 제기한 주장을 검증한다.
Authorization happens when a person or an organization has been identified and granted access to data, specifying what they can do with this data.
권한 부여는 개인이나 조직이 식별되고 데이터 접근 권한을 부여받았을 때 발생하며, 이 데이터로 무엇을 할 수 있는지 명시한다.
This also results in non-repudiation, that the data origin cannot be disputed.
이는 데이터 출처를 부인할 수 없도록 하는 부인 방지의 결과로 이어진다.
Increasingly, trusted frameworks which are based on agreements among participating parties are used for data sharing and service provision.
점점 더 많은 신뢰 프레임워크가 참여 조직 간의 합의에 기반하여 데이터 공유와 서비스 제공에 사용되고 있다.
The agreements refer to a collaboration of various public and private parties to share data or provide services on topics, such as identification and authentication, as part of the efforts to ensure interoperability and compliance, for instance with GDPR.
이 합의는 GDPR과 같은 규정을 준수하고 상호운용성을 보장하기 위한 노력의 일환으로, 식별 및 인증과 같은 주제에 대해 데이터를 공유하거나 서비스를 제공하기 위한 다양한 공공 및 민간 조직 간의 협력을 의미한다.
A trusted framework contains several elements to regulate data sharing or other types of services, which may include:
신뢰 프레임워크는 데이터 공유 또는 기타 유형의 서비스를 규제하기 위해 다음과 같은 여러 요소를 포함할 수 있다.
a list of requirements for trusted data sharing;
신뢰할 수 있는 데이터 공유를 위한 요구 사항 목록;
a set of standards for realizing trusted data sharing;
신뢰 데이터 공유를 실현하기 위한 표준 세트;
a collection of contracts and agreements for trusted data sharing;
신뢰 데이터 공유를 위한 계약 및 합의 모음;
an authorization scheme specifying who should have access to which data under what circumstances;
어떤 상황에서 누가 어떤 데이터에 접근해야 하는지를 명시한 권한 부여 계획;
a certification mechanism to record adherence of different parties to the rules;
다양한 조직이 규칙을 준수했음을 기록하는 인증 메커니즘;
an auditing mechanism to verify compliance with requirements, agreements, and contracts;
요구 사항, 합의 및 계약 준수를 확인하기 위한 감사 메커니즘;
a mechanism to enforce compliance with the rules and agreements.
규칙 및 합의 준수를 강제하기 위한 메커니즘.
These elements should cover the entire data life cycle and should be adaptable to changing circumstances.
이 요소들은 데이터의 전체 라이프사이클을 포괄해야 하며, 변화하는 상황에 적응 가능해야 한다.
For instance, a trusted framework should ensure that personal information is only shared when given consent to do so, that only defined parties can have access to specified data, and that a variety of public and private organizations can legitimately gain access to such data.
예를 들어, 신뢰 프레임워크는 개인 정보가 동의가 있을 때만 공유되고, 정의된 조직만 특정 데이터에 접근할 수 있으며, 다양한 공공 및 민간 조직이 이러한 데이터에 합법적으로 접근할 수 있음을 보장해야 한다.
Data sharing should be based on the ‘need to know’ principle.
데이터 공유는 ‘알 필요성’ 원칙에 기반해야 한다.
A minimum amount of data should be shared and only for specified purposes.
최소한의 데이터만 공유해야 하며, 명시된 목적에만 사용되어야 한다.
For example, when a service requests information about whether a person is eligible for voting, their age should not be shared; instead, only whether or not they are 18 should be provided.
예를 들어, 한 서비스가 누군가가 투표 자격이 있는지 정보를 요청할 때 나이가 아니라 단순히 18세 이상인지 여부만 제공되어야 한다.
The same applies to other types of information, such as birth certificates, diplomas, social security, tax services, and others.
이 원칙은 출생증명서, 학위증명서, 사회보장제도, 세무 서비스 등 기타 정보 유형에도 적용된다.
Instead of providing detailed personal information, an answer should be submitted to a specific question.
자세한 개인 정보를 제공하는 대신, 특정 질문에 대한 답변만 제출되어야 한다.
This reduces the chances of using the data for unrelated purposes.
이는 데이터를 관련 없는 목적으로 사용하는 가능성을 줄인다.
Critical aspects of data governance are identity and trusted data sharing, which are not part of the standard Internet infrastructure.
데이터 거버넌스의 중요한 측면은 신원과 신뢰할 수 있는 데이터 공유로, 이는 표준 인터넷 인프라의 일부가 아니다.
Therefore, organizations collect and store identity information such as name, gender, age, profession, and others to be able to identify persons.
따라서 조직은 이름, 성별, 나이, 직업 등 신원을 확인할 수 있는 정보를 수집하고 저장한다.
This results in a fragmented data landscape where such information is stored in many places.
이로 인해 그러한 정보가 여러 장소에 분산 저장되는 단편화된 데이터 환경이 형성된다.
This raises security risks for identity information to be stolen, privacy risks with handling personal information, and data integrity risks as data might not be consistent with each other and the states of the real world.
이는 신원 정보가 도난당할 수 있는 보안 위험, 개인 정보를 처리하는 데 따른 개인정보 보호 위험, 데이터가 서로 또는 실제 세계의 상태와 일치하지 않을 수 있는 데이터 무결성 위험을 초래한다.
Therefore, this data should be treated as an asset that can be reused by other organizations using secure and reliable storage and sharing services.
따라서 이러한 데이터는 안전하고 신뢰할 수 있는 저장 및 공유 서비스를 통해 다른 조직에서 재사용할 수 있는 자산으로 간주되어야 한다.
Organizations or users can control the data.
조직 또는 사용자가 데이터를 통제할 수 있다.
The first situation entails organizations defining base registries using data stewardship.
첫 번째 상황은 조직이 데이터 관리 원칙을 사용하여 기본 레지스트리를 정의하는 것을 포함한다.
The second involves users exercising Self-Sovereign Identity (SSI).
두 번째는 사용자가 자기 주권 신원(Self-Sovereign Identity, SSI)을 행사하는 것이다.
SSI provides control over and ownership of data to citizens, who can give consent to share such data with others.
SSI는 시민에게 데이터에 대한 통제권과 소유권을 부여하며, 이들이 다른 사람과 데이터를 공유하도록 동의할 수 있게 한다.
Interoperability is created to be able to share data based on commonly agreed standards specified by the trusted framework.
상호운용성은 신뢰 프레임워크가 지정한 공통적으로 합의된 표준에 따라 데이터를 공유할 수 있도록 생성된다.
The data-sharing governed by trusted frameworks should adhere to the informing principle.
신뢰 프레임워크에 의해 관리되는 데이터 공유는 통지 원칙을 준수해야 한다.
When the government shares data about a particular person or organization, this person or organization should be made aware of this to avoid misuse and verify the correctness of such data.
정부가 특정 개인 또는 조직에 대한 데이터를 공유할 때, 이러한 데이터의 오용을 방지하고 정확성을 검증하기 위해 해당 개인이나 조직이 이를 인지해야 한다.
Then, when the data is hacked or shared for illegitimate purposes, this is immediately revealed.
그런 다음 데이터가 해킹되거나 부적절한 목적으로 공유되면 즉시 드러나게 된다.
Furthermore, access to their own data not only results in transparency but also empowers citizens and organizations to be in control of their data, including data about themselves.
게다가 자신에 대한 데이터를 포함한 데이터에 대한 접근 권한은 투명성을 제공할 뿐만 아니라 시민과 조직이 데이터를 통제할 수 있는 권한을 부여한다.
However, this also requires agreements to regulate access, openness, and inclusion.
그러나 이는 접근, 개방성, 포괄성을 규제하기 위한 합의도 필요하다.
Although the foundation of trustworthy BDAS is sound data governance, this area is often overlooked.
신뢰할 수 있는 BDAS의 기반은 건전한 데이터 거버넌스이지만, 이 영역은 종종 간과된다.
Data governance for BDAS is a complex field, and the development of BDAS without due attention to data governance is a significant risk.
BDAS를 위한 데이터 거버넌스는 복잡한 분야이며, 데이터 거버넌스를 적절히 고려하지 않고 BDAS를 개발하는 것은 중대한 위험을 초래한다.
Data governance can be viewed as organizations and their personnel defining, applying, and monitoring the patterns of rules and authorities for directing the proper functioning of, and ensuring accountability for, the entire life-cycle of data and algorithms within and across organizations.
데이터 거버넌스는 조직과 그 구성원이 데이터 및 알고리즘의 전체 라이프사이클을 올바르게 작동시키고, 이에 대한 책임성을 보장하기 위한 규칙 및 권한 패턴을 정의, 적용, 모니터링하는 것으로 간주될 수 있다.
Data governance can help mitigate the issues of transparency, accountability, fairness, discrimination, and trust.
데이터 거버넌스는 투명성, 책임성, 공정성, 차별, 신뢰의 문제를 완화하는 데 도움이 될 수 있다.
Available approaches to data governance can be based on clear organizational structures, responsibilities, and accountabilities, planning and control cycles, and risks.
데이터 거버넌스에 사용할 수 있는 접근법은 명확한 조직 구조, 책임, 책무, 계획 및 통제 주기, 위험을 기반으로 할 수 있다.
The latter is particularly relevant.
후자가 특히 중요하다.
BDAS face the risks of violating privacy, using data for undesired purposes, allowing bias or discrimination in data to inform algorithmic decisions, making wrong decisions, and so on.
BDAS는 개인정보 침해, 원치 않는 목적으로 데이터 사용, 데이터의 편향이나 차별이 알고리즘 의사결정에 영향을 미치도록 허용, 잘못된 의사결정 등과 같은 위험에 직면한다.
Although greater transparency into the inner workings of algorithms is necessary, it is insufficient for effective oversight.
알고리즘 내부 작동에 대한 더 높은 투명성이 필요하지만, 이는 효과적인 감독을 위해 충분하지 않다.
For that, system-level governance is needed.
이를 위해 시스템 수준의 거버넌스가 필요하다.
Organizations and their personnel need to work in concert to carry out effective data governance.
조직과 그 구성원은 효과적인 데이터 거버넌스를 실행하기 위해 협력해야 한다.
Apart from socio-technical measures focused on controls and safeguards, an organizational culture that promotes awareness and ethical value of data and algorithms is part of data governance.
통제와 보호 장치에 초점을 맞춘 사회-기술적 조치 외에도 데이터와 알고리즘의 인식과 윤리적 가치를 증진하는 조직 문화는 데이터 거버넌스의 일부이다.
Table 1 provides an overview of the 12 main data governance principles that are discussed in this article.
표 1은 이 글에서 논의된 12개의 주요 데이터 거버넌스 원칙에 대한 개요를 제공한다.
Although these principles might at first appear simple, they are challenging to realize.
이 원칙들은 처음에는 간단해 보일 수 있지만, 이를 실현하는 것은 어려운 과제이다.
There are hardly any good practices for successful adoption and application of data governance for BDAS.
BDAS를 위한 데이터 거버넌스의 성공적인 채택과 적용을 위한 모범 사례는 거의 없다.
Scarce research exists about trusted frameworks and SSIs, and there is no consensus yet about how they should be realized in BDAS.
신뢰 프레임워크와 SSI에 대한 연구는 부족하며, 이것이 BDAS에서 어떻게 구현되어야 하는지에 대한 합의는 아직 없다.
Adhering to these principles will help improve data governance and contribute to trustworthy BDAS.
이 원칙을 준수하는 것은 데이터 거버넌스를 개선하고 신뢰할 수 있는 BDAS에 기여하는 데 도움이 될 것이다.
However, there is a need for technologies like base registries and self-sovereign identities to make trustworthy BDAS work.
그러나 신뢰할 수 있는 BDAS를 구현하기 위해서는 기본 레지스트리와 자기 주권 신원과 같은 기술이 필요하다.
The realization of data governance in multi-organizational settings will also require the use of trusted data-sharing frameworks to guide inter-organizational data exchange and ensure compliance with regulations as well as the creation of public value.
다중 조직 환경에서 데이터 거버넌스를 실현하려면 조직 간 데이터 교환을 안내하고 규정 준수 및 공공 가치 창출을 보장하기 위해 신뢰 데이터 공유 프레임워크를 사용해야 한다.
While the foundation of BDAS data governance is responsible data collection, citizens’ control of data, and data stewardship, this new research field has to continue advancing before it creates a solid research foundation for trusted BDAS.
BDAS 데이터 거버넌스의 기반은 책임 있는 데이터 수집, 시민의 데이터 통제, 데이터 관리이지만, 신뢰할 수 있는 BDAS를 위한 견고한 연구 기반을 형성하기 전에 이 새로운 연구 분야는 계속 발전해야 한다.