brunch

You can make anything
by writing

C.S.Lewis

by delight Jun 13. 2021

AI 독점 막는 대안, 오픈데이터 운동 확산의 조건

마이크로소프트 최고법률책임자(CLO) 브래드 스미스(Brad Smith) 사장은 자신의 책 기술의 시대에서 AI가 데이터를 많이 보유한 특정 국가들이나 기업들에 의해 좌지우지되는 것을 막을 수 있는 대안으로 오픈 데이터 무브먼트(운동)를 화두로 던졌다.


오픈 데이터를 오픈소스 소프트웨어 같은 대세로 만드는 게 쉽지는 않지만 그렇다고 불가능한 것은 아니라는 게 저자의 생각이다. 정부 정책과 업계 그리고 법체계 측면에서 지금과는 다른 변화가 필요하다는 얘기였다.

  오픈 데이터 운동은 소프트웨어에 대한 오픈소스 트렌드를 참조할 수 있을 것이다.  소프트웨어의 경우에도 처음에는 라이선스 문제가 대두됐다. 그러나 시간이 지나자 오픈소스 표준 라이선스가 나타났다. 데이터에도 비슷한 노력들이 나타날 거라고 기대할 수 있다.
  정부 정책도 오픈 데이터 운동을 촉진할 수 있다. 먼저 공적 용도를 위해 정부 데이터를 더 많이 사용할 수 있게해주는 것부터 시작할 수 있을 것이다.  그렇게 되면 작은 기관들의 데이터 부족 현상을 줄일 수 있을 것이다.


법체계 측면을 고려할 필요도 있다.

  오픈데이터는 또한 프라이버시 법의 진화와 관련해 중요한 이슈를 제기한다. 지금의 법률은 주로 AI 개발이 가속화되지 전에 만들어진 것들이다. 그래서 지금의 법률과 오픈 데이터 사이에는 긴장 관계가 있고 이는 심각하게 고려해야 할 사항이다.
  예를 들어 유럽의 프라이버시 관련 법률들은 소위 목적 제한에 초점을 맞추고 있다. 데이터가 수집 되었을 때 구체적으로 명시한 목적을 위해서만 정보를 사용하도록 제한하는 것이다. 그러나 데이터를 공유함으로써 암 치료처럼 사회적 목적을 달성할 수 있는 새로운 기회들이 많이 나타나고 있다. 다행히 이 법률은 공정하고 당초의 목적과 배치되지 않을 경우 데이터의 용도를 고치는 것을 허용하고 있다. 이제 이 조항을 어떻게 해석할 것인가 하는 중요한 문제가 제기될 것이다.
  특히 저작권과 관련해 중요한 지적 재산권 이슈도 생길 것이다. 예컨대 책을 읽는 것처럼 저작권이 있는 작품을 통해 누구든 새로운 사실을 알게 되는 것은 오랫동안 허용되어온 일이다. 그러나 그런 정보의 습득이 기계를 통해 일어나도 되는지에 관해서는 현재 의문을 제기하는 사람들이 있다. 데이터의 폭넓은 사용을 장려하고 싶다면 기계도 그렇게 할 수 있어야 한다.


기술적인 측면에서 오픈 데이터 운동을 보면 플랫폼과 툴 개발로 요약된다.

  데이터 소유자를 위한 실질적 협의 방식을 개발하고 정부 정책을 해결한 이후에 또 하나 중요한 것이 있다. 더 적은 비용으로 더 쉽게 데이터를 공유할 수 있는 기술 플랫폼과 툴을 개발하는 것이다.
  현재 다양한 데이터세트를 분석하고 통합하고 관리하는 최첨단 툴을 개발하고 있는 쪽은 IT업계이다. 그러나 트러널이 알아보았듯이 데이터를 생산하는 사람들과 새로운 툴을 만드는 사람들이 서로 다르기 때문에 매일 생성되는 막대한 양의 교육적 데이터, 임상 시험 데이터를 이용해 발견할 수 있는 영향력 있고 삶을 바꿀 수 있고 어쩌면 생명을 구할 수 있는 기회들을 놓치고 있다.
  그러나 이런 일이 가능하려면 오픈데이터에 최적화된 강력한 기술 플랫폼이 데이터 이용자들에게 제공되어야 한다. 자체 플랫폼에서 데이터를 수집하고 규합해 자신들이 알아낸 통찰을 기술 서비스나 컨설팅 서비스의 형식으로 제공하는 업체도 있을 수 있다.
  흥미롭게도 내가 매튜 트러널의 얘기를 귀 기울여 듣고 있던 그 8월의 저녁에 마이크로소프트와 SAP, 어도비의 직원들로 구성된 연합팀이 보완적인 다른 프로젝트를 이미 작업 중이었다. 한 달 후 세 회사는 오픈 데이터 이니셔티브라는 것을 발족했다. 여러 단체들이 데이터에 대한 소유권과 통제권을 그대로 유지하면서도 데이터를 한데 모아서 공유할 수 있는 기술 플랫폼과 툴을 제공하기 위한 것이었다. 각 단체가 이미 보유한 데이터 중에서 유용한 것들을 식별하고 평가하며 해당 데이터를 공유에 적합한, 기계가 읽을 수 있는 구조화된 형태로 만들 수 있는 기술 툴도 제공할 예정이었다.
  우리는 전기를 쉽게 이용할 수 있는 것처럼 데이터를 효과적으로 사용하는 것을 사회적 목표로 삼아야 한다. 쉬운 일은 아니다. 그러나 데이터 공유에 관한 제대로 된 접근법과 정부의 올바른 지원이 있다면 데이터가 몇몇 기업이나 국가의 전유물이 되지 않는 공유 모델을 다 함께 만들 수 있을 것이다.
작가의 이전글 스티브 잡스의 도발(?)과 제프 베조스의 결정적 순간
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari