인도의 데이터 비영리 단체 카리아AI(Karya AI)
AI 학습에 필요한 많은 데이터를 만드는 사람들이 있습니다. AI 윤리 레터는 데이터 노동자에 대해 여러 차례 다뤄 왔는데요. 데이터 노동자까지 고려하는 인도의 한 데이터 비영리 단체 카리아AI(Karya AI)가 타임지에 소개되었습니다. 카리아AI는 자신들을 “세계 최초의 윤리적 데이터 회사”라고 자처합니다. 카리아AI는 다른 데이터 회사와 무엇이 다를까요?
노동자가 받는 금액도 중요하지만, 더욱 중요한 것은 기업의 분배 논리입니다. 오픈AI에 데이터를 공급하며 5만 명을 빈곤에서 구출했다고 홍보해 왔던 데이터 기업 Sama가 케냐의 AI 노동자를 착취해 왔던 사실이 밝혀지는 등 기업의 수익을 노동자의 이익보다 우선하는 사례는 흔하기 때문입니다. 카리아AI는 노동자와 농촌을 앞세운 분배를 설계합니다.
카리아AI는 노동자에게 시간당 최소 5달러를 지불합니다. 이는 인도 최저임금의 20배에 달합니다. 지금까지 약 3만 명의 농촌 인도인에게 약 80만 달러의 임금을 지급했습니다.
부의 재분배를 위해 비영리 단체로 운영합니다. 노동자에게 충분한 수익을 배분한 후, 잉여 이익은 농촌 빈민에 재투자합니다.
노동자에게 데이터 소유권이 있으면, 데이터가 재판매될 때마다 추가 소득을 얻을 수 있습니다. 데이터 원작자에게 데이터 재판매 비용을 보상하려는 시도는 종종 있었습니다. 이미지 공유 플랫폼 셔터스톡도 AI에 데이터가 재사용될 때마다, 데이터 원작자에게 일정 비용을 보상한다고 발표했죠. 그러나 실제 보상이 어떻게 이루어지는지, 수익 배분율은 어떻게 정해지는지도 살펴봐야 합니다.
카리아AI의 데이터 재판매 수익은 100%가 노동자가 투입한 시간에 비례하여 배분됩니다.
지금까지 약 4,000명의 직원에게 11만 6,000달러의 로열티를 지급했습니다.
데이터 회사들은 대부분 “쉽게 원하는 소득을 얻을 수 있다”며 소득 중심의 홍보를 합니다. 반면 데이터 노동자들은 노동으로 부자가 되는 것은 결국 기업이라고 이야기하죠.
한편 카리아AI는 노동자의 최대 수입을 인도의 평균 연봉인 1,500달러로 제한합니다. 이는 더 많은 사람에게 노동의 기회를 주기 위한 노력이자, 데이터 노동이 주 수입원이 아닌 보조 수입으로 활용되도록 하기 위함입니다.
하지만 아이러니하게도 아직 단 한 명도 1,500달러의 수입에 도달한 적이 없다고 하네요.
데이터 노동은 주로 영어를 공용어로 사용하는 인도, 케냐, 필리핀 등에서 이루어집니다. 그러나 영어를 할 줄 모르는 지역 사회 사람들은 정작 AI 포함한 기술의 혜택을 얻기 어렵습니다.
카리아AI는 인도의 칸나다어를 포함한 지역 언어로 AI 모델을 구축합니다.
예를 들면, 의료 NGO와 협력하여 인도에서 매년 약 20만 명의 목숨을 앗아가는 결핵에 대한 음성 데이터 세트를 지역 언어로 구축하고 있습니다. 이러한 지역 언어로 AI 모델을 만들어 결핵에 대한 정보를 쉽게 얻고 예방하는 것이 목적이라고 합니다.
본 글은 AI 윤리레터 12호에 작성한 글입니다.
AI 윤리레터는 AI 윤리를 고민하는 직장인, 프리랜서, 대학원생이 꾸려가는 소식지입니다.
매주 쟁점이 되는 AI 윤리 소식을 각자의 관점을 담아 전달합니다.
함께 읽으면 좋을 지난 레터
이 주의 노동 카드: 생성 AI 시대 바람직한 노사관계