데이터 라벨링의 노예들, 실리콘 밸리의 유령들

by 안녕 콩코드

​매끄러운 인공지능 뒤의 거친 손마디

​우리는 ChatGPT가 시를 쓰고, 자율주행차가 보행자를 알아서 피하는 모습을 보며 전율한다. 마치 이 모든 과정이 매끄러운 코드와 고결한 알고리즘의 힘만으로 이루어지는 것처럼 보인다. 하지만 이 화려한 지능의 무대 뒤에는, 관객들이 결코 보아서는 안 될 '공장'이 숨겨져 있다.


​그 공장의 이름은 '데이터 라벨링(Data Labeling)'. 이곳에서는 수만 명의 인간들이 하루 10시간 넘게 모니터 앞에 앉아 기계가 공부할 교과서를 만든다. AI가 "이것은 고양이입니다"라고 말하기 위해서는, 누군가가 수백만 장의 사진 속 고양이 얼굴에 마우스로 정교하게 선을 긋고 '고양이'라는 꼬리표를 달아주어야 한다. 이 단순하고 고통스러운 반복 노동이 바로 현대 AI의 진정한 엔진이다.


​우리는 이를 '인공지능의 식민지'라 부른다.


​케냐의 슬럼가와 실리콘 밸리의 알고리즘

​나이로비의 낡은 건물, 혹은 필리핀의 비좁은 PC방. 이곳에 모인 청년들은 시간당 1~2달러를 받으며 실리콘 밸리의 최첨단 AI를 학습시킨다. 그들이 하는 일은 기괴할 정도로 단순하지만 잔인하다. 자율주행 AI를 위해 교통사고 현장 사진 속 시신과 파편을 분류하거나, 챗봇의 혐오 발언을 방지하기 위해 온갖 입에 담지 못할 음란물과 폭력적인 텍스트를 온종일 읽으며 '유해 콘텐츠'라는 태그를 단다.


​OpenAI의 챗봇이 그토록 예의 바르고 도덕적인 문장을 내뱉을 수 있는 이유는, 케냐의 노동자들이 그 기계가 내뱉는 가장 구역질 나는 말들을 대신 다 받아냈기 때문이다. 그들은 심리적 외상(PTSD)에 시달리면서도 마우스를 멈출 수 없다. 그들이 꼬리표를 하나 달 때마다 AI는 영리해지지만, 그들의 정신은 서서히 마모되어 간다.


​이것은 2화에서 다루었던 '체스 두는 인형 터크'의 현대판 비극이다. 사람들은 기계의 천재성에 감탄하지만, 실상 그 천재성은 수만 명의 인간 노동을 갈아 넣은 결과물일 뿐이다. 인공지능은 결코 저절로 태어나지 않는다. 그것은 철저하게 인간의 피와 땀, 그리고 시력을 먹고 자란다.



지능의 민주화인가, 착취의 자동화인가

​AI 기업들은 이를 '지능의 민주화'라고 포장한다. 전 세계 어디서나 인터넷만 연결되어 있다면 돈을 벌 수 있는 기회를 제공한다는 논리다. 하지만 실상은 다르다. 데이터 라벨링은 경력이 쌓이지 않는 '막다른 노동'이다. 알고리즘이 똑똑해질수록 라벨러들의 일감은 정교해지고 난이도는 높아지지만, 그들의 처우는 늘 최저 수준에 머문다.


​더 비극적인 것은, 라벨러들이 정성껏 만든 데이터가 결국 자신들의 일자리를 위협하는 AI를 완성한다는 사실이다. 그들은 자신의 존재를 지워버릴 기계를 위해 스스로의 지능을 조금씩 떼어 기계에게 이식하고 있는 셈이다.


​우리는 흔히 "AI가 인간의 일자리를 뺏을 것"이라고 미래형으로 말한다. 하지만 저임금 국가의 노동자들에게 그 미래는 이미 오래전부터 '현재'였다. 그들은 AI라는 거대한 제국의 건설을 위해 가장 낮은 곳에서 벽돌을 나르는 이름 없는 석공들이다.


​고스트 워크(Ghost Work)의 시대

​미국 인류학자 메리 그레이는 이를 '고스트 워크(Ghost Work)'라고 명명했다. 소비자의 눈에는 보이지 않지만, 디지털 시스템이 원활하게 돌아가도록 뒤에서 받치고 있는 유령 같은 노동이라는 뜻이다.


​우리가 배달 앱에서 음식을 주문할 때 최적의 경로를 짜주는 알고리즘 뒤에도, AI가 판별하지 못한 주소를 손으로 수정하는 유령 노동자가 있다. 소셜 미디어에 올라온 부적절한 사진을 순식간에 삭제하는 '스마트 시스템' 뒤에도, 끔찍한 이미지를 눈에 담으며 삭제 버튼을 누르는 인간 검열관이 있다.


​우리는 기술이 인간을 노동에서 해방해 줄 것이라 믿었지만, 오히려 기술은 인간을 더 잘게 쪼개어 알고리즘의 부품으로 소모하고 있다. 이것은 80년 전 노버트 위너가 우려했던 '인간의 비인간적 활용'이 가장 극단적인 형태로 나타난 모습이다.


우리가 클릭하는 매 순간의 무게

​브런치 독자 여러분, 오늘 당신이 웹사이트에 로그인하며 "로봇이 아닙니다"라는 체크박스를 누르고, 화면 속 소방차나 횡단보도 사진을 클릭했던 순간을 기억하시나요?


​그 짧은 순간, 당신은 구글의 자율주행 AI를 위해 공짜로 데이터를 라벨링해 준 셈입니다. 우리는 모두 어느 정도는 AI를 위해 무임금으로 봉사하는 라벨러들입니다. 우리가 무심코 누른 '좋아요'와 우리가 검색창에 입력한 단어 하나하나가 거대 기업의 서버로 흘러 들어가 그들의 AI를 살찌웁니다.


​AI 시대의 화려함에 취하기 전, 우리는 한 번쯤 멈춰 서서 생각해야 합니다. 이 매끄러운 화면 뒤에서 누가 눈을 비비며 데이터를 분류하고 있는지, 그리고 나 역시 알게 모르게 이 거대한 기계의 부품이 되어가고 있는 것은 아닌지 말입니다. 지능은 고귀한 것이지만, 그 지능을 만드는 과정은 결코 고귀하지 않았음을 기억해야 합니다.


​다음 화에서는 한층 더 뜨거운 논쟁거리로 들어가 보겠습니다. AI가 그린 그림, AI가 쓴 소설. 과연 이것을 '예술'이라 부를 수 있을까요? 그리고 그 주인은 누구일까요? '인공지능이 그린 그림은 누구의 것인가: 저작권법의 붕괴와 창작의 재정의' 편입니다.



​[작가 노트]

이번 11화에서는 AI의 기술적 성취 뒤에 숨겨진 불평등한 노동 구조를 거친 호흡으로 담았습니다. 독자들에게 익숙한 '로봇이 아닙니다' 테스트부터 제3세계의 고스트 워크까지 연결하여, 사회경제적 통찰을 제공하고자 했습니다.