요즘 AI는 굉장하다. 심심이는 이루다가 되었고, 체스 기계는 알파고가 되었다. 그림도 글쓰기도 자동으로 뚝딱 완성하는 시대. 자동차는 차선에 맞춰 핸들을 자동 조정하고 주위 사물을 식별하여 브레이크를 밟는다. 삐삐 메시지를 공중전화에서 확인하던 시대에서 자율주행차가 도로를 달리기까지 30년이 채 걸리지 않았다. 이런 경이로운 시대를 만들기 위해서 반드시 필요한 일이 있는데, 그건 기계의 학습이다. 이럴 때는 주로 이런 말을 하고, 이런 모양은 사람이고, 저런 모양은 자동차다라는 것을 누군가가 기계에게 알려줘야 한다. 그것을 알려주는 주체는 사람이다. HI(human Intelligence)가 AI의 스승인 격이다.
이루다에게 방대한 양의 채팅을 건네주고, 알파고에게 엄청난 양의 대국을 건네준 주인공. 특정 주제별로 작성된 엄청난 텍스트와 주행 중 촬영된 블랙박스 영상을 몽땅 날라서 기계에게 건네준 것은 사람이다. 그리고 그 데이터를 깔끔하게 가공해서 공부하기 쉽게 정리를 해준 것도 사람이고. 방대한 지식을 깔끔한 자습서로 만들고 연습문제까지 알차게 제공해주면 기계는 인간의 두뇌 구조를 모방한 알고리즘을 이용하여 학습도 하고 스스로 테스트도 본다(Training & Test).
이 일련의 과정에서 직업이 하나 생겼다. '데이터 라벨러'라고 부르는 직업. 텍스트나 이미지 같은 날 것의 데이터를 받아 그것을 기계가 학습하기 쉽도록 가공하는 작업자들이다. 대화 셋을 만들기도 하고, 이미지에 사람이나 물건의 위치를 표시하여 기계에게 넘긴다. 민가와 군사시설을 알려주고, 집과 공장을 구별하게 한다. 작업을 하면 '리워드'나 '포인트'가 지급된다. 재택근무가 가능하고 원하는 때에 일하면 고수익을 올릴 수 있다는 동화 같은 이야기에, 나 역시 데이터 라벨링 일을 시작하게 됐다. 강아지를 식별하고 혐오 발언을 가려내는 노고에 동참하기로 했다.
이 글에선 데이터 라벨링 일을 하면서 겪었던 여러 경험을 기록해 보려고 한다. '미세노동(microwork)'이라는 말은 <노동자 없는 노동>이란 책에서 데이터 라벨링 노동을 지칭한 용어다. 아마존의 제프 베조스가 처음 사용한 용어라고 한다. 미세노동이라는 단어가 데이터 라벨링 업무를 대표할 수 있는 꽤 괜찮은 단어인 것 같아 나도 이 단어를 쓰게 됐다. 재택 경제 활동인 나의 HI 생활, 미세노동에 대해 조금 기록해 보고자 한다.