학교교육은 원래 노동자를 양성하고 길들이기 위한 '훈련'이라는 말이 있다. 9시에 출근해서 6시에 퇴근하는 바이오 리듬을 키우기 위해 8시에 등교하고 5시에 하교하는 연습을 하는 데가 학교라고. 공부보다 정해진 시간에 왔다 갔다 하는 습관과 체력을 기르는 게 우선이라는 이야기를 들은 적이 있다. 학교에서 가르치는 상식과 지식도 사회의 노동자 혹은 피지배자로 살아가기에 적합한 의식과 지식을 알려주는 거라고. 뭐. 반은 맞고, 반은 아니라고 생각한다.
어쨌든 데이터 라벨링을 할 때도 더 많은 업무를 하기 위해서는 교육을 받아야 했다. 단순히 튜토리얼 영상을 보고 따라 진행하는 식으로 교육을 진행하는 사이트도 있었고, 교육비를 받고 작업 방법을 알려주는 곳도 있었다. 사이트 별로 차이는 있지만 교육을 받고 교육 이수에 관한 인증을 받으면 조금 더 많은 작업 기회가 주어지는 건 비슷했다.
50원, 100원짜리 작업을 몇천 번은 해야 마련되는 교육비. 이렇게 말하니까 엄청 많은 것 같지만 사실 몇만 원 정도다. 하지만 몇만 원 벌기에도 힘든 이 미세노동 시장에서 선뜻 그 교육비를 내기란 쉬운 결정이 아니었다. 버는 돈 보다 쓰는 돈이 더 많은 느낌이랄까. 그래도 교육을 하는 데는 다 이유가 있단 생각에 나는 교육과 자격시험에 약 20만 원이 넘는 돈을 지출했다.
교육과정은 실망스러웠다. 교육과정엔 데이터 라벨링에 관한 여러 작업 유형을 실습하는 과정과 머신러닝에 대한 개요 정도가 소개되었다. 초급 교육과 중급 교육에서 나오는 머신러닝에 관한 이론은 거의 대동소이했고, 데이터 라벨링 작업자들에게 큰 의미가 있는 내용이 아니었다. 대화문을 생성하면서 bert와 기존 transformer의 차이점을 알아야 할까? yolo 5와 yolo 7의 차이점을 알아야 세그멘테이션을 제대로 할 수 있을까? 작업자들에겐 딥러닝의 옵션 값을 설정하는 것보다 가이드를 정확하게 숙지하는 것이 중요할 테다. 그래도 긍정적으로 바라보면 AI 발전에 기여하는 작업자들에게 기본적인 개요 정도를 한 번 '들려주는' 의미 정도로 이해할 수는 있겠다. 부정적으로 바라보면 이 내용은 자격 시험 문제를 만들기 위한 용도겠구나 생각해볼 수 있겠고.
진짜 교육은 과정 속에 숨어 있는 실습이었던 것 같다. 반복 연습으로 제대로 작업하는 연습을 시키는 것. 머신러닝에 대한 이론 교육과 이 연습의 비율은 체감상 2:8 정도 된다. 그러니까 이 유료 교육의 핵심은 이 연습, 작업자 훈련인 것이다.
이 유료 훈련을 듣고 작업의 숙련도가 높아질까? 잘 모르겠다. 실제로 데이터 라벨링 작업자들이 모여 있는 네이버 카페에 가보면 유료 교육의 실효성에 대해 의문을 표하는 작업자들도 있다. 데이터 라벨링의 유료 교육이 필요하냐, 필요하지 않냐는 초등학생이 학원에 다녀야 하냐, 말아야 하냐 만큼 해당 카페에서 평행선을 달리는 이슈인 것 같다. 하지만 중요한 건 돈을 내고 이 훈련에 참가한 사람들에겐 좀 더 많은 기회가 주어진다는 것. 그러니 해당 사이트에서 일을 하겠다 마음을 먹었다면 필연적으로 이 훈련비는 지출하게 되어 있다. 시간 문제일 뿐.
최소한의 교육을 수료한 사람에게만 작업의 기회를 준다는 생각은 어떻게 보면 합리적이다. 출신 학교와 자격증이 힘이 있는 이유가 있으니까. 하지만 저임금의 작업을 하기 위해 모인 사람들에게 (비교적) 비싼 비용을 받고, 자격증 비용까지 받으면서 교육의 마스크를 쓴 훈련을 요구하는 것은 충분히 씁쓸하게 생각할 수 있다고 생각한다. 이런 생각을 하면서도 나는 해당 과정을 수료하고 자격증을 꾸역꾸역 두 개나 땄다.
분명한 것은, 이 훈련은 내가 새로운 기술을 얻고 최신의 지식을 얻을 수 있는 교육이 아니었다. 그냥 리워드를 받고 하루를 살아가기 위해 몸부림쳤던 순간 중 하나였을 뿐. 교육에 대한 환상이 있는 걸까. 이 훈련 과정에 '교육'이란 라벨을 붙인 것이 영 불만스럽다.