brunch

You can make anything
by writing

C.S.Lewis

by Toriteller 토리텔러 Jun 21. 2022

AI용 학습자료를 만드는 데이터 라벨링

大AI시대. AI 관련 산업은 계속 커지는 중 

요즘 AI(Artificial Intelligence)는 선택이 아니라 필수입니다. 바둑에서 인간을 이긴 알파고 이후 AI는 ‘자세히는 모르지만 대단한 기술’로 여겨지는 분위기입니다. 인공지능이라 번역되는 AI는 서비스뿐만 아니라 가전에도 적용되고 있습니다. 청소기, 공기청정기, 에어컨에도 AI가 들어있고 자율주행으로 대표되는 자동차는 AI가 광범위하게 사용 중이며 더욱 확대될 겁니다. AI면접 및 고객응대도 일반화될 거고, 로봇 저널리즘이라고 AI가 기사를 쓰는 것이나 AI를 활용한 투자자문도 일상화되고 있습니다. 


AI는 모든 것을 알아서 할까?

AI의 정의를 내려보라면 저는 ‘인간의 판단을 대신하는 기술’이라고 할 겁니다. 사람의 판단을 대신하는 이유는 빠르게, 더 넓은 사례를 기반으로, 쉬지 않고, 질적인 편차 없이 일할 수 있기 때문이라고 생각합니다. 나보다 더 많이 알고, 더 똑똑하고, 게다가 잠도 자지 않고 일할 수 있다면 굳이 사람을 쓸 필요가 있을까요? 다행스러운 일은 아직 AI가 사람을 완전히 대체할 만큼 똑똑하지는 않습니다. 똑똑한 AI를 만들기 위해서는 AI 역시 ‘학습’이 필요합니다. 


AI를 학습시키는 것은 아직 인간의 몫

영재들 일수록 좋은 스승을 찾아 다니 듯 아무리 똑똑한 아이도 좋은 선생님을 만나야 합니다. AI 역시 좋은 선생님과 교재가 필요합니다. 털 뭉치와 몸을 구부린 고양이를 구분하는 것이 사람에겐 쉽지만 AI에게는 쉽지 않은 일입니다. 그 외에 표지판을 구분하고 글씨를 읽고, 수많은 운송수단 사진 중에 스포츠카를 구분하는 등 더 어려운 일도 있습니다. 눈치 없는 일부 사람도 있지만 사람들이 쉽게 구분하는 사람의 표정도 화를 내는 것인지, 웃는 것인지 AI에게는 어려울 수 있습니다. 그래서, AI를 잘 가르칠 사람이 아직 필요하고, AI를 교육하는 학습자료를 만드는 것이 하나의 직업군으로 자리매김하는 중입니다. 


AI를 위한 데이터, 그리고 데이터 라벨링

AI는 똑똑해지기 위해 학습용 데이터가 필요하다고 말씀드렸습니다. AI 학습용 데이터에는 ‘이건 털 뭉치고, 이건 고양이야’라는 문제와 정답이 들어 있어야 하고, 사람의 역할은 이런 문제와 정답 묶음 데이터를 만드는 것입니다. 학습 데이터가 많을수록, 원하는 목적에 맞게 제작된 데이터일수록 인공지능은 기계적 부지런함으로 빠르게 똑똑해질 겁니다. 대신, 복잡한 학습을 시키려 할수록 데이터 작업의 난이도는 올라가겠죠. 단순한 작업에서부터 전문성이 필요한 작업까지, AI를 활용하는 사업이 커질수록 할 일이 늘어날 겁니다. AI산업이 확대되면서 이런 작업을 잘 수행하기 위한 Data Labelling (AI학습용 데이터를 만드는 일)과 Data Labeller (학습용 데이터를 만드는 사람)라는 새로운 일과 직업이 탄생하게 됩니다. 


아무에게나 보다 증명된 사람에게

산업이 만들어지고 성숙되어 갈수록 비숙련, 비전문가보다 숙련된 전문가가 필요해집니다. 데이터 라벨링 업무는 장소나 시간에 구애받지 않고 PC나 모바일만 있으면 어디에서나 여유 시간을 활용해 자기 주도적으로 할 수 있으니 일하는 사람 입장에서도 장점이 있습니다. 데이터라벨링 업무 자체가 공장 같은 곳에 모여서 하는 것이 아니고 본인의 PC나 스마트폰을 활용해 비대면으로 이루어지니 누구에게 일을 맡길지 정하기 어려울 겁니다. 그래서 AI 관련 회사들이 모여 협회를 만들고, 적절한 기준을 제시하고, 이 기준을 통과한 사람들에게 자격증을 부여하고, 자격증을 보유한 사람에게 더 전문적이며 높은 대가의 일을 주려는 일반적인 산업 발전 구조를 따라가게 됩니다. 게다가 지금은 산업이 커지는 중이니 일감은 많을 것이라 생각됩니다.  



교육, 업무배분을 지원하는 크라우드웍스

자격증을 따려면 먼저 알아야겠죠. 크라우드웍스는 5월 31일 자격증을 준비하는 아카데미 과정을 오픈했습니다. 이미 크라우드웍스에서는 현재까지 약 36만명의 데이터 라벨러에게 누적 140억원 정도의 수익을 배분했다고 합니다. 그동안 알음알음으로 진행되던 업무에 본격적인 틀과 기준을 만들어가는 과정의 하나로 아카데미를 연 것으로 보입니다. 교육을 받고, 인공지능협회의 자격시험에 응시(유료 7만원)한 후 시험을 통과하면 온라인으로 자격증이 주어집니다. 협회에서 자격증을 주는 가장 큰 목적은 결국 협회에 속한 기업들이 활용할 잘 만들어진 데이터를 안정적으로 공급받고 싶기 때문입니다. 자격증은 2급으로 출발해 좀 더 전문적이고 고급 업무(=단가가 비싼)를 수행하는 1급(준비중)까지 이어집니다. 2급 자격증을 따고 난 후 크라우드웍스에서 인증하면 자격을 증명해 주는 배지를 얻을 수 있습니다. 


쉽게 시작해서 꾸준히 한다면

처음에 일을 맡게 된다면 일부 쉬운 일만 고를 수 있을 겁니다. 대가도 아주 만족스럽지는 않을 테고요. 어쩌면 ‘이건 인형 눈알 붙이는 일이잖아!’라며 치워버릴 수도 있을 겁니다. 그런 와중에서도 누군가는 꾸준히 기술을 쌓으며 단순한 업무를 넘어 점점 복잡하고 전문적인 업무로 발전해 나가게 될 겁니다. 그러다 “우와! 언제 그만큼이나 벌었어?”라는 이야기를 듣게 되겠죠. 모든 인생에서의 선택은 항상 본인 몫입니다. 전문가를 목표로 시작해 볼지, 아니면 짬짬이 용돈벌이로 할지, 놀면 뭐하나라는 심정으로 해볼지, 하다가 말지 등등 선택과 노력에 따라 결과는 달라질 겁니다. 어떤 결과라도 얻고 싶다면 한 발자국이라도 움직이는 실천을 해야 합니다. 재테크나 주식투자도 마찬가지입니다. 뭔가 들었고 이해되었다면 실천해봐야 온전히 알게 됩니다. 그래야 자기의 투자 방향이 맞는지 틀리는지 알 수 있게 되면서 최적화할 수 있습니다. 한 발자국, 손가락 한 번이라도 까딱하지 않으면 인생에서 달라지는 것은 아무것도 없습니다. 

크라우드웍스 아카데미 자격증 교육과정 : https://bit.ly/3xDwyHb


<본 글은 소정의 고료를 받고 제 의견대로 작성했습니다>

작가의 이전글 매월 수익금을 받을 수 있다면
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari