brunch

You can make anything
by writing

C.S.Lewis

by 한사랑 Feb 04. 2024

데이터 라벨러를 아시나요?

마흔넷에 새로운 일을 시작했다.

나는 주부이면서 프리랜서 데이터 라벨러다.


 뜬금없이 잡(Job) 밍아웃을 하는 이유는 이전글 때문이다.

 이전 글에서 나는 내가 왜 다시 일을 하게 되었는지에 대해 이야기했었다.(내가 일을 시작한 건 간병비 때문이었다.(2) 참조)

 다시 일을 시작하게 된 계기에 대해 이야기를 했으니 이번엔 내가 하고 있는 일에 대한 글을 써보고 싶어졌다. 그래서 오늘은 데이터 라벨러라는 내 일에 대한 아주 전문적인 글을 써 볼 생각이다.

 아주 전문적인 글이므로 이게 뭔데? 하는 호기심으로만 읽어주시고 혹시나 부업으로 관심이 있어 알아보고 있는 분들이 보게 된다면 주관적인 의견으로 참고해 주시면 좋겠다.


 나의 본업은 주부이고 부업으로 데이터 라벨링을 하고 있다. 회사를 나가는 건 아니지만 그래도 돈을 벌고 있기 때문에 농담반 진담반으로 남편에게 프리랜서라고 우기는 중이다.

 재택근무를 하기 때문에 비교적 자유롭게 시간을 관리하며 일을 하고 있다. 덕분에 일을 쉬는 기간엔 이렇게 글을 쓸 수도 있고 책을 보며 시간을 보낼 수도 있다.

 사실 글을 쓰기 전에 잠깐 고민이 되었다. 브런치라는 공간이 정보를 제공하는 공간이라기보다는 글을 쓰고 싶어 하는 사람들의 공간이다 보니 어찌 보면 정보성 글 같은 이 글이 여기에 어울릴 수 있을까 하는 고민이었다.

 그러다 요즘 N잡러(본업 외에 부업을 하는 이들을 일컫는 말)가 유행이기도 하고, 그에 따라 부업에 대한 관심도도 높아지고 있으니,  내가 이 일을 해나가며 알게 된 일들과 감상을 적어보는 건 괜찮지 않을까 싶어 용기 내어 몇 자 적어보기로 했다.

 더불어 데이터 라벨링이라는 일에 관심을 갖고 계시는 분들이 이 글을 본다면 조금이나마 도움이 될 수 있었으면 좋겠다.




데이터 라벨러란 무엇일까?

데이터 라벨러란 AI가 창조되면서 덩달아 창조된 직업이다.

간단히 말하자면 AI를 가르치는 선생님으로 고용된 사람들이다.

일을 해보겠다고 결심을 하고 교육을 받을 때 참 인상 깊었던 설명이 있었다. 데이터 라벨러와 AI를 엄마와 아기에 비유한 설명이었다.  엄마가 아기에게 그림책을 보여주고 있다. 그림을 하나하나 손가락으로 가리키며

출처 Pixabay

"이건 버스라고 해. 이건 눈이고 이건 코라고 부르는 거야."


하고 알려준다. 이렇게 엄마가 아기에게 알려주는 것처럼 데이터 라벨러는 AI에게 세상 모든 걸 가르치는 일을 하는 사람이다.


"이건 글자고, 이건 바코드야, 이건 가격이고, 이건 과일이고, 이건 사람이야." 등등.


 처음엔 단순한 컴퓨터 프로그램이었던 AI가 데이터 라벨러들이 가르쳐 준 정보를 바탕으로 점점 정교하고 자연스럽게 자라면서 챗GPT도 되고, 밀리의 서재에서 제공하는 TTS(Text to Speech) 서비스도 해나가게 되는 것이다.  

 중요한 건 엄마든 선생님이든 올바르게 가르쳐 주지 않으면 AI도 잘못된 지식을 가지고 자라날 수 있다. 오류가 생긴다는 말이다. 그래서 데이터 라벨러는 늘 신중하고 꼼꼼하게 일해야 한다.


그래서 정확히 어떤 일을 하는 걸까?

 기본적으로 컴퓨터 작업이다.

 라벨링을 하는 특별한 프로그램을 가지고 일을 하는 경우도 있지만 대부분 기본적인 컴퓨터 작업만 할 수 있으면 일을 할 수 있다.

 일의 종류도 다양한데, 대부분 AI에게 알려줄 자료를 만드는 일들이다. 이미지를 선택하고 기준에 따라 라벨링(이름 붙이기)을 하거나 질문에 대한 더 나은 답변을 찾는 텍스트작업도 있고 직접 대화문을 만드는 작업도 있다. 결국 AI가 좀 더 사람처럼 일할 수 있도록 가르치는 자료를 만드는 작업들이다.

 자료를 모으고 계산하고 만드는 거라면 사람이 하는 것보다 컴퓨터가 더 정교하고 정확하겠지만, 실제 삶에는 정답이라고 말할 수 없는 명확하지 않은 상황들이 꽤 있다. 예를 들어 흔히 하는 말 중에 "그래. 너 잘났다."라는 말을 들으면, 보통 사람들은 이게 비꼬는 건지, 농담인지 판단을 할 수 있다. 하지만 컴퓨터는 "응. 나 잘났어."하고 생각해 버릴 수 있다는 거다. 그런 종류의 애매한 상황이나 판단에 대한 자료들은 사람이 직접 작업해서 알려주는 수밖에 없다고 한다.

 은행의 AI고객센터 프로그램이 더 자연스럽게 응대할 수 있도록 대화문을 만들거나 평가하는 등의 작업을 할 수도 있고, TTS 서비스의 음성으로 책을 들을 때 더 자연스러운 억양이나 말투를 쓰도록 교정하는 업무도 데이터 라벨러의 업무 중 하나다.

 도로 위의 수많은 상황들을 하나하나 분석하고 분류해서 이름을 붙여주면 그 데이터들을 기초로 자율주행 프로그램이 만들어지기도 하고 학습 데이터와 대상자의 기초정보를 모아 공부를 도울 수 있는 AI가 만들어지기도 한다.

 이 외에도 수업이 많은 종류의 라벨링이 존재한다.(① 이미지 ② 텍스트 ③ 음성 ④ 비디오 등등) 분야마다 하는 업무도 다르고 같은 업무 내에서도 중점으로 하는 일이 다르기 때문에 일을 시작하기 전에 가이드라인을 꼼꼼하게 살펴보아야 한다.

 

 데이터라벨링은 하는 일에 따라 작업자와 검수자로 나뉘는데 작업자는 직접 라벨링을 하는 업무이고, 검수자는 라벨링의 정확성을 높이기 위해 작업자의 일이 올바르게 이루어졌는지를 평가하고 피드백하는 업무를 한다. 아무래도 평가를 하려면 작업자보다는 검수자가 경험이 많이 필요하기 때문에 처음에는 작업자로 일을 하다가 검수자로 넘어가는 경우가 많다고 한다.

 일의 종류가 다양해서 모두 설명을 할 수는 없지만 그 종류가 다양한 만큼 선택의 폭이 넓다.

 모두 다 잘하는 사람도 있겠지만, 대부분은 보통 자신에게 맞는 일이 있다고 한다. 사람에 따라 이미지 라벨링을 잘하는 사람이 있고, 텍스트 라벨링을 잘하는 사람이 있다는 말이다. 잘 맞는 작업이 많고 잘할 수 있는 능력이 된다면 여러 곳에 모두 지원할 수 있어서 일자리 찾기가 편하고 돈도 많이 벌 수 있다.

나도 그랬으면 좋겠지만 내 능력은 제한적이라 좀 아쉽다.


자격증이 필요한 건 아닌가요?

 결론부터 말하자면 자격증이 있으면 득이 되지 실이 되지는 않는다. 하지만 굳이 자격증까지 따라고 권하고 싶지는 않다.

공인된 교육 프로그램으로 데이터 라벨링 교육을 수료할 수 있는데 교육을 받으면서 "아~ 이런 일이구나." 하고 개념을 이해하며 기초적인 라벨링 기술을 배운 후, 실제 일을 할 때는 각각의 가이드라인에 따라 일을 하게 된다. (공인된 교육을 해주는 곳이 몇 군데 있는데 나는 크라우드 웍스에서 교육을 받았다. 인터넷 강의 이므로 시간, 장소 구애 없이 교육을 받을 수 있다.)

 2023년도까지는 무료교육이라길래 작업자 과정을 먼저 듣고 바로 검수자까지 들었는데 (나는 공짜에 약하다.) 분야가 많아서 교육을 듣는데도 시간이 꽤 걸렸다. 현재는 2-3만 원 정도 돈을 내는 것으로 알고 있다.


 하지만 자격증은 따지 않았다. 교육 과정을 수료하고 바로 실전에 도전해 봤는데 실전을 겪어보니 자격증에 대한 회의가 더 많이 생겼다. 다른 일도 마찬가지겠지만 데이터 라벨링 역시 실무에서 배우는 게 훨씬 더 많다. 기본개념과 기초 기술을 습득했다면, 실제 일을 할 때는 기초지식을 바탕으로 프로젝트마다 주어지는 가이드라인에 따라 일을 하면 된다.

 하지만 그래도 이왕 하는 거 나는 더 전문적으로 일을 해보고 싶다고 생각을 한다면 선택은 각자 하면 될 것 같다.


일은 어떻게 구하나요?

 프리랜서라는 말에서도 알 수 있듯이 한 회사에 계속 소속이 되어 일을 하는 게 아니다. 프로젝트가 끝나거나 계약기간이 끝나면 바로 실직이다.

 그래서 일을 하고 있는 중에도 알바몬, 잡코리아, 사람인, 알바천국 같은 사이트에 올라오는 공고를 늘 눈여겨보아야 하고 데이터 라벨러들이 모여있는 카페에서 일자리 정보를 찾기도 한다. 나도 카페에 가입이 되어 있는데 요즘은 해외 라벨링 사이트에서 일하는 분들도 종종 보인다.

 데이터의 종류에 따라 영어, 수학 전공자들을 우대하는 작업도 있고, 특정 직업(금융업이나 의료계, 교육계 등)의 경력자들을 우대하는 작업도 있다.  

 하지만 상관없이 지원할 수 있는 일도 많기 때문에 나는 일단 다양하게 지원서를 내보는 편이다.

 덕분에 정말 나와 맞지 않는 일을 맡아 밤을 하얗게 새보기도 했고(머리가 하얗게 새 버리는 줄 알았다.), 의외로 재미있는 일을 만나 재미있게 돈을 벌어본 적도 있다. 그러면서 경력을 쌓아가는 것이므로 만약 데이터 라벨링에 관심이 있다면 처음엔 이것저것 가리지 말고 많은 것을 해보기를 권한다.


수입은 얼마나??

 사실 제일 중요한 게 수입인데, 이게 매달 일을 하는 만큼 버니까 대중이 없다. 장기 프로젝트도 있지만 아닐 경우가 더 많다 보니, 일이 항상 있는 것도 아니고, 쉴 땐 한 달씩 쉰 적도 있다. 그래서 수입도 매달 편차가 많다.

 많이 벌 땐 직장인 때보다 더 많이 벌 기도 하고, 일이 없을 땐 아주 없기도 하기 때문에 그래서 부업으로는 추천하지만 생업으로는 좀..

 급여 조건도 일마다 다르다. 월급, 주급, 시급, 건당 얼마 등등. 그나마 액수가 점점 줄고 있고,  재택근무일 경우는 최저 시급을 밑도는 경우도 있어서 요즘은 좀 우울한 게 사실이다. (꼭 부업으로 하시길 권합니다.)


 나 같은 경우는 부업으로 하고 있기 때문에 수입이 많으면 많아서 좋고, 일이 없을 땐 책도 실컷 읽고 이렇게 글도 쓰고, 자기 계발 유튜브도 보면서 공부도 한다. 일을 시작하고 이런 나만의 시간이 얼마나 소중해졌는지 모른다. 물론 이런 시간들이 소중하지 않았던 적은 없지만, 한참 정신없이 일하다가 잠깐의 여유가 생기면 그 달콤한 맛이 또 일하는 묘미 중 하나가 아닐까 싶다.




나는 현재 이런 일을 하고 있다. 예전에 간호사 일을 할 때보다 시간 활용하기가 좋고, 체력적으로 힘도 덜 들지만 돈은 적게 번다. 당연한 말이다. 짬나는 시간에만 일하면서 본업처럼 돈을 벌기를 원하는 건 일확천금을 벌겠다는 말이나 다를 바가 없지 않을까? 조금 일하니 조금 받는 건 당연한 거다.  


 대신 나 같은 주부들에겐 시간활용에 최적화된 일이다. 아이를 어린이집이나 유치원에 보내 놓고 집에 있는 시간을 활용해 돈을 벌 수 있다. 버리는 시간 없이 삶을 알뜰히 사용하고 있기 때문에  돈은 덜 벌어도 지금 생활이 훨씬 만족도가 높다.

 일의 강도가 높지 않아서 덜 힘든 것도 있지만, 사람 만나는 걸 그렇게 좋아하지 않는 나 같은 '극'내향적인 사람에게는 이렇게 앉아서 혼자 하는 일이 심적으로 너무 안정이 된다.

 더군다나 출퇴근하는 시간을 절약할 수 있다. 교통비, 점심값도 안 든다. 집에 있는 밥 먹으면 된다. 그러다 가끔 회사원 기분 내고 싶어서 아이 데려다주고 카페에 들러 라테 한잔을 사 온다. 왠지 카페에서 사 온 라테를 먹으며 일을 하면 더 뿌듯하다.

 일한 만큼 버니까 일하는데 의욕과 동기도 생긴다. 이 세계에 월급 루팡은 없다. 일을 해야 돈이 나온다. 이것도 당연한 건데 이건 좀 아쉽기도 한 걸 보면 난 완벽하게 윤리적인 사람은 아닌가 보다.

 그리고 이것도 내 경우에만 해당될지도 모르는데 텍스트 작업의 경우 사실 검증을 해야 하는 일들도 있아서 잡다한 지식들이 많이 생겼다.

 예전에 관심도 없었던 법률용어라든지, 경제용어 같은 게 뉴스에서 나오면 어? 저걸 어디서 들었지? 하는 나를 종종 발견한다.

 이렇게 쓰다 보니까 데이터 라벨링 예찬론자 같은데, 이건 나에게만 해당되는 지극히 주관적인 평가다.


 물론 단점도 있다. 일이 계속 있는 게 아니라서 늘 고용불안에 시달려야 한다. 프로젝트 하나가 끝나면 바로 실직 상태가 된다.

 일을 내가 직접 찾지 않으면 누가 던져주는 일은 없다. 직장 생활을 할 땐 누가 나한테 일을 던지면 그렇게 싫을 수가 없었는데, 이젠 가끔 누가 좀 던져줬으면 싶다.

 하지만 일을 구하기까지 공백시간이 생기면 그 시간엔 자기 계발을 하겠다고 마음먹고 살고 있다. 그래서 잠깐의 그 여유 있는 시간이 장점이 되기도 한다.


 그리고 마지막으로 이 일에는 또 하나의 이슈가 있다.

 데이터 라벨링이라는 일이 조만간 사라질지도 모른다는 소문이 있다. 사실 내가 일을 시작했을 때도 이미 이제 '이 일은 끝이다, 전망이 없다'라는 말들이 있기는 했었다.

  2-3년 전만 해도 AI개발이 본격화되면서 일자리도 많았고, 정부 지원금도 있어서 수입도 훨씬 많았다고 들었다. 새로운 일에 일찍 눈을 뜬 분들은 투잡으로 일을 하며 꽤 많은 수입을 올린 분들도 있었다고 하던데, 내가 합류했을 땐 이미 너무 늦었다. (한숨이 나오는 대목이다.)

 더구나 2024년부터는 국가지원금도 없고, 그래서인지 진짜 구직사이트에 일이 많이 줄어든 상태다. 그리고 재택근무는 더더욱 많이 줄었다.


 쓰다 보니 좀 걱정스럽긴 하다.

 그럼에도 내가 이 글을 쓰는 건 나는 길이 없다고 보지는 않기 때문이다.

 AI모델이 생기고 발전을 하면 점점 다른 분야로도 영역을 넓혀갈 것이고 다른 영역에서 일을 하기 위해선 라벨러의 역할이 필요해질 수밖에 없다.

 그리고 정 국내에 일이 없다면 해외로 눈을 돌려보는 것도 방법이다. 요즘 나도 얼떨결에 외국계 회사에서 일을 하고 있는데  생각보다 일이 재미있어서 열심히 하고 있는 중이다.

 난 영어를 못해서..라고 처음부터 기죽고 들어가지 말자. 영어는 나도 못한다. 길 가다 외국인이 지나가면 슬그머니 시선을 피하고 지나가는 사람 중 한 사람이다.

 하지만 솔직히 홈페이지 들어가 둘러보고 시험 쳐보는데 돈 드는 것도 아니고, 믿져야 본전이다. 일이 없어서 좌절하고 있다면 좌절할 시간에 들어가 보고 시험도 봐보는 것을 추천한다. 일단 뭐든 해보고 안된다고 해야지 해보지도 않고 되는지 안되는지 어떻게 알겠는가.

 더군다나 내가 외국계 회사를 추천하는 이유는 새로운 AI 개발 후 전 세계적으로 언어 서비스를 지원하기 위해  각국의 원어민 작업자들을 찾는 외국계 기업들이 꽤 있기 때문이다.

 하물며 달러수입이지 않은가. 입금될 때마다 느끼지만 달러는 참.. 은혜롭다.


 언젠가 AI들이 전부 성인이 되어 이제 가를 칠 필요가 없어진다면 데이터 라벨링이라는 일이 진짜 없어질지도 모르겠다. 아니면 유지, 보수, 새로운 개발을 위해 소수의 전문가 그룹만 남게 될지도 모르고, 더 발전하면 AI가 AI를 만들고 가르치는 세상이 올지도 모른다.

 아직은 괜찮아도 미래까지 괜찮다는 보장은 솔직히 없다. 그래서 나는 그때를 대비해 늘 새로운 일도 찾아보고 있다. 새로운 일이 보이면 관심을 가지고 알아보기도 하고, 이렇게 글도 쓰고 새로운 공부도 시작해 본다.

설사 새로운 일에 도전했다가 실패하더라도 배워서 남 주랴. 도전하는 것도 공부라며 쉬지 않고 도전 중이다.

 그렇게 나의 포트폴리오는 오늘도 차곡차곡 쌓이고 있는 중이다.


 끝으로 나도 부업에 관한 이야기를 쓰고 있지만 어느새 우리 사회는 N잡러가 되지 않으면 살아가기가 빡빡한 세상이 되어 버린 것 같다.

 아빠가 직장 다니며 힘들지만 꾸준히 일하면 살아가는 데 문제없이 우리 가족 행복하게 살 수 있던 시대도 있었던 것 같은데, 지금은 세상이 바뀌어도 너무 바뀌었다.

 아빠 월급만 가지고는 아이들 학원 보내고 대학 보내고 노후준비까지 할 수 있는 시대가 아니다. 물론 생활 수준이 높아져서 들어가는 비용이 많아진 것도 있지만 부부가 맞벌이를 하며 살아도 N잡러를 꿈꾸는 사람들이 많아졌다는 건 그렇게 벌어도 일단 돈이 부족할 만큼 물가가 오르고 집값도 오르고 필요한 비용이 많아졌다는 뜻이지 않을까?

 N잡러가 유행하면서 새로운 직업도 생기고, 부업의 종류도 많아졌다. 예전엔 봉투 붙이기와 인형 눈 붙이는 게 부업의 대부분이었던 걸 생각하면 엄청난 변화가 일어나고 있는 건 확실하다. 새로운 일이 많아지니 배워야 하는 것도 많아지는 건 당연하다. 이런 현상들이 새롭고 신기하긴 하지만 그만큼 먹고살기 힘들어졌다는 반증이라는 생각에,  쓸쓸한 뒷맛이 남는 건 어쩔 수 없는 것 같다.

 세상 살기가 참 쉽지 않은 시대가 되었다.


 이 쉽지 않은 세상 속에서, 고용불안까지 겪으면서도 내가 일을 즐겁게 생각하며 열심히 할 수 있는 건 돌아가신 아빠 덕분이기도 하다. 아빠와 이별할 때 즈음 더는 이렇게 살면 안 되겠다라 하는 생각을 뼈저리게 하며 나는 나를 변화시키기로 결심했다.

 그리고 자칭 N잡러가 되었고 꿈을 찾아 글도 쓰기 시작했다.

 힘든 일을 겪으면 철이 든다더니 난 나이 마흔이 넘어서야 철이 드는가 보다.

 이제 나는 내가 할 수 있는 일을 찾아 열심히 일도 하고 글쓰기도 시작하며 나를 찾아나가기 시작했다.

 조금 피곤하긴 하지만 지금의 삶에 만족하고 있고, 변화하는 나를 느끼며 찾아온 가슴 두근거림을 오랜만에 만끽하는 중이다.

 더 늦기 전에 두근거림으로 찾아온 나의 변화에 감사하고, 나는 앞으로도 계속 변화할 것이고, 나의 글쓰기도 계속될 것이라 믿는다.

 오랜만에 아빠가 참 보고 싶다. 잘했어하고 다독여주실 것 같은데.. 빈자리가 참 사무치는 날이다.





매거진의 이전글 내가 일을 시작한 건 간병비 때문이었다.(2)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari