brunch

You can make anything
by writing

C.S.Lewis

by 스타트업디 Jun 03. 2023

누구나 손쉽게 자신만의 AI 구축하는 시대를 열다

[Startup:D] (주)데이터메이커 이에녹 대표

인공지능 주차사업의 가장 큰 장벽이 데이터메이커를 설립한 아이디어

4차 산업혁명의 핵심 키워드 인공지능(AI)이 우리의 일상에 두루 스며들고 있다. 인공지능 응용산업은 기존 IT에서 자율주행, 헬스케어, 패션, 제조, 금융, 법률 등 영역을 무한 확장 중이다. 인공지능이 급속도로 진화하고 있어서다.      

인공지능의 진화와 함께 ‘데이터 라벨링(Data Labeling)’ 시장이 급속도로 성장하고 있다. 인공지능을 상용화하기 위해 반드시 필요한 과정이기 때문이다. 인공지능의 알고리즘을 고도화하려면 다양한 데이터를 주입해야 한다. 하지만 사람이 사용하는 텍스트나 이미지 등의 데이터를 인공지능 스스로 식별할 수는 없다. 인공지능이 학습할 수 있도록 원천 데이터에 라벨(이름)을 붙여야 하는데, 이 작업을 데이터 라벨링이라고 한다.      

인공지능이 고도화될수록 요구하는 데이터 수준이 높아질 수밖에 없다. 이런 상황에서 대전의 한 스타트업이 주목받고 있다. 카이스트 전산학 및 창업 석사 출신인 이에녹 대표가 2018년 10월 설립한 ㈜데이터메이커다.      

“카이스트 전산학 석사과정 중 평소 관심이 있고 필요하다고 생각하던 창업아이템이 있었어요. 인공지능을 활용한 주차사업이었죠. 창업 후 해당사업의 핵심이 되는 인공지능 개발에 많은 시간을 쏟아 부었습니다. 인공지능을 학습시키려면 데이터를 라벨링해야 하는데, 그 작업에 가장 많은 시간이 소요됐고요. 처음에는 저 혼자만의 고민인줄 알았는데, 알고 보니 주변의 인공지능 기업들이 모두 같은 문제를 안고 있었습니다. 그렇다면 시장이 여기에 있겠다 싶었죠.”     

이 대표는 인공지능 및 데이터 활용에 대한 회사의 비전을 자신감 있게 제시해 대전창조경제혁신센터로부터 ‘대전이노스타트업육성사업’. ‘초기창업패키지’, ‘창년창업-원(ONE)’ 등의 지원 사업을 이끌어냈다. 이를 통해 고객사에 최단시간에 최다의 고품질 데이터를 제공하는 기업으로 급성장했다.

 

데이터메이커의 ML 플랫폼은 현존하는 모든 유형의 데이터 라벨링이 가능

데이터메이커는 제품 개발, 빅데이터 분석, 사회현안 해결 등에 필요한 인공지능 데이터셋 구축사업을 수행하는 데이터 라벨링 전문기업이다. 인공지능의 고도화를 위해서는 다양하고 수많은 데이터를 주입해야 하는데, 이게 말처럼 간단한 일이 아니다. 데이터메이커는 이 문제를 해결할 수 있는 학습용 데이터 가공 및 학습 파이프라인 플랫폼을 선보여 업계의 반향을 불러일으켰다.      

데이터메이커의 주력 제품은 사용자가 손쉽게 대용량의 데이터 관리, 데이터 라벨링, AI 모델 개발과 학습을 직접 진행할 수 있는 ‘데이터메이커 시냅스(datamaker synapse)’라는 ML(머신러닝, Machine Learning) 플랫폼이다.      

“인공지능이 인간지능 이상의 성능을 내기 위해서는 클래스 당 약 100만 건 이상의 데이터 학습이 필요합니다. 기업들로서는 데이터 라벨링을 위한 비용과 시간부담이 클 수밖에 없는 거죠. 우리 플랫폼은 고객사 자체적으로 데이터 라벨링의 효율과 효과를 높일 수 있도록 다양한 기능으로 구성된 기술을 제공하고 있습니다.”     

데이터메이커의 ML 플랫폼은 현존하는 모든 유형의 데이터 라벨링이 가능하다. 보편적인 데이터 형태인 이미지, 영상, 음성, 텍스트뿐만 아니라 3차원 데이터, 의료 데이터, 열화상 데이터까지 총망라해 가공할 수 있다. 라벨링 뿐만 아니라 AI 시대를 가속화하는 모든 기능을 제공한다. 누구나 손쉽게 자신만의 인공지능을 구축해 활용할 수 있어서다.     

데이터메이커 ML 플랫폼의 기능적인 장점은 종류별 필터링과 버전관리가 가능해 효율적으로 데이터를 운용할 수 있다는 데 있다. 기존에는 데스크톱의 로컬에 파일 브라우저 형식으로 데이터를 관리함으로써 데이터 활용도가 낮았다.     

축적된 데이터셋은 그 자체가 자산이지만, 부가가치를 창출하려면 데이터를 가공하는 라벨링 작업이 필수적이다. 데이터메이커는 차별화 포인트로 고객사 자체적으로 데이터 라벨링 프로젝트를 운영할 수 있도록 했다. 뿐만 아니라 AI 기반으로 라벨링 작업을 자동 수행하는 전처리 기능을 플랫폼에 탑재했고, 라벨링을 진행할수록 전처리 성능이 실시간으로 향상되는 자동학습까지 가능한 툴을 제공한다.     

특히, 코딩지식이 없어도 웹 브라우저 상에서 몇 번의 클릭만으로 모델 선택부터 학습상세까지 진행할 수 있다. 고객사가 자체 개발한 인공지능 모델의 아키텍처나 GPU(그래픽처리장치) 서버 이용을 원하는 경우에도 지원 가능한 확장성까지 갖췄다.

     

데이터메이커의 고객은 인공지능 개발사를 넘어
특정기술이나 산업과 무관하게 확장 중

일정 수준 이상의 라벨링이 진행되면 데이터 라벨링 전 처리 엔진과 자동검증 솔루션이 활성화된다. 솔루션을 사용하다 ‘특이 데이터’가 주입될 경우에는 액티브 러닝(Active Learning) 기반의 추가 라벨링이 작동해 더 높은 정확도의 AI 전 처리 엔진으로 진화한다.     

“데이터메이커는 ML 플랫폼의 모든 기능을 포함한 ‘데이터 시냅스’를 라이선스 기반으로 고객사에 제공합니다. 고객사가 데이터 수집과 라벨링을 직접 진행하기 어려운 경우에는 다양한 데이터 구축 경험을 보유한 프로젝트 매니저(PM)나 퀄리티 매니저(QM) 등 숙련된 라벨러들이 양질의 데이터를 제공하는 서비스도 함께 제공하고 있습니다.”     

데이터메이커의 고객은 사업초기 인공지능 개발사에 국한됐지만, 이제는 특정기술이나 산업과 무관하게 확장되고 있다. LG화학, LG전자, LG생활건강, 포스코ICT, SKT 등 국내 굴지의 대기업은 물론 뱅크샐러드, 데이블 등 유망 스타트업, RIST(포항산업과학연구원), ETRI(한국전자통신연구원) 등 연구기관, 대전시청, 대전교통공사 등 지자체 및 공공기관들이 데이터메이커 시냅스를 활용하고 있다.

   

‘데이터 랩’의 체계적인 시스템을 기반으로
가나 청년들에게 ICT 교육과 일자리를 제공하는 사회적 가치를 실현

데이터메이커는 최고의 기술력은 물론 국내 최저 수준의 가격으로도 이슈가 되고 있다. 이는 아프리카 가나에 설립해 운영 중인 ‘데이터 랩’ 덕분이다. 의미론적 분할(Semantic Segmentation)처럼 가공에 시간이 많이 걸리는 경우 막대한 작업비용이 발생한다. 가나가 가격경쟁력을 위한 유용한 선택지였던 셈이다.      

이 대표는 선교사로 활동했던 부친을 따라 가나에서 초등학교 6학년부터 고등학교 1학년까지 청소년기 5년여를 보냈다. 지난 2020년 코로나19로 가나에 파견된 한국인 직원 5명이 모두 특별전세기로 귀국했다. ‘데이터 랩’ 관리에 구멍이 뚫린 것이다. 그때 가나은행에서 IT팀장으로 근무하던 현지인 친구가 데이터메이커에 합류하면서 위기를 돌파할 수 있었다.     

“지난 3년간 ‘데이터 랩’의 체계적인 시스템을 기반으로 가나 청년들에게 ICT 교육과 일자리를 제공하는 사회적 가치를 실현해왔습니다. 이제는 데이터의 품질 또한 국내 작업자와 차이가 없을 정도로 양질의 데이터 구축이 가능한 상태죠. 가나의 ‘데이터 랩’에서만 지금까지 약 120여 개의 프로젝트를 수행했습니다.”     

데이터메이커는 가나 ‘데이터 랩’의 역량과 규모를 지속적으로 확장해가면서 국내 인공지능 시장뿐만 아니라 전 세계 유수의 AI 기업들과 협업을 확대할 계획이다. 특히 인공지능융합기술을 의미하는 ‘AI+X(애플리케이션)’를 포함한 디지털 대전환의 허브기업으로 자리 매김한다는 비전을 제시했다. 데이터메이커는 2026년 기업공개(IPO)에 나설 계획이다.     

“국립 가나대학교와 인공지능 기술개발 적용에 나서고, 가나 교육부와도 협력해 전문 라벨러를 양성하는 신규 교육사업도 추진할 계획입니다. 해외 인력을 활용한 가격경쟁력을 앞세워 아프리카 노동시장은 물론 글로벌 데이터 시장을 선점해 최고 품질의 유니콘 기업으로 성장하고자 합니다.”



✔ Startup:D 다시보기


작가의 이전글 자율주행로봇으로 물류를 혁신하다
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari