포브스 박진호가 만난 김현수 슈퍼브에이아이 대표
포브스코리아에서 ‘박진호가 만난 TREND LEADING COMPANIES’ 시리즈를 진행하고 있습니다. 이번 편은 11월 호에 실린 글을 한 번 더 소개하는 것으로 생략된 부분이 많습니다. 원문은 해당 링크에서 확인 가능합니다. https://jmagazine.joins.com/forbes/view/336850
AI란 단어는 이제 기술 부문에서 매우 일상적으로 쓰인다. 그래서 투자업계는 AI 기업을 더 까다롭게 평가한다. 최근 투자 가뭄이 극심해지면서 평가 기준은 한층 더 까다로워졌다. 이 와중에 한국 인공지능(AI) 스타트업 ‘슈퍼브에이아이’가 220억원 규모의 투자 유치에 성공했다. 이 회사가 사용자 입장에서 AI를 도입하는 게 왜 어려운지부터 파고든 덕분이다. 박진호 대표는 사용자 입장에 서서 11번째 인터뷰이로 김현수 대표를 마주했다.
“이제 마케팅업계에서도 인공지능(AI)이 화두입니다. ‘AI 마케팅’이란 말이 정말 흔해졌어요. 실제 독일 스포츠패션 브랜드 아디다스도 AI 모델을 가지고 소비자 3억 명에 대해 1만 가지 넘는 속성을 분석해 고객 한 명이 3개월 이내에 운동화를 살 확률을 계산한다고 하잖아요. 순간 드는 생각이 ‘3억 명의 데이터를 어떻게 모으고 분류했지?’였습니다. 비단 마케팅 분야에서만 느끼는 바는 아니겠죠?”
박진호 뷰스컴퍼니 대표가 지난 10월 13일 서울 강남에 있는 슈퍼브에이아이(Superb AI) 사무실에서 김현수 대표를 만나 이런 고민을 털어놨다. 김 대표의 대답이 이어졌다.
“맞습니다. AI 업계의 고질적인 난제가 ‘데이터’죠. 정확히 보셨어요. AI가 방대한 양의 데이터를 처리하려면 먼저 AI가 각종 데이터를 ‘정확하게 인지’해야 합니다. 최근 데이터 라벨링(Data Labeling)이라고 하잖아요. 그림이나 영상에서 사물이나 사람 등을 객체별로 따주고 라벨을 붙이는 일입니다. ‘데이터 라벨러’라는 직업도 생겨났는데, 아시다시피 3억 명의 데이터를 사람이 일일이 라벨링한다는 게 쉽지 않죠.”
슈퍼브에이아이가 데이터 라벨링 자동화에 주목한 이유다. 김 대표는 “사실 사람이 하는 데이터 라벨링 작업을 100% 자동화 솔루션으로 대체할 수는 없다”며 “AI 개발자들이 전체 업무의 80% 정도를 데이터 준비 작업에 할애하는 현실에 비추어볼 때 이 작업을 3분의 1 수준으로 줄여주면 기업이 AI 활용에 좀 더 적극적으로 나설 수 있게 될 것”이라고 덧붙였다.
사실 김 대표는 AI 업계에서 몇 년 전부터 유명해졌다. 김 대표는 이미 2020년 미국 포브스의 ‘아시아에서 영향력 있는 30세 이하 리더’로 선정됐으며, 같은 해 포브스코리아와도 인터뷰한 바 있다. 이듬해인 2021년 5월엔 4차산업혁명위원회 제4기 최연소 민간위원으로 선정됐고, 같은 해 11월 미국 매사추세츠 공과대학교(MIT)가 발간하는 세계적 정보기술(IT) 전문 잡지 ‘MIT 테크놀로지 리뷰’가 선정한 ‘한국 35세 미만 최고 혁신가’13명에도 이름을 올렸다.
김 대표는 앞서 말한 기업의 데이터 라벨링 부담을 줄여주고자 플랫폼 ‘스위트(Suite)’를 개발했다. 스위트는 AI 개발에 필요한 데이터 구축, 관리, 분석 등 모든 관련 작업을 통합해 지원하는 플랫폼이다. 그는 “AI개발에 필수적인 방대한 데이터를 가공할 때 데이터 시각화와 분석을 돕는다”며 “데이터 라벨러, 프로젝트 관리자, AI 리서치 엔지니어들이 서로 내용을 공유할 수 있게 만든 직관적인 UI·UX가 장점”이라고 강조했다. 스위트를 개발하는 과정에서 머신러닝 오퍼레이션(MLOps)·데이터옵스(DataOps) 분야에서 세계적인 기술적 성과를 만들고, 총 10건의 미국 특허를 등록하기도 했다.
미국 듀크대에서 전자공학과와 생명공학과를 수석 졸업했고, 컴퓨터공학 석박사 통합 과정에 입학했다고 들었다. 보통 미국에서 대학원을 마치면 글로벌기업에서 일하거나 현지에서 창업을 한다. 하지만 김 대표는 대학원 1년을 마치고 SK텔레콤에 입사했다. 특별한 이유가 있었나.
2016년이었을 거다. 당시 구글 알파고와 이세돌의 바둑 대결이 있었다. AI와 인간의 대결에서 이세돌이 1승 4패로 졌지만, 한국에서 AI에 대한 인식이 완전히 달라지는 계기가 됐다. 삼성전자, 네이버, 카카오, SK그룹 등 다수의 한국 대기업이 AI를 연구소를 차리면서 대거 투자에 나섰다. 미국 대학에서 AI 연구하던 한국 유학생의 거의 다 제안을 받았다고 보면 된다. 박사를 마치면 한국에서 일할 기회가 더는 없을 거 같아 첫 직장으로 SK텔레콤을 택했다. 이곳 T브레인 부서에서 자율주행 차, AI 스피커, 게임 AI 알고리즘 개발 등 다양한 연구를 했다.
그렇게 SK텔레콤에서 2년을 일하고 불현듯 창업을 결심했다. 미국 박사과정에 다시 돌아가지 않았고, 창업도 미국이 아니라 한국에서 했다. 어떤 계기가 있었나.
사실 SK텔레콤에서 많이 배웠다. 당장 상업화가 되지 않더라도 다양한 분야에서 AI 개발 연구를 할 수 있게 해줬다. 그러면서도 머릿속에서 늘 AI 개발과정의 비효율을 해결할 방법이 없을까를 고민했다. 마침 당시 창업 열풍이 불면서 직장 근처 공유오피스에 수많은 스타트업이 입주해 일했고, 그 모습을 지켜봤던 나를 비롯한 같은 부서 동료였던 공동창업자 5명도 주말마다 공유오피스에서 ‘해결 방법’을 고민했다. ‘파편화돼 있고 비효율적인 AI 개발을 한 번에 해결할 수 없을까’, ‘데이터 라벨링 과정만이라도 자동화하면 많은 기업이 AI 도입에 나설 수 있을 텐데’, ‘글로벌기업도 AI를 도입하면서 같은 고민을 하고 있지 않을까’ 하며 머리를 맞댔다. 일단 우리는 AI 개발 문제를 데이터로 정의하면서 창업을 결심했다.
슈퍼브에이아이, YC 졸업한 7번째 한국 기업막강한 공동창업자 덕분인지, 창업 후 1년도 안 돼 미국 실리콘밸리에서 인정받았다. 2019년 초 스타트업계 명문 액셀러레이터 와이콤비네이터(Y Combinator, 이하 YC)를 졸업한 7번째 한국 기업이라고 알고 있다. 매년 YC에 지원해 입성하는 기업이 2%도 채 안 된다고 들었다. 어떤 경험이었나.
2018년 10월에 지원했던 기억이 난다. 다행히도 우리는 그해 4월에 창업 후 6개월 만에 제품 개발에 성공했고, 매출도 어느 정도 나오고 있었다. 초기에는 몇몇 기업에서 데이터를 넘겨받아 우리 알고리즘으로 태깅해 넘겨주는 식으로 비즈니스를 했다. 별다른 영업을 하지 않았는데도 내 SNS 계정으로 제안이 들어와 이런 사업 경험도 있겠다 싶었다. 2018년부터 2019년까지 미국에서 AI 개발 열풍이 불었고, YC도 관심을 가졌던 아이템이었다. 선정되고 나서 3개월간 YC에 있었는데, 이때 사업을 꾸려가는 기법보다 철학과 장기적인 목표를 어떻게 세울 것인지에 대해 더 많은 얘기를 나눴던 것 같다. ‘10년 후 어떤 회사가 돼 있을 것인가’, ‘1조원짜리 회사가 될 계획을 A4 용지 한두 장으로 써라’ 같은 과제가 많았다. 물론 그때와 지금의 슈퍼브에이아이 모습은 아주 달라졌지만, 우리가 어떤 지향점을 두고 가야 할지 심도 있게 고민할 수 있었던 기회라고 생각한다.
이제 기업들이 스위트를 쓰면 데이터 라벨링을 100% 자동화할 수 있나.
사실 완전 자동화 라벨링은 불가능하다. AI 데이터 라벨링의 자동화는 AI가 스스로 100% 태깅하고, AI가 AI를 만든다는 의미다. 언젠가는 이런 시기가 올지 모르겠지만, 당분간은 어려운 얘기다. 그래도 스위트를 쓰면 AI 개발 기간을 최대 10배 정도까지 단축할 수 있다. 이렇게 절약한 에너지를 AI 개발 뒷단에 있는 알고리즘 고도화에 집중하면 된다. 간혹 스위트를 오해하는 경우가 있다. 자동화된 머신러닝 정도로 이해하거나 데이터 라벨링을 에디팅하는 툴을 만드는 곳으로 이해하는 기업이 있지만 이건 데이터가 있을 때 모델 학습만을 자동화한 거다. 데이터 구축 과정의 ‘비효율’은 여전한 셈이다. 우리가 스위트를 AI 개발에 필요한 데이터 구축, 관리, 분석 전 과정을 지원하는 올인원(All-in-One) 플랫폼으로 만든 이유다.
그럼 AI를 도입하고 싶은 기업이라면 슈퍼브에이아이를 찾으면 되나.
그렇긴 한데, AI 모델 자체를 개발해달라고 하는 기업들의 요청은 정중하게 거절한다. 우리가 데이터 라벨링 자동화를 꺼낸 이유 역시 AI 알고리즘을 개발할 때 업계에 쌓인 도메인 날리지(Domain knowledge, 업계 전문지식)를 투여하려고 고민 중인 기업과 머리를 맞대기 위해서다. 우리가 데이터 라벨링 회사가 아니라 AI 개발 플랫폼 회사라고 주장하는 이유이기도 하다. 플랫폼 위에서는 어떤 기업이든 데이터를 좀 더 쉽게 라벨링하고 딥러닝 모델을 개발할 수 있다. 플랫폼은 데이터를 분석·보관하고 관리하는 데 중심을 둔다면, 딥러닝 모델을 학습하거나 배포하는 방향성을 어디에 둘 것인지는 AI를 도입하는 기업 몫이다. 최소한 기업이 왜 ‘AI’를 도입하려고 하는지, 도입해서 무엇을 최적화하려고 하는지를 명확히 알고 있어야 한다는 뜻이다.
AI 도입을 고민하는 기업이 반드시 고려해야 하는 요소가 있다면.
크게 확장 가능성(Scalable), 유연성(Flexibility), 한계비용 체감(Compounding) 등 세 가지를 꼽는다. AI 기술은 무조건 좋은 데이터가 많아야 기술적으로 유리할 수밖에 없다. 쉴 새 없이 쌓이는 데이터를 처리하는 속도가 느려지거나 과부하가 걸리지 않도록 시스템을 잘 유지하는 것이 관건이다. 다음으로 AI 데이터가 실시간으로 계속 바뀌고 진화하기 때문에 기업은 늘 이를 유연하게 받아들일 준비를 해야 한다. 마지막으로 데이터를 구축하면서 동시에 라벨링부터 AI 서비스 등에 필요한 경제성도 반드시 따져봐야 한다.
앞으로 10년간 펼쳐질 메가트렌드는 무엇이라 생각하나.
모든 기업이 AI를 도입하는 것이다. 사실 AI는 이제 거부할 수 없는 거대한 흐름이다. 지금 업계에서 벌어지는 상황을 보면 AI를 홀대하는 기업은 감히 미래가 없다고 할 수 있을 정도다. 그래도 긍정적인 측면이 있다면 한국 시장에서 AI에 대한 이해도가 몇 년 전보다 훨씬 높아졌고, 업계에 쌓인 노하우를 AI로 풀어 그간 놓쳤던 부분까지 잡아 비즈니스 기회로 연결하고자 하는 기업이 점점 늘고 있다는 점이다. AI가 만능은 아니지만, AI를 잘 이해하고 다룰 준비가 되어 있는 기업이라면 과거와는 다른 모습으로 탈바꿈할 무기로 삼을 수 있다고 믿는다.
<함께 보면 좋은 글>