AI 전문가 없이 만드는 AI Driven 서비스
AI 시대의 청바지 비즈니스 예측
"작은 것이 아름답다."라는 말이 LLM에도 적용이 되려나 싶다. 학습 크기로 전 세계의 LLM 새싹들을 압도해 버리는 OpenAI와 Google은 투트랙을 타고 있다. 한쪽에서는 언어 모델을 더 키우고, 한쪽에서는 경량화를 시도한다. 전자는 사실 그들만의 리그가 된 지 오래인데, 스타트업이나 로컬 대기업들이 파보려고 하는 sLLM까지 넘보는 이유는 바로 답변의 정확성 때문이다. general 한 영역을 벗어나면 너무 큰 덩치가 답변의 정확도를 오히려 떨어뜨리는 문제가 발생한 것.
무조건 많은 데이터로 학습시키는 것보다 유용한 데이터로 학습시키는 것이 LLM 구축에도 더 의미 있을뿐더러 너무 빠른 소프트웨어의 발전을 하드웨어가 따라가지 못하는 문제도 잠시나마 이연 시킬 수 있는 방향성이다.
이 거대한 AI 게임판에 글로벌 거대 기업이든, 한국의 작은 스타트업이든 간에 어떻게든 한 자리 잡아보려고 안간힘을 쓰고 있는 와중에 sLLM까지 파이를 나눠 먹어야 한다니 너무한 거 아닌가 싶다. 하지만 그 와중에도 비즈니스 기회를 찾기 위한 시도로써 AI 시대의 '청바지 비즈니스'를 상상해 본다.
*청바지 비즈니스란
19세기 중반 미국의 <골드 러시>로 서부에 수많은 광부들이 일확천금을 노리고 몰려든다. 이때 광부들 중 몇 명이나 진짜 금을 캐고 부자가 되었을까? 그거야 모를 일이지만, 확실한 건 그 광부들에게 잘 안 찢기고 실용적인 청바지를 판 리바이스는 부자 기업이 되었다. 이처럼 어떤 현상이 일어났을 때 그 현상을 지속시키거나 부흥시키기 위한 저변을 지속적으로 제공함으로써 수익을 창출하는 것이 청바지 비즈니스다.
(유튜버 장사의신은 더 쉬운 사례를 얘기한다. 여의도의 모든 직장인들이 커피를 마시고 있으니 자신은 원두를 공급하고, 여름 시즌이 되면 헬스장에 회원 수가 늘어나니 헬스장 안에서 단백질 음료를 팔 것이라고 말한다.)
AI 시대에는 어떤 사업이 청바지 비즈니스가 될까?
너무 거대한 주제라서 아이데이션조차 쉽지 않다. 그래서 쉬운 주제, 우리 회사 비즈니스를 놓고 생각해 보았다. 가장 이상적으로는 우리 프로덕트가 AI Driven 서비스를 제공하는 것이다. 그러려면 어디 밖에서 빌려오든, 우리 내부에 쌓인 것이든 간에 데이터를 잘 활용해야 한다. 벌써 여기서 청바지 비즈니스감이 두 개 떠오른다. 첫째는 데이터 중개업(플랫폼 서비스)고, 둘째는 데이터 검증/컨설팅 솔루션이다.
요즘 모든 기업이 AI를 외치고 있지만, AI 전문가의 공급은 극도로 부족하다. 그러니 AI 서비스를 만들어보려 해도 추진이 어려운데 이 두 가지를 데이터 중개업과 검증 솔루션이 해결함으로써 AI 생태계가 더 빠르게 활성화될 것이라고 생각된다.
왜 그런가를 보면, LLM과 sLLM의 등장으로 대부분의 기업들에게 남은 과제는 좋은 데이터를 모아 파인튜닝을 하는 일이다. 어떤 데이터가 좋은 데이터인지 정의하고, 식별하고, 학습을 하기 좋게 저장 및 전처리하고, 데이터의 정합성을 평가하고, 데이터의 총량이나 질이 어떤 수준인지 판단하는 문제는 여전히 기업마다 안고 가야 할 숙제다. 이마저도 외주화 해버린다면 정말 인공지능 전문가 없이 AI Driven 서비스를 만들어낼 수 있지 않을까 싶다.
+ 사실 서비스마다 고유한 데이터를 충분히 축적하는 게 쉽지 않다. 그럼 임의의 유저와 유저행동을 랜덤으로 뿌려서 가상의 데이터셋을 만들어주는 일종의 매크로 툴이 있다면? 아주 작은, 혹은 아예 시작도 안한 서비스도 ai 모델을 실제 데이터 없이 구현할 수 있지 않을까?