학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 번역 과정에서 의미 전달이 애매한 일부 문장은 삭제했습니다. 이번 글은AI 기업 코히어 웹사이트에 있는 글을 정리한 것입니다.
10여 년 전, "소프트웨어가 세상을 먹어 치우고 있다"라는 문구는 소프트웨어가 기술 분야를 넘어 많은 산업에서 중심이 되고 있음을 보여줬다. 주요 서적 판매 업체, 비디오 서비스 제공업체, 음악 회사, 엔터테인먼트 회사, 심지어 영화 제작사도 본질적으로 소프트웨어 회사들이었다.
이러한 추세는 여전히 강하다. AI를 새롭고 향상된 기능을 제공하는 소프트웨어의 확장으로 생각하는 것이 유용할 때가 많다. 그런 의미에서 AI 발전은 소프트웨어 확산 속도를 가속화할 가능성이 높다. 또한 이전에는 불가능했던 새로운 역량들에 접근할 수 있도록 한다는 점도 분명하다.
새로운 소프트웨어 기능이 새로운 제품들에 적용됨에 따라 가치 게임 판도가 어떻게 변화할까? 소프트웨어 확산이 반스앤노블에서 아마존으로, 블록버스터에서 넷플릭스로 옮겨갔다면, AI는 시장에서 어떤 역할을 하게 될까? 가치가 모델에 있을까? 아니면 데이터에 있을까? 이 새로운 체제의 해자는 어디에 있을까?
이 시리즈 첫 번째 글에선 생성 AI에 대해 가져야 할 유용한 관점들에 대한 주요 사항들을 다뤘다. 이 글에서는 AI 기술 스택 가치에 대한 관찰 결과를 공유하고 몇 가지 기술적 해자들이 어디에 있는지에 초점을 맞춘다.
AI 기술 및 가치 스택 맵과 환경
지금까지 여러 애널리스트와 투자자들이 AI 환경에 대한 다양한 그림들을 발표했다. 이러한 수치는 일반적으로 떠오르는 산업 현황을 파악하고 여러 플레이어들을 서로 비교하는 데 유용하다.
개인적으로 나는 데이터 유형(예: 텍스트/이미지)이 아닌 기술 스택(예: 애플리케이션/인프라)으로 기업을 분류할 때 더 많은 가치를 발견한다. 이러한 스택 구성은 사용자에게 직접 판매하는 기업(애플리케이션 수준)과 이들이 의존하는 플랫폼으로 나눠진다. 모델 레이어를 분리해 독점 모델과 오픈 소스 모델로 구분하고, 개발자가 그 위에 앱을 빌드하는 데 사용할 수 있는 API가 없다는 점을 고려하는 것이 a16z가 소개한 생성 AI 기술 스택에 도달할 수 있는 방법이다.
여기에 몇 가지 구성 요소를 추가하는 것이 유용하다. 첫 번째는 모델은 학습된 데이터에서 그 가치를 도출한다는 점이다. 따라서 모델을 지원하는 계층으로 데이터 및 ML옵스(MLOps)을 고려할 필요가 있다. 이와 관련한 회사들로는 Scale, Surge, Snorkel 같은 곳들을 꼽을 수 있다. 데이터 계층은 Shutterstock이 DALL-E 학습을 위한 데이터 제공업체가 되는 것을 떠올리면 된다. (이후에는 DALL-E에서 생성된 이미지를 배포하는 애플리케이션이 되기도 한다).
비즈니스 해자를 잊어서는 안된다.
지금까지 주요 소프트웨어 구성 요소를 살펴봤지만 단순한 소프트웨어 구성 요소들을 넘어 제품 차별화 또는 채택을 촉진하는 데 도움이 될 수 있는 비즈니스 요소들을 고려하는 것이 중요하다. 한 가지 좋은 예로 기존 배포 기반과 인플루언서 참여를 통해 Lensa AI 사용량이 폭발적으로 증가해 2022년 12월에 800만 달러 매출을 달성한 것을 들 수 있다. 텍스트 쪽에선 재스퍼가 2022년 7500만 달러 매출을 달성한 것이 대표적이다. 작가들은 재스퍼와 관련해 스타일 가이드와 브랜드 어투에 대한 전문성을 다른 AI 글쓰기 어시스턴트들과 차별화 요소로 꼽는다.
엔터프라이즈들: 하나가 아닌 시스템 내 수천 개 AI 접점을 계획하라.
기업을 위한 ML 전략을 구축하는 경우, '모델' 계층을 하나 또는 몇 개 모델들에만 국한되지 않는다고 생각하는 것이 좋다. 회사 모든 부서(예: IT, HR, 영업, 마케팅 등)들에서 소프트웨어가 사용되는 것과 마찬가지로, 소프트웨어가 사용되는 대부분의 부서들에 가치를 제공하기 위해 AI를 생각하라.
블룸버그는 '챗GPT를 잡으려는 구글의 계획은 모든 것에 인공지능을 집어넣는 것'이라는 제목의 기사에서 이렇게 보도했다. "새로운 내부 지침에 따라 몇 달 안에 모든 주요 제품에 '생성 AI'를 통합해야 한다."
이러한 기대에는 여러 가지 요인들이 작용한다. 우리는 AI를 독립적인 구성 요소로 생각하는 경향이 있지만, 더 유용한 관점은 더 복잡한 문제를 해결할 수 있도록 지원하는 소프트웨어의 확장으로 생각하는 것이다. 따라서 소프트웨어가 사용되는 곳이라면 어디에서든 AI가 해당 시스템을 개선할 수 있는 영역을 계속 찾아낼 것이다.
첫 번째 모델이 문제를 완전히 해결하는 경우는 거의 없다. 하나의 모델을 프로덕션에 제대로 사용할 수 있을 때까지 항상 여러 모델들을 반복해야 한다. 여기서 말하는 AI 접점이 반드시 모델을 의미하는 것은 아니다. 하나의 모델로 여러 사용 사례들을 지원할 수 있다. 예를 들어 텍스트 생성 모델은 텍스트 프롬프트를 변경해 다양한 사용 사례들을 처리할 수 있다. 예를 들어, 텍스트 임베딩 모델은 신경 검색과 텍스트 분류 및 감정 분석을 강화할 수 있다.
기업 기술 스택은 10개 모델을 활용하는 것과 1000개 모델을 활용하는 것을 목표로 한다면 완전히 달라질 것이다. 따라서 가치 방정식에서는 현재 생성 AI를 지원하는 딥러닝 혁명의 주요 구성 요소들 중 하나인 파인튜닝(미세조정)된 맞춤형 모델을 고려해야 한다.
기초 모델의 많은 후속작들과 반복들을 확인하라
파인튜닝 모델로 들어간다. 10년 전에 텍스트 생성 모델을 구축했다면 몇 달에 걸쳐 처음부터 다시 훈련해야 했을 것이다. AI의 핵심적인 발전 중 하나는 이제 많은 작업(예: 언어 작업)에 능숙한 사전 학습된 기초 모델들을 보유하고 있으며, 이들 모델을 훨씬 작은 데이터셋에 대해 조금 더 학습(파인 튜닝 프로세스)해 한 가지 작업에 능숙해지도록 할 수 있다는 것이다.
파인 튜닝은 원래 모델이 공개적으로 액세스 가능하거나 오픈소스인 경우에도 기업이 독점적인 커스텀 모델을 구축할 수 있게 해주기 때문에 경제적 가치 맵에서 중요하다. 애플리케이션 레이어에서 제품을 구축하는 경우, 파인튜닝된 커스텀 모델은 모델 레이어에서 제품을 차별화할 수 있는 요소가 될 수 있다. 관리형 언어 모델 공급자들을 사용하면 단일 파일을 업로드하는 것만큼이나 쉽게 모델을 파인 튜닝할 수 있으므로 여기에서 빠른 향상을 달성할 수 있다. 이 설정을 사용하면 수십 또는 수백 개 커스텀 모델을 편리하게 실험할 수 있다.
파인 튜닝은 생성 AI 가치 방정식에 영향을 미친다. 또 다른 예로, AI를 사용해 스타게이트 공상 과학 시리즈 에피소드 대본을 작성할 때 각 캐릭터의 톤과 스타일을 포착하기 위해 12개 파인튜닝된 모델들이 필요했다.
생성, 사용 및 피드백 데이터는 향후 버전 모델에 유용하게 활용된다. AI 제품을 배포하는 것이 최종 단계는 아니다. 오히려 모델을 개선하고 사용자 경험을 개선하기 위해 새로운 데이터를 수집하는 새롭고 중요한 프로세스의 첫 단계에 불과하다.
피드백 데이터를 수집하면 제품을 차별화할 수 있는 독점 데이터 풀에 추가된다. 피드백의 또 다른 형태는 사람 선호도 데이터를 수집해 모델을 최적화하는 것으로, 현재 일반적으로 RLHF(Reinforcement Learning from Human Feedback)라고 불린다.
제품 사용 데이터는 사용자와 데이터 어노테이터 도움을 받아 귀중한 학습 데이터를 생성할 수 있다.