세쿼이아 캐피탈
[테크수다 기자 도안구] 세계적인 벤처 캐피털 '세쿼이아'가 '생성형 AI 제 2막(Generative AI's Act Two Generative AI’s Act Two | Sequoia Capital)'라는 글을 올렸다. 2023년 9월 20일이다. 이 글은 1년 전인 2022년 9월 19일 생성형 AI : 창의적인 새로운 세상(Generative AI: A Creative New World Generative AI: A Creative New World | Sequoia Capital) 을 올린 지 1년이 지난 후의 글이다.
생성형 AI 시장 1년을 뒤돌아본다는 점에서 의미가 있는 글이다.
그들이 잘못 예측한 부분도 5가지 정도가 있었다는 대목도 눈에 띈다. 딥엘 서비스를 통해 번역을 했다.
오역이 있으니 반드시 원문을 보고 대조해보길.
이 글을 쓴 이들은 다음과 같다. 소냐(sonya@sequoiacap.com)와 팻(grady@sequoiacap.com)에게 이메일을 보내주시기 바랍니다. 세 번째 공동 저자(GPT-4)는 아직 이메일 주소가 없습니다(안타깝게도 :-).
1년 전, 우리는 제너레이티브 AI가 기술의 중대한 플랫폼 전환이 될 것이라는 가설을 발표했습니다. 그 후 폭풍이 몰아쳤습니다.
과학자, 역사학자, 경제학자들은 캄브리아기 혁신의 폭발을 일으킬 수 있는 최적의 조건을 오랫동안 연구해 왔습니다. 제너레이티브 AI를 통해 우리는 우리 세대의 우주 경쟁이라는 현대의 경이로움에 도달했습니다.
이 순간은 수십 년 동안 준비되어 왔습니다. 무어의 법칙의 60년은 엑사플롭의 데이터를 처리할 수 있는 컴퓨팅 성능을 제공했습니다. 인터넷의 40년(코로나로 인해 가속화됨)은 수조 토큰에 달하는 학습 데이터를 제공했습니다. 모바일과 클라우드 컴퓨팅의 20년은 모든 사람에게 손 안의 슈퍼컴퓨터를 제공했습니다. 즉, 수십 년에 걸친 기술 발전이 축적되어 제너레이티브 AI가 날아오르는 데 필요한 조건이 조성된 것입니다.
ChatGPT의 등장은 그 도화선에 불을 붙인 불꽃이었으며, 인터넷 초창기 이후 수년 동안 볼 수 없었던 혁신의 밀도와 열기를 불러일으켰습니다. 특히 AI 연구자들이 록스타의 반열에 오르고 주말마다 해커 하우스가 새로운 자율 에이전트와 동반자 챗봇으로 가득 차는 '지적인 밸리'에서는 숨이 멎을 듯한 흥분과 열기가 가득했습니다. AI 연구자들은 '차고의 해커'라는 속담에서 수십억 달러 규모의 컴퓨팅을 지휘하는 특수부대로 변신했습니다. 연구자들이 농담 삼아 새로운 논문을 따라잡을 수 있도록 새로운 논문을 잠시 중단해 달라고 요청할 정도로 arXiv 인쇄기가 너무 많이 사용되었습니다.
하지만 인공지능에 대한 흥분은 곧 경계선상의 히스테리로 바뀌었습니다. 갑자기 모든 회사가 "AI 부조종사"가 되었습니다. 받은 편지함은 "AI Salesforce", "AI Adobe", "AI Instagram"에 대한 차별화되지 않은 프레젠테이션으로 가득 차게 되었습니다. 1억 달러의 사전 제품 시드 라운드가 반환되었습니다. 우리는 자금 모금, 인재 전쟁, GPU 조달이라는 지속 불가능한 먹이 공급 열풍에 휩싸였습니다.
그리고 당연히 균열이 보이기 시작했습니다. 아티스트와 작가, 가수들이 기계로 생성된 IP의 정당성에 이의를 제기했습니다. 윤리, 규제, 다가오는 초지능에 대한 논쟁이 워싱턴을 뒤덮었습니다. 그리고 가장 우려스러운 것은 제너레이티브 AI가 실제로 유용하지 않다는 속삭임이 실리콘 밸리 내에 퍼지기 시작했다는 점입니다. 끔찍한 사용자 유지율에서 알 수 있듯이 제품은 기대에 훨씬 못 미쳤습니다. 많은 애플리케이션에 대한 최종 사용자 수요가 정체되기 시작했습니다. 이것이 또 한 번의 유행이었을까요?
1998년 한 유명한 경제학자가 "2005년에 이르면 인터넷이 경제에 미치는 영향이 팩스보다 크지 않다는 것이 분명해질 것"이라고 선언했던 인터넷 초창기를 연상시키는 불만의 AI 여름이 비평가들을 즐겁게 춤추게 만들었습니다.
잡음과 히스테리, 불확실성과 불만의 분위기에도 불구하고 제너레이티브 AI는 이미 스타트업에서만 10억 달러 이상의 매출을 올리며 SaaS보다 성공적인 출발을 보였습니다(SaaS 시장은 같은 규모에 도달하는 데 몇 달이 아니라 몇 년이 걸렸습니다). 일부 애플리케이션은 유명세를 타고 있습니다: ChatGPT는 학생과 개발자들 사이에서 특히 강력한 제품 시장 적합성을 바탕으로 가장 빠르게 성장하는 애플리케이션이 되었고, Midjourney는 11명으로 구성된 팀으로 수억 달러의 매출을 달성한 것으로 알려졌으며, Character는 AI 엔터테인먼트와 동반자 관계를 대중화하여 사용자가 인앱에서 평균 2시간을 보내는 등 가장 갈망하는 소비자 '소셜' 애플리케이션을 탄생시켰습니다.
하지만 이러한 초기 성공의 조짐에도 불구하고 많은 AI 기업이 제품 시장 적합성이나 지속 가능한 경쟁 우위를 갖추지 못했으며, AI 생태계의 전반적인 활기가 지속 가능하지 않다는 현실은 변하지 않았습니다.
이제 어느 정도 먼지가 가라앉은 지금이 제너레이티브 AI의 현재 모습과 앞으로 나아갈 방향에 대해 생각해 볼 수 있는 적절한 시기라고 생각했습니다.
제너레이티브 AI의 첫해, 즉 '1막'은 기술에서 시작되었습니다. 우리는 새로운 '망치'인 기초 모델을 발견하고 멋진 신기술을 가볍게 시연하는 참신한 앱의 물결을 일으켰습니다.
이제 시장은 고객으로부터의 '2막'에 접어들었다고 생각합니다. 2막에서는 인간의 문제를 엔드투엔드로 해결할 것입니다. 이러한 애플리케이션은 처음 출시된 앱과는 성격이 다릅니다. 이러한 앱은 전체 솔루션이 아닌 보다 포괄적인 솔루션의 일부로 기초 모델을 사용하는 경향이 있습니다. 새로운 편집 인터페이스를 도입하여 워크플로우를 더욱 견고하게 만들고 결과물을 개선합니다. 이들은 종종 멀티 모달입니다.
시장은 이미 "1막"에서 "2막"으로 전환하기 시작했습니다. '2막'에 진입한 기업의 예로는 엘리트 로펌을 위한 맞춤형 LLM을 구축하는 Harvey, 업무 관련성을 높이기 위해 워크스페이스를 크롤링하고 색인을 생성하는
Glean, 디지털 동반자를 만드는 Character와 Ava 등이 있습니다.
업데이트된 제너레이티브 AI 시장 지도는 아래와 같습니다.
작년 지도와 달리, 이번 지도는 모델 방식이 아닌 사용 사례별로 구성하기로 했습니다. 이는 시장의 두 가지 중요한 추세를 반영한 것입니다: 기술 망치에서 실제 사용 사례와 가치로 진화하는 제너레이티브 AI와 점점 더 멀티모달화되는 제너레이티브 AI 애플리케이션의 특성입니다.
또한 기업들이 프로덕션 환경에서 제너레이티브 AI 애플리케이션을 구축할 때 사용하는 컴퓨팅 및 툴링 공급업체를 반영하는 새로운 LLM 개발자 스택을 포함했습니다.
기존 에세이(Generative AI: A Creative New World | Sequoia Capital)에서는 제너레이티브 AI 시장 기회에 대한 논지와 시장이 어떻게 전개될지에 대한 가설을 제시했습니다. 어떻게 되었을까요?
우리가 잘못 생각한 부분은 다음과 같습니다:
1. 일이 너무 빨리 일어났습니다. 작년에 우리는 인턴 수준의 코드 생성, 할리우드 수준의 비디오 또는 기계적으로 들리지 않는 인간적인 음성을 얻기까지 거의 10년이 걸릴 것으로 예상했습니다. 하지만 틱톡이나 런웨이의 AI 영화제에서 일레븐 랩스의 목소리를 들어보면 미래가 워프 속도로 다가오고 있음을 알 수 있습니다. 3D 모델, 게임, 음악도 빠르게 발전하고 있습니다.
2. 병목 현상은 공급 측면에 있습니다. 최종 사용자 수요가 GPU 공급을 어느 정도까지 앞지를지 예상하지 못했습니다. 많은 기업의 성장에 걸림돌이 되는 것은 고객 수요가 아니라 엔비디아의 최신 GPU에 대한 접근성이었습니다. 긴 대기 시간이 일상이 되었고, 구독료를 지불하면 줄을 서지 않고 더 나은 모델을 이용할 수 있는 간단한 비즈니스 모델이 등장했습니다.
3. 수직적 분리는 아직 일어나지 않았습니다. 우리는 여전히 '애플리케이션 레이어' 회사와 기반 모델 제공업체가 분리되어 모델 회사는 규모와 연구에 특화되고 애플리케이션 레이어 회사는 제품과 UI에 특화될 것이라고 믿습니다. 하지만 현실적으로 이러한 분리는 아직 완전히 이루어지지 않았습니다. 실제로 가장 성공적인 사용자 대면 애플리케이션은 수직적으로 통합되어 있습니다.
4. 치열한 경쟁 환경 및 신속한 대응. 작년에는 경쟁 환경이 과밀했던 몇 가지 카테고리(특히 이미지 생성 및 카피라이팅)가 있었지만, 전반적으로 시장은 공백 상태였습니다. 오늘날 경쟁 환경의 많은 부분에서 기회보다는 경쟁이 더 치열합니다. Google의 Duet과 Bard에서 Adobe의 Firefly에 이르기까지 기존 업체들의 신속한 대응과 마침내 '위험을 감수'하려는 기존 업체들의 의지가 경쟁 열기를 더욱 고조시켰습니다. 기초 모델 계층에서도 고객이 여러 공급업체에 구애받지 않도록 인프라를 설정하는 것을 목격하고 있습니다.
5. 해자(능, 원, 묘 따위의 경계)는 데이터가 아니라 고객에 있습니다. 우리는 최고의 제너레이티브 AI 기업이 더 많은 사용량 → 더 많은 데이터 → 더 나은 모델 → 더 많은 사용량이라는 데이터 플라이휠을 통해 지속 가능한 경쟁 우위를 확보할 수 있을 것으로 예측했습니다. 특히 매우 전문적이고 확보하기 어려운 데이터가 있는 영역에서는 여전히 어느 정도 사실이지만, 애플리케이션 기업이 생성하는 데이터가 극복할 수 없는 해자를 만들지는 못하며, 차세대 기반 모델이 스타트업이 생성하는 데이터 해자를 모두 없애버릴 수도 있습니다. 오히려 워크플로우와 사용자 네트워크가 더 지속적인 경쟁 우위의 원천이 될 것으로 보입니다.
우리가 제대로 파악한 것은 다음과 같습니다:
1. 제너레이티브 AI가 대세입니다. 갑자기 모든 개발자가 제너레이티브 AI 애플리케이션을 개발하고 모든 기업 구매자가 이를 요구하기 시작했습니다. 시장에서는 '제너레이티브 AI'라는 명칭을 사용하기도 했습니다. 벤처 캐피털 자금과 함께 인재가 시장에 유입되었습니다. 심지어 "해리포터 발렌시아가" 같은 바이럴 동영상이나 차트 상위권을 차지한 고스트라이터의 드레이크 모창곡 "하트 온 마이 슬리브"에서 제너레이티브 AI는 대중 문화 현상으로 자리 잡았습니다.
2. 최초의 킬러 앱이 등장했습니다. ChatGPT는 가장 빠르게 1억 MAU를 달성한 애플리케이션으로 기록되었으며, 단 6주 만에 유기적으로 달성한 것으로 알려져 있습니다. 이에 비해 Instagram은 2.5년, WhatsApp은 3.5년, YouTube와 Facebook은 4년이 걸렸으며, 이러한 수준의 사용자 수요에 도달하는 데는 6주가 걸렸습니다. 하지만 ChatGPT는 고립된 현상이 아닙니다. Character AI의 깊이 있는 참여도(평균 세션 시간 2시간), Github Copilot의 생산성 이점(55% 더 높은 효율성), Midjourney의 수익화 경로(수억 달러의 수익)는 모두 킬러 앱의 첫 번째 집단이 도래했음을 시사합니다.
3. 개발자가 핵심입니다. Stripe이나 Unity와 같이 개발자를 우선시하는 기업의 핵심 인사이트 중 하나는 개발자 액세스가 상상조차 할 수 없었던 사용 사례를 열어준다는 것입니다. 지난 몇 분기 동안 우리는 음악 생성 커뮤니티부터 AI 매치메이커, AI 고객 지원 에이전트까지 모든 것을 소개해 왔습니다.
4. 폼 팩터가 진화하고 있습니다. AI 애플리케이션의 첫 번째 버전은 대부분 자동 완성 및 초안 형태였지만, 이제 이러한 폼팩터는 점점 더 복잡해지고 있습니다. 카메라 패닝 및 채우기 기능을 도입한 Midjourney는 제너레이티브 AI 사용자 경험이 어떻게 더 풍부해졌는지 잘 보여주는 예입니다. 전반적으로 폼 팩터는 개인에서 시스템 수준의 생산성으로, 휴먼 인 더 루프에서 실행 중심의 에이전트 시스템으로 진화하고 있습니다.
5. 저작권과 윤리, 실존적 공포. 이 뜨거운 감자 주제에 대한 논쟁이 뜨겁습니다. 예술가, 작가, 음악가들은 의견이 분분하며, 일부 크리에이터는 다른 크리에이터가 2차 저작물을 통해 수익을 얻는 것에 분노하고, 일부 크리에이터는 새로운 AI 현실을 받아들이고 있습니다(Grimes의 수익 공유 제안과 창작 게놈의 일부가 될 것이라는 제임스 벅하우스의 낙관론이 떠올랐습니다). 어떤 스타트업도 냅스터나 라임와이어가 되고 싶어하지 않으며, 결국에는 Spotify가 될 것입니다(h/t Jason Boehmig). 규칙은 불투명합니다: 일본은 AI 학습에 사용되는 콘텐츠에는 지적재산권이 없다고 선언한 반면, 유럽은 강력한 규제를 제안했습니다.
제너레이티브 AI는 사용 사례나 고객 수요가 부족하지 않습니다. 사용자들은 업무를 더 쉽게 만들고 더 나은 결과물을 만들어내는 AI를 갈망하고 있으며, 이것이 바로 (자연스러운 배포가 부족함에도 불구하고) 기록적인 속도로 애플리케이션에 몰려든 이유입니다.
하지만 사람들이 계속 사용할까요? 그렇지 않습니다. 아래 차트는 AI 퍼스트 애플리케이션의 첫 달 모바일 앱 리텐션을 기존 기업과 비교한 것입니다.
사용자 참여도 역시 저조합니다. 최고의 소비자 기업 중 일부는 60~65%의 DAU/MAU를 보유하고 있으며, WhatsApp은 85%입니다. 반면, 제너레이티브 AI 앱의 평균은 14%에 불과합니다(캐릭터와 'AI 동반자' 카테고리를 제외하면). 이는 사용자들이 아직 제너레이티브 AI 제품을 매일 사용할 만큼 충분한 가치를 발견하지 못하고 있다는 것을 의미합니다.
요컨대, 제너레이티브 AI의 가장 큰 문제는 사용 사례나 수요, 배포를 찾는 것이 아니라 가치를 증명하는 것입니다. 동료인 David Cahn은 "2,000억 달러 규모의 질문은 이 모든 인프라를 어디에 사용할 것인가 하는 것입니다. 사람들의 삶을 어떻게 변화시킬 것인가?"라고 말합니다. 영속적인 비즈니스를 구축하려면 리텐션 문제를 해결하고 고객이 지속적으로 활동적인 사용자가 될 수 있을 만큼 깊이 있는 가치를 창출해야 합니다.
절망하지 말자. 제너레이티브 AI는 아직 "어색한 10대 시절"에 머물러 있습니다. 반짝이는 부분도 있고, 제품이 기대에 미치지 못할 때에도 실패는 종종 신뢰할 수 있고 반복 가능하며 고칠 수 있습니다. 우리의 일은 우리에게 맡겨져 있습니다.
창업자들은 AI 제품을 '좋은' 제품으로 만들기 위해 신속한 엔지니어링, 미세 조정 및 데이터 세트 큐레이션이라는 힘든 작업에 착수하고 있습니다. 하나씩 하나씩 화려한 데모를 전체 제품 경험으로 구축해 나가고 있습니다. 한편, 기초 모델 기반은 계속해서 연구와 혁신으로 가득 차 있습니다.
기업들이 지속적인 가치를 창출할 수 있는 길을 찾으면서 공유 플레이북이 발전하고 있습니다. 이제 모델을 유용하게 만드는 기술을 공유할 수 있을 뿐만 아니라 제너레이티브 AI의 2막을 형성할 새로운 UI 패러다임도 등장했습니다.
생각의 사슬, 생각의 나무, 반사와 같은 새로운 추론 기법은 더 풍부하고 복잡한 추론 작업을 수행할 수 있는 모델의 능력을 향상시켜 고객의 기대치와 모델 기능 간의 격차를 좁히고 있습니다. 개발자들은 Langchain과 같은 프레임워크를 사용하여 더 복잡한 멀티체인 시퀀스를 호출하고 디버깅하고 있습니다.
특히, 최근 GPT-3.5와 Llama-2에 대한 미세 조정이 가능해짐에 따라 기업들이 특정 도메인에 맞게 기초 모델을 조정하고 사용자 피드백을 통해 개선할 수 있게 되면서 RLHF 및 미세 조정과 같은 전이 학습 기술에 대한 접근성이 더욱 높아지고 있습니다. 개발자들은 허깅 페이스에서 오픈 소스 모델을 다운로드하고 이를 미세 조정하여 우수한 성능을 달성하고 있습니다.
검색 증강 생성은 비즈니스 또는 사용자에 대한 컨텍스트를 가져와 환각을 줄이고 진실성과 유용성을 높이고 있습니다. Pinecone과 같은 회사의 벡터 데이터베이스는 RAG의 인프라 중추가 되었습니다.
새로운 개발자 도구와 애플리케이션 프레임워크는 기업이 재사용 가능한 빌딩 블록을 통해 고급 AI 애플리케이션을 만들고 개발자가 운영 중인 AI 모델의 성능을 평가, 개선 및 모니터링할 수 있도록 지원하며, 여기에는 Langsmith 및 Weights & Biases와 같은 LLMOps 도구가 포함됩니다.
Coreweave, Lambda Labs, Foundry, Replicate, Modal과 같은 AI 우선 인프라 기업은 퍼블릭 클라우드의 번들링을 해제하고 AI 기업이 가장 필요로 하는 것, 즉 합리적인 비용으로 온디맨드 방식으로 사용 가능하고 확장성이 뛰어난 풍부한 GPU와 훌륭한 PaaS 개발자 환경을 제공하고 있습니다.
이러한 기술을 함께 사용하면 기본 기반 모델이 동시에 개선되면서 모델에 대한 기대치와 현실 간의 격차를 줄일 수 있습니다. 하지만 모델을 훌륭하게 만드는 것은 전투의 절반에 불과합니다. 제너레이티브 AI 우선 사용자 경험을 위한 플레이북도 진화하고 있습니다:
제너레이티브 인터페이스. 텍스트 기반 대화형 사용자 경험은 LLM의 기본 인터페이스입니다. 퍼플렉시티의 제너레이티브 사용자 인터페이스부터 인플렉션 AI의 사람 목소리와 같은 새로운 방식에 이르기까지 점차 새로운 폼 팩터가 등장하고 있습니다.
새로운 편집 경험: 코파일럿에서 감독 모드까지. 제로 샷에서 묻고 조정하는 방식으로 발전함에 따라 제너레이티브 AI 기업들은 기존 편집 워크플로우와는 매우 다른 새로운 노브와 스위치를 개발하고 있습니다(잭 로이드의 글 참조). 미드저니의 새로운 패닝 명령과 런웨이의 디렉터 모드는 카메라와 같은 새로운 편집 경험을 선사합니다. 일레븐 랩스는 프롬프트를 통해 음성을 조작할 수 있는 기능을 제공합니다.
점점 더 정교해지는 에이전트 시스템. 제너레이티브 AI 애플리케이션은 자동 완성이나 사람의 검토를 위한 초안 작성에 그치지 않고, 이제 자율적으로 문제를 해결하고 외부 도구에 액세스하며 우리를 대신해 엔드투엔드 문제를 해결할 수 있는 능력을 갖추게 되었습니다. 우리는 레벨 0에서 레벨 5의 자율성으로 꾸준히 발전하고 있습니다.
시스템 전반의 최적화. 일부 기업에서는 개별 사용자의 워크플로우를 개선하여 효율성을 높이는 대신 시스템 전반의 최적화 문제를 직접 해결하고 있습니다. 지원 티켓이나 풀 리퀘스트를 선별하여 자율적으로 해결함으로써 전체 시스템을 더 효율적으로 만들 수 있을까요?
프론티어 역설에 가까워지고 트랜스포머와 확산 모델의 참신함이 사라지면서 제너레이티브 AI 시장의 성격이 진화하고 있습니다. 과대광고와 화려함은 진정한 가치와 전체 제품 경험에 자리를 내주고 있습니다.
세쿼이아는 제너레이티브 AI에 대한 확고한 믿음을 가지고 있습니다. 이 시장이 도약하기 위한 필수 조건은 수십 년에 걸쳐 축적되어 왔으며, 마침내 그 시대가 도래했습니다. 킬러 애플리케이션의 등장과 엄청난 규모의 최종 사용자 수요는 이 시장에 대한 우리의 확신을 더욱 깊게 했습니다.
하지만 기술의 효과를 단기적으로는 과대평가하고 장기적으로는 과소평가하는 경향을 보이는 아마라의 법칙(Amara’s Law)이 작용하고 있습니다. 저희는 창업자들이 가치 문제를 어떻게 해결해 나가는지 주의 깊게 살피면서 인내심과 판단력을 가지고 투자 결정을 내리고 있습니다. 기업들이 모델 성능과 제품 경험의 한계를 뛰어넘기 위해 사용하고 있는 공유 플레이북은 제너레이티브 AI의 2막에 대한 낙관적인 전망을 갖게 합니다.
가치와 전체 제품 경험에 초점을 맞춰 AI 시장을 개척하고 계신다면 여러분의 의견을 듣고 싶습니다. 소냐(sonya@sequoiacap.com)와 팻(grady@sequoiacap.com)에게 이메일을 보내주시기 바랍니다. 세 번째 공동 저자(GPT-4)는 아직 이메일 주소가 없습니다(안타깝게도 :-).