brunch

You can make anything
by writing

C.S.Lewis

by karpathy Feb 03. 2024

유튜브 요약 AI 서비스의 미래는?

데이터 플라이휠, 릴리스 AI, Corely 

최근 유튜브 요약 AI 서비스를 잘 이용하고 있다. 나는 기본적으로 AI 모델을 활용한 애플리케이션은 결국 더 뛰어난 모델이 바로 대체하게 되지 않을까? 생각을 가지고 있긴 하지만 모든 서비스가 대체될 것이라고 생각하지는 않는다.


아무리 뛰어난 모델이더라도 결국 한정된 자원/데이터를 가지고 있기 때문에 모든 것을 잘하는 모델이 발생할 수는 없을 것이다. 결국은 그 모델이 집중하지 못하거나 대의를 위해 포기해야하는 문제들 중 일부 유저에게는 매우 해결되어야만 하는 문제가 있을 것이라고 생각하고 이 문제를 해결해주는 서비스는 살아남을 수 있지 않을까 하는 생각을 가지고 있다.


오늘은 유튜브 요약 AI 서비스는 위에서 말한 그런 서비스가 될 수 있을지 거대 LLM과의 경쟁에서 이길 수 있는 제품인지를 내 관점에서 생각해보았다. 


더불어서 만일 내가 이 서비스를 만드는 사람이라면 어떤 데이터 플라이휠을 구축하고 어떤 해자를 만들고 어떤 것을 지향할까를 생각해보려고 한다.


데이터 플라이휠이란?

이전의 모바일 시대에서 플랫폼은 유저가 늘어나면 네트워크의 가치가 커지면서 이것 자체가 해당 서비스를 이용할 이유를 만들어주었다. 

아마존은 더 많은 상품과 저렴한 가격으로 더 많은 구매를 만들고 이걸 재투자해 이를 반복하는 플라이휠을 만들었다.

AI 시대에서는 더 많은 유저는모델을 활용하면서 더 많은 데이터가 쌓이게 될 것이고 이를 통해서 모델의 알고리즘(제품의 퀄리티)이 높아지면서 해자를 구축하지 않을까 하는 의견들이 많이 생기고 있다.

https://www.linkedin.com/pulse/essentials-ai-success-how-use-data-flywheel-within-stephen-galsworthy/



우선 구체적으로 얘기해보기 전에 간단하게 서비스 흐름에 대해서 이야기를 해보면, 아래와 같다.


1. 유저는 번역이 필요하거나 요약이 필요한 동영상 링크를 복사한다.

2. 유튜브 요약 사이트에 들어가 이 링크를 붙여넣기 한다.

3. 영상에 대해서 번역 & timestamp & 요약 노트 등을 위해 모델이 해당 링크 속 동영상을 추론한다.

4. 시간이 지난 후에 메일 혹은 알람이 오고 위에서 요청한 결과물을 받아볼 수 있다.




이런 링크를 주고 동영상을 요약받는 서비스들은 어떤 데이터를 얻게 되는 것일까?


해당 서비스는 표면적으로는 유저로부터 "한줄의 링크"를 얻지만 이 링크가 가지는 의미는 많은 것을 함축하고 있다. 우선 이 링크는 유저가 요약하고 싶은 영상의 "링크"이다. 유저가 요약하고 싶다는 것은 즉 유저의 관심사를 의미하고 주로 이러한 영상은 앞에서 말했듯이 "정보 습득"을 목적으로 했기 때문에 정보/지식 분야에서의 유저 관심사를 파악할 수 있다는 장점이 있다.


2월 3일 기준 미국의 시총 3위인 구글도 검색엔진을 통해서 유저에게 얻은 것은 "검색 키워드"이다. 이 키워드 하나만으로 미국에서 손가락 안에 들 정도의 회사의 초석을 다질 수 있었다.



모델은 어떤 것을 학습하게 되는걸까?


링크 속 동영상을 일종의 사람이 이해하기 쉬운(유저가 원하는) 형태로 요약/재가공하는 "지능"을 모델은 학습하게 될 것이다. 이건 무엇을 의미하게 되는걸까?


인간이 태어나서 학교에서 학습하는 과정을 생각해보자. 결국 인강이든, 오프라인 속 선생님의 강의든, 책이든, 티비든 외부로부터 자극(학습 자료)이 있고 이걸 받아들이면서 내가 이해하기 쉬운 형태로 바꾸고 내 뇌에 저장하는 것이 학습이라고 생각한다.


결국 위에서 모델이 동영상을 이해하기 쉬운 형태로 요약/재가공하는 것은 인간이 학습하는 과정을 배운다는 것을 의미하며 1차적으로는 영상뿐 아니라 다양한 형식의 자료(텍스트,PPT, 음성)에도 적용이 가능하다는 생각이 든다.


두번째로는 배우고 이해하기 쉬운 형태로 컨텐츠를 재가공할 수 있다면 반대 과정도 잘 학습시키면 반대로 어떠한 개념에 대해서 설명할 수 있는 다양한 교육 컨텐츠를 만들 수 있는 것이 아닐까? 하는 생각이 든다.


AI 모델에서는 인코더와 디코더라는 개념이 있는데 유사하게 모델을 잘 요약시킬 수 있다면 요약된 것을 반대로도 잘할 수 있도록 학습시킬 수 있지 않을까 생각이 든다. 그렇게 된다면 우리는 어쩌면 특정 개념에 대해서 잘 설명할 수 있는 영상을 만들 수 있게 될 것이고 이게 잘되면 인터넷에 있는 무수히 많은 지식형 블로그/PPT 파일들을 이해하기 쉬운 영상으로 만들 수 있게 되지 않을까? 하는 생각이 들었다.





이를 통해 어떤 해자를 구축할 수 있을까?


그에 앞서 해자라는 것은 경쟁이 전제이기 때문에 경쟁업체는 누가 될까를 우선 고민해보았다.

최근에 사실 구글에서 유튜브 AI Summary 기능을 붙일 예정이다라고 얘기는 나오지만 개인적으로는 유튜브는 유저의 시청시간이 즉 수입을 의미하기 때문에 이러한 요약을 지향하지는 않을 것 같다. 오히려 이런 기능은 유저가 재생 버튼을 누르기 전에 간략하게 어떤 내용인지 설명해서 클릭을 유도하기 위한 목적으로 사용되지 않을까 생각이 든다.


만일 경쟁자가 생긴다면 오히려 온디바이스 AI 폰같은 경우가 이러한 기능을 대체하려고 하지 않을까? 하는 생각이 든다. 혹은 인간과 유사한 지능을 가진 Agent가 생긴다면 기능을 완벽하게 대체할 수 있지 않을까 하는 생각은 든다.


https://www.moneycontrol.com/news/technology/today-in-ai-google-testing-youtube-ai-summaries-meta-working-on-ai-personas-and-more-11083861.html



만약 해자가 구축된다면 어떤 경우일까 생각해보았다. 우선 똑똑한 것과 남이 이해하기 쉽게 가르치는 것은 매우 다르다. 물론 현우진 강사님처럼 똑똑하고 이해하기 쉽게 가르치는 것도 잘하는 사람도 있다. 


다만 현재의 거대 모델은 이해하기 쉬움보다는 똑똑함에 좀 더 치중되어 있다고 보아서 방향이 다르다고 생각한다. 물론 그보다 더 똑똑해지면 이해하기 쉽게 설명할 수도 있지만 이는 오래 걸릴 것 같다. 그 상황이 오기 전에 유저로부터 얻은 데이터를 활용해서 요약의 퀄리티를 높여서 영상을 보지 않더라도 이것만 보면 바로 이해할 수 있는 자료를 만들 수 있도록 모델을 구축하는 것이 하나의 해자가 되지 않을까 하는 생각이 든다.


두번째로는 추천 알고리즘이다. corely ai의 첫화면을 보면 유저가 많이 복붙한 링크를 순위별로 보여주고 있다. 이것이 의미하는 건 뭘까? 우리가 공유한 링크를 기반으로 유사한 사람들을(collaborative filtering) 묶어줄 수 있고 각각이 공유한 영상들을 기반으로 좋아할만한, 유익할만한 영상을 추천해줄 수 있다는 것이다. 위에서 말한 모델이 직접 영상을 만들 수 있다면 그 영상까지도 컨텐츠 풀로 활용할 수 있을 것이다. 


유튜브 알고리즘이 이미 잘 하고 있지 않나요?라고 얘기하실 수 있다. 하지만 우리가 간과하는 건 유튜브에는 수없이 많은 나의 관심사들이 복합적으로 섞여있다는 것이다. 내가 쉬고 싶을 때는 테니스 영상을 보고, 요리해야할 떄는 요리 영상을 보고 공부해야할 때는 공부 관련 영상을 보는 상황에서 추천을 잘하는 것과 "지식 습득"을 목적으로 들어온 앱에서 쌓은 데이터를 기준으로 "지식 습득"컨텐츠를 추천해주는 것은 후자가 훨씬 쉽고 정확할 수 있다.


이게 잘 워킹한다면, 이런 요약 서비스는 내가 보고싶은 영상의 링크를 붙여넣기하러 들어오는 것 뿐만 아니라 수시로 나를 위해 도움이 되는 이미 요약된 아티클로 가득찬 "피드"를 보려고 들어오는 서비스로 발전할 수 있을 것 같다.


마지막으로는 아카이빙인 것 같다. 사람들은 내가 오랫동안 모든 자료들을 모은 공간에 대해서 관성을 가지는 경향이 있다. 노션보다 뛰어난 제품이 생겨난다고 해도 우리가 그동안 쌓은 이 노션에 대한 것들을 버리고 다른 툴로 정착할 수 있을까? 뛰어난 모델이 생기기 전에 유저로부터 많이 요약하도록 만들고, 이 요약한 컨텐츠들을 잘 아카이빙할 수 있고 관리/검색할 수 있는 기능이 제공된다면 경쟁 제품 대비해서 유사한 성능이라면 이 제품을 지속적으로 이용하게 될 유인이 되지 않을까?




해당 서비스의 PM이라면 어떤 것을 해볼 수 있을까?


위에서 말했듯이 가장 중요한 것은 데이터를 많이 확보하는 것이다. 이는 크게 2가지 접근으로 나눠볼 수 있을 것 같다.


유저당 공유수를 늘리는 것과 공유하는 유저 수 자체를 늘리는 것이다. 사실 전자는 기존 유저들을 더 자주 이용하게 만드는 것이고 공유하는 유저 수 자체를 늘리는 건 외부 유저를 많이 데려오는 것에 가깝다고 생각한다.


방법 1 : 유저당 요약 요청 수를 늘리는 접근방식

- 일반적으로 유튜브 요약 서비스는 유저가 요약이 필요한 컨텐츠가 아니라면 방문하지 않는다. 즉 "demand"가 있을 때에만 방문을 하는 서비스이고 "supply"를 할 수 없다는 점이 단점이다. 또한 Demand가 생길때마다 유저는 귀찮게 매번 링크를 복사해야한다. 유저당 공유 수를 늘릴려면 supply를 할 수 있는 방법과 이 허들을 낮추는 두가지 방법으로 접근하는 것이 좋아보인다.



1. 사람들은 재미성 컨텐츠들은 홈피드에서 휙휙 보고 넘기는 반면, 정보성 컨텐츠의 경우 하나의 컨텐츠를 보고 채널을 구독하는 비율이 높은 것 같다. 의미있는 컨텐츠를 지속적으로 생성할 것 같아서 그 정보를 받아보기 위해서 구독해놓는 느낌이다. 그렇다면 유저의 구독 채널 목록에 접근가능하다면(이게 api로 제공된다면) 이 중에서 정보성 채널들을 분류하고 이 채널들에 새로운 영상이 올라오면 이걸 요약해서 제공해준다면 유저는 유튜브에 구독탭보다 요약 서비스에 더 자주 방문하게 만들 수 있지 않을까? 


이렇게 되면 요약 요청 수라는 지표는 퇴색될 수 있어서 열람 수 등으로 지표를 수정해야할 수 있다.


2. 일반적으로 이러한 서비스는 모바일보다는 컴퓨터에서 영상을 복붙하는 것이 좀 더 편한 UX이다.하지만 대부분의 사람들은 주로 유튜브를 모바일로 많이 보는 편이다. 그래서 어떻게 하면 이걸 더 편하게 할 수 있을까 하다가 생각이 든건 카카오톡 플러스 채널이었다. 우리는 주로 SNS나 인터넷의 링크를 누군가에게 공유할 때 주로 카카오톡을 활용한다. 

그래서 이미 유저에게 익숙한 Use Case를 사용해서 유튜브에서 공유를 누르고 카카오톡으로 개별 요약서비스 채널로 보내면 시간이 지난 후에 요약노트를 보내주는 형태가 생각이 났다. 아쉽게도 아직까지는 그런 기능이 구현되어 있는 서비스는 없는 것 같다.(애초에 카카오톡 정책상 플러스 친구에 링크를 공유하는 기능이 없는 것 같은데 해결하는게 가장 쉬운 해결책인 것 같다.)



방법 2 : 유저 수를 늘리는 방법


유튜브 요약 서비스를 잘 이용하는 사람들의 이야기를 들어보면 대부분의 유저들이 만족한다. (모바일 유즈케이스에 대한 아쉬움과 결과를 받기까지 시간이 좀 걸린다를 제외하고는..) 실제로 많은 분들이 오가닉하게 홍보하시는 분들이 꽤 많다.


결국 유저들이 자발적으로 서비스를 홍보하는 역할(링크를 퍼나르는)을 해야하는데 이를 위해서는 2가지 장치가 필요하고 이 장치를 만들기 위해 아이디어는 이런 접근을 해볼 수 있을 것 같다.


1) 단순히 서비스 사이트 링크만 공유하는 것이 아니라 제품에 대한 가치가 잘 느껴질 수 있는 컨텐츠나 메세지가 함께 전달되어야 전환율이 잘 나타난다.

-> 일반적으로 릴리스 AI 요약 컨텐츠 중에서 가장 좋았던 건 "블로그 글" 기능으로 영상의 스크린캡처 이미지와 요약 정보를 같이 보여줘서 더 쉽게 이해할 수 있도록 도왔다. 이 요약 정보를 조금만 다듬으면 정말 바로 블로그 글이 나올 정도로 퀄리티가 높다고 생각한다. 이 컨텐츠를 어떻게 하면 잘 퍼뜨릴까에 집중할 것 같다.


그래서 나는 기본적으로 이 블로그 글을 실제 블로그 글로 작성하도록 해서 그 컨텐츠를 공유하도록 유도할 것 같다. 우선 회사 자체적으로 그 주에 가장 많이 요약된 컨텐츠를 선별해서 블로그 글로 작성을 하고, 요약을 한 유저에게 블로그 글을 작성하도록 유도할 것이다. 그와 더불어 스크린캡처 이미지 안에 "릴리스 AI"라는 워터마크가 박히도록 해준다면 자연스럽게 블로그 글이 노출될수록 이러한 릴리스 AI 제품을 홍보하는 바이럴 루프를 만들 수 있지 않을까 하는 생각이 들었다.


더 나아가서는 블로그 기능을 현재 복사만 되도록 되어 있는데 사이트 내에서 편집기능을 제공해서 이 글 자체를 다듬어서 발행하게 하고 이 컨텐츠들을 모아서 피드로 노출시키는 접근도 해볼 것 같다. 이를 통해 쉽게 2차 공유를 할 수 있을 것 같다. 나도 그렇지만 많은 분들이 링크 + 개인 생각을 모아서 뉴스레터나 블로그로 발행하시는 분들이 많은데 유튜브 링크 대신 요약 링크로 공유할 수 있지 않을까 생각이 들었다.


2) 유저가 가치를 느끼는 시점에 다른 사람에게 공유를 유도해서 기존 유저 대비 공유 비율을 높이는 것이 효과적이다.


사실 이 경우는 큰 아이디어보다는 UX상 가장 공유할 확률이 높은 시점에 공유를 유도하는 것이기 때문에 현재 기준으로는 요약이 마음에 들었다고 따봉을 누른 시점에 다른사람에게 공유를 유도하는 것이 현재의 상단 공유버튼보다는 좀 더 공유 확률을 높이지 않을까 생각이 들었다. 




기타 서비스 이용/분석해보면서 느꼈던 생각들

- 사실 이런 모델들은 Inference(LLM을 통해서 요약을 시키는 행위)를 시키는데 무수히 많은 비용이 들 것이다. 그래서 만일 내가 아닌 다른 사람이 내가 공유한 링크에 대해서 이미 요약을 요청했으면 모델에게 요청하지 않고 그 데이터를 DB에서 가져와서 보여주는 것처럼 보였다.(그래서 속도가 확연히 다르다.) 좋은 제품을 만드는 것도 중요하지만 AI 제품은 이 inference cost를 어떻게 최적화하면서 퀄리티를 유지하는지도 핵심인 것 같아서 남겨보았다. 


- corely ai의 사람들이 많이 요약한 영상들을 살펴보니 9분 내외의 영상도 요청하는 경우가 있더라. 정말 숏폼에 찌들어서 9분 내외의 영상조차도 요약을 원하는걸까? 아니면 요약해주는 폼 자체가 마음에 들어서 아카이빙의 목적으로 저 요약을 한걸까가 궁금해졌다. (유튜브는 결국 휘발되니까 일단 영상을 다보고 도움되는 영상이라는 생각이 들면 정리용으로 1차적으로 요청하는 걸까 하는 생각이 든다.)







끝으로 제가 해당 서비스를 직접 만든 사람도 아니기 때문에 구현 방식에 따라서 저런 모델에 대한 이야기가 매우 허황된 얘기일 수도 있습니다. 매우 유용하고 애정하는 서비스여서 더더 좋은 서비스가 되길 응원합니다! 직접 제품을 만드는 분들의 노력을 응원하며 열렬한 유저로써 지지합니다!


작가의 이전글 # 2024.02.01 / Inspiration
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari