brunch

You can make anything
by writing

C.S.Lewis

by 기획자 연주리 Apr 25. 2022

유튜브가 AI를 사용하는 방법

그들이 똑똑해지는 이유

유튜브는 '19년 11월부터 테스트 중인 신규 기능을 공개하고 있습니다. PM의 입장에서 유튜브가 새로이 테스트한 기능의 목록을 훑어보는 건 꽤 재미있고 유용합니다. 유튜브의 신규 기능 중 흥미롭다고 느낀 AI와 자동화 관련 기능 세 가지를 공유합니다.



1. 영상의 챕터를 자동으로 구분해줄게


유튜브 챕터 구분 기능을 최근에 보신 적이 있을 거예요. 재생 바가 챕터에 따라 구분되어 있고, 재생바를 문지를 때 썸네일과 함께 챕터 제목이 함께 뜨는 기능입니다. 유튜브는 이제 챕터를 자동으로 구분하는 기능을 테스트 중입니다.

https://www.youtube.com/watch?v=r1VL77gR-84


2020년 11월 23일: 비디오 자동 챕터 서비스

유튜버들이 수동으로 타임 스탬프를 추가하지 않아도 영상에 챕터가 구분될 수 있도록 하는 기능입니다. 챕터를 자동으로 생성하기 위해 머신 러닝으로 텍스트를 인식합니다.


어떻게 만들었을까?

OCR 글자 인식 기술을 사용했습니다. 기존에는 영상 설명 란에 챕터 별 timestamp를 적으면 그에 따라 챕터를 구분했는데, 이제는 OCR 인식 기술을 사용해 자동으로 설명란에 timestamp를 추가하고, 챕터를 구분할 수 있습니다.


https://www.youtube.com/watch?v=-ouI8Xw9pH8


장점

영상을 업로드하는 유튜버에게 편리한 기능입니다. 챕터 구분의 정확도만 보장된다면 챕터 timestamp와 자막을 유튜버가 직접 타이핑하지 않아도 됩니다. 영상 시청자들 또한 챕터 정보가 많아질수록 영상을 효율적으로 시청할 수 있다는 장점이 있습니다.


단점

글로벌 서비스다 보니 모든 언어를 한 번에 지원하기 어렵습니다. 현재 한국어에는 해당 기술이 적용되지 않은 것으로 보입니다. 또한, 언어 별로 글자를 인식하는 엔진이 다르므로 엔진 별 성능에 차이가 발생할 수 있습니다.


또한 성능과 관련하여 두 가지 궁금한 사항이 있습니다. 먼저, 챕터 제목(자막)의 위치가 고정되지 않고 위치를 옮기더라도 인식이 가능한지 알고 싶습니다. 대부분의 유튜버가 챕터 구분의 일관성을 위해 고정된 위치에 챕터 제목을 넣긴 하지만, 종종 챕터 제목의 위치가 변하거나 챕터 제목이 중간에 사라지는 영상도 있습니다. 그런 영상에서도 정확도가 보장되는지 궁금합니다. 또한, 챕터 자막과 예능형 추임새 자막도 구분을 해야 될 텐데 그것도 가능할지 궁금하네요. 챕터 자막과 예능형 자막의 영역이 겹친다면 완벽하게 구분해내기는 어려울 것으로 예상됩니다.



2. 상품 연관 영상을 추천해줄게


2021년 3월 22일: 비디오 안의 상품 리스트 자동 생성 서비스

영상에서 인식된 상품과 관련 상품 리스트를 제공하는 기능입니다. 이 UI는 영상 하단을 스크롤하면 추천 영상들 사이에 보입니다. 이 서비스의 목표는 사람들이 해당 상품에 대한 정보 및 관련 영상을 더 탐색하도록 돕는 것입니다. 이 기능은 미국 내 사용자에게만 적용됩니다.


어떻게 개발했을까?

유튜브 공식 블로그에서는 정확한 개발 방식이 나오지 않습니다. 영상에서 상품을 자동으로 인식하기 위해 객체 인식 (어떤 상품인지), 로고 인식 (어느 브랜드인지), OCR 문자 인식 (자막으로 상품 추론) 등의 기술을 종합하여 사용할 것으로 예상됩니다.


온라인 매거진 9 to 5 Google에서 예상한 UI는 아래와 같습니다. 다만, 외부 링크를 클릭해 유튜브 플랫폼을 이탈하는 방식보다는 같은 상품을 다루는 영상을 추천하는 방식에 더 가까울 것이라고 덧붙입니다. 상품을 구매하기 전, 상품에 대해 알아보는 단계에 있는 사용자들에게 같은 상품을 다루는 여러 영상을 추천하는 로직을 강화하기 위한 보조적인 기술로 판단합니다.


출처: 9to5google



3. 가장 인기 있는 장면을 알려줄게


2021년 10월 5일: 재생바 상단의 "인기 그래프(engagement graph)"

영상의 어떤 영역이 재미있는지 쉽게 탐색할 수 있는 UI입니다. 재생 바를 문지르는 동안 빨간색 재생바 위에 "인기 그래프"가 뜹니다. 다시 재생된 횟수가 높은 구간일수록 그래프가 더 높습니다. 이 테스트 기능은 적은 비율의 모바일과 데스크톱 시청자에게만 적용되었습니다.


https://www.youtube.com/watch?v=9azCrNTClqQ


어떻게 개발했을까?

현재 유튜브 크리에이터 스튜디오에서 시청 그래프를 제공합니다. 유튜버들이 자신의 영상에서 사람들이 어느 시점까지 시청하고, 어디에서 가장 많이 이탈했는지 알려주기 위해서입니다. 이 기능은 영상 창작자에게만 보이던 정보를 다른 사람들에게도 노출하는 기능입니다. 즉, 영상 창작자에게만 보여주던 재생 관련 정보를 시청자에게도 제공하는 데이터 시각화 서비스입니다.



장점

장점은 초반에 영상이 재미없어서 이탈하는 시청자를 조금이라도 더 잡아둘 수 있다는 것입니다. 예를 들어, 해당 영상은 초반에 약간만 지루함을 견디면 후반으로 가서 재미있게 시청할 수 있다는 단서를 얻을 수도 있고, 지루해서 도저히 못 견디겠다면 재생바를 뒤로 이동해서 most viewed 장면만 시청해도 됩니다. 해당 기능이 유효하게 작동한다면 전반적인 시청 시간이 증가할 것으로 기대됩니다.


단점

재생바 위에 그래프 UI가 난잡해 보인다는 것이 단점입니다. 사람들이 인기 그래프에 익숙해지면 처음부터 재생을 하지 않고 most viewed만 시청해서 시청 시간이 오히려 짧아진다는 부작용도 있을 수 있습니다.

매거진의 이전글 네이버와 카카오, IT 양대산맥의 visionAI 비교
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari