brunch

매거진 IT꿀팁

You can make anything
by writing

C.S.Lewis

by 작은세상 Jan 23. 2019

'영상 자막 노가다' 에서 해방될 수있을까?

Vrew. 인공지능 활용 영상 편집그램 진화

#유튜버가 장래 희망인 시대


최근 1~2년 사이 유튜버가 꿈인 초등학생이 많이 늘었다.

관심없던 둘째도 자기 채널을 개설하고, 구독자를 위해 방송과 콘텐츠 편집을 할 정도이니.


유튜브 영상 편집 프로그램을 네이버에서 검색하면, 편집과 효과 관련한 전문툴 (프리미어 프로, 에프터 이펙트)과 가벼운 툴 (곰믹스, 베가스) 이 연관검색어로 나타나는 것을 확인할 수 있다.                 


10분의 촬영 영상을 편집하는데 10시간 걸리는 현실에서 Vrew는 영상 편집자들의 Pain Point를 공략한다.


자막을 넣기 위해 영상을 보고 타이핑하고, 자르고 붙이고 하는 기존 편집방식을 문서편집처럼 바꾼것이다.


이런 느낌이랄까.



수작업으로 자막 편집했던 영상 편집 달인도 인정하는 Vrew 의 음성인식 통한 딥러닝 자막.

(영어와 한국어 2가지만 현재는 지원)   


유튜버 '미스터 가젯트' 영상 중 화면 캡쳐


'Deep Learning', 'AI' 등 핫한 기술을 버무려 만든 Vrew를 만든 회사는 어디일까?


회사대표가 강연한다는 소식을 듣고 세미나에 참석했다. 어떤 사람일까? 그 회사가 지향하는 것은 무엇일까?


' 보이저엑스 남세동대표'

    

1998년. 세이클럽을 혼자 기획하고 개발한 인턴 (런칭 후 네오위즈 캐시카우로 자리매김)

2005년. 네이버에 인수된 검색엔진 첫눈 기획팀장과 개발팀장 겸임 (350억원에 인수)

2012년. 라인 카메라 기획 및 개발 (500억원 가치)

2014년. 라인 B612 기획 PM 및 초기 UI 디자인 초안 만듬

2015년. 라인 퇴사

2017년. 보이저엑스 창업


[기획] 화제의 창업자,'보이저엑스' 대표 남세동, 그는 누구인가?


대표의 개인브랜드 가치가 높은 회사가 만들어낸 첫번째 작품.

그의 이야기를 듣기위해 1월21일 TOM (Talks on Media) 세미나에 참석했다.   


       

#폭풍이 몰려온다.


세미나에 참석한 청중 대부분은 미디어업계에 종사하는 사람들이었다.

그들의 관심사는 AI가 미디어 업계에 어떤 변화를 가져올 것인가에 대한 궁금증 때문이었으리라.


1시간 가량 진행된 발표 이후 Q&A 시간 질문들에서도 이러한 두려움은 느껴졌다.


"AI가 일자리를 대체한다거나 이런 기술 발전에 따른 변화에 인간의 역할은 어떻게 변할까요?"


남세동대표는 이 영상을 본 적이 있는지 질문을 하며 강연을 시작한다. (청중 1/3 정도가 봤다고 손을 들었다.)   

https://www.youtube.com/watch?v=wMWdo8cVZ_U           

2018년 구글 연례 개발자 컨퍼런스에 등장한 AI가 사람을 흉내내어 미용실을 예약하는 영상


방금 전에 보신 영상속에는 이러한 프로세스들이 숨어 있습니다.


주인의 요청을 수신 (일정표 확인) -> 미용실에 전화를 건다.(구글 어시스턴트가) -> 상대방의 음성을 수신하고 분석하여 적절한 답을 찾는 과정을 스스로 판단하고 실행한다. (미용실 예약 변수에 대한 능동적 대처)


많은 사람들의 입에서 탄식이 흘러나온다.


"오...아..."



수 많은 오케스트라 연주곡을 학습하여 스스로 작곡하는 AIVA 라는 서비스도 있습니다.   

https://www.youtube.com/watch?v=HAfLCTRuh7U

기존 레퍼런스 곡들을 학습하면서 패턴을 찾아내어 이를 프로그램으로 만드는 서비스


  남세동대표는 AI를 이야기 하기전에 딥러닝 -> 머신러닝 -> AI로 이어지는 구조를 설명한다.

   

  마치 시장규모 산정시 많이 이야기하는 SOM -> SAM -> TAM처럼.


강연의 상당시간은 개발 프로세스를 잘 알지 못하는 청중들을 대상으로 로직을 설명하는데 할애했다.


이세돌 9단이 알파고를 이긴 기적은 더 이상 볼 수 없다고. (알파고가 은퇴하기도 했고, 이미 이후 데이터를 학습했기 때문에 그런 기적은 나올 수 없다고)    


  https://www.youtube.com/watch?v=0QSi4EaV4i8

 

"AI 기술을 통해 미디어 분야에서 활용할 수 있는 범위는 어디까지라고 볼 수 있는가?" 라는 질문에 그는 이렇게 대답한다.


             입력, 출력, 숫자로 표현되는 '패턴'은 모두 AI로 대체될 수 있습니다.  


머신러닝에 대한 개념 이해와 AI 관련 활용 사례에 대한 소개가 끝나자, 관심있던 제품 Vrew에 대한 이야기가 이어진다.


큰 꿈을 가지고 개발한 제품은 아닙니다.
유튜버들을 만나보니 '영상 자막 노가다'에 지쳤다고 많이 이야기합니다.
그래서 그 수고를 조금이나마 도와주고 싶었습니다.
 

남세동대표의 이야기에 이어 몇 가지 기능들을 소개하니 현장은 공감의 목소리로 뒤덮였다.


특히, 프리미어 XML 내보내기 설명 구간에서도 여기저기서 탄성이 이어졌다. 그만큼 해당 작업 노가다에 대한 아픔이 컸기에.        


요 기능이다. 많은 이들의 공감을 불러왔던.

(개인적으로는 이 기능이 Vrew의 포지셔닝을 대변한다고 생각한다.)

  

https://www.youtube.com/watch?v=z3xTvm38c5s


2018년 Vrew 업데이트가 20차례 이어졌다니 고객의 요구들을 재빠르게 수용하고 개선하는 것이 Vrew 팀의 가장 큰 강점이 아닐까 싶다.


Vrew를 포함 보이저엑스가 준비하는 제품들에 대한 계획도 공개되었다.


Vrew 관련해서는 다음과 같은 기능들이 '5년' 내에 추가될 것이라고.

영상속의 화자 구분

상황인식 (지문) : 웃는 상황 같은 경우 (웃음) 이라는 지문들이 영상을 분석해서 추가될 수 있도록 구현

카메라 선택 : 멀티카메라 (ex) 웃으면 Zoom In 되는 기능 등

하이라이트 추출 : 편집하고 싶을때 목적에 따라 하이라이트를 자동 추출하는 기능 (ex) 홈런장면 등

화면 전환 효과 : 사람들의 편집효과의 '패턴'을 분석하여 거기에 맞는 화면 전환효과를 자동으로


FLATTR : 책을 스마트폰으로 자동으로 스캐닝하고 (폰트 스타일도 분석) 이를 PDF 로 Export


     



남세동대표의 페이스북 포스팅은 많은 사람들이 공유하고 공감한다.

왜 그런가 생각해보니 그의 성향이 개발을 잘아는 철학자에 가깝기 때문이 아닐까.


그가 쏘아올린 작은 공 Vrew는  '자막 노가다 해방 프로그램' 으로 환영받고 있다.

돈을 어떻게 벌지 고객들이 걱정하는 그런 회사.


우리나라에서 그런 회사를 만난다는 것. 토스 이후 오랜만에 느껴보는 기분이다.      


Vrew 다운받기 : http://bit.ly/2R97Ju6



매거진의 이전글 '아싸'의 돈버는 앱 4종 체험기   
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari