brunch

You can make anything
by writing

C.S.Lewis

메타, AI기반 ‘텍스트-GIF’ 변환 기술 공개

뉴스 스크랩

기사 제목: “텍스트로 동영상까지 만든다”…메타, AI자동화 기술 공개

기사 링크:https://www.itbiznews.com/news/articleView.html?idxno=77136


메타플랫폼이 텍스트를 토대로 동영상 콘텐츠를 만들 수 있는 인공지능(AI) 시스템 ‘메이크-어-비디오(Make-A-Video)를 공개했다. ‘광장에서 춤추는 로봇’과 같은 문장을 입력하면 AI가 이를 토대로 적합한 비디오 클립을 제작하는 자동화 기술이다. 메타는 ▲슈퍼히어로 망토를 쓰고 하늘을 나는 개 ▲화성에 착륙하는 우주선 ▲붓으로 캔버스에 그림을 그리는 클로즈업 ▲물을 마시는 말 등의 이미지를 공개했다. 이들 단어를 이용해 짧은 비디오 클립이 사실적으로 제작됐다는 게 메타의 설명이다.메타는 “메이크-어-비디오는 단 몇 단어, 혹은 몇 줄의 텍스트로 상상력에 생명을 불어넣어 생생한 색상, 캐릭터, 풍경으로 가득 찬 독특한 비디오를 만들 수 있다”며 AI를 통해 새로운 콘텐츠를 빠르고 쉽게 만들 수 있는 도구를 제공해 창의적인 표현을 발전시키는 기술”이라고 소개했다. 메타는 이미지에서 동영상을 만들거나 기존 동영상을 토대로 새로운 동영상을 만드는 편집 기능도 추가할 예정이다. 또 연내 공개 테스트가 시작될 것으로 알려진다. 구글, 오픈AI 등이 시도하는 이미지 생성 AI가 동영상 영역까지 확장되는 것이다.




핵심 기술 및 비즈니스 소개

멀티모달 AI: 텍스트, 음성, 언어, 사진, 영상 등 다양한 양식의 데이터를 받아들이고 사고할 수 있는 AI 

1. 메이크어비디오 기술은 단어, 텍스트 등을 이용해 일러스트를 만들었던 메타의 ‘메이크-어-신(Make-A-Scene)’을 고도화한 것으로 메이크-어-비디오, 메이크-어-신을 통해 크리에이터는 더 자유롭게 동영상이나 일러스트를 만들어 더 풍부하게 표현을 전달할 수 있다. 

2. 이 기술은 2개의 관련 이미지를 촬영하고 중간 프레임을 생성한다. 또한 정지 이미지에 모션을 적용할 수 있다. 예를 들어, 정지한 배의 그림을 캡처해 파도를 가로질러 움직이는 GIF를 만들 수 있다. 

3. 메타는 달리(DALL-E)와 같은 텍스트-이미지 AI모델을 사용해 단어와 이미지 사이의 연관성을 파악하고 추가로 레이블이 지정되지 않은 비디오 훈련 데이터를 적용해 메이크-어-비디오 모델이 텍스트 또는 이미지 프롬프트가 시공간에서 어디에 존재하는지 학습하도록 했으며 현 이미지 다음에 올 이미지를 예측해 짧은 시간 동안 움직이는 장면을 표시했다.


시사점 및 인사이트

메타의 메이크어비디오는 AI예술을 지금까지와는 다른 차원인 영상으로 끌어들였다고 볼 수 있다. 

예술적인 아이디어를 얻거나 특히 패션이나 디자인 업계 등에서 영감을 얻는 데 유용할 수 있다. 


같이 생각해 볼 만한 논점


1. 이렇듯 AI로 생성된 이미지/동영상과 관련해 일어날 수 있는 논란 또는 문제점은 무엇이 있을까?


2.  ‘특정인의 포인트와 특성을 짚어내는 것', 즉 인공지능의 ‘개인화’ 방식 관련 활용분야에 대해 생각해보자.



작성자: ITS 23기 김은수  

작가의 이전글 AI 문체분석 서비스, 인공지능의 개인화
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari