StabilityAI Stable Audio 2.0출시

전체 트랙 생성 기능 장착

Apr 7. 2024

출처: Stability AI

스태빌리티 AI는 텍스트 to 이미지인 스테이블 디퓨전(Stable Diffusion)으로 가장 많이 알려져 있지만 이미 23년 9월 스테이블 오디오를 출시하며 텍스트 to 오디오 툴 역시 서비스로 제공하고 있었습니다.

음악이나 사운드를 최대 3분 동안 생성하여 창의력을 발휘해 보세요

간단한 텍스트로 다양한 오디오의 편집을 경험해 보세요

Stablility AI는 저작권 보호를 우선시하여 머신러닝을 진행함

스태빌리티 AI는 스테이블 오디오 1.0는 뛰어난 오디오 충실도, 의미 있는 출력 지속 시간, 획기적인 텍스트 To 오디오 생성 모델을 만드는데 중점을 두었습니다.

그리고 그 경험을 바탕을 스테이블 오디오 2.0을 출시하며 초기의 본질을 그대로 발전시킨 모델을 만들어 냈습니다.

음악성을 발전시키고 출력 시간을 연장하고 프롬프트를 조금 더 세부적으로 이해하여 응답할 수 있도록 개발하여 새 버전을 발표하였습니다.

그들의 목표는 AI가 생성한 오디오 트랙이 실제 음악처럼 들리게 노래 전체를 만들 수 있도록 노력하였습니다.

그들의 이러한 노력은 크리에이터들과의 갈등 상황에 작은 희망을 보여주고 있습니다

하지만 스테이블 오디오는 말 그대로 오디오 트랙과 배경음악을 만드는데 유용해 보이고 sunoAI처럼 노래를 모두 만들어주는 프로그램은 아닙니다.

하지만 수노에서 만드는 노래는 마음에 들게 나와도 뭔가 부족함이 느껴질 때가 있는데 그때 스테이블 오디오에서 편집을 통해 조금 더 개선된 오디오를 만드는 데 활용이 가능하다 생각됩니다.

이후에 이런 사용 과정을 한번 포스팅해보겠습니다.

keyword