SUNO AI
가끔 이런 생각이 든다. 이제 음악도 AI가 만들면 사람은 뭘 해야 할까? 최근 가장 자주 사용한 음악 AI 툴이자, 다니던 회사에서 지원했던 서비스이기도 한 SUNO. AI 툴 탐구하기 시리즈의 첫 번째 주제로 이걸 선택한 이유다. 오늘은 SUNO가 무엇인지, 그리고 실제로 사용해 보면 어떤 결과물이 나오는지 이야기해보려 한다. 우선, 모르시는 분들을 위해 SUNO AI가 무엇인지 먼저 소개한다.
믹키 슐만 하버드대학교 박사가 설립한 SUNO는 음악적 지식이 없는 사용자도 텍스트 입력 만으로 몇 초 만에 연주와 보컬을 모두 포함하는 완전한 노래를 생성하는 AI다. SUNO는 대형언어모델(LLM)과 똑같은 방식으로 수백만 곡의 스타일과 구조를 학습, 다음 토큰을 예측하는 방식을 사용한다. LLM은 인간의 언어를 이해하고 생성하는 능력을 가진 인공지능 기술로, 방대한 양의 텍스트 데이터를 학습해 언어의 문법과 맥락, 그리고 다양한 표현의 뉘앙스까지 파악할 수 있다. Chat GPT와 같은 방식이라고 한다.
SUNO를 사용해 본 결과, 이 프로그램의 최고 장점은 정말 간단한 조작만으로도 높은 퀄리티의 결과물을 낸다는 것이다. 얼마나 간단하냐면. 과장 조금 보태서 클릭 한 번에 노래가 만들어진다. 꽤나 들을 만한 정도의 퀄리티로.
왼쪽의 Create을 누르면 화면과 같은 페이지가 뜬다. 본인은 왼쪽 상단의 Custom도 켜두었다. Custom을 끄면 노래에 관한 설명만으로 노래가 생성이 되지만 세부적으로 조절할 수 없다는 단점이 있다. 반면 Custom을 켜면 노래의 가사, 스타일 등을 직접 설정할 수 있어 더욱 원하는 결과를 얻기 쉬워진다. 이를 활용해 이 페이지의 BGM을 한번 만들어보겠다.
Chat GPT를 이용해서 가사를 만들었다. SUNO라는 단어를 이용한 라임을 살려서 가사를 부탁했다. 스타일은 힙합과 신남, 두 가지를 입력했다. 그렇게 탄생한 곡.
https://suno.com/song/ee068215-273d-4fa9-ab7b-657aa11c02f2?sh=yHpCS3Dtgxo3gzdS
사실 가사는 단어의 운율만 맞춰도 꽤나 그럴듯해 보이는 효과가 있다. 거기에 적절한 멜로디가 더해지니 마치 이제 막 데뷔하는 K-POP 아이돌의 곡 같은 느낌이 난다. 벌써 흥얼거리는 중. 하지만 BGM으로 사용하기엔 너무 신나고, 힙합의 느낌은 딱히 없다. 레퍼런스로 생각했던 곡은 Not like us인데 전혀 구현해내지 못했다. Style of music 항목에 들어가는 단어는 우리가 흔히 쓰는 표현과 다르게, AI 친화적인 용어를 찾아 넣어야 한다는 점을 다시 한번 깨달았다.
그럼 이번엔 Custom을 사용하지 않고 곡을 만들어보겠다. Song description에 Chat GPT를 이용하여 Create a powerful hip-hop track inspired by Not Like Us. Use heavy 808s, sharp hi-hats, and a West Coast bounce. Lyrics should be confident, aggressive, and packed with clever wordplay. 라고 적었다. 과연 결과는?
https://suno.com/song/1bf45837-c129-4f9e-9f21-5da833b53a7e?sh=wQYEUWocG3AF2R0s
확실히 처음보다는 훨씬 더 원했던 스타일에 가까운 음악이 나왔다. 하지만 가사가 자동 생성된다는 점은 아쉽다. 설명할 수 있는 칸이 200자뿐이라, 가사는커녕 곡 설명을 쓰기에도 벅차다. 원하는 곡 스타일만 대략적인 방향성이 맞으면 괜찮지만, 디테일한 설정이 필요한 경우엔 Custom 기능을 사용하는 것이 필수적이다.
그럼 또 궁금한 것. AI 음악은 사람이 만든 음악처럼 감동을 줄 수 있을까? 최근 정말 명반이라고 느꼈던 아이돌의 앨범이 하나 있다. 바로 엔믹스의 fe3o4:forward. 그중에서도 빠삐용은 정말 미쳤다.
https://www.youtube.com/watch?v=qQhEwaHszKo
초반부터 이 세상 것이 아닌 듯한 기계음과 묘한 화음이 어우러지면서, 마치 인간과 기계의 최후의 만남을 시사하는 듯한 엄청난 임팩트를 준다. 중간에 지우의 랩이 분위기를 환기시키면서, 리듬이 빨라지고 더 미지의 세계로 끌려가는 느낌이 든다. 이 곡의 유일한 단점이라면 너무 짧다는 것. 과연 이 노래의 감동을 AI가 얼마나 재현할 수 있을까? 가사는 동일하게 쓰되, 키워드만 입력해 곡을 생성해보았다.
https://suno.com/song/8a4ebd90-0d33-4e5f-9aa4-0242e0b26e2e?sh=f8sbR0avx10g0FVB
https://suno.com/song/d08f6b50-37c0-4427-80ea-c5a6bf08a368?sh=UBVO06TRCJLLP6hZ
결론은? 아직은 AI가 노래에서 감동을 주기는 어려워 보인다. 특히 AI가 만든 특유의 기계음이 곡의 완성도를 크게 떨어뜨린다. 최근 AI BGM을 가장 잘 활용한 콘텐츠를 꼽으라면, 추성훈 유튜브가 떠오른다. AI 음악의 유치하고 약간 촌스러운 감성이, 오히려 예능적인 재미를 극대화하는 데 활용되었다. 즉, 현재 AI 음악의 최적 활용법은 감성적인 터치보다는 콘텐츠의 분위기를 살리는 보조적 역할에 가깝다.
https://www.youtube.com/@Choosunghoon_ajossi
하지만, 이 분야도 크게 성장할 것이다. 더 비싼 느낌의 고퀄리티 비트, 그리고 실제 가수 같은 목소리와 가창력까지 탑재된다면, 인간이 만든 곡과 구별하기 어려운 날이 올 수도 있다. 그렇다면 인간 작곡가는 어떤 차별점을 가져야 할까? 노래의 감정을 전달하는 것도 결국 부르는 사람의 테크닉에 달려 있는데, 이 테크닉조차 AI가 구현할 수 있다면? 오프라인 공연이 더 늘어나려나? 이 지점에서 새로운 고민이 시작된다.
다음엔 또 다른 AI를 탐구해보겠다.