정복당하는 것은 인간의 의식일 뿐이다.
전 국민이 노래를 부르는 시대다. 누구나 노래를 연습하고 세상에는 노래를 잘하는 사람이 너무 많다. 그렇게 된 가장 큰 이유 중 하나는 보컬 연습에 관한 수많은 내용들이 인터넷으로 공유되는 세상이기 때문이다. 동아리에 내려오는 전설 같은 선배들의 주먹구구식 연습방법이 아니라, 수많은 사람들에게 검증된 다양한 방법들이 인터넷에 돌아다닌다. 심지어 서로의 방법이 옳다고 싸우기도 하고, 그 과정에서 누군가는 뭔가를 배우기도 한다.
결국 정답을 찾지 못하고 다양한 연습을 하겠지만 그래도 큰 줄기는 비슷하다. 예전처럼 폭포밑에서 목에서 피가 날 때까지 소리를 질러야 한다든가 하는 조금은 황당한 방식들은 없어졌다. 결국 무엇을 어떻게 하더라도 우리는 '음정'과 '박자'를 중요하게 여긴다. 그게 기본이라고 여기기 때문이다.
얼마 전부터 '그림 그리는 AI'에 대한 이슈가 불타올랐다. 개인적으로도 4차 산업과 문화 콘텐츠를 둘 다 다루는 입장이라 'stable diffusion'을 직접 써보기도 했고 관련해서 글도 썼다. 그 글에서도 다뤘지만 AI의 퀄리티는 생각보다 놀라웠다. 그리고 더 많은 내용의 학습을 거치면 더 놀라운 퀄리티를 뽑아낼 수 있을 것이라는 것 역시 사실이었다.
다만 학습모델의 영향을 떠나서 아직도 불안정한 부분이 많았다. 여러 가지 입력된 화풍으로 그리다 보니 중간중간 화풍이 합쳐지면서 어색해지는 부분이 많았다. 사람이 그렇게 그렸다면 '꿈보다 해몽'이라도 해서 의도가 있지 않겠나 살피겠지만 AI가 손가락을 6개씩 그리고 팔을 4개씩 그리면 그걸 종교적 의미와 결합한 그림이라고 확대해석 해 줄 사람은 많지 않다.
그럼에도 이번 사건은 꽤나 여러 분야의 사람들에게 긴장감을 주었다. 나도 내 노트북으로 AI 모델을 돌려봤다. 내 노트북이 아주 최신 사양이거나 너무 좋은 것이 아님에도 매끄럽게 몇 초에 한 장씩 그림을 뽑아낼 수 있었다. 그중에는 마음에 드는 고 퀄리티의 그림도 꽤 있었다. 예전처럼 AI로 뭔가 작업을 하는 게 항상 슈퍼컴퓨터를 필요로 하지는 않는다. 심지어 어딘가의 서버로 보내서 결괏값만 받는 것도 아닌 가정용 컴퓨터의 CPU와 GPU로도 충분히 돌려볼 수 있는 시대가 되었다.
음악에서도 AI의 도전은 심심치 않게 들려온다. 그런데 음악 AI와 그림을 그리는 AI는 꽤나 다른 점이 존재한다. 위에서 다룬 AI는 사실 창작의 영역이다. 음악도 작곡 AI가 존재한다. 그런데 음악에는 작곡가만 중요한 것이 아니다. 수많은 '실연자'들이 음악의 주체다.
그림은 창작을 하지 않으면 주체가 되기 어렵다. 타인의 그림을 카피해서 그리는 사람들에 대해서 우리는 별다른 주목을 하지 않는다. 그런데 음악은 다르다. 피아니스트, 바이올리니스트, 보컬리스트. 수많은 음악인들이 작곡을 하지 않는다. 그럼에도 세계적인 거장으로 불리거나 뛰어난 음악가가 된다.
AI로 음악을 연주하는 것은 사실 어려운 일은 아니다. 이미 DAW(Digital Audio Workstation)이 일반화된 지는 한참이 지났다. AI가 DAW를 통제한다면 있는 악보를 연주하는 것은 일도 아니다. 그리고 한 음도 틀리지 않고 정확하게 연주할 수 있다.
그림에서도 화가의 붓 터치는 각자의 감각이 있겠지만, 몇백 년 된 붓으로 그렸는가에서의 차이는 그다지 의미가 없다. 그런데 음악은 다르다. 악기 하나하나가 갖는 소리가 다르고 또 그걸 어떻게 다루느냐에 따라서 소리가 많이 다르다. 물론 디지털이 엄청난 시간을 들여서 그걸 따라가고는 있지만 이 하나의 변수만으로도 이미 음악 AI는 쉽지 않은 고민을 하게 된다. 물론 엄청난 시간을 들여서 학습한다면 그러한 악기의 소리도 거의 완벽에 가깝게 재현할 날이 올 수도 있다.
하지만 화가들은 같은 그림을 수백 명이 각자의 화풍으로 다시 그리는 일을 '굳이' 하지 않는다. 음악은 그걸 한다. 오래된 음악을 자신의 해석하고 받아들여서 연주한다. 그러기에 수많은 음악가들이 정말 엄청난 시간을 들여서 자신을 갈고닦는다. 그걸 '카피'하는 것은 AI가 아니라 컴퓨터도 가능한 일이다. 그런데 그런 새로운 '해석'을 해내는 것을 AI가 할 수 있을까?
AI가 아니라 우리 역시 노래뿐만 아니라 악기에서도 정확한 음을 연주하기 위해서 노력한다. 하지만 정확한 음이라는 것 자체가 참 어려운 개념이다. 누군가가 그것을 정확하게 입력했을 때 AI는 그런 정확한 '음'을 만들어 낼 수 있을지도 모른다. 그런데 그러기 위해서는 누군가 '정확하게 입력해 주는' 사람이 필요하다. 그리고 그 전제조건은 '정확한 음'에 대해서 알고 있어야 한다. 그게 불가능하다.
우리는 어릴 때부터 '도레미파솔라시도'라고 '계이름'이라는 것을 부르면 노래를 불렀다. 물론 지금의 아이들은 좀 더 체계적이고 다른 교육을 받을지 모르겠지만 적어도 몇십 년 간은 그렇게 배워왔다. 물론 당연하게도 음악을 전공으로 하는 사람들이라면 그 이상으로 복잡한 많은 음들을 알고 있을 것이다. 피아노만 봐도 검은건반이 있으니까. 그리고 현악기나 보컬처럼 정확하지 않은 음을 다루는 악기들이라면 그 이상의 음이 존재한다는 것도 알고 있을 것이다.
문제는 이러한 사이에 존재하는 음들을 무엇이라고 판단할 것인가의 문제이다. '정확한 음'을 벗어나면 전부 필요 없는 소리가 되는 걸까? 아니면 표현에 따라서 필요한 음이 되는 것일까.
음악을 좋아하지만 전공자는 아니다. 나는 위에 언급한 전설과도 같은 선배들의 족보 같은 레시피(?)로 노래를 연습했던 세대다. 인터넷이 그리 활성화되기 이전에 음악 밴드에서 서로 공유하는 정보는 대단히 부정확했다. 지금 이 시대가 되고 보니 맞는 것도, 틀린 것도 있다는 것을 알게 되었지만 황당한 연습방법이 꽤나 많았다. 웃긴 것은 그렇게 연습을 하더라도 조금씩 나아지긴 했다는 것이었다.
지금의 체계적으로 공부한 사람들이 들으면 코웃음을 칠 일이지만 그때는 그랬다. 지금은 어디 가서 노래 불렀다는 이야기도 잘 안 하지만.
어릴 때 동요를 부르면 대부분 '바이브레이션'을 넣지 않는다. 어떻게 보면 그 부분이 동요와 가요를 가르는 기준처럼 느껴지기도 했다. 멋스럽게 부르는 것. 우리가 봤을 땐 그랬다. 나이가 먹고 동요를 불러보라고 하면 다들 손을 내젓는다. 왠지 쑥스럽기도 하고 뭔가 어색하다고 느끼기 때문이다. 물론 아이가 생기면 어쩔 수 없이 메들리로 불러대야 하지만.
그도 그럴 게 동요는 바이브레이션이나 비브라토가 없는 탓에 음정이 흔들리지 않고 정확해야 한다. 어떤 면에서는 쓸데없는 기교가 없이 음정과 박자를 가장 정확하게 불러야 하는 노래라는 이야기다. 그래서 어렵다. 우리는 나이 먹고 긁히고 피로한 목소리로 노래를 부를 때 그걸 숨기려고 음을 흔든다. 물론 멋을 위해서이기도 하지만 그렇게 충분히 감출 수 있다. 그런데 동요는 정확하고 깨끗하게 부른다.
그래서 사실 동요는 '원류'에 더 가깝다. 음정과 박자를 더 정확하게 따지는 노래이기 때문이다.
그럼에도 동요가 음악의 완성체라고 생각하기는 어렵다. 오히려 나이가 들면 동요에서 벗어나는 것을 당연하게 여긴다. 우리는 왜 음정과 박자가 정확한 그 음악에서 벗어나는 것일까.
우리가 음악에 담으려고 하는 것은 감정이다. 괜히 사람들이 우주로 보내는 물건 중에 음악이 수록된 기록물을 보낸 것이 아니다. 음악은 충분히 무언가를 전달할 수 있기 때문이다. 그리고 그런 감정을 전달하기 위해서 정확한 음을 내는 것은 중요하다. 문제는 무엇이 정확한 음인지에 대해서 그 음악을 만든 사람조차도 확신할 수 없다는 것이다.
심지어 음악은 연주자의 기분과 해석에 따라서 다르게 변한다. 음정도, 박자도 미묘하게 변한다. 물론 그것 역시 AI에 패턴화 해서 넣을 수는 있겠지만 그러기 위해서는 그 모든 경우의 수를 계산하고 정리해야 한다. 그리고 그 정리와 계산은 인간의 주관이 들어갈 수밖에 없다. 그걸 과연 '정확하다'라는 표현을 쓸 수 있을까.
결국 어떤 감정을 전달하기 위해서 아주 정확한 음을 연주한다는 것은 완벽하다는 것을 의미하지 않는다.
'음악'은 AI에게 정복당하지 않는다.
만일 정복당한다면 그것은 그 음악을 향유하던 인간들이 AI에게 매몰당하는 것일 뿐이다. AI와 사람의 연주를 구분하지 못하는 자신들에게 의심이 싹트기 시작한다면 결국 언젠가 그 의심이 자라서 인간을 집어삼킬 것이다. 자신들의 감성을 믿지 못하고 AI에게 음의 정확성만 체크하게 된다면 언젠가는 그럴지도 모르겠다.