Big Tech vs. Hollywood
#1 GPT-4o가 Her를 노골적으로 모방하고 있군요
이전 글에서 LLM이 Agent로 진화하는 모습을 상상하면서 감성적인 대화가 가능한 따뜻한 'Her'의 사만다를 얘기한 적이 있습니다. 그리고 OpenAI는 음성값 자체를 입출력으로 하는 GPT 4 omni(이후, GPT 4o) 서비스를 출시했습니다. 기존 모델이 TTS-STT 레이어로 음성을 텍스트로 변환해 처리했다면 GPT 4o는 음성 데이터 자체를 인아웃으로 구성했다고 발표했습니다. 그리고 비서 중 하나의 목소리가 'Her'의 사만다와 아주 비슷한 느낌으로 다가옵니다. 중간 중간의 Pause, 스모키한 톤, 끝음 처리 등이 꽤 스칼렛 요한슨과 거의 동일하다는 생각이 들더군요.
그런데 기술에 대해 궁금해집니다. 음성 자체로 의미단위를 파악한다는 걸까요? 그렇게 음성데이터가 충분한가, 음성 데이터를 어떻게 샘플링해서 바로 이해한다는 건지 음성 압축 전공자가 아니라서 잘 파악이 안됩니다. 잠깐 대학원에서 음성압축 수업을 들었었지만 그걸로는 잘 설명이 안되네요. 제 부족한 지식으로는 음성 데이터를 샘플링해서 부호화하면서 음량이나 발화 패턴, 음성특징 등으로 감정, 습관 패턴을 학습하고 이를 텍스트 정보와 결합하는 방식 정도 밖에 상상이 안되네요.
이 부분을 명쾌하게 설명한 내용을 못찾았는데 혹시 설명가능하시거나 관련 정보를 아시면 댓글 주시면 감사하겠습니다.
#2 스칼렛 요한슨의 목소리를 함부로 훔치다니요
그런데 최근에 GPT 4o의 목소리로 한바탕 소동이 벌어졌습니다. 스칼렛 요한슨이 GPT 4o의 목소리 중 Sky라는 캐릭터의 목소리가 자신과 유사하다고 공개적으로 항의를 했기 때문입니다.
배경을 살펴보니 OpenAI는 작년 9월에 목소리를 빌려줄 수 있는지 스칼렛 요한슨에게 물어본 적이 있었는데 스칼렛 요한슨이 이를 거절했었다고 합니다. 그리고 GPT 4o를 공개하기 직전에 알트만이 직접 한번 더 제안을 했었으나 역시 거절했다고 합니다.
스칼렛 요한슨은 변호사를 고용해서 목소리 만드는 과정을 자세히 설명해 달라고 요청했고, 결국은 OpenAI가 Sky 비서 목소리는 중단하는 걸로 사건이 일단락되었습니다. AI 침공으로부터 목소리를 지켜냈군요, 아직은 OpenAI는 헐리우드와 대척점을 세울만한 권력이 없으니까요. 사실 이 사건은 앞으로 벌어질 AI의 창작물 침공으로 벌어지는 법정공쟁의 시작일 뿐이라는 평이 나오고 있습니다.
#3 헐리우드는 힘이 셉니다
미국의 빅테크는 모바일 플랫폼, SNS 플랫폼, 클라우드 등을 통해 강력한 기술권력을 보유하고 있지만 미국은 역사적으로 콘텐츠 권력이 강한 나라입니다. 헐리우드 영화는 2차 세계 대전 이후 '어메리칸 드림'으로 불리는 낙관적인 미래, 권선징악을 설득해내며 세계로 퍼져나갔고 때로는 폭력, 범죄, 무정부주의 등의 반체제적인 사고를 영화에 반영하며 반문화적 요소까지 흡수하는 블랙홀과 같은 존재가 되었습니다. 단순한 영화사업이 아니라 누구보다도 빠르게 젊은 사람들의 사고와 미래의 정치적 균형점을 반영하며 미래의 가치를 흡수하는 미국의 힘이 헐리우드에 있습니다.
그런 점에서 이번 사건은 빅테크와 헐리우드의 싸움에서 헐리우드가 승리를 거둔 사건처럼 보이기도 합니다. 헐리우드는 어느 산업보다도 진보된 기술을 빠르게 받아들이는 곳이기는 하지만 함부로 침범해서 파이를 가져갈 수 있는 곳은 아니라는 선언같기도 하구요.
2023년에 있었던 미국작가조합 파업이 생각납니다. 고용 안정성을 위한 조건들과 함께 주목받은 요구사항은 AI를 통해 이루어지는 인력 감축을 철회하는 것이었습니다. 결과적으로는 AI를 공동 작업자로 간주해서 원고료의 일부만 지급하는 행위, 작가의 동의없이 AI에게 원고를 맡기는 행위, 작가에게 AI를 이용할 것을 강요하는 행위가 금지되었습니다. 미국의 작가들도 AI 침공으로부터 일을 지켜냈습니다, 아직은 사람이 더 귀하니까요.
#4 예술은 힘을 가지고 있습니다
헐리우드가 가지고 있는 컨텐츠의 힘은 단순히 영화, IP 상품에 국한되는 것이 아닙니다. 역사가 없는 미국이 세계의 문화를 지배하는 힘이자 미래를 대비하는 무형적 전략이기도 합니다. 빅테크들은 콘텐츠의 힘, 무형적 가치의 힘을 어떤식으로 자신의 AI에 끌고와 조금더 인간의 삶에 가깝게 만들까에 대한 고민이 깊을 것입니다. AI 성능이 수렴하고 경쟁의 축이 기술에서 서비스로 넘어가는 시점에 사용자들의 마음을 훔칠만한 서비스를 만들기 위해 빅테크들이 어떤 컨셉을, 어떤 이야기를, 어떤 친밀감을 헐리우드로부터 차용해올지 궁금해집니다. 그리고 이 차용에 성공하는 순간 AI의 권력은헐리우드와의 협상력을 뒤집는 순간을 꿈꿀겁니다.
물론 헐리우드 자본가들이 AI를 자신의 대척점으로 보고 있지는 않은거 같습니다만, AI가 빠르게 산업을 바꿔나가는 미래가 조금은 두려운 저는 헐리우드의 창작자들이 기술과 예술의 경계선을 그을 수 있는 권력을 유지하기를 바랍니다. AI는 타고나길 단일화된 모델로 수렴해가기 쉬운 구조를, 예술은 타고나길 다양하게 분화되는 구조를 품고 있습니다. 기술과 예술의 균형점이 우리가 인간의 가치를 존중하면서 AI를 활용할 수 있는 출발점이 아닌가 싶기도 하네요.