brunch

You can make anything
by writing

C.S.Lewis

by 박현아 Feb 06. 2021

클럽하우스의 성공을 보며

이럴 줄 알았다.

이럴 줄 알았다.

아니, 이 정도일 줄은 몰랐지만 사실 예상은 했었다.

오디오 SNS 클럽하우스의 성공에 대한 얘기다. 


나는 음성 기반 SNS를 기획하려는 생각을 두번이나 했었으나, 기회를 놓쳤다.

지난 일을 후회하는건 졸장부들이나 하는 짓이지만, 안타깝게 기회를 놓친 것을 반성하면서 다른 기회를 모색하려고 적어둔다.




첫번째 기회는 2018년이었다.

당시 나는 네이버의 인공지능 스피커인 클로바에 탑재할 스킬을 기획하는 해커톤에 참가하고 있었다. 운이 좋게도 너무 마음이 잘맞는 팀원들 3명을 만났고, 우리가 이 해커톤에서 만들고자 했던 것은 음성 기반 SNS였다. 지금도 생생하게 기억이 나는 것은, 같은 팀원이었던 기획자 분과 함께 지하철을 타면서 내가 호기롭게 외쳤던 말이다. "보이스 기반의 인스타그램을 만듭시다!" 

그렇다. 우리가 하고싶었던 것은 인스타그램을 오디오 기반으로 서비스하는, 특히나 당시 핫했던(핫할 것으로 예상되었던) 인공지능 스피커 기반의 오디오 SNS였다. 우리는 사용자가 인공지능 스피커에 직접 음성을 입력하고 태그를 지정하면 인공지능 스피커가 그것을 저장하고 있다가 다른 사용자가 태그 기반 혹은 인기 기반으로 그것을 들을 수 있는 서비스를 만들고자 했다. 이 서비스는 '브이라디오'로, 음성기반 스트리밍형 SNS라는 컨셉으로 hcik 학회에서 발표도 했었다. 

이 서비스는 2018년 10월에 네이버 클로바의 스킬 중 하나로 탑재되었다(현재도 있다). 그러나 이 서비스가 성공하지 못했던 것은, 생각보다 스마트 스피커의 시장이 커지지 않았던 데다, 기술적 한계로 인해 사용자가 인공지능 스피커에 직접 음성을 입력할 수 없었던 이유 때문이었다. 기술적 한계로 인해 어쩔수없이 페이스북 페이지에서 챗봇으로 사연을 받았는데, 이는 사용자에게 번거로운 과정일 수밖에 없었다. 

당시만 해도 인공지능 스피커의 거의 모든 스킬은 사용자의 질의에 대해 특정한 정보를 제공하는 식의 단순한 플로우를 가진 스킬 뿐이었기 때문에, 내가 생각하기에 우리가 만든 스킬은 혁신적이었다. 브이라디오는 태그 기반으로 사용자의 요청에 따라 적합한 스토리를 들려주고, 그것이 라디오처럼 끊임없이 스트리밍되는 방식이었다. 라디오의 시대를 거쳐온 나는 이 서비스가 사용자의 일상에서 배경음악처럼 사용될 수 있기를 바랬다. 그러나 기술적인 한계와 인공지능 스피커 시장이 커지지 않는 문제는 극복할 도리가 없었다. 




두번째 기회는 바로 얼마전인 2020년 11월이었다.

나는 비대면 시대와 에어팟의 플랫폼화로 인해 이제야 오디오 콘텐츠 시장이 성장할 기회가 오고 있다고 생각했고, 이 기회에 대한 설득이 운좋게도 받아들여졌기 때문에 정부지원 사업에 합격해 창업을 하게 되었다. 창업 아이템은 오디오 콘텐츠를 제작하는 과정의 불편함에 착안한 것이었다. 나는 인공지능 스피커와 사용자 간의 상호작용 연구를 오랫동안 해 오면서 말로 명령하는 것은 인간에게 가장 대중적이고 직관적인 형태이기 때문에 앞으로는 모든 것을 말로 명령하는 시대가 올 것이라는 확신을 갖고 있었다(2020년 10월에 발간한 내 책, <인공지능, 말을 걸다>에도 같은 주장이 담겨 있다). 

그런데 인간이 청각적인 상호작용을 하는 미래 사회로 나아가는 과정에서 아직도 들을 만한 것들은 너무 부족하다는 생각이 들었다. 물론 대표적인 '들을 것'인 음악은 인간에게 행복감과 정서적인 안정감을 주는 훌륭한 예술이다. 그러나 한 명의 인간이 수많은 컴퓨터와 1: N으로 상호작용하고, 이들과 말로 상호작용해야 하는 멀티태스킹 시대가 되면서, 청각적인 상호작용이 전달하는 콘텐츠는 음악 외적으로도 더욱 다양해져야 한다고 생각했다. 그런데 오디오북 한권을 만드는데 800만원씩 든다는 뉴스는 이게 과연 인간이 이처럼 시간과 비용을 들여 고생해야 하는 일인가 라는 의심을 하게 했다. 인공지능이 죽은 사람까지도 흉내내는 21세기에. 그래서 오디오 콘텐츠를 쉽게 저작하고 공유할 수 있는 서비스가 우선 필요하다고 생각했다. 현재 제작중인 서비스 '보블'이 그것이다. 

'보블'을 기획하면서 마음 한 켠에는 음성 기반의 자유로운 SNS에 대한 여전한 미련을 갖고 있었던 차에, 미국에서 클럽하우스가 엄청난 인기를 끌고 있다는 뉴스가 들려왔다. 맨 처음 알았던 것은 2020년 3월즈음이었던 것 같고, 그 이후 창업 구상을 하면서 10월경에도 그 소식을 들었다. 

그래서 '보블' 외에도 사이드 프로젝트로 음성 기반 SNS를 해보겠다는 생각을 다시금 하게 됐다. 클럽하우스의 벤치마킹 격이었지만 나름대로 기획을 했고, 외주 용역사도 물색했다. WebRTC 에 대해서도 찾아봤다. 그런데 내가 2020년 10월 경 클럽하우스 같은 음성 SNS를 얘기했을때만 해도, 모두가 부정적이었다. 이미 있는 기술이기 때문에 기술적 혁신이 없다거나, 기존의 Zoom과 뭐가 다른지 모르겠다거나..... 시간과 인력의 투자에도 불구하고, 여러 여건이 나를 도와주지 않았기 때문에, 결국 음성기반 SNS 프로젝트는 잠시 홀드하게 되었다. 그러던 차에 3-4달이 흘러 현재 클럽하우스는 한국까지 영역을 넓혔고, 엄청난 수의 사용자들이 지금도 몰려들고 있다. 부정적인 얘기를 했던 사람들도 지금은 아마 클럽하우스를 쓰고 있을 것이다. 




이 광경을 지켜보면서, 처음에는 "거봐요, 내 예측이 맞았죠?"라는 생각에 안타까움과 아쉬움이 들었고, 한편으로는 씁쓸하기도 했다. 사실 두번째 기회에서는 내 스스로 뭔가 혁신을 일으키기 보다는 해외의 트렌드에 업혀가려는 심보도 없지 않아 있었으니, 보다 혁신적인 아이템을 스스로 제안했어야 했다는 아쉬움도 든다. 어쨌거나 내가 주목하고 앞으로 잘 될 거라고 했던 오디오/음성 시장이 뜰 거 같다는 예상이 맞았다는 사실만은 고무적인 사실이다. 나는 계속해서 이 시장에 머무를 거니까. 




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari