스마트폰 터치에서 음성 사용자 인터페이스(VUI)로의 변화
ChatGPT 열풍이 대단합니다. 개인적으로 한달 이상 ChatGPT를 써본 경험을 요약하자면, 강연의 목차를 잡거나 보고서의 구성을 짜달라고 하는 등의 일에는 매우 만족스러운 결과를 제시해 줬습니다. 특정한 주제의 문서를 작성할 때도 큰 도움이 되었구요. 하지만, 조금 구체적이거나 팩트 기반의 결과를 제시하라고 하면 잘못된 내용을 포함하는 것들이 많았습니다. 따라서, 중요한 일에 사용할 때는 신중해야 할 것 같습니다.
그럼에도 불구하고, 일상적인 분야에는 다양하게 활용할 수 있을 것 같습니다. 특히, 충분한 데이터를 학습한 영어 기반의 서비스에서는 놀라운 결과들이 많이 소개되고 있습니다. 가장 첫번째 것이 책 저술입니다. 저도 지금까지 8권의 책을 출간했고, 그 중에 공저로 쓴 3권을 제외하면 보통 책 한권 쓰는데 적게는 1년에서 많게는 2년 이상이 걸리기도 합니다. 그런데, 단 며칠이면 뚝딱 책 한권을 만들 수 있는 시대가 된 것입니다.
그도 그럴 것이 미국의 경우 아마존에서 제공하는 킨들 직접 출판(Kindle Direct Publishing) 같은 아주 훌륭한 전자책 출판 도구가 있기 때문입니다. ChatGPT를 이용해서 책의 구성을 짜고, 각 부분에 대한 이야기를 한단계 한단계 깊게 파고 들어가면 책의 내용이 구성됩니다. 그리고 교정과 약간의 수정 작업을 하면 되죠. 해당 원고를 킨들 직접 출판 툴에 입력하면 그것으로 끝입니다.
물론, 국내에도 교보문고 등에서 비슷한 툴을 제공합니다만, 근본적으로 ChatGPT의 한글 답변 수준이 떨어져서 쉽지 않다고 생각합니다. 따라서, 국내에서도 해보고 싶은 분들은 영어로 모든 작업을 하고, 번역 부분에서 deepl 같은 새로운 번역 솔루션을 이용하면 가능할 것입니다.
사진에 보이는 아마르 레쉬(Ammaar Reshi)는 ChatGPT와 Midjourney를 이용해서 Alice and Sparkle이라는 동화책을 만들어서 아마존에서 판매하고 있습니다. 책이 전부 20여 페이지 밖에 되지 않는데 가격은 비싸서 그렇게 많이 팔리지도 않은 거 같구요, 평점도 3점 수준으로 높지는 않습니다. 하지만, 인공지능 기술을 이용해서 책을 쓴 것으로 유명하죠.
레쉬뿐만이 아닙니다. 아마존에서 ChatGPT로 검색을 하면 1000여 개의 책이 검색되구요, 이 중에 저자에 ChatGPT가 들어가는 것을 추려도 300개에 이를 정도입니다. ChatGPT를 저자에 포함시키지 않는 책들까지 포함하면 이보다 훨씬 더 많겠죠.
글은 사람이 직접 쓰되 그림만 인공지능을 이용한 책들은 더 많습니다. 크리스트나 카슈타노바(Kristina Kashtanova)가 쓴 '새벽의 자리야(Zarya of the Dawn)'이라는 만화의 경우 만화책에 들어간 삽화를 미드저니를 이용해서 만들었는데요, 최근 미국 저작권청에서는 이런 경우 글은 저작권을 보호 받을 수 있지만, 몇몇 프롬프트를 이용해 만든 이미지는 저작권의 보호를 받을 수 없다는 판결을 내리기도 했습니다.
이 책처럼 인공지능을 이용해서 그림 대부분을 작성한 경우는 아직 많지 않습니다. 대신 인공지능을 이용해서 책 표지나 일부 삽화만 제작한 사례는 많습니다. 제가 최근에 출간한 책 <앰비언트 - 포스트 스마트폰 시대에 대비하라>만 하더라도 미드저니를 이용해서 책 표지를 만들었습니다. 프롬프트를 바꿔가며 앰비언트의 개념을 구체적으로 설명하다 보니 3단계에서 제가 원하는 형태의 이미지가 발견되었는데요, 그걸 표지로 사용한 것입니다.
참고로 제 책 이야기를 하면요, ChatGPT와 같은 생성형 인공지능 기술이 음성인식 기술과 결합한 사회 혹은 그 이후의 시대에 대한 책입니다. 말로써 자연스럽게 인터넷을 사용할 수 있게 되면 어떨까요? 당연히 스마트폰을 거의 사용하지 않게 될 것이며, 사용자 주변에 있는 다양한 스마트 기기들이 사용자가 필요로 하는 일들을 알아서 해주는 시대가 된다는 것입니다. 이런 시대에는 돈 버는 방법도 달라지는데요, 새로운 시장이 형성되고 마케팅 방식이 바뀌게 됩니다. 재밌을 것 같지 않나요? 바로 구매 들어가 주시기 바랍니다 ㅋㅋ
구매 링크: http://www.yes24.com/Product/Goods/116475354
다음으로 재미있는 사례는 생성형 인공지능 기술을 이용해서 인공지능 DJ 서비스를 하는 것입니다. 뮤직 스트리밍 서비스인 스포티파이(Spotify)가 대표적인데요, 자신이 지정한 Generative DJ를 통해 음악을 추천받아 듣고 음악에 대한 인사이트를 공유할 수 있도록 한 것입니다. 음성명령을 통해 생성형 DJ와 대화를 하기 때문에 탐색 및 검색 시간을 줄일 수 있구요, 음악 청취 경험을 향상시킬 수 있을 것으로 기대하고 있다는군요.
스포티파이는 이전에도 Spotify Car Thing이라고 해서 자동차에서 음성명령을 통해 음악을 들을 수 있는 장치를 만들기도 했었는데요, 이제 생성형 인공지능 기술과 음성 인식 및 음성 합성 기술을 바탕으로 매우 직관적이며 편리한 서비스 이용 환경을 제공해 줄 수 있게 된 것입니다. 이를 위해 스포티파이는 음성 합성 플랫폼 기업인 소난틱(Sonantic)을 22년 6월에 인수하기도 했습니다.
또 다른 예는 ChatGPT와 인공지능 스피커가 결합되는 경우입니다. 인공지능 스피커는 이미 많은 분들이 사용하고 계신데요, 대부분의 경우 그다지 만족스럽지 못한 경험을 이야기 합니다. 날씨 물어보거나 알람 설정, 음악 틀기, TV 켜기 등에만 제한적으로 이따금 사용하기 때문입니다. 그 이유 중의 하나는 사람의 말을 제대로 이해하고 그에 맞는 답을 못하기 때문일 것입니다.
이런 상황은 스마트홈 분야에서도 똑같습니다. 저도 스마트 스피커를 이용해서 집이나 사무실에 있는 스마트 기기들을 제어하곤 하는데요, 통상적으로 한 번에 하나의 기기밖에 제어하지 못 합니다. 물론, 시리야, 조명 꺼! 라고 함으로써 여러 대의 램프를 끌 수 있지만, 서로 다른 여러 장치들을 제어하도록 하는 것은 아직 불가능하거든요. 그런데, 대화형 인공지능과 결합되면 상황이 달라질 수 있습니다.
아래 영상은 Josh.ai라는 회사가 자신들의 음성 인식 및 합성 기술에 ChatGPT를 결합한 사례입니다. 영상의 앞 부분에서 보이는 것처럼, 쉐이드(블라인드) 고, 음악 멈추고, 불 끄고, 날씨 알려 달라는 연속적인 질문을 하면 이를 모두 알아 듣고 모두 수행합니다. 더 놀라운 것은 "지금 촬영을 하고 있는데 어두워"라는 질문을 하면 자기가 할 수 있는 것을 말해줍니다. 아직 문맥을 이해하지는 못하지만, 머지 않아 자기가 할 수 있는 것 중에서 조명을 켜주면 되겠다는 판단을 하고 해당 작업을 수행할 수 있을 것으로도 보입니다.
https://www.youtube.com/watch?v=FL_LP8u4E4g
스포티파이의 생성형 DJ 사례는 기존에 스마트폰 앱을 이용해서 인터넷 서비스를 이용하던 방식을 완전히 뒤바꿔 주기 때문에 서비스 사업자들이 주목을 해야 할 것으로 보입니다. 또한, 나 Josh.AI의 인공지능 스피커와의 결합 사례는 기존 스마트홈의 모습을 완전히 바꿀 것으로 기대됩니다.
이제는 직접 기술을 개발하는 것이 아니라, 이미 만들어져 있는 기술을 가져다 잘 활용하는 시대입니다. 누가 먼저 그런 기술을 이용해서 서비스에 대한 고객 경험을 개선하고 새로운 고객 가치를 제공하느냐가 앰비언트 시대 성공의 열쇠가 아닐까 합니다.