brunch

You can make anything
by writing

C.S.Lewis

by OOJOO May 16. 2023

챗GPT, 스마트 스피커를 부활시키다.

1세대 AI assistant 다음 자비스를 꿈꾸며

아마존 알렉사, 구글 어시스턴트, 애플 시리 그리고 SKT의 누구, KT의 기가지니와 네이버 클로바 등을 AI Assistant라고 부른다. 인공지능 비서 서비스는 2014년 알렉사를 시작으로 국내에서도 2016년 SKT의 누구가 소개되면서 본격적인 경쟁에 접어들었다. 2018년부터는 여러 종류의 스마트 스피커가 출시되어 스마트폰 앱 외에도 다양한 종류의 스피커를 통해 AI 비서를 이용할 수 있었다.


다양한 종류의 스마트 스피커


하지만, 이들 스마트 스피커가 천덕꾸러기로 천대 받는데 그리 오래 걸리지 않았다. 우선 AI 비서는 말을 너무 못 알아 듣는다. 부르지 않았음에도 호출한 것으로 오해가 되서 스스로 깨어나 방해하기 일쑤였다. 게다가 말을 겨우 알아 듣더라도 대답을 제대로 하지 못하는 경우가 다반사였다. 기껏 날씨나 시계 알람, 라디오, 음악 듣는 정도에만 사용할 수 있을 뿐 궁금한 것을 묻거나 정보를 찾는데는 도움이 되지 못했다.


고릴라 테크놀로지 슈퍼챗

그런 스마트 스피커와 1세대 AI assistant가 챗GPT 덕분에 부활의 날개를 펼 수 있는 기회를 얻고 있다. 2022년 8월 아마존은 알렉사를 개선할 수 있는 새로운 AI 언어 모델을 공개했다. Alexa Teacher Models(AlexaTM)이라 불리는 이 모델은 다양한 언어의 번역과 텍스트 요약 등에 탁월한 성능을 보여준다. 그 보다 훨씬 전인 2021년 구글이 발표한 LaMDA라는 오픈 도메인 챗봇은 다양한 주제에 대해 여러 페르소나로 대화를 할 수 있는 AI 모델이다. 실제 고릴라 테크놀로지라는 스타트업은 역사속 위인이나 세계적인 유명인들의 페르소나로 대화를 할 수 있는 슈퍼챗이라는 앱을 런칭했고, 유사한 AI 페르소나 서비스를 제공하는 회사로 Quora의 Poe, 캐릭터닷에이아이, D-ID 등의 스타트업들도 주목을 받고 있다. 또한, 시기니피컨트그래비타스라는 AI 스타트업이 런칭한 오토GPT(AutoGPT)는 GPT-4를 사용해 최종 목표를 AI에게 설정하면 AI가 스스로 이 목표 달성을 위한 계획을 수립해 작업을 수행하며 목표 달성을 향해 매진하는 서비스이다. 챗GPT는 인간의 명령과 질문에만 답을 할 뿐이지만, 오톻PT는 첫 목표, 지시를 내리면 그 이후부터는 AI가 스스로 자가발전하면서 그 목표 달성을 위해 다양한 세부 작업들을 스스로 수행해간다. 일례로, "팔로우 100만명의 인스타그램 계정을 만들어줘"라고 명령하면 열심히 오토GPT가 콘텐츠를 생산하고 마케팅을 해가며 이 목표 달성을 위한 다양한 세부 작업을 수행해가는 것이다. 만일 이런 모델들이 스마트 스피커에 적용한다면 기대 이상의 대화 서비스를 운영할 수 있을 것이다. 아마 1세대 AI 비서가 이제는 영화 아이언맨의 자비스라는 이상을 실현할 수 있게 될 것이다.


실제 2015년 설립된 음성 제어 홈 자동화 시스템 개발사인 Josh.ai는 챗GPT API를 활용해 자사의 스마트 스피커에 적용해 기존의 AI 비서보다 훨씬 자연스럽고 똑똑한 기능으로 대화를 할 수 있는 프로토타입을 선보였다. 챗GPT 덕분에 사용자가 잘못 명령을 내렸거나 앞뒤 문맥상 말이 안되는 질문을 해도 전후 사정을 고려해 교정을 해서 이해를 하고 답을 해준다. 또한, AI 비서에 연동되어 있는 주변의 사물들을 맥락에 맞게 작동시킬 수 있어 보다 통합된 서비스 경험을 제공해주기도 한다. 예를 들어, 사용자가 '오늘 하루 정말 피곤했네. 긴장을 풀 수 있는 방법이 무얼까?'라고 말하면 챗GPT가 연동된 Josh 스마트 스피커는 스트레스를 풀 수 있는 시나 명상을 읊어주거나 주변의 조명을 어둡게 하고, TV에서 릴렉스할 수 있는 영상을 유투브에서 찾아서 보여준다.


스탠포드대 학생들이 프로토타입으로 개발한 'RizzGPT'라는 안경은 GPT-4를 안경과 결합을 해서 다른 사람과 대화를 할 때 다양한 정보를 안경을 통해 텍스트로 보여주는 서비스를 제공한다. 스마트폰과 이 AR 안경이 연결되어 대화하는 음성이 텍스트로 변환되어 챗GPT로 전송된다. 이때 안경을 통해 내가 보고 있는 장면들, 예를 들어 앞에 대화하는 사람의 얼굴과 옷, 상태 그리고 주변의 사물들과 환경 등도 GPT-4로 전달되어 음성 뿐만 아니라 주변에 무슨 일이 일어나고 있는지에 대한 정보도 함께 전송된다. 이렇게 GPT-4로 전송된 정보를 해석해 적절한 정보를 다시 안경의 디스플레이를 통해 텍스트로 보여줌으로써 더 원활한 대화를 가능하게 해주는 것이다. 물론 앞으로 텍스트가 아닌 사진이나 영상 혹은 음성으로 사용자에게 여러 부가 정보를 제공하는 것도 가능해질 것이다. 일례로 강연을 하거나 중요한 보고서 발표를 하거나, 복잡한 전기 배선 공사를 할 때에 안경을 통해 시기적절하게 필요로 하는 정보가 정확하게 전달되어 사용자 가치를 높여줄 수 있을 것이다. 영화 속에서나 보던 자비스가 구현되는 것이다. 바로 ChatGPT와 같은 AGI(범용 인공지능) 서비스를 가능하게 해준 AI 기술(LLM, Large Language Model) 덕분이다.

스탠포드대 학생들이 프로토타입으로 만든 rizzGPT의 구성도


이처럼 챗GPT는 웹을 벗어나 스마트 스피커와 AR 안경 그리고 다양한 IoT(사물 인터넷)와 연동됨으로써 기존에 할 수 없었던 기능을 가능하게 해주고, 기존보다 더 나은 서비스 품질을 보장해줄 수 있게 될 것이다. 물론 그런 챗GPT가 우리를 도와주는 가상의 비서 역할을 넘어 로봇에 탑재되게 되면 물리적 실체를 가지게 될 수도 있다. 이는 가상이 아닌 우리가 사는 현실계에 챗GPT가 들어오게 되는 또 다른 차원의 문제라 우리 사회가 이 기술이 어떤 사회적 영향을 줄 것인지에 대한 깊은 고민과 자성을 하며 기술이 인류를 위협하지 않도록 대처해야 할 것이다.


 ➠ 저자의 전통기업에서의 챗GPT 활용과 BM혁신 기회와 IT 산업 전망에 대한 책

http://www.yes24.com/Product/Goods/118709955

작가의 챗GPT가 가져올 새로운 비즈니스 기회와 개인 이용팁과 기업의 활용 방안에 대한 강연
 ➠https://www.udemy.com/course/chatgpt-it-jihyunkim
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari