알렉사는 생성형 AI로 11년 만에 레벨업 할 수 있을까 - by 혠작가
생성형 AI 기반의 아마존의 알렉사 차기버전 알렉사 플러스(알렉사+). 뉴스가 뜰 때마다 '출시 연기' 소식을 전하더니 드디어 차기버전 알렉사가 2월 26일 공개되었습니다. 알렉사 사업은 근래에 3조 단위의 손실을 일으키며(참고) 투자 축소와 감원을 수행하고, 생성형 AI 출시를 한다 만다 말이 많았지만 역시 빅테크로서 투자가 쏠리고 있는 현재의 AI 판에 빠질 수 없으니 일단 승부수를 던져보기로 한 듯합니다.
새로운 알렉사의 기능은 예상을 크게 벗어난 것은 없었습니다만, 기존의 알렉사 (내지는 스마트 스피커 에이전트들)과 달라진 기능 위주로 정리해 보면 아래와 같습니다. (아래 내용은 챗 GPT의 심층리서치(deep research) 결과를 보고 인용된 레퍼런스를 검토하여 작성했습니다. 이 과정에 대해서도 추후 블로그로 공유할 예정이니 기대해 주세요! 수거되지 않은 밑밥이 늘고 있어요..)
찰떡같이 알아들어요
기본적으로 알렉사 플러스에서는 현재의 LLM이 가지고 있는 불완전한 지시를 잘 알아듣고 수행하는 능력이 갖춰져 있습니다. 기존의 Rule-based 스피커를 사용하신 분들은 음성비서의 어딘가 산뜻한 '잘 못 알아듣겠어요~' 대답을 몇 번 듣고는 스피커에 대한 기대감이 급격이 낮아진 경험들이 있으실 겁니다. 그리고 스피커는 날씨체크 & 타이머로 축소된 채 각인되죠.
알렉사 플러스는 이러한 부분에 있어서 사용자가 불완전한 말을 하더라도 알아차리고, 모호한 지시어들을 맥락 속에서 이해합니다. 사용자가 적합한 (알아들을 법한) 명령어를 기억하고 생각해 내기 위해 애쓰지 않아도 된다는 말이죠. 멀티모달 지원으로 텍스트가 아닌 이미지, 동영상, 음악을 이해하기에 이해할 수 있는 영역이 더 넓어졌습니다.
당신을 기억하는 개인화
아마존은 전부터 사용자가 온라인 서비스를 쓰며 했던 활동들, 무엇을 사고 어떤 비디오롤 보고 어떤 공연의 티켓을 구매하였으며 에코 캘린더에는 어떤 일정을 등록했는지를 지켜봐 왔습니다. 이에 더해서 이제는 사용자와 인터랙션을 통해 알게 된 사실들까지 기억하겠다고 합니다.
물론 사용자는 자신의 편의를 위해서, 스스로 '난 채식주의자인데 단백질이 좀 부족하다는 사실을 기억해 줄래?' 같은 요청을 할 수도 있습니다. 단, 아마존에서는 이렇게 명시적인 경우뿐만 아니라 묵시적인(implicit) 선호도 기억하겠다고 밝혔는데 사생활 침해 이슈가 우려되는 부분이기도 합니다. 묵시적이라는 것은 다른 말로는 사용자가 자신의 선호가 수집되는 것을 인지할 수 없다는 뜻이며, 의지와 무관하다는 말도 될 수 있으니까요.
할 수 있는 일이 늘었어요.
알렉사는 위에도 언급한 것처럼 LLM의 장점, 아무 얘기나 잘 알아듣고 그럴싸하게 대화할 수 있어 집에 앉아있는 친구처럼 쓸 수 있습니다. 할루시네이션을 줄이기 위해 저명한 뉴스 등 믿을 만한 정보 소스를 활용한다고 하는데, 뉴스미디어들 자체가 GenAI 활용으로 사실 왜곡 문제가 되는 상황에서 오류를 재생산할 가능성도 우려됩니다 (뮹작가님의 숨 쉬듯거짓말하는 LLM에 대한 글을 읽어보세요, 링크). 더불어 복합적인 명령 수행도 가능해서, 한 번에 여러 가지를 지시하더라도 수행할 수 있습니다.
가장 뚜렷한 차별화 요소는 "Expert"라고 불리는 일련의 시스템, 기능, API로 구성되어 end to end로 수행 가능하도록 하는 컨셉이 아닐까 싶습니다. '가족이 공항에 왔는데 택시 불러주고 식당 예약해 줘'라고 말하면 LLM으로 지시를 이해하고 Uber, Open table을 연동하여 실제 예약까지 완료하는 거죠.
알렉사 생태계 내에서 이미 연동은 되어 있었지만 발견되지 못한 에코의 기능들을 를 알렉사가 상황에 따라 알아서 활용하면서 활용도가 높아지게 되고 이에 따라 에코에 편입되고자 하는 기업이 늘어나면서 에코가 더 확장되는 선순환이 기대되는 부분입니다.
더불어 ChatGPT, 구글 등이 이미 Agent로 진화하기 위해 도입하고 있는 기능들을 알렉사에서도 제공한다고 합니다. 즉 웹에서 탐색하고 사용자를 대신해서 작업을 수행하는 일을 하는 거죠. 이쯤 되면 남들 하는 것은 거의 다 준비한 듯 한데, 어쩐지 저는 후발주자의 불안 같은 것도 느껴집니다.
아마존이 가진 자산과 갖지 못한 것들
아마존에는 6억 대나 되는 (하지만 거의 주방타이머 신세라고 알려진) 에코 기기들과 거기에 묶여있는 가족들이라는 유저베이스가 있으며, 그들의 수많은 전자상거래 데이터와 함께 명령만 하면 물건을 대령할 수 있는 강력한 유통망이 있습니다. 그리고 이해관계가 얽혀있는 기업들, AWS까지 고려하면 파트너십의 잠재력 또한 엄청납니다.
그렇지만 에코가 퍼스널 모바일 기기가 아니기에 한계도 있습니다. 공용 디바이스로서 받을 수 있는 데이터의 양과 종류가 더 제한되어 있을 것이며, 일단 사용자가 집이라는 공간을 벗어나면 힘을 꽤나 잃어버릴 것입니다. 알렉사닷컴 등을 제공하지만 웹과 앱의 공급이 이미 포화된 현재로서는 힘든 싸움일 겁니다. 만약 애플 인텔리전스가 잘 나온다면 알렉사 플러스에서 보여준 많은 씬들은 빼앗길지도 모릅니다. 앞으로 어떤 전개가 나올지 흥미진진합니다.
알렉사 플러스는 유료 서비스 플랜으로, 아마존 프라임 회원들에게는 무료로, 그 외의 회원들에게는 월 $19.99를 받고 (Chat GPT나 Perplexity 모두 일반 유료사용자 가격은 이 수준에 수렴하고 있군요) 사용할 수 있는 형태로 출시 예정이라고 합니다. 온디바이스 AI를 위해서 새로운 에코 기기의 출시의 가능성도 없지는 않았을 텐데, 좀 더 몸을 사리는 듯 보이기도 합니다.
아마도 포인트는 Talk to Action 관련, Expert 같은 수행기능이 얼마나 매끄럽게 문제없이 동작하는지, 이를 통해 사용자가 큰 효용을 느끼고 생태계가 확장되면서 플랫폼 플레이로 전개될 수 있는지 여부가 아닐까 생각합니다. 아마존은 과연 앤스로픽에 투자한 11조 원의 가치 중 일부를 회수할 수 있을까요? 알렉사 플러스는 음성비서의 넥스트 레벨을 보여줄 수 있을까요? 출시를 기다려봅니다.