brunch

You can make anything
by writing

C.S.Lewis

by 김학용 Jun 25. 2024

생성형 AI, 언제쯤 AI 스피커와 통합될까?

수익모델이 확보되어야만 통합이 가능할 것!

2023년 6월, 미국의 조시(Josh.ai)는 AI 스피커에 음성명령을 하는 식으로 자신들의 JoshGPT를 사용하는 모습을 보여줬습니다. JoshGPT는 ChatGPT 기반으로 개발된 Josh.ai의 음성 기반 생성형 AI 서비스로, 자연어를 인식하고 그에 맞는 답변을 하거나 스마트홈 기기를 제어하는 스마트홈에 특화된 것입니다. 


스마트홈 매니악인 저에게 JoshGPT은 매우 인상적이었는데요, 한번에 여러 개의 음성명령을 일괄해서 내릴 수 있었기 때문입니다. 예를 들면, "Hey Josh, 블라인드 올리고 테이블 램프 끄고 음악 틀고 오늘의 날씨 알려줘!"처럼, 한꺼번에 4개의 명령을 동시에 내리는 것이 가능했던 것입니다. 


JoshGPT를 이용해 블라인드 등 여러 명령을 동시에 수행하는 장면


물론, 한 번에 여러 개의 음성명령으로 동시에 수행하도록 하는 것이 새로운 것은 아닙니다. 하지만, 제가 아는 바로는 아마존과 구글이 동시에 두 가지 음성 명령을 한번에 수행할 수 있습니다. 실제로 이용해 보기도 했구요. 하지만, 다른 AI 스피커에서는 불가능한 걸로 알고 있습니다. 


예를 들면 이런 식으로 동작합니다. "알렉사, A 켜고 B 꺼!" "오케이 구글, A와 B 모두 켜!" 제 경험으로는 구글은 전자 및 후자를 모두 지원하지만, 아마존의 경우 전자만 지원하는 것 같습니다. 아마존의 경우 "알렉사, A와 B 꺼"라고 명령하면 어느 하나만 꺼주더군요. 


어쨌든, 한 번의 음성 명령으로 여러 기기를 제어하거나 여러 서비스를 이용할 수 있다는 것은 매우 인상적이었죠. 그리고, 맥락을 이해한 후 기기를 제어하는 것도 가능했습니다. 예를 들면, "책을 읽는데 조금 어두워!"라고 말하면 테이블 조명을 켜주는 식입니다. 사람들의 "말끼"를 알아듣기 시작한 거죠. 


그래서 저는 아마존이나 구글, 애플과 같은 AI 스피커 공급사들이 하루 빨리 기존 AI 스피커에 생성형 AI를 적용해 주기를 바랬죠. 그리고 아마존과 구글이 이에 응답했습니다. 2023년 9월, 아마존은 연례 하드웨어 행사에서 LLM이 적용된 Alexa를 소개하며, 2024년부터 출시할 예정이라고 했고, 구글도 음성 명령을 통해 스마트폰의 모든 서비스를 이용하는 모습을 보여주기도 했습니다. 


하지만, 그로부터 9개월이 지난 지금(2024년 6월 말)까지 공식적인 출시 소식이 들리지 않고 있습니다. 


생성형 AI 확산의 걸림돌, AI 이용 비용


왜 9개월이 지나도록 AI 스피커에 생성형 AI가 적용되지 않는 걸까요? 여러 이유가 있겠지만, 다음 두 가지로 압축될 수 있을 것 같습니다. 

   1. 사용자 의도를 정확하게 파악하지 못함

   2. 생성형 AI 이용 요금이 과다함


첫번째로 의심해 볼 수 있는 것은 생성형 인공지능의 성능입니다. 즉, 사람의 말을 제대로 이해하고 그에 정확히 맞아 떨어지는 답변이나 스마트홈 기기 제어를 하지 못한다는 것입니다. 그런데 말입니다, 최근 출시되는 GPT-4o나 Claude-3.5 같은 것을 보면, 개떡같이 말해도 찰떡같이 알아 듣는 것을 볼 수 있죠. 아마존이나 구글, 애플 등의 인공지능 개발 수준이 아무리 떨어지더라도 그렇게 형편 없지는 않은 것이라는 생각이 듭니다. 


그렇다면, 두번째 이유가 설득력이 있을 것 같습니다. 생성형 AI는 사용할 때마다 비용이 발생한다는 이야기를 많이 들었기 때문입니다. 생성형 AI가 어떤 방식으로 동작하느냐에 따라 그 비용은 달라지겠지만요, 한번의 질문과 답변에 대해 최소 10원의 비용이 발생한다 하더라도 이는 무시할 수 없는 비용이 될 것입니다. 


저의 경우 하루 20번 이상 알렉사를 호출하는 거 같은데요, 한 번에 10원씩만 비용이 발생해도 하루 200원, 한달에 6천원입니다. 전세계에 에코 스피커가 5억대 있다고 하니 단순 계산을 하면 월 3조원의 비용이 발생하는 것입니다. 실제로 현재의 AI 스피커를 이용할 때도 음성인식 서버를 유지하는 비용이 발생하기는 하는데요, 아마 이보다 훨씬 큰 금액이지 않을까 싶습니다. 


물론, 저의 경우 여러 대의 에코 스피커를 이용하고 있고, 사람마다 알렉사를 이용하는 횟수가 다를 거라서 이보다 훨씬 적은 비용이 들겠지만, 아직까지 알렉사로 제대로 된 수익을 창출하지 못하는 상황에서 얼마든 간에 무시 못할 비용이 든다는 것은 쉽게 수용할 수 없으리라 생각합니다. 



유료 버전 알렉사가 등장할까?


지난 6월 22일 로이터의 보도에 따르면, 아마존은 내부적으로 유료 버전의 알렉사를 준비 중인 것으로 알려졌습니다. 지금처럼 기존의 알렉사만 사용하는 경우는 무료로 이용하지만, 간단한 이메일을 작성해서 보내고 배달음식을 주문하는 것처럼 보다 강력한 AI 기능을 필요로 하는 사람들에게는 월 5달러 혹은 10달러를 받는 것을 검토하고 있다는 것입니다. 


앞에서 제가 6천원을 이야기 했는데요, 현재 환율로 약 4.3달러 정도 되니까 얼추 비슷하게 나오는 것 같습니다. 그리고, 통상적인 생성형 AI 서비스 이용 요금이 20달러인 점을 감안하면 그나마 현실성이 있는 가격일 수도 있을 것 같습니다. 


물론, 그렇다고 해서 유료로 LLM 기반의 알렉사를 사용하려는 사람이 얼마나 있을지는 모르겠습니다. 이메일 간단히 작성하고 배달음식 주문하는 것과 같은 서비스를 더 쉽게 이용하기 위해 5달러 혹은 10달러를 기꺼이 내는 사람들도 있겠지만, 있더라도 아주 많지는 않을 것 같습니다. 


그렇다면, 프라임 멤버십과 연동시키는 것도 하나의 방법일 수 있을 것 같습니다. 현재 프라임 멤버십은 연 139달러인데요, 이 가격을 2~30달러 정도 더 올리고 프라임 회원들만 생성형 AI 서비스를 무료로 이용하게 하는 것입니다. 하지만, 프라임 멤버십을 고려하고 있지는 않다고 합니다. 


또 하나 생각해 볼 수 있는 것은 "수익이 있는 곳에 비용이 있다"는 원칙을 적용하는 것입니다. 예를 들면, LLM 기반 알렉사를 이용해서 배달음식을 주문하는 경우 (예를 들어) 주문 금액의 2%를 수수료로 받는 것입니다. 만약 주문 금액이 40달러라면 배달음식 플랫폼으로부터 80센트의 수수료를 받아내는 거죠. 조금 과도한 금액일 수도 있지만, 수익이 발쟁하지 않는 서비스들까지 커버를 해야 하기 때문에 적정 수준을 찾아야 할 것 같습니다. 


요컨데, 생성형 AI 서비스가 AI 스피커에 본격적으로 적용되기 위해서는 생성형 AI 서비스 이용 비용을 상쇄시킬 수익모델 개발이 선행되어야 할 것 같습니다. 


또 다른 가능성, 온디바이스 AI 스피커


AI 스피커에 생성형 AI를 도입하기 위한 또 다른 방법은 생성형 AI를 클라우드가 아닌 AI 스피커 자체에서 수행하도록 하는 것입니다. 물론, 이러기 위해서는 AI 스피커가 생성형 AI를 수행시키기 위한 컴퓨팅 파워를 확보하고 있어야 할 테구요, 이를 보다 효과적으로 하기 위해 경량형 언어모델(SLM)을 개발해야 할 것입니다. 


아마존은 Echo Show 15이나 Echo Hub 등에 이미 AZ2와 같은 NPU를 탑재시키고 있어서 경량형 모델만 개발된다면 불가능한 일도 아니리라 생각합니다. 물론, 그렇다고 해서 ChatGPT 같은 수준의 생성형 AI 서비스를 제공하는 것은 불가능하겠지만, 적어도 스마트홈 환경에 특화된 서비스를 제공하는데는 무리가 없으리라 봅니다.


만약, 경량형 모델로 해결되지 않는다면, 그 때는 클라우드에서 AlexaLLM이나 고성능 AI를 이용해서 대응을 하는 거죠. 마치 삼성전자나 애플 등 스마트폰 회사들이 온디바이스로 경량형 AI를 돌리고, 이렇게 해결할 수 없는 것들은 클라우드에서 처리하는 하이브리드 방식을 쓰는 것처럼 말이죠. 


만약, 이런 어프로치를 취한다면 NPU 칩셋이 탑재된 AI 스피커를 빠르게 보급하는 것이 주된 이슈가 될 것입니다. 아마존이나 애플 등이 최근에 출시하는 신제품들에 최신 NPU를 탑재하는 것도 어쩌렴 이런 미래를 대비하기 위함이 아닐까 하는 생각이 듭니다. 


============

PS: 저희도 이와 비슷한 사업을 진행 중인데요, 고민이 되는 부분이라서 정리해 보았네요. 참고로 저희는 최초 솔루션 구매시 생성형 AI 이용 요금을 솔루션 도입 비용에 포함시키고 있습니다. 하지만, 이 방법은 도입 부담을 키워서 바람직하지 않아 보입니다. 

작가의 이전글 GPT-4o, omni와 multi의 차이
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari