CES 2024에 소개된 On-Device AI 솔루션들을 소개합니다.
이번 CES의 최대 화두는 단연 인공지능(AI)입니다. ChatGPT와 같은 생성형 인공지능이 다양한 분야에 적용될 예정이고 누구나 쉽게 인공지능을 사용할 수 있게 하는 솔루션들이 소개될 것으로 보입니다. 그래서 저는 CES 2024의 주제는 단연코 AI Everywhere & AI for All이라고 이야기합니다.
작년까지 인공지능이 다소 기술적인 측면에서 논의되었다면, 이번에는 응용과 이를 위한 사용자 인터페이스 및 사용자 경험에 초점이 맞춰지리라 생각합니다. 또한, 이를 가능하게 하는 디바이스 및 이런 디바이스에 사용될 칩셋, 그리고 온디바이스 AI(On-Device AI)나 엣지 컴퓨팅(Edge Computing), 하이브리드 AI(Hybrid AI)처럼 인공지능 서비스를 제공하는 방법에 대해서도 다양한 솔루션이 소개될 것으로 기대됩니다.
이 중에서 본 글에서는 온디바이스 AI에 집중해 보고자 합니다. On-Device AI의 개념 및 관련 사례들을 모아소개하도록 하겠습니다. (시간 날 때마다 업데이트하겠습니다.)
온디바이스 AI는 말 그대로 디바이스 상에(on-device) 인공지능(AI)이 존재하는 것을 말합니다. 즉, 그동안 클라우드에 접속해서 이용할 수 있었던 인공지능 기능들이 개별 디바이스에서 제공되는거죠. 인공지능 서비스를 이용하기 위해 클라우드에 접속하지 않아도 되니 여러 가지 장점이 있는데요 다음과 같습니다.
1. 프라이버시 보호: 사용자 데이터를 클라우드로 보내지 않아도 되므로 프라이버시 특성이 개선됩니다.
2. 빠른 반응 속도: 데이터를 클라우드로 보내고 처리한 후 그 결과를 다시 디바이스로 보내지 않고 디바이스에서 직접 처리하므로 반응 속도가 빠릅니다.
3. 높은 안정성: 네트워크를 이용하지 않기 때문에 네트워크 장애에 상관없이 인공지능을 이용할 수 있습니다.
4. 전력 소모 감소: 데이터를 보내고 받는 것보다 로컬에서 처리하는 것이 전력 사용량 측면에서 더 유리하며 이는 배터리 수명을 늘리게 됩니다.
온디바이스 AI는 흔히 에지 컴퓨팅(Edge Computing) 혹은 에지 AI(Edge AI)와 같거나 비슷한 것으로도 소개되지만, 항상 그런 것은 아닙니다. 에지 컴퓨팅이나 에지 AI는 클라우드에서 제공되던 AI 서비스를 로컬 혹은 구내(premises)에 있는 서버(Edge Server)에서 제공하는 것입니다. 이 경우 사용자 디바이스(user device) 혹은 종단 장치(End device)는 에지 서버를 통해서 AI 서비스를 받게 됩니다. (물론, 그럼에도 불구하고 ARM은 on-device AI라는 용어 대신 Edge AI라는 용어를 사용합니다.)
반면, 온디바이스 AI는 사용자 디바이스(user device) 혹은 엔드 디바이스(end device) 자체에 인공지능 모듈이 탑재되어 AI 기능 혹은 서비스를 제공하게 됩니다. 대표적인 것이 스마트폰인데요, 어두운 곳이나 밤에 사진을 찍을 때 얼굴 부분을 밝게 처리한다거나 하는 것이 대표적입니다. 물론, 얼굴 인식이나 지문 인식을 통한 잠금 해제도 인공지능 기술입니다. CCTV 카메라가 사람이나 사물을 인식하는 것도 이에 해당되죠.
개별 장치에서 AI 기능을 제공한다는 측며에서 온디바이스 AI는 전혀 새로운 기술이나 개념이 아닙니다. 이미 오래 전부터 다양한 분야에 적용되어 사용되던 방법이죠. 이미 2000년대 초반부터 온디바이스 AI라는 용어가 사용되었으며, 2017년 이후부터는 다양한 분야에 보편적으로 사용되고 있습니다. 대표적인 것이 가전제품인데요, 로봇 청소기가 사물을 인식하며 양말이나 전선 등을 피해가며 청소를 하구요, 세탁기는 세탁물을 인식하고 그에 맞는 세탁 코스로 빨래를 하게 됩니다.
그런데 최근에 왜 갑자기 온디바이스 AI가 주목받는 걸까요? 그것은 바로 ChatGPT나 DALL-E와 같은 대규모 언어 모델(LLM) 기반의 생성형 인공지능이 대거 등장했기 때문입니다. 생성형 인공지능을 써보니까 너무 좋고 편한데, 학습이나 추론 등에 어마어마한 컴퓨팅 파워가 들어가서 클라우드에서만 서비스가 되고 있죠. 그런데, 이걸 컴퓨터나 스마트폰 같은 개별 장치에서 제공하면 좋겠다는 생각이 들면서 특정 분야에 최적화된 경량형 대규모 언어 모델(small LLM)에 대한 연구가 이루어지고 있는 상황이죠.
동시에 경량화된 AI 모델을 개별 디바이스에서 처리할 수 있도록 하는 인공지능 칩셋들도 함께 개발되면서 개별 디바이스 상에서 사람의 얼굴을 인식한다거나 사진을 선명하게 바꿔주는 것과 같은 기존의 narrow AI는 물론 경량화된 생성형 인공지능 서비스를 함께 제공하는 것이 가능하게 된 것입니다. 그래서, 개별 디바이스에서 인공지능 서비스를 제공하는 것에 대해 다시 주목을 하게 된 것입니다.
요약하면, 온디바이스 AI라는 용어는 과거에도 존재했지만, 주로 특정한 목적을 가진 머신 러닝 기반의 인공지능(narrow AI) 모듈이 내장된 것인 반면, 최근에 이야기되는 온디바이스 AI는 여기에 생성형 인공지능 서비스까지 함께 제공되는 것을 말한다고 이해하시면 되겠습니다.
앞에서 간단히 살펴본 것처럼 온디바이스 AI는 기존 클라우드에서 처리되던 인공지능 서비스에 비해 더 높은 보안, 더 적은 비용, 더 낮은 전력 소비를 제공하면서도 맞춤형 개인화가 가능합니다. 온디바이스 AI는 클라우드 기반 서버 팜이 아닌 디바이스 자체에서 많은 AI 서비스를 실행할 수 있게 해 줄 것입니다. 즉, 개인정보 보호와 성능 모두에 잠재적으로 유리한 접근법인 것입니다.
그러나, 이 중에서 사용자들은 개인정보 보호에 더 많은 관심이 있으리라 생각합니다. 스마트홈 카메라의 해킹에 대한 끔찍한 뉴스를 접한 경험이 있는 사용자라면 더욱 그러할 것입니다. 카메라가 자율적으로 동작하고 자체적으로 인공지능 처리를 할 수 있다면, 클라우드와 공유해야 하는 데이터 양이 훨씬 줄어들게 될 것입니다. 애플의 홈킷 카메라는 이미 이러한 기능을 제공하고 있죠.
하지만, 더 근본적으로는 온디바이스 AI로 인해 사람이 기계(컴퓨팅 장치)와 소통하는 방식이 바뀌게 됩니다. 컴퓨터를 사용하기 위해 마우스나 키보드를 이용하거나 스마트폰을 이용하기 위해 필요한 앱을 실행하고 수 차례 화면을 터치하는 대신 자신이 원하는 것을 말하기만 하면 되는 거죠. 그동안 컴퓨팅 파워를 이용하기 위해 사람이 컴퓨팅 장치의 이용 방식을 배워야 했던 반면에, 앞으로는 기계가 사람을 배우는 시대가 된다는 것입니다. 그리고 이걸 잘 하는 기업이 비즈니스의 판도를 바꿀 수도 있게 되는 거죠.
이번 CES 2024에서는 모두 8건의 기조연설예 예정되어 있습니다. 로레알이 가장 먼저 키노트 발표를 알렸고, 월마트, 나스닥, 지멘스, 엘레반스 헬스, 그리고 우리나라의 HD현대(현대중공업)도 발표를 합니다. 하지만, 이 중에서 가장 주목을 끄는 것은 누가 뭐래도 사용자들의 인공지능 사용 경험에 대해 발표할 퀄컴과 인텔일 것입니다.
먼저 퀄컴은 크리스티아노 아몬 CEO가 '생성형 AI 시대에 디바이스와 상호작용하는 방법'을 주제로 발표를 할 예정입니다. 즉, 생성형 AI를 포함한 인공지능 기술이 사용자와 디바이스가 상호작용하는 방법을 어떻게 바꿀 것이며, 이를 위해 퀄컴은 어떤 준비를 하고 있는지에 대해 발표할 예정입니다. 퀄컴은 이를 '온디바이스 AI' 측면에서 소개할 것으로 보이는데요, 이미 10월에 하와이에서 개최된 '스냅드래곤 서밋 2023'에서 그 힌트를 제공했습니다.
퀄컴은 이 행사에서 '스냅드래곤 X 엘리트'와 '스냅드래곤 8 3세대'를 소개하며 다양한 사용 씬에 대해서도 소개한 바 있습니다. 먼저, 스냅드래곤 X 엘리트는 AI 처리 기능을 갖츤 노트북용 프로세서구요 스냅드래곤 8 3세대는 온디바이스 AI 기능을 갖춘 모바일 AP입니다. 퀄컴은 이런 칩셋이 들어간 스마트폰과 노트북에서 인터넷 연결이 끊긴 상태에서도 생성형 인공지능 서비스를 이용하거나 개인 맞춤형 서비스를 제공하는 모습을 보여준 바 있습니다.
스마트폰 카메라로 사물을 촬영하면 그 사물에 대한 설명이나 관련 정보를 제공해줄 뿐만 아니라, 심지어는 스마트폰으로 사람의 피부 습도를 측정하거나 공기질을 측정한 후 그에 맞는 대처법을 제시해 주기도 합니다.
인텔에서도 팻 겔싱어 CEO가 '인공지능의 접근성을 높이는데 있어 반도체 칩과 소프트웨어의 중요한 역할'에 대해 키노트를 진행합니다. 이 강연에서 겔싱어 CEO는 인공지능 칩이 소비자와 기업, 그리고 세상에 어떤 변화를 가져올 지를 전망할 것으로 보입니다.
실제로 인텔은 지난 12월에 AI를 지원하는 PC용 CPU인 '메테오 레이크(Meteor Lake)'를 공식 출시하기도 했습니다. 빠르면 2024년 초에 다양한 PC 제조사들은 이 칩을 이용하여 노트북을 출시하게 될 것이며, 사용자들은 말로 노트북을 이용하게 될 것입니다. 물론, 산업 현장에서도 말로 필요한 일들을 지시하게 되겠죠.
그리고 2024년 1월 3일에는 글로벌 투자회사인 디지털브리지와 함께 '아티큘8 AI(Articul8 AI)'이라는 생성형 AI 자회사를 설립하기도 했습니다. 인텔 칩 기반으로 기업에 최적화된 AI 시스템을 개발하여 제공하는 것을 목표로 하는데요, 클라우드, 온프레미스, 그리고 하이브리드 방식 중에서 선택할 수 있도록 제공할 예정이라고 합니다. 온프레미스의 경우 에지 AI 수준에 해당할 것 같습니다.
AMD는 이미 2023년 12월 딥러닝을 촉진하는 노트북용 프로세서인 라이젠(Ryzen) 8040 시리즈를 공개했습니다. 이 칩셋은 7개월 전에 출시한 Ryzen 7040처럼 온디바이스 AI 기능을 제공합니다. LLAMA 2 및 ONNX 비전 모델과 같은 대형 언어 모델에서는 Ryzen 7040에 비해 약 1.4배 정도 더 빠르며 AI 가속화 신경 처리 장치(NPU)도 포함하고 있습니다. 인텔과 마찬가지로 노트북에서 자체적인 생성형 인공지능 서비스를 제공하는 것이 가능해 진다는 것을 의미합니다.
이와 더불어 CES 2024에서는 Versal(TM) AI Edge XA 적응형 SoC 및 Ryzen(TM) 임베디드 V2000A 시리즈 프로세서를 출시하며 온디바이스 AI 칩셋 포트폴리오를 확장할 예정입니다. 이 칩셋들은 인포테인먼트, 첨단 운전자 안전 및 자율주행을 포함한 주요 자동차 부문에 서비스를 제공하도록 설계된 것으로, 노트북을 넘어 자동차로까지 사업을 강화해 나가겠다는 의지를 보여주는 것으로 이해할 수 있습니다.
인텔이나 AMD의 움직임과 직접적으로 연관이 있는 것은 아니지만, 마이크로소프트의 경우 컴퓨터 키보드에 있는 윈도우 키 중 하나(오른쪽)를 Copilot Key로 사용하겠다는 발표를 하기도 했습니다. 우리나라의 경우 주로 한자 변환 키로 사용되는 키를 이용해서 빠르게 생성형 인공지능을 사용할 수 있게 하겠다는 것입니다.
대만의 미디어텍도 2023년 11월 AI 기능이 포함된 모바일 AP인 Dimensity 9300을 출시했습니다. 이미 중국의 스마트폰 제조사인 iQoo가 이 칩셋을 이용한 Neo 9 Pro 라는 스마트폰을 출시하기도 했죠. 이 칩셋은 트랜스퍼모델을 사용하는 APU 970을 사용하구요, Meta의 LLAMA 2, Baichuan, Baidu AI LLM 등 첨단 언어모델을 최대 330억 개의 파라미터까지 지원합니다.
삼성전자는 2023년 9월에 베를린에서 개최된 IFA 2023에서 향후 출시 예정인 모든 스마트폰 및 가전에 자체 생성형 인공지능인 '삼성 가우스(Samsung Gauss)'를 탑재하겠다고 발표했습니다. 그리고 이번 CES 2024에서는 '모두를 위한 AI: AI 시대의 연결(Al for All: Connectivity in the Age of AI)'을 주제로 인공지능 기반의 지속가능하고 스마트한 기술을 선보일 예정입니다.
또한, 2024년 1월 17일 진행 예정인 갤럭시 S24 언팩 행사를 통해 새롭게 출시되는 갤럭시 S24 시리즈 및 노트북에 자체 개발한 생성형 인공지능인 가우스를 탑재할 예정입니다.
LG전자는 '고객의 미래를 다시 정의하다'를 주제로 LG전자가 개발해 온 AI와 혁신 기술을 기반으로 하는 고객 경험을 소개할 예정입니다. 이미 LG전자가 출시하는 일부 가전제품에는 온디바이스 칩셋들이 포함되어 있으며, 2024년에 출시되는 제품들에는 알파11(a11)이라는 새로운 칩셋이 사용될 것으로 알려지고 있습니다. 하지만, 이런 칩셋은 개별 디바이스의 기능을 지능화 하는 수준이며 생성형 AI와는 거리가 있습니다.
대신 AI 로봇인 '스마트홈 AI 에이전트'를 공개할 예정이죠. 바퀴가 달린 두 개의 다리와 자율주행 기술로 집안 곳곳을 자유롭게 이동하며 카메라 및 다양한 홈 모니터링 센서를 통해 집안 곳곳의 실시간 데이터를 수집할 수 있는 홈 로봇입니다. LG전자는 이를 바탕으로 상황에 맞는 스마트홈 서비스를 제공하는 장면을 선보일 예정입니다.
구글은 2023년 10월 생성형 AI를 지원하는 모바일 AP인 '텐서 G3(Tensor G3)'를 발표했습니다. 그리고 이 칩셋을 사용한 '픽셀 8(Pixel 8)'과 '픽셀 8 프로(Pixel 8 Pro)'도 함께 선보였죠. 이와 더불어 'Google Assistant with Bard'를 소개하며 스마트폰에서 생성형 AI를 사용하는 씬을 소개하기도 했는데요, 지금처럼 화면을 터치하는 것이 아니라 말로써 필요한 일들을 하는 모습이었습니다.
예를 들어, '지난 주 놓친 이메일 중에서 중요한 메일 확인해줘!'라고 말을 하면, G-mail 앱을 실행 후 검색 기능을 통해 읽지 않은 메일 중에서 중요한 메일의 내용을 요약해서 알려주게 됩니다. 만약 그 메일의 내용을 바탕으로 추가 질문을 한다면, 구글 맵과 같은 앱을 추가로 실행시켜주게 됩니다. 말 그대로 말 만으로 스마트폰을 이용할 수 있게 되는 시대가 되는 거죠.
구글은 CES 2024에서도 LVCC Central Plaza에 부스를 마련하고 전시를 진행할 예정인데요, 해당 제품 및 이용 씬들을 경험해 볼 수 있을 것 같습니다.
애플은 이전 제품보다 더 빠른 AI 및 기계학습 워크플로를 특징으로 하는 MacBook 노트북용 M3, M3 Pro 및 M3 Max의 중앙처리장치(CPU)를 출시했습니다.