AI 인프라 산업 트렌드가 보인다고요!
안녕하세요, 에디터 SA입니다. 최근에는 AI 인프라 산업에서 다양한 변화를 불러올 소식들이 가득했는데요. 그중에 가장 눈에 띄는 것은 엔비디아의 스타트업 인수 소식이었습니다. 엔비디아는 AI 인프라의 핵심이라 할 수 있는 GPU를 매년 새롭게 내놓고 있는 입장에서, GPU의 성능은 물론 효율까지 챙기려는 고민을 지속해 왔는데요. 최근에는 GPU 활용 효율을 높이는 솔루션, 서비스를 제공하고 있는 Run:AI를 인수했습니다.
엔비디아의 이러한 움직임은 AI 인프라에 있어 GPU의 효율이 얼마나 중요한 열쇠가 되는지를 시사합니다. TEN이 AI 인프라 문제에 집중하는 것도 같은 맥락인데요. AI 인프라는 사실상 구축이 곧 ‘시작’이라 볼 수 있습니다. 그 이후 어떻게 운용하느냐가 AI 사업화를 이끄는 과정에서, 특히 ‘비용’의 측면에 아주 큰 비중을 차지하는 중요한 문제가 됩니다.
TEN은 국내외 AI 기업들은 AI 인프라 구축을 위해 엔비디아 외에도 다양한 GPU를 구매하기 때문에, GPU의 효율을 제조사에 상관없이 챙길 수 있는 MLOps 솔루션인 AI Pub으로, AI 기업들의 AI 인프라 효율 개선을 돕고 있습니다.
엔비디아는 TEN처럼 AI 인프라 문제에 집중하고 있는 세계 각지 스타트업의 움직임에 주목하고, 순차적으로 인수하고 있습니다. 대체 어떤 관점과 맥락에서 스타트업을 인수하고, 그들의 기술력과 엔비디아의 자원을 융합하는 결정을 한 것일까요? 이번[AI, 뉴스룸]에서는 인수 스타트업들로부터 엿볼 수 있는, AI 인프라 산업에 대한 엔비디아의 관점을 읽어 보려 합니다.
가장 최근 엔비디아가 인수한 기업 run:ai(런에이아이)에 대한 소개부터 해야겠습니다. run:ai는 이스라엘 기업으로 텔아비브(Tel Aviv) 대학의 연구원들이 세운 스타트업입니다. AI 하드웨어 인프라를 쉽게 관리하는 소프트웨어를 개발했습니다. run:ai의 소프트웨어에는 AI 워크로드 전반에 걸쳐 '병렬'로 실행되도록 분할하는 개념이 적용되어 있습니다. 즉, 러 AI 워크로드를 순차적으로 실행하지 않고 병렬로 실행할 수 있는 거예요. 엔비디아 DGX 서버 및 워크스테이션과 DGX 클라우드에서 run:ai의 소프트웨어를 이용해 볼 수 있습니다. :)
run:ai는 GPU 클러스터 리소스를 여러 AI 워크로드에 공유하기 위해 AI 가상화 인프라를 구축하고 있습니다. 가상화 개념과 GPU 기반의 AI 워크로드를 결합한 회사라고 보시면 됩니다.
AI Pub은 TEN이 보유한 원천 기술이 적용되어 있기도 하고, web 형태로 솔루션을 제공하고 있는데요. 익숙한 GUI를 차용해 사용성을 높였다는 점, 그리고 AI 기업들이 구매를 고려하는 다양한 GPU들을 커버할 수 있다는 점에서 run:ai의 소프트웨어와 차이가 있다고 하겠습니다. run:ai의 경우, 엔비디아의 협업이 2020년부터 계속되면서 사실상 엔비디아의 제품에 특화된 GPU 오케스트레이션, 리소스 관리 기능을 제공하고 있습니다. 사실상, run:ai의 인수는 예견된 수순이었던 것 같기도 하네요.
아직 자세히 밝혀지지 않았지만, 엔비디아가 인수를 결정한 또 다른 스타트업이 있습니다. 바로 Deci AI(데시 에이아이) 입니다. AI 칩에서 AI 모델이 더 저렴하게 실행될 수 있는 방향을 ‘모델’에 초점을 맞춰 강구한 이스라엘의 스타트업입니다. AI 모델을 압축하고, CUDA로 개발된 AI 앱을 강화하는 방식으로 크기는 물론 성능까지 부스트하는 기능을 제공하고 있습니다. 실제로 Adobe 등의 글로벌 기업이 Deci AI에서 제공하는 기능을 이용 중인 것으로 알려져 있는데요. @.@
이후에 설명해 드릴 OmniML(옴니엠엘)과 유사한 기능인 것으로 보이지만, Deci AI는 AI에 최적화되지 않은 기기 환경에서 AI 서비스를 운영하더라도, 최적화에 도움을 주 기업을 대상으로, 최적화에 도움을 주는 플랫폼을 제공하고 있습니다. 그 때문에 엔비디아에 인수되기 전에도 자율주행, 제조, 통신 등 다양한 업계에서 Deci AI의 플랫폼을 이용하고 있었는데요. 엔비디아와 인수 계약이 확정됨에 따라, 더 다양한 업종에서 Deci Ai의 최적화 기능을 이용할 수 있을 것으로 보입니다.
이전에 Intel과의 MOU를 통해서, 인텔 프로세서 내 레스넷-50(ResNet-50) 신경망 추론 속도를 높이는 성과를 보이기도 했어서, 엔비디아의 ‘인수’까지 이루어질 거라는 예측을 하지 못하고 있었는데요. 기술력 있는 스타트업을 놓치지 않으려는 엔비디아의 적극적인 인수 전략에 눈이 가게 됩니다.
엔비디아의 AI 효율을 챙기려는 움직임은 ‘OmniML(옴니ML)’을 인수하는 것에서 시작되었습니다. 이번 run:ai와 Deci ai 인수 소식에 비해 조용히 진행되어서, 이 내용을 모르시는 분들도 간혹 계시는 것 같더라고요. 이번 AI 피드 콘텐츠에서는 가장 최근의 엔비디아 인수 소식부터 시간 역순으로 소개해 드리고 있는데요. run:ai와 Deci ai의 사례를 이미 보고 오셨으니, 그보다 더 전에 엔비디아가 인수한 OmniML의 기술을 짚어봄으로써. 엔비디아가 차근차근 준비하고 있는 AI 인프라 효율의 방향에 대해 파악해 보실 수 있을 거예요. ;)
옴니ML은 전 페이스북의 소프트웨어 엔지니어, 전 구글 리서치의 모바일 비전 팀 박사, MIT 컴퓨터공학부 박사가 공동 창업한 AI 스타트업입니다. AI의 기계 학습(ML) 모델을 클라우드가 아닌 하드웨어에서 인식할 수 있도록 구동하는 소프트웨어를 개발해 왔는데요. 2021년 시작한 따끈따끈한 신생 스타트업이었습니다.
창업한 지 1년 만에 ML 모델을 로우엔드 하드웨어에 적용하는 옴니마이저(Omnimizer) 플랫폼을 출시했는데요. AI 최적화를 대규모로 더 빠르고 쉽게 만드는 것을 목표로 하는데, 속도에만 집중한 것이 아니라 정확도까지 챙길 수 있고, 메모리 사용량도 줄일 수 있어 엔비디아에 인수되기 전에도 많은 기업들의 주목을 받았습니다.
작년 연말부터 ‘온디바이스AI’라는 새로운 산업 트렌드가 나타나면서, 옴니ML을 인수한 엔비디아의 의중을 알 수 있었는데요. 점차 일상화될 AI가 ‘클라우드’가 아니라 여러 가지 유형의 하드웨어에 자리 잡게 되고, 온디바이스AI에 탑재된 생성형AI의 성능이 점차 개선될 것이므로, 옴니ML의 기술은 우리가 생각한 것보다 더 광범위하게 쓰일 것으로 보입니다.
엔비디아가 인수한 기업들의 면면을 볼 때, 엔비디아가 제공하고자 하는 AI 인프라 또는 AI 칩에 대한 지향점이 보이는 것 같습니다. 병렬 기능으로 GPU 활용 효율을 챙기는 동시에, AI 모델 또는 신경망의 크기를 압축하는 방식으로 AI 모델을 경량화하는, 일련의 비용 효율 추구 프로세스가 그려지는데요. TEN 역시 AI 인프라 관리를 통해 AI 사업화 과정에서 발생하는 비용을 절감하고, 효율을 챙길 수 있도록 한다는 점에서 결이 비슷하다고 할 수 있겠습니다.
엔비디아의 제품이 고가이기에 실질적으로 엔비디아의 GPU를 보유하게 되는 기업들은 글로벌 기업 혹은 대기업이 되는데요. 아주 큰 규모의 기업에도 AI 인프라 구축과 운영에 대한 비용은 동등하게 무겁다는 사실은 분명하네요. AI 사업화를 생각 중인 다양한 규모의 기업들은 엔비디아 외에도 다양한 제조사의 GPU를 고려하다 보니, 이번 인수합병으로 인한 서비스 확대가 와닿지 않을 수도 있겠습니다.
대신 TEN의 AI Pub이 다양한 제조사의 GPU에 적용할 수 있어, 엔비디아의 GPU에 반영될 GPU 효율을 AI Pub으로도 경험하실 수 있답니다. AI 인프라의 효율에 대한 TEN의 지식은 [AI, 더 쉽게]와 [AI, 더 깊게]를 통해서 전해드리고 있으니, 궁금하시거나 AI 인프라에 대한 고민이 있으시다면 TEN 홈페이지를 찾아 주세요!
* 주식회사 텐의 콘텐츠를 더 빨리 만나는 방법! 텐의 AI피드를 방문해 보세요!