최근 주목받고 있는 생성형 AI는 인공지능 시대를 여는 혁신적인 기술임에 분명하다. 그러나 생성형 AI 인프라의 근간이 되는 클라우드 컴퓨팅에 대한 이해가 뒷받침되지 않는다면 생성형 AI를 효과적으로 도입 및 활용하기 어렵다. 클라우드 컴퓨팅은 생성형 AI 모델의 배포에 앞서 가상화된 환경에서 안정적으로 테스트 및 검증 가능하게 해 줄 뿐만 아니라, 실시간으로 바뀌는 사용자 수요에 맞추어 서버를 유동적으로 활용할 수 있게 해주는 핵심적인 기술이기 때문이다.
생성형 AI의 급격한 성장이 사람들의 관심을 모으고 있지만 클라우드 컴퓨팅은 여전히 생성형 AI보다 훨씬 더 거대한 시장이다. 글로벌 시장 조사업체 IDC(International Data Corporation)는 생성형 AI가 '챗GPT'의 등장이래 2023년 149억 달러(약 19조 원)의 시장을 형성했으며, 2024년에는 성장세가 더 뚜렷해지면서 시장 규모가 무려 2.7배에 달해 401억 달러(약 52조 원)에 다다를 것으로 전망했다. 반면 미국의 시장조사업체 가트너에 따르면 글로벌 클라우드 컴퓨팅 시장 규모는 2023년 5423억 달러(약 720조 원)보다 2024년 20% 증가한 약 6787억 달러(약 900조 원) 규모로 성장할 것으로 예상되는데, 이는 생성형 AI 시장의 무려 약 17배에 달하는 규모다.
이처럼 클라우드 컴퓨팅 기술은 생성형 AI 시대에 핵심적인 역할을 수행하고 있으며 앞으로도 4차 산업혁명 시대 생성형 AI와 블록체인 그리고 IoT 등 핵심 기술들의 중추적인 역할을 해나갈 매우 중요한 핵심 기술이다. 특히 2024년에는 기업의 생성형 AI 도입 사례가 급증하면서 관련된 새로운 트렌드와 기술이 발전할 것으로 전망된다.
그렇다면 클라우드 컴퓨팅 기술은 어디까지 왔으며, 우리 회사는 클라우드 도입 및 활용을 위해 무엇을 준비해야 할까? 클라우드 컴퓨팅은 기존의 IaaS 및 PaaS 방식을 넘어 서버리스(serverless) 및 에지(edge) 컴퓨팅과 통합되어 하이브리드 및 멀티 클라우드 환경으로 진화하고 있다. 생성형 AI의 근간이 되는 클라우드 컴퓨팅 기술을 관통하는 핵심 트렌드를 살펴보자.
1. 하이브리드 및 멀티 클라우드 환경의 증가
단일 클라우드 공급자(CSP, Cloud Service Provider)가 모든 서비스를 제공하는 기존의 방식은 안전하고 안정적인 서비스 제공이 불가능하다는 한계가 있었다. 하나의 CSP에 의존하는 기존 방식은 장애 발생 시 대응이 어려우며, 서버가 먹통이 될 수 있다는 치명적인 리스크가 존재하기 때문이다.
출처 : Freepik
따라서 기업들이 여러 CSP를 통한 '멀티 클라우드' 혹은 온프레미스와 클라우드 컴퓨팅을 혼합한 '하이브리드 클라우드'를 선호하는 경향이 뚜렷해지고 있다. 이에 따라 관련 기술 역시 발전하고 있다. 예를 들어 Kubernetes와 같은 오픈소스 기술을 기반으로 구축된 멀티 클라우드 설루션을 활용하면 다양한 클라우드 및 컴퓨팅 환경에서 애플리케이션을 마이그레이션, 빌드, 최적 화하가 가능해진다.
특히 생성형 AI의 경우, 여러 가지 환경에서 데이터를 효율적으로 관리하고 다루는 것이 중요한데, 클라우드 제공 업체들은 이러한 니즈를 충족시키기 위해 하이브리드 및 멀티클라우드 환경에서 AI 모델을 배포하고 관리하는 데 필요한 도구와 서비스를 제공할 것으로 예상된다.
2. 에지 컴퓨팅과의 통합
기존의 중앙 집권화 된 클라우드 컴퓨팅 방식은 많은 장점을 가지고 있지만, 데이터 소스가 다양화되고 빠른 응답과 실시간 처리가 중요해지는 최근 기술 트렌드의 요구사항을 충족시키기에 한계가 있다. 이러한 클라우드 컴퓨팅의 단점을 보완하기 위한 해결책으로 에지 컴퓨팅과의 통합된 환경 구축이 중요해지고 있다.
온디바이스 AI라고도 알려진 에지 AI는 머신러닝/딥러닝 모델이 기기에서 생성한 데이터를 사용하여 별도의 인터넷이나 클라우드와 같은 중앙 집중형 서버에 연결할 필요 없이 기기에서 직접 실행되는 분산형 컴퓨팅 패러다임으로, 데이터 소스와 가까운 곳에서 직접 연산을 수행할 수 있어 지연 시간을 줄이고, 실시간 처리를 할 수 있다는 장점이 있다.
출처 : Wipro
예를 들어 자율주행 차량이나 사물 인터넷(IoT)의 센서 등을 통해 수집되는 방대한 양의 데이터는 생성형 AI와 같은 딥러닝 기반 모델의 학습 및 커스터마이즈에 실시간으로 반영되어 직접적으로 성능을 향상할 수 있다. 2024년에는 클라우드와 에지 컴퓨팅이 더 긴밀하게 통합, 더 효율적인 데이터 처리 및 분석이 가능해질 것으로 예상된다.
이러한 방식을 통해 실시간으로 생성되는 데이터에 대한 빠른 응답을 유지하면서 데이터의 중앙 집중식 처리량을 줄일 수 있다. 생성형 AI 모델은 에지 디바이스에서 실행되어 지능적인 의사결정을 내릴 수 있다. 클라우드 컴퓨팅은 이러한 에지 장치와의 연결성을 향상하고, 모델의 업데이트 및 관리를 지원할 것으로 예상된다.
3. 서버리스 클라우드 컴퓨팅
생성형 AI가 확산되고 대화형 AI 등 소규모 이벤트 중심의 애플리케이션 서비스가 늘어나면서, 인프라 유지 및 관리에 대한 걱정 없이 저렴한 비용으로 소규모 서비스 개발 및 배포가 가능한 서버리스 방식의 도입이 늘어날 것으로 기대를 모으고 있다.
생성형 AI에 서버리스 아키텍처를 활용하면 초거대언어모델(LLM)이 공유 GPU 클러스터에서 호스팅 되며, 사용자의 수요에 따라 자원이 동적으로 할당된다.
따라서 LLM 사용을 위한 체크포인트 다운로드 및 로딩에 들어가는 비용을 획기적으로 줄일 수 있다.
이것이 가능한 이유는 서버리스(serverless) 컴퓨팅 방식이 CSP가 서버를 직접 관리 및 실행하며 요청이나 특정 이벤트가 있을 때에만 필요한 자원을 할당받아 클라우드의 서버를 이용하거나 서비스할 애플리케이션을 동작시키는 방식으로 작동하기 때문이다.
출처 : axiom
서비스형 기능(FaaS) 혹은 서비스형 백엔드(BaaS)라고도 하는 서버리스 컴퓨팅은 기업이 서버 인프라를 직접 관리해야 하는 부담 역시 덜어준다. 기존 클라우드 컴퓨팅 서버의 경우 하루 종일 서버가 켜져 있어야 했으며, 요청이 없을 때에도 계속해서 서버의 자원이 할당되고 구동되고 있어야 했다.
이러한 기존의 클라우드 컴퓨팅 방식은 기업이 서버 인프라 관리에서 자유로워질 수 없다는 단점이 있었지만, 서버리스 방식을 활용하게 되면 클라우드 사용자(개발자)는 서버 관리에서 완전히 자유로워지며 실제 구현해야 할 기능에 더 집중할 수 있게 된다.
*본 기고는 SK C&C로부터 소정의 원고료를 지급 받아 작성한 글을 원본으로 하고 있습니다.