25년 클라우드 기술의 방향은~

참고)한국지능정보사회진흥원(NIA), 디지털데일리

by 문영란

2025년 클라우드 기술방향은?


멀티 클라우드에 대한 수요 증가와 함께
글로벌 시장조사기관인 포춘 비즈니스 인사이트(Fortune Business Insights)에 따르면, 전 세계 IaC 시장 규모는 2023년 9억 870만 달러(한화 약 1조 2,431억 160만 원)에서 2030년 33억 490만 달러(한화 약 4조 5,211억 320만 원)로 연평균 20.3% 성장할 것으로 전망되고 있다.

뿐만 아니라, IaC 솔루션과 AI 기술이 통합된 ‘AIaC’ 확산으로 거대언어모델(LLM)을 활용해 자연어 기반 IaC 코드 템플릿을 생성하는 등 IaC 기술이 AI와 접목돼 더욱 고도화되었고 IBM이 2019년 레드햇 인수에 이어 최근 IaC 솔루션의 강자인 하시코프까지 인수하였다.


그러면 클라우드의 기술방향은 어디로 흘러가고 있을까?


1. 코드형 인프라 : IaC기술

온프레미스부터 멀티·하이브리드 클라우드까지 복잡한 인프라를 코드로 표준화·자동화해 운영 관리하는 ‘코드형 인프라(Infrastructure as Code; IaC)’ 기술이 주목받고 있다.

IaC는 손쉬운 인프라 생성·배치·관리를 가능케 하고, 개발과 운영을 통합하는 데브옵스(DevOpS) 구현의 기반으로 활용되고 있다.

기업 내 인프라가 다양해지면서 데이터와 애플리케이션은 여러 지점으로 분산돼, 통합 운영 관리가 어려워지고 인프라 배포, 보안, 네트워크, 애플리케이션 등 IT 부서가 관리대상이 많아지면서 개발자들이 개발 업무에만 집중할 수 있는 환경을 조성하기 힘들었다.

또한 운영 관리가 수작업으로 이루어져 이를 맡아 온 담당자가 이직하거나 변경되는 경우에는 운영 관리 프로세스를 다시 익혀야 하는 등 여러 가지 문제들이 야기됐다.

이를 해결할 수 있는 방법으로 부상한 기술이 바로 ‘코드형 인프라(Infrastructure as Code; IaC)’다.

IaC는 코드를 기반으로 인프라 프로비저닝(Provisioning)과 관리를 자동화하는 기술이다. 프로비저닝은 서버, 스토리지, 네트워크, 애플리케이션 등을 포함한 IT 인프라를 생성·설정하는 프로세스로, IaC를 활용하면 이 과정을 자동화하고 오류를 줄여 일관성을 유지할 수 있다.

IaC는 컴퓨터에서 읽을 수 있는 코드와 정의 파일을 사용해 사용자의 요구에 맞게 인프라 자원을 할당할 수 있는 프로세스이자 실행 가능한 문서다.

그림1.jpg


IaC의 큰 특징 중 하나는 ‘벤더 종속’ 탈피다. 단일 인프라를 넘어 다양한 클라우드 서비스 제공사(CSP)의 인프라와 멀티, 하이브리드 클라우드 환경을 코드로 호출하고 배포·운영할 수 있다.

아마존웹서비스(AWS), 마이크로스프트 애저(MS AZURE), 구글 클라우드 플랫폼(GCP)을 비롯해 프라이빗 클라우드 등 모든 클라우드 환경을 코드 기반으로 정형화함으로써 분산된 인프라를 통합적으로 관리할 수 있고, 보안과 거버넌스도 포함해 표준화·자동화된 인프라 배포가 가능하다.

레드햇 측 관계자는 “IaC 기술은 인프라를 코드로서 효율적이고 일관성 있게 관리할 수 있어 크게 주목받고 있다. laC의 주요 장점은 자동화를 통해 수작업을 줄임으로써 시간과 비용을 절감할 수 있다는 점이다. 코드로 작성된 설정은 항상 동일한 결과를 보장해 휴먼 에러를 방지하고 일관성을 유지한다.

또한 코드 변경 이력을 쉽게 추적할 수 있어 버전 관리도 용이하다”며 “협업 도구들과 표준화된 방식으로 쉽게 통합돼 팀 간 협업이 향상되고, 반복 가능한 환경을 구축해 신속하게 인프라를 배포할 수 있다.



2. CMP와 IaC 접목 추세


통상적으로 기업들은 인프라를 관리하기 위해 소프트웨어(SW)와 클라우드 관리 플랫폼(CMP) 등을 주로 활용한다. 이러한 솔루션들은 그래픽 유저 인터페이스(GUI)를 제공해 비전문가도 편리하게 인프라를 모니터링할 수 있도록 돕는다. 반면 특정 요구 사항에 맞춤화하기 어려우며, 라이선스 비용이 발생하고 더 나아가 특정 벤더 솔루션에 종속될 수도 있다.

이 점을 IaC가 보완할 수 있다. IaC 기반의 코드를 이용한 자동화는 원하는 형태로 맞춤형 설정이 가능하고, 오픈소스 도구를 활용할 경우 비용도 절감할 수 있다.

코드 기반으로 인프라와 관련된 모든 변경 사항을 추적할 수 있어 투명성과 버전 관리도 용이하다.


하시코프 김정훈 매니저는 “퍼블릭 클라우드, 그리고 멀티 클라우드가 대세가 된 이후에는 CMP만으로 모든 인프라를 통합 관리하기는 힘들어졌다.

AWS, MS 애저, GCP 등 각각의 서비스들이 제공하는 툴이 다양하다 보니 익혀야 할 기술이 많아졌고, API나 신규 서비스가 추가되면 이를 일일이 CMP에 반영하는 것도 노력이 든다.
이어 김 매니저는 “이 가운데 등장한 것이 IaC다. 여러 클라우드 인프라를 하나의 표준화된 도구로 배포할 수 있어야 하나의 인프라처럼 운영 관리할 수 있다는 관점이 대두된 것이다”라며 “IaC는 인프라를 콘솔로 클릭하던 것을 코드로 구성한다는 개념을 넘어, 이 코드를 표준화해서 모든 클라우드에 적용할 수 있게 한다는 것이 기본 모토다”라고 덧붙였다.

3. CI/CD와 데브옵스, 코드 기반으로 구현


IaC가 특히 더 주목받는 이유는 개발과 운영팀 간의 헙업을 촉진하고, 나아가 ‘지속적 통합/지속적 배포(CI/CD)’와 ‘데브옵스(DevOps)’를 구현할 수 있기 때문이다. 인프라가 코드로 관리된다는 IaC 개념은 개발자가 애플리케이션 코드를 개발할 때 사용하는 다양한 개발 도구와 방법론을 적용할 수 있다는 의미이기도 하다.

이는 곧 형상관리 도구인 깃(Git)을 통해 자동화된 테스트와 배포 파이프라인을 만들어 인프라를 제어하는 깃옵스(GitOps)를 적용해 CI/CD를 구현하는 기반이다. IaC가 개발자들에게 친숙한 코드 기반 도구와 워크플로우까지 제공하는 것이다..

그림2.jpg

이와 관련해 ‘사이트 신뢰성 엔지니어링(SRE)’도 주목받는 조직 개념으로 부상 중이다.
SRE 개념에 대해 한국IBM 김종서 상무는 “SRE는 데브옵스 운영 방법론을 차용한 인프라 자동화 운영에 포커싱된 운영 방법이다. SRE를 구현하는 기본적인 기술이 IaC다.

이전에는 자동화할 수 있는 방법이 없어 서버, 스토리지, 네트워크 등을 구성할 때 엔지니어들이 수동으로 설정했지만, IaC가 등장하면서 자동화가 가능해지면서 SRE라는 개념이 등장했다. SRE팀은 인프라 운영 전반과 관련된 서비스 수준 지표(SLI), 서비스 수준 목표(SLO), 서비스 수준 계약(SLA)을 측정하고 설정하는 역할을 담당한다”고 설명했다.

**용어정리)

그림3.jpg

테라폼은 하시코프에서 오픈소스로 개발한 IaC 도구로, 기본적인 형상관리와 인프라 배포에 최적화된 글로벌 선두 솔루션이다. 테라폼은 하시코프 설정 언어(HCL)를 사용해 인프라를 정의하고 클라우드 리소스를 생성한다. AWS, MS 애저, GCP와 같은 주요 클라우드 서비스를 비롯한 3,000개 이상의 프로바이더 서비스를 지원하기에 거의 모든 인프라를 테라폼만으로도 배포할 수 있다.
laC 도구인 테라폼 외에도 하시코프는 보안 관리 자동화를 위한 ‘볼트(Vault)’, 네트워크 자동 관리를 지원하는 ‘컨설(Consul)’, 애플리케이션 관리를 돕는 ‘노마드(Nomad)’ 등 인프라부터 애플리케이션까지 기업의 IT 전 영역에 대한 표준화된 자동 관리 지원 SW 제품군을 서비스하고 있다

한국에서는 메가존클라우드, 베스핀글로벌 등 클라우드 관리 서비스 제공사(MSP)를 포함한 20곳 이상의 파트너사와 협력 중이다.


참고지식) laC솔루션 테라폼 한 번 알아볼까요

테라폼은 인프라 형상관리와 배포에 목적을 둔, 즉 인프라 전반의 구성을 담당하는 IaC 솔루션이다. 테라폼의 강점은 CSP사들과의 긴밀한 협력을 통해 3천 개에 달하는 거의 모든 클라우드 서비스를 지원한다는 점이다. CSP사들이 업데이트한 사항들이 테라폼 템플릿에도 실시간 반영된다. 또 각 CSP 서비스에 맞는 샘플 코드도 제공하기에 손쉽게 수정하고 활용할 수 있다. 그래서 우리는 테라폼을 프로바이더이자 엔진이라고 부른다.

가령, 어떤 기업에서 AWS를 배포한다고 하면 테라폼 홈페이지에서 AWS 서비스를 선택하고 해당 프로그램 패키지와 API를 자동으로 불러올 수 있다. 또 하시코프 설정 언어로 작성된 직관적인 코드 템플릿으로 바로 확인할 수 있다.
오픈소스 솔루션보다는 기술 지원이 되는 기업용 버전의 솔루션을 활용해야 한다는 것이다. 실제 IaC 기반 운영 시, 작성된 코드가 실제 기업 인프라와 맞지 않아 지속적인 관리가 어려워지는 일들이 발생할 수 있다.



4. 테라폼 다음으로 인기를 끄는 솔루션은 레드햇의 ‘앤서블 오토메이션 플랫폼(Red Hat Automation Platform)’이다.


레드햇 앤서블 오토메이션 플랫폼은 자동화 개발 도구, 자동화 환경, 콘텐츠 및 컨테이너 레지스트리, 자동화 분석 도구 등으로 구성된다.


테라폼이 기본적인 형상관리에 최적화돼 있다면, 레드햇 앤서블은 자동화 영역에 방점을 둔 솔루션이다. 이러한 테라폼과 앤서블을 혼용해 사용하는 것이
최근 추세다.

이 같은 오픈소스 기반 IaC 솔루션이 대세인 가운데, CSP에서 직접 개발한 IaC 서비스도 있다. AWS 클라우드포메이션이 대표적이다. AWS 클라우드포메이션은 AWS 인프라를 코드로 정의하고 관리하는 IaC 솔루션이다.
다양한 멀티 클라우드 환경 구축을 지원하는 테라폼이나 앤서블과 달리, AWS 클라우드 서비스를 위주로 IaC를 지원한다는 점 때문에 AWS 클라우드포메이션은 고객들에게 제한적일 수 있다.

최근 AWS는 생성형 AI 서비스인 ‘아마존 Q 디벨로퍼(Amazon Q Developer)’를 인프라 코드 개발에도 활용하도록 지원하는 등 더욱 자동화된 IaC를 위한 고도화를 추진 중이다.

**테라폼과 앤서블 IaC 엔진을 기반으로 멀티, 하이브리드 클라우드 구성을 지원하는 IBM의 ‘IBM 클라우드 스키매틱스(Cloud Schematics)’와 같은 솔루션도 있다. 스키매틱스는 테라폼과 앤서블, 깃을 비롯한 오픈소스를 활용해 IaC 자동화를 서비스로 제공한다. 테라폼을 활용해 클라우드 리소스의 프로비저닝 및 수명주기 관리를 자동화하고, 레드햇 앤서블 오토메이션 플랫폼을 사용해 클라우드 리소스와 아키텍처 구성을 돕는 서비스다. 테라폼을 통해 서버, 스토리지, 네트워크 등 전체 인프라 환경을 구성하면 이후 구성된 하나하나의 요소들을 또 앤서블로 관리하는 방식이다.


국내에도 지난 4월 공식 출시된 IaC 기반 시각화·배포 서비스가 있다. 바로 클라우드로(CLOUDRAW)의 ‘클라우드스튜디오(CloudStudio)’다. 클라우드스튜디오는 클라우드 시각화 및 배포 관리 서비스로, IaC를 기반으로 인프라 설계부터 배포, 상태 관리 등을 포괄적으로 지원한다. AWS, MS 애저와 같은 주요 클라우드 서비스를 포함한 네이버클라우드, NHN클라우드 등 국내 CSP사의 서비스도 지원하며, 추가적으로 쿠버네티스 활용도 가능하다.
클라우드스튜디오는 리소스를 시각화된 캔버스에 드래그 앤 드롭 방식으로 쉽게 설계하고, 구성된 인프라를 테라폼 엔진 기반의 코드 템플릿으로 확인할 수 있다.


향후 기술은?

AI모델을 엣지에서 배포, MLflow활용 !

클라우드플레어는 AI 모델 배포를 최적화하기 위해 MLflow를 도입했다. 클라우드플레어는 데이터브릭스와의 파트너십을 통해 MLflow를 활용하여 모델 학습부터 배포까지의 전 과정을 자동화하였다.

이를 통해 클라우드플레어의 서버리스 개발자 플랫폼에서 MLflow의 기능을 제공하며, 개발자가 모델을 쉽게 추적, 공유, 패키징 및 배포할 수 있도록 지원한다.

이를 통해 AI 모델의 글로벌 배포를 간소화하고, 최종 사용자에게 초저지연(Low Latency) AI 서비스를 제공하며, 대량 요청을 효율적으로 처리하고 인터넷 연결에 대한 의존도를 줄이는 차별점을 갖고 있다.

또한 핀테크 및 금융 서비스 플랫폼 토스는 MLflow를 활용하여 실시간 모델 업데이트 및 모델 배포 자동화 기능을 적극 활용하고 클릭률(CTR, Click-through Rate) 예측 모델을 안정적으로 운영하고 있다.

keyword
작가의 이전글시작과 함께 찾아온, 봄이 오는 소리, 에세이 1.