고도화는 기술이 아니라 구조다:
진짜 MSP의 자질

기술은 있는데 왜 성공하지 못하는가?

by Yameh

안녕하세요.

지난 14화에서 우리는 클라우드 생태계가 왜 고장 났는지, 그리고 생태계의 참여자들인 CSP, MSP, 컨설팅이 어떻게 제 역할을 하지 못하고 있는지 살펴봤습니다.

고객은 전략이 없고, CSP는 공급자에 머무르며, MSP는 기술은 있지만 전략이 없고, 컨설팅은 전략만 있을 뿐 실행을 모릅니다. 이처럼 각 주체가 책임을 회피하는 구조 속에서, 기업이 클라우드를 통해 '고도화'를 이루겠다는 목표는 어떻게 가능할까요? 더 근본적인 질문을 던져봅시다. "고도화란 대체 무엇인가?"


많은 기업이 '클라우드 고도화'라고 하면 쿠버네티스 도입이나 마이크로서비스 전환 같은 최신 기술의 적용을 떠올립니다. MSP는 고객에게 "쿠버네티스를 도입하시죠", "MSA로 전환해야 합니다"라고 제안합니다. 하지만 이것이 정말 고도화일까요?


이번 화에서는 '진짜 고도화'란 무엇인지 그 본질을 정의하고, 이 복잡한 과제를 수행할 수 있는 '진정한 MSP'는 어떤 자질을 갖추어야 하는지 깊이 있게 살펴보겠습니다.


1부: 고도화는 '기술 도입'이 아니라 '구조 개선'이다

준비되지 않은 신기술은 독이 된다

"요즘 쿠버네티스가 대세라던데, 우리도 도입해야 하지 않나요?"

이런 질문을 받을 때마다 필자는 되묻습니다. "왜 필요하신가요?"

대부분은 명확한 답을 하지 못합니다. 그저 "혁신적이라고 들었다", "경쟁사가 쓴다더라" 같은 막연한 답변만 돌아옵니다.

준비되지 않은 신기술 도입은 고도화가 아니라 재앙입니다. 오히려 복잡성과 장애 리스크만 키우는 함정이 될 수 있습니다. 쿠버네티스 클러스터는 돌아가지만 아무도 제대로 활용하지 못하고, 비용만 증가하며, 운영 복잡도만 늘어나는 상황. 이것이 우리가 원했던 고도화일까요?

진짜 고도화는 기술 도입이 아니라 구조 개선입니다.

그리고 그 출발점은 뜻밖에도 '최신 기술'이 아니라, 지금 가지고 있는 것을 제대로 정리하는 데서 시작됩니다.


고도화의 진짜 출발점: Lift, Fix & Shift

2018년, 필자는 한 글로벌 주류회사의 클라우드 전환 프로젝트 제안서에 "Managed Migration"이라는 개념을 처음 제시했습니다. 당시만 해도 대부분의 클라우드 전환은 단순한 'Lift & Shift', 즉 "온프레미스에 있던 걸 그대로 클라우드로 옮기기"에 불과했습니다.

하지만 이 방식의 문제는 명확했습니다.

기술 부채까지 함께 클라우드로 가져온다는 것입니다. 온프레미스에서 비효율적이던 아키텍처, 정리되지 않은 운영 프로세스, 낡은 보안 정책까지 모두 클라우드로 이사합니다.

결과는? "비용만 비싸지고 아무것도 변하지 않았다"는 고객의 실망뿐입니다.


필자가 제안한 Managed Migration은 달랐습니다.

철저한 사전 진단(Thorough Assessment)을 통해 고객의 아키텍처, 데이터, 운영 상태를 분석하고, Rehost, Replatform, Refactor 중 최적의 전환 방식을 조합해 이전하는 방식이었습니다.

핵심은 "고쳐서 옮기기(Fix & Shift)"였습니다.

클라우드로 옮기기 전에, 기존 시스템의 문제점을 먼저 진단하고 고칩니다. 불필요한 의존성을 정리하고, 비효율적인 아키텍처를 개선하며, 보안 구조를 재설계합니다. 그러고 나서 클라우드로 옮깁니다.


이 개념은 최근 클라우드 전문가 데이비드 린디컴(David Linthicum)이 주장하는 "Lift, Fix & Shift" 모델과 구조적으로 동일합니다. 진정한 고도화의 출발점은 바로 이 "고쳐서 옮기는" 개념에서 시작됩니다. 이것이 기술 부채를 청산하고 고도화를 시작하는 가장 현실적인 첫걸음입니다.


클라우드 컴퓨팅(2)_15화_fix.png


운영 고도화: 자동화를 넘어 자율화로

클라우드로 이전했다고 끝이 아닙니다. 오히려 그때부터가 진짜 고도화의 시작입니다.

운영 고도화는 단순히 기존 인프라 구조를 바꾸지 않고도 클라우드 활용의 효율성과 안정성을 획기적으로 높이는 방법입니다.

그렇다면 운영 고도화의 진짜 방향은 어디를 향해야 할까요? 그것은 결국 '사람이 개입하지 않아도 운영이 가능한 체계', 즉 자율 운영(Autonomous Operations)을 향해 나아가야 합니다.

하지만 모든 기업이 당장 자율 운영을 구현할 수는 없습니다.

따라서 운영 고도화는 두 단계로 접근해야 합니다.


1단계: 지금 당장 할 수 있는 자동화

먼저 할 수 있는 것부터 시작합니다.

태그 정비, 리소스 예약 종료 알림, 예산 경고 시스템, 권한 정책 자동화, 로그 수집 및 시각화, 룰 기반 알림 체계, 정기 점검 자동화 같은 것들입니다.

이런 자동화는 특별한 AI 기술 없이도 스크립트와 정책 설정만으로 구현 가능합니다.

핵심 목표는 '사람의 개입을 줄이는 것'입니다. 반복적인 작업을 자동화하고, 운영자의 대응 시간을 단축하며, 사람이 실수할 여지를 줄입니다.


2단계: AI 기반 자율 운영 (AIOps)

보다 진보된 고도화는 AI를 활용한 예측, 판단, 자동 대응 체계를 포함합니다. 이른바 AIOps 구조입니다.

로그를 수집하는 것을 넘어 AI가 이상 징후를 탐지하고, 과거 유사 이슈를 분석해 조치를 추천하거나 자동으로 수행합니다. 예산 초과를 예측하고 선제적으로 리소스를 최적화하며, 트래픽 패턴을 분석해 인프라를 자동으로 재조정합니다.

이러한 자율화 체계는 사람 없이도 운영 체계가 최적 상태로 유지되도록 하는 것을 목표로 하며, 궁극적인 운영 고도화의 방향입니다.

"운영 고도화의 진짜 종착점은 자동화가 아니라 자율화다. 그리고 자율화는 결국 AI를 운영 체계에 통합하는 구조에서 가능해진다."

운영 고도화는 지금 할 수 있는 것과 준비해야 할 것을 동시에 봐야 합니다.

지금은 자동화를 통해 품질과 효율을 높이고, 미래에는 AI를 통해 자율화된 운영 체계를 구축하는 것입니다.


클라우드 컴퓨팅(2)_15화_autonomous.png

구조 전환형 고도화: MSA로 가야 할까?

"우리도 MSA(마이크로서비스 아키텍처)로 전환해야 하지 않나요?"

이 질문을 받을 때마다 .NET 개발자 커뮤니티에서 활동하는 Tim Corey의 조언이 떠오릅니다.

그는 이렇게 말합니다.

"마이크로서비스는 복잡성의 비용을 전제로 한다. 유행이 아니라, 진짜 그것이 필요한 지부터 따져야 한다."

모든 기업이 당장 MSA로 전환할 수 있는 것도 아니고, 전환해야 하는 것도 아닙니다.

MSA는 모든 기업에 적합한 구조가 아닙니다. 단순히 '기술적 우월성'이 아니라 '조직의 운영 역량과 비즈니스 민첩성의 요구 수준'에 따라 도입 여부를 판단해야 합니다.

서비스 배포 주기가 월 1회인 기업에 MSA가 필요할까요? 개발팀이 5명인데 수십 개의 마이크로서비스를 관리할 수 있을까요? 모놀리식 구조도 충분히 잘 작동하고 있는데, 굳이 MSA로 전환해서 복잡도를 높일 이유가 있을까요?

준비되지 않은 MSA는 구조 복잡성과 장애 확산의 리스크만 키웁니다.

고도화를 진지하게 고려한다면, 점진적인 접근이 필요합니다.

모든 것을 한 번에 바꾸는 게 아니라, 일부 워크로드의 컨테이너화부터 시작하고, 비즈니스 민첩성이 필요한 부분만 API 기반 마이크로서비스로 설계하며, CI/CD를 정착시키고, DevSecOps를 강화하는 방식입니다.

그리고 무엇보다 중요한 것은 전환 이전에 반드시 고객의 비즈니스 구조와 조직의 운영 역량을 검토해야 한다는 것입니다.


AI 기반 고도화: 준비된 자만이 누린다

고도화의 궁극적인 목표는 AI를 중심으로 한 비즈니스 자동화, 지능형 의사결정 구조에 있습니다. 하지만 AI는 구조가 준비된 기업에만 실질적 가치를 줍니다.

데이터 수집-정제-서빙 파이프라인이 구축되어 있나요?

MLOps 기반의 모델 배포, 서빙, 모니터링 체계가 내재화되어 있나요?

보안, 책임성, 예산 통제 등 운영 측면에서의 준비도가 갖춰져 있나요?

이런 것들이 준비되지 않은 상태에서 "AI를 하고 싶다"고 말하는 것은, 기초 공사 없이 고층 빌딩을 짓겠다는 것과 같습니다.


2부: 진짜 MSP가 갖춰야 할 자질

고도화는 고객 혼자 할 수 없습니다. 그렇다면 14화에서 "기술은 있지만 전략이 없다"고 비판받았던 MSP가 어떻게 변해야 이 과제를 수행할 수 있을까요?

클라우드 시장에 MSP는 넘쳐납니다. 하지만 고객이 원하는 품질과 신뢰를 안정적으로 제공하는 MSP는 드뭅니다. 기술을 가진 MSP는 많지만, 그 기술을 책임질 수 있는 '구조'를 가진 MSP는 제한적입니다.

신뢰받는 MSP가 갖춰야 할 핵심 자질은 무엇일까요?

단순한 기술 보유가 아니라, 조직의 구조와 딜리버리 체계 전반의 성숙도로 드러나야 합니다. 다음은 신뢰받는 MSP가 갖춰야 할 8가지 핵심 역량입니다.


1. 실행 방법론(Delivery Methodology)

MSP는 단순한 기술 납품자가 아닙니다. 프로젝트 전체를 책임지는 주체입니다. 따라서 고객의 기대를 관리하고, 변경을 통제하며, 품질을 검증하고, 전환 이후 안정화까지 포함하는 일관된 실행 프레임워크가 필요합니다.

중요한 것은 이 방법론이 문서로만 존재하는 것이 아니라, 딜리버리 조직 전체에 내재화되어 있어야 한다는 점입니다. 프로젝트마다 일관되게 적용되는 운영 체계여야 합니다.

방법론이 없는 MSP는 매 프로젝트마다 즉흥적으로 대응하게 되고, 결국 품질은 담당자 개인의 역량에 좌우됩니다. 이것은 조직이 아니라 개인사업입니다.


2. 자동화 기반 딜리버리 역량

운영 자동화는 단순한 효율성 문제가 아닙니다. MSP의 수익성과 고객 만족을 동시에 좌우하는 핵심 변수입니다.

반복적인 태스크, 예산 경고, 태그 관리, 정기 점검, 로그 분석 등 모든 운영 프로세스가 자동화되어야 인건비를 줄이면서도 운영 품질을 높일 수 있습니다. 자동화 수준이 낮은 MSP는 인력 중심의 수작업 구조에서 벗어나지 못하고, 결국 고객 불만과 내부 피로도만 높아지는 악순환에 빠지게 됩니다.

자동화 역량은 단순한 운영 고도화뿐 아니라, 같은 리소스로 운영 및 구축 범위를 확장해 궁극적으로 MSP의 사업 확장을 가능하게 하는 기반이 됩니다.


3. CMP(Cloud Management Platform) 운용 능력

단순히 CSP에서 제공하는 포털을 사용하는 것을 넘어서, 고객 환경에 맞게 비용 관리, 자원 운영, 보안 정책, 권한 통제, 거버넌스 적용을 통합적으로 관리할 수 있는 툴을 제공할 수 있어야 합니다.

이는 자체 개발이든 상용 솔루션 활용이든 상관없지만, 중요한 것은 "고객에게 인사이트를 제공하고, 운영을 단순화해 주는 체계"로 기능해야 한다는 점입니다.

CMP 없이 AWS 콘솔, Azure 포털, GCP 대시보드를 각각 오가며 운영하는 것은 21세기가 아니라 20세기의 운영 방식입니다.


4. 기술 내재화를 위한 R&D 역량

클라우드 기술은 매우 빠르게 변화합니다. 이를 따라가지 못하면 고객을 리드하기는커녕 대응조차 어렵습니다.

MSP는 새로운 기술을 빠르게 실험하고, 고객 환경에 적용 가능한 PoC를 설계하며, 이를 반복 가능한 참조 구조(Reference Architecture)로 전환할 수 있는 역량을 보유해야 합니다.

이는 단순한 랩 환경 테스트가 아니라, 실제 고객 환경을 반영한 기술 내재화 능력을 말합니다.

"우리도 해봤는데요"와 "이렇게 하면 됩니다" 사이에는 큰 차이가 있습니다.


5. 프라이빗 클라우드 운영 역량 (OpenShift, Nutanix 포함)

퍼블릭 클라우드만 다룰 줄 아는 MSP는 하이브리드 전략을 수행할 수 없습니다.

MSP는 OpenStack, VMware 기반뿐 아니라 최근 수요가 높아진 Red Hat OpenShift(컨테이너 기반 PaaS 프라이빗 클라우드)나 Nutanix(HCI 기반 인프라)도 운영할 수 있어야 합니다.

특히 OpenShift는 컨테이너 기반의 프라이빗 플랫폼을 이해하고 실제 서비스로 안정화시킬 수 있는 고급 기술 역량이 요구됩니다. Nutanix는 퍼블릭 클라우드의 민첩성을 프라이빗 환경에서도 구현하려는 고객 수요에 적합하며, MSP는 이에 대응할 수 있어야 합니다.

프라이빗 환경의 핵심은 단순한 인프라 설치가 아니라, 퍼블릭과의 연계, 운영 정책 일관성, 보안 통합까지 책임지는 전체 역량에 있습니다.


6. AI 딜리버리 역량

미래의 고도화는 결국 AI입니다.

AIOps, FinOps, MLOps 등으로 대표되는 AI 기반의 운영 자동화와 비용 통제 체계는 앞으로의 운영 환경에서 기본이 됩니다.

MSP는 AI를 위한 인프라 설계, 데이터 흐름 구조, 모델 서빙, 모니터링 등 다양한 실무 역량을 보유하거나, 이를 설계할 수 있는 구조를 갖추고 있어야 합니다.

고객이 "AI를 하고 싶다"고 말하는 순간, MSP는 기술이 아닌 전략과 구조로 대응해야 합니다.


7. 클라우드 컨설팅 역량

고객은 이제 단순히 구축이 아니라 전략을 원합니다.

MSP는 보안, 거버넌스, 비용, 아키텍처 등 최소한의 컨설팅 기능을 내재화하고 있어야 하며, 부족하다면 외부 컨설팅 조직과의 유기적인 협업 구조를 미리 확보해 두는 것이 필요합니다.

고객의 전략적 의사결정에 개입할 수 있는 MSP만이 진짜 파트너로 평가받을 수 있습니다.

단순히 "시키는 대로 만든다"는 하청업체의 사고방식에서 벗어나, "이게 정말 당신에게 맞는 방향인가요?"라고 물을 수 있어야 합니다.


8. 핵심 특기 역량(Core Competency)

기술 기본기는 누구나 갖추고 있습니다. 하지만 특정 분야에서 '이 MSP가 최고'라는 인식이 있어야 시장에서 선택됩니다.

"모든 것을 다 잘한다"고 말하는 MSP는 아무것도 잘하지 못할 가능성이 큽니다.

예를 들어 "데이터 분석과 마이그레이션은 A사", "인프라 아키텍처는 B사", "보안 아키텍처는 C사"처럼 명확한 포지셔닝이 필요합니다.

이를 위해 내부 전문성 육성, 강점 중심 레퍼런스 확보, 마케팅 연계 전략이 필요합니다.

클라우드 리세일은 MSP의 특기 역량이 아닙니다.

특기 역량은 기술이자 브랜드가 됩니다. 이것이 빠져 있는 MSP는 기억되지 않습니다.


클라우드 컴퓨팅(2)_15화_octagon.png


마치며: 기술은 기본이고, 구조가 차별점이다

이 모든 자질은 단순한 '할 수 있다'의 문제가 아닙니다.

MSP가 고객에게 신뢰받기 위해서는, 실제로 이러한 역량을 반복적으로 제공하고, 일관된 품질로 납품할 수 있어야 합니다.

기술은 기본입니다. 이제 고객이 찾아야 할 파트너는 단순히 기술을 나열하는 회사가 아니라, 위에서 언급한 8가지 자질, 즉 '기술을 책임질 수 있는 구조'를 갖춘 조직입니다.

고도화는 기술이 아니라 구조이며, 이 구조를 함께 설계하고 책임질 수 있는 MSP만이 고장 난 생태계에서 살아남는 진정한 전략 파트너가 될 것입니다.


다음 화에서는 이 모든 주체들—고객, MSP, CSP, 컨설팅—이 실제 프로젝트에서 어떻게 협력해야 하는지, 프로젝트 성공을 위한 실질적 조건을 살펴보겠습니다.

이전 14화고장 난 생태계의 참여자들: CSP, MSP, 컨설팅