brunch

AWS RI와 SP 개념의 등장 배경과 활용 방안

by 멘토사피엔스

“AWS에서 비용을 줄이는 가장 쉬운 방법은, 사실 정해져 있습니다.”

많은 팀이 AWS 비용 문제에 부딪히면 가장 먼저 떠올리는 해답이 “뭔가 잘못 쓰고 있겠지”입니다.

그래서 로그를 뒤지고, 사용량을 정리하고, 일부 리소스를 끄기도 합니다.


하지만 AWS는 이미 오래전부터 “비용을 줄이고 싶다면, 정액제를 쓰라”는 메시지를 명확히 보내고 있습니다.

그게 바로 RI(Reserved Instance), SP(Savings Plans)입니다.

언뜻 보면 그저 할인 혜택 같지만, 그 속을 들여다보면 AWS의 비즈니스 전략과 고객 락인 의도가 섬세하게 설계된 구조임을 알 수 있습니다.


그렇다면 우리는 이 구조를 어떻게 ‘현명하게’ 활용해야 할까요?


정액제처럼 쓰는 AWS: RI와 SP 개념의 등장 배경


비용 예측이 가능해야 전략도 수립된다

실제 운영에서 AWS 비용은 매달, 혹은 매일 변동합니다.

트래픽에 따라 스케일이 커지고 줄어들며, 새로운 기능을 배포할 때마다 새로운 리소스가 추가됩니다.

이 변화는 비즈니스에 유연성을 주지만, 비용 측면에서는 전략 수립을 어렵게 만듭니다.


예를 들어 이번 달 EC2는 200만 원이 나왔습니다. 다음 달엔 얼마나 나올까요? 마케팅 캠페인이 있으면? QA 서버를 새로 띄우면? 신규 서비스가 붙으면? 사용자 트래픽이 늘면? 트래픽 공격을 받으면?


이 질문에 답하려면 정확한 사용량 예측이 필요한데, 현실적으로 이건 매우 어렵습니다.

반대로 정확한 사용량을 예측할 수 있다면 이것은 비용을 굉장히 절감할 수 있는 중요한 포인트가 됩니다.

RI(Reserved Instance)와 SP(Savings Plans)라는 ‘정액제 모델’을 사용할 수 있기 때문입니다.


정액제는 “우리는 이만큼 리소스를 최소한으로 계속 쓸 것이다”라는 전제 아래, 비용을 고정해주는 운영 계약의 개념입니다. “불확실한 온디맨드 대신 어느 정도는 예측 가능한 사용량이 있다면 그만큼은 저렴하게 운영할 수 있게 됩니다.


이러한 정액제 구조가 도입되면서 기업들은 본격적으로 중장기적인 비용 전략을 세우고, 월별 예산안, 커버리지 목표, 리소스 운영 계획을 체계화할 필요성을 느끼게 됩니다.


RI와 SP는 단순 할인 수단이 아니라 ‘리소스 운영 계약’

많은 분들이 RI(Reserved Instance)나 SP(Savings Plans)를 단순히 온디맨드보다 ‘좀 더 저렴한 요금제’ 정도로 오해하는 경우가 많습니다. 하지만 이는 AWS와 고객 간의 ‘운영 계약’에 더 가깝습니다.


RI는 특정 인스턴스 유형을 특정 기간(1년 또는 3년) 동안 쓰겠다고 약정하는 방식입니다.

SP는 일정 금액만큼의 사용량을 시간당 기준으로 약정하고, 어떤 인스턴스든 유연하게 사용할 수 있도록 만든 구조입니다.


잘 생각해보면 RI, SP는 사용자 입장에서 예측가능한 리소스에 대해 비용을 절감할 수 있지만, AWS 입장에서도 예측이 가능합니다.


두 모델 모두 AWS 입장에서 리소스를 미리 확보하고, 사용량을 예측 가능하게 만들 수 있는 도구입니다.

즉, 이는 단순히 고객에게 할인 혜택을 주는 것이 아니라, 리스크를 줄이는 대가로 AWS가 가격을 내려주는 것입니다.


RI, SP 서비스에 대한 AWS의 의도

1)유휴 인프라 방지

AWS는 거대한 물리적 인프라를 운영합니다. 전 세계 수십 개 리전에 수많은 서버 랙을 설치하고, 그 위에서 수백만 개의 EC2 인스턴스와 RDS 인스턴스가 실행됩니다.


이 인프라는 “필요할 때마다 띄우는” 온디맨드 방식만으로는 예측이 어렵고, 결과적으로 리소스를 과잉으로 준비하거나, 유휴 상태로 두게 됩니다. RI와 SP는 바로 이 불확실성을 해소하는 장치입니다.


고객이 “1년간 이 인스턴스를 쓰겠다”고 약속하면, AWS는 그에 맞춰 인프라를 최적화해 운영할 수 있습니다.


2) 고객 락인(Lock-in)

RI나 SP를 구매하면, 최소 1년 또는 3년간 AWS에 약정이 생깁니다.


이 말은 곧, 해당 기간 동안에는 다른 클라우드로 이전하거나, 온프레미스로 전환하는 것이 실질적으로 어렵다는 뜻입니다. 특히 EC2 Instance SP처럼 범용적인 Savings Plans는 많은 워크로드를 포괄하므로, 더 강한 락인 효과를 가집니다.


AWS 입장에서는 기존 고객을 오래 유지하고, 경쟁사로의 이동 가능성을 낮추는 구조적 장치가 되는 셈입니다.


3) 장기 계약 유도

AWS는 고객이 장기적인 전략을 세우도록 유도합니다.


이 전략에는 “우리 워크로드는 앞으로도 클라우드에서 계속 운영될 것이다”라는 전제가 깔려 있습니다. RI/SP는 이를 서서히 유도하는 수단입니다.

처음에는 일부 인스턴스를 대상으로 RI를 구매하고,

점차 Savings Plans로 확장하며,

전체 인프라의 70~80%를 장기 약정으로 고정하게 됩니다.


그 결과, 고객은 더 안정적으로 비용을 관리할 수 있지만, 동시에 AWS에 점점 더 깊이 묶이게 되는 구조가 형성됩니다.


RI/SP를 똑똑하게 활용하기 위한 우리 전략


확실한 워크로드를 수립

정액제 구조는 당연히 고객에게도 강력한 기회가 됩니다.

AWS가 리스크를 줄이기 위해 만든 구조는, 고객이 명확하게 예측할 수 있는 리소스에 대해서는 최대 70%까지 비용을 절감할 수 있는 강력한 무기가 됩니다.


핵심은 하나입니다. 불확실한 상황에서 RI/SP를 쓰면 리스크가 되지만, 확실한 워크로드를 수립하는 것이 필요합니다.


즉, 이 전략은 단순히 “할인 받자”가 아니라, 우리 조직이 어떤 리소스를 얼마나 안정적으로 사용할 수 있는지에 대한 깊은 통찰이 있을 때에만 의미가 생깁니다.

운영 서비스로 24시간 가동 중인 EC2 인스턴스

특정 리전에서 1년 이상 유지되는 RDS

매일 반복되는 배치 작업을 처리하는 Lambda


이처럼 일정 이상 지속성과 패턴이 확보된 워크로드는 온디맨드로 계속 돌리는 것이야말로 비용적 리스크입니다. AWS는 정액제를 통해 락인을 유도하고 싶어 하지만, 고객은 이 구조를 정확히 이해함으로써 오히려 주도권을 가질 수 있습니다.


“우리가 이 정도는 반드시 쓸 거니까, 이 정도는 싸게 쓰겠다.”

이것이야말로 비용 최적화 전략의 핵심입니다.


커버리지 전략 수립: 고정 vs 유동 인프라 분리

RI와 SP를 현명하게 활용하기 위해 가장 먼저 해야 할 일은 조직 내 인프라를 ‘고정적으로 필요한 리소스’와 ‘변동 가능한 리소스’로 나누는 일입니다.


운영 서비스에 반드시 필요한 리소스는 일정 수준 이상 항상 켜져 있어야 합니다.

예를 들어 다음과 같은 경우입니다

트래픽에 상관없이 항상 가동되는 웹 서버 (EC2)

사용자 요청을 지속적으로 처리해야 하는 핵심 API 서버

실시간 서비스를 뒷받침하는 운영 DB 인스턴스 (RDS)


이런 인프라는 사용량 예측이 명확하므로, RI(Standard 또는 Convertible) 또는 EC2 Instance Savings Plans를 적용해도 리스크가 낮습니다. 오히려 온디맨드로 계속 쓰는 것이 비용 낭비가 되는 구조입니다.


반면 다음과 같은 인프라는 스케일이 유동적이기 때문에 정액제로 묶었을 때 오히려 리스크가 커질 수 있습니다.

일시적인 트래픽 증가에 대응하는 Auto Scaling 그룹

비정기적 실행이 많은 QA, 테스트, 이벤트성 서버

하루 한두 번만 실행되는 배치 처리 작업

스팟 또는 Fargate 기반의 유동 컨테이너 워크로드


이 경우에는 온디맨드를 유지하거나, 유연성이 높은 Compute Savings Plans를 고려하는 것이 더 유리합니다.


전체 비용 중 60~80% 정도만 정액제로 커버

RI와 SP는 ‘많이 사는 것’이 최적화가 아닙니다.

조직의 안정성과 변화 가능성을 감안하면 전체 인프라 중 약 60~80% 수준까지만 정액제(약정형)로 커버하는 것이 현실적입니다. 60% 이하라면 할인 효과가 약해지고 80%를 초과하면 유동적 수요를 커버하지 못해 손실이 발생할 수 있습니다.


AWS에서 제공하는 Coverage 리포트와 Compute Optimizer의 추천 인스턴스를 통해 이 비율을 정기적으로 점검하고 조정하는 것이 중요합니다.


핵심은, 비용 최적화는 ‘전체를 묶는 것’이 아니라, ‘적절히 나누는 것’에서 시작된다는 점입니다.

고정된 리소스에 집중하고, 유동 리소스는 유연하게 운용하되 각각에 맞는 절감 전략을 적용해야 진짜 최적화가 이뤄집니다.


‘전략적 유연성’ 확보

전략적으로 비용과 유연성을 트레이드오프해야합니다. 다음 이어지는 글에서 더 자세하게 다루겠으나 몇가지 케이스를 요약하면 아래와 같습니다.


Standard RI는 할인률이 높지만, 인스턴스 패밀리나 OS 변경이 불가능합니다.

반면 Convertible RI는 일부 할인률을 포기하는 대신, 인스턴스 타입, 패밀리, OS, 테넌시(Tenancy) 등을 변경할 수 있는 유연성을 제공합니다.


Savings Plans 중 Compute SP는 RI보다 훨씬 넓은 범위에 적용됩니다. 어떤 인스턴스든 어떤 OS든 어떤 AZ나 리전에서든 EC2, Fargate, Lambda까지 포함해서 적용 가능합니다.

이런 유연성 덕분에 Compute SP는 서비스의 변화나 확장에 따른 리스크를 최소화하면서도, 할인을 받을 수 있는 ‘범용형 전략’으로 쓰입니다.


“RI/SP 좋다니까 한 번에 몰아서 많이 구매하는 것”은 시점 리스크를 키웁니다.

구매 직후 트래픽이 줄면? → 사용률 급감

구매 직후 서비스 구조가 변경되면? → 적용 불가


이를 방지하기 위해 월 단위로 약정을 분산 구매하는 전략이 필요합니다. 예를 들어, 3개월에 걸쳐 매달 30%씩 구매하면 향후 1년간 사용 패턴이 달라져도 유연하게 대응할 수 있습니다. 또한 이렇게 하면 RI/SP 커버리지를 점진적으로 쌓으며 실제 비용 절감 효과를 검증하면서 조정할 수 있습니다.


결론


“무턱대고 줄이는 게 아니라, 확신 있는 곳부터 싸게 쓰는 것.”


AWS 비용 최적화는 결국 의사결정의 싸움입니다.

불확실성을 감수하고 유연하게 갈 것인가, 확실한 워크로드에 대해서는 단호하게 약정을 맺을 것인가.


RI와 SP는 단순한 비용 할인 정책이 아닙니다. AWS와의 ‘신뢰 계약’이며, 동시에 우리의 운영 철학을 시험하는 선택지입니다.

확실한 워크로드에는 RI/SP를 도입하고

변동성 높은 영역은 유연하게 열어두며

장기 락인 대신 전략적 유연성을 확보하고

전체 비용의 60~80%만 부분 약정으로 커버해 나간다면


우리는 AWS의 정액제 전략을 AWS보다 더 잘 이해하고 활용하는 고객이 될 수 있습니다.

지금 우리는 AWS를 싸게 쓰는 방법이 아니라, 현명하게 쓰는 방법을 배우고 있는 중입니다.






FinOps 커뮤니티에 함께 하실래요?


저는 최근 48%, $36000의 AWS 비용절감을 달성했습니다.

클라우드 비용을 효율화하고 싶은 분들, 비슷한 고민을 나누고 싶다면 제가 운영 중인 AWS-FINOPS-KR Slack 커뮤니티에 참여하세요. 실제 절감 사례, 질문, 전략 공유를 나누실 수 있습니다.


⇒ [FinOps Slack 참여하기]

keyword
매거진의 이전글AWS 서버 비용구조, 비용최적화가 어려운 이유