brunch

You can make anything
by writing

C.S.Lewis

by Master Seo Oct 09. 2021

(정리) 대형장애 대비는 멀티 클라우드가 답이다.

대형장애는 GSLB와 쿠버네티스로 대응 가능하다



<1> 최근 대형 장애 내용

<2> 요구 사항, 개선안

<3> DNS와 GSLB 구축하여 트래픽 조정하기

<4> Kubernetes 구축하여 유연하게 대처하기





<1> 최근 대형 장애 내용



1

2024년 07월 

크라우드 스트라이크발 전산 마비 사태

https://namu.wiki/w/2024%EB%85%84%20%ED%81%AC%EB%9D%BC%EC%9A%B0%EB%93%9C%EC%8A%A4%ED%8A%B8%EB%9D%BC%EC%9D%B4%ED%81%AC%EB%B0%9C%20%EC%A0%84%EC%82%B0%20%EB%A7%88%EB%B9%84%20%EC%82%AC%ED%83%9C



2

2023년 8월

https://news.hada.io/topic? id=10525&utm_source=discord&utm_medium=bot&utm_campaign=926



3

2022년 10월

판교 데이터센터 화재, 전국민 대상 카카오 서비스가 ‘먹통’

https://www.ddaily.co.kr/page/view/2022120613105788224




4

2021년 12월

AWS 먹통에 멈춰선 미국

https://m.mk.co.kr/news/it/view/2021/12/1124184/



5

2021년 10월

전 세계 페이스북-인스타그램 멈췄다

https://byline.network/2021/10/5-97/


https://www.theverge.com/2021/10/4/22709806/facebook-says-the-six-hour-outage



6

2021년 10월

KT 장애, 명령어 하나 누락으로 시작…안전장치 없어 전국 확산

https://n.news.naver.com/article/001/0012756482






<2> 요구 사항, 개선안


1

요구 사항 - 대형 장애 대응 필요

CrowdStrike 제품으로 인한 윈도 시스템 비정상 종료 장애 - 2024.07

덴마크의 클라우드 제공 업체가 모든 고객 데이터를 잃음- 2023년 8월

판교 데이터센터 화재, 전국민 대상 카카오 서비스가 ‘먹통’-2022년 10월

AWS 장애 - 2021년 12월

페이스북 장애, 인스타그램의  6시간 서비스 장애-2021년 10월

KT 장애에 대한 인터넷 웹사이트 개선 방안-2021년 10월



2

개선안

멀티 클라우드가 답이다.

쿠버네티스 컨테이너가 답이다.

테라폼으로 코드로 관리하자

Multi Cloud Ops 엔지니어가 필요하다.



해당 아키텍처 장점

통신사나 CSP(Amazon , Azure)의 장애가 발생하더라도 다른 CSP로 서비스 지속 가능.

배포 시 GSLB를 이용해 트래픽을 조절하면 서비스 장애는 없음.

작은 사이트는 Node2개만 띠우면 그리 큰 금액은 아니다.



해당 아키텍처 단점

Active-Active로 구성시 쿠버네티스 비용이 추가로 들어간다.

AWS, Azure, GCP, NCP 등 다른 클라우드도 비용처리가 필요하다.

AWS, Azure, GCP, NCP 등 다른 클라우드도 익혀야 한다.








<3> DNS와 GSLB 구축하여 트래픽 조정하기




1

DNS와 GSLB 구축

https://brunch.co.kr/@topasvga/1928



2

네이버 GSLB 구축





<4> Kubernetes 구축하여 유연하게 대처하기



1

Naver kubernetes Service 구축법





2

Amazon EKS 구축과 게임 컨테이너 올리기


https://brunch.co.kr/@topasvga/1929



3

Google GKE 구축


https://brunch.co.kr/@topasvga/1932



4

MS AKS 구축


https://brunch.co.kr/@topasvga/1933



5

https://brunch.co.kr/@topasvga/1930



6

GSLB로 kubernetes와 Amazon EKS 트래픽 조절하기


https://brunch.co.kr/@topasvga/1931






돌아가기


https://brunch.co.kr/@topasvga/3938



감사합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari