이중화 기준
복구 절차
이미지 출처: 네이버 클라우드 서밋
<1> 네이버는 어떻게 복구했을까요?
<2> 네이버 구성
<1> 네이버는 어떻게 복구했을까요?
1
각 SIM들이 각자 담당한 서비수 중 판교 IDC에 운영 중인 담당 서비스를 리스트업
개발팀과 커뮤니케이션하면서 서비스별 상황을 파악
이미지 출처: 네이버 클라우드 서밋
2
서비스에 어떤 이슈가 발생했는지?
개발팀에서 배포로 대응 가능한지?
인프라에서 대응해야 하는지?
이슈가 되는 기능 복구를 위해 어느 정도 시간이 걸리는지?
해당 데이터센터에서 사용하지 않는 경우도 해당 데이터 센터의 API를 호출해 서비스하는 경우 특정 기능에 문제가 발생하기도 함.
3
다른 IDC에 서버 증설 및 이전을 진행했다.
<2> 네이버 구성
1
네트워크 CSLB?
네이버 클라우드의 L4 아키텍처
Load Balanver IP 이전가능
위치 제약 없이 단일 VIP를 Active-Active 형태로 Anycast 서비스가 가능하다.
2
서버 nFront?
nFront는 네이버의 SSL offloading 플랫폼.
기존에는 웹 애플리케이셔마다 SSL 인증서를 별도 설정하고, 갱신 주기마다 추가 작업 하였으나, nFront에서는 일괄 처리한다.
nFront에서 서비스 전면에서 클라이언트의 SSL연결을 대행해 주고, WEB WAS 사설망에서는 HTTP통신을 수행한다.
nFront는 IDC장애, 공격성 트래픽 방어, 요청량 급증에 대응이 된다.
// SSL 부하를 앞단에 서버를 추가로 두어 해당 서버에서 처리하므로, 뒷단 서버에서 부하가 적어진다.
3
서버?
서버 구성 자동화 플랫폼 = BMC 관리 플랫폼 + 서버 구성 관리 플랫폼
BMC 관리 플랫폼
랙마운트, 네트워크 케이플포설, 바이어스 설치, 전원 on/off 작업이 필요함. BMC(Baseboard management Controller) 기반의 IMPI를 이용 메인보드, 주변 HW상태 모니터링, 원격 전원 on/off , 원격 BIOS설정 및 펌웨어 업데이트, 원격 콘솔 접속 등이 가능하다.
원격에서 서버를 관리할 수 있고, 대규모 제어도 수행 가능하다.
서버 구성 관리 플랫폼
서버 OS, 소프트웨어 관리는 PXE 기반의 Kickstart Engine을 사용하는 OS설치 자동화 시스템. 네트워크를 통한 표준 OS설치, 다양한 서버 하드웨어 지원, 대구모 구성 및 설치 가능
4
DB?
MySQL DBMS 이중화 기술로 DNS MMM사용 중
기존 VIP 기반의 DB이중화는 , 특정 IDC의 MYSQL 서버가 다운되면 IDC 간 자동 Fail-over가 불가능.
DNS MMM 사용하여, 한쪽 IDC의 DBMS접근이 불가능해지더라도, 다른 IDC의 DBMS에서 연속된 서비스를 제공한다.
네이버에서만 사용하는 것으로 nBase-T라는 DBMS.
Mysql 위에 올려 사용하고 있음.
5
Global PoP내 DNS인프라를 구성.
특정 PoP장애 시 자동 절체를 통해 서비스 연속성을 즉시 보장한다.
6
GSLB는 DNS기반으로 네트워크 트래픽을 로드밸런싱할 수 있는 설루션.
7
SIM (Service Infra Manager)?
인프라설계, 제공 및 성능관리, 이슈 대응 컨트롤 타워, 인프라 비용 관리, 예비 인프라 확보., 성능 및 SPOF 점검.
인프라 예산 수립, 저사용 서버 최소화, 서버 컨솔리데이션 작업 관리등으로 비용 효율화.
다음은
https://brunch.co.kr/@topasvga/2951
감사합니다.