네이버 인프라 운영 7년의 대규모 인프라 운영 경험을 공유합니다.
12가지 운영 노하우입니다.
중소기업에서는 어떻게 하면 좋을지 저만의 의견도 적어봅니다.
<1> 가상서버는 OS,WEB/WAS,어플리케이션,DB설치된 이미지를 준비하라.
<2> 네트워크장비 L4를 이용하여 디폴트 이중화 하라.
<3> L7 Check설정을 통해 WAS,DB장애까지 모니터링하라.
<4> 웹 Cache등 기술플랫폼을 적용하라.
<5> CDN을 활용하라~
<1> 가상서버는 OS,WEB/WAS,어플리케이션,DB설치된 이미지를 준비하라.
1
문제점
OS설치후, WEB/WAS설치, 어플리케이션 설치,DB설치등에 시간이 많이 걸린다.
이벤트등이 생기면 20대 정도 늘려야하는데 시간이 부족하다.
2
해결방안
OS,WEB/WAS,어플리케이션,DB를 한서버에 설치하고 그 이미지를 만들어두고 재사용한다.
3
성과
해당 이미지는 보안점검도 미리 받아 , 나중에 따로 보안점검을 받는데 시간을 낭비하지 않도록 한다.
표준OS와 표준WEB/WAS, 설치위치등 사전에 표준이 정해져있어야한다.
이미지 관리가 필수이다.
4
중소기업에서는 설치가 많지 않으므로 그냥 OS설치, 스크립트를 이용한 보안 패치를 차이는 없다^^
<2> 네트워크장비 L4를 이용하여 디폴트 이중화 하라.
1
문제점
서버 1대로 운영중 서버 장애시 서비스가 중지됨
2
해결방안
서버는 2대이상으로 구축하고, 네트워크 L4장비를 이용해 서비스를 이중화 하라.
서버는 24시간 켜놓는 장비라 언제든 고장 날수 있다.
1대 고장이 난다고 서비스가 중지되면 안된다.
3
클라우드의 L4기능을 이용하여 저렴한 비용으로 사용하면 된다.(자동 Fail-over됨)
AWS L4기능 제공하는 Route53 https://brunch.co.kr/@topasvga/28
MS에저,구글Cloud,알리Cloud L4기능은 확인해보고 별도 업데이트하겠다^^
<3> L7 Check설정을 통해 WAS,DB장애까지 모니터링하라.
1
문제점
L4를 쓰더라도 WAS장애시 Fail-over가 되지 않는다.
2
해결방안
L7 Check설정으로 WAS,DB오동작까지 모니터링하여 Fail-over를 한다.
L4에서 WEB서버 장애는 잘 모니터링 되고 Fail-over가 되지만, WAS 안된다.
L7 Check 설정을 통해 해결을 한다.
WEB에서 WAS를 모니터링하는 부분을 만들어 L4에서 모니터링한다.
L4가 L7 Check를 지원해야 하며, L4장비 부하가 늘어나므로 장비 성능고려를 반영해야 한다.
<4> 웹 Cache등 기술플랫폼을 적용하라.
1
문제점
이벤트등으로 급격히 트래픽이 늘어나는경우
웹서버 부하가 늘어나 서비스지연이 발생한다.
2
해결방안
Web과 Was사이에 Cache기술플랫폼을 적용하여 부하를 감소시킨다.
적용사례: 네이버에서 대선사이트 운영시 Varnish 적용 http://d2.naver.com/helloworld/352076
<5> CDN을 활용하라~
1
문제점
사용자가 컨텐츠를 빠르게 받지 못한다.
2
해결방안
CDN서비스를 이용해 사용자가
가까운 네트워크에서 컨턴츠를 받도록 한다.
CDN 운영기술 https://brunch.co.kr/@topasvga/9
아키텍처 공부
https://brunch.co.kr/@topasvga/73
감사합니다.