brunch

You can make anything
by writing

C.S.Lewis

by 신현묵 Aug 02. 2017

Infrastructure Mornitoring 출시!

2017년 8월 1일 인프라스트럭처 모니터링이 출시되었습니다.

기존 와탭의 SMS를 기반으로 서버 모니터링이 제공되었습니다. 해당 기능들을 포함한 상태에서 몇 가지 큰 장애요소를 극복하고, 새로운 개념들이 추가된 상태에서 와탭의 인프라스트럭처 모니터링이 정식적으로 2017년 8월 1일에 출시되었습니다.


무엇이 얼마나 바뀌었을까요?


첫 번째. 와탭의 SMS에서 간혹 발생되던 과도한 오탐에 대한 적극적인 해결 <- 사용자가 멀티 클라우드를 관제하고 있다면 만나게 될 문제!

두 번째. 프로세스 기반의 다양한 체크 및 알림 기능

세 번째. 사용자 기반의 Log의 키워드에 대한 추적관찰기능

네 번째. 디테일한 Alert Policy에 대한 정책관리의 다양화!

다섯 번째. 모니터링 에이전트의 초경량화!


이렇게 5가지로 축약해서 이야기 드릴 수 있습니다.


가장 먼저 설명드리면, 사용자의 클라우드와 와탭의 서비스 간의 네트워크 단절로 인한 과도한 탐지가 제거되었다는 점입니다. (기존 SMS의 가장 고질적인 문제였죠 )


이 문제는 멀티 클라우드를 사용하면 당연하게 고객들이 겪으셔야 할 문제였습니다. 현재( 2017년 7월 말 기준 ) 와탭 랩스는 1만 5천대 정도의 고객 서버에서 만들어지는 상황을 모니터링하고 있고, 대부분의 클라우드와 IDC에서 발생되는 네트워크 장애들을 직접 만나고 있습니다.


사용자가 오픈소스 기반으로 와탭과 같이 멀티 클라우드로 시스템을 관제하신 다면 이와 유사한 문제를 똑같이 경험하게 되실 것이지만, 와탭 랩스는 이러한 경험을 이번  Infrastructure Mornitoring에서 깔끔하게 문제를 해결하였습니다. 


DownChecker 기능을 사용하면 멀티클라우드에서 발생되는 네트워크 가용성에서 만들어지는 과도한 오류 탐지기능을 제거할 수 있으며, 간혹 전송되던 '서버 장애'인것처럼 보이지만, 사실상 네트워크 장애였던 상황( 그것도.. 와탭의 클라우드 환경와 사용자 클라우드 환경상의 네트워크 장애..)으로 사용자의 서비스에는 실제 아무런 영향이 없었던 상황이었죠.


대부분의 사용자들은 멀티 클라우드가 아니시니까요. 하여간, 과도한 네트워크 과탐은 사라집니다.!


5번째 변화인 Agent의 초경량화에 대해서 설명드리는 것이 우선인 듯합니다.


오픈소스나 상용화된 서버 모니터링 제품들이 생각보다 무겁다는 것을 대부분의 사용자들은 모르고 계시는 경우가 많습니다. 유명한 국내 APM 제품의 CPU 사용량은 엄청나게 사용되며, 단순한 서버 모니터링 제품들도 그 규모가 생각보다 심하게 가동됩니다. ( CPU를 10% 넘게 사용한다고 보고된 제품도 있습니다. )


와탭 랩스는 에이전트들은 go로 정말 새롭게 제작되었으며, 실제 사이즈나 서비스의 용량은 극이 최소로 사용되고 있습니다. 실제로, 그전의 SMS 제품에서 발생되던 CPU의 사용량을 최소로 줄였습니다.


위의 그림을 보시면, 와탭의 새로운 인프라스트럭처의 CPU 사용량을 0.13 정도로 최소만 사용되고 있습니다. 다른 어떤 서버 모니터링과 비교해도 월등한 수치입니다. APM의 CPU 사용량도 대략 비슷합니다. 정말 최소로 전체 서비스를 모니터링할 수 있습니다.


와탭이 가장 신경쓰는 부분이기도 하며, 에이전트는 계속 버전 업그레이드를 진행합니다. 언제나, 와탭의 에이전트를 업그레이드 하세요.


나머지 부분들을 소개해드리겠습니다.


두 번째로 설명한 프로세스 기반의 다양한 체크 및 알림 기능


아래 그림에 쉽게 설명드리겠습니다.

해당 프로세스가 최소, 최대 숫자에 맞추어 경고를 하거나, 관리가 가능하도록 디자인되었습니다. 꼭 필수적으로 가동되어야 하는 프로세스나, 과다하게 프로세스가 증가하는 것을 추적하는 것을 관리할 수 있으며, 이 방식은 CPU와 Memory에서도 동일하게 제공됩니다.


Cloud의 경우에 해당 기능을 이용하여 클라우드의 VM숫자를 증가하거나 줄이는데 활용할 수 있습니다. AWS의 스케일 아웃과 같은 효과를 허접한 다른 클라우드에서 활용하시거나, 좀 더 세밀하게 조정하는데 매우 유용한 기능들입니다.


매일 밤 필수적으로 동작되는 배치작업들이나 크론탭 작업들의 관리에도 유용하죠.



세 번째로 설명한 사용자 기반의 Log의 키워드에 대한 추적관찰기능


서버의 특정 영역에 만들어지는 Log 화일에서 특정 키워드가 발생되는 상황에 대해서 추적하거나, 그 연관된 모니터링을 확장할 수 있는 기능을 제공합니다.

프로그래머가 만들어 놓은 룰이나, 특정 오류 상황에 대한 대처 등에 대해서 빠르게 대응할 수 있도록 자동화가 가능합니다.


정말 많은 운영자분들이 원하시던 기능이며, 개발자와 의사소통만 되신다면 정말 세밀한 운영이 가능합니다.



네 번째로 설명한 디테일한 Alert Policy에 대한 정책관리의 다양화!


그 이외에도 다양한 관리 룰에 대해서 최소, 최대에 대한 임계치에 대해서 운영자들이 매우 효과적으로 대응할 수 있습니다. 각각의 리소스의 증가와 축소에 대응하여 클라우드에서의 효과적인 운영 대응이 가능한 형태들을 제공합니다.


와탭 랩스의 인프라스트럭처의 경량화된 서버 리소스를 기반으로, 다양하고 강력한 기능들을 갖추고 있으면서도 오픈소스보다 더 싸게 지원이 가능하다는 것을 이야기드리고 싶습니다.


특히, SaaS 형태로 서비스를 제공받는다면, 수집서버의 관리를 위한 ELS스택도 필요하지 않다는 것이며, 별도의 VM비용으로 대부분의 모니터링 서비스 기능을 제공받을 수 있죠.


'오픈소스 보다 싸고 빠르게' 


와탭이 고객에게 드리는 가치입니다.

http://whatap.io


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari