100년 전 광부들이 사용하던 '위험'을 피하는 방법
Canary in a CoalMine
오래전 탄광에는 특별한 환기시설이 없었다. 광부들은 지하 깊숙한 곳에서 발생되는 독가스나 유독가스에 대해서 언제나 위험을 감수해야 했다.
과학이 발전한 후에야 파악된 것이지만. 과거의 광부들은 카나리아를 새장에 넣어 작업장에 데리고 들어갔다. 카나리아의 짹짹거리는 소리는 광부들의 마음을 편하게 하는 효과도 있었지만, 유해가스에 민감한 카나리아가 노래를 멈추게 되면, 광부들은 위험한 상황을 인식하고 탄광 밖으로 탈출했다.
카나리아는 메탄이나 일산화탄소에 매우 민감하고, 가스에 노출이 조금만 오래되어도 카나리아는 죽는다.
20세기에 들어서 독가스 검출 기술이 발전한 이후에도 이 카나리아를 사용하는 방법은 사용되었다고 한다.
와탭이 추구하는 모니터링은
이런 카나리아 분석에 매우 적합하게 디자인되어있다.
IT서비스의 빠른 장애 대응을 위해서 지표 중심의 테스트 운용환경을 준비하고, 이곳에 먼저 배포 운용을 한 다음, 실 서버에 배포하는 방법을 많이 사용한다.
실 운영환경에서 발생되는 환경과 유사한 환경을 만들면 HTTP의 상태와 response time 등의 200여 개의 지표들을 유사하게 모니터링할 수 있다. ( 사용자의 실제 운용은 아니지만, 유추할 수 있는 테스팅 운용환경을 복합적으로 사용할 수 있다. )
물론, 지표 기반의 카나리아 분석기법은 해외의 N사나 D사도 가능하며, 이런 케이스로 배포 운용 환경과 동일하게 만들어서 사용하는 방법은 국내 스타트업이나 대기업에서도 상당히 많은 케이스를 찾을 수 있다.
와탭은 기존 업체들과 다른 추가적인 접근법을 제공한다.
기본적인 성능지표 이외에도 Top-stack과 Active-stack(와탭 특허) 기법을 활용하는 와탭의 웹서비스 모니터링은 '통계적'기법을 이용하여 문제가 발생되는 트랜잭션과 성능과의 상관관계를 메서드 레벨로 추적한다.
쉽게 이야기하면 사용자의 접근방법에 따른 웹 트랜잭션에서 메서드 레벨의 성능 관련된 상관관계를 시계열로 추적하여 성능 문제나 장애가 발생하는 부분을 빠르게 추적한다.
이 Active Stack(특허) 기술을 사용하여 프로파일링과 시계열적인 분석을 통해서 실제 배포가 되지 않더라도 문제를 최대한 빠르게 접근할 수 있다. 기존에 다른 APM들이 접근하던 방법과는 완전 다른 방법이다.
http://tech.whatap.io/2017/03/23/casestudy_mobilebanking/
실 사례로 제시되는 A은행의 케이스도 실제 운영 배포 상황에서 문제를 진단하고 추적한 것이 아니라, 개발서버에서 이 문제를 찾은 것이다. 이 와 다른 사례로 B통신사의 장기간 해결 못한 문제를 해결한 케이스도 있다.
와탭 모니터링은 '카나리아 분석'환경에 대해서 현존하는 그 어떤 모니터링보다 가장 촘촘한 방법으로 그 형태를 제공합니다.
물론, 최저의 가격과 SaaS의 장점인 원격 성능 진단 서비스까지 제공하는 강력한 와탭의 성능 모니터링은 개발자들의 IT서비스를 더욱 굳건하게 할 것이다.
와탭, 모니터링 서비스를 사용하면, 아주 쉽게 카나리아 분석법 기반의 배포전 환경 구축이 수월해집니다.