brunch

You can make anything
by writing

C.S.Lewis

by 이동인 Feb 10. 2018

클라우드와 인프라 아웃소싱.

IT 모니터링

IT 인프라스트럭쳐가 클라우드로 전환되면서 많은 변화를 겪고 있습니다. 변화의 범위는 서비스 아키텍쳐의 변화에서 IT 운영 조직과 개발 조직의 변화, 개발 및 운영 프로세스의 변화까지 너무 광범위하기 때문에 최근 엔터프라이즈의 CTO 조직은 새로운 변화에 맞추기 위해 전쟁에 가까운 노력을 기울이고 있기도 합니다. 


클라우드는 인프라의 아웃소싱화

클라우드는 인프라를 서비스로 제공하는 것이기 때문에 기업의 입장에서 클라우드 전환이라는 것은 인프라의 운영이 직접 운영에서 아웃소싱으로 전환된다는 것입니다. 이것은 기업에게 매우 큰 변화입니다. IT 기업에게 인프라의 안정적인 운영은 핵심 업무였습니다. 하지만 인프라가 클라우드로 전환되면서 인프라 운영의 책임이 클라우드 벤더와 클라우드 메니지드 서비스 업체로 이관되고 있습니다. 그리고 기업의 서비스 운영팀은 인프라 관점의 운영에서 서비스 관점의 운영으로 포지셔닝 되고 있습니다.


인프라 아웃소싱으로 인한 서비스 관리 이슈

클라우드는 기업이 인프라와 인프라 운영조직을 아웃소싱 하는 것이라고 이야기 했습니다. 서비스에 장애가 나타나면 IT 운영팀이 가장 먼저 확인 하는 것이 인프라의 문제인지 어플리케이션의 문제인지 확인하는 것입니다. 이 문제를 확인하는 과정에서 인프라조직이 아웃소싱되어 있기 때문에 클라우드 벤더가 적극적으로 도움을 주지 않는다면 인프라는 블랙박스와 같은 상황이 되어 버립니다. 클라우드 벤더에 있는 엔지니어들은 기업의 엔지니어들보다 더욱 전문적인 지식과 많은 경험을 가지고 있습니다. 하지만 도메인에 밀접한 이슈 또는 어플리케이션과의 관계에서 문제가 발생하는 경우에 서비스 장애의 시작점을 모른다면 클라우드 벤더의 우수한 엔지니어들도 도움을 주지 못하게 됩니다. 그래서 어플리케이션 관점에서 인프라까지 살펴보는 모니터링이 클라우드에서 더욱 중요하게 됩니다. 


블랙박스를 투명하게 만드는 모니터링

이런 이유로 최근 클라우드는 사용하는 대다수의 기업들이 Performance Monitoring을 기본 모니터링으로 도입하고 있습니다. 클라우드를 사용하는 기업들이 Infrastructure Monitoring 보다도 Performance Monitoring을 더 많이 사용하는 이유는 클라우드의 인프라와 자사의 서비스의 연결 관계를 추적할 수 있기 때문입니다. 예를 들어 EC2에 올라간 서비스가 느려지는 현상이 발생했을 경우 아마존에 문의를 하면 아마존에서는 CPU, Memory, Disk 정보를 확인하고 문제가 없다면 애플리케이션 이슈로 판단하고 애플리케이션을 수정할 것을 권고합니다. 하지만 Performance Monitoring을 사용한다면 DB 커넥팅 또는 네트웍 연결에 관련되 처리 상황을 확인할 수 있습니다. 만일 네트웍 연결에 관한 메소드가 오래 걸린다는 것을 안다면 해당 내역을 기반으로 지정된 네트웍 경로에 관해 아마존의 담당자와 다시 논의 할 수 있습니다. 


https://stackshare.io/stacks#! 북미 기업들이 사용하는 솔루션 확인하기

북미 Performance Monitoring 도입 기업

스택쉐어를 통해서 Performance Monitoring 도입 기업들을 확인할 수 있습니다. 스택쉐어에 등록된 New Relic 사용 고객이 3천개가 넘는 것을 확인할 수 있습니다. 

최근 Infrastructure에서 Performance Monitoring으로 서비스를 확장한 DataDog을 사용한다고 공개한 기업도 400개가 넘습니다. 페이스북과 인텔같은 큰 기업들도 보입니다.

또 하나의 특징은 북미의 많은 기업들이 하나가 아닌 복수의 Perforamance Monitoring 서비스를 사용한다는 것입니다. 국내에는 제가 다니는 와탭랩스가 있습니다. 국내 Performance Monitoring은 실시간으로 데이터를 보여주고 문제 해결 과정에서 사용자의 의도가 반영된다는 특징을 가지고 있습니다. 이런 부분들은 국내 기업 문화가 반영된 것으로 한국 Performance Monitoring 시장의 95%를 국내 솔루션이 점유하고 있습니다. 


결론

클라우드는 자사의 인프라를 전문성 높은 인프라 운영조직에 아웃소싱 하는 것입니다. 클라우드는 통계적 관점에서 더욱 안정적인 인프라의 운영 보장합니다. 하지만 아웃소싱이 가진 한계 또한 엄연히 존재합니다. 클라우드 벤더는 기업의 장애를 보편적인 시각에서 대응 할 수 밖에 없기 때문에 자사 서비스 특성에 따른 장애가 발생할 경우 많은 어려움을 겪습니다. 이런 문제를 해결하는 방법으로 Performance Monitoring은 클라우드 서비스 운영에 있어 매우 중요한 서비스 입니다. 클라우드 서비스를 사용하고 있고 아직 Performance Monitoring을 사용하지 않는다면 도입을 고민해야 합니다. 특히 해외 또는 국내 SaaS 기반의 서비스들은 (NewRelic, DataDog, WhaTap) 모두 무료 사용기간을 제공하기 때문에 부담없이 테스트가 가능하고 운영에 사용해볼수 있습니다. 



 




매거진의 이전글 클라우드와 운영자의 불안함.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari