6탄-2. 현재의 문제부터 다가올 미래의 문제까지

02. 현재의 문제부터 다가올 미래의 문제까지, DevOpsGuru 활용

by Master Seo

Jul 22. 2022

<1> DEVOPS 란?

<2> AWS 모니터링 도구?

<3> AWS 관찰 가능성 도구?

<4> Amazon DevOps Guru는 장애 복구 시간을 줄여주는 완전 관리형 기계 학습 기반 서비스

<5> Amazon DevOps Guru 작동원리

<6> Amazon DevOps Guru for RDS로 데이터 베이스에 대한 분석도 가능하다.

<1> DEVOPS 란?

기업은 고품질 소프트웨어를 빠르고 안정적으로 제공을 목적으로 한다.

데브옵스 자동화를 통해 신속한 소프트웨어 제공

데브옵스의 범위?

CI/CD

식별 가능성 (Observability)

인프라의 코드화

소스 관리

복원력과 보안

식별 가능성(Observability)?

모니터링은 시스템의 상태 측정

식별 가능성은 내부 상태 추론

시스템이 왜 작동하지 않는지에 대해서 이해할 수 있다.

이슈 타임라인?

탐지 - 식별 - 수정 - 검증 4단계

탐지 시간 - MTTD

식별 시간 - MTTI , 이슈 세부 정보 인지

탐지, 식별 + 수정시간 , 검증 시간 = MTTR (resolve)

MTTD, MMTI 시간을 줄이자

데이터 기반의 의사 결정?

로그

메트릭

트레이스

<2> AWS 모니터링 도구?

로그?

Amazon CloudWatch 에이전트로 클라우드 온프라미스 수집한다.

로그 인 사인트로 분석한다.

CloudWatch logs 사용

메트릭?

Amazon CloudWatch 에이전트로 수집

메트릭 수식으로 분석.

Cloudwatch Metrics 사용

트레이스?

AWS X-Ray 에이전트

X-Ray 에널리틱스로 분석한다.

X-Ray Traces 사용한다. 근본 원인 확인한다.

<3> AWS 관찰 가능성 도구?

도구

Container Insights - 컨테이너 모니 터링

X-Ray Insights - 비정상적인 디텍트 사용하여 문제를 자동으로 식별하고 사용자에게 알림

Lambda Insight - 람다 성능 및 상태 메트릭에 대한 인사이트

Contributor Insights: CloudWatch 로그에서 시계열 데이터 생성 , 가장 부하가 큰 트래픽 패턴을 찾는다.

Metrics Explorer - 리소스 태그를 기반으로 하는 동적 대시보드

ServiceLens : 로그 , 메트릭 및 추적의 상관관계를 쉽게 연결하여 서비스 병목 현상을 신속하게 식별, 각 애플리케이션과 데이터들의 상관관계를 시작화 한다.

Synthetics : 웹 사이트 및 엔드포인트에서 실제 사용자 모니터링 수행, 주기적인 인공 신호를 보내 사용자 인지 전에 모니터링.

탐지- 식별 - 수정 - 검증 4단계

탐지에서 해결?

Synthetics 경고

X-Ray Insights 알림

식별에서 해결?

ServiceLens를 사용하여 로그, 메트릭, 트레이스 데이터의 상관관계를 지정할 수 있다.

로그

메트릭

트레이스

Correlation (상관관계)

서비스가 늘어나면?

모니터링과 관찰 가능성 도구의 많은 부분을 자동화해야 한다.

올바른 방법을 찾아야 하며 계속 확인해야 한다.

이 부분 해결을 위해 Amazon DevOps Guru 가 개발되었다.

<4> Amazon DevOps Guru는 장애 복구 시간을 줄여주는 완전 관리형 기계 학습 기반 서비스

애플리케이션을 모니터링하여, 가용성을 자동으로 개선하고, MTTR을 줄이는 완전 관리형 기계 학습 기반 서비스이다.

Amazon CloudWatch , AWS x-ray , CloudTrail 등으로 수집한 데이터를 기반으로

기계 학습을 기반으로 이슈 발생에 따른 데이터들을 연관하고 누락되거나 잘못 구성된 경보 , 리소스 고갈에 대한 조기 경보,

서비스 중단으로 이어질 수 있는 코드 및 구성 변경과 같은 운영 문제를 자동으로 감지할 수 있다.

Amazon DevOps Guru 기계 학습 모델

운영 문제를 확인하고 디버깅하는 시간을 줄인다.

애플리케이션을 효과적으로 모니터링한다.

Amazon DevOps Guru 특징?

사용이 쉽다 - 콘솔에서 스택 또는 계정 감지 체크만 해놓으면 별다른 구성 없이 바로 기계학습을 활용한 데이터 분석을 시작할 수 있다.

운영 문제 자동으로 감지 - 서로 다른 데이터 및 메트릭의 스트림을 지속적으로 분석하여 애플리케이션의 동작을 결정한다.

인사이트 및 권장사항을 제공하여 문제를 신속하게 해결하는데 도움을 준다.

새로운 워크로드가 추가되더라도 별다른 설정 없이 쉽게 확장하고 유지한다.

경보 피로를 감소시킬 수 있다.

경보가 그룹화되어 불필요한 경보를 줄여준다.

<5> Amazon DevOps Guru 작동원리

CloudWatch 메트릭 모니터링

기계 학습을 통한 이상 징후 감지

이벤트와 연계