brunch

You can make anything
by writing

C.S.Lewis

by Master Seo May 24. 2022

EKS 6탄-16.Kubernetes 위한 옵저버빌리티

16. Kubernetes를 위한 Observability (LG유플러스

쿠버 네티스를 위한 옵저빌리티입니다.

쿠버네티스의 모니터링을 위한 좋은 내용~



<1> 전통적인 엔터프라이즈 시스템 모니터링

<2> Observability 개념?

<3> LG 유플러스 사례




<1>  전통적인 엔터프라이즈 시스템 모니터링


PC----------F/W-----L4-----------web---------was-----------DB


모니터링?


Network = NMS

서버 = SMS

AP = APM

DB = DPM 모니터링



 <2> 디지털 트랜스포메이션?


1

기업의 비즈니스와 업무 혁신을 위해 디지털 기술을 적극적으로 적용하는 것.


2

지속적 개발 , 빠르게 배포해야 한다.

시장의 변화를 따라갈 수 없다.

작게 나눠져야 한다.

우리는  MSA라고 한다.


3

컨테이너 오케스트레이션이 필요.

쿠버 네티스가 메인이 됨


4

쿠버 네티스?

Pod , 서비스, 리플리 카세트 , 배포


5

모니터링은?


인프라와 애플리케이션 사이의 컨테이너를 오케스트레이션 한다.

영역별 모니터링 방식은 이제 아니다.

하나의 솔루션으로 모니터링이 필요하다.



<3> Observability 개념?


1

외부에 출력을 내부의 성능을 측정하는 것

동적인 시스템에 대한 모니터링.

성능 메트릭스, 트랜잭션 추적 , 로그  3가지로 모니터링한다.


2

3가지를 모니터링, 분석해야 한다.

메트릭스-성능지표

트랜잭션 추적

각종 로그(통합 로그 모니터링이 필수적이다)



<4> LG 유플러스 사례


1

목표?

서비스 분할로 민첩성 향상

가용성/확장성 증가 - 급격한 사업 변경

운영 비용 효율화 - 자동화, 오픈소스 활용


2

수단?

마이크로 서비스 아키텍처

이벤트 방식

하이브리드 클라우드 인프라 - 보안 리스크는 프라이빗에 구축 , 빠름 필요는 퍼블릭에 구축



<5> 모니터링 포인트  6가지?


인프라 환경의 변화 - 하이브리드 클라우드 모니터링

실행 환경의 변화 - 소프트웨어 모니터링

로그 변화  - 애플리케이션 통합 로깅

트래이싱의 변화 - 트랜잭션 통합 연계 추적

변경 영향 분석 - MSA 영향도 분석

사용자 체감 품질 (프런트~ 백앤드) 측정.




1

인프라 환경의 변화 - 하이브리드 클라우드 모니터링


하이브리드 환경에서  인프라부터 애플리케이션 데이터 수집은  각 리전에서 진행.

분석 및 관제는 One View로 통합으로 진행.

수집서버는 1개면  클라우드 비용 발생 , 모니터링이 분리되면 관리 공수 증가

와탭 설루션 사용.

하나의 와탭 화면에서 모니터링.



2

실행 환경의 변화 - 소프트웨어 모니터링

쿠버 네티스, 자바, 리눅스 , 데이터 베이스 , 30종 --------- 통합 모니터링 (와탭)



3

로그 변화  - 애플리케이션 통합 로깅

자동 서버 추가 등으로 로그가 추가 발생한다.


2개 로그에 대해 처리?


aceess-log는?

Fluntd Agent , Elastic Search , Kibana로 구축


application log는?

와탭 에이전트 --- 분석 설루션 ---- 관계 시스템으로 구축

 와탭 에이전트?   Weaving 기술로  소스를 수정하지 않고 원하는 로그를 넣을 수 있다.



4

트레이싱의 변화 - 트랜잭션 통합 연계 추적

와탭 트레이스 키와 결합



5

변경 영향 분석 - MSA 영향도 분석

연계추적을 통해 트레이싱을 확보함.

영향도 분석에 사용.


6

사용자 체감 품질 (프런트~ 백앤드) 측정

응답 시간 70% 이상은 프런트에서 발생

html5로 변환  =  FCP , LCP ,  TTI , Speed Index와 같이 사용자 체감 지표 측정 가능

Request 수 최소화,  JS/CSS의 크기 최소화,  Render-blocking  리소스를 축소 등 개선 작업 진행


7

Observability  확보를 위해 영역별  솔루션이 아니라,  통합된 솔루션이 필요하다!




같이 보면 좋을 자료


자동화 모니터링

https://brunch.co.kr/@topasvga/1763



https://brunch.co.kr/@topasvga/2466


https://brunch.co.kr/@topasvga/2439



https://brunch.co.kr/@topasvga/1769


https://brunch.co.kr/@topasvga/1758


감사합니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari