0. InfluxDB소개
Time-series DB는 데이터베이스 중에서도 시계열 데이터를 저장하고 활용하는데 특화된 형태의 데이터베이스입니다.
장점으로는 RDB에서 반복적으로 생성해야 하는 테이블 형태나 함수를 사전에 제공해서 좀 더 효율적으로 시계열성 데이터를 저장하고 제공하는 점을 꼽을 수 있습니다.
시계열 데이터로 어떤 것이 있을까요? 주식이나 시간대별 온도 등을 꼽을 수도 있는데, 여기에서는 CPU나 메모리 등 하드웨어 성능과 관련된 데이터를 어떻게 추출하고 저장하고 보여주는지 알아보겠습니다.
이 주제 다음은 아마 gatling을 통해 웹 서버에 부하를 주는 방법을 설명할 것 같습니다. 그때에도 이 내용을 기반으로 활용할 예정이니, 예습 차원에서도 같이 살펴보시죠.
Time-series DB에도 여러 종류가 있는데, 그중에서도 InfluxDB를 선정한 이유에서는
1. 설치가 간편하다.
2. 검색할 때 SQL 구문을 활용할 수 있다.
3. 모니터링 도구인 graphite 프로토콜을 지원한다.
입니다.
실시간 모니터링을 그래프로 보여줄 때 graphite를 사용했었는데, 설치의 복잡도와 다른 툴과의 chaining이 쉽지 않아서 좀 더 나은 대안이 있는지 살펴보다 InfluxDB를 발견했습니다.
빅데이터의 전체 big picture에서의 Influx 위치는 아래 링크를 참조하세요.
http://xyz.insightdataengineering.com/blog/pipeline_map.html
이어지는 글에서 사용할 InfluxDB 사이트는 다음을 참조하세요.
그럼, 다음에는 InfluxDB 설치부터 알아보겠습니다.
전체 목차