InfluxDB로 알아보는 time-series DB

0. InfluxDB소개

Jan 2. 2016

Time-series DB는 데이터베이스 중에서도 시계열 데이터를 저장하고 활용하는데 특화된 형태의 데이터베이스입니다.

장점으로는 RDB에서 반복적으로 생성해야 하는 테이블 형태나 함수를 사전에 제공해서 좀 더 효율적으로 시계열성 데이터를 저장하고 제공하는 점을 꼽을 수 있습니다.

시계열 데이터로 어떤 것이 있을까요? 주식이나 시간대별 온도 등을 꼽을 수도 있는데, 여기에서는 CPU나 메모리 등 하드웨어 성능과 관련된 데이터를 어떻게 추출하고 저장하고 보여주는지 알아보겠습니다.

이 주제 다음은 아마 gatling을 통해 웹 서버에 부하를 주는 방법을 설명할 것 같습니다. 그때에도 이 내용을 기반으로 활용할 예정이니, 예습 차원에서도 같이 살펴보시죠.

Time-series DB에도 여러 종류가 있는데, 그중에서도 InfluxDB를 선정한 이유에서는

1. 설치가 간편하다.

2. 검색할 때 SQL 구문을 활용할 수 있다.

3. 모니터링 도구인 graphite 프로토콜을 지원한다.

입니다.

실시간 모니터링을 그래프로 보여줄 때 graphite를 사용했었는데, 설치의 복잡도와 다른 툴과의 chaining이 쉽지 않아서 좀 더 나은 대안이 있는지 살펴보다 InfluxDB를 발견했습니다.

InfluxDB를 기반으로 구성한 전체적 조감도 입니다.

빅데이터의 전체 big picture에서의 Influx 위치는 아래 링크를 참조하세요.

http://xyz.insightdataengineering.com/blog/pipeline_map.html

우측 하단에 보면 Time Series DB에서 InfluxDB를 찾을 수 있습니다.

이어지는 글에서 사용할 InfluxDB 사이트는 다음을 참조하세요.

InfluxData is based on the TICK stack, the first open source platform for managing IoT time-series d

https://influxdata.com/

그럼, 다음에는 InfluxDB 설치부터 알아보겠습니다.

전체 목차