오랫동안 기업은 데이터 수집, 저장, 데이터 중앙 집중화에 초점을 맞춰왔다. 그러나 빅데이터 시대를 맞아 폭발적으로 늘어난 데이터는 기업들에게 새로운 과제를 안겼다.
그 결과 현재 다수의 기업들은 비용, 관리 측면을 고려하여 데이터 통합 인프라를 클라우드로 전환하고 있으며, 이에 비즈니스의 중단 없이 데이터 이관을 수행할 수 있는 CDC솔루션이 재부상하고 있다.
CDC(Change Data Capture)는 소스 데이터의 변경이 발생하면 이를 캡처하여 타깃 데이터에 반영하는 기술이다. 기업 내 데이터의 중요성이 부각되며 실시간 데이터 분석 요건이 많아지고, 기업들이 다양한 DBMS로의 전환 및 클라우드 기반의 서비스로 이동하면서 CDC 솔루션의 중요성이 커지고 있는 것이다. 그러나 기존 CDC 솔루션들은 정형 RDBMS에 특화된 솔루션이기에 비정형 데이터 수집이나 전송에 한계가 있다.
모던 CDC 솔루션의 핵심은 세 가지로 요약할 수 있다. 데이터의 실시간(real-time) 복제, 확장 가능하고 효율적이며 광범위한 데이터 소스 복제, NO 스크립팅이다.
대표적인 모던 CDC 솔루션인 Qlik Replicate는 다양한 데이터 시스템 간의 실시간 데이터 복제가 가능하다. 1) 현대적이고 효율적인 데이터 파이프라인의 기반이 되며 모든 주요 데이터 레이크, 스트리밍 시스템, 데이터베이스, 데이터 웨어하우스 및 메인프레임 시스템에서 자동화된 실시간 범용 데이터 통합을 제공한다.
데이터 원본을 최초로 타깃 시스템으로 전송하고, 그동안 실시간으로 발생하고 있는 변경 내역을 수초~수분 안에 반영할 수 있어 2) 무중단 마이그레이션이 가능하다.
가트너(Gartner) Data Integration tool 분야에서 2019 ~ 2020년 2년 연속 성장률 1등을 기록한 Qlik Replicate는 여타 솔루션과 차별화된 가치를 제공한다. 3) 데이터 소스에서 타겟으로 데이터를 순식간에 복제시키고, 엔드 투 엔드(end to end) 복제 자동화를 완벽히 지원하며 복잡하고 관리하기 어려운 스크립트 방식이 아닌 4) 그래픽 인터페이스를 통해 편리하고 쉽게 관리할 수 있다.
5) 에이전트 설치가 필요 없는 간편한 구성을 제공하며, 관리자와 데이터 아키텍트는 전사적 변경 데이터 캡처(CDC)를 통해 6) 대량 혹은 실시간 업데이트를 빠르게 설정, 제어 및 모니터링할 수 있다. 마지막으로 7) 분산 하이브리드 환경에서 데이터 복제에 대한 글로벌 가시성과 중앙 집중식 제어를 제공한다.
8) 온프레미스와 클라우드 모두에서 비용과 노력을 줄이면서도, 민첩한 분석을 필요로 하는 비즈니스에 더 많은 데이터를 제공할 수 있다.
* 연속되는 내용이 아니므로 case별로 참여하시면 됩니다.
클릭(Qlik)의 한국 총판 지티플러스(GTPlus)는 2월 10일부터 4회에 걸쳐 온라인 세미나 ‘케이스로 알아보는 모던 CDC 세미나’를 진행한다. 이번 세미나는 변화하는 데이터 환경에서 우리 회사에 꼭 맞는 데이터 관리 및 활용 전략 탐색을 위한 ‘데이터 복제 사용 케이스’로 구성했다. 소스 설정과 타깃 정의 등 데이터 전문가가 궁금해할 실전 정보로, 복잡한 데이터 환경에서 스크립팅하고 있는 데이터 관리자(DBA)에게 추천한다. 신청은 지티플러스 블로그에서 가능하다.
https://blog.naver.com/gtplus1/222625548668
https://www.itworld.co.kr/t/73374/GTPlus/223259