brunch

You can make anything
by writing

C.S.Lewis

by 김도환 Dec 11. 2024

실시간 데이터 스트리밍:챗봇으로 사내 데이터 추출하기


기업의 데이터 활용 길잡이, 디피니트입니다.  


오늘은 실시간 데이터 스트리밍에 대한 이해와
챗봇으로 사내 데이터를 추출하는 방법을 알아볼게요!



오늘의 목차입니다.






01. 기업 시스템 데이터 추출 방법과 단점




기업 내부 시스템의 데이터를 추출하는 방법은 다양합니다.



원하는 데이터를 추출하기위해, 전통적으로 데이터베이스 관리자(DBA)에게 요청하여 데이터를 추출합니다.


최근에는 데이터 리터러시의 중요성이 부각되면서, 사내 구성원들이 직접 SQL을 학습하여 데이터를 추출하거나, 파이썬과 같은 프로그래밍 언어를 활용한 데이터 처리 기법이 각광받고 있습니다. 


이는 데이터 기반 의사결정의 민첩성을 높이는 데 기여하고 있습니다.


또한, ETL(추출, 변환, 로드) 도구나 BI(비즈니스 인텔리전스) 플랫폼과 같은 전문 솔루션을 도입하여 데이터 추출 및 분석 프로세스를 자동화하는 추세도 두드러지고 있습니다.


이 중에서 DBA에게 의존하는 전통적인 데이터 추출 방식은 여러 한계점을 노출하고 있습니다. 


기업 환경에서 데이터베이스 관리자(DBA)에게 데이터 추출을 요청할 때, 

다음과 같은 주요 도전 과제들이 자주 발생합니다.



1) DBA가 데이터 추출 요청을 즉시 처리하지 못함

DBA의 업무 우선순위와 다른 업무로 인해, 데이터 추출 요청에 대한 즉각적인 대응이 지연될 수 있습니다. 이는 비즈니스 의사결정의 적시성을 저해할 수 있는 요인이 됩니다.


2) 특정 데이터 추출 시 많은 소요 시간 

데이터베이스 스키마의 복잡성이나 대용량 데이터 처리 필요성으로 인해, 특정 데이터 추출에 상당한 시간이 소요될 수 있습니다. 이는 실시간 데이터 분석 요구를 충족시키기 어렵게 만듭니다.


3) 추출한 데이터의 일관성이 떨어지는 경우

다중 시스템에서의 데이터 추출 시 발생할 수 있는 불일치나, DBA의 전문성 부족으로 인한 데이터의 품질 저하는 분석 결과의 신뢰성에 심각한 영향을 미칠 수 있습니다. 이는 데이터 거버넌스의 중요성을 부각시키는 요인이 됩니다.



이러한 문제들은 기업의 데이터 중심 의사결정 프로세스의 효율성과 정확성을 저해할 수 있으며, 

보다 체계적이고 자동화된 데이터 관리 및 추출 시스템의 필요성을 강조합니다.






02. 챗봇, 실시간 데이터 스트리밍의 핵심


위에서 정리한 전통적인 데이터 추출 방식의 불편함을 해결하기 위해 챗봇 도입이 해결책이 될 수 있습니다.



챗봇을 통한 실시간 데이터 스트리밍은 
사용자와 시스템 간의 즉각적이고 연속적인
데이터 교환을 가능하게 하기 때문입니다.



[ 실시간 데이터 스트리밍이란? ]

 다양한 소스에서 생성되는 데이터를 연속적이고 즉각적으로 처리, 활용하는 기술로, 시작과 끝이 없는 데이터 흐름을 실시간으로 분석하고 활용하는 것을 의미합니다.




Q. 그럼 기업에서 챗봇을 통해 실시간 데이터 스트리밍 환경을 어떻게 구축할까요?



1) 사용중인 시스템 속 데이터베이스 정리

: ERP, MES, HR 등 다양한 시스템 속 데이터베이스를 정리하여 데이터를 체계적으로 관리하고 최적화합니다.  중복된 데이터를 제거하고 데이터의 일관성을 유지하여 효율적인 처리를 가능하게 합니다. 이를 통해 데이터의 정확성과 신뢰성을 확보하고, 사용자 접근을 용이하게 하며, 전체적인 데이터 관리 비용을 줄이는 데 기여합니다.


2) 챗봇과 데이터베이스를 연동

: 다양한 시스템 속 정리된 데이터베이스와 챗봇 시스템을 연동합니다. 이를 위해, API 개발하거나 데이터베이스 연결을 설정합니다.



3) 챗봇을 활용한 데이터 추출 및 업데이트

사용자의 요청에 따라 데이터베이스에서 필요한 정보를 추출합니다. 여기서 TEXT TO SQL 기술이 활용됩니다. 사용자가 질문한 문장을 SQL로 변환해 데이터를 찾아주는 기술입니다.

반대로, 챗봇을 통해 실시간으로 데이터베이스에 새로운 데이터를 저장하여 지속적으로 정보를 업데이트할 수 있습니다.







이러한 솔루션을 디피니트는 다비스라는 이름으로 기업에 제공하고 있습니다.


자연어 기반으로 실시간 데이터를 손쉽게 추출할 수 있으며, 스프레드시트와 챠트로 데이터를 정리해 제공합니다.


특히, ERP와 MES 데이터를 통합으로 추출할 수 있다는 것이 장점입니다.


비정형 데이터인 텍스트 기반의 정보도 손쉽게 추출할 수 있습니다.


이렇게 디피니트는 기업의 실시간 데이터 스트리밍 환경을 구축해드리고 있습니다.



오늘은 실시간 데이터 스트리밍에 대한 이해와 챗봇으로 사내 데이터를 추출하는 방법을 알아보았습니다. 앞으로 SQL을 배울 필요 없이 손쉽게 챗봇과 대화를 통해 원하는 데이터 분석이 더욱 손쉬워질 것입니다.


디피니트의 다비스가 궁금하신 분들은 아래 링크를 클릭해 확인해주세요.


감사합니다.


https://dfinite.ai/


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari