brunch

문서검색 AI, 비용 걱정없이 구축하는 방법은?

by 김도환

안녕하세요.


기업의 문서와 지식을 통합해드리는 AI 전문가 집단, 디피니트입니다.


최근 많은 기업들이 문서검색 AI 도입을 고려하고 있습니다. 그만큼 업무 효율성 향상과 지식 관리의 중요성이 커지고 있다는 뜻입니다. 하지만 새로운 기술 도입에는 항상 고민이 따르기 마련입니다.


"문서검색 AI를 꼭 도입해야 할까요?"
"우리 회사 문서를 AI가 제대로 찾아 줄까요?"
"문서검색 AI, 정말 보안은 괜찮을까요?"
"도입 비용은 얼마나 들까요?"




그래서 이번 포스팅에서는 문서검색 AI에 대한 여러분의 궁금증을 풀어드리고, 도입을 고민 중인 기업들에게 실질적인 도움이 될 수 있는 정보를 제공하고자 합니다.


문서검색 AI 도입의 필요성과 중요한 핵심 기술, 비용부담 없이 구축할 수 있는 방법을 자세히 살펴보겠습니다.




001.png



오늘의 목차입니다.


002.png


먼저 문서검색 AI를 도입해야 하는 핵심적인 이유는 다음과 같습니다.


기업의 진정한 경쟁력은 축적된 지식과 경험에서 나옵니다. 하지만 많은 기업들이 이 귀중한 자산을 제대로 활용하지 못하고 있습니다. 수많은 문서 속에 숨겨진 통찰력 있는 정보들이 사장되고 있는 것이죠. 문서검색 AI는 이런 문제를 해결할 수 있는 강력한 도구입니다.


다시말해, 직원 개개인이 가진 노하우와 경험을 조직 전체의 자산으로 만들어주는 것이며 기업의 지식 관리 체계를 근본적으로 개선하는 전략적 선택입니다.


그럼 이렇게 중요한 문서검색 AI 솔루션, 어떤 기술력이 중요한지 살펴볼게요.




01. 문서검색 AI, 가장 중요한 기술력은?


문서검색 AI 솔루션은 AI 관련 고난이도 기술력을 기반으로 개발된 IT제품입니다.

기업의 지식과 문서를 자산화하는데 중요한 AI 기술은 무엇인지 디피니트의 다비스 챗봇을 기반으로 살펴보겠습니다.

003.png


디피니트는 다비스라는 기업 문서 검색 AI 챗봇을 개발하였습니다.

재생버튼을 클릭해 문서 검색 시연을 확인해주세요.



다비스 챗봇은 최첨단 AI 기술의 집약체로,

sLLM(특화 대규모 언어 모델)과 RAG(검색 증강 생성) 기술을 기반으로 구축되었습니다.


스크린샷 2025-02-20 오후 1.34.49.png

1) 응답 시간 단축을 위한 모델 경량화

: 다비스 챗봇은 sLLM(특화 소형 언어 모델) 기술을 활용하여 모델 경량화를 실현했습니다. 이는 특정 분야나 기업에 맞춤화된 작은 AI 모델로, 불필요한 정보를 줄이고 필요한 지식만을 집중적으로 학습합니다.


이러한 경량화 기술은 모델의 크기를 줄이면서도 성능은 유지하여, 더 빠른 응답 시간을 가능하게 합니다.

경량화된 모델은 적은 컴퓨팅 자원으로도 효율적으로 작동하여 '작지만 강력하게' 기능합니다.


이러한 sLLM 미세조정을 통해 DARVIS는 빠른 응답 속도(3초 이내)와 높은 정확도(SQL 생성 100%)를 동시에 달성할 수 있습니다.



2) 사내 문서 및 자료 통합 및 RAG 기술로 빠른 검색

: 다비스 챗봇은 기업의 다양한 내부 시스템과 문서를 통합하여 단일 플랫폼에서 관리합니다.


문서 검색 챗봇은 텍스트 문서 속 많은 글을 작은 조각으로 나누고, 그 조각들을 숫자로 바꿔서 저장합니다. 그러면 나중에 사용자가 질문을 하면, 챗봇이 그 숫자를 보고 가장 비슷한 조각을 찾아서 답을 해주게 되죠. 이렇게 하면 챗봇이 쉽게 필요한 정보를 빠르게 찾을 수 있답니다.


이를 위해, RAG(검색 증강 생성) 기술을 활용하며 사용자의 질문에 대해 방대한 데이터베이스에서 관련 정보를 신속히 검색하고, 이를 바탕으로 정확하고 맥락에 맞는 답변을 생성합니다.


이를 통해 임직원들은 복잡한 시스템을 오가지 않고도 필요한 정보를 빠르고 정확하게 얻을 수 있어 업무 효율성이 크게 향상됩니다.



3) 산업별 전문 용어에 대한 학습 과정


: 다비스 챗봇은 각 산업에서 사용하는 특별한 용어들을 이해하기 위해 특별한 학습 과정을 거칩니다. 이 과정에서 전문 용어나 현장에서 쓰이는 은어를 숫자로 바꾸어 저장합니다. 예를 들어, 조선업계에서 "요소를 태운다"라는 말을 챗봇이 이해할 수 있게 만듭니다.


이렇게 하면 챗봇이 업계 특유의 언어를 알아듣고, 정확한 답변을 할 수 있게 됩니다. 결과적으로 챗봇은 고객의 질문을 더 잘 이해하고, 더 정확하고 유용한 답변을 제공할 수 있게 됩니다.




4) 부서/직급/직택/문서별 접근 권한 설정

: 다비스 챗봇은 문서 접근에 대한 보안을 강화하기 위해 관리자 페이지에서 부서, 직급, 직책, 문서별 접근 권한을 설정할 수 있습니다.


이를 위해 사용자 인증 시스템이 필요하며 이 시스템은 각 사용자의 정보를 확인하고 저장합니다.



또, 문서에 대한 접근 권한을 관리하는 데이터베이스 구축과 사용자가 요청한 정보에 대해 접근 권한이 있는지 빠르게 확인할 수 있는 시스템이 필요합니다.


이렇게 모든 기술이 함께 작동하여 중요한 정보를 안전하게 보호하면서 필요한 사람에게 제공할 수 있습니다.


스크린샷 2025-02-20 오후 1.39.46.png




02. 데이터바우처로 비용 걱정 없이 구축하기


그럼 다비스와 같은 문서검색 AI, 비용 걱정없이 구축을 도와주는 지원사업을 소개할게요.

바로 데이터바우처입니다.

004.png


2025 데이터 바우처 지원 사업은 중소기업, 스타트업, 소상공인들이 데이터를 효과적으로 활용할 수 있도록 돕는 정부 프로그램입니다. 이 사업은 기업들에게 최대 4,500만원까지 데이터 구매, 가공, AI 서비스 등을 위한 바우처를 제공합니다.



005.png

다비스 챗봇과 같은 문서 검색 AI 구축을 위해선 다음의 작업 과정이 필요합니다.



• 비정형 데이터(사내 문서)의 AI 학습용 데이터셋 구축


• AI 모델 도출을 위한 단계별 검수 및 테스트


• 데이터 구매 및 가공 비용 지원


• AI 가공 지원


• 문서 처리를 위한 AI 모델 구축 및 훈련 등



이러한 작업 과정 모두 데이터바우처 지원을 통해 수행할 수 있습니다.




오늘은 문서검색 AI 도입이 필요한 이유와

중요한 핵심 기술 그리고 비용 걱정없이 구축하는 방법을 알아보았습니다.


디피니트의 다비스 챗봇에 대해 더욱 자세히 알아보고 싶으시다면 아래 링크를 클릭해 다양한 기능들을 확인하실 수 있습니다.


또한 데이터바우처 지원금을 활용해 구축하고 싶은 분들은 컨설팅을 신청하여 미팅을 요청해주세요. 감사합니다.


⬇︎⬇︎⬇︎

https://dfinite.ai/


keyword
매거진의 이전글인수인계, 회사 문서 관리 챗봇으로 손쉽게 하세요.