brunch

매거진 Tech

You can make anything
by writing

C.S.Lewis

by 서교동방울이 Jul 02. 2024

데이터베이스도 못 피한 AI 바람

우리 오라클이 달라졌어요 

데이터베이스는 모든 IT 시스템의 기본이다. 수만 수억개 단위의 데이터를 담아 놓고 이를 시스템 요청에 따라 뿌려주는 우물 역할을 한다. DB가 없는 IT 시스템은 사실상 껍데기에 불과하고 데이터를 얼마나 잘 정리하고 빨리 배포하고 분석하냐에 따라 IT 서비스의 성능이 좌우된다.


속도와 정확도도 DB의 '명성'을 가른다. 빠르게 요청에 반응하고 쿼리를 넣었을 때 원하는 결과를 빨리 불러올 수 있어야 서비스의 속도가 빨라진다. 당연히 '뻑나지' 않는 안정성도 생명이다. 


이 DB업계에도 AI 바람이 불었다. AI 편한 것 누가 모르겠냐만 AI에는 오작동의 가능성이 늘 도사리는 것 아니었나. 하지만 내로라하는 DB 업체들이 속속 AI를 자신들의 강점으로 내세우고 있는 건 이유가 있다. 구체적인 접목 형태야 각각 다르지만 자체 기술을 활용하는 기업과 생성AI API를 붙여 편의성을 높인 모델로 나뉜다.


특히 명실상부 DB의 1인자 오라클이 생성AI 카드를 꺼내든 건 시사하는 바가 크다. 'DB=오라클'이라 불릴만큼 DB업계에서의 오라클 영향력은 독보적이다. 오라클 공인 교육이 데이터 엔지니어(또는 사이언티스트)가 되려는 이들의 기본 코스이고, 이를 잘 아는 오라클 또한 위력적(?)인 가격정책을 고수한다.


오라클은 기본적으로 관계형 DB다. 행과 열로 구성한 컬럼을 써 텍스트 같은 정형화 데이터를 정리하고 분석하는 데 적합하다. 관계형 DB의 반대는 영상이나 음성 같은 비정형 데이터를 관리하는 비관계형 DB다.


지난해 가을인가 오라클은 자사 관계형 DB의 최신 버전인 23C를 내놓으면서 눈에 띄는 기능을 선보였다. 이 글을 쓴 계기이기도 한데 벡터(Vector) 검색을 추가했다는 발표였다. 더 구체적으로는 '검색 증강 생성(RAG·Retrieval-Augmented Generation)'을 위한 기능 추가다. 강점을 가진 데이터 관련 기술로 AI의 단점을 메꾸는 작전이다.


RAG를 먼저 살펴보자. RAG는 앞서 언급했던 AI의 오판을 막는 도구 측면이다. 생성AI는 사람이 입력하는 프롬프트값을 잘못 이해해 엉뚱한 답을 내놓는 환각 문제가 여전하다. 단순한 데이터 요청이라도 다른 데이터를 불러오는 경우까지 생길 수 있다.


오라클은 컬럼을 기반으로 정형화된 데이터를 잘 저장하고 뽑아내는 DB다. 데이터는 똑 떨어지는 형태로 담아놨으니 잘 끌어오기만 하면 된다. 허나 생성AI를 쓰는 건 사람이 편하기 위해서인데 여기서 오류가 생긴다. 사람의 말과 같은 형태의 자연어로 편리하게 데이터를 뽑아내는 게 DB에서의 생성AI 활용 방안이지만 프롬프트를 제대로 받아들이지 못한 채 생성AI의 엔진인 LLM의 학습 데이터에만 의존하는 경우가 생긴다.


벡터화는 다양한 포맷의 데이터를 숫자로 표현하는 것을 떠올리면 쉽다. 복잡하더라도 컴퓨터가 이해할 수 있는 숫자로 데이터를 바꿔놓고 이 숫자만 맞아떨어지면 제대로 원하는 데이터를 불러올 수 있는 구조다. 


여기서 '증강'이라는 개념이 성립한다. RAG를 통해 생성AI의 한계를 오라클 DB에 담아놓은 풍성한 데이터로 메꿀 수 있다는 게 이들의 논리다. 정리하면, 벡터화한 데이터(잘 정리되고 컴퓨터가 이해하기 쉽게 분류한 데이터)로 증강시켜 LLM의 아직 부족한 정확성을 보완한다.


RAG는 다른 업체도 구사하는 전략이지만 오라클에게는 더 큰 의미가 있다. AI 구동에 필수적인 클라우드에서는 오라클의 명성이 그리 높지 않았다. DB에서는 전교 1등인데 클라우드에서는 AWS·마이크로소프트·구글의 삼각편대는 물론 알리바바클라우드에도 밀린다는 평가가 있었다. 오라클 입장에서는 자존심 상하는 일이었고 관계형 DB만으로는 빅테크의 자존심을 지키기 힘들거라는 위기감이 작용했다.


자체 LLM이 없는 오라클은 '오라클클라우드인프라스트럭처(OCI)'라는 클라우드에서 코히어(Cohere)와 메타의 라마(LLaMa)2 같은 타사 LLM을 제공한다. 오라클 DB에 모두 익숙한 상황에서 AI 수요를 OCI라는 클라우드 서비스로 끌어모으기 위한 양동작전이다.


정리해보면 오라클이 벡터 검색으로 RAG를 지원하는 건 환각이라는 LLM의 한계는 뚫고 이미 가진 DB 업계에서의 명성을 더 공고히 하기 위해서다. 이미 오라클에 익숙한 사람들이 OCI를 쓰게 하고 데이터 기술의 장점을 어필해 생성AI 트렌드 속에서도 사용자 이탈을 막기 위한 의도로 읽힌다. 또 지난달에는 오픈AI와 마이크로소프트간 3사 파트너십을 맺고 마이크로소프트의 애저 AI 플랫폼 확장을 위해 OCI를 제공하기로 결정했다. 적과의 동침이다.


오라클은 그 고인물 이미지 만큼이나 적대 진영도 많다. 비싼 유지보수료 탓에 심정으로는 거부하지만 어쩔 수 없이 쓸 수 밖에 없는 것도 사실이다. 괜히 색다른 DB를 썼다 문제가 생기는 것보다는 이미 검증된 DB를 쓰자는 거다. 냉정하게 보면 기업 예산은 자기 주머니에서 나오는 돈이 아니다. 구매담당자 입장에서는 의사결정자를 설득하는데 업계 1위라는 설명만큼 편한 게 없다. 시장을 선점한 오라클의 사실상 최대 무기이기도 했다.


하지만 클라우드 시대에서 하드웨어 DB만으로는 살아남을 수 없는 순간이 됐다. 오라클의 RAG 전략이 오라클의 증강으로도 이어질지 지켜볼 일이다. 이제 절대지존이라는 자존심은 접고 변화와 적과의 동침을 택한 오라클의 미래는 어떻게 될까.

매거진의 이전글 [AI의 홍수] 제로섬 게임
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari