brunch

딥시크의 출현과 AI 에이전트

DeepSeek가 발전하면 AI 에이전트는 더 이상 필요 없어질까?

by 알바트로스

최근 중국의 스타트업에서 발표한 언어모델 딥시크(DeepSeek)가 화재입니다. 정확한 투자금의 규모나 그들이 사용한 열화판 GPU H800의 성능에 대한 논란의 여지는 있지만, 약 80억 원이라는 인공지능 업계에서는 상상도 못 할 적은 훈련비용만으로 GPT-4o와 Claude-3.5-Sonnet과 같은 SoTA 모델과 유사하거나 더욱 뛰어난 모델을 만들어냈다니 어쨌든 그 자체로 참 대단한 일입니다.


출처 : latenote.com


더군다나 소스코드를 공개하며 Python 코드 좀 만져본 LLM 개발자라면 누구나 구동할 수 있도록 했다는 점이 참 인상적입니다. Meta의 LLaMA 시리즈가 그러했듯이 누구나 GPU 리소스의 제한 없이 최첨단 LLM을 쓸 수 있도록 발판을 마련했습니다. 일각에서는 결국은 오픈소스 전략이 이길 수밖에 없다는 점을 보여주었다는 주장도 나오고 있습니다.


https://github.com/deepseek-ai

이에 질세라 OpenAI에서는 o3-mini를 서둘러 시장에 내놓으며 미중 인공지능 대립 구도가 더욱 심화되고 있습니다. 저 역시 설연휴가 끝나고 출근하자마자 부랴부랴 DeepSeek에서 공개한 테크니컬 리포트를 읽어보고, 직접 모델을 돌려보며 이 녀석의 정체가 무엇인지 파헤치느라 여념이 없습니다.


DeepSeek과 같은 최첨단 언어 모델이 출시되면 'AI 에이전트는 이제 끝인가요?'라는 질문을 주시는 분들이 적지 않습니다. 이는 DeepSeek과 OpenAI의 여러 서비스들 그리고 그들을 활용하기 위한 다양한 라이브러리와 프레임워크들을 경쟁 구도로 생각하기 때문에 생기는 오해라고 생각합니다. 저는 오히려 deepseek과 같은 성능 좋고 값싼 LLM이 많이 나오면 나올수록 AI 에이전트는 발전할 수밖에 없다고 생각합니다.


예를 들어 DeepSeek이 기타 초거대언어모델에 비해 매개변수가 적고(685B) 성능이 뛰어나(최신 SoTA 모델과 엇비슷) 상대적으로 컴퓨팅 리소스가 열악한 스타트업에서도 고성능 LLM 서비스를 낮은 비용으로 제공할 수 있다면 AI 에이전트에 이를 결합해 만들어 낼 수 있는 서비스는 점점 더 많아질 것입니다. 그 밖에도 AI 에이전트가 여전히 중요한 이유는 다음과 같습니다.


1. 문제 해결의 복잡성


DeepSeek과 같은 최첨단 언어 모델은 매우 강력하고 정교하지만, 이 모델들이 해결할 수 있는 문제는 본질적으로 단일 작업 중심적입니다. 즉, 주어진 텍스트 입력에 대한 반응을 생성하는 데 특화되어 있습니다. 반면, AI 에이전트는 다양한 작업을 유기적으로 결합하고, 여러 단계를 통해 복잡한 문제를 해결할 수 있는 능력을 가집니다. 예를 들어, AI 에이전트는 날씨를 확인하고, 항공권을 예약하며, 여행 계획을 세우는 등 여러 도구와 정보를 종합적으로 활용할 수 있습니다.


출처 : aws


2. 자동화된 의사결정 및 작업 관리


매우 우수한 텍스트 생성 능력을 지니고 있는 언어모델이라고 해도 자동화된 의사결정 및 작업의 관리에는 한계가 있습니다. AI 에이전트는 주어진 작업을 단순히 처리하는 것을 넘어서, 목표 지향적인 작업을 수행하고, 작업을 관리하며, 결과를 분석하고 후속 작업을 조정하는 데 능숙합니다. 예를 들어, 하나의 입력에 대해 여러 단계로 나누어 작업을 순차적으로 처리하고, 그 과정에서 최적의 결정을 내릴 수 있습니다.


3. 실시간 외부 데이터와의 상호작용


DeepSeek이나 GPT-4o와 같은 모델은 주어진 텍스트 기반의 데이터를 처리하는 데 매우 뛰어나지만, 실시간 데이터를 처리하거나 외부 API와 상호작용하는 능력에는 제한이 있을 수 있습니다. AI 에이전트는 이러한 외부 도구나 API를 활용해 실시간 정보를 수집하고, 그 데이터를 바탕으로 보다 정확하고 구체적인 결과를 제공할 수 있습니다. 예를 들어, 날씨, 주식 시세, 교통 정보 등 실시간 데이터와 결합하여 동적인 결과를 생성하는 데 유리합니다.


4. 기계학습 기반의 지속적 개선


DeepSeek과 같은 모델은 훈련된 데이터에 기반하여 작동하며, 특정 시점에서 고정된 모델입니다. 반면, AI 에이전트는 지속적으로 개선될 수 있는 구조를 가지고 있습니다. 예를 들어, AI 에이전트는 작업을 수행하면서 피드백 루프를 통해 자가 학습을 하거나, 추가적인 훈련 데이터를 활용하여 성능을 지속적으로 개선할 수 있습니다. 이는 특히 동적인 환경에서 유용합니다.


5. 다양한 도구와의 통합


DeepSeek과 같은 모델은 고유의 언어 모델로서 뛰어난 텍스트 생성 능력을 자랑하지만, AI 에이전트는 다양한 도구를 통합하여 여러 작업을 동시에 처리할 수 있습니다. 예를 들어, AI 에이전트는 텍스트 처리 외에도 이미지 분석, 데이터베이스 쿼리, API 호출 등 다양한 외부 시스템과 상호작용하며, 복잡한 문제를 해결합니다.


이처럼 DeepSeek과 같은 최신 언어 모델이 뛰어난 성능을 보이고 있지만, AI 에이전트는 여전히 필수적입니다. AI 에이전트가 단순한 텍스트 생성의 범위를 넘어 다양한 작업을 관리하고 조정하는 능력, 실시간 외부 도구와의 상호작용, 지속적인 개선 및 학습, 그리고 목표 지향적인 자동화를 통해 복잡한 문제를 해결할 수 있기 때문입니다. 최첨단 언어 모델과 AI 에이전트는 경쟁과 배척관계가 아닌 서로 보완적인 관계에 있으며, AI 에이전트는 여전히 다양한 산업 분야에서 중요한 역할을 계속할 것입니다.






keyword
이전 18화AI 에이전트의 아키텍처(3) - 오케스트레이션