AI Agent의 개념과 발전 방향, 그리고 기획자의 역할에 대한 고찰
"그래서 AI Agent가 뭐라고 생각하세요? 사실 저도 잘 모르겠어서 ㅎㅎㅎ."
올해 초 지인이 AI서비스 PM 직무 면접을 봤는데, 면접관에게 들은 마지막 질문이라고 한다.
AI 기획 직무 면접 시, 다른 도메인 기획 면접에서보다 AI와 관련 지식과 개념에 대한 질문이 곧 잘 등장하는 편인 듯 하다.
"AI를 한 문장으로 정의한다면 뭐라고 생각하세요?"
"머신러닝과 딥러닝, LLM의 차이점을 한 마디로 이야기 한다고 뭐일까요?"
같은 질문을 받았다는 직장 동료들도 있는데, 예상 밖의 이런 질문을 받으면 조금 당황하게 된다고 한다.
면접관이 이런 질문을 하는 이유는, 면접자가 AI 기술 관련 지식과 개념을 얼마나 보유하고 있는지 확인하려는 의도인 경우도 있고, 사실 면접관 본인도 정확히 모르겠어서 다양한 사람들의 의견을 들어 보고 싶은 경우도 있을 것이다.
현재 활용되고 있는 AI 기술 트렌드를 공부하면서, 기획자로서 자신만의 관점과 식견을 더해 정의해 본다면, 면접과 같은 상황에 도움이 될 수 있다.
이번 글에서는 내가 생각하는 AI Agent의 개념과 발전 방향에 대해 간단히 남겨 보겠다.
수년 전에 기획했던 룰베이스 기반의 서비스에서는 AI 비서, 어시스턴트라는 표현을 브랜딩 슬로건에 많이 사용했다면, 최근에 기획하는 생성형 AI 기반 서비스에서는 AI Agent라는 표현을 많이 사용하고 있다.
사내 시스템이나 산업에 특화된 B2B AI Agent, 특정 목적에 특화된 대고객용 B2C AI Agent를 기획하는 일을 하고 있다.
AI란 표현이 대고객용 서비스로 처음 등장한 건, 아마존의 알렉사나 우리 나라 통신사 및 IT 기업에서도 출시한 음성 인식 기반의 생활 비서 서비스였다.
이는 사용자 발화의 의도를 분류한 후, 실제로는 뒷단에 셋팅된 룰을 토대로 기능이나 답변을 제공하는 형태의 서비스였다.
단편적인 답변이나 기능 재생을 할 수 있던 초창기 AI 서비스들을 대부분 나만의 AI assitant, AI 비서를 캐치 프레이즈로 등장했다.
생성형 AI 기술이 빠르게 성장한 최근에는, AI assitant라는 표현은 많이 줄어들고, AI Agent라는 표현이 훨씬 많이 사용되고 있다.
Assistant는 주인의 지시에 따라, 시킨 일을 하는 보조자에 가깝다면, Agent는 해당 분야의 전문성을 갖춘 대리인이다.
Agent는 사용자가 직접적으로 지시한 것 이상으로, 스스로의 추론을 통해 사용자에게 필요한 솔루션을 도출하고 능동적으로 제안하는 역할을 한다. 나아가 인간이 실행까지 위임한다면, 최종단계의 액션까지 수행하는 역할을 목표로 하고 있다.
사용자를 대신해서 중요한 의사 결정을 하고 처리해 주려면, 관련된 지식과 판단력을 갖추어야 하고, 실행력도 좋아야 한다. 생성형 AI의 빠른 발전으로 이 세가지 능력을 갖출 수 있게 되었다.
- 정확한 지식: 생성형 AI 초창기에는 학습된 데이터만을 기반으로 답변을 생성해, 정보의 정확성이 부족했다. 필요한 최신 지식 데이터나 전문 DB를 검색하여 답변을 생성하는 RAG 방식이 도입되면서, 정확도 높은 Output 생성이 가능해졌다.
- 판단력: 정확한 정보를 가졌다면, 이를 토대로 적절한 판단과 의사 결정을 할 수 있는 능력이 필요하다. GPT, Claude 등의 LLM 모델의 새로운 버전 출시가 거듭되면서, 모델의 추론 능력 또한 진화하게 되었다.
- 실행력: 사용자를 대신해 최종 처리까지 할 수 있는 AI를 만들기 위한 노력이 한창이다. 자동화된 처리 능력을 갖춘 Auto GPT 개념이 등장했었고, 온 디바이스 AI로 다양한 액션을 처리해주는 Rabbit의 RI 디바이스가 출시되기도 했다. 멀티온 등의 서비스에서는 AI가 물리적 버튼 선택을 사람 대신 하면서, 온라인 구매, 메일 전송 등과 같은 처리를 하는 시도가 있었다. 하지만 사용자의 클릭을 대신하는 형태의 액션형 AI는, 막상 사용해 보면, 사용자 인증, 정보 동의 과정에서 허들이 있어 최종 완료 단계까지 성공하기 쉽지가 않아, 한계가 있다.
아직까지 '실행' 부분은 숙제가 많이 남아 있지만, MCP나 A2A와 같은 기술의 등장을 통해, 연결 방식의 확장과 규격화가 이루어지면서 더 빠른 발전을 기대할 수 있을 거라 생각한다.
현재 AI Agent의 발전 방향은 '더 똑똑해지는 것'보다는, '더 잘 위임받는 것'에 가깝다.
모든 일을 처리할 수 있는 슈퍼 만능 Agent보다는, 특정 지식과 맥락 안에서 주어진 역할을 수행하는 다양한 Agent들로 진화할 가능성이 크다.
즉, 범용 Agent보다는 금융, 쇼핑, 제조 등 각 도메인이나 역할에 특화된 Agent가 먼저 자리 잡을 것으로 보인다. 각 영역에서 요구되는 판단 기준과 책임 수준을 학습한 전문 Agent가 현실적인 형태가 될 것이다. 이는 정확도나 성능을 위한 측면도 있지만, 의사결정의 리스크를 관리하기 위한 선택이기도 하다.
그래서 Agent가 완전한 자동 실행을 하기 보단, Agent 간의 '단계적 위임'과 '협업' 구조가 강화될 것이다.
하나의 Agent가 모든 처리를 하는 대신,
정보 수집 Agent, 판단 Agent, 실행 Agent와 같이 분리되고, 이들이 표준화된 방식으로 연결되는 구조가 점차 확산될 것으로 본다.
MCP나 A2A와 같은 기술 흐름은, Agent를 ‘하나의 똑똑한 존재’가 아니라 역할을 가진 시스템 구성 요소로 발전하게 한다.
또한, '판단 → 제안 → 사용자의 승인 → 실행' 과 같은 flow를 기본으로,
Agent와 사람의 역할도 나누게 될 가능성이 높다.
그런 관점에서, AI Agent를 만드는 기획자는 어떤 지식을 갖추어야 할까?
먼저, 나의 도메인에서 필요한 Agent의 형태와 역할, Agent에 필요한 지식 DB를 어떻게 연동할 수 있을지를 알고 있어야 한다.
두 번째로는 Agent가 수행해야 Task의 범위와 수행하지 않는 범위를 정의할 수 있어야 한다.
그 다음으로는 Agent가 단계 별로 처리하기 위한 workflow를 설계할 수 있는 능력이 필요하다.
마지막으로는 여러 Agent 간의 협업 구조와 툴 사용 등을 고려한, 전체 Framework를 이해할 수 있어야 할 것이다.