brunch

함께 일하는 AI팀을 만들어?

멀티 AI 에이전트 구축기_EP.0

최근에 원고를 작성하지 못했습니다. 6월 23일이 마지막이었다고 나오니 두 달이 조금 넘었네요. 작지만 소중한 구독자 여러분께 미안한 마음을 전합니다. 그러니까 앞으로 좀 더 성실히 원고를 작ㅅ.... 무튼 열심히 하겠습니다.


지난 두 달간 흥미로운 작업을 진행했습니다. 집구석 데스크톱에 나만의 멀티 AI 에이전트를 구축하고 웹페이지와 연계시켜 활용하도록 만들었거든요. LLM의 헛소리를 막아줄 믿을만한 자료 도서관(RAG)을 구축하는 작업이 남아있긴 하지만 웬만큼은 끝내서 홀가분합니다. 그 경험을 하나씩 공유할까 합니다.


압력의 교차점, 변화는 어떻게 분출되는가

최근에 국내 500대 기업의 임직원 연령대별 분포 변화 데이터가 발표되었습니다. 데이터를 보면, 2022년부터 2024년까지 불과 2년 사이에 30세 미만 직원의 비율은 21.9%에서 19.8%로 감소한 반면, 50세 이상 직원의 비율은 19.1%에서 20.1%로 증가했습니다. 조직의 허리를 담당하는 30~49세 연령층이 소폭 증가하기는 했으나, 전체적인 추세는 조직의 고령화를 뚜렷하게 보여줍니다. 신입사원보다 부장님이 더 많아진 시대가 온 거죠.


부장님이 넘치는 시대가 왔다


표면적으로 보면 단순한 인구 통계학적 변화처럼 보일 수 있습니다만 그 이면에는 '경험의 역설(Experience Paradox)'이라는 위험이 숨어 있습니다. 수십 년간 축적된 경험과 노하우를 보유한 시니어 인력으로 인해 당장의 '경험 자산'은 풍부해지고 있지만, 정작 그 귀중한 자산을 조직 차원에서 흡수할 구조적 역량은 약해지니까요. 문서화하기 어려운 직관, 상황 판단 능력, 문제 해결 노하우 등은 시니어 인력이 조직을 떠남과 동시에 소멸될 가능성이 큽니다. 조직의 지식 자본도 그만큼 줄어들겠죠.


두 번째 그래프를 볼까요. 미국의 사무실 건설 비용보다 데이터 센터 구축에 들어가는 비용이 더 커졌다는 내용입니다. 이건 기업들이 AI 투자를 바라보는 시각이 달라졌음을 의미합니다. 더 이상 일부 부서의 연구개발(R&D) 비용이 아니라, 모든 산업 분야에서 이사회의 핵심 안건으로 다루어지는 안건이라는 얘기입니다.

ChatGPT가 등장하면서 판이 달라졌다


이러한 투자 열풍은 AI 기술을 통해 이전에는 불가능했던 성과를 창출하라는 강력한 요구로 치환됩니다. 투자자들은 비즈니스의 판도를 바꿀 만한 아이템, 혹은 그에 준하는 차원이 다른 생산성을 원하거든요. 당장 수익 만들어내라는 얘길 살짝 돌려서 말할 뿐이죠.


우리는 교차점에 서있습니다. 한 편으로는 인적 자원의 제약과 지식 단절이라는 '머릿수 리스크'가 있고, 다른 한 편으로는 막대한 AI 투자에 대한 성과를 입증해야 하는 '압박 리스크'가 있습니다. 머릿수는 부족한데 차원이 다른 성과를 내놓으라니. '1000원 줄 테니 이것저것 다 사 오고 잔돈까지 남겨와라'는 얘기와 진배없습니다.


이러한 상황에서 더 많은 사람을 채용하거나 기존 인력에게 더 많은 노력을 요구하는 기존의 해법은 더 이상 유효하지 않습니다. 그럴 여유도 없고요. 완전히 다른 차원, 비선형적이면서 약간은 도라이 같은 접근법이 필요합니다. 우리도 AI를 '생산성 증대 혹은 확장의 자본'으로 인식해야 할 필요성이 생기는 거죠. 'AI 에이전트' 얘기도 바로 이 지점에서 나옵니다


그러니까 자비스 말하는 거야? 프라이데이?

많은 분들이 AI 에이전트 하면 영화 아이언맨에 나오는 자비스나 프라이데이를 떠올립니다. 사실 영화 속의 자비스 정도만 나오면 대박이죠. 구글이나 아마존 웹 서비스와 같은 글로벌 기술 기업들이 그리는 모습도 얼추 비슷합니다. '사용자를 대신하여 목표를 추구하고 과업을 완수하기 위해 AI를 사용하는 소프트웨어 시스템'을 AI 에이전트라고 정의하거든요. 정해진 스크립트에 따라 응답하는 챗봇과 달리 스스로 상황을 판단하고 행동하는 능동적 존재라는 점에서 차별성을 갖습니다. 물론 말이 그렇다는 겁니다.

아이언맨이 심어준 환상은 거대했다


AI 에이전트의 핵심은 LLM(Large Language Models), 거대 언어모델입니다. 인간의 자연어를 분해해서 그에 맞는 목표와 세부 이행계획을 수립하죠. AI 에이전트의 작동 과정을 단순화시켜 보면 4단계로 설명할 수 있을 거 같습니다.


목표 수신 (Goal Reception): 사용자로부터 "신입사원 온보딩 만족도를 다음 분기까지 20% 향상시킬 방안을 보고서로 작성해 줘"와 같이 목표를 전달받았다 가정합시다.

과업 분해 및 계획 수립 (Task Decomposition & Planning): LLM은 사용자의 목표를 구체적이고 실행 가능한 하위 과업들로 분해합니다. '① 기존 온보딩 프로그램 현황 분석', '② 신입사원 및 멘토 대상 설문조사 실시', '③ 경쟁사 온보딩 우수 사례 벤치마킹', '④ 개선 방안 도출 및 보고서 초안 작성'처럼 나누고 거기에 맞는 단계별 계획을 조립합니다.

도구 사용 (Tool Use): 계획 실행에 필요한 정보나 기능이 있다면 가져옵니다. 내부 데이터베이스에 접근해 과거 만족도 데이터를 가져오거나, 이메일 시스템을 이용해 설문조사를 발송하고, 웹 브라우저를 열어 경쟁사 정보를 검색하기도 합니다.

학습 및 성찰 (Learning & Reflection): 에이전트는 각 단계의 행동 결과를 관찰하고 그 결과를 학습합니다. 만약 설문조사 회수율이 낮다면, 회수율을 높이기 위해 리마인더 메일을 보내는 등 계획을 수정하겠죠. '실행-관찰-학습-조정'의 순환 고리를 반복하면서 사용자의 목표에 접근해 갑니다.


제조사마다 아주 약간의 차이는 있습니다만 AI에이전트의 기본 정의나 플로우는 이렇게 구성되어 있습니다. 이런 거 보면 '세상엔 똑똑한 사람들이 많구나'라는 생각도 듭니다. 허허.


간단하지 않은 현실의 문제. 하나로 가능할까?

단일 AI 에이전트가 복잡한 문제를 해결하는 능력의 기반에는 '연쇄적 사고(Chain of Thought, CoT)'라는 프롬프팅 기법이 있습니다. LLM에게 문제의 답을 바로 내놓으라고 요구하는 대신, 문제 해결 과정을 단계별로 차근차근 설명하도록 유도합니다. 문제 해결 과정을 논리적인 단계로 나누어 '소리 내어 생각하게' 함으로써, 복잡한 추론 과제에서 높은 정확도를 이끌어냅니다.

사고를 단계별로 쪼개서 줘야 훨씬 잘 알아듣는다


예를 들어, "민아는 테니스공 5개를 가지고 있었습니다. 3개씩 들어있는 캔 2개를 더 샀습니다. 지금 민아는 총 몇 개의 공을 가지고 있나요?"라는 질문에, CoT를 적용하면 아마 LLM은 생각의 흐름을 이렇게 가져갈 겁니다.

- 민아는 처음에 5개의 공을 가지고 있었다.

- 3개씩 든 캔 2개는 총 3 ×2=6개의 공이다.

- 따라서 민아가 가진 공의 개수는 5+6=11개다.


이런 연쇄적 사고(CoT)는 A에서 B로, B에서 C로 이어지는 추론 경로를 따라가는 '추론 선형성'에 기초를 둡니다. 이 부분이 CoT의 장점이자 단점으로 작용하는데 중간에 단 하나의 단계에서라도 오류가 발생하거나 잘못된 가정을 하게 되면 전체 결과가 틀어지게 됩니다. 마치 삼단논법에서 대전제나 전제가 틀어지면 엉뚱한 결론이 나는 것과 같은 이치입니다.


우리가 해결해야 할 현실의 문제는 정답이 정해진 수학 문제와 다릅니다. 정보는 불완전하고, 상황은 유동적이며, 고려해야 할 변수는 많습니다. 여러 가지 대안을 동시에 탐색하고, 각 대안의 장단점을 비교하며, 막다른 길에 부딪혔을 땐 재빠르게 다른 길을 찾아야 하죠. 단일 AI 에이전트의 선형적 사고방식은 효과적이긴 하나 지저분한 현실의 전략적 의사결정 문제에서 한계를 드러냅니다.


여럿이 등장하면 어떨까. 하나의 팀으로.

단일 AI 에이전트의 선형적 사고가 가진 한계를 극복하기 위한 노력은 활발히 이루어졌습니다. 그 결과 연쇄적 사고 기법(CoT)에서 여러 생각을 떠올리고 판단하는 '사고의 나무(Tree of Thoughts, ToT)'로, 그리고 여러 생각이 서로 영향을 주고받으며 진화하는 '사고의 그래프(Graph of Thoughts, GoT)'로 추론 방식이 발전했습니다.

'토니, 이제 하나로는 어려워'


멀티 AI 에이전트는 바로 이 '여러 생각이 상호작용하며 사고한다'는 개념에서 출발한 접근법입니다. 구글은 멀티 에이전트 시스템을 '공유된 환경 내에서 다수의 자율적인 에이전트들이 상호작용하며 개별적 또는 집단적 목표를 달성하기 위해 협력, 조정, 경쟁하는 시스템'으로 정의합니다. 각자의 역할을 가진 에이전트(팀원)들이 존재하고, 이들이 어떻게 소통하고 작업을 조율할지에 대한 규칙도 있습니다. 완전하지는 않지만, '사용자와 함께 일하는 AI 팀'이라는 개념을 바탕에 두고 설계, 발전하고 있는 시스템입니다.


사용자와 같이 일하는 AI 팀의 핵심은 '미처 보지 못하는 부분에 대한 효율적 접근과 부담해소'에 있습니다. 제아무리 뛰어난 능력자라도 모든 부분을 다 커버할 수는 없거든요. 아주 짧은 시간에 내가 보지 못한 데이터를 서로 연결해서 뭔가를 찾아내고 알려주는 AI 팀, 그것 만으로도 구축할 명분은 충분하지 않을까요.


당신의 손안에 AI 팀이 생긴다면

다음 편부터는 '어떻게(How)'에 대한 이야기를 풀어볼까 합니다. 실제로 로컬 컴퓨터에 환경을 구축하고 여러 오픈소스 LLM을 설치하고, 각 에이전트에게 역할을 부여하고, 프롬프트를 수정해 나가면서 나만의 'HRD AI 팀' 프로토타입을 만들어 보는 거죠.

사용자와 함께 일한다는 전제가 깔려있다


코딩이나 AI에 대한 깊은 지식이 없는 분이라도 '쟤도 하는데 나도 한 번 해볼 수 있겠다'는 근거 없는 자신감을 심어 드릴 수 있으면 좋겠습니다. 일단 그래픽 카드의 GPU 용량부터 확인해 볼까요.


그럼 다음 회차에 뵙죠.

keyword
작가의 이전글분위기 파악 못하는 AI