달콤했던 AI Agent 개발 '성공', 그리고 마주한 '현실'
지난 글에서 저는 제 로컬 PC에 FastMCP 기반의 AI 에이전트를 구축하는 과정을 공유했습니다. 결과는 강렬했습니다. AI가 스스로 지메일(Gmail)을 읽고, 그 내용을 분석해 세일즈포스(Salesforce)에 영업 리드(Lead)로 등록하는 과정은 마치 마법과도 같았습니다.
하지만 확장을 위해서 냉정하게 시스템을 바라보았을 때, 명확한 한계가 보였습니다.
친구에게, 동료에게 "이거 진짜 편해, 주소 줄 테니 한번 써봐"라고 말할 수 없다는 사실. 그것이 제가 마주한 현실이었습니다.
이 문제의 원인을 파악하기 위해, 제가 구축한 시스템의 구조도를 그려보았습니다. 아래 첫 번째 이미지를 봐주세요.
[이미지 1: MCP의 기본 개념(USB의 예제로 설명한 구조)]
이미지의 보시면,
Claude Desktop과 MCP Server가 마치 USB 케이블처럼 연결되어 있는 것을 볼 수 있습니다. 이것이 바로 MCP(Model Context Protocol)의 핵심이자 한계입니다.
장점: USB를 꽂으면 바로 인식되듯, 로컬 환경에서 도구(Gmail, Salesforce 등)를 매우 쉽고 강력하게 제어합니다.
단점: 물리적으로(혹은 논리적으로) 연결된 '내 PC'에서만 작동합니다.
아래 두 번째 이미지를 봐주세요.
[이미지 2: MCP의 지원 현황]
이미지2를보시면, 안타까운 '붉은색 X' 표시들이 보입니다. 현재 구조(2025년 11월 기준)에서는 모바일 앱이나 웹 브라우저(claude.ai)를 통해서는 이 강력한 기능을 전혀 사용할 수 없습니다.
즉, 제 PC가 꺼지거나 제가 자리를 비우면, 이 비서도 함께 잠들 수밖에 없는 '철저한 1:1 로컬 구조'인 셈이죠.
"나만의 비서"를 넘어 "모두를 위한 서비스"로 가기 위해, 저는 가능한 모든 아키텍처를 펼쳐놓고 고민을 시작했습니다. 다음은 제가 구상한 5가지의 선택지입니다.
위 설계도는 로컬 전용부터 완전한 웹 서비스까지의 진화 단계를 보여줍니다. 저는 이 중 현실적인 세 가지 대안을 놓고 깊은 고민에 빠졌습니다.
다시 이미지3-1으로, 옵션1과 옵션2로 Claude Desktop으로 돌아가는 길입니다. 퇴보가 아닙니다.
개념: 웹 확장을 포기하는 대신, PC 제어 능력을 극한으로 끌어올리는 것입니다.
사용처: 웹 서비스가 아닌 '사내 배포용 프로그램'이나 '보안이 중요한 기업용 솔루션'이 됩니다. 내 PC의 파일, OS 설정, 사내망 인트라넷까지 깊숙이 관여할 수 있습니다. 보안 걱정 없이 업무를 자동화하는 '엔터프라이즈 솔루션'의 길입니다.
이미지의 3-2 옵션3 (MCP Gateway)**입니다.
개념: 다수의 사용자가 접속할 수 있는 거대한 'MCP 중계소(Gateway)'를 만드는 것입니다.
현실: 이론상은 좋지만, 그림에서 보시다시피 중간 단계(MCP Gateway Layer)가 추가되며 구조가 지나치게 복잡해집니다. 통신 단계가 늘어나면 AI의 답변 속도(Latency)가 느려질 위험이 큽니다. "배보다 배꼽이 더 큰" 상황이라 과감히 후순위로 미뤘습니다.
이미지의 3-3 옵션4와 옵션5 (Web/Mobile Claude AI API , Open AI +Langchain)을 주목해 주세요.
개념: MCP의 편리한 'USB 연결'을 끊어내고, Frontend와 Backend가 갖춰진 전통적인 웹 서비스로 전환하는 길입니다.
구조: 사용자가 웹/앱으로 접속하면, 제가 만든 백엔드 서버를 통해 Claude API, OpenAI+Langchain(Brain)와 통신합니다.
장점: 인터넷만 되면 전 세계 누구나 쓸 수 있습니다. 제가 꿈꾸던 '확장성'의 끝판왕입니다.
단점: Cluade desktop +MCP가 간편하게 해주던 '도구 연결'과 '실행' 과정을 비교적 복잡하게 일일이 코드로 다 짜야 합니다. 개발 난이도가 수직 상승합니다.
설계도를 그려놓고 보니, 선택은 단순히 기술을 고르는 문제가 아니었습니다. 그것은 이 서비스의 '철학'을 정하는 문제였습니다.
대안 2,3 (웹 서비스)로 갈 것인가?
지향점: 넓은 연결 (Broad Connection) 누구나, 어디서나 접근 가능한 대중적인 서비스를 만들고 싶은가?
대안1 (로컬 고도화)로 갈 것인가?
지향점: 깊은 통제 (Deep Control)특정 사용자에게 PC와 시스템을 완전히 장악하는 강력한 슈퍼 비서를 쥐어주고 싶은가?
두 길은 구현 방식도, 사용자 경험도 완전히 다릅니다. 저는 이 갈림길에서 다음 실험을 위해서 하나의 방향을 정해야 합니다. 그리고 그 선택의 결과물인 실제 작동하는 코드와 데모를 들고 돌아오겠습니다.
과연 저는 다음실험에서 '대중성'과 '전문성' 중 무엇을 택할까요? 그리고 그 선택은 어떤 괴물 같은(혹은 천사 같은) AI Agent를 탄생시킬까요?
다음 화, "설계도를 찢고 나온 AI Agent, 그 실체를 공개합니다" 편을 기대해 주세요.