brunch

AI Agent 시대, 어떤 PM이 되어야 할까?

Sendbird가 바라본 AI Agent 시대의 PM

by 경민

이 글은 최근 샌드버드의 CEO 김동신 대표님의 유튜브 채널인 <존잡생각>에서 진행한 <글로벌 시장에서 AI를 만드는 PM의 역할은?>이라는 영상의 내용을 정리한 글입니다.


AI Agent가 단순한 대화형 챗봇을 넘어 실제 행동을 수행하는 자율적 시스템으로 발전하면서, SaaS 시장의 방향뿐만 아니라 PM의 역할, 조직 구조, 기술 운영 방식, 그리고 문화 전반이 빠르게 변하고 있습니다. 아래의 내용은 이러한 변화를 4개의 주제로 나누어 정리했습니다.



시장과 패러다임의 변화


1. AI Agent 시장의 부상과 의미

샌드버드는 2015년부터 B2B SaaS로 시작해 온 기업으로, 최근 AI Agent 시장으로의 확장을 통해 ‘인간 중심 툴’에서 ‘비인간 노동력’으로의 전환 체감

기존 소프트웨어가 인간이 사용하는 도구로, 노동 시간과 역량에 제약 존재

AI Agent는 전기와 컴퓨트 리소스만 있으면 확장 가능한 비선형적 생산성 도구

기업이 구매가 아닌 채용의 관점에서 접근 가능 - 고객 지원 산업처럼 노동력 기반 시장(약 300~500조 규모)이 AI로 대체 가능한 잠재 시장으로 부상할 수 있다는 강점을 가짐


2. AI 챗봇과 AI 에이전트의 차이

AI 챗봇: 사용자의 질문을 이해하고, 주어진 컨텍스트 안에서 자연어로 답변하는 대화형 시스템

AI 에이전트: 사용자의 의도와 문맥을 이해해 툴이나 API를 호출하여 실제 행동을 수행하는 자율적 시스템


3. 미래 전망: A2A(Agent-to-Agent) 이코노미와 AI-Default World

A2A 거래: 개인이 가진 AI 에이전트가 비즈니스 AI 에이전트와 가격/옵션 협상, 구매 실행까지 자율 처리하는 시나리오가 가시권

AI-Default 세대: 태생적으로 AI가 내장된 도구부터 접하는 세대의 등장. 인간의 역할은 에이전트 워크포스의 매니징·오케스트레이션으로 이동

인간성에 대한 낙관: 지치지 않는 대화 파트너로서 AI가 공감·성찰을 도움. 반대로 편향 증폭 위험에 대한 정책적·제품적 책임도 확대


4. 커리어 조언: 지금이 ROI가 가장 높은 학습시기

초기 러닝의 압축 효과: 지금 합류하면 1년 집중으로 AI/LLM 실전 역량을 획득 가능. 시간이 지날수록 동일 숙련에 더 많은 시간이 필요

경력 요건보다 태도: “경력이 부족하다”보다 속도·호기심·문제정의·실행 편향이 중요. 기술을 빠르게 따라잡는 팀/조직에서 현장 중심 학습이 최적


미래의 프로덕트 매니저에게는 AI Agent를 활용하거나 직접 설계할 수 있는 역량이 필수적인 기본 소양이 될 가능성이 높습니다. 해외 시장과 투자 동향을 꾸준히 살펴보는 사람이라면, 이미 AI Agent 분야로 막대한 자본이 유입되고 있으며, 이 변화가 먼 미래의 이야기가 아니라는 사실을 실감하고 있을 것입니다.


그럼에도 불구하고, 여전히 많은 기업들은 이러한 AI Agent를 제대로 활용하지 못하고 있습니다. 지금 이 시점에 준비한다면, 마치 의사면허를 취득하듯 장기적으로 경쟁력 있는 전문 자격을 확보한 것처럼, 비교적 오랜 기간 유리한 위치에서 일할 수 것 같다는 생각도 해봅니다.




PM 역할 구조와 역량


5. PM 역할의 재구성: Core PM과 FD PM

샌드버드의의 프로덕트 매니저는 Core PM과 forward Deployment PM(FD PM)로 PM 역할 구분

이는 Palantir 모델에서 영감을 받은 구조로, 제품 전략 수립과 고객 맞춤형 구현을 병행하는 AI SaaS 조직의 복잡성을 효율적으로 관리하기 위한 방식으로 작동함

Core PM: 제품의 비전과 방향성을 정의하고, 중장기 로드맵을 통해 조직이 나아갈 방향을 설계하는 전략형 PM으로 내부 개발, 디자인팀과 밀접하게 일함

Field Deployment PM(FD PM): 고객 현장에서 요구사항을 반영해 맞춤형 AI Agent를 설계·배포하며, 당장의 가치를 실현하는 실행 중심형 PM으로 고객 및 현장 운영팀과 밀접하게 일함


요구사항을 반영하는 것과 제품에 대한 로드맵에 따라 과제를 가져가는 것을 병행하는 것은 정말 어려운 일입니다. 따라서, 커스텀한 요청이 있을 때, 이를 최대한 추상화시키고, 일반적인 제품으로 녹여낼 수 있도록 구상하는 일이 필요합니다.


저도 요즘 리소스가 제한적인 상황에서 새로운 시스템(인터널 프로덕트)을 구축하면서 다양한 조직의 요구사항이 서로 반영될 수 있도록 추상화하는 작업을 진행하고 있습니다. 해보면서 느끼는 것은 이를 위해 중요한 것은 다른 도메인에 대한 이해와 관심, 사용자의 요구사항을 한발짝 떨어져서 바라보려는 마인드셋 등이 중요한 것 같습니다.



6. AI 시대의 PM 역량 변화

AI 모델의 동작 원리를 완벽히 알지 못하더라도, 어떤 경우에 어떤 결과가 나오는지를 패턴으로 인식하는 능력이 중요

'프롬프트 설계' 자체가 제품 기능 정의의 핵심이 되면서, 구체적이고 명확한 의도 전달 능력이 PM의 경쟁력으로 부상함 (프롬프트 설계와 모델 행동 이해는 PM이 반드시 가져야 할 기본 소양)

PM이 직접 피그마 Make, Cursor 등을 활용해 UI 기반 프로토타입을 즉시 제시해야 함. 이는 고객과 내부 엔지니어 간 커뮤니케이션 속도와 정확성을 크게 향상함

AI 시스템은 100% 결정적(Deterministic)이지 않음. “10번 중 9번만 성공하는 기능”의 품질 기준과 에러 대응 방식을 정의해야 하는 등, 새로운 제품 품질 판단 기준이 필요


7. 고객 도메인 이해의 중요성

AI Agent는 단순 기능을 넘어서 특정 산업의 도메인 지식 요구 (예: 암 진료 플랫폼, 항공사 CS 등)

PM은 해당 산업의 전문 언어, 규칙, 맥락을 단기간에 학습하고 이를 AI 프롬프트 설계에 반영해야 함.

기존 컨설팅 산업보다 실질적 책임이 크며, 이해, 설계, 실제 운영까지 전 과정을 주도해야 함.

PM이 단순한 기획자가 아니라, 비즈니스 번역가이자 기술 실무자의 역할을 수행해야 함


8. AI 에이전트 PM에게 요구되는 역량·마인드셋

테크노-옵티미즘과 실행 편향 : “된다”를 전제하고 어떻게 되게 할 것인가를 집요하게 찾는 태도. 단일 모델이 막히면 모델·툴 다중 조합으로 우회하는 사고(“문제가 있다면 더 많은 AI로 푼다” 수준의 해법 탐색).

겁 없음(Bias to Action)과 디스커버리 리드 : 정의되지 않은 문제까지 발견·정의하며, 고객 앞에서 도메인 질문을 주도하고 가설-실험-학습을 빠르게 돌릴 수 있는 담력.

대화형 시스템 사고: 일회성 Q&A가 아닌 멀티턴 대화·추론·팔로업 흐름을 통한 문제 해결 UX 설계 능력.

정확한 언어화·프롬프트 설계력 : 모델에게 정밀한 지시를 내릴 수 있도록 요구사항을 구체 문장으로 환원하는 능력

도메인 흡수력 : 항공, 헬스케어, 리테일 등 산업별 용어·정책·프로세스를 단기간 내 습득해 프롬프트·툴 사용 정책에 반영


4분기에 CDP에 붙이는 AI Assistant를 기획하는 작업을 진행하고 있습니다. 그 과정에서 이런 글을 읽으니, 여러 가지 아이디어나 놓치고 있던 부분들이 정리되는 것 같아서 좋네요. 정말 잘 정리해 주신 것 같습니다. 특히, '대화형 시스템 사고'가 아직 익숙치는 않은데 많이 훈련해야 할 것 같습니다.


9. 글로벌 PM 관점: 지역/시장/도메인 차이와 역할 범위

노출 데이터·속보의 차이 기준치가 달라짐 : 미국 실리콘밸리에서는 다양한 신제품·경쟁사·속도에 지속 노출되어 제품 품질과 출시 기준(스탠더드)이 상향. 이 기준을 들고 한국·유럽 고객과도 대화하며 글로벌 레퍼런스로 설득.

도메인 횡단 학습의 기회 : 항공·헬스케어·리테일 등 도메인을 짧은 주기로 흡수하여 프롬프트/툴 정책에 반영. PM의 범위가 기획자원확보구현운영(E2E)로 확장.

역할 창출형 조직 : 현장 문제를 풀다 생겨난 Field Deployment PM과 같은 역할을 스스로 정의·정착. 조직 설계에도 PM이 주도적으로 관여.




기술 운영 과제와 디플로이 전략


10. 기술·운영 과제(프로덕션 관점)

인간용 API를 AI가 쓰는 난점 : 검색·필터·장바구니 등 사람 중심 UI/API를 에이전트가 연쇄적으로 호출하며 발생하는 엣지케이스(예: “비건 비타민” 검색 결과에 ‘레몬’ 노출)

Relevance·Accuracy 별도 트래킹, 후처리 규칙, 랭킹 가드 필요 : 시간 감각·연산 취약성

기준일/상대시점 오해(예: “6개월 이상” 규정 판정) : 명시적 타임라인 주입, 서버사이드 Time API 호출, 규정 판단용 함수(툴)로 보정.

자기-불확실성 인식 결여 : 모델이 “모른다”를 스스로 선언하기 어려움. 불확실성 휴리스틱 + 거절·이관 정책(우아한 폴백 카피, 재시도·핸드오프 설계).

확률적 품질 관리 : 100% 결정론이 아닌 성공 확률 기반 품질 기준이 필요(예: “10번 중 9번 성공”의 SLA 정의, 재시도·보정 루프 포함)

속도 기대치 : 사용자 기대(“AI는 즉답”) 충족을 위해 저지연 호출 체인, 캐시, 스텝 축약 등 최적화 필수.


11. 디플로이 전략: 스코핑·테스팅 원칙

Scope Small, Go Deep : 처음부터 100% 자동화를 목표로 하지 않는다. 상위 3~5개 Use Case를 좁고 깊게, 액션(Write)까지 닿게 만든 뒤 확장. 넓고 얕게 가면 결국 정보형 챗봇에 머무를 위험.

테스트 범위와 방식의 재정의 : 의도된 시나리오만이 아니라 의도치 않은 대화(Out-of-Scope)를 체계적으로 수집·주입. “몇 년간도 테스트 가능”함을 인정하고, 지속형 테스트-개선 파이프라인으로 전환

고객 기대·현실 관리 : “GPT면 다 된다”는 환상 차단. 단계별 목표·지표를 합의하여 빠른 출시관측확장 루프 가동.


12. 측정 지표

Resolution Rate: 인간 개입 없이 문제 해결 비율(대화·티켓 기준).

Containment Rate: 사람 상담 이관 없이 해결된 비율.

AHT/TTFR: 평균 처리시간, 첫 응답시간(저지연 최적화 지표).

Action Success Rate: Refund/Modify 등 Write 액션 성공률·오류율.

Relevance / Accuracy: 검색·추천 결과의 적합성/정확도.

NPS/CSAT: 공감 카피·우아한 이관의 체감 품질.

비즈니스 임팩트: 환불 처리 리드타임 단축, 콜/챗 Deflection, 매출/원가 변화 등.


13. 운영 가이드(체크리스트)

스코프 합의: 상위 3~5개 Use Case 선정(정보형+액션형 혼합), 금지·유해 액션 규정

툴·API 설계: 시간/정책 판단은 함수 호출로 외부화, 모델은 판단 근거만 생성

불확실성 설계: 거절·이관 카피, 재시도 정책, 실패 로깅 기준 마련

데이터·거버넌스: PII·규정(예: 항공 정책) 소스의 단일 진실 공급원(SPoT) 확보

관측·평가: Resolution/Action/NPS 대시보드 상시 모니터링, 주 단위 회귀 테스트

확장 로드맵: Depth 성과 확인 후 브레드스 확장(채널·도메인·액션 추가)


14. 에이전트 실무 논점

액션을 전제로 한 품질 관리 : 환불/구독변경 등 Write 액션까지 범위를 좁고 깊게 가져가면 비즈니스 임팩트와 측정이 명확.

얼라인먼트·페르소나 설계 : 에이전트의 톤·동의성(agreeableness)·반론 제시 수준을 과제·브랜드에 맞춰 정책화. 작은 편향도 대규모 사용자에선 큰 영향이므로 가드레일 필수.

대화 품질 vs 결과 품질 : 결과가 불가하더라도 일관된 공감/이관 UX로 NPS/CSAT 개선 가능.


PM에게 중요한 것 중 하나가 범위를 잘 Scoping 하는 역량이기 때문에, 이는 AI Agent PM에게도 그대로 적용된다고 봐도 될 것 같습니다.



조직 문화와 실행 구조


15. 조직 문화·의사결정 패턴 인사이트

규모보다 문화가 속도를 결정 : 회사 크기와 상관없이, 탑다운 의지·실험 문화·리스크 허용도가 추진력을 좌우. 일부 대기업은 초반부터 환불/구독변경 등 Write 액션을 제한적 범위에서 과감히 허용—수익·비용에 직결되어 임팩트 측정이 명확.

Breadth-first: 많은 Use Case를 얕게—속도는 빠르나 액션 부재로 임팩트 약함.

Depth-first(권장): 소수 Use Case를 깊게—해결률(Resolution Rate)·매출/비용 개선으로 비즈니스 임팩트가 선명.


16. 문화와 속도: 의사결정 방식이 결과를 좌우

규모보다 문화 : 대기업이라 느리고 스타트업이라 빠르다는 통념은 불완전. 탑다운 의지, 실험 허용도, 리스크 감내가 속도를 결정

속도 전쟁과 운영 리듬 : 기술 릴리즈가 초고속으로 이뤄지는 환경에서 데일리 스탠드업, 강한 오너십, 책임 추궁 문화(hold to account)가 속도를 견인.

인재 전략 : 스페셜리스트의 깊이보다, 다도메인 흡수·문제정의·실행이 가능한 제너럴리스트/하이 에너지형 인재 선호. 호기심과 자기 동기부여가 핵심.


17. 입사/합류 체크리스트

1. 액션 범위와 가드레일이 명확한가

2. 실험학습확장 루프가 운영되는가

3. 데이터·정책의 단일 진실 공급원(SPoT)이 있는가

4. 대화·행동·비즈니스 지표의 단계별 목표가 합의돼 있는가

keyword
매거진의 이전글프로덕트는 어떻게 관계를 설계할까