brunch
매거진 오늘도 AI

어디까지 맡길 수 있나요? 챗GPT 에이전트 출시

마우스 딸깍도 걍 알아서 하겠다는 너를 믿어도 되겠니 - 혠작가

by WAVV

지난주 오픈 AI에서 챗GPT 에이전트 (ChatGPT Agent)를 베타로 출시했습니다. 뉴스를 계속 따라오시던 분들이라면 이 기능의 전신이었던 오퍼레이터를 떠올리실 겁니다. 에이전트라는 이름을 걸고 베타공개까지 왔다면 성능이 확보되었을 것으로 보고, (비록 저는 활성화되어있지 않아 써보지 못했지만) 정리된 후기를 통해 이 기능을 살펴보았습니다.



1. 챗GPT 에이전트가 뭔가요?

이제까지는 챗GPT에게 무언가를 시키면 채팅창에서 대답을 하거나 그림을 그려줬지만, 이제 명령을 통해 가상 컴퓨터 자체를 제어할 수 있습니다. 직접 쿠팡을 켜서 내가 시킨 물건을 담아서 결제하고, 딥리서치 PPT로 만들어 줄 수도 있는 것입니다. 이런 방식을 행동하는 AI, Agentic AI라는 이름으로 생성형 AI의 넥스트 레벨로 언급되고 있습니다. MCP도 이러한 방향에 지향점을 두고 있습니다.


※음.. MCP가 뭐였더라..? 아래의 글 참고하세요!

https://brunch.co.kr/@wavv/41



2. 어떤 것을 할 수 있나요?

현재 오픈 AI 홈페이지에서 공개된 (참, 오픈 AI가 이제 공식적으로 한글 번역을 제공합니다) 주요 사례를 확인하면 다음과 같은 것들이 가능합니다. 각각의 기능들은 AI 서비스들을 통해 이미 익숙하실 수 있지만 기존에 사용하던 툴로 end-to-end로 작업을 완료할 수 있다는 점이 특징입니다. 단순히 서핑하는 것이 아니라 결제, 예약까지 완료해 주는 것이죠.

1️⃣ 웹브라우징: 여행계획+ 예약, 캘린더 관리, 장보기 등 검색 + 인터랙티브 웹 작업 2️⃣ 코드 실행: 터미널에서 스크립트를 돌리고 분석 결과 도출3️⃣ 문서 작성: 엑셀, PPT 등을 활용하여 문서를 직접 작성, 이메일 초안 생성
PPT까지 알아서 만들어준다고? 알아 그거 다해봤지 (ft. 감마, 캔바, 미리캔버스)



3. 성능에 대한 반응

해외 IT 뉴스로 유명한 The Verge 나 Geeky Gadget, 국내 AI뉴스로 유명한 조코딩님등 많은 분들이 직접 사용해 보시고 남겨준 후기에 따르면 벤치마크 성능도 좋고 이메일, 리서치, 요약에서 뛰어난 성능을 보여줌에도 불구하고 복잡한 태스크를 잘 수행하지 못하고 느리다는 평가가 있습니다. 일부 사이트에서 장바구니 추가 실패 등 UI 제어 취약점도 있었고요.


조코딩님도 라이브 중 여행계획, 슬라이드 작성을 테스트해 봤으나 시간이 상당히 오래 소요됐고 결과도 제대로 나오지 않아 체리피킹 데모 같다는 의견을 주었습니다. 사용 후기만 보니 오픈 AI에서 뭔가 심리적으로 마음이 급했나 하는 생각이 듭니다. Kimi, Grok 등 매일 주요 플레이어들이 날아다니는 와중에 비영리기업으로서 압박을 느낀 걸까요? 곧 Sora 새로운 버전이 공개된다는데 추이를 지켜봐야겠습니다.

오픈 AI 위기설에 대한 짤 - 마음이 급했던 걸까요?



4. 마무리하며 - 에이전틱 AI, 현명하게 위임하기

어떤 일들은 정확성이 너무 중요해서 1퍼센트만 어긋나도 의미가 없게 되는 일들이 있습니다. 또 어떤 일들은 실수의 대가가 유난히 비싼 경우가 있습니다. 이런 경우에 대해서 사용자는 당분간은 전적으로 믿고 수행을 맡길 수 없을 것입니다. 거꾸로 말하면 이외의 영역에서는 에이전트를 도입해 볼 만하다는 뜻입니다.


또한 사람들 간에 위임을 할 때에도 다양한 수준이 위임이 있습니다. 업무의 성격과 위임받는 이의 능력치에 따라 전적으로 자율에 맡길 수도 있고, 정해진 영역 내에서 일부를 맡기거나 중간 과정에서 계속 체크하고 관여하는 방식의 위임도 있습니다. 마찬가지로 에이전트의 성능이 아직 부족하더라도 이를 보완하는 설계로 활용도를 높일 수 있을 것입니다.


커서 옆에 행동의 근거를 설명하는 UI를 눈여겨볼만합니다 (출처: 오픈 AI)


이번에 눈여겨본 UI 중 하나는 챗GPT 에이전트가 움직일 때 마우스 포인터에 매번 행동의 근거와 목적, 과정을 설명해 주는 위의 말풍선이었습니다. 아직 100프로 믿을 수 없는 생성형 AI를 에이전트로 쓸 때 신뢰를 높여주고 동시에 내가 과정을 알고 통제하고 있다는 심리적인 안정감을 줄 수 있습니다. 이처럼 새로운 기술과 사용자 간의 간극을 줄여주는 UI를 잘 활용하는 것이 제품으로서의 성공으로도 이어갈 수 있는 비결이 아닐까요?






✍️ AI 기획자들의 이야기, 매주 받아보고 싶다면?

브런치 구독하기 버튼 꾹 눌러주세요!



#챗GPT #챗GPT에이전트 #ChatGPT #ChatGPTAgent #AgenticAI

keyword
매거진의 이전글햄찌 영상 어떻게 만들어요? 미드저니와 Veo3 활용법