(!) ChatGPT Plus 버전을 기준으로 합니다.
우리는 ChatGPT를 사용하면서 단순하고 질의하고, 데이터를 생성 및 분석하는 것뿐만 아니라 공부 및 연구와 같은 일을 할 때도 사용합니다. ChatGPT에서 GPT는 Generative Pre-trained Transformer이므로, 사전 학습(Pre-trained)된 지식들을 가지고 있다는 것을 알 수 있는데, 공부와 리서치를 할 때는 이를 바탕으로 수행하게 되는 것이지요.
다만, 사전 학습된 지식은 과거의 지식으로써, 최신성에 문제가 있기 때문에 ChatGPT 자체만으로는 기본적으로 실시간으로 데이터를 가져와서 처리하는 등의 일을 할 수 없어서 웹 검색이나 ChatGPT 커넥터와 같은 기술적 장치를 사용하여 외부의 데이터 소스로부터 데이터를 끌어 올 수 있었습니다.
하지만 결국 이와 같은 요소들도 그저 도구(Tools)에 불과합니다. 도구는 사용할 때 비로소 가치를 발휘합니다. 즉, AI가 사용자의 문제를 해결할 때 도구를 적극적으로 활용하지 않으면 의미가 없다는 뜻입니다. ChatGPT에는 도구를 적극적으로 활용하여 사용자의 문제를 해결하는 "에이전트 모드"라는 것이 존재합니다. 따라서 이번에는 ChatGPT 에이전트에 대해 알아보도록 하겠습니다. 다만, 에이전트 모드를 알아보기 전에 "에이전트"에 대한 개념과 구성 요소를 간단하게 살펴보겠습니다.
도구를 적극적으로 사용해서 특정 도메인에 대해 사용자의 문제를 해결하는 AI를 우리는 일반적으로 에이전트(Agent)라고 부릅니다. 에이전트는 사용자의 질의를 해결하기 위해 스스로 문제해결 계획을 수립하고, 이를 실행합니다. 따라서 같은 문제라도 그 방식과 절차가 에이전트마다 다를 수 있습니다. Genspark, Manus와 같은 서비스에서 제공하는 디자인 AI, 파워포인트 작성 AI와 같은 것들도 모두 에이전트입니다. 이제부터 에이전트를 구성하는 요소들은 어떤 것들이 있는지 살펴보도록 하죠.
기초 모델은 에이전트의 두뇌를 담당하는 언어 모델(Large Language Model, LLM)을 의미합니다. 에이전트 개발자는 에이전트를 구성할 때 GPT, Claude, Gemini과 같은 베이스 모델 중 하나를 선택하여 에이전트의 두뇌로 사용하도록 할 수 있으며 에이전트 서비스를 제공하는 기업에서는 사용자가 모델을 직접 선택할 수 있도록 선택권을 부여하는 경우도 있습니다. 예를 들어 Genspark에서는 다음과 같이 사용자가 직접 모델을 선택할 수 있습니다.
시스템 프롬프트는 에이전트의 역할과 정체성을 명시해 놓은 프롬프트입니다. 예를 들어 다음과 같은 프롬프트는 에이전트에게 '생성형 AI 전문가'의 역할 수행하도록 명시합니다. 에이전트를 만드는 입장에서 시스템 프롬프트는 아주 중요한 요소입니다. 대부분의 에이전트에는 시스템 프롬프트가 설정되어 있습니다. 에이전트가 실질적으로 수행하는 임무와 절차가 명시되어 있기 때문입니다.
당신은 생성형 AI 전문가입니다.
- 사용자는 ChatGPT, Gemini와 같은 생성형 AI에 대한 기초 지식 및 사용법에 대한 질의를 할 수 있으므로 비전문가가 이해하기 쉽게 설명하세요.
에이전트는 사전 학습된 지식 이외에도 별도의 배경 지식(Knowledge)을 가질 수 있습니다. 예를 들면 특정 제품에 대한 고객 문의에 대응하는 에이전트가 있는 경우, 그 제품에 대한 지식을 가지고 있을 수 있습니다.
지식은 일반적으로 외부에 노출되어 있는 개념도 아니고, 에이전트를 만들 때 배경지식을 탑재하는 방법은 플랫폼마다 다르지만, 일반적으로 에이전트를 만들 때 배경 지식을 탑재하기 위해 구사할 수 있는 대표적인 방법으로는 파일 업로드가 있습니다. 파일 업로드를 통해 검색 증강 생성(Retrieval-Augmented Generation, RAG)을 기본적으로 사용합니다.
에이전트는 웹 검색, 코드 인터프리터, ChatGPT 커넥터와 같은 도구(Tools)를 사용할 수 있는데요, 이때 AI는 자신이 사용할 수 있는 도구 목록을 살펴보고 적합한 도구를 선택하여 사용합니다. 기본적으로 웹 검색, 코드 인터프리터와 같은 도구는 ChatGPT 내장 도구입니다. 웹 검색을 통해 웹에서 데이터를 얻어오거나 코드 인터프리터를 통해 스프레드시트 등의 구조화된 데이터를 생성하고 분석할 수 있죠.
ChatGPT 코드 인터프러터는 기본적으로 활성 상태이며 이러한 설정은 프로필 → 개인 맞춤 설정 → 고급에서 On/Off 할 수 있는데, 코드 인터프리터뿐만 아니라 웹 검색, 코딩, 캔버스, 커넥터 등의 ChatGPT에 내장된 기능들에 대해 On/Off 할 수 있습니다.
(!) ChatGPT 웹 검색과 코드 인터프리터는 도구이지만, 캔버스(Canvas)는 도구가 아닙니다.
에이전트는 웹 검색과 코드 인터프리터와 같은 내장된 도구를 너머 다른 플랫폼에서 제공하는 외부의 도구를 호출하기 위해 MCP(Model Context Protocol)를 사용할 수 있습니다. 외부의 도구를 사용할 수 있다는 것은 해당 플랫폼에서 제공하는 기능을 사용할 수 있다는 것과 마찬가지입니다. 예를 들면 ChatGPT 커넥터에서 Notion에 연결하는 경우 Notion 페이지를 읽는 등의 작업을 수행하기 위해 Notion MCP를 사용합니다.
외부 도구의 예로, 대표적인 UI/UX 디자인 서비스 중 하나인 Figma에 연결한다고 가정했을 때, 프로필 → 연동 앱 및 커넥터 → Figma에서는 Figma MCP가 제공하는 도구 목록을 살펴볼 수 있습니다. ChatGPT와 Figma와 연결하게 되면 generate_asset이라는 도구를 사용할 수 있고, 이는 사용자의 요청에 따라 적절하게 사용 여부가 결정됩니다.
ChatGPT에서 사용할 수 있는 가장 대표적인 에이전트는 ChatGPT 에이전트 모드가 있습니다. 그 외에도 현재 ChatGPT에서 제공하는 에이전트로는 심층 리서치, 공부하기, 쇼핑 어시스턴트가 있는데요, 이들은 말 그대로 연구, 공부, 쇼핑할 때 사용하는 에이전트인데, 각자 하는 일과 사용 용도만 다를 뿐 결국 에이전트라는 본질은 똑같습니다.
심층 리서치
ChatGPT 에이전트 이외에도 심층 리서치라는 기능도 있습니다. 다른 서비스에서는 딥 리서치(Deep Research)라는 표현으로 사용됩니다. 이 또한 ChatGPT 에이전트처럼 ChatGPT에서 제공하는 에이전트의 일종이지만, 이름 그대로 연구에 특화되어 있어 보고서나 논문 초안 작성 등에 사용될 수 있습니다.
브라우징을 중점으로, 검색 및 분석을 다단계로 반복하며 자료를 수집 및 평가, 종합하여 문서화된 결과를 제공합니다. ChatGPT 에이전트처럼 도구 및 커넥터를 사용할 수는 있지만 에이전트보다는 브라우징과 문서 해석 위주의 사용 등 제한적으로 활용될 수 있습니다.
활용 Tip.
ChatGPT 에이전트 모드는 ChatGPT에서 사용할 수 있는 범용 에이전트입니다. 기본적으로 웹 검색과 ChatGPT 커넥터를 통해 웹과 외부 서비스를 돌아다니며 자료를 조사하고 분석할 수 있으며 특정 작업을 수행할 수 있습니다. 코드 인터프리터를 통해 엑셀 데이터를 생성하고 분석할 수도 있습니다. 마켓 리서치, 리포트 작성 등의 작업을 수행할 때는 일반적인 질의응답보다 에이전트를 사용하는 것이 더 좋습니다.
만약 공부, 쇼핑, 심층 연구를 하고자 할 때는 에이전트 모드를 그냥 사용하기보다는 별도로 분리되어 있는 심층 리서치, 공부하기, 쇼핑 어시스턴트를 사용해 보세요.
ChatGPT 에이전트 모드를 활성화하려면 채팅창에서 "에이전트 모드"로 활성화할 수 있습니다. 그다음, 에이전트를 사용해서 어떤 일들을 할 수 있는지 미리 예시가 나와있는 것을 살펴보실 수 있어요. 대표적으로 리포트 작성, 특정 작업 수행, 스프레드시트(엑셀) 작성, 슬라이드 작성이 나와 있습니다. 다만 여기서는 ChatGPT에서 제안하는 내용을 바로 사용하기보다는, 조금 더 자세한 예시로써 다음과 같이 "사회적 문제를 바탕으로 하는 사업 아이디어 도출"이라는 주제에 대한 프롬프트를 에이전트 모드로 실행해 보도록 하겠습니다.
(!) 에이전트 모드는 고급 기능이기 때문에 플랜마다 사용량에 제한이 있습니다.
(!) 에이전트를 사용하면서 신경 써야 하는 부분은 프롬프트 엔지니어링입니다. 에이전트는 일반적인 질의응답에 비해 하는 일이 많고 절차도 복잡하기 때문에 수행 시간이 더 오래 걸립니다. 시간이 더 오래 걸리는 만큼 입력 프롬프트의 품질에 신경을 써줄 필요가 있는데요, 모호한 프롬프트는 작업 및 검색 시간도 길기 때문에 에이전트의 작업 수행 시간이 오래 걸립니다. 30분에서 몇 시간까지 걸릴 수도 있습니다. 반면 조건과 제약이 명확한 프롬프트는 검색 범위가 좁고 해야 하는 일이 명확하여 더 빠르게 결과를 낼 수 있습니다.
당신은 스타트업 창업 전문가입니다.
분야에 관계없이 한국에서 최근 5년간 주목받고 있는 [사회적 문제]를 파악하고, 시도해 볼 만한 사업 [아이디어]를 도출하여 [형식]에 따라 작성해 보세요.
사회적 문제= 분야에 관계없이 사회적 고립·저출산·지방소멸 등의 사회적 문제
요약= [사회적 문제]에 대한 200자 이내의 요약(예: 50대 중년 층에서 사회적 고립이 크게 증가하였고, 40대로 확산되고 있음)
문제= 고객이 가지고 있는 본질적인 문제에 대한 200자 이내의 요약
아이디어= [문제]를 해결하기 위한 3가지 이상의 스타트업 아이디어(낮은 진입 장벽·초기 창업자가 3개월 안에 MVP 작 가능·저비용·IT 서비스 기반)
# 형식
|사회적 문제|요약|문제|아이디어|
|----------|----|----|-------|
이제 다음과 같이 에이전트가 내장 브라우저를 활성화하여 리서치를 시작하게 될 것입니다. 메뉴에서 "활동"을 누르면 어떤 일들을 진행했는지 살펴볼 수도 있습니다.
ChatGPT를 사용하다 보면 주기적으로 반복하는 작업이 있기 마련입니다. 예를 들어서 최신 뉴스를 정리해서 매일/매주마다 요약을 받는다던지, 주기별로 데이터를 수집해서 엑셀 파일로 만드는 등으로 말이죠. 이러한 일을 하려면 해당 서비스를 제공하는 사이트에 접속하거나 필요할 때마다 프롬프트를 반복해서 입력해주어야 합니다.
ChatGPT 작업을 사용하면 주기적으로 해야 하는 반복적인 일을 등록해 두고 ChatGPT가 그 일을 예약된 시간에 완료하여 알림을 받을 수 있습니다. 이러한 기능 또한 에이전트가 할 수 있는 일이라고 볼 수 있는데요, 이와 같이 특정 시기에 특정 태스크를 예약해 두고 수행하도록 하는 것을 태스크 스케줄링(Task Scheduling)이라고 합니다. 소프트웨어 개발에서는 크론탭(Crontab) 또는 큐(Queue) 기능으로 사용하기도 합니다.
ChatGPT에서 다음과 같이 입력하면 '일정'에 등록되어 매주 월요일 8시마다 AI 뉴스를 요약하여 우리에게 알림을 보내줍니다.
매주 월요일 오전 8시마다 최신 AI 뉴스를 요약해서 알려줘
일정이 올바르게 등록된 경우 채팅창에 다음과 같은 인터페이스가 나타날 것입니다.
그 이후, 프로필 → 일정 → 관리로 진입하여 등록된 일정을 확인할 수 있습니다.
등록된 일정을 눌러보면 다음과 같이 일정이 등록되어 있는 것을 볼 수 있으며 이제 매주 월요일 오전 8시마다 최신 AI 뉴스를 수집하여 요약할 것입니다.
활용 Tip.
ChatGPT 작업은 웹 서버 로그 분석처럼 특정 주기별로 처리해야 하는 작업이나 투자에서 경제, 섹터, 기업에 관한 최신성 있는 정보를 얻어와야 할 필요가 있을 때 유용하게 사용할 수 있습니다. 다만 ChatGPT 작업은 스케줄링이기 때문에 실시간으로 푸시되어야 하는 일에는 적합하지 않습니다. 예를 들어 주식투자에서 특정 뉴스를 보고 빠르게 매매하는 이벤트 매매에는 적합하지 않습니다.
ChatGPT 작업에 예약된 일정은 수행하는 즉시 알림으로 전송되는데요, 이러한 알림은 다음과 같이 프로필 → 알림에서 설정할 수 있습니다. 또한 ChatGPT 에이전트는 작업을 수행하는데 시간이 오래 걸리는데, 이를 무작정 기다리고만 있는 것은 낭비이므로 작업이 완료되었을 때 알림을 받을 수 있습니다.
정리하자면, 에이전트는 사용자의 문제를 해결하기 위해 스스로 문제를 해결하기 위한 계획을 수립하여 작업을 수행할 수 있는 AI이며, 주요 구성요소로는 기초 모델, 시스템 프롬프트, 지식, 도구가 있습니다. ChatGPT를 비롯한 대부분의 생성형 AI 서비스에서는 에이전트를 제공합니다. Genspark와 같은 서비스에서는 특화된 에이전트를 제공하기도 합니다.
ChatGPT 에이전트는 ChatGPT에서 제공하는 가장 범용 에이전트이자 연구, 분석, 생성 등의 다양한 작업을 수행할 수 있습니다. 다만 일반적인 대화에 비해 더 가능한 일이 많고 응답의 품질이 높은 만큼 작업의 시간이 오래 걸릴 수 있는데, 이는 사용자 단에서 프롬프트 엔지니어링으로 조절합니다.
ChatGPT 작업은 ChatGPT에서 제공하는 에이전트 기능 중 하나로써, ChatGPT에서 태스크 스케줄링을 위해 사용할 수 있는 기능입니다. 반복되는 작업을 일정으로 예약해 둘 수 있습니다.
'비전공자를 위한 챗GPT 101'은 단순하게 챗GPT 사용법을 이야기하는 것이 아니라, 생성형 AI를 활용하기 위해 알아야 하는 기초를 대표적인 생성형 AI 서비스인 챗GPT를 사용하여 풀어냅니다. 물고기를 잡아주기보다는 물고기를 잡는 법을 알려줍니다.
챗GPT를 사용하는 활용법은 간단한 글쓰기부터 시작해서 기획, 마케팅 등 너무나도 많고, 직무마다 다른데, 이 글들은 '이메일 쓰기', '통계 분석하기 같은' 단순한 '사례'만을 이야기하지 않습니다. 생성형 AI의 '기본'을 이야기함으로써 챗GPT를 자유롭게 구사하며 실무에서 활용할 수 있도록 뼈대를 쌓습니다.