월 2만원 내고 채팅만 하고 있다면 꼭 읽어봐야할 글
ChatGPT Plus, Gemini Advanced, Claude Pro, Grok Premium.
이전 글에서 설명했던 요즘 가장 잘나가는 4대장이다.
한 달에 2~3만원 정도하는 가격. 이걸로 과연 무엇을 하고 있는가.
"질문하면 답변해주는 거 아니야?" "모르는거 물어보면 잘 대답해주던데?"
맞다. 근데 그건 무료로도 된다. 유료 구독료는 그 이상을 위한 것이다.
각 서비스마다 "이건 진짜 돈 값 한다"는 기능들이 있다. 대부분 사람들이 모르거나 안 쓰고 있으니 이 글을 통해 알아가자.
글 중간 중간 강력추천기능 이 알짜배기 기능이다.
더 이상 지브리에 갇혀있지 말자.
"해변에서 일몰을 바라보는 사람의 실루엣"이라고 치면 영화 퀄리티까지는 아니지만 알맞은 영상이 SNS 콘텐츠나 프레젠테이션용으로 생성된다.
PowerPoint 주요 포인트에 센스있게 사용해보자.
1. Text-to-Video (텍스트 → 영상)
텍스트 프롬프트만으로 영상 생성
2. Image-to-Video (이미지 → 영상)
- 정지 이미지를 업로드하고 어떻게 움직일지 텍스트로 설명
- 사진, 일러스트, 제품 이미지 등을 애니메이션화
- 카메라 움직임, 자연스러운 깊이감 추가
3. Partial Animation (부분 애니메이션)
- 이미지의 특정 영역만 페인트해서 그 부분만 움직이게 하고 나머지는 정적 유지
- 전문적인 컨트롤된 애니메이션에 유용
추가 기능
- 현실적인 물리 시뮬레이션 (중력, 관성 등)
- 배경음, 대화, 효과음 자동 생성 및 싱크
- 2025년 10월 업데이트로 손 생성 15%, 텍스트 렌더링 20%, 시간적 일관성 10% 향상
Plus: 720p, 5초, 월 1,000 크레딧
Pro: 1080p, 20초, 월 10,000 크레딧, 워터마크 없음
"항공권 예약해줘", "이 양식 작성해줘" 같은 요청을 실제로 처리한다.
Operator라는 이름으로 2025년 1월에 나왔다가, 지금은 Agent Mode로 ChatGPT에 통합됐다.
웹 브라우저를 조작해서 폼 작성, 예약, 주문까지 대신 해주는 이 기능은 꽤 복잡한 브라우저 워크플로우를 소화시킬 수 있다.
Computer-Using Agent (CUA) 모델의 작동 원리는 다음과 같다.
1. Microsoft Azure 위의 Linux 가상머신에서 "가상 브라우저" 실행
2. AI가 스크린샷을 찍어서 화면을 "본다"
3. 마우스 클릭, 키보드 입력으로 실제 웹페이지 조작
4. 실수하면 스스로 추론해서 수정
→ API 연동 없이 일반 웹사이트를 사람처럼 조작합니다.
실제 할 수 있는 것
- 웹사이트 탐색 및 네비게이션
- 폼 작성 (예약, 신청서 등)
- 스프레드시트 편집
- 파일 업로드/다운로드
- 이메일, 문서 저장소 연결
작업 완료까지 보통 5~30분 소요.
내가 생각하기에 이 기능의 가장 큰 장점이나 활용처는 데이터 크롤링이다. 동적 홈페이지로 가득한 인터넷 세계에 크롤러들이 매번 고전하는데 이런 가상 브라우저 머신은 여기저기 계층화 되어있는 정보 빼내기에 안성맞춤이다.
Google Drive, Gmail, Slack, Notion, GitHub, Linear, Asana, Salesforce, Google Calendar 등 다수의 앱과 연결된다.
한 번 연결하면 "내 드라이브에서 지난달 보고서 찾아줘", "Slack에서 마케팅 채널 내용 요약해줘"가 가능하다. Google Calendar를 연결하면 "오늘 일정 뭐야?", "다음 주 회의 빈 시간 찾아줘"도 된다. 복사-붙여넣기 없이.
최근엔 포토샵도 연결되어 누끼따기 등과 같은 작업도 ai로 직접 해볼 수 있다. 내가 생각하는 GPT의 돌파구. 이걸로 몰아부쳐서 범접할 수 없는 수준까지 가면 좋겠다.
무료/Go 플랜은 Connectors 사용 불가.
이게 Gemini의 핵심이다.
일반 AI가 5초 만에 답하는 걸, Deep Research는 20분 동안 작업한다. 수백 개의 웹사이트를 읽고, 링크를 타고 들어가고, 종합 보고서를 작성한다.
경쟁사 분석, 시장 조사, 기술 트렌드 파악 — 이런 걸 혼자 하려면 며칠 걸리지만 Deep Research를 활용하면 몇 십 분이면 된다.
결과물에 출처도 다 달려있어서 검토하는데 문제도 없고 본인 파일/이미지도 소스로 업로드 가능하다. 또한 자체 문서 편집 환경인 Canvas에서 인터랙티브 시각화, 퀴즈 등으로 변환할 수도 있고 Google Docs로 뽑아낼 수 도있다.
2. Canvas — AI와 함께 쓰는 문서 (Pro부터)
채팅창이 아니라 문서 편집기 같은 화면이 나온다. 특정 문장을 드래그해서 "이 부분만 더 전문적으로"라고 하면 그 부분만 수정된다.
코드도 된다. "이 데이터를 보여주는 대시보드 웹페이지 만들어줘"라고 하면 HTML/CSS/JS 코드를 작성하고 바로 미리보기로 확인할 수 있다. 간단한 랜딩 페이지나 데이터 시각화 페이지 정도는 코딩 없이 만들 수 있다.
더 좋은 건, Canvas에서 바로:
웹페이지로 변환
인포그래픽 생성
퀴즈 제작
Audio Overview (팟캐스트 형식 요약)
문서 하나로 여러 형태의 콘텐츠를 만들 수 있다.
PDF, 슬라이드, Deep Research 결과물을 팟캐스트 형식의 오디오로 변환한다.
두 명의 진행자가 대화하듯이 내용을 설명한다. 출퇴근길에 보고서 "읽는" 대신 "듣는" 게 가능하다.
무료: 하루 3개
Pro: 하루 20개
더 긴 심층 대화가 필요하면 NotebookLM을 쓰면 된다. Pro 구독에 포함되어 있다.
여러 문서를 업로드하고 그 문서들만을 기반으로 AI와 대화한다.
노트북당 최대 50개 문서 업로드
문서 내용 기반 정확한 답변
Audio Overview가 더 길고 심층적 (10~30분 팟캐스트)
업로드 문서 기반 보고서 작성
업로드 문서 기반 표, 인포그래픽, 슬라이드 자료 생성
논문 리뷰, 계약서 분석, 교재 학습에 유용하다. Pro는 일일 채팅 500회, 오디오 20개까지 생성이 가능한데 이정도면 일반인한테 과분하다 생각한다. 이해 안되는 논문을 넣고 이해하기도 너무 편하고, 컨퍼런스, 회의록 등 작성할때에도 매우 편리하다. 특히 PPT슬라이드 생성 기능은 어지간한 사무직들보다 발표자료를 잘 만든다. 물론 후가공하기 어려운 단점이 있지만 난 매우 강력히 추천하는 툴이다.
Google의 영상 생성 모델. Flow라는 AI 영화 제작 도구도 있다. 텍스트로 영상을 만들고, 기존 영상을 편집하고, 사진을 영상으로 변환할 수 있다.
난 영화, 영상 업계에 몸 담고 있는 입장은 아니어서 어느정도의 파급력을 가지고 있는지 모르지만, 내가 느끼기에 프롬프팅 & 컨셉만 잘 잡는다면 정말 강력할 툴이라 생각한다. 다만 Pro 모델은 하루에 생성할 수 있는 영상 갯수가 3개로 한정되어있어 많이 아쉽다. 영상 생성이 업이라면 Ultra를 써보는것도 생각해 볼만하다.
Pro: Veo 3.1 Fast (제한적 액세스)
Ultra: Veo 3.1 풀 액세스
사진을 자연어로 편집한다. "배경 블러 처리해줘", "이 얼룩 지워줘", "흑백 사진에 색 입혀줘", "이 사람 포즈 바꿔줘" 라는 명령어만으로, 포토샵 없이 말로 사진을 고친다. 모델 사진을 찍어놓은 채 제품 사진을 나열한 다음 자체적으로 착장을 만들어 낼 수도 있다.
이게 Claude의 킬러 기능이다.
"Q3 매출 데이터로 엑셀 보고서 만들어줘"라고 하면 진짜 .xlsx 파일이 나온다. 수식 포함, 서식 적용된 상태로. 예를 들어 "웹에서 2024년 전기차 판매량 데이터 찾아서 국가별로 정리한 엑셀 파일 만들어줘"라고 하면 웹 검색 → 데이터 수집 → 엑셀 파일 생성까지 한 번에 처리한다.
엑셀 작업 많은 사람한테 이거 하나만으로 구독료 뽑는다. 개인적으로 파워포인트는 기본 템플릿을 가지고 있다면 꽤 높은 퀄리티를 뽑아내지만 순수 체급으로 만들어내라고 하면 아쉬운 결과가 나온다. 다만 word, excel, pdf 생성 등의 작업은 기가 막힌다. 강력히 추천.
Excel: 수식, 피벗 테이블, 차트, 데이터 검증
PowerPoint: 템플릿 기반 프레젠테이션, 이미지 배치
Word: 트래킹된 변경사항, 레드라인 작업
Model Context Protocol. Claude를 Asana, Google Calendar, Slack 등과 연결한다.
Artifacts에서 바로 외부 서비스 데이터를 읽고 쓸 수 있다. "오늘 캘린더 일정 확인해서 회의 준비 자료 만들어줘" 같은 게 가능해진다.
MCP Apps라는 확장 기능으로 인터랙티브 UI도 만들 수 있다.
코드나 문서를 만들면 옆 패널에서 바로 실행 결과가 보인다. 간단히 웹, 앱 프로토타입을 만들어서 팀원들에게 공유해도 좋다. 난 데이터 시각화(BI) 용으로 꽤 자주 쓴다. 몇 개월 간 비용 추적 시각화 자료를 높은 퀄리티로 쉽고 빠르게 url 공유가 가능해 활용성 높다 생각한다.
2026년 업데이트로 Persistent Storage가 추가됐다고 한다. 세션이 끝나도 데이터가 유지되어(최대 20MB) 일기장, 습관 트래커, 협업 도구 같은 걸 만들어서 계속 쓸 수 있다.
엑셀 프로그램 안에서 Claude를 부른다. 피벗 테이블 만들고, 차트 그리고, 복잡한 수식 작성하고 — 엑셀 창을 벗어나지 않고 AI 도움을 받는다. 정말 좋은데 사내 보안 규정으로 못쓰는 케이스가 많다. 확인을 해보고 쓰면 좋겠다.
Grok의 차별점. X 플랫폼의 실시간 데이터에 접근한다.
"지금 비트코인에 대한 여론이 어때?", "이 주제로 트렌딩 되는 게 뭐야?" — 실시간으로 소셜 미디어 감정 분석이 가능하다.
다른 LLM회사들과 달리 본인 소유의 SNS가 있는 XAI는 똑똑한것 뿐 아니라 실시간 데이터를 추적해서 가지고 온다. 민감한 정보, 1분 1초가 중요한 정보들을 서치함에 있어 뉴스나 기사는 f/up까지 시간이 너무 오래 걸리지만 Grok은 지금 이순간을 쫓을 수 있다. 물론 Instagram, thread, facebook은 트래킹 안되지만 전세계에서 X가 가지고 있는 영향력을 생각해봤을때 절대로 무시할 수 없는 파워라 생각한다.
텍스트로 이미지와 짧은 영상 클립을 생성한다. Gemini 와 ChatGPT에 가려 성능에 대해 이슈가 안되고 있지만 꽤 퀄리티가 좋고 생성할 수 있는 양이 무제한인게 큰 장점이다. 특히 다른 플랫폼과 달리 박진감 넘치는 동영상 생성이 가능하다는게 뽀족한 장점이다.
Premium+: 2시간당 100개 프롬프트/이미지
SuperGrok: 무제한 생성, 고품질
X Premium+: $40/월 — X 기능 + Grok 제한적 액세스
SuperGrok: $30/월 — Grok 풀 액세스 (X 기능 제외)
SuperGrok Heavy: $300/월 — Grok-4 Heavy, 최대 연산력
Premium+ 유저는 SuperGrok 50% 할인.
둘 다 $20 수준. 일반적인 질문, 글쓰기, 코딩 도움에 둘 다 충분하다.
Google 생태계 많이 쓴다 → Gemini
앱 연동이나 자동화 원한다 → ChatGPT
시장 조사, 경쟁사 분석, 기술 트렌드 파악이 필요하면 Deep Research가 독보적이다.
Excel, PPT, Word 파일을 AI로 만들고 싶다면 Claude가 유일하다. 특히 엑셀 업무 많은 직장인에게 강력 추천. 만약 본인 회사나 업무에 월 100달러, 혹은 200달러 지원해 줄 수 있는 상황이라면 무조건 Claude Max 를 추천한다. 사용량 제한이 많이 걸려서 GPT, Gemini 를 추천하는 것 뿐이지, 만약 돈을 많이 쓸 수 있는 상황이라면 100이면 100 전부 Claude에 손을 들어줄 것이다.
X 기반 실시간 여론, 트렌드 분석이 필요하면 Grok 외에 대안이 없다. 네이버 블로그, 기사 등 관련 데이터 접근이 가능한 유일한 LLM이다... 국내 맛집 검색하기에 안성맞춤.
마케터, 트레이더, 기자에게 유용하다.
짧은 SNS 클립 → ChatGPT Plus (Sora)
더 긴 영상, 영화급 → Gemini Ultra (Veo) 또는 ChatGPT Pro (Sora Pro)
ChatGPT
- Introducing Operator — OpenAI
- Introducing ChatGPT agent — OpenAI
- ChatGPT agent Help Center — OpenAI
- ChatGPT Canvas & Projects Update — Data Studios
- https://blog.adobe.com/ko/publish/2025/12/12/edit-photoshop-chatgpt — Adobe
Gemini
- Generate presentations in the Gemini app — Google Workspace Updates
- Gemini Canvas — Google
- Gemini Drops: October 2025 — Google Blog
Claude
- Claude Skills — Anthropic
- MCP (Model Context Protocol) — Anthropic
Grok
- Grok gains a canvas-like tool for creating docs and apps — TechCrunch Sora
- Sora 2 Features Guide — Sora2.ink