AI 구독료의 함정
ChatGPT Plus $20, Claude Pro $20, Google AI Pro $20.
세 개 다 쓰면 한 달에 $60이다.
과연 이건 경제적일까?
계산해봤다.
모든 서비스가 월 $20 선에서 만난다.
그렇다면 API 비용은 어느정도일까?
토큰은 단어가 아니다.
LLM은 텍스트를 단어 단위가 아니라 더 작은 조각으로 쪼개서 처리한다. 영어 "unhappiness"는 한 단어지만 "un"과 "happiness" 두 토큰이 된다. 짧은 단어는 통째로 한 토큰, 긴 단어나 전문 용어는 여러 토큰으로 나뉜다. 영문 기준 1토큰 ≈ 0.75단어, 그러니까 1M 토큰은 약 75만 단어다. 소설 한 권이 8만 ~ 10만 단어니까 소설 79권 분량이다. 하지만 기본적으로 우리가 쓰는 LLM들은 한국어 based 학습 모델이 아니기에 한국어, 중국어 등 을 표현하는 데 토큰이 몇 배나 더 든다.
https://brunch.co.kr/@230kimi/44
API로 채팅을 구현하면 매 메시지마다 이전 대화 전체를 다시 보내야 한다. 이게 비용 구조의 핵심이다.
전제 조건:
시스템 프롬프트: 200토큰
유저 메시지: 평균 100토큰
AI 응답: 평균 400토큰 (실측 평균은 약 260토큰이지만 업무용 상세 응답을 감안해 높게 잡았다 [14])
이전 대화: 매 턴마다 누적
N번째 턴에서 보내는 input 토큰 수는 이렇게 늘어난다.
Input(N) = 200 + 100 + (N-1) × 500 = 500N - 200
1턴째 300토큰이던 input이, 10턴째는 4,800토큰이 된다. 대화가 길어질수록 input 비용이 급격히 올라간다.
10턴 대화 1회의 토큰 소비:
합계는 등차수열 합산으로 계산했다.
[for n=1..10]
Σ(500n − 200) = 25,500.
10턴 대화 한 번에 약 29,500토큰이 소비된다.
그렇다면 각 모델별 대화 10턴 진행 시 비용이 얼마나 나올까?
Gemini 3 Flash는 10턴 대화 한 번에 2.5센트. 100원도 안 된다.
Claude Sonnet 4.6이 가장 비싸지만 그래도 13.7센트, 약 180원이다.
한턴 대화하는데 100~200원이 든다 생각하면 생각보다 비싼가? 싶기도 할 것이다. 하지만 실제 우리가 매달 구독하는 비용으로 계산을 해본다면?
구독료 한 달치인 $20를 API에 쓰면
하루 49개 메시지. 출근해서 퇴근할 때까지 한 시간에 6개씩 보내는 셈이다. 대부분의 업무용으로 충분하다.
Gemini 3 Flash는 하루 269개. 하루 종일 대화해도 한도에 걸리기 어렵다.
다만 구독에도 한도가 있다. 이 한도를 계산해야 공정한 비교가 된다.
ChatGPT Plus가 가장 넉넉하다. 다만 한도가 동적으로 조정된다 — 출처에 따라 3시간에 100~160개로 추정이 다름.
보수적으로 100개 기준으로 잡아도 하루 533개, 넉넉한 추정(160개)이면 하루 853개다.
Claude Pro는 5시간에 45개. 단, 이건 "짧은 대화" 기준이다. 긴 컨텍스트 대화에서는 토큰 가중치가 적용돼서 실제로는 훨씬 적게 쓸 수 있다.
Google AI Pro는 가장 단순하다. 하루 100개, 끝.
각 서비스의 현실적 최대 사용량을 그 서비스의 API 가격으로 계산하면 다음과 같다.
ChatGPT Plus를 한도까지 쓰면 API로는 $115~$184가 든다. 보수적으로 잡아도 6배 이상 이득이다.
Claude Pro는 $59 어치. 약 3배.
Google AI Pro는 $7.4 어치 — 다만 이건 Gemini 3 Flash 기준이다.
하지만 실제로 사람들은 구독 한도를 다 채우지 않는다. 사용 패턴별로 계산했을때 다음과 같다.
하루 10개만 보내면 세 모델 전부 합쳐도 월 $7이다. 구독 하나 값의 1/3.
세 모델 다 써도 $21. 구독 3개 합계($60)의 1/3이다.
하루 100개부터 이야기가 달라진다. GPT-5는 구독과 비슷해지고, Claude Sonnet 4.6은 구독의 2배를 넘긴다. Gemini 3 Flash만 여전히 구독의 37%다.
이 수준이면 구독이 압도적으로 유리하다. 단, Gemini 3 Flash만큼은 하루 200개를 보내도 구독보다 싸다.
가장 중요한 손익분기점.
하루 몇 개 메시지부터 구독이 이득인가?
Claude Sonnet 4.6은 하루 49개, GPT-5는 93개를 넘기면 구독이 이득이다.
Gemini 3 Flash는 하루 269개를 넘겨야 구독이 싸진다. 사실상 API가 거의 항상 이긴다.
이 계산은 "영문 기준 순수 텍스트 채팅"이다. 실전에서는 몇 가지 변수가 더 있다.
Prompt Caching. 시스템 프롬프트나 반복되는 컨텍스트를 캐싱하면 해당 부분의 input 비용을 최대 90% 줄일 수 있다. 다만 매 턴 새로 추가되는 유저 메시지와 AI 응답에는 캐싱이 적용되지 않으므로, 전체 비용 절감은 30~40% 수준이다.
Thinking 토큰.
GPT-5, Gemini 3 Flash, Claude Sonnet 4.6(extended thinking) 모두 내부적으로 "생각"하는 과정에서 토큰을 소비한다. 이 토큰은 응답에 보이지 않지만 output으로 과금된다. 복잡한 추론 질문을 하면 실제 output이 2~10배로 뛸 수 있다.
위 계산의 output 400토큰은 thinking 없는 단순 대화 기준이다.
한국어 토큰.
위 계산은 영문 기준이다. 한국어는 같은 내용을 표현하는 데 토큰이 약 3배 더 든다. 한국어로만 대화한다면 손익분기점도 그만큼 낮아진다 — Claude Sonnet 4.6 기준 하루 25~33개 수준.
웹 검색, 파일 분석, 이미지 생성, Deep Research, Agent Mode — 이런 기능은 구독에 포함되지만 API로 따로 구현하면 추가 비용이 든다.
대부분의 사용자는 하루 30개도 안 보낸다. 그 기준에서 구독 3개($60)는 실제 사용량의 8배를 내는 셈이다.
하루 30개 이하 → API. 세 모델 합쳐도 월 $7. 구독 하나 값의 1/3이다.
하루 50~100개 → Gemini는 API, Claude·GPT는 구독이 낫다.
하루 100개 이상 → 구독. 단, Gemini Flash는 269개까지도 API가 싸다.
다만 한국어 사용자는 손익분기점이 절반으로 내려간다. Claude 기준 하루 25개면 이미 구독이 낫다.
구독이 필요 없다는 말이 아니다. 웹 검색, 이미지 생성, Deep Research 같은 기능은 구독에만 있고, Thinking 모드를 자주 쓰면 토큰 비용이 몇 배로 뛴다. 이런 기능이 필요하면 구독의 가치는 숫자 이상이다.
그럼에도 불구하고,
API로도 다 구현할 수 있다. 웹 검색 API, 이미지 생성 API, 문서 분석까지 전부 붙일 수 있고, 요즘은 바이브 코딩으로 나만의 챗봇을 만드는 것 자체가 어렵지 않다. 코딩을 몰라도 AI한테 시키면 된다 — 그게 바이브 코딩이니까.
물론 기능을 많이 붙이면 비용이 올라가지만, 사용한 만큼만 과금되는 구조라 갑자기 요금이 폭등할 일은 없다.
프라이버시도 API 쪽이 유리하다. OpenAI, Anthropic, Google 3사 모두 API 데이터는 모델 학습에 사용하지 않는다고 명시하고 있다. 구독 서비스는 기본적으로 대화 데이터가 학습에 활용될 수 있고, 옵트아웃을 직접 해야 한다. API는 반대다 — 기본이 비학습이다.
그리고 API로 쌓은 대화 데이터는 온전히 내 것이다. 구독 서비스의 대화는 그 서비스 안에 갇히지만, API로 직접 만든 시스템의 데이터는 내가 원하는 대로 저장하고, 검색하고, 분석할 수 있다. 지금은 단순한 채팅이지만, 쌓인 데이터를 기반으로 나만의 에이전트 — 내 맥락을 이해하고, 내 업무 패턴을 아는 AI — 로 발전시킬 수 있다.
이번 기회에 본인이 얼마나 쓰고 있는지 확인해 보도록 하자.
관련 글
https://brunch.co.kr/@230kimi/46
[1] Gemini Developer API Pricing — Google
[2] OpenAI API Pricing — OpenAI
[3] Claude API Pricing — Anthropic
[4] ChatGPT Plans & Pricing — OpenAI
[5] Claude Plans & Pricing — Anthropic
[6] Google AI Plans — Google
[7] GPT-5 Rate Limits Guide — Arsturn
[8] ChatGPT Plus Usage Limits 2026 — LaoZhang AI
[9] Understanding usage and length limits — Anthropic
[10] Google separates, raises Gemini 3 usage limits — 9to5Google
[11] Gemini 3 Flash API Pricing — PricePerToken
[12] GPT-5 API Pricing — PricePerToken
[13] Claude Sonnet 4.6 Pricing — Apidog
[14] How much energy does ChatGPT use? — Epoch AI
[15] Data controls in the OpenAI platform — OpenAI
[16] Is my data used for model training? — Anthropic
[17] Gemini API Abuse Monitoring & Data Usage — Google