"AI 비서"에서 "AI 동료"로 한 발짝 더 다가간 느낌
3월 5일, OpenAI가 GPT-5.4를 공개했습니다. 불과 이틀 전 GPT-5.3 Instant를 내놓은 직후였습니다. Anthropic이 Claude 무료 사용자에게 기억(memory) 기능을 열어주면서 역대 최대 가입자를 기록한 직후이기도 했습니다. OpenAI 입장에서는 빠르게 반격할 필요가 있었고, 그 카드가 바로 GPT-5.4인 셈입니다.
이번 모델은 단순한 성능 업그레이드가 아닙니다. 컴퓨터를 직접 조작하고, 100만 토큰(AI가 한 번에 읽을 수 있는 분량 단위)이라는 방대한 맥락을 처리하며, 엑셀과 구글 시트에 직접 들어가 일하는 모델입니다. "AI 비서"에서 "AI 동료"로 한 발짝 더 다가간 느낌이 듭니다.
GPT-5.4의 가장 눈에 띄는 변화는 "컴퓨터 사용(Computer Use)" 기능입니다.
쉽게 말하면, AI가 화면을 보고 마우스를 클릭하고 키보드를 치는 겁니다. 사람이 컴퓨터 앞에 앉아서 하는 일을 AI가 대신할 수 있게 된 것입니다.
이건 Anthropic의 Claude가 먼저 선보인 기능이기도 합니다. 하지만 GPT-5.4는 벤치마크에서 상당히 인상적인 결과를 보여줍니다. 데스크톱 환경에서 화면을 보고 작업을 수행하는 OSWorld 테스트에서 75.0%의 성공률을 기록했는데, 이는 사람의 성공률(72.4%)을 넘어선 수치입니다. 이전 모델인 GPT-5.2가 47.3%에 머물렀던 것과 비교하면, 한 세대 만에 거의 두 배 가까이 뛴 겁니다.
웹 브라우징 테스트(BrowseComp)에서도 82.7%를 기록하며, 복잡한 정보를 찾아내는 능력이 크게 향상되었습니다. 솔직히 이 정도면 "AI가 컴퓨터를 쓴다"는 말이 더 이상 과장이 아니라는 생각이 듭니다.
토큰이란 AI가 텍스트를 처리하는 단위입니다. 한국어 기준으로 100만 토큰이면 대략 소설책 3~4권 분량에 해당합니다. GPT-5.4는 API와 Codex에서 최대 100만 토큰의 맥락을 지원합니다.
이게 실무에서 어떤 의미냐면, AI에게 프로젝트 문서 수십 개를 통째로 넘겨주고 "이걸 분석해서 보고서 만들어줘"라고 할 수 있다는 뜻입니다.
이전에는 문서를 쪼개서 나눠 넣어야 했지만, 이제는 전체 맥락을 한 번에 파악할 수 있게 된 겁니다. 다만 27만 2천 토큰을 넘기면 비용이 두 배로 올라간다는 점은 알아두어야 합니다.
직장인 입장에서 가장 반가운 소식일 수 있습니다. OpenAI가 GPT-5.4와 함께 ChatGPT for Excel 애드인을 출시했습니다. 엑셀 셀 안에서 직접 AI를 불러 분석하고, 수식을 만들고, 데이터를 정리할 수 있게 된 겁니다. 구글 시트도 동일하게 지원됩니다.
OpenAI는 내부 투자은행 업무 벤치마크에서 GPT-5 대비 GPT-5.4 Thinking이 43.7%에서 88.0%로 성능이 뛰었다고 밝혔습니다. 재무 모델링, DCF 분석, 실적 프리뷰 같은 반복적이면서도 전문적인 작업에 특히 강해졌다는 의미입니다. FactSet, MSCI, Moody's 같은 금융 데이터 서비스와의 연동도 함께 발표되었습니다.
다만 이런 금융 특화 기능이 일반 사용자에게까지 얼마나 실질적으로 와닿을지는 지켜봐야 할 것 같습니다. 엑셀 애드인 자체는 기업용(Enterprise) 고객 위주로 먼저 제공될 것으로 보입니다.
개발자가 아니라면 지나치기 쉬운 기능이지만, 실은 상당히 중요한 변화입니다. 기존에는 AI에게 사용할 수 있는 도구 목록을 전부 알려줘야 했습니다. 도구가 10개면 괜찮지만, 36개 서버에 수백 개 도구가 연결되면 그 목록을 읽는 것만으로도 상당한 비용과 시간이 들었습니다.
GPT-5.4의 도구 검색 기능은 이 문제를 구조적으로 해결합니다. AI가 필요한 도구만 그때그때 찾아서 쓰는 방식입니다. OpenAI의 테스트에서는 36개 MCP 서버 환경에서 정확도는 동일하면서 토큰 사용량이 47% 줄었습니다. 비용과 속도 모두 개선되는 셈입니다.
이 기능이 왜 중요하냐면, AI 에이전트가 점점 더 많은 도구를 연결해서 쓰는 시대가 오고 있기 때문입니다. 도구가 많아질수록 효율이 떨어지는 문제를 근본적으로 해결한 것이라, 앞으로의 확장성 측면에서 의미가 큽니다.
GPT-5.4 Thinking은 ChatGPT Plus(월 20달러, 약 2만 9천 원) 이상 구독자에게 제공됩니다.
GPT-5.4 Pro는 ChatGPT Pro(월 200달러, 약 29만 원)와 Enterprise 사용자 전용입니다.
무료 사용자도 질문에 따라 자동으로 GPT-5.4가 적용되는 경우가 있지만, 직접 선택할 수는 없습니다.
API 개발자라면 100만 토큰 컨텍스트, 컴퓨터 사용 기능, 도구 검색을 모두 활용할 수 있습니다.
다만 컴퓨터 사용 기능은 현재 API와 Codex에서만 지원되며, ChatGPT 일반 대화에서는 아직 사용할 수 없습니다.
GPT-5.4 출시의 배경에는 치열한 경쟁이 있습니다. Anthropic의 Claude가 컴퓨터 사용 기능을 먼저 선보였고, 최근에는 Cowork이라는 협업 도구까지 출시했습니다. 구글의 Gemini도 빠르게 성장하고 있습니다. OpenAI가 이틀 간격으로 연달아 모델을 공개한 것 자체가 이 경쟁의 긴박함을 보여줍니다.
흥미로운 점은, 이제 AI 모델 경쟁의 축이 "얼마나 똑똑한가"에서 "얼마나 실제로 일할 수 있는가"로 옮겨가고 있다는 것입니다. 컴퓨터를 조작하고, 스프레드시트를 다루고, 여러 도구를 연결해 업무를 수행하는 능력. 사실 이런 기능들은 원래 모델 바깥의 에이전트 프레임워크들이 담당하던 영역이었습니다. 모델 회사들이 이 기능을 모델 안으로 흡수하기 시작했다는 건, 결국 대화형 AI의 종착지가 "에이전트"라는 데 업계가 합의하고 있다는 뜻이기도 합니다.
OpenAI, Anthropic, Google 할 것 없이 모두 같은 방향을 향해 달리고 있습니다. 도구를 쓰고, 컴퓨터를 조작하고, 긴 맥락을 기억하며, 스스로 판단해서 일을 처리하는 AI. 이름만 다를 뿐, 지향점은 하나로 수렴하고 있는 셈입니다. GPT-5.4는 그 수렴이 더 이상 먼 미래가 아니라는 것을 보여주는 모델입니다.
TechCrunch - OpenAI launches GPT-5.4 with Pro and Thinking versions
VentureBeat - OpenAI launches GPT-5.4 with native computer use mode
Ars Technica - OpenAI introduces GPT-5.4 with more knowledge-work capability