오픈AI, 에이전트의 미래를 여는 'Operator' – o3 모델로의 진화
글로벌연합대학교 인공지능융합연구소장
버지니아대학교 이현우 교수
2025년 5월, 오픈AI는 자사의 컴퓨터 사용 에이전트(CUA)인 '오퍼레이터(Operator)'를 획기적으로 업그레이드하면서 인공지능(AI) 기반의 에이전트 기술 분야에 새로운 전환점을 예고했다. 이번 발표에서 핵심은 오퍼레이터의 기반 모델을 기존의 GPT-4o에서 최신형 추론 특화 모델인 'o3'로 교체한 것이다. GPT-4o는 다양한 모달 입력을 유연하게 처리할 수 있는 다기능 모델이었으나, o3는 특히 복잡한 명령 처리와 논리적 추론에서 더 뛰어난 성능을 발휘하는 데 중점을 둔 모델이다. 이처럼 성능 중심으로 설계된 o3를 오퍼레이터에 통합함으로써, 오픈AI는 단순한 챗봇 이상의 '작업 수행형 에이전트'를 완성 단계로 끌어올리고자 한다. 이러한 변화는 단순한 기능 개선이 아닌, 사용자와 AI 간 상호작용의 패러다임 자체를 재정의하는 혁신으로 해석될 수 있다. 오퍼레이터는 이제 웹 기반의 다양한 실무를 수행할 수 있는 차세대 디지털 파트너로 진화하고 있으며, 이를 통해 오픈AI는 생산성 향상, 시간 절약, 자동화된 디지털 행위의 미래를 구체화하고 있다.
오퍼레이터의 초기 버전은 지난 1월에 첫 공개되었으며, 사용자 대신 웹 브라우저 내에서 클릭, 스크롤, 텍스트 입력 등의 기능을 자율적으로 수행할 수 있는 에이전트로 설계되었다. 당시에는 정보 검색, 온라인 쇼핑, 식당 예약 등 일상적인 웹 작업을 대리로 처리해주는 기능이 소개되었지만, 실사용자들 사이에서는 반응 속도와 명령 이해력의 한계, 브라우저 동작의 정확성 등에 대해 다소 회의적인 평가가 존재했다. 그러나 이번에 o3 모델을 통합함으로써, 이러한 한계를 극복하고 더욱 지능적인 작업 수행이 가능해졌다. 특히 o3는 언어의 맥락을 깊이 있게 해석하고, 여러 단계를 거쳐야 하는 복잡한 지시사항도 손쉽게 해결할 수 있도록 고도화되어 있다. 이는 단지 기술적 진보에 그치는 것이 아니라, AI가 사용자의 생각과 논리를 보다 정밀하게 이해하고 반영할 수 있는 수준으로 접어들었음을 시사한다.
성능 지표 측면에서도 o3 기반 오퍼레이터는 눈에 띄는 향상을 보이고 있다. 오픈AI가 공개한 자료에 따르면, 웹 기반 작업 처리 능력을 평가하는 'OSWorld' 지표에서 o3는 42.9점을 기록해 GPT-4o의 38.1점을 상회했다. 이 점수 차이는 표면적으로는 작아 보일 수 있으나, 오픈AI 측은 "자동화된 평가 시스템이 실제 성능 격차를 충분히 반영하지 못한다"며 실제 성능 차이는 최대 20포인트에 달할 수 있다고 설명했다. 'WebArena' 지표에서는 62.9점 대 48.1점으로 차이가 더 확연했으며, 특히 고차원적인 AI 에이전트 능력을 측정하는 'GAIA' 지표에서 o3는 62.2점, GPT-4o는 12.3점이라는 극명한 차이를 보였다. 이러한 수치는 단순한 성능 개선 그 이상을 보여주는 지표이며, o3가 진정한 의미의 에이전트 지능을 구현하고 있다는 방증으로 받아들여진다.
사용자 인터페이스와 상호작용 품질에서도 o3 기반 오퍼레이터는 큰 진전을 이뤘다. 예를 들어, 사용자가 식당 예약을 요청했을 때 GPT-4o는 대체로 텍스트 나열 중심의 응답을 제공하는 데 그쳤지만, o3는 위치, 미슐랭 등급, 시간대, 좌석 배치 등의 정보를 표 형태로 정리해 제공하며, 직관성과 정확성을 동시에 잡았다. 이는 단지 출력의 형태적 개선을 의미하는 것이 아니라, AI가 정보를 어떻게 구조화하고 시각적으로 전달하는지를 새롭게 정의한 사례라 할 수 있다. 사용자 선호도 평가에서도 o3는 스타일, 응답 구성, 명확성, 지시 이행 능력에서 GPT-4o를 압도적으로 앞섰으며, 이는 사용자 중심의 인터페이스 설계에 있어서도 o3가 새로운 기준을 제시하고 있다는 점에서 의미가 깊다. 이러한 발전은 AI와 인간의 협업 방식에 혁신적인 전환을 가져올 것으로 보이며, 단순한 정보 제공자가 아닌 능동적 해결사로서의 AI 역할을 강화하는 계기가 된다.
보안성과 프라이버시 측면에서도 오퍼레이터는 발전을 거듭하고 있다. 오픈AI는 이 에이전트를 기존 웹 브라우저 위에서 동작시키는 방식이 아닌, 자체 개발한 가상 브라우저 환경인 operator.chatgpt.com 내에서 작동시키는 방식으로 설계했다. 이 환경은 클라우드 기반으로 사용자 데이터를 저장하지 않으며, 실시간 관찰 기능과 감시 모드(Watch Mode), 고위험 웹사이트 차단 기능 등을 포함해 보안성 면에서 한층 강화되었다. 특히 민감한 금융 정보나 개인 신상 정보가 다뤄질 가능성이 높은 업무를 수행할 때, 사용자의 신뢰를 확보하기 위한 장치들이 잘 마련되어 있다. 이러한 기능은 기업 사용자뿐만 아니라 의료, 법률, 금융 등 규제가 엄격한 산업군에서도 AI 에이전트를 활용할 수 있는 기반을 마련해 준다. o3 기반 오퍼레이터는 단순한 '성능 개선'의 개념을 넘어, '신뢰할 수 있는 AI'로의 진화를 동시에 이루고 있으며, 이는 향후 AI 기반 업무 자동화 시장에서 경쟁력을 좌우하는 중요한 요인이 될 것이다.
현재 오퍼레이터는 아직 '연구 미리보기(Research Preview)' 단계로, 월 200달러를 지불하는 챗GPT 프로 사용자만 이용할 수 있다. 그러나 이 제한된 환경 속에서도 오퍼레이터는 이미 의미 있는 반응을 얻고 있으며, 향후 일반 소비자뿐 아니라 기업 및 공공기관 등 다양한 사용자층으로 확대될 것으로 전망된다. 오픈AI는 향후 오퍼레이터를 API 형태로도 공개해 기업들이 자체 서비스에 통합할 수 있도록 지원할 계획을 세우고 있다. 이는 단지 AI가 사용자 개인의 어시스턴트를 넘어, 산업 전반의 자동화와 디지털 전환의 핵심 축으로 자리 잡을 수 있음을 시사한다. o3 모델을 기반으로 한 오퍼레이터의 등장은, 기술적 진보와 함께 사용자 경험, 보안, 산업 확장성 등을 모두 포괄하는 포괄적 진화라 할 수 있다. 향후 이 에이전트가 인간의 업무 방식을 어떻게 바꾸어놓을지, 또 그 변화 속에서 우리는 어떤 선택과 책임을 마주하게 될지에 대한 사회적 논의 또한 본격화될 것이다.