brunch

알트먼의 ‘o3-미니’ 온디바이스 AI 선언

#AI 산업혁명

“손안의 GPT”를 향한 도전: 알트먼의 ‘o3-미니’ 온디바이스 AI 선언

글로벌연합대학교 인공지능융합연구소장

버지니아대학교 이현우 교수


AI의 다음 무대, 손안의 전장


2025년 6월, 오픈AI의 샘 알트먼 CEO는 단순한 설문 하나로 다시금 전 세계 인공지능 업계의 시선을 집중시켰다. X(구 트위터)에 올라온 그의 질문은 간단했지만, 그 함의는 결코 가볍지 않았다. “o3-미니 수준의 모델이 휴대폰에 탑재될 시기는 언제라고 생각하십니까?”라는 이 질문은 알트먼이 그동안 꾸준히 언급해 온 온디바이스 AI 모델에 대한 오픈AI의 구체적 행보를 예고하는 것이었다. 이는 단순한 온라인 투표가 아니라, 기술의 진화를 향한 여론을 수렴하고 업계 반응을 탐색하는 일종의 ‘사전 공개 리허설’이라 할 수 있다.

기술의 무게는 점점 더 가벼워지고 있다. 클라우드에서 AI가 작동하는 시대는 이미 도래했지만, 진정한 차세대 혁신은 **“클라우드 너머, 단말기 안”**에 있다. 알트먼이 거론한 ‘o3-미니’는 그 자체로 상징적이다. GPT-4 시리즈를 잇는 세대의 경량화 모델, 즉 추론 효율과 연산 속도, 메모리 압축 기술이 총체적으로 결합된 첨단 소형 모델이다. 이 모델이 휴대폰에 탑재될 수 있다면, AI는 더 이상 인터넷에 연결된 서버가 아닌 ‘개인의 손끝’에서 작동하게 된다. 이는 인간과 인공지능의 관계, 정보의 주권, 사용자의 프라이버시까지 재정의하는 중대한 변곡점이 될 수 있다.


‘o3-미니’라는 암호, 그리고 산업계의 촉각


알트먼은 구체적인 스펙을 밝히지 않았지만, IT 업계는 그의 질문에서 명백한 힌트를 읽어낸다. ‘o3-미니’라는 이름 자체가 단순한 표기가 아닌, 모델의 크기와 연산 범위를 가리키는 것으로 해석되고 있다. 일반적으로 GPT-3.5나 GPT-4 모델은 수백억 개 이상의 매개변수(parameter)를 보유한 반면, ‘미니’ 모델은 10B 이하로 추정되며, 이는 스마트폰에 실시간으로 탑재할 수 있는 수준의 AI 추론 모델을 의미한다.

이전에도 알트먼은 “GPU에서 실행해야 하지만 꽤 작은 모델이 낫겠는가, 아니면 가능한 최고의 휴대폰 모델이 더 유용한가”라는 유사한 질문을 제기한 바 있다. 이번 설문은 그 맥락에서 한 걸음 더 나아가, ‘휴대폰 탑재’를 명시적으로 언급했다는 점에서 주목된다. 이는 단순히 모델의 크기나 용도에 대한 고민을 넘어, **온디바이스 추론(AI inference on edge)**이란 기술철학에 오픈AI가 본격적으로 뛰어들겠다는 의지를 상징하는 변화다.


조니 아이브와의 협업, 그리고 하드웨어의 재구성


온디바이스 AI가 현실화되기 위해서는 하드웨어의 진화도 병행되어야 한다. 이런 맥락에서 조니 아이브와의 협업은 매우 전략적인 요소로 읽힌다. 애플의 전 수석 디자이너이자, 아이폰과 맥북 등 혁신적 디바이스를 설계해온 그는 이제 AI 하드웨어에 시선을 두고 있다. 그가 알트먼과 함께 개발 중인 새로운 기기는 **“인간-기계 상호작용의 미래”**를 설계하는 작업이라 할 수 있다.

해당 장치는 마이크와 카메라, 센서 등을 통해 실시간으로 세상을 인식하고, 오프라인에서도 사용자와 소통하는 장치가 될 것으로 보인다. 이러한 장치에서 클라우드 서버가 아닌, 현장에서 즉시 데이터를 처리하는 온디바이스 AI는 필수적이다. 즉, ‘o3-미니’는 단순한 모델이 아니라, AI의 물리적 구현을 위한 핵심 부품이 되는 것이다. 이는 결국 AI가 ‘앱’에서 ‘디바이스’로 진화하는 시작점이다.


구글, MS, 그리고 온디바이스 전쟁의 개막


경쟁사는 이미 이 전쟁에 뛰어들었다. 구글은 ‘제미나이 나노(Gemini Nano)’와 ‘젬마(Gemma)’라는 온디바이스 AI 모델을 출시하며 선두를 노리고 있다. 마이크로소프트(MS) 역시 오픈AI와 공동 개발한 AI 비서 ‘파이(Phi)’를 통해 반격에 나섰다. 이들 모두의 공통점은 ‘경량화된 언어모델’을 스마트폰이나 노트북, 웨어러블에 실어 실시간 추론이 가능하도록 하는 데 집중하고 있다는 것이다.

이러한 흐름 속에서 오픈AI는 비교적 늦은 진입을 하고 있지만, 그만큼 정교하고 차별화된 접근을 예고하고 있다. 특히 GPT-4 기반의 고성능 대규모 언어모델을 이미 보유하고 있는 오픈AI는, 이를 토대로 압축률 높은 경량화 기술을 활용할 수 있다는 강점이 있다. 만약 ‘o3-미니’가 10B 이하의 파라미터로 GPT-4 수준의 응답 품질을 보여준다면, 이는 기술적 파급력을 넘어 사용자 경험의 패러다임 자체를 바꾸는 계기가 될 것이다.


손안의 GPT 시대, 새로운 윤리와 가능성


온디바이스 AI의 등장은 기술적 혁신뿐만 아니라, 윤리적·사회적 논의도 불러일으킨다. 서버 기반 AI는 중앙 집중형 통제를 통해 데이터 사용과 보안이 관리되지만, 온디바이스 AI는 개인 단말에서 독립적으로 작동하기 때문에 데이터 프라이버시, 정보 권한, AI 책임 주체에 대한 새로운 규범이 필요하다. 동시에 사용자는 자신만의 비서를 휴대하는 듯한 경험을 하게 되며, AI는 점차 ‘기계’가 아닌 ‘동반자’로 진화하게 된다.

샘 알트먼의 설문은 단순한 여론조사가 아니다. 그것은 기술의 방향을 묻는 동시에, 인간의 삶이 향할 새로운 좌표를 가늠하는 일종의 나침반이다. ‘손안의 GPT’가 실현되는 순간, 우리는 단지 스마트폰에 AI를 탑재하는 것이 아니라, 인공지능이 인간의 인지능력과 일상을 물리적으로 통합하는 새로운 세대의 문을 열게 되는 것이다.

오픈AI가 그 문을 열 준비를 마친 지금, 세상은 또 한 번 경계 너머로 향하고 있다.

keyword
매거진의 이전글삼성SDS, '에이전트 AI' 시대를 열다