OpenAI를 더 이상 선두로 볼 수 없는 이유

스케일링 법칙이 한계에 다다랐기 때문입니다.

by 경영로스팅

ChatGPT가 처음 출시됐을 당시, 많은 이들은 AI가 커질수록 더 똑똑해진다고 믿었다. 파라미터 수와 데이터 양, 연산 능력을 키우면 성능도 자연스럽게 향상된다는 기대가 있었고, 이는 스케일링 법칙(Scaling Law)으로 설명됐다. 2024년까지 이 법칙은 실제로 잘 작동했으며, OpenAI는 GPT-3.5와 GPT-4를 연이어 출시하며 시장의 선두 자리를 차지했다.

하지만 이 공식은 오래가지 않았다. 연산량을 10배 늘려도 성능은 1.2배 남짓 오르는 데 그치며, 투자 대비 개선 효과는 점점 줄어들고 있다. 고품질 학습 데이터는 고갈되고 있고, 전력 소비는 급증해 인프라 부담까지 우려되고 있다.

이제 OpenAI는 선두 자리를 위협받고 있다. 6월에는 구글이 Gemini 2.5 Pro를 출시해 주요 벤치마크에서 GPT-4를 앞섰고, 7월에는 xAI가 Grok 4를 공개하며 추론과 코딩 능력에서 더 높은 성능을 기록했다.

미국 빅테크 기업들은 이 변화에 세 가지 방식으로 대응하고 있다. (1) GPU와 전용 칩, 데이터센터를 확보하는 초대형 인프라 구축, (2) 연산 효율을 높이는 스마트 알고리즘 개발, (3) 다양한 제품에 AI 기능을 직접 결합하는 일상 속 접점 확장이다. 이 세 가지는 단순한 모델 크기 경쟁에서 벗어나기 위한 전략이다.

(1) 초대형 인프라 측면에서 OpenAI는 GPU 100만 개 규모의 ‘Stargate’ 슈퍼컴퓨터를 2028년까지 완성할 계획이다. (다만, 스타게이트 프로젝트가 삐그덕거리고 있다는 소식도 들린다.) 마이크로소프트는 소형 원자로와 자체 AI 칩 ‘Maia’를 포함한 1천억 달러 규모의 투자를 발표했다. 구글도 TPU Ironwood를 중심으로 전력 대비 성능을 높이는 데이터센터를 조용히 확대 중이다.

(2) 스마트 알고리즘 기술 측면에서 메타는 오픈소스 모델 Llama를 경량화해 빠르게 확산시키고 있다. Anthropic은 Claude 4를 통해 판단의 근거를 설명할 수 있는 방식으로 AI를 개선하고 있다. xAI는 실시간 학습과 툴 연동, 리트리버 기반 추론을 결합해 문제 해결 능력이 높은 에이전트형 AI를 실험하고 있다.

(3) 사용자 접점 측면에서는 OpenAI가 마이크로소프트, 애플, 오라클과 협력해 윈도우, 아이폰, 오피스 같은 제품에 GPT를 기본 기능으로 넣고 있다. 메타는 페이스북, 인스타그램, 왓츠앱에 AI 비서를 적용해 사용자 경험을 넓히고 있다. xAI는 테슬라의 자율주행, X 플랫폼, 스타링크 위성 등 물리적 장치에 AI를 직접 연결하며 확장을 시도하고 있다.

반면, 중국 기업들은 다른 접근 방식을 보인다. (1) 연산 자원과 비용을 줄이면서도 성능을 유지하는 구조, (2) 폐쇄형 모델과 달리 오픈소스를 앞세우는 전략, (3) 아시아권에 적합한 제품 사용성 확보에 집중하고 있다. 미국이 자본과 스케일을 앞세운다면, 중국은 빠르고 가볍게 확산되는 AI에 집중하고 있다.

(1) DeepSeek는 GPT-4 수준의 R1 모델을 약 500만 달러 비용으로 훈련해 오픈소스로 배포했다. (2) Baidu는 자체 칩 ‘쿤룬’을 통해 GPT-4.5급 성능의 모델을 검색과 클라우드 전반에 적용하고 있다. (3) Moonshot의 Kimi는 초장문을 빠르게 분석하고 출처를 명확히 제시하며, 문서 기반 질의응답에 특화된 도구로 중국 내에서 확산되고 있다.

이처럼 AI 경쟁은 점점 (1) 비정형 데이터와 (2) 에너지 효율성 확보로 이동하고 있다. 테슬라는 수억 건의 도로 주행 영상을 수집해, GPU 없이도 처리 가능한 구조를 만들어 자율주행 AI를 학습시키고 있다. 연산량이 아니라, 계산하는 방식이 AI 성능을 좌우하는 시대다. 전력이 제한된 환경에서도 작동할 수 있는 AI가 다음 승자가 될 가능성이 높다.

결국 중요한 것은 ‘누구나 쓸 수 있는 모델’이 아니라, 나만 보유한 ‘비정형 데이터’다. 이 데이터를 기반으로 효율적으로 작동하는 AI가 앞으로의 경쟁력을 좌우할 것이다. 어떤 모델을 쓸 것이냐보다는 내부망에 흐트러져있는 비정형 데이터를 어떻게 활용하느냐가 더 중요해지는 시대로 가고 있다.

keyword