brunch

AI 패러다임 전환의 심장 — 파운데이션 모델 경쟁

GPU·TPU 구조, 그리고 구글과 오픈 AI의 역전극

by 신피질

인류는 지금 컴퓨터 이후 가장 큰 기술적 전환점인 파운데이션 모델 시대의 한가운데에 서 있다. 거대한 모델들이 언어와 이미지, 코드와 의사결정까지 대체하며 새로운 산업 구조를 만든 이 변화는 단순한 기술 경쟁이 아니라 인류 문명 전체의 재구성에 가깝다. 이 변화의 중심에는 네 가지 큰 축이 존재한다. 파운데이션 모델의 경쟁 구도, AI 가속기의 심장인 엔비디아 GPU와 구글의 TPU의 구조적 차이, 클라우드 생태계와 공급망의 전략적 역할, 그리고 구글이 오픈 AI에게 선두를 뺏긴 역사적 이유다. 이 네 축이 서로 얽히고 맞물리며 지금의 AI 질서를 만들었고, 앞으로의 10년을 결정지을 새로운 힘의 지도를 그리고 있다.

파운데이션 모델의 성능은 점점 비슷해지고 있다. 오픈 AI (마이크로소프트) GPT‑5.1, 구글의 Gemini 3, 엔쓰로픽 Claude 3.8, 메타 Llama 4, 테슬라 Grok 3와 같은 모델들은 과거처럼 압도적인 성능 격차를 보이지 않는다. 추론 능력과 장기 문맥, 멀티모달 처리 능력 역시 수렴하는 흐름이다.


그러나 성능이 비슷해진다고 시장이 단일 독점으로 통합되지는 않는다. 각 모델은 고유한 생태계를 갖고 있기 때문이다. GPT는 개발자 생태계와 API 중심 구조에서 강하고, Gemini는 검색과 워크스페이스, 안드로이드 생태계를 등에 업고 있으며, Claude는 정확성과 안전성에서 독자적인 평가를 받는다. Llama는 오픈소스라는 독특한 가치로 기업용 커스터마이징 시장을 장악하고 있다.

성능은 수렴하지만 생태계와 전략은 다르고, 국가마다 자국 모델을 요구하는 규제가 존재하며 산업별로 특화된 파운데이션 모델 수요가 강해지는 이유다. 미래는 결국 다자 공존의 구조가 된다. 세 개에서 다섯 개의 메가 모델이 존재하고, 여기에 의료·국방·금융 등 산업 특화 모델과 국가 단위 파운데이션 모델이 더해지는 다층적 구조가 자리 잡을 것이다.

TPU.png


오늘의 AI 경쟁은 사실상 칩 전쟁이다. 그 중심에는 엔비디아 GPU와 구글 TPU가 있다. 엔비디아 GPU는 AI 반도체의 표준이다. 누구나 구매할 수 있고, 어떤 데이터센터에도 설치할 수 있으며, CUDA라는 생태계를 기반으로 딥러닝 연구자와 엔지니어 전체를 묶어낸다. H100, H200, B200, X100으로 이어지는 발전 속도는 압도적이며 GPU 시장은 수백만에서 천만 개 단위의 생산량을 기록한다. 슈퍼마이크로, 델, HPE 같은 서버 기업들이 GPU 서버를 공급하며 범용성과 개방성을 통해 세계 AI 인프라를 사실상 장악했다.


반면 구글 TPU는 완전히 다른 철학에서 출발한다. TPU는 구글이 자체 서비스와 Google Cloud 내부를 위해 설계한 커스텀 ASIC이며 외부 판매용이 아니다. TPU를 쓰려면 반드시 Google Cloud에 접속해야 하고, TPU 서버나 TPU 칩은 시장에서 구매할 수 없다. 이 칩은 구글 검색, 유튜브 추천, 광고 알고리즘, Gemini 모델과 같은 구글 내부 인프라에 최적화되어 있으며 생산량 역시 GPU 대비 훨씬 적다. GPU가 글로벌 표준이라면 TPU는 구글 내부 생태계를 강화하기 위한 전략 칩에 가깝다.

비용 구조 또한 다르다. TPU v7은 Google Cloud에서만 사용할 수 있으며 추론에 특화되어 있어 GPU 대비 30~50% 저렴하게 운영된다. 하지만 온프레미스(폐쇄된 자체 서버) 구축은 불가능하다. 반면 엔비디아 B200은 단일 서버가 5억 원이 넘는 고가 장비이며 클라우드에서도 GPU 한 장이 시간당 몇 달러에서 10달러 이상에 이르기도 한다.

대신 GPU는 학습과 추론 모두 가능하고, 어느 환경에서나 사용 가능하며 고객이 직접 서버를 꾸릴 수도 있다. GPU 최대 고객은 사실상 마이크로소프트와 AWS이며, 이들은 엔비디아와 직접 대규모 계약을 체결해 수십만 장에서 수백만 장 단위의 GPU를 확보한다. 언론에는 CoreWeave, IREN 같은 중형 GPU 클라우드가 자주 등장하지만 실제 최대 구매자는 Azure와 AWS이다. 다만 이들은 구매 물량을 공개하지 않기 때문에 시장에 잘 드러나지 않을 뿐이다.

구글 오픈에이아아.png


AI 시대의 또 다른 축은 클라우드 생태계다. 구글은 TPU를 외부에 판매하지 않고 Google Cloud 내부 전용으로 제공한다. TPU를 통해 구글 생태계 내부에 고객을 묶어두려는 전략이다. 반면 엔비디아 GPU는 전 세계 데이터센터, 국가 단위 AI 센터, 연구소, 기업 모두가 구매할 수 있는 개방형 생태계를 갖고 있다. 오픈 AI는 자체 하드웨어가 없기 때문에 GPU를 100% 활용하며 파운데이션 모델 중심의 생태계를 구축하는 방식으로 성장했다. ChatGPT, GPT Store, Agent 등 소프트웨어·모델 중심 혁신으로 시장의 주도권을 가져갔다.

그러나 무엇보다 흥미로운 것은 구글이 기술적으로 가장 앞섰음에도 오픈 AI에게 선두를 내주었다는 사실이다. 구글은 Word2 Vec, BERT, Transformer, AlphaGo, AlphaFold 등 AI 역사상 가장 중요한 기술의 절반 이상을 직접 만들었다.

하지만 구글은 AI를 연구 중심으로 접근했고, 제품화는 매우 느렸다. 내부적으로 AI는 위험할 수 있으며 검색엔진 광고 사업을 파괴할 수 있다는 우려가 강했다. 구글 전체 매출의 80~90%가 검색광고에서 나오는데, 사람이 검색 대신 LLM에게 직접 질문하기 시작하면 구글의 핵심 비즈니스가 흔들릴 수 있기 때문이다. 구글은 기존 사업을 보호하기 위해 혁신을 의도치 않게 억눌렀다. 코닥이 필름 사업을 지키기 위해 디지털카메라 출시를 미뤘던 것과 같고, 노키아가 피처폰 제국을 지키려다 스마트폰 시대에 뒤처진 것과도 같다. 소니가 워크맨과 CD 사업을 지키려다 MP3 플레이어와 스마트폰 시장에서 뒤처진 것과 동일한 패턴이다. 승자의 저주는 구글에게도 동일하게 작용했다.

오픈 AI는 달랐다. 잃을 게 없었고, 위험을 감수해도 방해받는 기존 사업이 없었다. ChatGPT라는 단순하지만 강력한 인터페이스를 세상에 공개하며 전 세계 사용자를 단숨에 확보했다. 연구 → 제품 → 공개 → 피드백 → 더 큰 모델이라는 사이클을 엄청난 속도로 반복했고, 마이크로소프트의 대규모 투자를 바탕으로 수십만 장의 GPU를 사용해 GPT-4와 GPT-5 같은 초거대 모델을 빠른 속도로 개발했다. 구글은 연구에서는 앞섰지만 실행력과 용기에서 오픈 AI에게 완전히 패배했다.

결국 AI 시대의 구조는 이렇게 정리된다. 구글은 기술을 만들었다. 엔비디아는 칩을 만들었다. 오픈 AI는 세상을 바꾸었다. 파운데이션 모델의 성능은 상향 평준화되고 있지만 생태계와 국가 전략, 산업 구조 때문에 독점은 발생하지 않는다. GPU는 AI 세계의 표준 인프라가 되었고, TPU는 구글 내부 경쟁력을 위한 전략 칩으로 자리 잡았다. 구글은 승자의 저주 때문에 혁신의 타이밍을 놓쳤고, 오픈 AI는 실행을 통해 역사적 주도권을 가져갔다. 그리고 지금 우리는 그 세 축이 만들어낸 새로운 AI 문명의 중심에서 다음 10년의 판도를 지켜보고 있다.

keyword
이전 10화AI 에이전트 시대, 인간의 시간을 다시 설계하다