구글의 TPU 로드맵과 TSMC와의 협력

by Grandmer


구글의 TPU(Tensor Processing Unit) 로드맵은 단순히 연산 속도를 높이는 것을 넘어, 전력 효율과 거대 모델(LLM) 처리에 최적화된 AI 하이퍼컴퓨터 체계로 진화하고 있다.


로드맵과 세대별 핵심 특징을 정리해 보자.


1. 구글 TPU 세대별 로드맵 (2024~2028)

image.png

구글은 6세대인 트릴리움(Trillium)의 보급을 완료하고, 최신작인 7세대 아이언우드(Ironwood)를 본격적으로 시장에 투입하고 있다.

image.png

6세대인 트릴리움은 5세대 대비 성능이 4.7배 향상, 에너지 효율이 67% 개선되었고 TSMC의 4 나노 공정이며 주요 타깃은 고성능 학습 및 추론이다.


7세대인 아이언우드는 듀얼 칩셋구조로 9,216개 칩 기반 초거대 클러스터이며 주요 공정은 TSMC의 3 나노이며 초거대 언어 모델을 위해 사용된다.


26년에는 아이언우드의 정식 버전이 출시 및 확장되며 에이전트 AI 및 실시간 추론을 위해 사용된다.


8세대 Cypress는 27년 출시 예정이며 차세대 광학 인터커넥트 및 2 나노 이하 공정에 적용될 예정이며 TSMC의 2 나노를 사용할 계획이고 범용 인공지능 인프라에 사용될 가능성이 있다.


2. 주요 세대별 상세 분석


6세대: 트릴리움 (Trillium, TPU v6)


2024년 말 정식 출시되어 현재 구글 클라우드의 주력 모델이다.


이전 세대(v5p) 대비 칩당 피크 성능이 4.7배 증가했다.


고대역폭 메모리(HBM) 용량과 칩 간 상호 연결(ICI) 대역폭을 각각 2배씩 늘려 대규모 모델 학습의 병목을 해결했다.


스파스코어(SparseCore) : 추천 알고리즘과 같이 방대한 임베딩 처리가 필요한 작업에 최적화된 3세대 전용 가속기가 탑재되었다.


7세대: 아이언우드 (Ironwood, TPU v7 / v7x)


2026년 현재 가장 진보된 AI 가속기로, 엔비디아의 독주를 저지할 강력한 대항마다.


칩렛(Chiplet) 아키텍처 : 처음으로 두 개의 칩 조각을 하나로 묶는 듀얼 칩렛방식을 도입하여 제조 효율과 성능을 동시에 잡았다.


압도적 스케일 : 단일 클러스터(Pod)에 최대 9,216개의 TPU를 연결할 수 있으며, 전체 연산 능력은 42.5 엑사플롭스(ExaFLOPS)에 달한다.


액체 냉각 표준화 : 고성능 발열 제어를 위해 수랭식(Liquid Cooling) 시스템이 기본 적용되었다.


TCO 혁신 : 경쟁사 제품(Nvidia GB200 등) 대비 총 소유비용(TCO)을 약 44% 절감할 수 있는 경제성을 갖췄다.


3. 구글의 전략적 방향: AI 하이퍼 컴퓨터


구글은 TPU를 단품 칩이 아닌, 전체 시스템 인프라의 핵심으로 보고 있다.

image.png

에이전트 AI 최적화 : 2026년 구글의 전략은 단순 챗봇을 넘어 스스로 업무를 수행하는 에이전트 AI에 맞춰져 있다.


이를 위해 TPU v7은 복잡한 다단계 추론과 긴 문맥(Long Context) 처리에 특화되었다.


수직적 통합 : 자체 설계한 Axion(액시온) ARM CPU와 TPU를 결합하여, 연산부터 데이터 처리까지 구글 자체 칩으로만 구성된 최적화된 스택을 제공한다.


광학 스위칭(OCS) : 칩 간 데이터를 빛으로 전송하는 기술을 고도화하여 전력 소모를 줄이고 대규모 확장이 용이하도록 설계했다.


구글은 이제 TPU를 내부 서비스용으로만 쓰지 않고, 앤스로픽(Anthropic)과 같은 외부 기업들에게 대규모로 공급하며 사실상 반도체 공급사로서의 입지를 굳혔다.


특히 엔비디아의 높은 가격과 전력난에 지친 기업들에게 TPU v7(아이언우드)은 가장 강력한 대안으로 부상하고 있다.


구글의 TPU(Tensor Processing Unit) 로드맵 확장은 파운드리 파트너인 TSMC에게 거대한 수익원인 동시에, 생산 공정 및 패키징 운영 측면에서 복합적인 영향을 미치고 있다.


1. 3 나노(N3) 공정의 핵심 고객사 등극


구글의 최신 TPU v7(아이언우드)은 TSMC의 3 나노(N3E) 공정에서 생산된다.


점유율 확대 : 애플, 엔비디아와 함께 TSMC 3 나노 라인을 꽉 채우는 3대 핵심 고객으로 자리 잡았다.


구글의 자체 칩(ASIC) 물량이 늘어나면서 TSMC의 HPC(고성능 컴퓨팅) 부문 매출 비중은 2026년 1분기 기준 50%를 상회하고 있다.


이는 스마트폰(모바일) 시장의 둔화를 상쇄하는 강력한 성장 동력이 된다.


2. 첨단 패키징(CoWoS) 병목 현상의 심화

image.png

TPU는 고대역폭 메모리(HBM)를 연산 칩과 통합해야 하므로 TSMC의 첨단 패키징 기술인 CoWoS(Chip on Wafer on Substrate)가 필수적이다.


엔비디아가 TSMC CoWoS 용량의 절반 이상을 선점하면서, 구글은 당초 2026년 400만 대 생산 목표를 약 310만~320만 대 수준으로 하향 조정(약 25% 감축) 해야 하는 상황에 처했다.


구글의 물량 확보 노력은 TSMC가 CoWoS 생산 능력을 2026년 말까지 월 12만 장이상으로 급격히 늘리게 만드는 직접적인 원인이 되었다.


3. 브로드컴(Broadcom) 및 미디어텍(MediaTek)과의 삼각 공조

image.png

구글은 직접 TSMC와 거래하기도 하지만, 설계 파트너를 통해 생산을 관리한다.


기존 파트너인 브로드컴은 고성능 v7 모델을, 신규 파트너인 미디어텍은 가성비 모델(v7e)의 제조 코디네이션을 맡아 TSMC와 협상한다.


다수의 설계 파트너가 구글의 TPU 물량을 들고 TSMC를 찾으면서, TSMC는 선단 공정(3nm, 2nm)의 가격 결정권(Bargaining Power)을 더욱 강력하게 쥐게 되었다.


패키징 용량 부족으로 생산이 다소 제한적이지만, TSMC의 신규 패키징 시설(AP8 등)이 본격 가동되는 2027년에는 구글 TPU 출하량이 500만~600만 대까지 급증하며 TSMC의 최대 실적을 견인할 것으로 보인다.


매거진의 이전글파나마 운하와 미국 중국 갈등