데이터 센터는 현대 산업의 두뇌이며, 그 안을 채우는 반도체는 각각 특화된 역할을 수행한다.
인공지능(AI) 열풍으로 인해 데이터 센터용 반도체 시장은 과거와는 완전히 다른 양상을 보이고 있다.
1. 연산의 핵심: 프로세서 (Compute)
데이터 센터의 성능을 결정짓는 가장 중요한 부품이다.
GPU (그래픽 처리 장치) : AI 학습과 추론의 핵심이다.
NVIDIA가 시장을 압도하고 있으며, Vera Rubin(베라 루빈) '플랫폼과 같은 차세대 아키텍처가 도입되어 테라파라미터급 모델 처리를 주도하고 있다.
CPU (중앙 처리 장치) : 전체 시스템을 제어하고 범용 연산을 처리한다.
전통적인 x86(Intel, AMD) 진영과 효율성을 앞세운 ARM기반 CPU의 경쟁이 치열하다.
특히 최근에는 ARM 기반 CPU가 클라우드 시장 점유율 40%를 돌파하며 전력 효율성 면에서 각광받고 있다.
NPU/ASIC (맞춤형 반도체) : 구글의 TPU, 아마존의 Trainium처럼 특정 AI 알고리즘에 최적화된 저전력·고효율 반도체다.
2. 데이터 이동의 병목 해결: 메모리 (Memory)
AI 연산 속도가 빨라지면서 데이터를 얼마나 빨리 프로세서에 전달하느냐가 핵심이 되었다.
HBM (고대역폭 메모리) : 여러 개의 DRAM을 수직으로 쌓아 데이터 통로를 획기적으로 넓힌 메모리다.
HBM3E가 주력이며, HBM4(6세대)의 양산 및 검증이 삼성전자와 SK하이닉스를 중심으로 진행되고 있다.
HBM은 GPU 바로 옆에 붙어 AI 연산의 병목 현상을 해결한다.
CXL (Compute Express Link) : 서버 내 메모리 용량을 획기적으로 확장하고 여러 장치가 메모리를 공유할 수 있게 하는 차세대 인터페이스다.
CXL 3.1 표준이 도입되면서 메모리 풀링(Memory Pooling)을 통해 버려지는 메모리 없이 효율적인 자원 배분이 가능해졌다.
3. 저장 및 네트워크 (Storage & Networking)
Enterprise SSD : 대규모 데이터를 저장하며, AI 학습용 데이터 세트를 빠르게 읽어오기 위해 고성능 NVMe SSD가 주로 사용된다.
SmartNIC / DPU (데이터 처리 장치) : 데이터 전송과 보안 처리를 CPU 대신 전담하여 서버의 전반적인 효율을 높인다.
4. 반도체 시장의 3대 키워드
칩렛 : 작은 반도체 조각들을 연결해 하나의 큰 칩을 만드는 방식으로 제조 수율 향상 및 맞춤형 칩 설계가 용이하다.
저전력 설계 : 전력 부족 문제를 해결하기 위한 와트당 성능을 강조하며 ARM CPU 및 액체 냉각 최적화 반도체 확산에 영향을 준다.
공급망 재편 : 자국 내 반도체 생산 설비 구축 경쟁이 심화되고 있으며 미국, 일본, 유럽의 첨단 패키징 시설 투자가 증대되고 있다.
엔비디아(NVIDIA)와 TSMC의 관계는 단순한 고객과 파운드리를 넘어, 설계를 함께 고민하는 공동 설계(Co-design) 파트너로 진화했다.
엔비디아의 차세대 로드맵과 이를 뒷받침하는 TSMC의 공정 계획을 정리해 보자.
1. 엔비디아의 차세대 아키텍처 로드맵
엔비디아는 과거 2년 주기였던 아키텍처 업데이트를 1년 주기로 앞당겼다.
2025년 (Blackwell Ultra) : 기존 블랙웰(Blackwell) 아키텍처의 개량 버전인 B300시리즈가 주력이다.
TSMC의 4nm/3nm 공정을 혼용하며, 메모리 대역폭을 극대화한 HBM3E를 탑재한다.
2026년 (Rubin - 루빈) : 천문학자 베라 루빈의 이름을 딴 차세대 플랫폼이다.
루빈(Rubin) GPU와 베라(Vera) CPU가 결합된 슈퍼칩 형태이며, TSMC의 3nm(N3P) 공정에서 양산된다.
처음으로 차세대 메모리인 HBM4를 본격 채택한다.
2027년 (Rubin Ultra & Feynman) : 루빈의 성능 강화판인 루빈 울트라와 그 차기작인 파인만(Feynman) 아키텍처가 예고되어 있다.
이때부터는 TSMC의 2nm(N2) 이하 초미세 공정과 차세대 전력 공급 기술(A16 등)이 적용될 예정이다.
2. TSMC의 공정 및 패키징 로드맵
TSMC는 엔비디아의 고성능 칩을 구현하기 위해 공정 미세화와 첨단 패키징을 동시에 제공한다.
N3P (3 나노 강화 공정) : 2026년 루빈 GPU의 주력 공정이다.
이전 3 나노 대비 전력 효율과 트랜지스터 밀도가 크게 개선되었다.
CoWoS-L (첨단 패키징) : 엔비디아 칩의 대형화에 따라 여러 개의 칩렛(Chiplet)을 하나로 묶는 CoWoS-L기술이 핵심이다.
TSMC는 엔비디아의 수요를 맞추기 위해 2026년까지 CoWoS 생산 능력을 현재의 4배 수준인 월 13만 장 규모로 확장하고 있다.
A16 (1.6 나노) 및 후면 전력 공급(SPR) : 2026~2027년 양산을 목표로 하는 이 기술은 칩 뒷면에서 전력을 직접 공급하여 전력 손실을 획기적으로 줄인다.
엔비디아의 차세대 AI 칩이 이 공정의 핵심 고객이 될 전망이다.
3. 양사의 전략적 협력 관계: 단일 생태계
전용 라인 확보 : 엔비디아는 TSMC의 최첨단 공정(3nm, 2nm) 및 CoWoS 라인을 선점하기 위해 거액의 선급금을 지급하며 사실상 전용 생산 라인을 확보하고 있다.
공동 엔지니어링 : 엔비디아의 CEO 젠슨 황은 TSMC 없이는 엔비디아의 AI 혁명도 없다고 공언할 정도로, 설계 단계부터 TSMC의 공정 특성을 반영하는 긴밀한 협력을 유지한다.
공급망 다변화 시도 : 엔비디아가 삼성전자나 인텔 파운드리 활용 가능성을 열어두고는 있지만, 수율과 첨단 패키징(CoWoS) 기술력 차이로 인해 TSMC가 여전히 압도적인 메인 파트너지위를 유지하고 있다.