데이터 센터에 들어가는 반도체

by Grandmer


데이터 센터는 현대 산업의 두뇌이며, 그 안을 채우는 반도체는 각각 특화된 역할을 수행한다.


인공지능(AI) 열풍으로 인해 데이터 센터용 반도체 시장은 과거와는 완전히 다른 양상을 보이고 있다.


1. 연산의 핵심: 프로세서 (Compute)


데이터 센터의 성능을 결정짓는 가장 중요한 부품이다.


GPU (그래픽 처리 장치) : AI 학습과 추론의 핵심이다.


NVIDIA가 시장을 압도하고 있으며, Vera Rubin(베라 루빈) '플랫폼과 같은 차세대 아키텍처가 도입되어 테라파라미터급 모델 처리를 주도하고 있다.


CPU (중앙 처리 장치) : 전체 시스템을 제어하고 범용 연산을 처리한다.


전통적인 x86(Intel, AMD) 진영과 효율성을 앞세운 ARM기반 CPU의 경쟁이 치열하다.


특히 최근에는 ARM 기반 CPU가 클라우드 시장 점유율 40%를 돌파하며 전력 효율성 면에서 각광받고 있다.


NPU/ASIC (맞춤형 반도체) : 구글의 TPU, 아마존의 Trainium처럼 특정 AI 알고리즘에 최적화된 저전력·고효율 반도체다.


2. 데이터 이동의 병목 해결: 메모리 (Memory)


AI 연산 속도가 빨라지면서 데이터를 얼마나 빨리 프로세서에 전달하느냐가 핵심이 되었다.


HBM (고대역폭 메모리) : 여러 개의 DRAM을 수직으로 쌓아 데이터 통로를 획기적으로 넓힌 메모리다.


HBM3E가 주력이며, HBM4(6세대)의 양산 및 검증이 삼성전자와 SK하이닉스를 중심으로 진행되고 있다.


HBM은 GPU 바로 옆에 붙어 AI 연산의 병목 현상을 해결한다.


CXL (Compute Express Link) : 서버 내 메모리 용량을 획기적으로 확장하고 여러 장치가 메모리를 공유할 수 있게 하는 차세대 인터페이스다.


CXL 3.1 표준이 도입되면서 메모리 풀링(Memory Pooling)을 통해 버려지는 메모리 없이 효율적인 자원 배분이 가능해졌다.


3. 저장 및 네트워크 (Storage & Networking)


Enterprise SSD : 대규모 데이터를 저장하며, AI 학습용 데이터 세트를 빠르게 읽어오기 위해 고성능 NVMe SSD가 주로 사용된다.


SmartNIC / DPU (데이터 처리 장치) : 데이터 전송과 보안 처리를 CPU 대신 전담하여 서버의 전반적인 효율을 높인다.


4. 반도체 시장의 3대 키워드


칩렛 : 작은 반도체 조각들을 연결해 하나의 큰 칩을 만드는 방식으로 제조 수율 향상 및 맞춤형 칩 설계가 용이하다.


저전력 설계 : 전력 부족 문제를 해결하기 위한 와트당 성능을 강조하며 ARM CPU 및 액체 냉각 최적화 반도체 확산에 영향을 준다.


공급망 재편 : 자국 내 반도체 생산 설비 구축 경쟁이 심화되고 있으며 미국, 일본, 유럽의 첨단 패키징 시설 투자가 증대되고 있다.


엔비디아(NVIDIA)와 TSMC의 관계는 단순한 고객과 파운드리를 넘어, 설계를 함께 고민하는 공동 설계(Co-design) 파트너로 진화했다.

image.png

엔비디아의 차세대 로드맵과 이를 뒷받침하는 TSMC의 공정 계획을 정리해 보자.


1. 엔비디아의 차세대 아키텍처 로드맵


엔비디아는 과거 2년 주기였던 아키텍처 업데이트를 1년 주기로 앞당겼다.

image.png

2025년 (Blackwell Ultra) : 기존 블랙웰(Blackwell) 아키텍처의 개량 버전인 B300시리즈가 주력이다.


TSMC의 4nm/3nm 공정을 혼용하며, 메모리 대역폭을 극대화한 HBM3E를 탑재한다.


2026년 (Rubin - 루빈) : 천문학자 베라 루빈의 이름을 딴 차세대 플랫폼이다.


루빈(Rubin) GPU와 베라(Vera) CPU가 결합된 슈퍼칩 형태이며, TSMC의 3nm(N3P) 공정에서 양산된다.

처음으로 차세대 메모리인 HBM4를 본격 채택한다.


2027년 (Rubin Ultra & Feynman) : 루빈의 성능 강화판인 루빈 울트라와 그 차기작인 파인만(Feynman) 아키텍처가 예고되어 있다.


이때부터는 TSMC의 2nm(N2) 이하 초미세 공정과 차세대 전력 공급 기술(A16 등)이 적용될 예정이다.


2. TSMC의 공정 및 패키징 로드맵


TSMC는 엔비디아의 고성능 칩을 구현하기 위해 공정 미세화와 첨단 패키징을 동시에 제공한다.


N3P (3 나노 강화 공정) : 2026년 루빈 GPU의 주력 공정이다.


이전 3 나노 대비 전력 효율과 트랜지스터 밀도가 크게 개선되었다.

image.png

CoWoS-L (첨단 패키징) : 엔비디아 칩의 대형화에 따라 여러 개의 칩렛(Chiplet)을 하나로 묶는 CoWoS-L기술이 핵심이다.


TSMC는 엔비디아의 수요를 맞추기 위해 2026년까지 CoWoS 생산 능력을 현재의 4배 수준인 월 13만 장 규모로 확장하고 있다.


A16 (1.6 나노) 및 후면 전력 공급(SPR) : 2026~2027년 양산을 목표로 하는 이 기술은 칩 뒷면에서 전력을 직접 공급하여 전력 손실을 획기적으로 줄인다.


엔비디아의 차세대 AI 칩이 이 공정의 핵심 고객이 될 전망이다.


3. 양사의 전략적 협력 관계: 단일 생태계


전용 라인 확보 : 엔비디아는 TSMC의 최첨단 공정(3nm, 2nm) 및 CoWoS 라인을 선점하기 위해 거액의 선급금을 지급하며 사실상 전용 생산 라인을 확보하고 있다.

image.png

공동 엔지니어링 : 엔비디아의 CEO 젠슨 황은 TSMC 없이는 엔비디아의 AI 혁명도 없다고 공언할 정도로, 설계 단계부터 TSMC의 공정 특성을 반영하는 긴밀한 협력을 유지한다.


공급망 다변화 시도 : 엔비디아가 삼성전자나 인텔 파운드리 활용 가능성을 열어두고는 있지만, 수율과 첨단 패키징(CoWoS) 기술력 차이로 인해 TSMC가 여전히 압도적인 메인 파트너지위를 유지하고 있다.


매거진의 이전글스마트 글라스 시장 규모와 기술의 발전