2026년 3월 19일, GTC의 마지막 날. 3만 명의 참가자 중 상당수가 이미 돌아간 조용한 세션에서, NVIDIA는 2028년의 로드맵을 공개했습니다. 코드명 Feynman(파인만). 양자전기역학의 창시자이자 "바닥에는 아직 공간이 많다(There's plenty of room at the bottom)"라는 유명한 강연으로 나노기술의 시대를 예언한 물리학자 리처드 파인만의 이름입니다.
이 이름은 상징적입니다. Feynman 아키텍처에는 반도체의 물리적 한계를 돌파하려는 세 가지 시도가 담겨 있습니다. 3D 다이 스태킹, 커스텀 HBM, 실리콘 포토닉스. 이 세 가지는 각각 칩의 크기, 메모리의 구조, 데이터의 이동 방식을 근본적으로 바꿉니다.
앞서 다뤘던 HBM — "메모리를 수직으로 쌓아 대역폭을 높인 기술"(3회 참조) — 의 다음 단계가 여기에 포함되어 있습니다.
지금까지의 AI 가속기는 '2.5D' 구조를 사용해 왔습니다. GPU 다이와 HBM 메모리 스택을 실리콘 인터포저라는 얇은 기판 위에 나란히 배치하는 방식입니다. Rubin과 Rubin Ultra도 이 구조를 씁니다. 문제는, 이 인터포저가 점점 커지고 있다는 것입니다. Rubin Ultra의 패키지는 120×150mm에 이르는 거대한 크기로, 이미 물리적·경제적 한계에 가까워지고 있습니다.
Feynman은 다릅니다. GPU 다이 자체를 수직으로 쌓습니다. NVIDIA 역사상 최초의 진정한 '3D 다이 스태킹'입니다. 젠슨 황은 GTC 2026 키노트에서 이를 직접 확인했고, 로드맵 상에서 Feynman의 칩 스케치는 Rubin이나 Rubin Ultra보다 눈에 띄게 작습니다. 수평으로 넓히는 대신, 수직으로 높이 쌓는 것입니다.
3D 스태킹은 신호 경로를 단축하고 대역폭을 높이며 패키지 크기를 줄입니다. TSMC의 SoIC(System on Integrated Chips) 기술이 이를 뒷받침합니다. 하지만 가장 큰 기술적 과제는 열 관리입니다. 2킬로와트를 넘어설 것으로 예상되는 GPU의 발열을, 수직으로 쌓인 다이 사이에서 어떻게 빼낼 것인가. Igor's Lab은 이를 두고 "열적 줄타기"라고 표현했습니다. 9회에서 다룬 냉각 혁명이 단순히 데이터센터의 문제가 아니라, 칩 내부의 문제이기도 한 이유입니다.
Feynman 로드맵에서 가장 주목할 변화가 있습니다. HBM 칸에 적힌 문구가 'HBM4'나 'HBM5'가 아니라 'custom HBM'입니다. Rubin은 HBM4, Rubin Ultra는 HBM4E — 모두 JEDEC 표준을 따르는 규격품입니다. 하지만 Feynman부터는 NVIDIA가 메모리의 핵심 부품인 '로직 다이(base die)'까지 직접 설계에 관여하겠다는 신호입니다.
기존 HBM에서 로직 다이는 메모리 제조사 — SK하이닉스, 삼성, 마이크론 — 가 설계하고 생산했습니다. 이 로직 다이는 DRAM에 최적화된 공정으로 만들어집니다. 커스텀 HBM에서는 이 로직 다이를 NVIDIA가 설계하고, 첨단 로직 공정에서 제조한 뒤, 메모리 제조사의 DRAM 스택과 결합합니다. 삼성, SK하이닉스, 마이크론 그리고 Marvell 같은 기업이 cHBM 이니셔티브에 참여하고 있습니다.
이것이 메모리 업계에 던지는 질문은 심대합니다. 메모리 제조사가 "완제품 공급자"에서 "DRAM 스택 공급자"로 역할이 축소될 수 있습니다. NVIDIA가 GPU뿐 아니라 메모리의 두뇌까지 통제하게 되는 것입니다. SK하이닉스와 삼성에게 이것은 기회이면서 동시에 위협입니다. 최대 고객인 NVIDIA의 요구에 맞춰 맞춤형 제조 역량을 갖추면 관계는 더 깊어지지만, 협상력은 약해질 수 있습니다.
세 번째 혁신은 데이터의 이동 방식 자체를 바꿉니다. 지금까지 칩과 칩, 랙과 랙 사이의 데이터 통신은 구리 배선을 통해 전기 신호로 이루어져 왔습니다. 구리 배선은 거리가 길어질수록 신호가 약해지고 전력 손실이 커집니다. AI 데이터센터의 규모가 커질수록, 이 "배선의 벽"이 점점 심각해지고 있습니다.
Feynman은 실리콘 포토닉스(Silicon Photonics) — 빛으로 데이터를 전송하는 기술 — 를 도입합니다. 광 신호는 전기 신호보다 빠르고, 거리에 따른 손실이 적으며, 전력 소비도 낮습니다. NVIDIA는 이를 NVLink 8 CPO(Co-Packaged Optics)라는 이름으로 구현합니다. 광학 부품을 스위치 칩이나 GPU 패키지에 직접 통합하는 방식입니다.
이미 2026년 출시되는 Spectrum-X 이더넷과 Quantum-X 인피니밴드 제품에서 CPO가 적용되기 시작했습니다. Feynman 세대에서는 이것이 GPU 간 통신의 기본이 됩니다. 데이터센터 전체가 광으로 연결되면, 물리적으로 떨어진 랙들이 마치 하나의 거대한 컴퓨터처럼 작동할 수 있습니다. 프리필 전용 랙과 디코드 전용 랙(8회에서 다룬 GPU+LPU 구조)을 광 패브릭으로 연결하는 것이 가능해집니다.
Feynman의 마지막 조각은 Rosa CPU입니다. 미국의 물리학자이자 노벨상 수상자인 로절린 서스먼 옐로(Rosalyn Sussman Yalow)의 이름을 딴 이 CPU는, 기존 Vera CPU를 대체하는 새로운 ARM 기반 데이터센터 프로세서입니다.
2026년 Vera Rubin, 2027년 Rubin Ultra, 2028년 Rosa Feynman으로 이어지는 로드맵에서, NVIDIA는 매년 새로운 세대의 AI 플랫폼을 출시하는 "연간 케이던스(Annual Cadence)"를 확립했습니다. 그리고 Feynman 세대에 이르면, GPU(Feynman) + CPU(Rosa) + LPU(LP40, Groq 기반) + DPU(BlueField-5) + 네트워크 스위치(Spectrum 7) + 광 인터커넥트(NVLink 8 CPO) — 데이터센터를 구성하는 모든 핵심 부품을 NVIDIA가 직접 제공합니다.
이것은 인텔이 x86 시대에 구축한 생태계를 연상시키지만, 규모와 범위가 다릅니다. 칩에서 시작해 메모리 설계, 네트워크, 냉각까지 하나의 플랫폼으로 통합하는 "풀스택 AI 인프라"의 완성입니다. 고객 입장에서는 검증된 단일 플랫폼의 편의성이 있지만, 동시에 NVIDIA에 대한 의존도가 더욱 깊어진다는 의미이기도 합니다.
Feynman은 아직 2년 뒤의 이야기입니다. 3D 스태킹의 열 관리, 커스텀 HBM의 생태계 구축, 실리콘 포토닉스의 양산 — 어느 것 하나 쉬운 과제가 아닙니다. 하지만 반도체의 역사는 불가능해 보이는 것을 일정표 안에 집어넣는 역사이기도 합니다. 2028년을 준비하는 것은 2028년이 아니라, 바로 지금입니다.
기술은 이렇게 앞으로 달리고 있습니다. 그런데 이 기술을 만들 사람은 충분한가요? AI가 일자리를 대체한다는 공포가 있지만, 정작 AI를 만드는 산업은 극심한 인력난에 시달리고 있습니다.
NVIDIA, GTC 2026 Keynote — Feynman Architecture Roadmap, 2026년 3월 16일.
WCCFTech, "NVIDIA Feynman GPU Gets 3D Die-Stacking, Custom HBM, & Next-Gen Rosa CPU", 2026년 3월.
Igor's Lab, "Feynman stacking analysis — turning 2.5D into a thermal tightrope walk", 2026년 3월.
Heise, "Nvidia Feynman comes with stacked GPU dies and custom HBM", 2026년 3월.
TweakTown, "NVIDIA updates roadmap with new details on Feynman", 2026년 3월.
1. 이 글은 『보이지 않는 전쟁 — AI 반도체, 누가 미래를 지배하는가』 연재의 10회입니다. 매주 화·수·금 발행됩니다.
2. 이 글은 필자가 주 2회(월,목) 발행하는 브런치 매거진 'AI 트렌드 리포트'의 기획기사로 12회에 걸쳐 연재할 예정입니다.