엔비디아 AI 시대의 도래 : CUDA 플랫폼의 힘
엔비디아의 2분기 실적이 어닝 서프라이즈를 기록했습니다.
사업부별 매출액과 실적을 정리해 보면 다음과 같습니다.
눈에 띄게 주목해야 할 점은 데이터센터 매출의 극적인 성장입니다. 전년 대비 171%의 급증률을 기록하며, 매출 비중 그래프에서도 76.4%로 압도적인 비중을 차지하고 있습니다.
과거에는 엔비디아가 PC 시장의 사이클과 암호화폐 시장의 변동에 민감하게 반응하는 기업이었습니다. 이는 엔비디아가 주로 게이밍 GPU에 의존해 왔기 때문입니다.
따라서, 고사양 PC 수요의 감소나 암호화폐 시장의 악재에 따라 엔비디아는 시장의 변화에 크게 영향을 받았습니다. 이러한 상황에서는 엔비디아의 주가가 암호화폐 시장의 변동과 연동되는 우스갯소리까지 나왔습니다.
하지만 현재는 상황이 크게 변화하였습니다.
이전에는 주력 사업인 게이밍 부문이 전체 매출에서 약 18.4%만 차지하는 수준이었습니다. 그러나 현재는 PC 시장과 암호화폐 시장의 동향과 무관하게 안정적인 실적을 이끌어내는 비즈니스 구조로 변모하였습니다.
엔비디아는 이제 더 이상 게이밍 GPU 회사로만 볼 수 없습니다. 회사는 단 년 만에 AI 반도체 기업으로 완전한 변화를 이루었습니다.
이런 변화가 어떻게 가능했을까요? 단 년 전까지만 해도 게이밍과 데이터 센터가 엔비디아의 매출을 공유하는 형태였지만, 현재는 데이터 센터 부문이 엔비디아 매출의 과반을 차지하며, 엔비디아는 AI 반도체 회사로 정착했습니다.
이러한 성과의 배경에는 A100, H100과 같은 데이터 센터용 GPU의 발전과 더불어 생성형 AI의 부상, 특히 챗 GPT의 영향이 큽니다.
생성형 AI는 일반적인 AI 연산보다 훨씬 더 큰 데이터 처리 능력을 필요로 하며, 파라미터 수가 수천억 개에서 수조 개에 달하는 거대한 모델 구조로 이루어져 있기 때문에 고성능 GPU의 필요성이 대두되었습니다. 엔비디아는 이러한 요구에 부응하기 위해 업계 최고 성능의 GPU 가속기인 H100을 도입함으로써 시장에서 빠르게 선두 지위를 확립했습니다.
그동안 엔비디아의 주력인 게이밍 사업 부문이 비중을 축소하면서도 데이터 센터 매출을 40%에서 70% 이상으로 늘릴 수 있었던 핵심 요소는 가격이었습니다. A100과 H100의 가격 추이를 보면, A100 1개당 거래가는 1만 5,000 달러로 상당히 높았으나 H100의 경우 4만 6,000 달러까지 급격히 상승하는 것을 확인할 수 있습니다. 이는 게이밍 GPU와 비교할 때 엄청난 가격 차이를 보여주며, 엔비디아의 데이터 센터 GPU가 높은 수익을 올릴 수 있는 핵심 요소 중 하나였습니다.
또한, 다양한 기업들이 생성형 AI의 열풍에 편승하고 데이터 센터 업그레이드를 진행함으로써 GPU의 업그레이드가 필수적해졌습니다. 이로써 엔비디아의 H100은 수많은 고객들로부터 주문을 받게 되었습니다.
엔비디아는 급격한 고객 주문에 대응하기 위해 TSMC와의 협력을 가속화하였으며, 이로써 TSMC는 2023년 1분기에 대한 견실한 수익을 올릴 수 있었습니다.
따라서, 엔비디아가 생성형 AI 시장 개화의 주요 수혜자가 된 이유는 다음과 같이 세 가지로 요약할 수 있습니다.
엔비디아가 2016년 8월에 본격적으로 서버 시장으로 진출했지만, 이전부터 서버 시장 진출을 위한 준비를 꾸준히 하고 있었습니다. 비록 처음부터 서버 시장을 목표로 움직였던 것은 아니지만, 엔비디아의 노력과 행보는 결국 AI를 위한 데이터 센터 사업을 확장하는 데 유리한 방향으로 나아갔다고 볼 수 있습니다.
그 중요한 시작점 중 하나는 2006년에 출시된 CUDA 플랫폼입니다. CUDA 플랫폼은 엔비디아가 개발한 GPGPU 플랫폼 및 API 모델로, 빠른 출시와 강력한 호환성으로 인해 엔비디아는 외장 GPU 시장을 빠르게 지배하는 데 큰 역할을 하였습니다. 이 플랫폼은 엔비디아 GPU에 내장된 CUDA 코어에서만 작동할 수 있으며, 초기에는 무료로 배포되어 높은 확산 속도를 보였습니다. CUDA 코어를 탑재한 엔비디아 GPU에서만 작동한다는 제한성은 엔비디아 GPU의 보급에 큰 도움이 되었습니다.
2012년, 엔비디아가 Alexnet이라는 신경망을 개발하면서 AI 분야에 진출하였는데, 이 때 CUDA 플랫폼이 중요한 역할을 하였습니다. 2012년은 인공지능이 IT 가전 제품에 접목되기 시작한 시기로, 그 당시에는 아직 AI가 매우 기초적인 수준이었습니다. 하지만 엔비디아는 미래를 정확하게 예측하였고, 자사의 인공지능 신경망을 지원하는 GPU 제품을 출시하고 CUDA에도 인공 신경망 관련 명령어 셋을 도입했습니다.
이로써 엔비디아는 인공지능 연산을 지원하는 GPU를 제공하고, CUDA를 활용한 인공지능 소프트웨어를 구축하는 툴로 확고한 지위를 확립하였습니다. 이러한 소프트웨어 플랫폼의 선점과 GPU 요구 사항을 견인하면서 엔비디아는 빠르게 서버 GPU 시장을 석권하게 되었습니다. 이를 통해 엔비디아는 강력한 병렬 연산 능력과 CUDA의 최적화 성능을 통해 빠르게 성장하며, 서버 GPU 시장에서 주요 플레이어로 우뚝 섰습니다.
엔비디아와 TSMC 사이의 관계는 전통적인 파운드리 고객과 공급업체 간의 관계입니다. TSMC는 오랜 역사를 가진 파운드리 기업으로, 다양한 기업의 반도체 제품을 수많이 생산하고 있습니다. 그 중에서도 TSMC가 파운드리 시장의 절대 강자로 손꼽히는 이유 중 하나는 파운드리 시장을 선도해 온 선구적인 회사로서의 역할입니다. 물론 TSMC는 반도체 제조의 전 영역을 커버하지는 못하지만, 다양한 협력 관계를 통해 마치 IDM(직접 개발 및 제조) 기업처럼 협력 네트워크를 구축하여 강점을 확보하고 있습니다.
TSMC는 여러 강력한 패키징 업체와 협력하며 이종 접합 패키징 기술을 개발해 왔습니다. 이종 접합 패키징은 서로 다른 기능을 하는 칩을 하나의 칩셋으로 묶어 하나의 칩으로 만들어내는 첨단 패키징 기술을 의미합니다. 이는 현재 유행하는 어드밴스드 패키징의 한 형태입니다. 그리고 TSMC의 이종 접합 패키징 기술이 엔비디아와 어떤 연관이 있는지 알아보겠습니다.
TSMC의 이종 접합 패키징 기술 중 하나인 CoWoS(Chip-on-Wafer-on-Substrate)는 2012년부터 도입된 2.5D 패키징 기술입니다. 이 기술은 엔비디아의 딥러닝과 머신러닝 시대가 도래한 2016년부터 엔비디아의 파스칼 아키텍처 기반 GPU인 엔비디아 테슬라 P100 GPU부터 적극적으로 사용되었습니다.
이 특별한 패키징 기술은 엔비디아 GPU 칩셋의 중심 부분에 HBM(High Bandwidth Memory)를 탑재할 수 있게 해주었습니다. 이것은 엔비디아 데이터 센터용 GPU의 연산 성능을 크게 향상시켰습니다. 외장 GPU 업계에서 이미 강력한 지위를 차지하던 엔비디아가 이 기술을 통해 서버용 GPU에서도 강력한 성능을 발휘할 수 있었고, 이는 경쟁사들이 따라올 수 없는 기술적 우위로 작용했습니다.
또한, 인공지능 연산의 보편화로 GPU 코어와 GDDR 메모리만으로는 처리할 수 없는 연산량이 발생했으며, 이로 인해 GPU와 HBM의 결합이 대세로 자리잡게 되었습니다. 이러한 다른 기능을 하는 칩들을 하나의 칩셋으로 묶기 위해서는 이종 접합 패키징 기술이 필요하며, TSMC는 엔비디아에게 이를 제공하여 최고 성능의 GPU 칩셋과 HBM을 효과적으로 결합할 수 있었습니다. 이를 통해 엔비디아는 CUDA를 통한 소프트웨어 플랫폼 장악과 더불어 하드웨어 성능까지 독차지하며 독보적인 존재로 부각되었습니다.
엔비디아가 데이터센터 사업에서 강력한 입지를 확립한 이유는 시장에서 절대적인 지위를 차지하고 있기 때문입니다. 이러한 포지셔닝은 업체에 굉장한 영향력을 미칩니다.
외장형 GPU 시장은 주로 엔비디아와 AMD가 주도하고 있으며, 최근에는 인텔이 시장에 진입하려는 시도를 하고 있지만 엔비디아와 AMD에 비해 경쟁력이 약한 상황입니다.
2023년 1분기 현재의 AI 가속기 시장 점유율을 보면, 엔비디아가 압도적인 84%의 점유율을 보이며 경쟁자가 사실상 존재하지 않습니다. 특히 인텔이 본격적으로 시장에 진입하면서 그 점유율이 빠르게 증가하고 있지만, 2위 업체인 AMD의 점유율은 정체된 상태입니다.
이러한 결과는 엔비디아가 가속기 시장에서 헤게모니를 확실하게 확보했기 때문입니다. 이 배경에는 엔비디아의 CUDA 생태계와 강력한 이종 접합 패키징 기술을 통한 최고 성능의 GPU가 있습니다.
엔비디아는 원래 GPU에 특화된 기업이었으며, GPU의 병렬 연산 성능이 AI 연산에 이상적임을 빠르게 파악했습니다. 따라서 병렬 연산에 특화된 GPU 가속기 시장을 선점하고, 인공지능 성능 향상과 엔비디아 GPU 간의 연관성을 강조하여 고객사들에게 홍보했습니다.
2023년 1월의 상황에서 엔비디아와 TSMC만이 활약할 수 있던 이유는 생성형 AI 시장의 성장과 빅테크 기업들의 투자로 인해 시장이 활성화되었기 때문입니다. 이미 시장에서 엔비디아 H100을 생성형 AI 연산에 특화된 GPU로 인식하고 있었기 때문에, 경쟁사들이 어떤 제품을 내놓더라도 시장의 신뢰는 쉽게 깨지지 않았습니다.
생성형 AI 시장은 아직 초기 단계이며, 안정적인 인프라를 필요로 합니다. 엔비디아는 CUDA 플랫폼을 통한 안정적인 개발 환경과 최적화, 그리고 TSMC의 생산 능력을 통해 고객들에게 안정적인 제품을 제공할 수 있어 선택받는 경향이 있습니다.
요약하자면, 엔비디아는 이제 게이밍 GPU 기업이나 암호화폐 채굴기 기업이 아닌 명실상부한 AI 반도체 기업 및 데이터센터용 가속기 기업으로 진화했습니다. 데이터 센터 매출이 171% 성장한 것은 이러한 변화를 반영한 결과입니다.
엔비디아의 이러한 성공은 CUDA 생태계 구축을 통한 시장 지배력 강화, TSMC의 강력한 이종 접합 패키징 기술을 활용한 강력한 성능의 서버용 GPU 공급능력 확보, 그리고 시장에서의 신뢰를 통한 헤게모니 유지로 이루어졌습니다.
현재로서는 엔비디아가 AI 가속기 시장을 정복한 상태이며, 경쟁사들이 엔비디아의 아성을 무너뜨릴 수 있을지에 대한 도전이 계속되고 있습니다. 그러나 엔비디아의 강력한 입지와 지속적인 혁신은 이를 어렵게 만들고 있습니다.
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.