brunch

AI 패권 경쟁. 미국 대 중국 대표기업

엔비디아 대 화웨이

by sonobol





Ⅰ. 서론: AI 패권의 본질과 게임보드


AI 패권은 세 축의 결합에서 결정된다. 연산력, 소프트웨어 생태계, 전력·냉각 인프라. 미국은 엔비디아가 주도하는 풀스택 생태계로 우위를 점한다. 중국은 화웨이를 정점으로 국산화와 대체 생태계를 빠르게 끌어올린다. 이 둘을 갈라놓는 가장 큰 레버는 수출통제와 공급망 재배치다. 2024~2025년 미국의 강화된 수출통제는 중국으로의 첨단 AI 칩 흐름을 크게 제한했고, 중국은 자체 칩과 툴체인으로 공백을 메우는 중이다.



Ⅱ. 미국의 대표기업: 엔비디아(NVIDIA)


2.1 하드웨어: 블랙웰과 NVLink·네트워킹


엔비디아의 블랙웰 아키텍처(B200/GB200)는 대규모 모델 학습과 추론의 비용 효율을 동시에 겨냥한다. GB200은 두 개의 B200과 그레이스 CPU를 초고속 NVLink로 결합해 메모리 대역과 상호연결 병목을 줄인다. 이는 모델 병렬화와 파이프라인 병렬화에서의 효율을 끌어올려 클러스터 규모가 커질수록 TCO 절감을 가능케 한다.


2.2 소프트웨어·플랫폼: CUDA 라인과 AI 팩토리


CUDA, TensorRT-LLM, NeMo, AI Enterprise로 이어지는 툴체인은 개발자 생산성, 최적화된 커널, 프레임워크 통합을 묶어 락인 효과를 만든다. 정부·기업의 주권형 AI 수요에 맞춘 ‘소버린 AI’ 파트너십(예: 오라클)은 데이터 거버넌스와 규제 준수를 전제로 한 레퍼런스 스택을 제공한다. 이 조합이 경쟁사 대비 전환비용을 높이고, 고객 락인을 강화한다.


2.3 사업모형: AI 팩토리와 생태계 네트워크


하이퍼스케일러와의 공동 설계 레퍼런스, OEM·클라우드·ISV 연합, 파운드리·패키징 파트너들의 적시 공급이 결합된 ‘AI 팩토리’ 모델은 칩 단품이 아니라 가속-네트워크-소프트웨어-레퍼런스 아키텍처의 묶음 판매를 촉진한다. 결과적으로 매출의 변동성은 낮고, 고부가 소프트웨어와 서비스 매출 비중이 점차 커진다.


2.4 리스크: 전력·냉각·규제


데이터센터 전력 수요가 급증하면서 입지와 인허가, 전력코스트가 핵심 제약으로 부상했다. 글로벌 데이터센터 전력수요는 2030년 945 TWh 수준으로 두 배 이상 증가할 전망이다. 미국 내에서도 2025~2026년 전력 사용이 사상 최대를 경신할 가능성이 높다. 이는 하드웨어 도입 속도와 TCO에 직접적인 상한을 건다.



Ⅲ. 중국의 대표기업: 화웨이(Huawei)


3.1 하드웨어: Ascend 910B/910C


화웨이는 Ascend 910B로 엔비디아 공백을 채웠고, 2025년에는 910C 출하를 확대하며 클러스터 납품을 늘리는 중이다. 910C는 910B 두 개를 결합한 형태로 알려져 있으며, 수율과 생산능력 제약이 크지만 중국 내 주요 AI 기업의 주력 칩으로 자리 잡을 가능성이 높다. 미국 상무부는 2025년 화웨이 Ascend 생산능력을 연간 20만 개 이하로 추정한다. 이 수치는 중국 내 수요에 대부분 흡수될 것으로 예상된다.


3.2 소프트웨어: CANN·MindSpore


엔비디아의 CUDA에 대응해 화웨이는 CANN(컴퓨팅 가속 라이브러리)과 프레임워크 MindSpore를 확장한다. 목표는 커널 최적화와 연산그래프 변환, 분산훈련 스택의 국산화를 통해 하드웨어 제약을 소프트웨어 최적화로 상쇄하는 것이다. 생태계 성숙도는 아직 낮지만, 정책·조달 연계와 대규모 내수 클러스터가 성장의 발판이다.


3.3 리스크: 공정·장비·생태계


첨단 공정과 패키징, EDA·장비 접근성은 지속 제약이다. 오픈소스와 표준화 주도력에서도 후발주자다. 다만 국가 조달과 규제 환경은 ‘국가급 수요’라는 안정적 수요원을 제공한다.



Ⅳ. 규제와 디커플링: 게임의 룰


수출통제는 엔비디아의 중국 매출 제약과 동시에 중국 국산화 가속을 촉발했다. 2024년 말과 2025년 들어 미국은 반도체·AI 관련 규정을 재정비해 군민겸용 위험을 낮추려 했다. 중국은 장비와 공정 측면에서 회피 여지를 찾고, 국산 대체와 역설계로 적응 중이다. 규제의 미세 조정은 앞으로도 이어질 가능성이 높다. 정책은 기술경쟁의 룰이며, 성능곡선 못지않게 매출 믹스와 밸류체인 지형을 바꾸는 변수다.



Ⅴ. 경쟁구도: 미국 진영의 다극화 vs 중국 진영의 내재화


5.1 미국 진영의 대항마: AMD와 전용칩


AMD는 MI300 계열 양산에 이어 MI350을 2025년 하반기부터 본격 투입하며 추론 성능을 대폭 끌어올리겠다는 로드맵을 제시했다. 오픈 AI 등 대형 수요처의 채택 신호는 다변화 조짐을 보여준다. 구글 TPU, AWS Trainium·Inferentia 같은 전용칩은 특정 워크로드에서 TCO 우위를 제공해 엔비디아 편중을 완화한다.


5.2 중국 진영의 내재화: 화웨이 중심 수직결합


중국은 화웨이 칩과 툴체인을 중심으로 클러스터를 증설하고, 국산 프레임워크와 라이브러리를 정착시키는 전략을 택했다. 수율·공정 제약은 성능 상한을 만들지만, 데이터 주권과 조달정책이 수요를 보장한다. 단기적으로는 ‘충분히 좋은’ 성능과 대량 보급이 목표다.



Ⅵ. 소프트웨어 생태계 전쟁: CUDA vs CANN


6.1 개발자 낙인과 전환비용


CUDA는 10년 이상 축적된 커널·라이브러리·샘플과 풍부한 커뮤니티를 기반으로 실질적 표준이 되었다. 반면 CANN·MindSpore는 API 호환, 모델 포팅, 커널 최적화를 통해 ‘호환 가능한 대체재’가 되는 데 주력한다. 핵심은 개발자 시간과 디버깅 비용이다. 동일 하드웨어 성능이라도 소프트웨어 생태계 완성도가 TTM과 운영비를 갈라놓는다.


6.2 오픈 전략과 인터페이스


미국 진영은 Triton, OpenXLA, PyTorch 2.x 컴파일러 스택 등 범용 인터페이스를 통해 백엔드 다변화를 시도한다. 중국 진영은 호환레이어와 변환도구로 CUDA 생태계 의존을 낮추려 한다. 롱테일 모델·커스텀 연산에서의 최적화 속도 차가 당분간 격차를 만들 가능성이 높다.



Ⅶ. 인프라의 물리학: 전력, 냉각, 입지


AI 전력수요의 급증은 데이터센터 입지 선정, 전력 PPA, 배전망 증설, 수랭으로의 전환을 동시 요구한다. 글로벌에서는 2030년 데이터센터 전력 사용량이 약 945 TWh로 예상되고, 미국만 보더라도 2025~2026년 전력 수요가 사상 최대다. 칩 성능 경쟁 못지않게 와트당 성능과 메가와트당 유효연산이 전략 변수가 된다. 이는 고객의 구매 의사결정에서 칩 성능 수치 못지않게 ‘전력-냉각-부지’ 제약을 반영한 총 소유비용(TCO) 모델을 앞세우게 만든다.



Ⅷ. 2026~2030 시나리오

시나리오 A: 규제 강화 지속, 양 진영 분리 심화


엔비디아는 미국·동맹 시장에서 고부가 소프트웨어와 레퍼런스 아키텍처로 마진을 방어한다. 화웨이는 내수 중심으로 규모를 늘리되 수율·공정 제약을 점진적으로 해소한다. 국제 표준의 이원화와 상호 호환성 저하는 비용 상승을 유발한다.


시나리오 B: 제한적 완화와 부분적 재결합


특정 스펙 이하 제품의 거래가 일부 재개되면, 중국은 ‘중간성능’ 칩으로 공백을 메우고 미국 기업은 중국 매출의 일부를 회복한다. 다만 전략물자·소프트웨어 서비스는 계속 제한된다. 정책 변동성은 리스크 프리미엄을 유지시킨다.


시나리오 C: 에너지·공급망 병목이 속도 결정


전력·냉각 인허가가 가장 강한 상한이 된다. 칩 로드맵보다 전력 가용성이 배치 속도를 좌우하고, 입지 프리미엄과 PPA 가격이 클러스터 경제성을 좌지우지한다. 이 경우 효율 중심의 아키텍처, 저정밀 연산, 메모리·네트워크 최적화가 승부처다.



Ⅸ. 산업·정책·투자 시사점


9.1 정책

전력 인프라: 송전·배전 증설, 수랭 인센티브, 부지 전력쿼터의 투명 배분.


표준화: 모델·데이터 거버넌스와 벤더 중립 인터페이스 가이드.


공급망: 패키징·기판·냉각 부품 국산화와 다변화.


9.2 기업 전략

멀티벤더 전략: CUDA 퍼스트를 유지하되, Triton/OpenXLA·ROCm 등 보조 백엔드 준비.


이식성 확보: 프레임워크 레벨 추상화로 벤더 종속 리스크 헤지.


TCO 우선순위: ‘성능/와트’와 ‘성능/메가와트’ 최적화. 수랭 전환과 랙 밀도 설계 선행.


9.3 투자 포인트

가치 이동: 칩→소프트웨어→전력·냉각으로 수익성이 이동.


네트워킹·메모리: NVLink/InfiniBand/이더넷 광학계, CXL, HBM 공급망.


전력 체인: 소형 모듈형 원전(SMR), 고효율 수랭, 분산형 재생에너지+배터리.


미국 vs 중국 익스포저: 규제 시나리오별 포트폴리오 가중치 차등.



Ⅹ. 결론: 연산력+생태계+전력 인프라의 결합이 승부를 가른다


단기 성과는 엔비디아가 주도한다. 하드웨어와 소프트웨어가 결합된 풀스택이 강력하고, 하이퍼스케일러와의 공진화가 빠르다. 중국은 화웨이 중심의 내재화로 추격하며, 대규모 내수와 정책 지원을 무기로 격차를 줄인다. 최종 승부는 칩 성능이 아니라 생태계 전환비용과 에너지 제약 하에서의 유효연산/TCO에서 난다. 정책은 룰을 정하고, 전력은 속도를 정한다. 2026~2030년의 AI 패권은 이 세 축의 선점 정도로 결정될 것이다.




출처

엔비디아 블랙웰 및 GB200 발표·세부: NVIDIA 보도자료·기술 노트. (NVIDIA Newsroom)


오라클–엔비디아 소버린 AI 협력: NVIDIA News. (NVIDIA Newsroom)


AMD MI350·채택 동향: Reuters 보도·2024~2025 로드맵. (Reuters)

수출통제 변화: 미 상무부(BIS) 공지, 미 의회조사국(CRS). (산업안전국)


화웨이 Ascend 910C 출하와 생산능력 추정: Reuters·미 상무부 발언. (Reuters)


전력·에너지 수요 전망: IEA Energy & AI 보고서, 미국 EIA 전력전망. (IEA)

keyword