AI 반도체의 미래 모습
최근 컨퍼런스에서 메타 창업자인 주커버크가 엔비디아 창업자인 젠슨에게 GPU구하는게 어렵다고 투정을 부리는 장면이 나왔다. 아마존, 메타, 구글, 테슬라등 인공지능으로 사업 확장을 하려고 하는 여러 회사들이 엔비디아의 GPU를 구하기 위해서 어려움을 격고 있다는 것을 반증하는 모습이다.
구매자와 판매자 사이에 관계가 반대로 된 상황이다.
문득 궁금해져서 내년 엔비디아 매출 흐름을 보니 이미 23년에는 33조, 24년에는 79조, 25년에는 150조 정도 추정치로 달려가고 있다.
앞에 말한것 처럼 AI반도체 구매자들은 불만이 있을것이다.
구하기도 힘들고 비싸다. 하지만 안타깝게도 근 1~2년 동안은 쉽게 엔비디아의 강력한 대체 반도체를 찾기가 쉽지는 않아 보인다.
그런데, 2~3년 후에는 점점 대체재를 찾을것이다. 그것을 위해서 여러 회사들은 준비 중에 있다.
대표적으로는 바로 아마존이다.
전 세계 1위 이커머스 회사이자 1위 데이터센터 업체인 아마존의 자체 반도체 전략을 살펴보자.
아마존은 현재 엔비디아의 최고 고객이다. AI 초거대언어모델은 말 그대로 매우 거대하기 때문에 데이터센터에서만 구동된다. 대부분 사업자들은 자체적인 데이터센터를 구축하기 힘들기 때문에 클라우드 데이터 서비스를 제공하는 업체를 이용한다. 아마존웹서비스(이하 AWS)는 글로벌 클라우드 서비스 시장의 30% 이상을 점유하고 있는 글로벌 1위 업체로 2위 마이크로소프트의 점유율(20%)보다 10%이상 높다. 3위 구글은 10% 초반대다.
가장 큰 데이터센터를 운영한다는 것은 그만큼 반도체도 많이 산다는 의미다. CPU, GPU, 메모리 모두 많이 사야 한다. 많은 사람들이 AI 서비스를 운영할 데이터센터를 원하고 있고 AWS는 엔비디아로부터 막대한 규모의 GPU를 사고 있다. 돈 주는 쪽이 갑이긴 하지만 엔비디아는 을치고는 꽤나 부담스러운 을이다. AWS의 갑은 데이터센터를 이용하는 고객들이다. 그리고 그 고객들은 엔비디아 GPU를 사용하고 싶어 한다. AWS가 엔비디아 GPU를 확보하지 못하면 고객들은 다른 클라우드 서비스 업체로 옮겨갈 것이다. 고객들이 원하는 충분한 규모의 GPU를 확보해야만 AWS는 사업을 영위할 수 있는 것이다. 그런데 엔비디아 GPU는 가격이 매우 비싼데다 사고자 하는 사람들이 많아서 사고 싶다고 충분히 많이 살 수 있는 것도 아니다. 을이긴 하지만 부담스러운 을이다.
아마존가 새로운 서비스를 공개 하는 자리에서 자체 개발 반도체인 AWS 그라비톤 4(Graviton 4)와 AWS 트레이니엄 2(Trainium 2)를 공개했다. 그라비톤 4는 아마존의 서버용 CPU로 이전 세대 대비 30% 향상된 컴퓨팅 성능과 50% 더 많은 코어, 75% 더 높은 메모리 대역폭을 제공한다. 아담 셀립스키 AWS CEO는 “이미 5만 개의 고객사가 그라비톤 4를 사용하고 있다”고 말했다. 트레이니엄은 AI 모델 처리를 위해 만들어진 반도체(GPU와 같은 AI 가속기)로 전 세대보다 4배 빠른 학습 성능을 제공한다. AWS는 고객들이 원하니 엔비디아 GPU를 사서 설치해 둬야 하지만 한편으로는 자체 반도체를 만들어 데이터센터에 탑재해 고객들이 엔비디아 GPU가 아닌 AWS 자체 개발 반도체를 사용하길 유도하고 있다. 2022년 6월 기준, AWS의 전체 클라우드 서비스 중 자체 반도체를 사용한 비중은 15% 남짓이다. 엔비디아의 독주를 생각하면 꽤 큰 비중이다.
AWS가 개발한 반도체는 일단 외부 판매용이 아니라 내부 설치용이라 엔비디아 GPU와 직접 경쟁을 하진 않는다. 하지만 굳이 외부에 판매하지 않겠다고 명시하진 않았다. 찾는 사람이 있으면 파는 거다. 언제 서로가 경쟁자로 돌변할지 모르는 상황이다. 이런 와중에 엔비디아 GPU의 경쟁 모델을 출시하는 행사에 엔비디아 CEO를 초대한 장면이 참 고약하게 느껴졌다.
그럼 엔비디아가 대부분 점유하고 있는 AI 반도체 시장을 여러 회사들이 조금씩 야금야금 뺏어 가는 것이다.
비용절감을 원하는 구매자 측면에서는 아마존, 구글, 마으크로소프트등 이 자체적으로 하거나 협업개념으로 브로드컴과 같이 개발을하고 생산은 TSMC가 하는것이다.
부족한 생산량과 더 가성비 있는 제품을 만드는 경쟁자 측면에서는 AMD와 경쟁을 할것이다.
후속 주자로 아직 이름은 유명하진 않지만 중국,대만의 신생업체들도 새로운 경쟁자로 나올것이다.
그럼 엔비디아는 어떻게 반대로 전략을 짜고 있을까? 과연 가만히 있을까?
당연히 아니다. 최고의 수비는 공격이라는 말이 있지않은가. 오히려 반대로 엔비디아라고 반도체 영역에 국한해 머물러 있지만은 않는다.
2024년 1월, 미국 샌프란시스코에서 전 세계 바이오 업체들이 모이는 ‘JP모건 헬스케어 컨퍼런스’가 열렸다. 이 자리에 엔비디아가 등장했다. 바이오와 GPU, 그리 관련성 있어 보이지 않는다. 하지만 엔비디아는 이 자리에서 글로벌 제약회사인 암젠이 엔비디아의 AI 신약 개발 플랫폼 바이오니모(BioNeMo)를 도입했다고 밝혔다. 킴벌리 파월 엔비디아 헬스케어 담당 부사장은 “슈퍼컴퓨터에는 신약 개발을 위해 인구 300만 명으로부터 추출한 5억 개의 유전자 데이터가 저장돼 있다”며 “엔비디아의 강력한 AI 시스템을 활용하면 데이터를 7배 더 빠르게 처리하고, 비용을 7배 더 아낄 수 있다”고 소개했다.
엔비디아도 클라우드 사업을 자체적으로 시작한것이다. AWS, 구글, 메타, 마소등의 고객들을 직접만나서 자사 AI서비스를 소개하고 판매까지 하는 것이다.
성장하는 시장 속에서 앞에서는 악수를 하고 "협업"을 하고 있지만 뒤에서는 서로의 더 많은 매출을 올리기 위한 "전쟁"을 하고 있는 것이다. 과연 10년 후에는 어떤 모습일지 궁금하다.
참고: 책 AI 반도체 혁명
AI and The Next Computing Platforms With Jensen Huang and Mark Zuckerberg
Mass Customization For AI Inference