brunch

You can make anything
by writing

C.S.Lewis

by 서진호 Apr 19. 2021

엔비디아, 그레이스칩으로 AI 데이터센터 재설계하다!

2020년대 초 엔비디아는 인텔을 완전히 곤경에 빠뜨렸습니다. 그 이유는 바로 영국 반도체 회사인 ARM을 인수할 계획을 발표하자마자 약 1조개 이상 매개 변수 AI 모델을 위한 메모리, CPU 및 GPU 액셀레이터를 긴밀하게 통합하여 AI를 위한 데이터 센터를 재발명했습니다. 동시에 인공지능 칩 리더로서 수익성이 가장 높은 빅 테크 회사가 될 것이라는 인상을 이번 GTC 2021 키노트를 보고 느꼈습니다! 


작년 GTC에서 자택 부엌에서 차세대 GPU 아키텍처인 암페어(Ampere)를 꺼내놓은 장면이 인상 깊었는데, 올해도 마찬가지로 자택 부엌에서 키노트를 발표했습니다. 올해는 더 특별히 CPU/GPU계의 흡입 신공이라도 연마한 듯이 하얀 머리카락이 인상 깊었습니다. 그렇다면, 이번 GTC 2021에 어떤 것들이 발표되었을까요? 정말 인공지능 컴퓨팅의 새 패러다임을 전환시킬 수 있을까요?  


[사진 1 -  GTC 2021 엔비디아 CEO 젠슨 황 키노트] 


엔비디아는 현재 어떤 회사인가?  


현재 전 세계 칩 부족으로 대만 반도체 회사들과 엔비디아는 매우 잘 알고 있습니다. 인텔은 2020년 데이터 센터 그룹의 매출이 전년 대비 11% 증가한 261억 달러를 보고 했습니다. 반면에 엔비디아는 인공지능 및 기타 고성능 컴퓨팅 작업을 향상시키기 위한 새로운 칩을 보유하고 있습니다. 따라서 2023년에 그레이스 프로세서를 탑재한 거대한 슈퍼 컴퓨터를 출시할 예정입니다. 


그렇게 된다면, 이를 통해 엔비디아는 해당 분야에서 진정으로 동급의 빅 테크 회사로 자리매김할 것입니다. 주식은 현재 608 달러이지만 혁신의 속도는 곧 1천 달러의 주식이 될 것임을 의미합니다. 또한 시가 총액은 3천770억 달러이지만 오래 동안 그렇게 낮지는 않을 것으로 예상됩니다.


현재 엔비디아에는 1만 9 천명명에 가까운 직원이 있고 총마진은 62%입니다. 재무제표를 보면 이 회사는 순이익 챔피언입니다. 엔비디아의 회계 1분기 매출은 5월에 끝나는 최대 60억 달러에 이르는 데, 4분기 총수익은 61 % 증가했습니다. 따라서 매출이 167억 달러에 달하는 엔비디아는 2020 년대 이후에도 계속 성장하여 가장 중요한 빅 테크 기업이 될 것입니다. 


또한 엔비디아는 현재 S&P에서 12 번째로 큰 회사이자 인공지능의 6 번째 빅 테크 기업입니다. 개인용 컴퓨터 (PC) 그래픽부터 그래픽 처리 장치 (GPU) 및 인공지능(AI)에 중점을 두고 패러다임을 옮겨 가면서 오늘날 미국에서 가장 혁신적인 회사들로 거듭나고 있습니다.   


엔비디아 그레이스 칩 탄생 


엔비디아는 12년 동안 봄에 개최되는 GPU 테크놀로지 콘퍼런스(GTC)를 통하여 그래픽 및 애플리케이션 가속화를 위한 새로운 GPU로 고객들과 투자자들을 놀라게 했습니다. 그러나 올해 설립자이자 CEO 인 젠슨 황은 새로운 GPU가 아니라 2023 년 ARM 기반 CPU를 발표함으로써 약 십만 명 이상의 가상 참석자를 놀라게 했습니다.


저도 이번 엔비디아 행사에서 가장 먼저 눈에 떠오르는 것은 ARM 기술을 기반으로 그레이스(Grace)라는 자체 서버 중앙 프로세서였습니다. 서버의 심장을 움직이는 CPU가 아니라 이제 인공지능용 그래픽 프로세서와 칩이 대세입니다. 새로운 그레이스 프로세서는 최초의 데이터 센터 CPU로 90% 이상의 시장 점유율을 차지하는 시장에서 인텔에게 도전합니다.


엔비디아는 맞춤형으로 설계된 CPU-GPU 플랫폼이 차세대 하이퍼스케일 인공 지능을 가능하게 하고 컴퓨터 기반 "일반 지능"수준에 접근하기 시작할 수 있는 유일한 방법이라고 믿는다고 이야기했습니다. 이를 위해 더 빠른 NVLink를 통해 차세대 GPU에 연결된 그레이스라는 곧 출시될 엔비디아용 ARM CPU를 연결하는 AI 용 플랫폼을 개발 중이라고 발표했습니다.


미국 에너지부 로스 알 라모스 국립 연구소를 비롯한 연구진이 그레이스 칩을 사용하여 슈퍼 컴퓨터를 구축할 계획이라고 밝혔습니다. 그레이스는 엔비디아의 인공지능 서버 제품에서 CPU 크기의 허점을 채우기 위해 설계되었습니다. GPU는 특정 클래스의 딥러닝 워크로드에 매우 적합하지만 GPU를 계속 공급하는 데 CPU가 필요하기 때문에 모든 워크로드를 조화롭게 ARM CPU과 GPU가 최적화될 것입니다. 


젠슨 황은 2030년대까지 전체 시장을 통해 여러 부문에서 성장할 여지가 있는 세대별 칩 회사를 만들고 있습니다. 데이터 센터용 엔비디아 그레이스는 기본적으로 AI 및 HPC에 대해 '오늘날 가장 빠른 서버'의 10 배 성능을 약속합니다. 


새로운 그레이스는 컴퓨팅 개척자 그레이스 호퍼(코볼 창시자)의 이름을 따서 명명되었습니다. 엔비디아에 따르면 다음과 같이 주장했습니다. 


2023년에 가장 복잡한 AI 및 고성능 컴퓨팅 워크로드에서 오늘날 가장 빠른 서버의 성능을 10 배 향상할 것입니다.   

또한 그레이스 차세대 버전도 이미 2025년에 출시될 로드맵에 있습니다. 새로운 칩은 인공지능 고객이 오늘날의 칩 설계에서 가능한 것보다 훨씬 더 복잡한 컴퓨팅 작업을 실행할 수 있도록 해야 하며, 이는 오늘날 머신 러닝 연구의 성배인 일반 인공지능(GAI)을 향한 단계라고 캠브리언 AI 리서치 분석가인 칼 프레운드는 말했습니다. 


엔비디아는 무엇을 발표했으며 그 이유는 무엇인가? 


그렇다면, 좀 더 자세히 엔비디아는 무엇을 발표했고 그 이유는 무엇인지에 대해 알아보겠습니다. 젠슨의 목표는 인공지능 혁신의 차세대 물결인 1조 매개 변수 컴퓨터 인텔리전스를 추구하기 위해 긴밀하게 통합된 컴퓨팅 기반을 만드는 것이라고 말합니다. 오늘날 가장 큰 AI 모델은 Open.ai사의 GPT-3으로, 언어 처리에 총 1,700 억 개의 매개 변수가 있으며, 마이크로소프트 애저에서 호스팅 하는 1천 여개 이상의 엔비디아 GPU가 필요합니다. 


인간의 뇌에는 약 100 조 개의 시냅스가 있으며 이는 심층 신경망 매개 변수와 거의 동일합니다. 만일 성공한다면 엔비디아 시스템은 인간의 뇌보다 100 배 더 느릴 것입니다. 이것은 여전히 일반 인텔리전스에 접근하지 않지만 미국 DOE 연구소에서 계획한 현재 계획된 엑사스케일(Exascale) 시스템보다 훨씬 더 클 수 있습니다.


엔비디아의 액셀레이터 컴퓨팅 부사장인 이안 버크는 이것이 오늘날의 문제를 해결하기 위해 다른 CPU와 경쟁하는 것이 아니라는 점을 분명히 했습니다. 버크는 다음과 같이 말했습니다. 


 그레이스는 오늘날의 MLperf 벤치 마크를 실행하는 x86 CPU 및 NVIDIA GPU를 능가하지 않을 것입니다. 그러나 오히려 시스템 설계를 통해 오늘날보다 훨씬 더 큰 AI 문제를 해결할 수 있습니다.

엔비디아는 빠른 응답 시간으로 1 조 개의 매개 변수 모델을 효율적으로 실행하기 위해 전체 시스템 아키텍처를 재설계해야 했습니다. 이것은 엔비디아를 위한 통합 시스템 설계에 관한 것입니다. 그 마법은 부분적으로 더 빠른 NVLink 버전에서 나올 것이며, 그레이스에서 GPU로, GPU 간, 그레이스 CPU 간에 500GB / S의 캐시 일관된 상호 연결을 제공합니다. 


[사진 2 - 더 높은 메모리의 빠른 상호 연결을 통해 각 GPU에 연결된 전용 ARM 칩으로 재설계한 그레이스칩 개발]


이러한 수준의 엄청난 성능을 구현하기 위해 이러한 상호 연결을 구축하는 CPU 공급 업체가 없기 때문에 NV엔비디아는 직접 설계할 수밖에 없었습니다. 또한 엔비디아는 그레이스가 오늘날 퀄컴과 같은 모바일 플랫폼에서 사용되는 LPDDR5x를 지원할 것이라고 밝혔습니다. 총 메모리 액세스는 GPU에 대한 오늘날의 서버 메모리보다 약 2TB / S 또는 30 배 더 빠릅니다. 


GPU는 로컬 데이터 저장을 위해 고 대역폭 메모리에 계속 의존합니다. 그레이스는 4개의 Grace CPU와 GPU가 NVLink를 통해 직접 상호 연결되는 HGX 보드와 향후 서버에 제공됩니다. 향후 엔비디아의 GPU는 이러한 서버를 하이퍼 스케일 AI 머신으로 결합하기 위한 상호 연결을 제공할 것입니다. 더 빠른 상호 연결과 더 높은 메모리 대역폭을 통해 각 GPU에 연결된 전용 Arm CPU를 사용하여 AI 시스템을 완전히 재설계하여 기존 X86 가속 서버와 비교할 때 NVIDIA가 구상하는 극적인 성능 향상을 볼 수 있습니다.


[사진 3 - 모든 x86 CPU에서 누락된 NVLINK는 엔비디아의 자체 ARM CPU의 주요 기능] 


적어도 한 명의 고객이 아이디어를 좋아하고 더 많은 고객이 따를 것으로 기대합니다. 스위스 국립 컴퓨팅 센터 (SCSC)와 ETH 취리히는 HPE 크레이가 제공하는 대규모 그레이스 기반 시스템을 배포하여 최대 규모의 AI 네트워크에 20 엑사 플롭(16 비트) AI 성능을 제공할 계획입니다.  이는 현재 예상되는 가장 빠른 DOE 시스템인 미국 엘 캐피턴(2023 년 AMD CPU 및 GPU 사용 예정)보다 10 배 더 빠른 것입니다. 


[사진 4 - AI용 전 세계 가장 빠른 슈퍼 컴퓨팅 계획]


첫 번째 엑사스케일(Exascale) 시스템에서 엔비디아를 제외하기로 한 미국 DOE 결정이 HPC에서 엔비디아 리더십 종말을 예고하지 않았음이 이제 분명합니다. 그것 와는 거리가 먼 이 발표는 거의 같은 기간에 경쟁 업체를 10 배로 앞썼기 때문입니다. 엔비디아는 이번 발표가 인텔 또는 AMD CPU와 직접 경쟁하기 위한 변화를 보여주지 않기 위해 많은 노력을 기울였지만 그레이스 CPU는 대규모 AI 모델을 처리하도록 구축된 시스템에서 이러한 CPU를 확실히 대체할 것으로 봅니다. 젠슨은 또한 CPU, GPU 및 DPU(Data Processing Unit)의 연간 발전을 제공할 새로운 회사 로드맵을 공유했습니다. 


[사진 5- 엔비디아의 CPU, GPU, DPU 3년 향후 칩 계획]


그 외 새로운 종류의 인공지능 처리를 가능하게 할 수 있는 놀라운 성장에서 진정한 혁신을 보여주고 있습니다. 실시간 및 사실적인 그래픽 디자인을 위한 옴니버스 엔터프라이즈 제품군은 진정한 협업이자 B2B 예술 작품입니다. 엔비디아 옴니버스 엔터프라이즈 패키지에는 클라이언트 간의 공유 데이터베이스를 관리하는 데 사용되는 엔비디아 옴니버스 뉴클리스 서버가 포함되어 있습니다. 


엔비디아의 아틀란(Altan) 칩은 2025 년에 자율 주행 차를 부양할 것입니다. 엔비디아는 작년에 ARM을 400 억 달러에 인수할 계획을 발표했습니다. 타 ARM 칩 제조업체에 계속해서 기술 라이선스를 제공할 것이라고 밝혔습니다. 


엔비디아의 향후 계획은?    


엔비디아는 고객이 가장 까다로운 문제만 해결하도록 돕는 것이 사명임을 지속적으로 상기시킵니다. 이 발표는 엔비디아가 경쟁에서 자신을 측정하는 것이 아니라 빛의 속도로 측정한다는 것을 보여줍니다. 이러한 열정은 비전을 실현할 수 있도록 ARM CPU를 설계해야 합니다. 다가오는 그레이스 CPU는 엔비디아가 CPU 사업에 뛰어드는 것이 아니지만 젠슨 황과 그의 파트너가 구상하는 1조 개의 매개 변수 AI 모델을 위해 데이터 센터를 재설계하는 것입니다. 


그러므로 엔비디아는 주요 시장에서 인텔에 도전한 지금까지 가장 큰 칩 회사가 될 것입니다. 엔비디아의 시장 진출은 ARM의 데이터 센터 진출을 가속화할 수 있으며, 대만 반도체 제조 회사는 2021년의 글로벌 칩 부족으로 인해 많은 신흥 디지털 전환 부문을 복잡하게 할 뿐만 아니라 지속적인 성장을 이어갈 것으로 예상됩니다.


끝으로 자체 중앙 프로세서를 만들어 엔비디아는 처음으로 인텔과 AMD를 경쟁할 수 있는 직접 ARM을 인수하려고 합니다. 엔비디아는 인텔을 방해할 수 있다면, 400억 달러 가격은 그렇게 비싸지 않고 오히려 천재적인 움직임처럼 보일 것입니다. 그러므로 21세기에 미국에서 가장 독특하고 수익성 있는 기업 중 하나로 부상할 것이라고 저는 믿습니다.


GTC 2021 키노트: https://www.nvidia.com/en-us/gtc/keynote/?ncid=em-even-562061&mkt_tok=MTU2LU9GTi03NDIAAAF8b3NEmIfh2Yfd0agksbwaXWpvIeRVbj4d35fRp3U07mdJSZQJ2W1KS9sk-jMjkOWHdSBZ8mOTG9k4vvrb868uO_LniLtK6LtU1uQRTnrPbj6t6P8


매거진의 이전글 더 많은 데이터 중심으로, 더 작은모델로!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari