엔비디아가 7월 8일 장 마감 기준으로 인텔의 시가총액을 넘었습니다. 인텔은 스마트폰 호황이었던 2012~2014년에 퀄컴에 자리를 뺏겼던 적을 제외하고 거의 30년간 줄곧 반도체 시장의 선두를 지켜온 기업입니다. 게다가 엔비디아는 8월 20일 장 마감 기준으로 삼성전자의 시가총액도 넘어섰습니다. 글로벌 파운드리 기업 TSMC를 제외하면 사실상 팹리스 반도체 기업에서는 왕좌에 오른 셈입니다.
하지만 단순히 비교하면 엔비디아의 매출과 영업이익은 인텔과 삼성전자의 매출과 영업이익에 비하면 턱없이 작습니다. 2020년 2분기 기준, 인텔의 매출은 197억 달러, 엔비디아는 38.7억 달러로 20% 정도입니다. 삼성전자는 2분기 '영업이익'이 67.9억 달러로 엔비디아의 '매출'의 2배 정도가 되는 기업입니다.
이런 가운데 엔비디아가 거대한 두 기업보다 시장에서 높은 평가를 받는 이유는 무엇일까요? 어떤 점에서 많은 투자자들이 엔비디아에 투자하는 것일까요?
엔비디아는 컴퓨터 CPU(중앙처리장치)를 만들던 회사였습니다. 하지만 시장에서 독주하고 있던 인텔의 아성을 무너뜨리지 못했고, 결국 그래픽 칩셋으로 사업 방향을 바꿉니다. 1990년대 후반 'CPU'에 빗대어 자사의 제품을 'GPU'라 마케팅하며 퍼스널 컴퓨터 시장에서 꾸준히 성장하기 시작했습니다. 이 GPU가 우리가 흔히 알고 있는 'GeForce' 시리즈입니다. 이후 2010년대 중반 인공지능이 여러 산업에서 화두가 되면서 GPU가 머신러닝, 딥러닝의 역심 요소가 되면서 빠르게 사업을 다각화하였습니다.
2020년 2분기 기준, 처음으로 게이밍 GPU 매출이 데이터센터 부문 매출에 뒤지긴 했지만 여전히 게이밍 GPU는 엔비디아의 핵심 매출 부문입니다.
CPU는 고성능의 코어가 여러 가지 연산을 순차적으로 처리하는 반면, GPU는 성능이 낮은 수많은 코어들이 연산을 동시에 처리합니다. 때문에 CPU는 복잡한 연산을 처리하는 데 유리하고, GPU는 단순한 연산을 동시다발적으로 처리하는 데 유리합니다. GPU는 고속 병렬 연산에 능하기 때문에 우리가 즐겨하는 '게임' 속 수많은 화소의 색과 밝기를 동시에 조절하는 데 특화되어 있습니다.
게임 그래픽에 특화되어 있는 GPU는 전 세계 게임 시장이 점점 커짐에 따라 그 수요도 꾸준히 증가해왔습니다. 스마트폰, 태블릿을 제외한 PC와 콘솔 분야에서 엔비디아의 GPU는 꾸준히 판매되고 매출 성장을 견인했습니다.
근래 COVID-19 여파로 집에서 게임을 즐기려는 수요가 늘어, 게이밍 노트북과 콘솔(닌텐도 스위치, MS의 Xbox, 엔비디아의 실드)의 판매량도 늘고 있습니다. 이 디바이스들의 상당수는 엔비디아의 GPU(GeForce, Tegra)를 사용합니다. dGPU에서 분명 AMD라는 경쟁자가 있지만, 엔비디아의 시장 점유율은 80% 내외를 유지하고 있습니다.
경쟁사인 AMD의 무지막지한 가성비를 이겨내고 압도적인 점유율을 자랑하는 이유는 엔비디아가 보유한 앞 선 기술이라고 생각합니다. 그 예로 DLSS(Deep Learning Super Sampling) 2.0을 들 수 있습니다. 이 기술은 흐릿하게 보이는 그래픽을 딥러닝을 통해서 주위 그래픽을 추론하여 유저가 보이기 더욱 선명하게 인식할 수 있도록 해줍니다.
최근 엔비디아의 매출 성장을 견인한 것은 바로 '데이터 센터 부문' (2분기 기준 17억 달러, 전년 대비 167% 성장)입니다. 우리가 흔히 알고 있는 아마존의 AWS, MS의 Azure 등의 데이터 센터는 수많은 고성능 컴퓨터가 네트워크로 연결되어 있는 집약체입니다. 우리가 일상에서 구글 클라우드에 올려서 수시로 내려받고, 내가 하는 게임의 정보들이 바로 이 데이터센터에 저장됩니다.
과거에는 데이터 센터가 지녀야 하는 최고의 덕목(?)은 방대한 양의 저장공간이었습니다. 분석하기 이전에 저장하는 것이 먼저였으니까요. 이 때문에 삼성전자와 하이닉스가 메모리 반도체 시장에서 급속도로 성장하였습니다. 하지만 클라우드 산업의 개화기보다 현재에는 훨씬 더 많은 데이터가 매일매일 생겨나고 있기에 이를 효과적으로 연산해줄 프로세서(CPU 혹은 GPGPU)가 필요해졌습니다. 또, AI가 발달됨에 따라 머신러닝에 최적화된 프로세서를 원하는 기업들도 늘어나고 있는 상황입니다.
엔비디아는 경쟁자들보다 빠르게 이 흐름에 대비했습니다. 인공지능이 많은 기업의 필수적 요소가 될 것이라고 생각하고 자사 제품인 GPU를 데이터센터에 맞게 설계하고 운영할 수 있는 자체 플랫폼 및 솔루션을 만들었습니다. 그리고 올해 4월 데이터센터의 서버와 스토리지 간의 네트워크 기술(InfiniBand)을 만드는 멜라녹스(Mellanox)를 인수하면서 데이터센터 솔루션에 핵심 기술을 확보했습니다.
미래를 끊임없이 준비한 엔비디아는 올해 5월 MIG 기술을 활용하여 기존 제품보다 AI 추론 성능이 7배 뛰어난 신형 GPU ‘A100’를 출시하여 데이터 센터 운영 선두 기업들과 공급 계약이 따내고 있습니다.
MIG(Multi-Instance GPU)는 A100 GPU를 각각 그 자체로 완전하게 격리된 최대 7개의 인스턴스로 파티셔닝 할 수 있는 엔비디아만의 기술입니다. GPU의 연산은 추론, 트레이닝, 고성능 컴퓨팅 등 리소스가 큰 것부터 아주 작은 것까지 매우 다양합니다. 때문에 각 리소스에 맞게 잘게 쪼개어 독자적인 연산을 하는 것은 GPU의 낭비를 막고 최적화된 컴퓨팅 속도를 만들어줍니다.
엔비디아의 데이터 센터 부문의 강점은 MIG와 같은 신기술만 있는 것은 아닙니다. 제가 기업을 고를 때 가장 눈여겨보는 점 중에 하나인 '독자적인 생태계' 또한 잘 구축하였습니다. 엔비디아의 CUDA(Computed Unified Device Architecture)는 GPU 개발 언어 및 프로그램입니다. 엔비디아는 10여 년의 긴 시간 동안 CUDA 코어가 장착된 GPU에서만 CUDA를 사용할 수 있도록 하여 'CUDA 생태계'를 꾸준히 구축해왔습니다.
올해 8월 엔비디아 개발자 프로그램에 등록된 회원수가 200만 명이 넘어섰다고 합니다. 캘리포니아 공과대학, MIT, 옥스퍼드 등 유수의 공과대학교 개발자들이 참여하고 있습니다. 이들은 엔비디아 HPC를 활용해서 AI, 자율주행, 로봇공학 등 여러 분야에서 엔비디아의 칩과 개발자 생태계를 공유하고 있습니다.
더 많은 개발자들이 엔비디아의 칩과 언어를 사용해서 각자의 연구를 진행하고, 이는 엔비디아가 수많은 AI, 자율주행 개발자들이 어떤 부분을 어려워하고, 해결하고 싶은지를 어떤 기업보다 빨리 알아내고 개선할 수 있다는 장점을 가집니다.
[마이크로소프트에 투자한 3가지 이유]에서 클라우드 시장이 커질 것이라는 점에 대해서 먼저 언급한 바가 있습니다. 많은 클라우드 서비스를 제공하는 기업들은 데이터센터에 대한 투자를 아끼지 않을 것이고, 시간이 지날수록 Intel CPU 아키텍처의 Xeon보다 AI 머신러닝과 고성능 컴퓨팅에 적합한 NVIDIA의 GPGPU 아키텍처의 A100을 택하는 클라우드 기업들이 늘어날 것이라고 생각합니다.
2011년, 인공지능 3대 권위자 중 한 명인 스탠퍼드 대학 앤드류 응(Andrew Ng) 박사가 2,000개의 CPU를 대신해 단 12개의 GPU로 딥러닝 연구를 한 것이 화제가 되면서, AI 연구분야에서 본격적으로 GPU가 대두됩니다. 앞서 설명드린 병렬 컴퓨팅 방식으로 GPU는 인공지능 연구 개발에 필요한 머신러닝, 딥러닝이 특화되어있습니다. 기존의 CPU로 진행하던 연구비용을 1% 이하로 줄일 수 있었기 때문에 어쩌면 GPU가 AI 연구의 대중화를 앞당겼다고 볼 수도 있겠습니다.
아마 일반 대중들에게 엔비디아의 GPU가 인공지능에 쓰인 다는 것을 안 계기는 2016년 구글의 알파고의 이세돌 9단의 바둑 대결이었을 겁니다. 176개의 GPU에 있는 50만 개의 코어를 통해 160,000개의 기보와 매일 30,000번 이상의 대국을 진행했습니다. CPU를 통해서 위와 같은 딥러닝을 구현하려면 아마도 천문학적인 금액이 들어갔을 것입니다.
엔비디아 GPU의 성능은 세계 25대 슈퍼컴퓨터 중 20대가 엔비디아의 GPU를 사용한다는 점에서 이미 증명되어왔습니다. 게다가 멜라녹스의 인피니밴드 네트워킹 기술까지 확보한 엔비디아는 상위 500대 슈퍼컴퓨터 시장의 66%에 해당하는 컴퓨터에 기술 지원을 하여 그 영향력이 더욱 강해졌습니다.
현재 AI 연구와 추론은 대부분 데이터센터급 규모 컴퓨팅에서 이루어집니다. 규모가 작은 연구소나 스타트업의 경우 상대적으로 AI 연구에 장벽을 느낄 수밖에 없습니다. 이에 2019년 엔비디아는 지능형 시스템 구축을 가능하게 하는 인공지능(AI) 컴퓨터, 젯슨 나노(Jeston Nano)를 출시하였습니다. 99달러에 판매하고 있는 젯슨 나노 키트는 규모에 관계없이 다양한 개발자와 기업이 AI 연구를 할 수 있도록 도와줄 것으로 보입니다.
자율주행 분야도 엔비디아가 현재 두각을 나타내고 있습니다. 테슬라를 제외한 대부분의 자율주행차 연구 기업들은 엔비디아의 GPU와 오픈 플랫폼을 통해서 연구를 진행하고 있습니다. 엔비디아 드라이브(NVIDIA DRIVE)는 현재 자율주행 개발의 표준(데이터 수집, 모델 분석, 시뮬레이션 솔루션 제공)으로 자리 잡고 있으며 오픈 플랫폼이기 때문에 개발자/기업이 엔비디아 생태계에서 자유롭게 연구/개발을 할 수 있는 환경입니다. 때문에 엔비디아는 이들에게 더 최적화된 프로세스, 어플리케이션을 제공하여 생태계 Lock-In 하도록 만들고 있습니다.
반면 인텔 모빌아이의 EyeQ 칩의 경우, 알고리즘 자체가 고객사들에게 공개되지 않습니다. 따라서 자율주행을 연구하는 많은 기업들이 실제 추구하는 방향으로 커스터마이징 하기 힘들고 연구 결과 또한 제한적으로 받아들일 수밖에 없습니다.
AI가 4차 산업의 핵심 분야라는 것은 아마 대부분이 공감하실 겁니다. AI라고 하면 되게 거창하게 들리지만, 우리가 유튜브에서 나에게 꼭 맞는 채널을 추천해주고, 쿠팡에서 내가 사고 싶어 하는 물건을 어떻게 알았는지(?) 추천해주는 알고리듬도 인공지능의 한 영역입니다.
어떤 인공지능의 영역(자율주행, 추천 알고리듬 등)이든 거의 모든 기업에서 연구하고 실제 제품/서비스에 적용하게 될텐데, 이때 엔비디아의 하드웨어, 소프트웨어 플랫폼을 택하지 않을까요?
읽어주셔서 감사합니다.
오늘도 좋은 하루 보내세요. :D