brunch

매거진 실리콘 밸리 북마크

2 라이킷 50 댓글 15

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 예나빠 Apr 03. 2024

NVIDIA는 무엇이 그렇게 특별한가?

25년 동안 보아온 외부자의 의견

* 본 계시물은 스크롤 압박이 심하오니 유의바랍니다.

The NVIDIA GTC 2024 Keynote Live Blog (Starts at 1:00pm PT/20:00 UTC)

www.anandtech.com

얼마 전 GTC 2024에서 발표된 NVIDIA의 새 AI GPU를 보며 모두들 경악에 빠졌다. 이미 시장을 지배하고 있는 1등 기업이 뭘 또 이렇게까지 치고 나가나 싶은 것이다. 역시 이들에게는 '수성'이란 없었다. '공격'만 있을 뿐. S사의 전 회장이 부르짖었던 '초격차'가 S사가 아닌 미국 기업에서 일어나고 있다.

이제 NVIDIA를 모르는 사람이 없다. 연일 천장을 뚫는 NVIDIA의 주가덕에 주식 좀 한다는 사람들은 모두 웃거나 운다. NVIDIA가 70%에 육박하는 영업 마진을 내는 걸 보며, 배가 찢어질 정도로 아파진 전 세계의 팹리스들은 '우리도 AI 하드웨어를 해보겠다'라고 달려들고 있다.

덕분에 NVIDIA가 왜 지금 돈을 쓸어 담고 있는지, 황 회장의 리더십은 무엇이며, 어떻게 혁신을 이끌고 있는지 모두가 분석, 분석, 분석한다. 30년 된 이 회사의 역사를 고찰하고 찬양하는 기사, 유튜브 콘텐츠가 넘쳐난다. 애플, 테슬라에서 이어 혁신의 리더십은 이제 NVIDIA로 넘어온 것만 같다.

상황이 이렇다 보니, 과연 NVIDIA의 독주가 얼마가 오래갈지 많은 이들이 궁금해한다. 시기심, 질투심인지 (아니면 바람인지) 혹자들은 NVIDIA의 재무 재표를 따져가며 거품론을 설파한다. AI 버블과 함께 언젠가 붕괴될 것이라고 도끼눈을 뜬다.

그런데, 대부분의 사람들처럼 나도 그들의 영광이 대대손손 지속될 것으로 생각하는 편이다. 그것은 향후 AI 시장의 전망이나 최근 보여준 NVIDIA의 퍼포먼스 때문이 아니라, 거의 초창기 때부터 보아온 그들의 행보 때문이다. 참고로 난 NVIDIA에 적을 둔적은 없다 (그런데 오히려 현직 NVIDIA 직원이 아니기에 더 편하게 이야기할 수 있다. 원래 소속 회사 이야기는 공개적으로 이야기 못하게 되어 있으니 말이다).

그러면서 뭘 안다고 이야기하냐고? 그동안 학계에 있을 때의 전공이나, 업계에서 지금까지 이어온 내 커리어가 GPU라 좋으나 싫으나 어쩔 수 없이 NVIDIA를 주시해야 했다. 또한 반도체 3사를 거치며 무수한 NVIDIA 출신 동료들을 만났으며, 온오프라인 미팅, 학회 등에서 꽤 많은 NVIDIA 연구원들과 이야기도 나눴다. 그렇게 직간접적으로 접한 스토리가 겹겹이 쌓여 어느새 NVIDIA에 대한 나만의 이미지가 생겨난 것이다.

'난공불락의 철옹성'

이미지 출처=DALL-E

오랜 시간 동안 쌓여 구축된 이 이미지 때문에 나는 그들의 권좌가 굳건할 것 같다. 철왕좌에 긴 장검을 기대고 앉아있는 황 회장의 모습부터 연상될 뿐이다. 그게 다다. 왜 이런 느낌적인 느낌만으로 왜 NVIDIA가 강하다고 생각하는지 이제부터 나만의 이야기를 좀 해보려 한다.

지금 누구나 말하고 있는 매출, 영업이익, 리더십, 비즈니스, AI 시장 전망 같은 거창한 분석 따위가 아닌, 내가 직간접적으로 겪은 경험에 따른 이야기다. 다소 기술적인 내용이지만 최대한 일반화시키도록 하겠다.

내가 NVIDIA라는 회사를 처음 알게 된 것은 꽤 오래전 일이다. 25년 전(아니 그렇게 오래 전이야?) 나는 청운의 꿈을 앉고 대학원에 진학했고, 어리바리한 석사였던 나는 당시 박사 사수로부터 연구(라기보다는 잡일) 주제 하나를 부여받았다.

그것은 이제는 거의 사장된 용어 '그래픽 가속기(Graphics Accelerator)'였다 (지금은 AI 가속이 화두지만, 당시는 그래픽스조차 가속하느냐 마느냐 하던 시기였다). '그래픽 가속기'라면 3D 게임을 빨리 처리해 주는 하드웨어, GPU이전 시절의 그래픽 카드를 생각하면 쉽다.

당시 NVIDIA는 몇 번의 고전 끝에 그래픽 칩셋 시장에서 첫 번째 성공을 거두고 있었고, 회사의 존재가 PC 게이머들 사이에서 빠르게 회자되고 있었다. 그즈음부터였다. NVIDIA를 예의 주시하게 된 것이. 내 연구 주제와 직접적으로 관련 있는 미국 기업이니 모르려 해도 모를 수가 없었다. 이후부터 뻔질나게 이 회사의 웹사이트를 들락거렸다.

외장형 그래픽 칩셋 시장이 NVIDIA, ATI 두 회사에서 의해 이제 막 성장하던 때였다. 따라서 당시 학계가 '그래픽 가속기'를 연구 주제로 삼기에도 나쁘지 않았다. 국내에는 이를 연구하는 학교는 극소수였으나, 미국에는 스탠퍼드를 필두로, UNC, 조지아텍, 버지니아텍, 유타, UT오스틴 등 유수 대학 연구 그룹이 달려들고 있었다 (이후 NVIDIA가 워낙 빠르게 치고 나가 10년도 안되어 이 연구실들은 연구 주제를 다 접어야 했지만).

그 후 석, 박사과정 동안 시뮬레이터 구현, 그래픽 가속기 구조, 병렬 렌더링 등 잡스럽게 연구/구현 프로젝트에 참여했다. 그 기간 동안 NVIDIA는 늘 내게 말 그대로 '레퍼런스'였다. 새로운 제품이 출시되면 관련 문서를 내려받아 읽었고, 혹여나 새 그래픽 카드가 내 손에 들어오면 신기능을 시험해 보고 찬탄에 마지않았다.

졸업 후 S사에 입사해 GPU 프로젝트에 참여하는 동안에도, 미국으로 건너와 I사에서 그래픽스 리서치팀에서 일할 때도 NVIDIA는 늘 분석과 따라잡아야 할 대상이었다. 그 20년이 넘는 기간 동안 외부자로 겪어온 NVIDIA는 말 그대로 '난공불락'이었다.

사람 (People)

NVIDIA의 강점은 세계 최고의 맨파워에서 나온다. 탑티어 엔지니어, 연구원들이 운집해 있는 회사다. 2021년 이래 가장 일하고 싶은 기업 1-2권으로 계속 뽑히는 만큼 늘 좋은 인재들이 몰려든다. 지금 워낙 핫한 회사니 어찌 보면 당연한 일이다.

지금이야 인재들이 알아서들 찾아 오지만 처음부터 그렇지는 않았다. 그럼에도 NVIDIA는 초창기부터 리쿠르팅 전략을 펼쳐 좋은 인재들을 확보했다. 2000년대 초 그래픽 칩셋 사업이 궤도에 오르고 더 많은 R&D 인력이 필요해지자 그들은 적극적으로 발품을 팔기 시작한다.

우선 그들은 SIGGRAPH/Graphics Hardware와 같은 탑티어 그래픽스 학회를 해마다 방문하기 시작했다. NVIDIA 관계자들은 세션장 입구에서 쪼그리고 있다가, 논문을 발표하고 나오는 대학원생들에게 먼저 다가갔다. 학생들에게 명함을 건네며 입사 의향을 타진하기 위해서였다. 졸업은 언제 하는지, NVIDIA에 관심은 있는지 물어보고 적극적으로 구애했다. 지금 생각하면 상상도 못 할 일.

당시 해당 학회에서 논문을 발표했던 연구실 선배 1인은 한국으로 돌아오자마자 NVIDIA로부터 '졸업 시기와 입사 의향'을 물어보는 메일을 받았다. 귀차니즘의 결정체였던 그 선배는 해당 메일을 무시(!)하는 용자였는데, 어쩌면 지금 땅을 치고 후회하고 있을지 모른다.

NVIDIA는 일찍부터 미국 대학 유수 그래픽스 연구 그룹들과 파트너십을 맺기 시작했다. 연구비를 지원하거나 GPU 신제품이 출시되면 대학에 우선 제공하는 등 다양한 방법으로 인재 확보에 공을 들였다.

대표적으로 스탠퍼드 CS학과의 그래픽스 그룹을 들 수 있는데, 산학 협력을 통해 스탠퍼드와 공동 연구를 수시로 진행했고 박사들이 졸업하면 잽싸게 모셔갔다. 후술 하겠지만 스탠퍼드-NVIDIA 공동 프로젝트의 결과물들은 GPU 역사의 전환점을 만드는데 혁혁하게 기여하기에 이른다.

2010년대부터는 찜해놓은 학생들을 영입하는데서 그치지 않고, 대학의 교수들을 직접 모셔오기 시작한다. 때로는 교수만, 때로는 교수가 이끌고 있는 연구 그룹을 통째로 데리고 왔다. NVIDIA Research의 창립멤버라 할 수 있는 미국 버지니아텍의 David Lubke, 독일 울름 대학의 Alex Keller, 영국 UCL의 Jan Kautz, 미국 아이오와 대학의 Chris Wyman 등 저명한 그래픽스 분야 교수들을 좋은 조건으로 영입했고, 이들은 NVIDIA에서 연구 팀들을 맡아 리더십을 발휘하기 시작한다.

이런 행보는 그 이후로도 계속되어, 인턴쉽, 펠로우쉽(장학 프로그램), 산학 협력 프로젝트를 지속적으로 펼친 결과, 현재 NVIDIA Research는 200명이 훨씬 넘는 탑티어 연구 인력을 확보 중이다. 분야도 실시간 그래픽스를 넘어 AI, 자율 주행, 비전, 로보틱스 등으로 확대되었고, 이 연구 그룹들이 속한 NVIDIA Research의 위상은 현재 학계에서 최상위에 포진한다.

기술 (Technology)

이제 NVIDIA가 미래 기술을 주도하고 있다는 것을 누구도 부인하지 않는다. 그런데 NVIDIA는 어떻게 30여 년 동안 기술 주도권을 계속 유지할 수 있었을까?

지금 대부분의 사람들은 NVIDIA가 인공 지능 반도체로 혁신을 이뤘다고 생각하지만 이는 사실과는 다르다. 훨씬 이전, '그래픽스 가속기' 시절부터 그들에게는 혁신의 DNA가 있었고 그 역시 '사람'에 있었다. 끊임없이 유입되는 인재들이 GPU의 주요 변곡점을 만들어 냈고 결국 시장에도 막대한 영향을 끼쳤기 때문이다.

개인적으로 그동안 NVIDIA가 만들어낸 GPU 변곡점 기술을 4가지로 본다. 1) Programmable Shader, 2) GPGPU, 3) AI, 그리고 4) Ray Tracing.

GPU의 탄생, 그리고 Bill Mark

스탠퍼드의 CS 대학원 박사과정이었던 Bill Mark는 1999년 6월 지도 교수인 Pat Hanrahan의 지도 아래 새로운 연구 프로젝트를 착수한다. 그것은 '그래픽 가속기에 프로그램을 처리할 수 있는 기능을 넣는 것'이었다. 쉽게 말해 사용자가 짠 프로그램을 이식시킬 수 있도록 하드웨어 구조를 개편하는 것이다.

당시 3D 칩셋은 말 그대로 가속기, 주어진 연산만을 빠르게 처리해 주는 고정 기능(Fixed-function) 하드웨어에 불과했다. 그리고 그 '주어진 연산'이라는 것도 표준화된 3D 연산이었다. 즉, '3차원 데이터를 공간상에서 표현하고, 빛과 상호 작용해 최종 색상을 입히는가' 정도의 미리 정해진 표준 연산만 처리할 수 있었던 것이다.

이 '가속기'로 표준 연산을 빠르게 처리하여 실시간 3차원 그래픽에 성공했지만, 당연히 표준에서 벗어난 연산들은 처리할 수 없었다. 바로 고정 기능 하드웨어의 태생적인 한계였다. 쉽게 말해 하나만 잘하는 스페셜리스트였던 것이다. Bill과 Pat 교수는 미래의 수요를 꿰뚫었고, NVDIA와 스탠퍼드는 바로 다음 단계에 착수했다.

그것은 프로그래머에게 좀 더 많은 자유도를 주는 것이었다. 하드웨어에 좀 더 많은 유연성 제공하고, 그래픽 가속기를 CPU처럼 프로그램을 처리하는 구조로 변경함으로써 말이다. 여기서 나아가 그들은 좀 더 큰 그림까지 그렸다.

'5년 내 Toy Story의 그래픽을 NVIDIA의 그래픽 카드로 실시간 처리하겠다'

내 지도 교수는 미국 출장 중 NVIDIA의 이 야심을 접해 들었다고 했다. 한국으로 돌아왔던 그는 '연구자라면 저 정도 야망을 가져야 하지 않냐'며 한동안 애먼 박사과정들을 들들 볶았다. 우리는 마음속으로 합심해 소리쳤다 '미친 NVIDIA. 미친 NVIDIA'.

이미지 출처= 영화 Toy Story

무지막지한 CPU 서버들로 렌더링해야 했던 그래픽 애니메이션 한편을 그래픽 가속기에서 실시간으로 돌리겠는 것은 NVIDIA에게 실로 원대한 꿈이었다. 그 꿈을 실현하기 위해서 우선 해야 할 일은, 영화 특수효과, 애니메이션과 같은 오프라인 렌더링의 다양한 그래픽 알고리즘을 그래픽 가속기에서 실행시키는 것이었다.

2년여의 연구 끝에 Bill과 동료들은 필요한 컴파일러 기술을 완성했고 NVIDIA는 새로운 가속기 구조를 설계했다. Bill은 졸업 후 NVIDIA에 입사해 자신의 연구를 상용화시키기로 결심한다. 그리고 그는 자신의 팀에서 Cg(C for graphics)라 불리는 개발자 친화적인, 새로운 그래픽 프로그래밍 언어를 개발해 출시했다. 당시 나는 과학 시각화 연구를 하고 있었는데, 그때 대부분의 프로토타입을 Bill이 만든 Cg로 개발하곤 했다.

그리고 이 프로그래밍이 가능한 최초의 NVIDIA의 3D 칩셋, GeForce3 시리즈가 2001년에 출시된다. 이 시점부터 더 이상 이 하드웨어는 '그래픽 가속기'라 불리지 않았다. 더 이상 CPU를 보조해 주는 하드웨어가 아닌, CPU와 동급의 독립 프로세서로 존재하게 된 것이다. 바로 GPU가 탄생하는 순간이었다.

Bill은 이듬해 NVIDIA를 퇴사, 텍사스 오스틴 대학에서 조교수로 재직하며 그래픽스 아키텍처 연구 그룹을 리딩했다. 또다시 업계로 나와 Intel Lab에서 광선 추적(Ray Tracing) 연구 팀을 이끌었고, 현재는 구글 리서치에서 새로운 혁신을 꾀하고 있다.

범용 GPU, 그리고 Ian Buck

2002년 또 한 명의 스탠퍼드 박사과정이었던 Ian Buck은 재미있는 연구 프로젝트를 기획한다. 하지만 당시 만해도 Ian은 'GPU를 그래픽스만이 아닌 좀 더 다양한 분야에 쓰겠다'라는 자신의 아이디어가 향후 20년간 GPU와 그래픽스 업계에 크나큰 파장을 일으킬 줄 상상하지 못했다.

Ian은 미래의 GPU는 좀 더 일반화될 것으로 전망했고 이를 위한 새로운 프로그래밍 모델을 연구하기 시작했다. NVIDIA가 GPU에 프로그램을 입히면서 구조가 유연해지고 점차 그 처리능력도 눈에 띄게 발전하면서, 더 많은 사용자의 유입을 이끌었기 때문이다.

비디오나 이미지와 같은 비그래픽 연구자들도 '우리도 GPU를 한번 써볼까?' 하면서 조금씩 사용하기 시작한 것이다. CPU보다도 GPU에서 실행했을 때 더 빠르게 동작하는 사례들이 심심찮게 등장했기 때문이다.

Ian은 이런 미래의 수요를 예측해 일반 개발자가 쉽게 쓸 수 있는 범용적인 프로그래밍 언어와 개발 환경을 설계하기 시작했다. Cg/HLSL/GLSL과 같은 당시의 GPU 프로그래밍 언어는 비그래픽 개발자들이 사용하기에 매우 까다로웠기 때문이다. 여전히 그래픽스를 위한 언어들이었고, GPU를 사용하기 위해서 비그래픽 개발자들도 그래픽스를 이해해야 했다.

그는 스탠퍼드에서 자신의 후배들과 함께 2년 동안 Brook이라 불리는 새로운 GPU 프로그래밍 언어, 컴파일러, 런타임을 개발했다. 그리고 그가 연구 결과를 2004년 SIGGRAPH에서 논문으로 발표했을 때, 학계, 업계는 환호성을 질렀던 것을 나는 아직도 기억한다.

Ian은 같은 해 가을, 졸업과 동시에 NVIDIA에 입사했다. Bill과 마찬가지로 그는 NVIDIA에서 그의 연구 결과를 상용화시키는 팀을 이끌었다. 그리고 3년 뒤인 2007년 여름, Ian의 Brook은 더욱 강력해진 기능과 성능을 갖는 새로운 이름의 기술로 공식적으로 출시된다.

그것이 바로 쿠다, CUDA(Compute Unified Device Architecture)다. NVIDIA가 현재 AI 서버 시장을 독점하고 있는 이유라고 알려진 바로 그 '쿠다'. 후술 하겠지만 쿠다는 NVIDIA의 공격적인 마케팅, 교육, 시장 점유 전략과 함께 빠르게 업계에 배포되었고, 결국 향후 20년이 넘는 시간 동안 시장에서 사실상 표준(De facto standard)으로 자리 잡았다.

하지만, 여전히 쓰기 어려운 쿠다. 이미지 출처=인터넷 밈

쿠다가 GPU를 비그래픽 분야에 응용될 수 있도록 길을 열어주면서, 범용 GPU(General Purpose Graphics Processing Unit, GPGPU)라는 다소 모순적인(범용 + 그래픽이 조합되는) 용어까지 등장했다. GPGPU라는 새로운 시장마저 열린 것이다.

쿠다는 고성능 서버 시장의 판도를 조금씩 바꿔나갔다. 그동안 자동차, 항공 우주, 석유 및 가스, 금융 서비스, 제약 등 방대한 계산이 요구되는 HPC(High Performance Computing) 응용을 처리하기 위해서는 CPU 서버 외에는 대안이 없었다. 쿠다 + GPU 조합이 CPU를 압도하는 성능을 보여주면서 NVIDIA는 점차 I사와 A사가 지배하던 데이터 센터 서버 시장을 조금씩 잠식해 나갔다. 그리고 그것은 현재 AI 데이터 센터 시장을 독점하는 NVIDIA의 신호탄이 되어주었다.

Ian은 현재에도 NVIDIA에서 VP로 근무 중이다.

인공 지능(AI)

여기서부터는 비교적 최근 일로 이미 대중에게 많이 알려진 사실이다. 2010년대 중반 인공 지능 열풍이 불면서 대규모 학습용 고성능 연산에 대한 수요가 증가하였고, 2017년 GPU 업계 최초로 AI 연산을 위한 전용 코어를 GPU에 장착하기 시작했으며, 아예 서버향으로 제작된 DGX로 불리는 슈퍼컴퓨터까지 출시한 것을 말이다.

이미 HPC 서버 시장에 널리 보급된 쿠다 지배력은 DGX가 빠르게 확산되는데 날개를 달아줬고, ChatGPT를 위시한 거대 언어 모델(LLM)이라는 AI의 제2파가 불어닥치면서 NVIDIA의 GPU는 웃돈을 주고도 못 살만큼 엄청난 수요의 재화가 된 것도 이제 웬만한 이들 모두 다 아는 이야기다.

2017년에 이 Volta라 불리는 아키텍처 기반의 GPU가 출시되었는데, 한 세대의 GPU를 설계, 개발, 양산하는 기간을 고려해 보았을 때, 그들은 최소 2015년부터 설계에 착수했을 것이다. 2015년이면 '딥러닝' 열풍이 불던 시기였지만, 이미지, 비전 정도를 제외하면 아직 그 응용분야가 많지 않았던 때다. 구글의 '알파고'와 이세돌이 역사적인 대국이 있기도 전.

다만 이 시기에도 이미 NVIDIA의 GPU는 '딥러닝' 학습을 위한 가장 강력한 자원이었다. 하지만 향후 AI가 더 많은 응용 분야로 확장되고 그 요구 연산량이 커질 것으로 본 NVIDIA는 일찍부터 AI 연산을 위한 전용 코어를 GPU에 포함시키기로 결정한 것이다.

그렇게 2017년 NVIDIA가 Volta 아키텍처 GPU와 이에 기반한 DGX 머신을 출시했을 때 데이터 센터에 CPU를 공급해 왔던 경쟁 업체들은 반신반의했다. 저 초고가의 무지막지한 시스템을 과연 시장이 소화할 수 있을 것인가 말이다. 여전히 서버 시장은 CPU가 주력이라며 안주하면서, 결국 2020년대로 접어들어 시장을 눈에 띄게 잠식당하더니, 2023년이 되면서 모든 AI 데이터 센터 시장을 NVIDIA에 빼앗기고 만다.

광선 추적(Ray Tracing)

NVIDIA와 '광선 추적, 또는 레이 트레이싱'에는 참으로 구성진 재미가 있다. '레이 트레이싱'은 빛이 실세계를 여행하는 과정을 그대로 컴퓨터에 옮겨 계산해 '이론적으로는' 실사에 가까운 영상을 만들어 낼 수 있는 그래픽 알고리즘이다. 실사와 얼마나 가까운지는 우리가 얼마나 많은 광선을 계산에 고려했는지에 달려있다.

그 이론은 이미 1970년대에 제안되었지만, 이 방식으로 한 장의 영상을 완성하기 위해 천문학적 계산이 필요했다. 현재 여러분의 모니터에서 쓰이는 4K 해상도 (3820 x 2160 화소)에서 한 장면을 광선 추적으로 그리기 위해서는, 최소 1억 개 이상의 광선을 처리해야 한다. 게다가 이를 부드럽게 움직이는 애니메이션으로 표현하기 위해서 초당 30-60개의 장면을 처리해야 하는데 결과적으로 60억 개가 넘는 광선을 1초의 시간 내에 처리해야 하는 무시무시한 컴퓨팅 능력이 필요했던 것이다.

실시간 처리가 우선 중요했던 그래픽 가속기 시절부터 GPU는 래스터라이제이션(Rasterization)이라는 근사화된 알고리즘을 기반으로 설계되어 왔다. 문제는 이 래스터라이제이션과 레이 트레이싱은 그 '근본'부터 다른 방식이라, 기존 GPU가 아무리 성능을 개선해도 레이 트레이싱을 실시간으로 처리하는 것은 불가능한 일이었다.

따라서 '실시간 처리'가 중요한 게임과 달리, 영상의 품질에 올인하는 '영화, 애니메이션' 분야, 소위말하는 '전문가 그래픽(Professional Graphics)'에서만 국한되어 사용되었다. 게다가 재귀(Recursion)나 분기(Branch)가 많고, 프로그램 유연성이 높아야 하는 특성상, 광선 추적은 오랫동안 CPU 친화적인 알고리즘으로 간주되어 왔다. 픽사와 같은 애니메이션 스튜디오가 아직까지도 'CPU'를 즐겨 사용하는 이유다.

'CPU'의 명가 I사가 이를 놓칠 리 없었다. 이제 레이 트레이싱만큼은 NVIDIA를 이겨보자는 생각에 일찌감치 산학연 연합전선을 통해 레이 트레이싱에 연구 인력을 집중 투자했고, 2000년 초반부터 논문을 쏟아내기 시작했다.

그러던 차에 2002년에 뜬금없이 스탠퍼드에서 논문을 한편 발표한다. Bill, Ian과 함께 스탠퍼드에서 수학하던 박사과정 Tim Purcell이었다. GPU와 상성이 안 좋던 레이 트레이싱의 알고리즘을 획기적으로 변경하고, GPU를 일부 변형시킨 아키텍처, 개발자를 위한 프로그래밍 모델을 제안한 것이다. Tim 또한 NVIDIA 장학생이었다.

이 논문 이후 학계에서는 '어. GPU에서도 레이 트레이싱이 된다고?'라며 관심을 두기 시작했고, 실제 구현 사례가 나오기 시작했다. 2000년 중반부터 I사와 NVIDIA의 박빙의 싸움이 펼쳐졌고, 그리고 결국 각자 자신만의 플랫폼에 최적화시킨 Embree, OptiX와 같은 레이 트레이싱 패키지를 출시한다. 하지만 영화, 애니메이션 등 프로페셔널 그래픽스 분야에 있어서 만큼은, 기존 CPU 서버 시장 점유를 무기로 I사가 압도적으로 우위를 지켜나갔다.

다음 단계는 게임과 같은 실시간 그래픽에 레이 트레이싱을 이식하는 것이었다. 하지만 전술했듯 이를 위해서는 GPU의 아키텍처의 대대적인 재설계가 필요했다. 즉, 광선 추적을 위한 전용 하드웨어가 GPU내에 추가적으로 내장돼야 하는 아주 큰 일이었던 것이다. 이전 학계나 기업 연구소에서 관련 하드웨어 연구가 있긴 했지만 상용 GPU에서 이를 채택한 사례는 없었다.

의외로 모바일 GPU 업계에서 먼저 이를 도입했다. 오랫동안 Apple에 GPU를 독점 공급해 오던 영국의 GPU 업체, Imagination이 2014년 업계 최초로 GPU에 광선 추적 가속기를 장착해 발표한 것이다. 하지만 발표 이후 어느 정도 시장에서 반향을 일으켰지만, 이 GPU를 자사 제품에 적용한 모바일 단말 업체는 없었다. Apple은 얼마 이후 Imagination과 결별하고 자체 개발에 나섰고, 한국, 중국의 메이저 스마트폰 업체들도 외면했다. 시장성이 없다는 이유였다. 모바일 게임에 레이 트레이싱은 과한 스펙, 불필요하다는 논리.

한동안 실시간 레이 트레이싱의 인기는 시장에서 소강 국면에 접어들었다. 게임 회사들도 '있으면 좋겠지만, 딱히 없어도 불편함이 없는' 정도의 인식만 가진 상태였다. 무엇보다도 당시 OpenGL, Vulkan, DirectX와 같은 표준 3D API는 모두 기존의 래스터라이저 방식으로 설계되어 있었다. 레이 트레이싱 GPU가 출시된다 해도 이를 이용해서 게임 개발을 하는 것은 매우 비효율적이었다. Imagination의 실패 사례를 본, 많은 게임 개발자, GPU 엔지니어들 모두 레이 트레이싱에 회의적이었다.

2018년 봄 해마다 샌프란시코에서 열리는 게임 개발자 컨퍼런스(Game Developer Conference, GDC)에서 NVIDIA는 갑자기 RTX라는 실시간 레이 트레이싱 기술을 '기습적'으로 발표했다. 같은 장소에서 표준 3D API를 제정하는 마이크로소프트가 DirectX Ray Tracing (DXR)를 공식적으로 릴리스했고, 심지어 복수의 게임 회사들은 DXR/RTX 기술을 사용한 게임들을 함께 발표한다.

수많은 밈을 양산한 RTX ON/OFF

말 그대로 NVIDIA의 깜짝쇼였다. 개발 생태계의 중요성을 누구보다 잘 알고 있는 NVIDIA는 최소 2년 전부터 표준을 제정하는 마이크로소프트를 끌어들여 레이 트레이싱 API 스펙을 함께 쓰기 시작했고, 자체적으로 기술이 무르익자 Epic, EA, Remedy, Steam 등 주요 게임 회사들과 협력해 게임 데모 제작까지 끝낸 것이었다. 그리고 NVIDIA는 같은 해 여름, 전 세계 최대 그래픽스 학회인 SIGGRAPH에서 레이 트레이싱 코어가 장착된 GPU GeForce RTX를 공식적으로 발표하기에 이른다.

2015-2018년 사이에, 학회나 외부 행사에서 만나는 NVIDIA의 엔지니어들, 게임 개발자들 모두 지속적으로 레이 트레이싱 무용론을 설파하곤 했다. 모두 이 깜짝쇼를 위한 페이크였던 것이다.

레이 트레이싱에 대한 회의적인 시장 분위기를 일거에 반전시킬 수 있었던 것은, 자사의 GPU 하드웨어뿐 아니라 관련 표준, 생태계, 그리고 응용을 담당하는 회사들까지 연합군을 꾸리게 만든 NVIDIA의 시장 지배력에 있었다. 즉, 시장에 맞춰 제품을 생산하는 것이 아니라, 자사의 제품에 맞춰 새로운 시장을 창출해 내버렸던 것이다. 이 광경을 GDC/SIGGRAPH에서 직접 본 나는 그때 경악했다. 무슨 이런 미친 회사가 다 있냐고.

이후 1-2년의 적응 기간을 거쳐 이제는 거의 모든 게임에서 레이 트레이싱을 사용하고 있고, 2024년 현재 모바일을 포함한 거의 모든 GPU 업체들은 레이 트레이싱 가속기를 디폴트로 장착하고 있다.

연구-사업화 연계 (Research and Productization)

NVIDIA는 연구 결과를 사업화로 이끌어내는데도 남다르다. 많은 테크 회사에서 '연구'와 '사업화'의 연결고리는 매우 취약하다. 연구원들은 기술과 이론을 '논문'이 되는 데까지만 개발하고 손을 뗀다. 이들이 개발한 연구 프로토타입은 기본적인 아이디어만 검증된 상태이며, 이를 그대로 사업화에 적용할 수는 없다. 성능 최적화, 테스트, 검증, 데모 제작 등 추가로 해야 할 일이 산적하기 때문이다.

그런데 사업부의 엔지니어들은 이미 자신들이 해야 할 일도 바쁘기 때문에, 이런 추가적인 일을 하기 꺼려한다. 따라서 애초부터 리서치팀으로부터 완성도 있는 결과물을 인도받기 원한다. 여기서 리서치팀과 사업부 간 서로 일을 미루는 핑퐁게임이 벌어지고, 사업화에 난항을 겪게 된다.

그런데 NVIDIA는 리서치 팀의 결과를 사업화 수준까지 끌어올리는 일을 전담하는 별도의 엔지니어들이 존재한다. 바로 데브텍(DevTech, Development Technician). 이들은 사업화, 고객 지원, 기술 홍보를 위한 기술적 업무를 담당하며 리서치와 사업부를 이어주는 가교역할을 훌륭히 수행한다.

또한, 사업화 시 별도의 프러덕트 매니저(Product Manager, PM)를 신규로 채용하거나 할당한다. 서비스, 제품에 대해 시장분석, 동향 파악, 우선순위 설정, 개발, 디자인, 마케팅 및 영업팀과 협력을 담당하는 전담 인력이다. 사업화 아이템별로 PM이 별도로 존재한다 하니 얼마나 체계적인 구조인지 알만하다.

이렇듯 리서치->최적화->사업화->마케팅에 이르는 파이프라인이 잘 구축되어 있기 때문에, 일단 의사 결정이 이뤄지면 실행에 걸리는 시간은 매우 신속하다. 내가 관찰했던 바에 따르면, NVIDIA에서 연구 논문이 발표된 이후 이를 토대로 서비스 라이브러리, SDK, 패키지 제품이 출시되는데 빠르면 1년도 채 걸리지 않았다.

마케팅과 생태계 (Marketing & Ecosystem)

NVIDIA의 뛰어난 마케팅 능력은 업계에 이미 정평이 나있다. 때로는 꽤 얄미울 정도인데, 살짝살짝 업계의 상도의를 벗어나기도 한다. 특히 경쟁사 연구팀이 먼저 발표한 신기술이 효용성이 있다면, 관련 특허를 살짝 피해 유사 기술을, 다른 이름으로 신속히 개발한 뒤 경쟁사보다 먼저 상용화시키곤 한다. 게다가 영향력을 행사하여 API 표준에는 자사의 기술명으로 반영시킨다.

그리고 이에 대한 대규모 마케팅에 자원을 쏟아붓는다. 자연스럽게 시장은 해당 기술이 NVIDIA가 최초로 개발한 것으로 인식하고 받아들인다. I사가 일찍이 2005년 논문으로 발표한 Conservative Raterization은 2016년 NVIDIA의 GTX 10 GPU에서 먼저 상용화되었고, 2014년에 논문으로 발표한 Coarse Pixel Shading은 NVIDIA가 Variable Rate Shading (VRS)라는 기술로 바꿔 2018년에 RTX 20 GPU에 장착했다. 물론 연구 결과를 보수적으로 관리한 I사의 문제도 있지만, 타사의 독창적인 기술을 살짝 개선해서 우선 상용화하고, 이를 시장에 보급시키는 NVIDIA의 마케팅 능력에 혀를 내두를 수밖에 없다.

NVIDIA는 표준의 중요성을 아주 잘 알고 있는 회사다. 표준에 자사의 기술이 채택되면 경쟁 업체는 그 기술을 울며 겨자 먹기로 제품에 포함시켜야 한다. 그만큼 업계, 시장에 지배력도 강화되고 시장 생태계와 기술 영향력이 넓어진다. 따라서 그래픽 가속기 시절부터 표준화 활동(OpenGL ARB, Khronos 등)에 적극 참여했고, 해당 표준화 단체의 주요 직들(좌장, 스펙 에디터)들을 선점하곤 했다. 물론 표준화 단체의 좌장은 표면적으로 중립을 지키는 자리지만, 보이지 않게 자사에게 유리하게 영향력을 행사할 수도 있다.

때로는 업계의 공식 표준을 무시하는 전략을 펴기도 한다. 바로 쿠다가 좋은 예다. 시장에서 GPGPU가 활성화되고, GPU에서 동작하는 비그래픽 응용 분야(이를 통칭해 업계에서는 '컴퓨트(Compute)'라 부른다)가 확산되자, 이를 위한 프로그래밍 모델(즉, 쿠다)을 이미 확보하고 있었던 NVIDIA는, 시장 지배력을 믿고 일찍부터 과감히 나 홀로 전략을 펼친다.

쿠다가 시장에 확산되면서 표준 단체는 이와 유사한 '컴퓨트'용 프로그래밍 모델을 제정하고 보급하기 시작했는데, 그것이 바로 OpenCL(Open Compute Language)이다. 용어만 다를 뿐 거의 쿠다와 동일한 모델이었다. NVIDIA가 아닌 GPU 상에서 컴퓨트 응용을 구동시키기 위해서였다. 한동안 NVIDIA는 쿠다와 OpenCL을 동시에 지원했지만, 2016년을 기점으로 OpenCL은 완전히 무시하고 쿠다에만 집중하고 있다. 덕분에 OpenCL은 이제 시장에서 거의 고사되었다.

"CUDA Everywhere!"

당시 황 회장이 주창하던 모토였다. NVIDIA는 '생태계를 지배하는 자'가 시장을 지배한다는 원리를 잘 알고 있었다. 쿠다 출시와 동시에, 개발자를 위한 자세한 매뉴얼을 공개하고, 커뮤니티를 활성화시키고, 데브텍, 마케팅 엔지니어를 동원해 홍보와 고객지원에 나섰다. 쿠다 프로그래밍을 조금이라도 쉽게 할 수 있도록, 다양한 라이브러리/SDK/샘플 프로그램들을 함께 출시했다. 분야별로 라이브러리를 특화시켜 관련 분야 엔지니어들로 하여금 진입 장벽을 낮췄고, 최근엔 ASML, TSMC, Synopsys와 같이 반도체 공정 회사를 위한, 계산 리쏘그래피(Computational Lithography) 전용 쿠다 라이브러리까지 제공하고 있다.

2014년 GTC에서 키노트 발표중에 "쿠다는 여러분 곁에 있어요"라던 황 회장.

NVIDIA는 쿠다를 개발자 교육에서 그쳤던 것이 아니라, 인맥을 활용해 주요 대학 CS 커리큘럼에까지 침투시켰다. 쿠다 출시 초장기부터 기술 서적을 함께 썼던 '일리노이 대학'을 필두로, 스탠퍼드, 옥스퍼드, UC데이비스 등 주요 공과대학 CS 학과의 코스웍에 쿠다 관련 과목을 개설하여, 마치 CS 전공자들에게 '쿠다'가 CS 필수인 것처럼 인식시킨 것이다. 과목을 이수한 학생들은 업계에 진출하기 전부터 쿠다를 스킬 셋으로 익히고 나왔던 것이다.

그렇게 Ian Buck이 스탠퍼드에서 2004년 Brook을 발표한 이래, 쿠다는 20년이 넘는 세월 동안 NVIDIA의 간판 기술로 자리 잡았고, 황 회장의 모토대로 NVIDIA의 GPU가 있는 곳이면 어디에나 존재하는 요소 기술이 되었다. 현재까지 4천만 회 이상의 다운로드를 기록하고 있고, 전 세계적으로 400만 명 이상의 개발자들이 사용하고 있다. 이런 기록적인 점유로 전 세계 GPU '컴퓨트' 개발은 대부분 쿠다로 이뤄지고 있고, 시장에서 사실상의 표준(De Facto Standard)으로 자리 잡았다.

최근 전용 AI 하드웨어, NPU 칩 개발 업체들이 호시탐탐 NVIDIA의 자리를 노리고 있지만, 결코 쉽지 않은 것이 바로 이 쿠다의 장악력 때문이다. 해당 업체들은 어차피 같은 NVIDIA라도 'GPU를 교체하면 쿠다 코드를 새로 짜야한다'며, '생태계 종속성은 없다'거나 'SW 교체는 문제가 아니'라고 한다. 하드웨어 성능, 전력효율에서 우위를 보이면 사용자는 기꺼이 새 환경으로 갈아탈 것이라면서 말이다.

이는 SW와 생태계의 중요성을 간과한 짧은 생각이다. 중요한 것은 '쿠다 코드를 새로 짜야한다'라는 단편적인 현상이 아니라, 개발자의 ‘인식'을 바꾸는 일이다. NVIDIA도 데이터 센터 사업을 시작하면서 프로페셔널 그래픽스 시장에 진입하려 부단히 애를 썼다. CPU 서버보다 GPU서버가 비용 대비 성능이 좋다며 마케팅에 많은 돈을 쏟아부었지만, 기존 CPU서버에서 애니메이션을 제작하던 렌더링 엔지니어들은 꿈쩍을 안 했다.

이미 수십 년 동안 구축해 놓은 쉐이더 코드들이 모두 CPU에서만 동작했고, '오프라인 렌더링=CPU'라는 인식이 뿌리 박혀 있었기 때문이다. 이들은 CPU가 교체되고, 새로운 병렬화 라이브러리가 출시되어도 이에 맞게 기꺼이 쉐이더 코드를 수정한다.

그래픽 서버 시장에서 교훈을 얻은 NVIDIA가 새로운 컴퓨트 시장에서 시도한 전략이 바로, 개발자들에게 인식을 심는 것이었다. 이를 위해 20년이 넘는 시간을 들여 개발자들에게 '컴퓨트=쿠다'라 각인을 새겼다. 한번 고착된 인식을 전환시키는 것은 거의 불가능에 가깝다.

그것이 OpenCL을 쿠다로 변환하거나, 쿠다 코드를 타사 GPU에서 동작시키도록 라이브러리로 제작하려는 시도가 있는 이유다. 더떻게든 쿠다 환경에 맞춰보려는 고육지책까지 써야할 정도가 된 것이다.

황 회장 (CEO, Jensen Huang)

이제 CEO의 젠슨 황은 셀럽에 가까운 인지도를 갖고 있다. 시가총액을 Apple의 턱밑까지 쫓아가는 무소불위의 기업을 키워냈고, 덕분에 전 세계 주주들에게 달달한 이익을 안겨주었으니 말이다. NVIDIA가 AI로 일반 대중에까지 널리 알려지면서, 황 회장의 일거수일투족이 모두 기사화될 정도로 주목을 받고 있다.

사실 AI가 붐을 타기 전부터 GPU/그래픽 업계에서 젠슨 황의 인지도는 이미 넘사벽이었다. 발군의 쇼맨쉽으로 무장한 그가 컨퍼런스, 개발자 포럼에서 발표하는 키노트는 관련 업계에서 항상 주목을 받았고, 그가 새로운 제품을 발표하기라도 하면 미디어는 받아쓰기에 바빴다. 이런 황회장의 주목도, 인지도는 직원으로 하여금 '자부심'을 갖고 스스로 일에 취해 미치게 만든다.

특히, 임원들에게 받는 보고 문화를 싫어해서 실무자들과 직접 소통하는 것으로 유명하다. 꽤 오래전 NVIDIA 엔지니어게 들은 바로는, 황회장은 실무 엔지니어의 주간 보고를 직접 읽는다고 한다 (요즘에도 그런지는 모르겠다). 물론 15,000명에 가까운 임직원의 주간 보고를 모두 확인하는 것은 불가능하다. 다만, 황회장이 특정 시점에 관심이 생긴 분야가 있으면, 사내에서 해당 업무를 하는 엔지니어의 일을 관심을 가지고 들여다 본다는 것이다.

이를 위해 전직원의 주간보고는 특정 폼에 따라 기입되어 전사적으로 DB화되고, 황회장이 자신의 책상에서 키워드 몇개만 입력하면 관련 직원의 주간 보고가 바로 뜨게 된다. 그리고 이를 읽어보고 궁금한 점이 있으면 직접 해당 직원과 메일을 통해 소통한다고 한다. 따라서 실무자들은 내가 언제 황회장에게 메일을 받을지 모른다는 생각에 주간보고를 쓰면서도 바짝 긴장한다고.

실리콘 밸리 테크 기업이 수평적인 조직 문화라고는 하지만, CEO가 실무 직원과 소통하는 일은 거의 없다. 그래서 실무자들과 직접 소통을 즐겨하는 황회장의 리더십이 더 특별할 뿐이다.

물론 NVIDIA가 성공가도만 달린 것도 아니다. Tegra GPU로 모바일 시장에 진입했다가 실패한 대표적인 사례가 있다. 그리고, 내부적으로 많은 연구, 개발 프로젝트가 진행되다가도 실패하기도 한다. 또한, 그래픽 카드 제조사에 대한 '갑질', 경쟁 반도체 업체들에게 '소송'을 일삼는 등 시장 지배력을 악용하는 사례들도 심심치않게 알려지곤 한다. 그럼에도 '기술'로만 따지면 NVIDIA를 인정할 수 밖에 없을 것이다.

NVIDIA는 왠지 '혁신(革新)'이라는 말과 잘 어울리지 않는 회사같다. 전통적인 팹리스 제조업체로 '가죽을 벗길'만큼 획기적인 제품이나 서비스를 일순간 내놓은 적이 없기 때문이다. 하지만, 30년 넘는 역사동안 새로운 GPU를 출시할 때마다 항상 대중의 기대치를 상회하는 기술을 선보였다. 때로는 시장에 앞서거나, 때로는 새로운 시장을 창출해 내면서까지 말이다. 그들이 보유한 남다른 인재, 기술, 전략, CEO 때문이었다. 그 역사가 겹겹이 축적되면서 어느새 가장 '혁신'적으로 보이는 반도체 기업의 반열에 오른 것이다.

부디 이 글이 NVIDIA에 대한 이해에 조금이나마 도움이 되었길 바란다.

- 예나빠

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari