칩 성능보다 더 강력했던 CUDA 생태계의 비밀
이미 세계 최대기업 중 하나였던 엔비디아가 불과 2년 만에 4배로 성장했다. 상식적으로 불가능한 성장을 이룬 비밀은 GPU의 성능이 아니라 따로 있었다.
2년 전 엔비디아의 기업가치는 1조 달러(약 1,300조 원)였다. 지금은 4조 달러다. 이게 얼마나 말이 안 되는지부터 한번 보자:
애플의 성장
- 1조 → 2조 달러: 2년 (2배)
- 이것만 해도 경제 역사에 남을 대기록이었다
마이크로소프트의 성장
- 1조 → 2조 달러: 2년 (2배)
- 역시 놀라운 성과
엔비디아의 성장
- 1조 → 4조 달러: 2년 (4배)
- 같은 기간에 두 배 더 빠른 성장
쉽게 말해, 동네 빵집이 매출을 2배로 늘리려면 지점 하나만 더 내면 된다. 하지만 삼성 같은 거대 기업이 매출을 2배로 늘리려면? 이미 전 세계에 진출해 있는데 어디서 그만큼 더 벌지?
그래서 보통 기업이 클수록 성장률은 떨어진다. 시장에 한계가 있으니까. 그런데 엔비디아는 이미 1조 달러, 1300조 원 기업이면서도 2년 만에 4배가 됐다. 마치 이미 전 세계에 진출한 기업이 갑자기 화성에서도 장사를 시작한 것 같은 일이 벌어진 거다.
"AI 붐이니까 그렇지 뭐."
이렇게 넘어가기엔 뭔가 석연찮다. 엔비디아 GPU가 갑자기 10배 좋아진 것도 아니고, AMD나 인텔이 망한 것도 아니다. 심지어 구글, 아마존, 애플 같은 거대 기업들이 자체 AI 칩을 만들어도 여전히 엔비디아만 찾는다.
왜 엔비디아를 선택할 수밖에 없는 걸까?
흔히 사람들은 이 성공을 엔비디아가 가진 뛰어난 GPU 성능 덕분이라 생각하지만, 실제 핵심은... 20년 전으로 거슬러 올라간다.
엔비디아는 원래 게임용 그래픽 칩을 만드는 회사였다. 게임 화면을 더 멋지고 생생하게 보여주는 GPU(Graphics Processing Unit)를 만들었다. 쉽게 말해, 게임 속 캐릭터의 머리카락 한 올 한 올까지 자연스럽게 표현해 주는 칩이다.
그런데 어느 날부터 이상한 고객들이 나타났다.
"단백질이 어떻게 접히는지 GPU로 계산하고 싶은데요."
"날씨 예측을 하는데 그래픽카드가 필요해요."
"석유가 어디 묻혀있는지 찾는데 게임용 칩을 쓰고 싶어요."
엔비디아 직원들은 당황했다. 게임이랑 날씨가 무슨 상관??
답은 간단했다. GPU가 특정 계산에서는 CPU보다 훨씬 빨랐기 때문이다.
2003년 당시 최고급 컴퓨터에 들어있던 인텔 CPU보다 엔비디아 GPU가 특정 연산 작업에서 무려 33배 빠른 성능을 보였다. 다시 말해서 CPU로 1시간 걸리는 작업을 GPU로는 2분도 안 돼 끝낼 수 있다는 말이다.
왜 이런 차이가 날까? 일하는 방식이 다르기 때문이다.
CPU는 천재 요리사 한 명: 아무리 복잡한 요리도 완벽하게 만들어낸다. 하지만 한 번에 한 가지 요리만 할 수 있다.
GPU는 김밥 마는 아주머니 1000명: 프랑스 정찬은 못 만들지만, 김밥 1000줄을 동시에 말 수 있다.
과학자들이 하는 계산은 대부분 "김밥 100만 줄 만들기" 같은 일이다. 단순하지만 엄청나게 많은 반복 작업. 이런 일은 천재 요리사보다 김밥 아주머니 군단이 훨씬 빠르다.
하지만 큰 문제가 있었다. GPU와 대화하는 게 너무 어려웠다. GPU는 원래 그림 그리는 칩이니까, 모든 대화를 "그림"으로만 해야 했다.
비유하자면 이런 상황이다:
- 과학자: "2 더하기 3을 계산해 줘?"
- GPU: "죄송해요, 그림으로 그려주세요."
- 과학자: (숫자를 그림 데이터로 억지로 변환)
- GPU: (결과를 이미지로 출력) ❄️
- 과학자: "이게... 5인가?"
당연히 일반 과학자들은 포기했다. 컴퓨터 그래픽 전문가가 아니면 아예 시도조차 할 수 없는 일이었다.
엔비디아 CEO 젠슨 황은 생각했다. "우리 GPU에는 엄청난 계산 능력이 숨어있는데, 게임으로만 쓰기엔 아깝다. 이걸 과학자들도 쓸 수 있게 만들면 완전히 새로운 시장이 열릴 거야!"
2006년, 엔비디아는 CUDA(쿠다)라는 획기적인 도구를 발표했다. CUDA는 일종의 통역사였다. 과학자들이 익숙한 프로그래밍 언어(예: C++)로 명령하면, CUDA가 그래픽 칩이 이해할 수 있는 언어로 번역해 주는 것이다.
더 놀라운 건 엔비디아가 이 비싼 통역사를 공짜로 나눠줬다는 거다.
CUDA 효과는 즉각적이었다. 예를 들면:
- 의료계: MRI 분석이 10시간에서 1시간으로 단축. 의사들이 환호했다.
- 금융가: 복잡한 투자 시뮬레이션이 50배 빨라졌다. 월스트리트가 GPU를 사들였다.
- 석유회사: 땅속 석유를 찾는 지진파 데이터분석이 20배 빨라졌다. 석유업계 GPU 구매시작
2010년에는 예상치 못한 고객도 나타났다. 비트코인 채굴자들이었다. 그들이 GPU를 쓸어가면서 게이머들이 그래픽카드를 못 사는 지경에 이르렀다.
이 모든 것은 GPU 성능이 향상되어서가 아니었다. CUDA 덕분에 GPU 활용이 쉬워져 생긴 결과였다.
2012년, 캐나다 토론토 대학 박사과정생 알렉스 크리제프스키가 만든 AlexNet이 세계 이미지 인식 대회(ImageNet)에서 충격적인 성과를 냈다. 컴퓨터가 강아지와 고양이 같은 이미지를 얼마나 정확히 인식하는지를 겨루는 대회였는데 AlexNet은 여기서 2등보다 무려 10%나 더 정확한 결과로 압승을 거두었다. 10%가 대단한 것 같지 않지만 이 분야에서는 정확도를 1%만 개선해도 엄청난 성과다!
비결은? 딥러닝이라는 새로운 방식이었다.
기존 방식(기계학습): 사람이 특징을 정해주면 컴퓨터가 패턴을 찾는 방식
- 사람: "고양이는 귀가 뾰족하고, 수염이 있고, 눈이 세로로 길어."
- 컴퓨터: "알겠습니다. 그런 특징이 있는 그림을 찾아볼게요."
새로운 방식(딥러닝): 컴퓨터가 스스로 특징을 찾아내는 방식
- 사람: "여기 고양이 사진 100만 장 있어."
- 컴퓨터: "아하! 고양이는 이런 특징들을 가지고 있군요!"
문제는 이 딥러닝이 어마어마한 계산을 필요로 했다는 것. 기존 컴퓨터의 CPU로는 현실적으로 불가능한 일을 알렉스는 500달러짜리 엔비디아 GPU 2개로 단 1주일 만에 해냈다.
물론 CUDA 덕분이었다. 이전에도 일부 연구자들이 GPU로 AI를 시도했지만, 프로그래밍이 너무 어려워 포기했었다. CUDA가 딥러닝 시대를 연 것이다.
AlexNet의 충격은 실리콘밸리를 뒤흔들었다. "GPU로 AI를? 5일 만에? 우리도 해야 돼!!!"
구글, 페이스북, 바이두 등 글로벌 기업들이 너 나 할 것 없이 모두 엔비디아 GPU를 사서 딥러닝을 시작했다.
그전까지 AI 연구는 거의 CPU로만 했다. CUDA는 2006년부터 있었지만 주로 과학자들의 데이터 분석에 사용되었지, AI 연구자들은 CUDA를 잘 알지 못했다.
AlexNet이 모든 걸 바꿨다. AlexNet이 CUDA로 만들어졌고, 그 코드가 공개되었기 때문이다.
그리고 이때부터 눈덩이 효과가 시작됐다:
모든 AI 연구자가 CUDA 사용
모든 딥러닝 라이브러리가 CUDA 기반으로 개발
더 많은 연구자가 CUDA 선택
더 많은 도구와 자료 축적
2년 만에 CUDA는 과학 계산 도구에서 AI 개발의 표준 플랫폼으로 진화했다. 이때부터 "AI 개발자 = CUDA 사용자"라는 공식이 성립했다.
2017년 구글에서 "Attention Is All You Need"라는 논문이 나왔다. 겨우 8페이지짜리 논문이었다. 이 논문은 Transformer라는 새로운 AI 구조를 제안했다. 복잡하게 설명할 필요 없다. 지금 우리가 쓰는 ChatGPT, 클로드, 퍼플렉시티, 제미나이... 모든 생성형 AI의 조상이 바로 이 Transformer다.
재미있는 건, 이 혁명적인 연구도 엔비디아 GPU 8개로 단 3.5일 만에 완성됐다는 것이다.
당시엔 아무도 몰랐다. 이 짧은 논문이 엔비디아를 4조 달러 기업으로 만들 씨앗이라는 걸.
2022년 11월, ChatGPT가 세상에 나왔다. 5일 만에 100만 사용자를 돌파했다. 갑자기 모든 기업이 "우리도 AI 만들어야 해!"를 외쳤다. 그런데 AI를 만들려면? GPU가 필요했다.
어떤 GPU?
당연히 엔비디아 GPU.
왜?
AI 연구자들이 쓸 수 있는 딥러닝 라이브러리, 도구, 교육 자료가 모두 CUDA 기반이니까.
그 결과 전 세계적인 GPU 쟁탈전 이 벌어졌다:
- 대기 시간: 6-12개월
- 가격: 2만 5천 달러 → 4만 달러 (한화 5천만 원!)
- 암시장: "GPU 브로커"라는 새로운 직업 등장
대형 테크 기업들은 GPU 확보 전쟁을 벌였고, 스타트업들은 클라우드 GPU 시간을 분 단위로 아껴가며 개발했다.
경쟁사 AMD는 억울하다. 자신들의 GPU 성능도 나쁘지 않다. 가격도 더 싸다. 그런데 아무도 안 산다. 왜?
지난 15년간 만들어진 CUDA 생태계 때문이다. AI 라이브러리, 코드, 교육 자료가 모두 CUDA로 작성되어 있었다. AMD GPU로 바꾸려면 모든 걸 다시 만들어야 한다.
인텔도 oneAPI라는 경쟁 플랫폼을 만들었지만 마찬가지다. 이미 CUDA에 익숙해진 400만 개발자들이 굳이 새로운 걸 배울 이유가 없다.
구글이 자체개발한 칩은 특정 작업에서는 엔비디아보다 빠르다. 하지만 개발자들은 여전히 엔비디아를 선호한다. 친숙한 CUDA 환경을 포기하고 싶지 않아서다.
그 결과 엔비디아의 장악력은 커져만 갔다. 2025년 기준 일부 전문가에 따르면
- AI 훈련용 엔비디아GPU 점유율: 92%
- AI 추론용 엔비디사GPU 점유율: 70~80% 추정
- 데이터센터 엔비디아GPU 점유율: 92%
- 매출 총 이익률: 75%
이제 진실이 보인다. 엔비디아가 4조 달러가 된 건 더 좋은 칩 때문이 아니었다. 19년간 쌓아온 CUDA 생태계 때문이었다.
2006년부터 시작된 이 생태계는 이제:
- 400만 명의 CUDA 개발자
- 수십만 개의 CUDA 기반 소프트웨어
- 전 세계 대학의 CUDA 교육과정
- 모든 AI 회사의 CUDA 의존 코드
이 모든 게 거대한 해자가 되었다. 중세 성을 둘러싼 해자처럼, 경쟁자가 넘을 수 없는 장벽이 된 것이다. AMD가 10배 빠른 칩을 만들어도, 구글이 10배 싼 클라우드를 제공해도, 개발자들은 여전히 묻는다.
"CUDA 되나요?"
대부분의 스타트업은 "더 좋은 제품"에 집중한다.
"우리 앱이 더 빨라요!"
"우리 서비스가 더 편해요!"
"우리 기술이 더 혁신적이에요!"
하지만 제품은 복제할 수 있다. 기술도 따라잡을 수 있다. 그러나 생태계는 복제할 수 없다. 애플의 앱스토어, 구글의 안드로이드, 아마존의 AWS... 진짜 승자들은 모두 제품이 아닌 생태계를 만든 회사들이다. 엔비디아는 19년 전, 아무도 관심 없던 과학자들을 위해 무료 도구를 만들었다. 그게 오늘날 4조 달러의 해자가 되었다.
성공의 비결은 CUDA 생태계를 만들기로 결정한 것이었다.
CUDA 사용자가 늘면 CUDA 기반의 소프트웨어와 애플리케이션이 많아지고 그럼 더 많은 기업들이 엔비디아 GPU를 구매하고 이것은 다시 더 많은 개발자를 CUDA 생태계로 유입시키는 선순환 구조를 만든다.
이것이 엔비디아가 우리에게 가르쳐 주는 교훈이다.