brunch

DeepSeek 돌풍: AI 패권을 뒤바꾼 7가지 함의

중국발 스타트업의 초고속 성장, 미국 거대 기업들의 위기 신호?

by 유니콘정글
App Store의 DeepSeek 순위 #1

1. 시대의 최대 지정학적 갈등

DeepSeek는 중국의 AI 스타트업이다. 이는 미·중 간 “신(新)냉전” 또는 갈등 구도가 지속되는 상황에서 매우 중요한 사실이다. 중국은 전통적으로 제조, 산업화, 인프라, 응용 기술 등에서 미국을 어느 정도 앞서왔다는 평가가 있으나, ‘순수 과학 및 기술 혁신’ 분야에서는 미국에 뒤쳐진다는 인식이 많았다. 이러한 상황에서 DeepSeek는 창업 후 약 1년 반 만에 세계 최고의 AI 모델들과 어깨를 나란히 하며, 중국 기술계가 단순 모방을 넘어 혁신에 도달할 수 있음을 보여준 사례가 되었다.

만약 중국이 AI 연구개발(R&D)에서도 꾸준히 미국과 대등하거나 앞선 결과물을 내놓고, 중국 대학 졸업생들이 최고 수준에서 경쟁하려는 의지와 역량을 갖춘다면, 이는 미국의 패권적 지위에도 영향을 미칠 수 있다. 특히 제조·인프라·에너지·로보틱스·항공우주 등 다양한 전략 분야에서 AI 기술력이 필수적이기 때문이다.


2. DeepSeek 모델은 서방 최고 수준에 필적

Source : https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf
Source : https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek의 주요 모델인 V3(베이스 모델)와 R1(추론 모델)은 미국을 대표하는 여러 모델(예: GPT-4 계열, Sonnet 3.5, Llama 405B 등)과 직접 비교했을 때 충분히 대등하거나 일부 측면에서는 앞서는 성능을 보인 것으로 알려졌다. 이는 창업 후 불과 1년 반 만에 이루어낸 성과로, Microsoft와 Google 같은 거대 기업의 지원을 받는 OpenAI, DeepMind와 견줄 정도로 빠른 속도로 성장하고 있다.

이들의 성공적인 모델 지표 자체도 놀랍지만, 무엇보다 의미 있는 부분은 다음과 같은 점이다. DeepSeek는 상대적으로 열악한 컴퓨팅 자원(GPU 등)과 짧은 업력에도 불구하고, 새로운 방식의 연구 개발(아키텍처 개선, 알고리즘 혁신 등)을 통해 미국 선두 기업들과 비슷한 성능을 달성했다는 것이다. 예를 들어, Multi-head Latent Attention(MLA)로 트랜스포머의 메모리 병목을 해소하거나, 기존 강화학습 방식을 단순화한 Group Relative Policy Optimization(GRPO) 방식을 채택하는 등, 기존 미국 기업들이 시도하지 않은 다양한 최적화 기법을 적극적으로 도입했다.


3. 급진적 투명성으로 여는 혁신

DeepSeek는 모델 가중치(Weights)를 공개하는 형태로 오픈소스를 추진한다(단, 학습 데이터 세부 정보는 비공개). 또한 “오픈소스 AGI” 비전을 밝히며, 누구나 혜택을 누릴 수 있는 AI를 지향한다고 천명했다.

모델을 사실상 공짜에 가깝게 공개하는 전략은, 과거 1990년대 소프트웨어 업계에서 경쟁하는 기업들이 핵심 상품 가격을 낮추거나 무상으로 배포해 경쟁사를 고사시키고, 다른 영역으로 수익을 창출하는 방식(이른바 ‘가격 제로’ 전략)을 떠올리게 한다. Meta(페이스북 모기업)도 Llama 시리즈를 공개해 자사 SNS 생태계 내 통합 서비스를 강화하는 방식으로 이익을 도모한다. 그러나 DeepSeek의 경우, 펀딩은 CEO의 헤지펀드(High-Flyer)에서 전적으로 이뤄져, 이를 통해 API로 돈을 벌거나 가입자 요금 모델을 구축하는 데 큰 관심이 없어 보인다는 것이 특징이다.

이렇게 되면 미국 기업들이 그동안 유료로 제공하며 이익을 창출해온 LLM(대규모 언어 모델) API 시장이 압박받게 된다. 수익원이 흔들리는 상황에서 기술적 우위를 지키기도 쉽지 않다. 다만, 이것이 단순한 시장 교란용인지, 아니면 장기적으로 중국 AI 의존도를 높인 뒤 결정적 순간에 공급을 차단하려는 의도인지 등은 여러 해석이 존재한다.


4. 이해하기 어려운 문화를 넘어서는 방법

중국이라는 국가와 문화가 서구 시각으로는 낯설다는 점도 주요 변수로 꼽힌다. 중국에서는 집단적 목표나 장기적 관점을 중시하는 문화가 강하며, 혁신 과정에서도 국가적 과제, 산업 발전, 교육 등을 폭넓게 연계해 접근한다.

DeepSeek의 경우, “AGI(범용 인공지능)를 향한 궁금증을 풀겠다”는 호기심 중심의 태도를 내세우지만, 미국 기업들처럼 ‘AGI가 인류 미래를 바꾼다’는 식의 거대 담론을 강조하거나, ‘AI 안전성·윤리성’ 문제를 크게 부각하는 편은 아니다. 미국 기업들은 모델 운영 중 이상 행동이나 해킹 등에 대비하기 위해 막대한 자본을 쏟아부으며 안전장치를 강화하지만, DeepSeek는 이런 부분에서 비교적 가벼운 제약을 거는 것으로 보인다. 결과적으로, 사용자 입장에서는 검열이나 제약이 적게 느껴질 수 있다는 장점이 있다.

이런 ‘차이’로 인해, 미국의 AI 안전성(Alignment) 연구가 상대적으로 덜 중요해지는 국면이 올 수 있다는 지적이 있다. AI가 대중적으로 퍼져 나가는 속도전에 돌입할 경우, 규제나 윤리 문제에서 상대적으로 느슨하게 접근하는 업체가 빠른 채택을 이끌어낼 수 있기 때문이다.


5. 수출 통제로도 DeepSeek의 성장을 막지 못함

미국은 반도체 수출 통제 등을 통해 중국의 AI 개발 역량을 억제하려고 해왔다. 하지만 DeepSeek 사례는 이러한 통제가 완벽히 작동하지 않는다는 점을 보여준다. 추정치에 따르면 DeepSeek 보유 GPU는 10만 장 이하로, 엘론 머스크의 기업(xAI 등)이 보유한 GPU 규모와 비슷하거나 그보다 적은 것으로 추정된다. 반면, Meta나 구글, 오픈AI 같은 미국 기업들은 수십만수백만 대 이상의 GPU 인프라를 확보한 초대형 슈퍼컴퓨터를 구축하고 있다.

전문가 중에서는 “미국의 수출 통제가 더 장기적으로 작동할 것”이라는 의견도 있다. 단기적으로 중국 측에 불이익이 있겠지만, 결국 중국이 스스로 반도체 및 관련 공급망을 독자적으로 구축하도록 ‘자극’함으로써, 중장기적으로는 훨씬 강력한 경쟁자가 탄생할 여지를 키울 수 있다는 시각이다.


6. 낮은 비용으로 미국 시장에서 성공

Source : https://x.com/deepseek_ai/status/1872242663489188088
Source : https://x.com/deepseek_ai/status/1881318130334814301

DeepSeek는 API 사용료를 미국 기업들보다 훨씬 싸게 책정했고, 모바일 앱은 무료로 제공한다. 이는 모델 훈련 및 추론 비용을 혁신적으로 절감했기에 가능하다는 평가가 많다. DeepSeek 측은 자체 모델 V3를 엔비디아 H800(수출 제한 버전)으로 278만 GPU 시간을 써서 학습하는 데 약 557만 달러를 지출했다고 한다. 반면, 유사 성능을 추구하는 Llama 3(405B 파라미터)는 약 3,084만 GPU 시간이 필요해, 단순비교 시 10배 이상 비싼 훈련 비용이 발생한다.

이렇게 보정된 방식으로 획기적 비용 절감을 이룬 데에는 ‘규모(스케일) 확장’보다 ‘연산·메모리 효율’ 등 알고리즘 개선을 우선시했기 때문이라는 분석이 있다. 구글, 오픈AI 등은 막대한 자본으로 초대형 클러스터를 구축함으로써 ‘규모의 힘’을 앞세웠지만, DeepSeek는 제한된 자원 안에서 최적화와 혁신을 통해 비슷한 수준에 도달했다.


7. DeepSeek의 놀라운 AI 연구 역량

최종적으로, DeepSeek가 보여준 일련의 성과는 중국의 AI 연구 역량을 재평가하게 만드는 중요한 사례다. 짧은 업력에도 불구하고 세계 최고 수준 모델과 견줄 만한 결과물을 내놓았으며, 혁신적인 연구 방향과 알고리즘 개선을 공개적으로 시도해 비용·성능 효율을 극대화했다. 지정학적 갈등 속에서 수출 규제나 막대한 자본력 부족 등 여러 제한 사항이 있었음에도, 다양한 최적화와 새로운 접근법을 통해 불과 1년 반 만에 글로벌 AI 무대의 핵심 플레이어가 되었다.

이는 중국이 더 이상 “응용 중심”이나 “추격형”에 머무르지 않고, 선도적인 AI R&D로 진화할 가능성을 보여주는 예시이기도 하다. 동시에 미국 포함 서방 기업들에게는 AI 연구·개발에서의 태도, 비용 구조, 운영 방식을 다시 돌아보게 하는 자극이 되고 있다.

요약 정리

지정학적 관점: 중국의 AI 선도 가능성이 커지면, 미국 패권에 대한 압박도 증가할 수 있다.

모델 경쟁력: DeepSeek 모델(V3, R1)은 서구권의 대표 모델들과 성능 면에서 대등하게 경쟁한다.

오픈소스 전략: 모델을 공개하며 저비용·공개 전략을 펼쳐, 기존 유료 중심 시장을 흔들고 있다.

문화적 차이: 중국 기업 특유의 장기적, 집단적, 투철한 목표의식이 DeepSeek에도 반영되어 있다.

수출 통제의 한계: GPU 제한에도 불구하고, 알고리즘 혁신을 통해 충분히 성장 중이다.

낮은 비용: 소수의 GPU로도 훈련·추론 효율을 극대화해, 미국 기업들과 달리 저렴한 서비스를 제공 중이다.

미래 전망: DeepSeek는 앞으로도 혁신 속도를 유지할 가능성이 높으며, 글로벌 AI 경쟁 구도에 큰 영향을 미칠 것으로 예상된다.

keyword
매거진의 이전글현대 직업의 딜레마: 목적 vs 안정성