brunch

라이킷 10 댓글 공유 작가의 글을 SNS에 공유해보세요

You can make anything
by writing

C.S.Lewis

미국 빅테크 긴장, 중국 AI 스타트업, 딥시크 창업자

by Jenny Jang Jan 27. 2025
브런치 글 이미지 1



요즘 테크 업계에서 가장 뜨거운 화두 중 하나가 있다. 바로 딥시크(DeepSeek)라는 이름의 중국 스타트업인데, 도대체 어떤 기술이기에 미국 빅테크 기업들조차 긴장하게 만들고 있을까?


‘인공지능 대형 언어 모델(LLM)은 오직 대기업만의 영역’이라는 통념을 깨고, 중국의 한 스타트업이 더 뛰어나거나, 적어도 ‘비슷한 수준’의 모델을 만들어냈다는 소식이 전해지면서 여러 대기업들이 꽤나 충격을 받은 모양이다. (심지어 오픈소스로)


나 역시 호기심이 생겨 조금 더 알아보았고, 이를 간략히 정리해보려고 한다. 이어지는 글에서 DeepSeek과 관련된 정보를 차근차근 풀어보겠다. 






1. 중국 AI 스타트업 딥시크(DeepSeek)


최근 중국 인공지능 스타트업 ‘딥시크(DeepSeek)’가 빅테크 연구비의 10% 수준으로 개발한 AI 모델을 공개해, 실리콘밸리에 일종의 ‘파란’을 일으켰다고 전해진다. 미국 시엔비시(CNBC) 등 외신 보도를 종합하면, 2023년 설립된 딥시크가 지난 20일(현지시각) 공개한 추론형 인공지능 ‘알원(R1)’이 일부 성능 테스트에서 오픈AI의 ‘오원(o1)’보다 앞서는 결과를 냈다고 한다.



AIME 2024 문제 테스트: 알원(R1)이 79.8% 정확도를 기록해, 오원(o1)의 79.2%를 앞섰다고 한다. 

낮은 개발비: 딥시크는 엔비디아 최신 칩(H100)이 아닌 저사양 H800 2000개를 활용해 두 달 만에 대규모 언어 모델 ‘브이쓰리(V3)’도 완성했다고 한다.          

빅테크 대비 1/10 연구비: 뉴욕타임스에 따르면, 딥시크가 쓴 인공지능 훈련 비용은 메타(Meta) 같은 빅테크가 지출하는 액수의 약 10분의 1 수준이다.          



이러한 소식에, 메타나 오픈AI 등 미국 빅테크들도 긴장하는 분위기가 감지된다. 특히 메타 직원들이 활동하는 블라인드(Blind) 커뮤니티에서는, 딥시크가 새로운 모델을 공개한 직후 “메타의 생성형 AI 조직이 패닉 상태”라는 글이 올라오기도 했다.








+ 딥시크의 창업자는 누구일까





브런치 글 이미지 2





딥시크의 창업가는 누구일까? 개인적인 궁금증으로 궁긍해서 여기저기 알아봤다. 중국 광둥성 잔장(湛江) 출신으로, 1985년생인 량원펑(梁文锋)은 AI 분야에서 최근 가장 주목받는 기업가 중 한 명이다. 절강대학교(Zhejiang University)에서 전자정보공학(학사)과 정보·통신공학(석사)을 전공했고, 석사 논문은 “저비용 PTZ 카메라 기반 목표 추적 알고리즘 연구”를 주제로 작성했다.




1) 초기 경력과 창업 배경

금융 데이터 축적 및 머신러닝 활용: 2008년, 대학 동기들과 함께 금융 시장 데이터를 모으고 머신러닝을 활용한 퀀트 트레이딩(Quantitative Trading)을 연구했다. 당시 2007~2008년 금융위기가 한창이었지만, 이를 계기로 데이터·AI의 잠재력에 확신을 가지게 되었다고 알려진다.          

대학 동문들과 함께 투자사 설립: 2013년에는 절강대 동문과 함께 항저우 야커비 투자관리를 설립했고, 이후 2015년 ‘환팡(幻方) 테크놀로지’(현재의 절강주장자산관리)로 발전시켰다. 2016년에는 닝보(寧波) 지역에 High-Flyer라는 퀀트 투자기업을 공동 창업했고, 기업가치가 크게 올라가며 운용자산(AUM)이 100억 위안을 돌파했다고 전해진다.          

AI 연구로의 확장: 고성능 GPU를 대량 구매해 AI 프로젝트에 투자하기 시작했으며, 이 과정에서 주변인들은 “AI가 대기업의 전유물인데 가능하겠느냐”며 의구심을 나타냈다고 한다. 하지만 량원펑은 “AI가 세상을 바꿀 것”이라는 믿음을 갖고 직접 AI 연구 조직을 세워갔다.     






2) DeepSeek 설립과 성장

2019년: 하이플라이어 AI 부문 설립: 량원펑은 투자사업(High-Flyer)에서 얻은 자금을 토대로 High-Flyer AI 조직을 꾸렸다. 이 조직이 바로 훗날 DeepSeek이 된다. 당시 벤처캐피털(VC)들은 “수익화까지 시간이 오래 걸린다”는 이유로 투자를 꺼렸으나, 량원펑은 장기적인 비전을 내세워 우수 인력을 영입했다.          

2023년: 본격적인 AGI(범용 인공지능) 개발 선언: 5월, AI 칩 수출 규제가 본격화되기 전, 이미 NVIDIA A100 GPU를 1만 개 이상 확보해 놓았다. 덕분에 중국에서 자체 LLM(대형 언어 모델)을 개발할 수 있는 기반을 다졌다는 평가가 나온다. “AGI를 향한 연구를 본격화하겠다”는 포부를 밝혔고, 여기서 개발된 모델이 DeepSeek V2, V3 등으로 이어졌다.          

2024년: AI 가격 전쟁 촉발 DeepSeek V2 출시 후, 중국 AI 시장에 가격 경쟁을 유발했다고 한다. 량원펑은 “가격이 이렇게 민감할 줄 몰랐다”면서도, 오픈소스 정신을 강조하며 “폐쇄적인 방식은 결국 발전을 더디게 할 뿐”이라고 언급했다.          

2025년: 중국 정부 행사 초청: 1월 20일, 베이징에서 열린 전문가·기업가·교육·과학·문화·체육 분야 대표 간담회에 초대되어, 정부 업무 보고서에 대한 의견을 제시할 정도로 중국 내 AI 선도 인물로 자리매김했다.               





3) AI와 퀀트 트레이딩을 결합한 혁신가



            퀀트 투자 + AI: 량원펑은 퀀트 트레이딩과 인공지능을 융합해 성공 사례를 만든 대표적 인물이다. “투자 결정은 사람이 아니라 알고리즘이 내린다”는 원칙을 고수해, 자금 운용 효율을 극대화했다고 한다.          


            량원펑의 철학: “중국이 기술 발전의 수혜만 누릴 것이 아니라, 기술혁신 자체에 기여해야 한다”는 소신을 여러 인터뷰에서 반복해왔다. 혁신에 필요한 것은 자금보다도 “인재를 조직화해낼 수 있는 확신과 지식”이라고 강조한다.          


            ‘프로그래머 관점에서 본 중국 퀀트 투자 미래’: 2019년 8월 황금소상(Golden Bull Awards) 시상식에서 “프로그래머의 시각으로 본 중국 퀀트 투자 미래”라는 키노트 스피치를 했다. 여기서 투자 의사결정의 자동화, 중국 이차 시장 효율성 제고 등을 주장하며 주목받았다.          




이처럼 량원펑은 금융과 AI를 접목하는 과정에서 대담한 투자와 오픈소스 철학을 결합하여, 오늘날 DeepSeek이라는 혁신적 스타트업을 만들어냈다고 평가받는다. 앞으로 그가 선보일 기술적·사업적 행보가 더욱 주목되는 이유이기도 하다.







2. 딥시크 AI, ‘오픈소스’ 전략과 효율적 개발로 주목받는다


딥시크는 오픈소스 형태의 AI 모델을 지향하고, 비용을 최소화하면서도 성능을 끌어올리는 전략을 택했다고 한다. 이를 두고 외신들은 “미국의 수출 규제 탓에 중국 엔지니어들이 더 효율적인 AI 개발을 추구하게 됐다”고 분석했다. 그 결과, 적은 예산과 제한된 하드웨어에도 불구하고 글로벌 톱 수준의 AI 모델을 잇따라 내놓고 있다는 평가가 나온다.



 월스트리트저널(WSJ): 딥시크의 AI가 성능 면에서 글로벌 10위권으로 올라섰으며, 미국 수출 규제가 중국의 기술 발전을 막기엔 역부족임을 시사한다고 보도했다.          

 메타 수석 AI 과학자(얀 르쿤): “딥시크의 성과는 ‘중국이 AI에서 미국을 앞선다’보다는 오픈소스 모델이 독점 모델을 추월하고 있다는 점을 보여주는 사례”라고 언급했다.          







3. “ChatGPT는 구식?”… DeepSeek 활용법 소개


한편, 해외 온라인 커뮤니티에서는 “ChatGPT는 이제 구식(old news)”이라며, DeepSeek이 훨씬 뛰어난 추론 및 검색 기능을 갖추고 있다고 주장하는 글도 화제가 되었다. 그 글에서는 DeepSeek을 다음과 같은 방식으로 이용하라고 조언했다.


접속chat.deepseek.com

기능 활성화: “DeepThink”와 “Search”를 동시에 켠다.


차이점: ChatGPT는 추론(Reasoning) + 검색(Search)을 동시에 하지 못하지만, DeepSeek은 가능하다고 한다.



(1) DeepSeek 프롬프트 예시 (출처: 링크드인)

Golden Circle + Market Validation

Act as a visionary strategist. For [X], first use DeepThink to define its Why, How, What...

이후 Search 기능을 활용해 산업 동향소비자 조사성공 사례 등을 검증한다.




Learning Curve + Accelerated Mastery

Act as a skill-acquisition scientist. For [X], use DeepThink to map the learning curve stages...

Search로 실제 학술 논문, 도구, 기술 등을 찾아 반영한다.




Eisenhower Matrix + Industry Context

Act as a productivity consultant...

업무를 중요도/긴급도 기준으로 나눈 후, Search를 통해 업계 벤치마크와 통계 자료를 덧붙인다.




Decision Trees + Risk Quantification

Act as a risk analyst. For [X], use DeepThink to build a decision tree...

이후 Search로 현실 데이터와 사례 연구를 찾아서 ROI/risk 비율을 산출한다.




이와 같은 접근법은 DeepThink를 통해 논리적 구조화를 먼저 하고, Search로 실제 데이터와 사례를 보강해 이론과 현실을 결합하는 형태다.






4. DeepSeek 기술 보고서: R1, V3, 그리고 RL(강화학습) 혁신


딥시크가 공개한 기술 보고서 역시 업계에서 관심을 받고 있다. 주요 내용은 다음과 같다.

 강화학습 집중: DeepSeek-R1-Zero 모델은 완전한 RL 기반으로 학습해 강력한 추론 능력을 보이지만, 가독성이나 언어 혼합 문제 등 일부 한계를 지녔다고 한다.          

 Cold-Start 강화: DeepSeek-R1 모델은 다단계 파이프라인(초기 데이터 + 반복적 RL)을 적용했고, OpenAI의 o1-1217과 유사한 수준의 성능을 달성했다.          

 소형 모델 증류(Distillation): 대규모 모델의 추론 능력을 소규모 모델에 옮기는 방법을 성공적으로 시연해 연산 비용을 줄이고 성능을 유지했다.          

 벤치마크 성과: 수학, 코딩 등 논리적 사고가 필요한 영역에서 최신 모델들과 대등하거나 앞서는 결과를 냈다.          

 향후 방향: 멀티랭귀지(여러 언어) 확장, 프롬프트 안정성 개선, 소프트웨어 엔지니어링 분야 적용 등이 목표라고 한다.          



이 모델들은 MIT 라이선스로 공개되어, 누구나 활용할 수 있게 했다.






5. 왜 이토록 ‘가성비’가 중요한가?


미국 빅테크들은 인공지능 개발에 막대한 돈을 쏟아붓지만, 딥시크는 그보다 훨씬 적은 비용으로 비슷하거나 뛰어난 성능을 내고 있다. 이는 엔지니어링 효율과 오픈소스 정신이 만나 큰 시너지를 낸 결과라고 해석된다. 일례로 메타의 얀 르쿤 역시, 딥시크 사례를 들어 “오픈소스 AI 모델이 독점 모델을 넘어서는 중"이라고 언급했다.


메타 CEO 마크 저커버그는 24일 “올해 인공지능에 650억 달러 투자를 계획한다”고 밝혔지만, 딥시크의 부상을 의식해 내부적으로도 효율성을 재점검할 필요를 느끼는 것으로 보인다.          



6. 진화하는 중국 AI, 그리고 DeepSeek 활용 가이드


최근 딥시크(DeepSeek)가 보여주는 빠른 성장과 가성비 전략은 전 세계 AI 업계에 강력한 충격을 주고 있다. 단순히 저렴한 비용에 그치지 않고, 수학/추론/코딩 분야에서 기존 빅테크 모델들을 앞지르는 성과까지 내고 있으니, 업계가 긴장할 만하다고 본다.


더 나아가, 사용자는 DeepSeek 플랫폼에서 DeepThink와 Search 기능을 결합해 이론적 사고와 실제 데이터를 동시에 얻을 수 있다고 주장한다. 이는 기존 ChatGPT가 제공하지 못하는 부분이라며, 구체적인 프롬프트 예시까지 제시해 활용법을 소개하고 있다.



결국, 오픈소스 AI 생태계의 발전이 기술적 혁신뿐 아니라 연구비 효율, 확장성, 접근성까지 한층 끌어올리고 있다는 점이 핵심이라고 생각한다.          향후 딥시크가 언어 모델의 추론 및 멀티랭귀지 지원을 어떻게 더 강화해 나갈지도 지켜볼 만하다.          




중국 AI 스타트업 딥시크의 부상 및 DeepSeek 모델 활용법에 대한 정리를 마친다. 인공지능 산업은 이제 막 경쟁의 포문을 열었고, 대기업만의 영역이 아닌, 작은 회사더라도 누가 더 효율적이고 혁신적인 기술을 구현하느냐가 관건이 될 것으로 보인다. 




추가)

   Deepseek 논문 링크: https://lnkd.in/gJQ5bsJS          

  모델 깃허브 링크: https://lnkd.in/gFWQRZrB          





작가의 이전글 스타트업이란 무엇일까? 창업 절차, 투자없이도 가능?

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari