brunch

Deepseek CEO 인터뷰 재구성

모방을 넘어 창조로, AGI를 향한 Deepseek의 도전

by PODO

중국 AI의 새로운 혁신가, Deepseek의 등장


2024년 5월, 중국 AI 업계에 거대한 지각변동이 일어났다. 그동안 조용히 기술 개발에만 몰두해왔던 스타트업 Deepseek가 자사의 새로운 AI 모델 'DeepSeek V2'를 발표하면서다. 중국의 7대 대형 AI 모델 기업들 중에서 가장 조용한 행보를 보여왔던 이 기업의 발표는 단순한 신제품 출시 그 이상의 의미를 가졌다. 100만 토큰당 1위안(약 190원)이라는 파격적인 가격은 업계에 충격을 주기에 충분했다. 이는 Llama3 70B의 1/7, GPT-4 Turbo의 1/70 수준이었다.

Deepseek는 1년 전만 해도 양적 헤지펀드 강자인 High-Flyer(환방)의 지원을 받는, 1만 대의 A100 칩을 보유한 독립 기업이라는 점에서만 주목받았다. 하지만 지난 1년간 이 기업은 중국 AI 업계에서 가장 주목할 만한 혁신을 이뤄냈다. 특히 5월의 DeepSeek V2 발표는 중국 AI 시장의 판도를 완전히 바꾸어 놓았다.


Deepseek의 파격적인 가격 정책은 단순한 출혈 경쟁이 아닌, 근본적인 기술 혁신의 결과물이었다. 이 기업이 새롭게 제안한 MLA(multi-head latent attention) 아키텍처는 기존 MHA 아키텍처와 비교해 메모리 사용량을 5-13% 수준으로 대폭 줄였다. 여기에 DeepSeekMoESparse 구조를 더해 전체적인 연산 비용을 최소화하는 데 성공했다. 이는 단순한 비용 절감을 넘어서는 혁신적인 기술적 진보였다.

이러한 기술적 성과는 실리콘밸리에서도 큰 반향을 일으켰다. SemiAnalysis의 수석 분석가는 DeepSeek V2 논문을 "올해 최고의 논문"이라고 평가했으며, 전 OpenAI 직원 Andrew Carr는 이를 "놀라운 지혜로 가득 찬" 연구라고 칭찬했다. 특히 Anthropic의 공동 창업자이자 전 OpenAI 정책 책임자인 Jack Clark는 Deepseek가 "고심오측한 천재들을 고용했다"고 평가하며, 중국에서 만든 대형 모델이 "드론과 전기차처럼 무시할 수 없는 힘이 될 것"이라고 전망했다.


Deepseek의 발표 이후, 중국 AI 시장은 급격한 변화를 겪었다. ByteDance가 가장 먼저 반응하며 자사의 주력 모델 가격을 Deepseek 수준으로 낮추었고, 이는 곧 다른 기술 대기업들의 연쇄적인 가격 인하로 이어졌다. Alibaba, Baidu, Tencent 등이 잇따라 가격 인하를 발표하면서, 중국 AI 시장은 본격적인 가격 전쟁에 돌입했다.

하지만 이러한 가격 전쟁의 이면에는 중요한 사실이 숨어있었다. 다른 대기업들이 보조금을 투입하며 출혈 경쟁을 벌이는 동안, Deepseek는 오히려 수익을 내고 있었다. 이는 근본적인 기술 혁신을 통한 원가 절감이 있었기에 가능한 일이었다. 량원펑 CEO는 "우리는 보조금을 지급하지도, 과도한 이윤을 추구하지도 않습니다. 이 가격은 단순히 비용에 약간의 이윤을 더한 수준일 뿐입니다"라고 설명했다.


Deepseek의 혁신은 모델 아키텍처 수준의 포괄적인 혁신에서 비롯되었다. 대부분의 중국 기업들이 현재 세대의 Llama 아키텍처를 그대로 복제해 응용하는데 집중할 때, Deepseek는 완전히 새로운 접근방식을 선택했다. MLA 아키텍처와 DeepSeekMoESparse 구조의 개발은 이러한 도전의 결과물이었다.

특히 주목할 만한 점은 이러한 아키텍처 수준의 혁신이 국내외 대형 모델 기업들 사이에서도 매우 드문 시도였다는 것이다. AI 연구자들은 Attention 아키텍처가 제안된 이후 수년 동안 거의 성공적인 수정이 이루어지지 않았으며, 대규모 검증은 더욱 드물었다고 지적한다. "이는 대부분의 사람들이 자신감이 부족해 의사결정 단계에서 차단되어 버리는 아이디어였습니다"라는 한 AI 연구자의 평가는 Deepseek의 도전이 얼마나 특별했는지를 잘 보여준다.



혁신의 중심에 선 Deepseek의 도전과 전략


Deepseek의 특별함은 CEO 량원펑(梁文锋)의 독특한 리더십에서 시작된다. 중국의 대부분 퀀트 펀드 창업자들이 해외 헤지펀드 경력이나 물리학, 수학 학위를 보유한 것과 달리, 량원펑은 줄곧 국내파 이력을 유지해왔다. 저장대학교 전기공학과에서 인공지능을 전공한 그는 여전히 매일 "논문을 읽고, 코드를 작성하며, 소그룹 토론에 참여하는" 연구자의 모습을 보여준다.


업계 관계자들과 Deepseek 연구원들은 량원펑을 중국 AI 산업에서 매우 드문 인물이라고 평가한다. "강력한 인프라 엔지니어링 능력과 모델링 능력을 동시에 갖추었을 뿐만 아니라, 자원을 동원할 수 있는 능력까지 보유한" 인물이라는 것이다. 그는 "정확한 고수준의 판단을 내릴 수 있으면서도, 세부적인 면에서는 일선 연구원들보다 더 강한 면모"를 보여준다. "두려울 정도의 학습 능력"을 가졌으면서도, "전혀 보스답지 않고 오히려 기술자에 가까운" 그의 모습은 Deepseek의 문화를 상징적으로 보여준다.


"우리의 목적지는 AGI입니다." Deepseek의 방향성을 설명하는 량원펑의 이 한마디는 단순한 선언 이상의 의미를 담고 있다. 대부분의 중국 기업들이 현재 세대의 Llama 아키텍처를 그대로 복제해 응용하는데 집중할 때, Deepseek는 근본적인 혁신을 추구하는 도전적인 길을 선택했다.

량원펑은 중국 AI 기업들의 현주소를 냉정하게 진단한다. "우리는 최고 수준과 비교해 훈련 효율성에서 2배, 데이터 효율성에서 2배의 격차가 있습니다. 결과적으로 같은 성과를 내기 위해 4배의 컴퓨팅 파워가 필요한 상황입니다." 하지만 그는 이 격차가 단순히 시간의 문제가 아니라고 지적한다. "진정한 격차는 독창성과 모방 사이의 차이입니다. 이것이 바뀌지 않는 한, 중국은 영원히 추격자의 위치에 머물 수밖에 없습니다."


Deepseek의 또 다른 특별한 점은 혁신이 젊은 인재들에 의해 주도되고 있다는 것이다. V2 모델을 개발한 팀은 대부분 국내 최고 대학의 신입 졸업생들과 4-5년차 박사과정 학생들로 구성되어 있다. 많은 AI 기업들이 해외 인재 영입에 집중하고 있으며, "이 분야 최고 50명의 인재들이 중국 기업에서 일하지 않을 수도 있다"는 우려가 있지만, Deepseek는 다른 접근을 취한다. "최고 50명의 전문가들이 중국에 없을 수 있지만, 우리가 그러한 인재들을 직접 육성할 수 있을지도 모릅니다."

이러한 접근은 MLA 아키텍처의 개발 과정에서도 잘 드러난다. 이 혁신적인 아이디어는 한 젊은 연구원의 개인적 관심에서 시작되었다. attention 메커니즘의 주류적 진화 트렌드를 정리하던 중 대안을 설계해보자는 생각에서 출발한 것이다. 물론 이 아이디어를 현실화하는 것은 긴 여정이었다. 회사는 이를 위한 전담 팀을 구성했고, 수개월에 걸친 노력 끝에 성공적인 결과를 만들어냈다.


Deepseek의 조직 운영 방식은 기존의 틀을 깨는 실험적인 모습을 보여준다. 회사는 완전한 상향식(bottom-up) 구조를 채택하고 있으며, 일반적으로 역할을 미리 정의하지 않는다. 대신 업무 분담은 자연스럽게 이루어진다. "모든 사람이 자신만의 여정을 가지고 있고, 자신의 아이디어를 가져오기 때문에 누군가를 밀어붙일 필요가 없습니다."

특히 주목할 만한 점은 GPU나 인력 자원 활용의 유연성이다. 팀의 누구라도 아이디어가 있다면 언제든 승인 없이 훈련 클러스터 카드를 사용할 수 있다. 마찬가지로 회사에는 계층이나 별도의 부서가 없어, 사람들은 상호 관심사가 있는 한 팀의 경계를 넘어 자유롭게 협업할 수 있다.

회사의 물리적 공간 구성도 이러한 철학을 반영한다. 사무실 중앙의 회의실들은 양쪽에 문이 있어 누구나 열 수 있게 되어 있다. 직원들은 이러한 설계가 우연한 발견의 여지를 남겨둔다고 설명한다. 실제로 Transformer의 탄생도 누군가가 대화를 우연히 듣고 참여하면서 시작되어, 결국 일반적인 프레임워크로 발전했다는 사실은 이러한 공간 설계의 의미를 잘 보여준다.


"혁신은 믿음에서 시작됩니다." 량원펑의 이 말은 Deepseek의 철학을 잘 보여준다. ChatGPT가 등장했을 때 중국의 기술 커뮤니티는 프론티어 혁신에 대한 자신감이 부족했다. 투자자들부터 대형 기술 기업들까지 모두 격차가 너무 크다고 생각하며 응용에만 집중하기로 했다. 하지만 혁신은 자신감에서 시작되며, 이는 종종 젊은이들에게서 더 많이 발견된다는 것이 그의 믿음이다.



기술 혁신과 오픈소스: Deepseek의 파격적 전략


중국 AI 업계에서 Deepseek의 행보는 여러모로 파격적이다. 7대 대형 AI 모델 기업들 중 유일하게 "모든 것을 다 하겠다"는 접근을 포기하고, 연구와 기술 개발에만 집중하고 있다. toC 애플리케이션 개발도 하지 않으며, 상업화도 적극적으로 고려하지 않는다. 대신 오픈소스 노선을 확고히 하며, 추가 자금 조달 계획도 없다. 이러한 선택은 때로 기업을 주목받지 못하게 만들지만, 커뮤니티 내에서는 오히려 자발적인 사용자 홍보로 이어지고 있다.

"파괴적인 기술 앞에서 폐쇄적인 소스로 만든 해자는 일시적일 뿐입니다. OpenAI의 폐쇄적 접근방식조차도 다른 이들의 추격을 막을 수 없죠." 량원펑의 이 말은 Deepseek가 오픈소스를 선택한 이유를 잘 설명한다. 그는 오픈소스가 단순한 상업적 전략이 아닌 문화적 행위라고 설명한다. "다른 이들이 당신의 혁신을 따르는 것을 보는 것은 기술 인재들에게 큰 성취감을 줍니다. 오픈소스에 기여하는 것은 우리에게 존중을 가져다주고, 이는 회사에 문화적 매력을 더합니다."


Deepseek의 혁신은 중국 AI 산업의 고정관념에 도전장을 던진다. 지난 30여 년간의 IT 물결 속에서 중국은 실질적인 기술 혁신에 거의 참여하지 않았다. "우리는 무어의 법칙이 하늘에서 떨어지기를 기다리며, 집에 누워서 18개월마다 더 나은 하드웨어와 소프트웨어가 나타나기를 기다렸습니다. 스케일링 법칙도 그렇게 대하고 있죠."

하지만 량원펑은 이것이 서구 주도의 기술 커뮤니티가 끊임없는 노력을 통해 만들어낸 결과물이라고 지적한다. 중국이 이전에 이 과정에 참여하지 않았기 때문에 그 존재를 간과했을 뿐이라는 것이다. 그는 중국 경제가 발전함에 따라 점차 공짜 승차자가 아닌 기여자가 되어야 한다고 믿는다.


혁신의 비용이 결코 낮지 않다는 것은 분명하다. 과거의 무분별한 차용 경향은 중국의 이전 조건들과도 관련이 있었다. 하지만 량원펑은 현재 상황이 다르다고 본다. "이제 ByteDance나 Tencent 같은 거대 기업들의 이익을 보세요. 글로벌 기준으로도 결코 낮지 않습니다. 우리가 혁신에서 부족한 것은 자본이 아니라, 자신감과 고밀도 인재를 효과적인 혁신을 위해 조직하는 방법에 대한 지식입니다."

특히 그는 중국의 거대 기술 기업들조차 빠른 상업화를 최우선 순위로 삼는 현상을 비판적으로 바라본다. "지난 30년 동안 우리는 돈을 버는 것만 강조하고 혁신은 소홀히 했습니다. 혁신은 전적으로 비즈니스 주도가 아닙니다. 호기심과 창조에 대한 욕구도 필요합니다. 우리는 단지 오래된 습관에 얽매여 있을 뿐이며, 이는 특정 경제 단계와 연관되어 있습니다."


Deepseek는 단순히 기술 개발을 넘어, 중국 AI 산업의 생태계 발전을 목표로 한다. "현재 단계는 기술 혁신의 폭발적 성장기이지, 응용의 시기가 아닙니다. 장기적으로 우리는 산업이 우리의 기술과 산출물을 직접 활용할 수 있는 생태계를 만들고 싶습니다."

량원펑은 Nvidia의 리더십이 단순히 한 기업의 노력이 아닌, 서구 기술 커뮤니티와 산업 전체가 협력한 결과라고 설명한다. 그들은 다음 세대의 기술 트렌드를 보고 로드맵을 가지고 있다. 중국의 AI 발전도 이러한 생태계가 필요하다는 것이다. 많은 국내 칩 개발이 어려움을 겪는 이유는 지원하는 기술 커뮤니티가 부족하고 이차적인 정보만 가지고 있기 때문이라고 그는 지적한다.


Deepseek는 AGI 개발에 대해서도 독특한 관점을 가지고 있다. "2년이 될 수도 있고, 5년이나 10년이 될 수도 있습니다. 어떤 경우든 우리 생애에는 일어날 것입니다." 회사 내부에서도 로드맵에 대한 통일된 의견은 없지만, 세 가지 방향에 대한 실질적인 투자는 이루어지고 있다. 수학과 코드, 멀티모달리티, 그리고 자연어 자체가 그것이다.

특히 수학과 코드는 바둑과 같은 자연스러운 AGI 테스트 영역으로 여겨진다. 이들은 높은 수준의 지능이 자가 학습될 수 있는 폐쇄적이고 검증 가능한 시스템이기 때문이다. 한편 멀티모달리티와 실제 인간 세계와의 상호작용도 AGI의 필수 요건이 될 수 있다. Deepseek는 이러한 다양한 가능성에 대해 열린 자세를 유지하고 있다.



중국 AI의 미래: 도전과 기회의 교차점


중국 AI 산업은 지금 중요한 전환점에 서 있다. 대형 모델 스타트업들이 경쟁적으로 시장에 뛰어들고 있지만, 량원펑은 이들 중 2-3개 기업만이 생존할 것으로 전망한다. "현재 모든 기업들이 '돈 태우기' 단계에 있습니다. 자기 포지셔닝이 명확하고 운영을 더 잘 다듬은 기업들이 살아남을 가능성이 높죠. 다른 기업들은 큰 변화를 겪게 될 것입니다. 하지만 가치 있는 것들은 단순히 사라지지 않고 다른 형태로 변모할 것입니다."


량원펑은 중국 AI 산업의 발전 방향에 대해 독특한 시각을 제시한다. "미래 세계는 전문적인 분업이 이루어질 가능성이 높습니다. 기초 대형 모델은 지속적인 혁신이 필요하며, 대기업들도 능력에 한계가 있어 반드시 최적의 선택이 되지는 않을 수 있습니다." 이는 현재의 산업 구조가 필연적으로 변화할 것이라는 전망을 담고 있다.

특히 그는 인터넷 시대의 비즈니스 로직으로 미래 AI의 수익 모델을 논하는 것에 대해 회의적이다. "이는 마치 마화텅이 사업을 시작할 때 제너럴 일렉트릭이나 코카콜라를 논하는 것과 같습니다. 무의미한 일이죠." 그의 이러한 관점은 현재의 산업 관행과 사고방식에 대한 근본적인 도전을 제기한다.


중국 경제가 하향세를 보이고 있고 자본이 더 이상 예전처럼 풍부하지 않은 상황에서, 이것이 기초 연구를 억제하지 않을까 하는 우려가 있다. 하지만 량원펑은 오히려 반대의 시각을 제시한다. "중국의 산업 구조 조정은 필연적으로 하드코어 기술 혁신에 더 많이 의존하게 될 것입니다. 사람들이 과거의 쉬운 돈벌이가 운 좋은 기회의 창이었다는 것을 깨달을 때, 그들은 더 겸손해지고 진정한 혁신에 참여하고자 할 것입니다."

그는 자신의 개인적인 경험을 통해 이러한 변화의 필연성을 설명한다. "저는 1980년대에 광둥성의 5선 도시에서 자랐습니다. 아버지는 초등학교 교사였죠. 1990년대 광둥에는 돈을 벌 기회가 많았습니다. 당시 많은 학부모들이 우리 집에 찾아왔고, 기본적으로 그들은 공부가 쓸모없다고 생각했습니다. 하지만 지금 돌아보면 그들 모두 관점이 바뀌었죠. 돈벌기가 쉽지 않아졌기 때문입니다. 택시를 운전할 기회조차 곧 사라질 수 있습니다. 단 한 세대만에 이런 변화가 일어났습니다."


량원펑은 미래에 하드코어 혁신이 점점 더 보편화될 것이라고 전망한다. "지금 당장은 이해하기 어려울 수 있습니다. 사회 전체가 이 점에 대해 교육받을 필요가 있기 때문입니다. 일단 사회가 하드코어 혁신에 전념하는 사람들이 명성과 재산을 얻을 수 있게 허용하면, 우리의 집단적 사고방식도 적응할 것입니다. 우리는 단지 몇 가지 예시와 과정이 필요할 뿐입니다."

Deepseek의 경험은 기술 주도 혁신의 가능성을 보여준다. 량원펑의 이전 기업인 High-Flyer는 기술과 혁신에 강한 기반을 두고 비교적 순조로운 성장을 이뤄냈다. 하지만 그는 이것이 결코 쉬운 여정이 아니었다고 강조한다. "외부에서는 2015년 이후의 High-Flyer만 보지만, 사실 우리는 16년 동안 이 일을 해왔습니다."

Deepseek의 행보는 단순한 기술적 우위를 넘어선 더 큰 그림을 향한 투자로 볼 수 있다. 량원펑은 중국의 AI가 영원히 추격자의 위치에 머물 수 없다고 본다. "우리는 종종 중국 AI와 미국 사이에 1-2년의 격차가 있다고 말하지만, 진정한 격차는 독창성과 모방 사이의 차이입니다. 이것이 바뀌지 않는다면, 중국은 영원히 추격자일 뿐입니다."


이러한 관점에서 Nvidia의 리더십은 중요한 시사점을 제공한다. 그들의 성공은 단순히 한 기업의 노력이 아닌, 서구 기술 커뮤니티와 산업 전체의 협력 결과다. 그들은 다음 세대의 기술 트렌드를 예측하고 로드맵을 가지고 있다. 중국의 AI 발전도 이러한 생태계가 필요하며, 이는 기술 프론티어에 서 있는 선구자들이 필요하다는 것을 의미한다.



새로운 혁신의 시대를 여는 Deepseek


Deepseek의 여정은 중국 AI 산업의 새로운 가능성을 보여준다. 대부분의 기업들이 응용과 상업화에 집중할 때, Deepseek는 근본적인 기술 혁신이라는 도전적인 길을 선택했다. MLA 아키텍처와 DeepSeekMoESparse 구조의 개발은 이러한 도전이 단순한 모험이 아닌, 실질적인 성과로 이어질 수 있음을 증명했다.

특히 주목할 만한 점은 이러한 혁신이 해외 인재나 거대 자본 없이도 가능했다는 것이다. 젊은 국내 인재들을 중심으로 한 연구팀은 실리콘밸리도 인정한 혁신적인 기술을 만들어냈다. 이는 중국의 AI 산업이 더 이상 모방자의 위치에 머물 필요가 없다는 것을 보여주는 중요한 사례다.


Deepseek의 성공은 단순한 기술적 혁신을 넘어선다. 완전한 상향식 조직 구조, 자율성과 창의성을 중시하는 문화, 그리고 오픈소스에 대한 확고한 철학은 중국 기술 기업의 새로운 모델을 제시한다. 특히 기술 커뮤니티와의 협력과 공유를 중시하는 접근은 건강한 기술 생태계 구축의 중요성을 강조한다.

량원펑이 지적하듯, 혁신은 자본이나 인프라의 문제가 아닌 문화의 문제다. "지난 30년 동안 우리는 돈을 버는 것만 강조하고 혁신은 소홀히 했습니다. 혁신은 전적으로 비즈니스 주도가 아닙니다. 호기심과 창조에 대한 욕구도 필요합니다." 이는 단순히 한 기업의 성공 전략을 넘어, 중국 기술 산업 전반에 대한 중요한 통찰을 제공한다.


AGI를 향한 Deepseek의 도전은 여전히 진행 중이다. 수학과 코드, 멀티모달리티, 자연어 처리 등 다양한 영역에서의 연구는 계속되고 있다. 하지만 더 중요한 것은 이러한 도전이 중국 AI 산업 전반에 미치는 영향이다. Deepseek는 기술 혁신이 더 이상 서구의 전유물이 아니며, 중국 기업들도 글로벌 기술 혁신의 흐름에 주도적으로 참여할 수 있다는 것을 보여주었다.

특히 경제 구조 조정기를 맞은 중국에서, Deepseek의 사례는 더욱 중요한 의미를 가진다. "중국의 산업 구조 조정은 필연적으로 하드코어 기술 혁신에 더 많이 의존하게 될 것"이라는 량원펑의 전망은, 단순한 예측을 넘어 중국 기술 산업의 새로운 방향성을 제시한다.


Deepseek의 이야기는 결국 혁신에 대한 믿음의 중요성을 보여준다. "혁신은 믿음에서 시작됩니다." 량원펑의 이 말은 단순한 수사가 아닌, 실제 경험에서 나온 통찰이다. ChatGPT 출시 이후 많은 중국 기업들이 기술 격차를 이유로 응용에만 집중할 때, Deepseek는 근본적인 혁신의 길을 선택했다. 그리고 그 선택은 옳았음이 증명되었다. Deepseek의 여정은 아직 진행 중이다. 하지만 그들이 보여준 혁신의 가능성, 젊은 인재들의 잠재력, 그리고 기술 공유의 문화는 이미 중국 AI 산업에 새로운 이정표를 세웠다. 이제 중요한 것은 이러한 혁신의 흐름이 일회성 사례로 그치지 않고, 중국 기술 산업 전반의 변화로 이어질 수 있느냐다. Deepseek의 다음 행보가 더욱 기대되는 이유다.





이 글은 Deepseek CEO 량원펑의 인터뷰 원문을 재구성한 글입니다.

인터뷰 원문 : https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas

keyword
작가의 이전글DeepSeek의 충격 AI 산업의 새로운 패러다임