생존형 개발자의 생각 #118
저번 주, 구정연휴가 시작될 즈음 지인들의 메신저에서 생소한 링크가 보이기 시작했다. DeepSeek 그리고 충격!이라는 말과 함께 꾸준히 공유되고 있었다.
생성 AI를 비관적으로 보는 시각에는 기술적 이슈가 지배적이고 아래와 같은 난제가 존재하고 있다.
고사양의 GPU와 스토리지
전기소모(핵발전소까지 구매할 수준의 난제)
학습할 데이터의 무결성 및 분량
이러한 이슈로 생성 AI의 플레이어들은 일반 스타트업 회사들이 아니라 몇 조단위의 투자를 지원받는 유니콘 중에 유니콘들만 자격이 주어졌다. 소위 말하는 넘사벽의 멤버들과 천문학적인 펀딩이 가능한 펀드들이 생성 AI를 이끌어왔다고 해도 과언이 아니다. 그런 시점에서 2024.12.26일 부터 일반인 세상에 알려지기 시작한 DeepSeek는 지난 주부터 넘사벽 유니콘들과 투자 펀드에게 충격을 주는 이슈로 알려지기 시작했다.
헤게모니인 “거대자본”과 “운영리소스(전기, 하드웨어)”의 제약이 없이 “소프트웨어 파워”만으로 기존 생성AI를 능가하는 스타트업이 나타났기 때문이다. 결과적으로 AI 전쟁으로 일컷는 “미국 VS 중국”의 기술싸움에서 중국이 [Drop ship]으로 본진을 유린했다. 호들갑을 떠는 사람들은 라마(메타라고 불리는 페이스북)의 몰락을 예고한다.
“마치 암흑의 군주가 보유했던 절대반지를 숲속에 떨어트려 누구나 가질 기회(오픈소스)를 준 것과 마찬가지이다”
그럼 골룸이 되어야 하는건가? 그것보다는 샤잠이 맞을 듯하다
딥시크 주소:
가입 후, 다음과 같은 프롬프트를 시전했다.
- 프롬프트
생성물에 대한 공유링크는 아직 제공되지 않는다. 그렇기 때문에 핵심내용만 발취하여 정리해본다.
- 핵심포인트
일단 가장 핵심은 "한 번 우리도 해볼 수 있겠다"라는 판단을 할 수 있다는 것이다. 특히 도메인 특화(Domain-Specific)는 AI를 이야기 할 때마다 개인적으로 주장했던 핵심사항이다. AI의 핵심은 데이터 싸움이고 단지 AI 머신을 돌릴 돈이 없다가 문제였기 때문이다. 결과적으로 누구나 참전 가능한 시대가 왔다.
고가 아파트값(80억 내외) 정도만 있으면 해볼만 것이 아닌가? 라는 어설픈 생각도 든다(아부지에게...좀...부ㅌ..ㅎ.ㅁ).
- 최종정리
위에서 핵심은 "민주화"라고 과대포장된 "누구나 판매가능한 제품"이 가능해졌다는 것이다. 특히 Domain-Specific은 국가차원의 과제가 될 수 밖에 없기에 우리같은 소프트웨어 엔지니어들이 참전할 수 밖에 없는 상황이 되어버렸다. 정말 예상치 못했다.
기사요약:
GPU를 적게 사용하는 LLM 엔진개발
gpt-4o1을 앞선 성능
저렴한 투자비용(78억)
결과적으로 서방(미국)의 AI 칩제제가 무용지물이 됨
기사요약:
DeepSeek 공개로 메타 패닉
93조원 투자계획의 라마에 먹구름
78억으로 만든 강력한 오픈소스
gpt-o1보다 성능 우수
중국이 미국을 앞서다
기사요약:
지난 주 DeepSeek의 쇼크로 서학개미 패닉
엔비디아 거래 8.35% 하락
ARM 홀딩스 7.79% 하락
마이크로 소프트 2.7% 하락
스타게이트(손상의 소프트뱅크 그룹) 6.28% 하락
중국의 뻥튀기일 수도 있다는 의견도 있음
기사요약:
스타트업 전문 채널에서 요약한 DeepSeek 사태
개인적으로 평가하자면 "서비스 Interface"가 부족하다. 그 점은 향후 업그레이드 될 것이 확실하므로 큰 문제를 삼을 필요가 없을 것 같다. 단지 앱으로 배포되는 것들 중에는 특정 태블릿에서 로그인이 안되는 이슈가 발생했다(즈그나라 Lenova 탭에서 안된다!). 그 외에는 다음과 같은 것들이 눈에 띄였다.
(1) 생각기능
DeepThink (R1)이라는 버튼을 선택 후, 프롬프트를 진행하면 추론(?)의 과정을 문장으로 만들어준다. 기존의 생성AI들은 아웃라인 글쓰기 형태(개인적으로 가장 완벽한 글쓰기라고 생각한다)이지만 추론의 과정을 Tracing하는 문장을 먼저 보여줌으로써 읽는 사람들의 사고의 폭을 넓힐 수 있어서 좋았다.
이 과정이후에는 기존의 아웃라인 글쓰기 형태의 문서로 내용을 제공하고 있다.
(2) 이미지 분석
DeepSeek에거 가장 인상깊었던 것은 이미지 분석이다. 대부분의 생성 AI는 Object와 Text를 구분못하고 처리하는 경우가 많은데, 이 모델은 두 개를 분류해서 마음에 들었다. OCR 분야에서 활용할 것들이 많아졌다고 판단된다. 특히 문서처리 시스템을 개발할 시 OCR에 대한 신뢰도가 높아질 것 같다.
먼저 정리부터 해보고자 한다.
DeepSeek를 만든 사람들
출신국
중국의 젊은이들
출신대학:
칭화대
베이징대
저장대
최고석학보다는 Software 엔지니어 주축의 개발진
이들이 엔지니어 성향이 강하다고 말한 근거는 MIT 라이센스(자유로운 활용강함)와 오픈소스로 배포했기 때문이다. 결과적으로 서방(?)의 폐쇄적인 행보와 달리 자신들의 AI기술을 공유했기에 미국의 빅테크보다 더 공정한 기술평가를 받고 있다.
SNS 상에서는 중국혐오 관련된 컨텐츠만 포커싱 되지만 실제로 IT와 비지니스 영역에서는 그들의 행보는 공산국가 또는 사회주의의 반대인 영악한 자본주의의 성향이 강하다. 반대로 우리나라는 자본주의 입장에서 보면 이해할 수 없는 회사운영을 하는 경우가 많다. 결과적으로 기술은 중국이 수십년전부터 앞서고 있었다.
github의 테크니컬한 레포지토리는 중국어로 도배되기 시작한 지 이미 십년이 넘었다.
결과적으로 하드웨어, 소프트웨어는 중국을 "정신승리"로만 이겼다고 하고 있다. 그리고 그들의 기술력을 폄하하는 데만 신경을 썼기에 우리의 수준을 자각하지 못하고 있다.
미국이 몇년동안 미치도록 중국을 죽이려는 이유는 "생긴 것이 마음에 들지 않아서?"가 아니다. 그들이 미국을 이미 추월했기 때문이었다. 그렇기 때문에 사활을 걸고 중국까기 정책(틱톡, 반도체, 대만, ...)을 벌인 것인데 36년 전 일본을 망하게 했던 것 만큼 쉽지 않아서 당황하고 있을 뿐이다.
심지어 트럼프가 집권하며 AI 강국을 선언하고 며칠 만에 패닉이 발생했다.
이런 상황에서 세계정세의 이익주의를 무시하고 시대착오적 사대주의를 숭상하는 사람들이 목소리를 내는 것이 우울하다. 우리역사를 보면 사대주의 기득권들이 외세에 빌붙어 내수를 망가트리는 것이 반복되었다. STEM이 망하고 의대에 광분하는 사회에서 기초상식적인 국제 비지니스의 이익관계도 무시하는 작금의 상황은 "누구나 가질 수 있는 절대반지"를 우리만 가지지 못할 것이다라는 자괴감이 들게 한다.
AI 전쟁에서
무기는 무엇이며
그것을 어떻게 얻을 수 있나?
를 고민하면 우리가 행동해야 할 방법은 의외로 간단하다. 무기를 빨리 가져와 쓰면 된다. 그리고 협업하면 된다. "AI절대 권력자들(미국의 빅테크)"에게만 무기가 있지않음을 인지해야 한다. 어쩌면 One Shot One kil의 기회일지 모르겠다.
(*) 글 업로드 후 며칠 후:
AI 어시스트 제품 군들 중에서 빠르게 deepseek로 전환한 windsurf. 생각보다 다양한 제품군에서 반강제적으로 사용하게 되지 않을까?코디엄같이 영향력있는 ai 코딩 어시스턴스 제품에 탑재되면 여파가 클 것으로 예상된다.