brunch

10배 속도·1/10 비용

알리바바 ‘큐원3-넥스트’

by AI러 이채문
1단계_ “속도 10배, 비용 1_10”의 선언 - visual selection.png

“속도 10배, 비용 1/10”의 선언

알리바바가 또 한 번의 승부수를 던졌습니다. 지난 9월 12일 공개된 차세대 오픈 모델 큐원3-넥스트(Qwen3-Next)는 기존 모델 대비 10배 빠른 속도, 훈련 비용 1/10을 내세웠습니다. 단순한 성능 향상이 아니라, 효율성과 비용 구조 자체를 바꿔버린 접근입니다. 특히 ‘인스트럭트(Instruct)’와 ‘싱킹(Thinking)’ 두 가지 버전으로 출시해, 대화·코딩·추론 등 다양한 작업에 맞춤형 활용이 가능하도록 설계한 점이 눈길을 끕니다.



하이브리드 아키텍처와 효율성 혁신

이번 모델은 단순히 매개변수 크기를 키운 것이 아니라, 하이브리드 설계를 도입한 첫 사례입니다. 핵심은 빠른 읽기 처리(Gated DeltaNet)와 세밀한 검증 처리(Gated Attention)를 조합한 구조입니다. 전체 레이어 중 75%는 속도를, 나머지 25%는 정밀도를 담당해 긴 텍스트를 다루면서도 정확성을 잃지 않습니다. 또한 전문가 혼합(MoE) 기법을 적용해 800억 매개변수 중 30억만 활성화해 연산 효율을 극대화했습니다. 이 덕분에 단일 GPU(H200)에서도 구동 가능할 만큼 접근성이 높아졌습니다.



글로벌 AI 경쟁의 ‘중국식 해법’

큐원3-넥스트는 단순한 연구용 모델이 아니라, 허깅페이스(Hugging Face)와 모델스코프(ModelScope)를 통해 상업적 활용까지 가능한 오픈 모델입니다. 불과 일주일 전에는 1조 매개변수 모델 ‘큐원3-맥스-프리뷰’를 공개하며 초거대 모델 경쟁에 뛰어든 알리바바가, 이번에는 중소형 모델의 고효율 전략을 내놓은 셈입니다. 이는 미국의 폐쇄형 모델 전략과는 확연히 다른 길입니다. 즉, “누구나 쓸 수 있는 고성능 모델”을 무기로 생태계 확장을 노리고 있는 것입니다.




keyword
매거진의 이전글이제는 진짜 시작일까