딥시크, ‘R2’를 향한 진화
추론 중심 인공지능의 새로운 패러다임 제시
1. 추론의 새로운 길을 제시한 딥시크-GRM 딥시크(DeepSeek)가 인공지능 강화학습의 중심축을 ‘보상 모델(Reward Model, RM)’로 이동시키며, AI 추론 능력의 새로운 가능성을 열어 보이고 있다. 특히 칭화대학교와의 협력을 통해 개발한 ‘딥시크-GRM(Generalist Reward Modeling)’은 단순한 기술 혁신이 아닌, 지능
댓글
0
1시간전
by
AI러 이채문