범용 모델의 도메인 특화 도전기
이제는 4월도 여름인 시대에 살고 있네요. 우리가 사용하는 인공지능을 위한 머신들의 발열도 한몫하고 있겠다 생각하면 마음이 우울합니다만, 그렇다고 아무 논문도 안 읽을 수는 없죠. 2026년의 우리는 인공지능이 사람 없이 코드를 짜고, 복잡한 통계 모델을 뚝딱 만들어내는 시대에 살고 있습니다. 일부 AI는 데이터 분석 대회에서 전문가 수준의 성과를 내기도 하죠. 여기서 한 가지 궁금증이 생깁니다. "그렇다면 이제 데이터 과학자라는 직업은 사라지는 걸까?"
최근 arXiv에 올라온 AgentDS 논문은 이 질문에 대해 아주 흥미롭고 냉철한 답변을 내놓았습니다.
기존의 AI 벤치마크들이 일반적인 코딩이나 수학 문제에 집중했다면, AgentDS는 훨씬 더 까다롭습니다. 연구진은 단순히 데이터만 준 것이 아니라, 현장의 맥락이 포함된 6개 분야(전자상거래, 식품 제조, 의료, 보험, 제조, 소매 금융)에서 17개의 과제를 설계했습니다.
이 시험의 핵심은 범용 인공지능이 특정 산업의 전문 도메인 지식을 요구하는 과제도 해결할 수 있는가를 측정하는 것이었습니다.
연구팀은 80명의 전문가(29개 팀)와 최신 AI 에이전트들을 맞붙였습니다. 그 결과는 놀라웠습니다.
• AI 단독: 범용 능력이 뛰어난 AI들도 특정 산업의 복잡한 논리가 들어가자 고전을 면치 못했습니다. AI만 사용했을 때의 성적은 대회 참가자들의 평균(중앙값) 근처이거나 그 이하에 머물렀습니다.
• 인간+AI 협업: 가장 높은 성과를 낸 것은 AI를 도구로 적절히 활용한 인간 전문가들이었습니다.
논문은 AI가 특히 어떤 부분에서 어려움을 겪었는지 분석했습니다.
• 문제의 공식화: 현실의 문제는 친절하게 설명되어 있지 않습니다. 무엇이 문제인지 정의하고, 어떤 지표를 최적화해야 할지 결정하는 '전략적 판단'에서 인간의 직관이 압도적이었습니다.
• 도메인 추론: 예를 들어 보험 데이터에서 왜 특정 수치가 중요한지, 제조업 공정에서 이 변수가 의미하는 바가 무엇인지와 같은 도메인의 맥락을 이해하는 능력이 AI에게는 아직 부족했습니다.
이 논문에서 보면, AI가 데이터 과학자를 대체하기보다는, 도메인 지식을 갖춘 데이터 과학자가 AI를 사용해 무적이 되는 시대가 왔다는 것입니다.
단순히 모델을 돌리고 코드를 짜는 기술적인 부분은 AI가 빠르게 가져가겠지만, 산업의 본질을 이해하고 데이터 속에서 비즈니스 가치를 찾아내는 '인간의 통찰력'은 그 어느 때보다 중요해졌습니다.
AI의 능력의 끝을 알 수 없습니다만, 아직까지는 AI는 훌륭한 조수이고, 도메인의 맥락을 읽고 전략을 세우는 '함장'의 자리는 여전히 인간 전문가의 영역인가 봅니다.