자연어 기반 설계 방식을 도입
인공지능(AI) 기반 로봇 시스템이 등장! 자연어 기반 설계 방식을 도입
(MIT 연구진, 구글 딥마인드(Google DeepMind)와 오토데스크 리서치(Autodesk Research)참여)
미국 샌디에이고 인공지능 학회 신경정보처리시스템학회(NeurIPS 2025)
'3D 생성형 AI 및 비전 언어 모델 활용 다중 구성 요소 객체의 텍스트 기반 로봇 조립 논문 발표
기존 기술 단점) CAD(컴퓨터 지원 설계) 시스템은 높은 숙련도를 요구하고 세밀한 설정이 필요
생성형 AI와 로보틱스를 결합해 비전문가도 손쉽게 물리적 객체를 제작할 수 있는 새로운 프레임워크를 개발
MIT는 16일(현지시간), 사용자가 자연어로 원하는 물체를 설명하면 AI가 이를 3차원(3D) 구조로 설계하고, 로봇이 실제 부품을 조립해 완성하는 AI 구동 로봇 조립 시스템을 공개
이 시스템은 두 개의 생성형 AI 모델을 활용한다.
첫 번째 모델은 사용자의 텍스트 입력을 바탕으로 물체의 3D 기하 구조를 생성하고,
두 번째 모델은 해당 물체의 기능과 형태를 추론해 각 부품이 배치될 위치를 결정한다.
1. ‘눈과 두뇌’ 역할 하는 비전-언어 모델(VLM)
핵심 기술: 이미지와 텍스트를 동시에 이해하는 비전-언어 모델(Vision-Language Model, VLM)
이 모델은 사전에 학습한 다양한 사물 사례를 바탕으로, 구조 부품과 패널 부품이 어떻게 결합돼야 하는지를 추론
VLM은 의자의 좌석과 등받이에 패널이 필요하다는 점을 인식하고, 해당 정보를 텍스트 라벨 형태로 출력_
이후 각 표면에 번호를 부여해 다시 모델에 입력하면, AI가 최종적으로 패널이 부착될 정확한 위치를 선택해 3D 설계를 완성한다.
VLM은 로봇의 눈과 두뇌 역할을 동시에 수행하며, 기하 구조를 이해하고 그 위에서 기능적 판단을 내릴 수 있음.
2. 사람-인공지능 협업 설계… 사용자 피드백 즉시 반영
사람이 설계 과정에 지속적으로 개입 : ‘휴먼 인 더 루프(Human-in-the-loop)’ 구조
사용자는 “좌석에는 패널을 사용하지 말고 등받이에만 적용해달라”와 같은 추가 지시를 통해 설계 실시간 수정 가능”
MIT 건축학과 대학원생 리차 굽타(Richa Gupta)는 “사용자가 AI 설계를 직접 조정할 수 있어 결과물에 대한 주인의식과 만족도가 높아진다”고 밝혔다.
설계가 완료되면 로봇 조립 시스템이 미리 제작된 구조 부품과 패널 부품을 사용해 실제 물체를 제작한다. 연구진은 이 시스템으로 의자와 선반 등 가구를 제작했으며, 모든 부품은 분해와 재조립이 가능해 제작 과정에서 발생하는 폐기물을 줄일 수 있다.
연구진은 이번 기술이 가구 제작을 넘어 항공우주 부품, 건축 구조물, 맞춤형 산업 설계 등 복잡한 객체의 빠른 시제품 제작에 활용, 장기적으로는 가정에서 로봇과 대화하며 필요한 가구나 물품을 직접 제작하는 환경도 가능할 전망임
출처 : 인공지능신문(https://www.aitimes.kr) 요약 정리