텍스트 입력만으로 로봇을 설계할 수 있다고?
[2025년 11월 11일 먀 AI 뉴스레터로 발행한 글입니다.]
식빵을 닮은, 에너지 효율이 높은 4족 보행 로봇
위와 같이 쓰고 엔터를 치자, 24시간 안에 실제 작동하는 로봇이 눈앞에 나타난다면 어떨까요?
듀크 대학교 연구팀이 Text2Robot이라는 방법론을 통해, 간단한 텍스트를 입력하면 실제 제작 가능한 '물리적인 4족 보행 로봇'을 자동으로 설계하는 방식을 발표했습니다. 3D 프린팅을 하면 실제 조립도 가능하다고 하는데요. 자세히 알아볼까요?
로봇을 만들려면 어떤 과정을 거쳐야 할까요?
먼저, 어떤 로봇을 만들고 싶은지 구상하는 아이디어 스케치부터 시작해야 합니다. 그 다음 제대로 작동하는 로봇으로 만들기 위해 복잡한 모델링 과정을 거쳐야 하지요. 이후 시제품을 제작하고 제어기를 설계해 샘플 로봇이 나오면 반복해서 테스트를 해야하는데요. 모든 과정을 거치고 나면 수개월은 족히 지나있습니다.
로봇을 만드는 과정을 자동화하려는 시도는 꾸준히 있었습니다. 가장 대표적인 것이 바로 자연의 진화에서 영감을 받은 '진화 알고리즘(Evolutionary Algorithms)'인데요. 이름에서 유추할 수 있듯이, 자연 선택의 원리를 이용해 스스로 개선되는 방식입니다. 더 강한 종자가 살아남아 특성이 유지된 것처럼, 더 효율적인 방식이 살아남으면서 가장 적합한 방식을 찾는다는 원리이지요. 하지만 진화 알고리즘은 두 가지 치명적인 문제를 안고 있습니다.
1. 느리다:
진화 알고리즘은 무작위로 작동합니다. 백지상태에서 다리를 무작위로 붙여보고, 걷게 해보고, 조금 더 잘 걸으면 그 형태를 '진화'시키지요. 마치 휴대폰 비밀번호를 찾기 위해 0000부터 9999까지 눌러보는 것처럼, 이 방식은 최적의 '답'을 찾기 위해 수천 번의 반복이 필요하기에 느릴 수밖에 없습니다.
2. 비현실적이다:
그동안은 오랜 시간을 들여 만든 디자인이 실제로 쓸 수 없는 경우가 많았습니다. 제작을 고려하지 않고 시뮬레이션만 돌려본 결과물이기 때문이지요. 보기에는 완벽하지만 제조하기 어려운 형태이거나, 비현실적인 관절 움직임 때문에 모터가 타버리는 등 실현 단계에서 실패하는 경우가 다반사였습니다.
Text2Robot(이하 'T2R')은 새롭게 접근합니다. '무(無)'에서 시작한 기존 진화 알고리즘과 다르게, 생성형 AI가 가진 '세상에 대한 지식'을 활용하지요. T2R은 어떻게 로봇을 만들까요?
시작은 사용자의 텍스트입니다. 벌레나 개, 혹은 개구리와 같은 간단한 단어를 입력하면, 이 요청 사항은 '<(단어)>을/를 닮은 4족 보행 로봇'이라는 프롬프트로 변환되는데요. 텍스트를 3D로 만들어주는 모델인 'Meshy'에 이 프롬프트를 입력하면, 사용자의 미적, 그리고 기능적 선호가 반영된 3D 형태의 로봇 외형 후보군을 만들 수 있습니다. 이 로봇 외형을 '메시(mesh)'라고 부르지요.
연구진은 동물 외에도 빵, 캔, 신발과 같이 생물이 아닌 개체로도 테스트했는데요. 어떤 형태로 나왔을까요?
각 물건의 특징을 살린 형태에 다리가 네 개씩 달린 모습을 볼 수 있지요? 단순히 생김새를 모방한 차원을 넘어, '4족 보행'이라는 기능적 제약과 사용자가 지정한 개체의 미적 형태를 융합하여, 자연계에 존재하지 않는 형태도 생성이 가능합니다.
로봇의 외형인 메시를 제작했으니, 움직이게 해주어야 겠지요? 아래 과정을 통해 메시는 로봇의 형태를 갖추기 시작합니다.
모양 잡기
AI를 통해 3D 메시의 무게 중심을 찾고, 몸통을 수직으로 썰어가며 '단면적(cross-sectional area)'을 계산합니다. 예를 들어, 단면적이 최소가 되는 지점을 '어깨 관절'로, 최대가 되는 지점을 '무릎 관절'로 할당하며 공학적으로 추론하지요.
부품 들어갈 자리 만들기
로봇이 실제로 움직이려면 '뇌�' 역할을 하는 초소형 컴퓨터, '심장�' 역할을 하는 배터리, '근육��' 역할을 하는 모터 같은 부품들이 필요합니다. 따라서 3D 모델을 만들 때, 이 실제 부품들이 쏙 들어갈 완벽한 크기의 빈 공간이나 홈을 자동으로 파둡니다.
로봇 제조용 언어로 바꾸기
만든 설계도를 로봇계의 '표준 기술 언어'인 URDF(Unified Robot Description Format)라는 파일로 바꿔줍니다. '여기가 어깨 관절이고, 이쪽으로 몇 도 회전해', '다리 길이는 몇cm야' 같은 다양한 정보가 들어있지요.
3단계는 로봇의 '몸(형태)'과 '두뇌(제어 정책)'를 동시에 최적화하는 과정입니다. 이 과정은 이중 순환으로 작동합니다.
내부 순환 (걷는 법 배우기):
각 로봇 형태는 AI로 만든 가상의 시뮬레이션 환경에서 수천 번 넘어지고 일어나며, 강화 학습을 통해 걷는 법을 배웁니다. 잘 걸으면 보상을 받고, 넘어지면 벌점을 받지요.
외부 순환 (더 나은 몸으로 진화하기):
내부 순환에서 로봇들이 받은 '보상 점수'에 기반 해 점수가 높은 우수 로봇들을 선별합니다. 우수 로봇끼리 서로 교차하고 조금씩 바꿔보는 유전적 연산을 통해 더 나은 다음 세대 로봇 디자인을 생성합니다.
이때 사용자는 '성능 선호도'를 지정할 수 있습니다. 속도를 선호하면 속도 관련 보상의 가중치를, 에너지 효율을 선호하면 에너지 보상 가중치를 높이는 식이지요. 사용자가 선택한 목표에 맞춰 AI는 로봇의 다리 길이나 몸체 모양 등을 진화시킵니다.
최적의 로봇 설계도가 완성되었어니, 이제 조립을 해야겠지요? 로봇의 외형은 설계도를 따라 3D 프린터로 출력합니다. 결과물이 출력되는 데는 약 하루 정도가 소요되는데요. 프린트가 완료되면, 2단계에서 자른 홈에 맞춰 기성 전자 부품을 넣어 조립합니다. 이미 치밀하게 모든 부품의 위치와 설계를 고려했기 때문에, 조립은 퍼즐을 맞추듯 간단합니다. 소형 시제품 기준, 모든 부품을 조립하는 데 걸리는 시간은 단 몇 분에 불과하다고 해요!
로봇을 자동으로 설계하는 기존 방식 중에 'RoboGrammar(로보그래머)'가 있습니다. 로보그래머는 로봇의 몸 구조를 문법(grammar)처럼 규칙적으로 조합해서 자동으로 만드는 시스템입니다. 즉, 언어의 문법처럼 로봇의 몸체를 구성하는 규칙을 코드로 정의해두고, 그 규칙을 조합해서 새로운 형태의 로봇을 자동으로 만들어내는 시스템이지요.
성능 비교를 위해, 연구진은 T2R이 생성한 디자인 150개와 로보그래머가 생성한 디자인 150개에게 동일한 훈련 시간을 주고, 누가 더 높은 보상 점수를 받는지 비교했습니다. 높은 보상 점수를 받는다는 건, 걷는 것을 더 잘 배워 보상도 많이 받았다는 의미니까요. 결과는 어땠을까요?
로봇 모양만 봐도, T2R 로봇이 더 잘 걷게 생겼지요? 역시나, T2R 로봇들(붉은색)이 로보그래머의 로봇들(노란색)보다 훨씬 높은 보상 점수를 받았습니다.
T2R은 물리적 세계에 대한 지식이 있는 AI가 외형을 디자인 했기 덕분에, 처음부터 보다 안정적인 자세와 적절한 신체 비율을 갖출 수 있었습니다. 모양이 더 안정적이니 걷는 법도 더 빠르고 쉽게 배웠겠지요?
이번 연구는 빠르게 로봇을 만든 것 보다도, AI가 '스스로' 로봇 공학의 원리를 발견하는 모습을 보여준 데 의의가 있는데요. 로봇이 험지(험난한 땅)에 적응하는 과정에서 AI가 스스로 최적의 형태를 발견하는 모습이 포착됐습니다.
연구진은 로봇들을 평탄한 지형이 아닌, 계단이나 장애물 등이 포함된 험지 에서 걷도록 훈련시켰는데요. 그 결과, 평지에서 최적화된 로봇들은 더 큰 아치형 발을 갖도록 진화했고, 험지에서 최적화된 로봇들은 더 작고 단순한 둥근 발을 갖도록 진화했습니다. 연구진이 지형에 따른 적합한 발 모양에 대해 가르친 적이 없는데도 말이지요.
AI는 수천 번의 시뮬레이션과 '진화'의 압력 속에서, 지형에 맞는 최적의 발 모양이 무엇인지 추론해냈습니다. 그리고 추론한 이유는 실제 로봇 공학의 원리와 정확히 일치했습니다!
AI의 판단 (평지):
아치형 발은 접촉면이 넓어서 안정적이고 빠르게 걸을 수 있구나?
AI의 판단 (험지):
하지만 험지에서는 발이 너무 커서 돌부리에 걸려 넘어질 위험이 높아...
AI의 결론:
어디에 닿을지 모르는 예측 불가능한 표면인 험지에는 '둥근 발'이 더 안정적이야!
*물론, Text2Robot은 아직 초기 단계이며 한계가 존재합니다. 지금은 4족 보행에 8모터 로봇에 국한되어 있고, 조립도 수동으로 해야해 온전한 text-to-robot이라고 부르기는 어렵습니다.
배경지식으로 초안을 잡고, 끊임없는 연구와 실험을 통해 검증까지 하는 Text2Robot은 인간 연구원을 연상시킵니다. 단순히 정보를 검색하고 취합해 주던 AI는 이제 최적의 로봇 형태를 찾을 줄 압니다. 가르치지 않아도 스스로 판단해 더 나은 결과물을 가져오지요.
빠르고 급격한 변화에 삶이 혼란스럽게 느껴지기도 하는 요즘입니다. 하지만 어떤 험지가 와도, 우리는 최적의 형태로 걷는 법을 스스로 발견해 내고, 누구보다 안정적으로 걸어 나갈 것입니다.
참고자료- 논문 <Text2Robot: Evolutionary Robot Design from Text Descriptions>
오늘 이야기가 흥미로우셨나요?
다음 이야기는 브런치에 올라오기 전, 이메일로 가장 먼저 받아보세요!
구독하기: https://mmmya.stibee.com/