brunch

You can make anything
by writing

C.S.Lewis

by 성빈 Seongbin Jan 27. 2024

[번역] 너의 로봇 아바타는 거의 다 완성되었다 pt2

디자인 아티클 모음 #3 : Avatar XPrize로 보는 텔레프레즌스

[번역] 너의 로봇 아바타는 거의 다 완성되었다 pt1에서 이어지는 글입니다.



인간의 형태인가? 인간의 기능인가?

 Avatar XPrize와 같은 로봇 공학 대회에서는 실제 세계에 적용가능한 문제해결에 대한 문제해결보다는 더 넓은 목표와 단순히 경쟁에서 승리한다는 목표의식 사이에 그 목적이 자리잡고있습니다. 승리한다고 해서 문제가 반드시 해결되는 것은 아닙니다. XPrize는 "실시간으로 인간 존재를 원격 위치로 이동할 수 있는 아바타 시스템"의 생성을 촉진할 수도 있지만 대회 조건에서 맞게 가장 효율적으로 완료한 팀이 승리했습니다.


Istituto Italiano di Tecnologia의 iCub 팀은 이족 보행 아바타가 인간의 자연스러운 움직임을 로봇에 전달하는 가장 직관적인 방법이라했습니다.


 예를 들어, 이탈리아 제노바에 위치한 IIT(Istituto Italiano di Tecnologia)의 iCub 팀은 인간 존재를 먼 곳으로 이동시키는 가장 좋은 방법은 인간을 최대한 가깝게 구현하는 것이라고 생각했습니다. 이를 위해 IIT의 아바타 시스템은 키가 100cm인 작은 이족보행 휴머노이드 로봇인 iCub 을 구현했습니다 . 이족 보행 로봇이 안정적으로 걷도록 하는 것은 어려운 일입니다. 특히 해당 로봇이 경험이 부족한 인간의 직접적인 제어를 받는 경우에는 더욱 그렇습니다 . 그러나 이상적인 조건에서도 iCub이 바퀴 달린 경쟁사만큼 빠르게 움직일 수 있는 방법은 없었습니다.


 XPrize는 인간과 유사한 로봇에게  유리한 코스(예를 들어 코스에 계단이 없음)를 제시하지 않기로 결정했습니다. 이는 "인간 존재"가 실제로 무엇을 의미하는지에 대한 질문을 촉발합니다. "인간 존재"의 의미가 인간이 갈 수 있는 곳이면 어디든 갈 수 있다는 의미라면 다리가 필요할 수도 있습니다. 로봇(및 일부 인간)이 이동성에 제한이 있다는 사실을 받아들이고 결과적으로 아바타 경험의 다른 측면에 초점을 맞춘다면 아마도 다리는 선택 사항일 것입니다. XPrize의 의도가 무엇이었든 궁극적으로 코스 구성은 대회 목적에 맞는 성공적인 아바타를 만드는 방법으로 만들어졌습니다.



아바타 최적화

 당연한 이야기이지만 대회 경쟁에 집중하고 그에 따라 아바타 시스템을 최적화한 팀이 좋은 성과를 거두는 경향이 있었습니다. Northeastern 팀은 운영자를 위한 정수압 피드백 인터페이스(hydrostatic force-feedback interface)를 사용하여 3위를 차지해 100만 달러를 획득했습니다. 인터페이스는 10년 전 Disney Research에서 처음 개념화한 유체 작동기 시스템을 기반으로 했습니다 .


 2위는 프랑스 스타트업인 Team Pollen Robotics 에 돌아갔습니다. 그들의 로봇인 Reachy는 Pollen Robotics의 상용 모바일 조작기를 기반으로 하며 가격이 단 €20,000(US $22,000)에 불과해 경쟁에서 가장 저렴한 시스템 중 하나였을 것입니다. 주로 3D 프린팅 구성 요소와 오픈 소스 디자인을 사용했습니다. Reachy는 실제 조작을 위한 일반화 가능한 플랫폼으로 의도되었기 때문에 최적화 전략을 채택하지는 않았습니다. 그러나 팀의 상대적으로 단순한 접근 방식은 200만 달러의 상금을 획득하는 데 도움이 되었습니다.


 1위는 독일 본 대학교의 NimbRo 팀이 6분 이내에 전체 과정을 만점으로 완료했습니다. NimbRo팀은 로봇공학 대회의 오랜 역사를 가지고 있습니다. 그들은 2015년 DARPA Robotics Challenge에 참가했고 2005년부터 국제 RoboCup 대회에 참여해 왔습니다. Avatar Xprize를 통해 그들은 인간 지능과 로봇 제어 시스템을 결합하는 새로운 방법을 보여주었습니다.  팀 리더인 Sven Behnke는 IEEE Spectrum 과의 인터뷰에서 “인간 지능이 기계를 작동시키는 모습을 볼 수있다는 점이 매력적이라고 생각합니다.”라고 말했습니다 . "인간은 기계가 예상하는 방식에서 벗어나는 것을 볼 수 있으며 창의성을 발휘하여 이러한 오차를 해결할 수 있습니다."


 Team NimbRo의 시스템은 인간 조작자의 감각과 지식에 크게 의존했습니다. “우리는 인간의 인지 능력을 최대한 활용하려고 노력했습니다.”라고 Behnke는 설명했습니다. “예를 들어 우리 시스템은 깊이를 추정하기 위해 센서를 사용하지 않습니다. 인간은 엄청나게 효율적인 방식으로 이 작업을 수행하도록 진화했기 때문에 이는 단순히 조작자의 시각 피질에 의존합니다.” 이를 위해 NimbRo의 로봇은 작업자의 머리 움직임을 따르는 비정상적으로 길고 유연한 목을 가졌습니다. 대회 중에 작업자가 시차를 사용하여 물체가 얼마나 멀리 떨어져 있는지 이해함에 따라 로봇의 머리가 좌우로 이동하는 것을 볼 수 있었습니다. 꽤 잘 작동했지만 NimbRo는 운영자의 머리 움직임과 로봇의 비디오 피드 사이의 지연 시간을 최소화하여 운영자가 멀미를 느끼지 않도록 특수 렌더링 기술을 구현해야 했습니다.


XPrize 심사위원 Jerry Pratt[왼쪽]가 코스에서 NimbRo의 로봇을 조종하고 있습니다[오른쪽]. 무거운 물체를 들어 올려 정밀하게 조작하는 훈련 작업이 어려웠습니다.


 팀은 또한 로봇을 사용하여 물체를 조작하는 것이 최대한 직관적이게 하기 위해 많은 노력을 기울였습니다. 조작자의 팔은 아바타 로봇의 팔과 복제된 로봇 팔에 직접 부착되었습니다. 이는 작업자가 수행하는 모든 팔 동작이 로봇에 의해 미러링되어 작업자에게 매우 일관된 경험을 제공한다는 것을 의미합니다.


하이브리드 자율성의 미래

 Team NimbRo의 로봇을 조종한것은 심사위원은 Jerry Pratt였습니다. Jerry Pratt는 작년에 휴머노이드 로봇 스타트업인 Figure 에 합류하기 전 수십 년 동안 플로리다 인간 및 기계 인지 연구소에서 로봇 공학 교수로 재직했습니다 . Pratt는 2015년 DARPA Robotics Challenge Finals에서 Team IHMC(및 Boston Dynamics Atlas 로봇 )를 2위로 이끌었습니다. Pratt는 "60분 안에 로봇 조종법을 방법을 배울 수 있다는 것이 정말 놀랍습니다."라고 말했습니다. 그의 또 다음과 같이 덧붙였습니다 "그리고 그것들을 조작하는 것은 정말 재미있어요!" Avatar XPrize 코스 완주에 Pratt은 5분 50초 걸렸습니다. 이 속도는 인간의 속도보다 많이 느리지 않았습니다.


 이와 대조적으로 2015년 DARPA 로봇공학 챌린지 결승전에서 Atlas 로봇은 힘들게 조종해야 했습니다. 인간이 5분이면 끝낼 수 있는 코스를 로봇이 완주하는 데 50분이 걸렸습니다. Pratt는 “[DARPA 대회 기간 동안] 조이스틱과 마우스로 물건을 집어내려고 하면 정말 느립니다.”라고 말합니다. “완전한 텔레프레즌스로 '오, 저기 물건이 있군요. 제가 잡아 보겠습니다'라고 그냥 갈 수 있는 것보다 더 좋은 것은 없습니다."


Team Pollen의 로봇[왼쪽]은 상대적으로 단순한 조작자 인터페이스[가운데]를 갖고 있었고 이는 대회에서 유리하게 작용했습니다.[오른쪽].

 

 Pratt와 NimbRo팀의 리더인 Behnke는 인간을 단기적으로는 현실 세계의 구조화되지 않은 환경에서 작동하는 로봇의 중요한 구성 요소로 보았습니다. Pratt은 “높은 수준의 의사결정을 위해서는 인간이 필요합니다.”라고 말합니다. “뭔가 새로운 것이 있거나 뭔가 잘못되면 세상에 대한 인간의 인식이 필요합니다. 이것이 바로 텔레프레즌스가 필요한 이유입니다.”


 Behnke도 이 의견에 동의합니다. 그는 자신의 그룹이 Avatar XPrize 대회에서 얻은 인사이트가 텔레프레즌스를 통해 하이브리드 자율성으로 이어지기를 바라고 있습니다. 즉, 로봇은 대부분 자율적이지만 인간은 로봇이 막히면 텔레프레즌스를 사용하여 로봇을 도울 수 있다는 것입니다. 이 접근 방식은 이미 인도 배달 로봇과 같은 단순한 상황에서 구현되고 있지만 Behnke의 시스템이 수행하는 복잡한 인간 루프 조작 방식에서는 아직 구현되지 않았습니다.


 Behnke는 "단계적으로 내 목표는 인간을 그 루프에서 벗어나 한 명의 운영자가 10대의 로봇을 제어할 수 있도록 하는 것입니다. 로봇은 대부분 자율적으로 작동합니다."라고 말합니다. “그리고 이 10개의 시스템이 작동하면서 우리는 배울 수 있는 더 많은 데이터를 얻게 되며, 그러면 한 명의 운영자가 100대의 로봇을 담당하게 될 수도 있고, 그 다음에는 1,000대의 로봇을 담당하게 될 수도 있습니다. 우리는 자율성을 더 잘 수행하는 방법을 배우기 위해 텔레프레즌스를 사용하고 있습니다.”라고 덧붙였습니다. 


전체 Avatar XPrize 이벤트는 YouTube의 라이브 스트림 녹화를 통해 시청할 수 있습니다.


 Avatar XPrize 대회는 우주 탐사 시나리오를 기반으로 했지만 Behnke는 일상 생활과 같이 텔레프레즌스를 통한 인간의 접촉이 훨씬 더 가치 있는 응용 프로그램에 더 관심이 있습니다. Behnke의 그룹은 팔을 다친 사람이 혈압을 측정하고 코트를 입는 데 아바타 시스템을 사용하는 방법을 이미 시연했습니다 . 이는 간단한 작업처럼 들리지만 로봇 자체로는 매우 어려운 인간 상호 작용과 창의적인 조작을 기반하여야 합니다. 몰입형 텔레프레즌스는 이러한 작업을 더 간단하게 만들고 약간의 교육만 받으면 거의 모든 사람이 사용 할 수 있도록 해줍니다. 이것이 바로 Avatar XPrize가 달성하려고 했던 것입니다.


 그러나 이러한 기술이 얼마나 확장 가능한지 알기는 어렵습니다. 현재 아바타 시스템은 취약하고 비용이 많이 듭니다. 역사적으로, 세간의 이목을 끄는 로봇 공학 대회가 열린 후 자율주행 자동차, 휴머노이드 로봇과 같은 결과 기술이 실험실 외부의 유용한 장소에 도착하기까지는 약 5~10년의 시간차가 있었습니다. 구조화된 환경에서 일반적인 작업에 대한 아바타 로봇의 영향이 다소 줄어들 만큼 자율성이 빠르게 발전할 가능성이 있습니다. 그러나 자율 시스템이 인간 수준의 직관이나 창의성을 달성할 것이라고 상상하기는 어렵습니다. 즉, 가까운 미래에도 아바타에 대한 수요는 계속될 것입니다. 그리고 만약 이들 팀이 Avatar XPrize 대회에서 4년 동안 도출된 인사이트를 활용하여 연구 단계에서 끌어낼 수 있다면 인간의 능력을 통해 자율성의 제약을 우회하여 우리에게 도움이 되는 유용한 로봇을 일상에 가져올 수 있습니다. 




글을 닫으며

인간의 감각은 50억년 진화의 산물이라고 합니다. 

 인간의 감각적인 영역은 단순히 기술로 쉽게 대체할수 없다는 뜻일겁니다. 위 아티클은 로봇과 인간의 인지/물리적 능력의 영역차이를 엿볼수있는 글이었습니다. 로봇 자동화로 대체되는 인간 뿐만 아니라 "로봇을 조작하는 인간(하나의 부품으로서)"이라는 관점에서 어떤 역할을 하는지, 인간(조작자)이 기계와 어떻게 상호작용하는지에 대한 탐구도 핵심적인 포인트라 생각합니다. 전세계에서 온 팀들이 어떤 관점으로 로봇을 바라보고 있는지에 따라 구현되는 기술이 다르다는 점도 알수있는 흥미로운 글이었습니다. 




원글


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari