마침내, 로봇이 온다 #05
하 은 작가님, 혹시 그런 생각해 보신 적 있으세요?
은 어떤 생각이요?
하 사람들은 왜 차량 내비게이션에 말을 시킬까?
은 그건 어쩐지 하리리 소장님 보다는 제가 던져야 할 질문 같은데요? 저도 생각을 해본 적이 있는 문제예요. 저는 인간과 다른 동물을 구분 지을 수 있는 거의 유일한 특징이 '음절로 구분되는 언어'라고 생각하거든요. 그런 특기를 갖고 있어서 그런지 어쩐 지는 몰라도 사람들은 생명이 있는 것은 물론 그렇지 않은 대상에 대해서 말을 건네는 걸 참 좋아하는 존재라는 생각이 들었습니다. 인간의 언어에 대해 반응을 보이는 반려동물은 말할 것도 없고, 식물에도 무생물에도 끊임없이 말을 걸잖아요. 한 마디로 굉장히 외로운 존재 같아요.
하 나중에, 인공지능이나 로봇에 관해 별도의 장에서 얘길 하면서 가까운 미래에 산업적으로 가장 많이 영향을 받을 분야는 어디인가, 또 어떤 산업이 발달할 것인가 이런 얘기도 해보고 싶습니다. 늘어지니까, 그때 더 얘기를 하기로 하고 이쯤에서 본론으로 뛰어들어 보도록 하죠. 우리는 지금 '새 로봇' 얘기를 하고 있으니까요.
은 네, 지난 편 마지막에 제시하셨던 기사와 동영상을 봤습니다. 기사는 자동차 회사가 GPT를 탑재한 자동차를 생산한다는 내용이었고, 동영상은... 뭔가 '허접한' 로봇이었는데 좀 특징이 있더군요 (1) 조이스틱이나 이런 조종장치로 움직이는 게 아니라 사람이 말로 지시해서 움직이게 한다는 점. (2) 사람의 말과 로봇의 구동장치를 매개하는 역할을 대규모 언어모델(LLM)인 GPT가 맡고 있다는 점입니다.
하 아주 정확하게 짚으셨네요. 그냥 외관만 보면 말씀하신 대로 '허접한' 로봇이지만 그 의미가 적지 않습니다. 이 로봇 자체가 대단하다는 게 아니고, 앞으로 이런 시도가 계속될 것이고 저희가 말해온 새 로봇은 이런 작동방식, 즉 '사람의 말을 듣고 그걸 동작에 반영하는' 방식을 기본으로 삼을 거라는 얘기입니다. 이건 혁명적인 변화입니다.
은 글쎄요... 제가 지인 집에 갔을 때 거기에 놓여있는 AI 스피커를 본 적이 있거든요. 지인이 약간 쑥스러워하면서 'TV 켜줘', '음악 틀어줘' 이러는 걸 본 적이 있는데요. 그거랑 뭐가 다르죠?
하 두 가지 측면에서 크게 다릅니다. (1) AI 스피커에 연결되었던 인공지능의 수준은 GPT4 내지 GPT5의 수준과는 비교를 할 수가 없습니다. 제한적인 키워드에 대해 반응하도록 학습되어 있는 수준이었으니까요. (2) 어떻게 생각해 보면 티브이를 끄고 켜고, 음악을 틀고, 전등을 켜고 끄는 행동은 본질적으로 다르지 않습니다. 0/1, on/off, T/F 전형적인 이진법체계죠.
그런데 잠깐 생각해 보면 그렇게 가벼이 생각할 문제가 아닙니다. 몸을 가진 로봇이 있고, 그 로봇이 내가 하는 말을 광범위하게 알아듣고, 거기에 말로는 물론 행동으로 응답하는 상황을 한 번 상상해 보세요. 소설가시니까요. 아까 말씀하셨던 'AI 스피커' 작동상황과 같은 상황을 놓고 뭐가 다를까 생각해 보세요.
(로봇과 80대 중반 여성이 거실 식탁에 함께 앉아있다.)
인간 : 로봇 TV 켜줄래?
로봇 : 네. 잠시만요. 리모컨 어디 두셨죠?
인간 : 응 어디 뒀지? 내가 요즘 깜빡깜빡해.
로봇 : 저도 그럴 때가 있는데요 뭐(예쁜 거짓말). 잠시만 기다리세요 제가 찾아볼게요.
(의자에서 일어나 소파 틈에서 리모컨을 찾아낸다.)
로봇 : 어머니, 찾았어요. TV 뭐 보실 거예요? 이 시간이면 좋아하시는 토요 장수무대 할 텐데, 그거 틀어드릴까요?
인간 : 아니, 나 동물 다큐 보고 싶어.
로봇 : 아, 그럼 동물들의 세계 채널 찾아볼게요.
(로봇이 손가락을 이용해 채널을 이리저리 돌리면서 동물 다큐가 나오는 채널을 찾는다.)
인간 : 고마워. 나 소파로 갈래. (힘겹게 의자에서 일어나려고 한다)
로봇 : 잠시만요. 제가 손 잡아드릴게요.
은 그야말로 뻔한 SF의 한 장면 같네요.
하 그렇죠. 그런데, 지금 나와있는 현재의 기술(LLM과 FIGURE 내지 옵티머스봇)을 조합했을 때 논리적으로는 구현이 충분히 가능한 시나리오입니다.
위 시나리오에서 로봇이 갖춰야 할 기능은 (1) 인간의 말을 알아듣는 기능 (2) 시각 정보를 통해 주변을 탐색하고 물건을 찾을 수 있는 기능 (3) 인간의 과거 행동을 DB로 기록해 그 DB를 바탕으로 선택을 제안하는 기능 (4) 실시간 TV 프로그램을 시각정보로 판단해 인간이 원하는 채널을 탐색하는 기능 (5) 인간의 보행을 간접적으로 보조하는 기능 등으로 정리해 볼 수 있을 것 같습니다. 저도 GPT-3 단계에서 LLM이 뭘 할 수 있는지, 뭘 못하는지 시험을 좀 해봤는데요. 위 상자 안에 제시한 시나리오 정도를 소화하는 건 크게 무리가 아니었습니다.
은 아니요. 그럴 리가 없습니다. 재가 얼마 전 봤던 동영상인데 한 번 같이 보시겠습니까?
2023년 세계 로봇 축구대회 장면입니다. 데니스 홍 박사님 팀도 참여를 했죠. 저 파란색 유니폼이 데니스 홍 박사팀 팀입니다. 로봇 뒤에 사람이 보이는 데요, 가만히 보시면 저게 로봇을 조종하려고 뒤에서 저러고 있는 게 아닙니다. 로봇은 인공지능에 따라 자율적으로 움직이는 건데, 넘어지면 로봇이 망가질까 봐 사람이 쓰러지면 받아줄 준비를 하고 있는 겁니다. 보모처럼요. 저게 지금 로봇들 수준인데 사람을 부축한다고요? 정말 어림도 없는 예기죠.
하 보셨군요. 저도 동영상 봤습니다. 데니스 홍 박사님이 일전에 유튜브 프로그램에 나오셔서 광고를 너무 세게 하시더라고요. 그래서 '아마 실제는 그렇게 멋지게 움직이지 않을 건데' 하고 저 혼자 속으로 좀 걱정을 했죠. 그런데 여기서 중요하게 여겨야 할 지점이 있습니다. 새 로봇의 특징 세 번째, "전기모터(전기 액추에이터)로 작동한다."는 측면입니다.
④ 액추에이터는 정교하고 인간의 움직임을 닮은 동작을 가능케 한다
은 처음에 그 말씀을 하실 때부터 저는 그게 뭐가 중요할까 의심을 품었었습니다. 오히려 유압으로 작동하는 보스턴다이내믹스의 아틀라스가 예외적이었지 휴보를 포함해서 사실 우리가 계속 보아왔던 로봇들이 다 전기모터로 작동했던 것 아닌가요? 그런데 그게 왜 새 로봇의 특징이라는 건지 저는 잘 이해가 안 되거든요.
하 충분히 그럴 수 있다고 생각합니다. 은 작가님이 그리 생각하는 것도 당연합니다. 여기서 잠깐 로켓 얘기를 좀 해보려고 해요. (은 갑자기 왜 또 로켓입니까?) 스페이스X와 NASA가 다른 이유, 같은 로켓을 만들어도 NASA가 직접 개발하는 SLS가 훨씬 더 비싸게 먹히고 개발기간도 긴 이유가 뭔지 아십니까?
은 글쎄요. 전혀 생각 안 해본 분야라서요.
하 역시 좀 단순화해서 얘기해 보겠습니다. NASA가 로켓을 개발하는 방식은 이렇습니다. 로켓에는 단순한 전선에서부터 시작해서 로켓 엔진, 그 엔진에 들어가는 수많은 밸브, 탑재되는 컴퓨터까지 헤아릴 수 없을 만큼 많은 부품이 들어갑니다. 또 그 우주선을 타고 갈 사람들이 입을 우주복도 만들어야 합니다. NASA는 대개 이걸 기존에 나와있는 부품들을 이용해서, 그러니까 그 분야의 여러 업체에 주문을 내서 조립을 하는 방식으로 일을 합니다. 반면에 스페이스X의 경우엔 그 수많은 부품들을 자기네들이 직접 설계해서 개발합니다. 그러니까 일단 빠르고요, 두 번째로 '이런 게 있으니까 이런 걸 할 수 있겠다.'가 아니라 '이런 걸 하려면 이런 부품을 만들어야겠다.' 이런 식으로 일을 추진합니다. 결과적으로 어떻게 되냐면요, 지금까지는 생각하지 못했던 전혀 새로운 발상의 제품들이 나올 수가 있는 겁니다. 혁신이죠. 하나만 비교해 보면요, 초대형 로켓 SLS에 쓰이는 로켓 엔진은 우주왕복선에 썼던 RS-25 엔진입니다. 이유는 간단합니다. 재고가 많아서요. 액체 수소와 산소를 쓰는 구식 엔진입니다. 반면에 스페이스X의 팰컨, 그리고 스타십에 쓰이는 엔진은 다릅니다. 대형 엔진 하나를 쓰는 게 아니라, 작은 엔진 여러 개를 묶어서 쓰는 방식입니다. 이걸 클러스터링이라고 합니다. 그리고 특히 스타십에 쓰이는 로켓 엔진은 메탄을 연료로 씁니다. 각광받는 최신기술입니다.
은 주제에서 벗어난 로켓 얘기는 이 정도로 끝내시죠. 무슨 말씀을 하고 싶으신 건지요?
하 잘 끊으셨습니다. 로켓 얘기를 오래 해서 죄송합니다. 무슨 얘기를 하고 싶었냐면요, 로봇을 움직이는 모터도 마찬가지라는 이야기입니다. 일론 머스크는 스페이스X에서와 마찬가지로 로봇 옵티머스를 만들 때 로봇에 쓰이는 모든 부품을 스스로 설계해서 만들어 쓰고 있습니다. 그러니까 '지금 나와 있는 부품의 한계는 이거니까 이런 식으로 만들 수밖에 없다.'가 아니라, '로봇이 이런 능력을 갖춰야 하니까 이런 능력을 발휘하려면 이런 부품이 필요하다.'는 방식으로 접근하고 있다는 겁니다. 그 핵심, 로켓의 경우 엔진이지만 로봇의 경우는 핵심이 바로 액추에이터입니다. 기존의 모터가 작동하는 방식은 이렇습니다. 회전만 할 수 있는 모터에 톱니바퀴를 붙여서 여러 가지 다른 움직임을 만들어내는 거죠. 그런데 새롭게 개발되고 있는 액추에이터는 모터와 스프링을 잘 조합해서 '탄력이 있는 움직임'을 구현할 수 있습니다. 아래는 테슬라가 얼마나 이 액추에이터를 중시하는지 보여주는 동영상입니다.
데니스 홍 박사가 한 언론과 한 인터뷰의 일부를 가져와보겠습니다.
“인공근육 기술이다. 현재 전기로 작동하는 로봇은 전기 모터로 작동하며 힘이 세고 정밀하게 움직인다. 하지만 우리가 정말로 필요한 것은 동물 근육처럼 탄성이 있고 힘을 조절할 수 있는 구동기(액추에이터)다. 현재 개발 중인 휴머노이드인 ‘브루스’는 이런 인공근육을 장착한 로봇으로 막 뛰어다닐 수 있다.
요컨대, 보스턴다이내믹스는 이런 탄력 있는 움직임을 전기모터로는 구현하기 어렵다고 보고 유압식 구동방식을 채택한 거였는데, 지금 막 돌파구가 열리고 있는 겁니다. 여기에 배터리 기술의 비약적인 발전까지 더해지면서 인공근육(액추에이터)을 갖추고, 등산용 백팩처럼 생긴 배터리팩을 매지 않고도 5시간 동안 인간처럼 움직일 수 있는(현재 FIGURE가 제시하고 있는 사양) 새 로봇이 나오고 있는 겁니다. 데니스 홍 박사님은 이 기술을 공개하는 방향으로 프로젝트를 진행하고 있는데요, 그걸 기반으로 해서 새로운 액추에이터 기술이 급속히 발전하게 될 것으로 예상합니다. 메탄을 연료로 쓰는 로켓 개발이 확산되고 있는 것과 동일하게 말입니다.
은 무슨 말을 하시려는지 잘 알겠습니다. 그런데, 제 생각은 소장님 생각과 좀 다릅니다.
하 뭐가 다르죠?
은 인공지능 스피커에 'TV 틀어줘' 했는데 TV를 틀어주지 않고 엉뚱하게 라디오를 틀어주던가 아니면 아예 '잘 못 들었습니다.'라며 오작동을 일으킬 수 있잖아요? (하 그렇죠.) 그런데 팔과 다리, 몸을 가진 로봇이면 좀 다르지 않습니까? 저는 겁날 것 같은데요? 갑자기 오작동을 일으켜서 인간에게 위해를 가하면 어쩌죠? 아까 시나리오 대로라면 80대, 힘없는 노인에게 굉장히 위험한 일이 생길 수도 있지 않을까요? 작년 11월, 국내에서도 사고가 있었어요. 로봇의 센서가 잘못 작동해서 사람을 종이 박스로 오인하고 눌러서 숨지게 한 일이 벌어졌습니다. 소장님 기사 보셨죠?
하 네 봤습니다. 잘 지적하셨어요. 우리가 지금까지 얘기한 건 '새 로봇'의 특징을 소개하는 것이었잖아요? 새 로봇의 대중화가 먼 일이 아니라 가까운 미래에 일어날 일이라면요, 이런 변화에 따라서 산업 전반에 어떤 영향을 미치게 될지, 그리고 법적 제도적으로 어떤 준비가 필요할지도 생각해봐야 합니다. 더 이상 미룰 일이 아니라고 생각합니다.
( 다음 편에 계속 )
https://www.youtube.com/watch?v=U8cxZZ55slA
https://blog.naver.com/karipr/222310701955
https://www.chosun.com/economy/science/2023/12/14/4BSBVZ7KHZCSPATJ3VZ2W5OR4A/
https://www.youtube.com/watch?v=1xChD-gv_pc
https://biz.chosun.com/science-chosun/science/2023/01/25/HZ2TQJQJOVF5BFFVTVM6CJNUTY/
https://m.hankookilbo.com/News/Read/A2023110815210004537