100% 가사노동 해방을 위한 Embodied AI -혠작가
스마트홈, 홈 오토메이션이라는 컨셉이 나온 지 40년도 넘었다는 사실 아시나요? 그렇지만 스마트홈은 아직 우리의 일상에 깊숙이 침투하지 못했습니다. 아직 할 수 있는 것은 전등이나 에어가전을 켜고 끄며 환경을 쾌적하게 설정해 주는 것에 머물러 있습니다. 좋기는 하지만 큰 차이는 아닌 거죠.
세탁기가 도입되고 확산되었을 때 여성이 노동에서 해방되면서 사회에 진출할 수 있었습니다. 이 정도의 임팩트를 가진 변화는 결국 휴머노이드와 Embodied AI가 될 것입니다. 가전제품이 아무리 발달하더라도 소화할 수 없는 많은 여집합의 가사노동 (다림질하기, 옷 서랍에 정리하기 등등)을 모두 소화해 줄 테니까요. 단, 자유도 높게 실행하는 몸을 가졌다면, 거기에 맞는 감각과 머리를 갖춰야겠죠.
주요 회사의 휴머노이드 데모를 보면 물리적인 몸의 동작 기술은 이미 높은 수준에 도달한 것으로 보입니다. 춤을 추거나 격투기를 하는 재밌는 영상도 많지만, 가장 많이 시연되는 것들이 앞에서 언급한 다양한 틈새 집안일들입니다.
1. 네오 감마 - 1X Technology
홈 휴머노이드 관련 가장 자주 회자되는 1X의 네오 시리즈입니다. 빨래 바구니 운반, 청소기 돌리기, 택배 받기, 액자 수평 맞추기, 창문 닦기, 전기포트 켜고 옮기기 등등 수월하게 해냅니다. 사람들과 접촉이 많은 만큼 따뜻한 패브릭 질감을 입힌 디자인이 눈에 띕니다.
2. 헬릭스(Helix) - Figure AI
한때 사과 집기 데모로 업계를 평정했던 Figure AI의 헬릭스입니다. 다소 느린 속도를 보완하기 위해서인지 둘이서 협동하는 데모 시연이 인상적입니다. 물건을 뜯어서 냉장고를 열어 선반에 정돈하는 데모를 보여주었습니다.
이 외에도 테슬라 옵티머스 역시 요리, 다림질, 쓰레기 비우기 등등 집안일을 해내는 시연 종종 보여주고 있습니다. 하지만 이 영상들을 처음부터 끝까지 보신 분들이라면, 화려한 데모영상의 한 장면을 보는 것과 실생활에서 휴머노이드를 활용하는 것에는 분명 간극이 있을 것이라는 인상을 받으셨을 수도 있습니다. 종종 사람들이 아주 긴 지시를 내리는 모습들이 포착되거든요.
Embodied AI는 '몸을 갖추고 행동하는 인공지능'입니다. 챗GPT는 똑똑하지만 아직까지는 화면 안에서만 존재하죠. 하지만 Embodied AI는 인지, 추론, 이동, 실행까지 모든 걸 갖춘 존재입니다. 인간처럼 환경을 오감으로 이해하고, 상황에 맞게 판단하고, 실제로 행동까지 합니다.
기존 스마트홈은 기본적으로 직접 지시를 받아 움직였습니다 ("불 켜줘", "음악 틀어줘"). 하지만 Embodied AI는 명령 기반에서 맥락 기반으로 완전히 패러다임이 바뀌어야 합니다. 자유도가 높아진 만큼 할 수 있는 일의 가짓수는 기하급수적으로 증가하게 되는데, 이걸 일일이 다 시킬 수 없게 되기 때문이죠. 즉, 포괄적으로 기능하기 때문에 자체판단이 더 중요하게 될 것입니다.
뿐만 아니라 어떤 행동을 하고 난 후에 사용자별로 나타나는 피드백 반응 또한 잘 캐치해서 섬세하게 반영할 줄 알아야 합니다. 말투, 표정, 시간대, 분위기 같은 사회적 맥락, 이른바 '눈치'를 갖춰야 할 것입니다. 눈치 없는 휴머노이드에게 상황마다 지시하며 시간을 보내게 되면 결국 '이럴 바에 내가 하겠다' 순간이 오고 말 테니까요. (챗GPT 프롬프트를 고쳐 쓰고 고쳐 쓰다 '그냥 내가 하겠다' 해보신 분들, 기시감이 있지 않으신가요?)
"내가 퇴근하기 바로 전에 불 좀 켜줄래..?"
이 부탁을 누군가에게 들었다고 생각해 보세요. 여기에는 수많은 암묵적 정보가 담겨있습니다. 퇴근 후 피곤한 상태, 어둠에 대한 불편함과 쓸쓸한 기분, 너무 빨리 불이 켜지면 나갈 전기세에 대한 걱정까지... 이런 행간의 맥락을 읽어내는 게 바로 LLM의 역할이 될 것입니다. 행간을 읽어야 저변의 니즈를 잡아낼 수 있고, 지시받지 않았지만 필요하면서도 적합한 행동을 수행할 수 있는 거죠. 사용자의 감정·루틴·습관을 언어와 상황으로 해석하는 AI가 있어야 Embodied AI의 '머리' 역할을 할 수 있거든요.
결국 집에서 함께 생활하는 휴머노이드의 완성은 최대한 많은 정보를 손실 없이 수용할 수 있는 정밀한 센서 + LLM의 의도추론 + 사용자별로 누적된 기록(기억) + 섬세한 행동의 조합으로 이루어질 것입니다. 단순히 수행을 잘한다고 해서 좋은 휴머노이드가 될 수는 없는 것이죠.
우리가 챗GPT와 같이 온라인에서 생성형 AI를 쓸 때는 목적이 특정되어 있습니다. 시키는 일을 찰떡같이 해오면 그걸로도 충분한 만족감을 느끼게 됩니다. 그러나 가정용 휴머노이드와 Embodied AI는 '생활'이라는 거대하고 복잡한 콘텍스트 안에서 말하지 않은 것을 읽고 판단하며 움직일 수 있어야 합니다.
살피고, 묻고, 헤아려서 돌보는 사람의 능력을 우리는 '배려'라고 합니다. 조만간 배려를 갖춘 휴머노이드와 생활하며 자잘한 집안일에서 벗어나 그리스 로마의 귀족처럼 삶의 본질을 고민하며 살 수 있는 날도 오지 않을까, 빨래를 개키며 상상해 봅니다.