로봇 UX를 읽고 기억에 남는 것
몇 달 전 엔비디아가 2025 CES에서 엔비디아의 CEO 젠슨 황이 현실 세계와 상호작용 가능한 AI의 시대인 "피지컬 AI "를 다음 물결로 선언한 사실을 아마 모두 알고 계실 것 같다. 물론 엔비디아의 GPU 활용을 늘리기 위한 계산적 전략이고 "피지컬 AI"는 그저 마케팅 용어일 뿐이라는 비판도 있지만 지금까지는 디지털 영역에 국한된 AI 기술을 확장한다는 측면에서 분명 언젠가는 다가올 미래로 느껴진다.
나는 피지컬적인 상호작용에 관심이 많다. 디지털적인 상호작용은 그냥 재미가 없다. 게임이나 영화/드라마와 같은 엔터테인을 제외하면 말이다. 아마 양적으로는 피지컬 세계의 정보값이 디지털 보다 훨씬 많고, 질적으로는 더 많은 감각을 자극할 수 있어서 그런가 싶다.
이 책을 읽게 된 이유도 로봇이라는 피지컬적인 사물이 사람과 어떻게 상호작용하는지 궁금해서 읽게 되었다. 피지컬 한 제품들이 점점 더 지능화되어 간다. 좀 더 로봇에 가까워지고 있는 것이다. 근데 어라? 전자 제품과 로봇의 다른 점이 무엇일까? 가습기나 냉장고와 같은 일상 "기계"들과 다른 점이 무엇일까? 좀 찾아봤더니 로봇은 일정한 자율성을 가지고 [센서를 통해 세계를 감지 → 연산 판단 → 행동]의 작동 패턴을 가진다고 한다(ISO 8373, MIT의 로드니 브룩스(Rodney Brooks)). 이 지점에서 우리 일상의 여러 기계들은 점점 더 "로봇"처럼 발전해나가고 있다.
책에 대한 종합적인 감상을 정리해 보자면 감성적일 수밖에 없는 사람의 인지적인 특성을 잘 이해해야 한다는 것이다. 이를 기반하는 감정적인 신뢰 구축을 다양한 사례를 들어 설명해 준다. 사실 이런 부분들은 책을 직접 읽어서 봐야 좋고 나는 이 책이 나름 실용적으로 정리한 부분을 요약하는 식으로 글을 써보려고 한다.
대상의 역동적인 실존성과 사회적 교감 능력을 배제한 UX는 절름발이다
[7페이지]
책을 읽으며 유용했던걸 정리해보고 싶다.
탠저블 한 환경에서 [로봇-사람]이 상호작용할 때 고려해야 하는 부분을 나름 정리한 내용이 있어 나중에 사용할 수도 있을 것 같다.
물리적 대상과의 상호작용은 디지털 상호작용보다 고려해야 할 요소가 많다. 로봇 자체의 특징부터 상호작용 방법, 사용의 맥락과 주변 환경까지 고려 변수가 많을수록 견고한 제품을 만들 수 있을 것 같다. 책을 읽으며 느낀 것은 로봇 기술에 대한 사용자 경험이어도 기술에 중점을 맞추기보다 역시 사용자에 초점을 맞춰야 할 뿐만 아니라 오히려 더 중요하다. 또, 윤리적인 차원에서 기술의 발전 속 미래 환경 설계자로서의 디자이너의 역할을 강조한다.
하지만 이러한 내용은 책을 직접 읽어보기를 추천하고 나는 보다 실용적인 내용을 요약하고자 한다.
[목차]
1. 5단계 소셜 디자인 프레임워크
2. 우리가 제품과 맺는 핵심요소
3. 로봇의 표현 방식 정리 (빛, 움직임, 소리)
4. 센서와 액추에이터
5. 흥미로운 실제 사례들
1. 5단계 소셜 디자인 프레임워크
이 디자인 프레임워크는 사람과 감정적으로 상호작용하는 로봇을 설계할 때 고려해야 할 다섯 가지 핵심 요소를 단계적으로 정리한 프레임 워크이다. 가장 지협적이고 로봇 바운더리 안에서의 설명부터 범위를 더 외부로 넓히며 설명한다.
실재감(Presence)
로봇의 물리적 외형, 크기, 색상, 형태 등이 인간이 어떻게 인식하고 신뢰할지에 직접 영향을 준다.
로봇이 공간에서 '존재하는 느낌'을 어떻게 주는가?
외형, 질감, 크기, 빛, 소리, 존재감 있는 움직임 등
표현(Expression)
빛, 소리, 움직임 등을 통해 로봇이 감정을 전달하는 방식을 설계한다. 구체적 예시로 Simon 로봇의 ‘귀’ 디자인, 그리고 목소리의 ‘정직함(honesty)’에 대한 접근 등이 대표 사례임.
감정을 어떻게 시각·청각적으로 표현할까?
예: 눈 깜빡임, LED 색 변화, 음성 높낮이
상호작용(Interaction)
사람과의 반응 타이밍, 동작의 동기화, 반응의 명료성 등 효과적인 교류를 위한 상호작용 패턴 설계.
사람과 어떻게 ‘자연스러운 교류’를 할 수 있는가?
반응 속도, 간단한 질문-응답, 비언어적 신호
맥락(Context)
제품이 사용될 환경과 사용자의 심리 상태를 고려해 설계되어야 하며, 키오스크나 공항에서 경험할 수 있는 ‘실재감’과 ‘편안함’을 예로 들 수 있다.
로봇이 사용되는 장소와 상황은 어떤가?
가정, 병원, 학교 등에서의 상호작용 방식이 달라짐
에코시스템(Ecosystem)
로봇이 다른 제품, 서비스, 사람들과 연결된 생태계 속에서 어떤 역할을 수행하며 확장 경험을 제공할지를 설계한다.
로봇이 다른 기기, 사람, 서비스와 어떻게 연결되는가?
예: 음성비서, IoT 연동, 가족 구성원들과의 정보 공유
2. 우리가 제품과 맺는 핵심요소
로봇이 단순한 도구가 아닌, 인간과 정서적·사회적 관계를 맺는 존재로 인식되기 시작했다고 한다. 우리가 로봇이나 지능화된 사물과의 관계 맺기는 몇 가지 유형을 구분하고 포지셔닝(positioning) 하는 내용이 흥미로워서 다음과 같이 정리해 보았다.
관계적 특성
로봇은 더 이상 단순히 '작동하는 기계'가 아니라, 사람과 사회적 관계를 맺는 존재로 포지셔닝된다. 이 관계는 로봇이 수행하는 역할을 통해 결정되며, 사용자로 하여금 로봇을 사람처럼 대하게 만들 수 있다. 로봇이 어떤 역할을 수행하는지에 따라, 사용자는 그 로봇에게 특정한 태도와 기대를 갖게 된다.
호텔 객실청소부 : 물리적인 업무를 조용히 수행, 존재는 인식되지만 직접적인 감정 교류는 적음
집사 : 주인의 명령에 충실하며, 의식적인 ‘서비스 제공자’로 기능
바텐더 : 고객과 가벼운 감정을 교류하며 분위기를 형성
유모 : 정서적 안정과 돌봄을 제공하는 존재, 신뢰와 애착이 중요
감정적 특성
사람은 로봇과의 관계에서 감정적 의미나 애착을 투사하게 되며, 이때 로봇은 기술적 기계를 넘어서 감정적 오브제로 기능한다. 저자는 이를 네 가지 형태로 나누어 설명할 수 있다.
토템 : 힘과 니즈에 대한 잠재력 나타내며 어떤 힘, 신념, 자기 강화의 상징
부적 : 몸에 지니며 상징, 습관 조절
배지 : 자신의 정체성이나 소속감을 보여주는 상징
기념품 : 다른 누군가를 생각나게 해 (ex. 누군가가 준 시계 등)
3. 로봇의 표현 방식 정리 (빛, 움직임, 소리)
로봇이 감정이나 상태를 사용자에게 전달할 때 사용하는 주요 표현 수단은 빛, 움직임, 소리이다. 각각은 고유한 특성과 한계를 가지며, UX 설계 시 이들의 조합과 역할을 전략적으로 고려해야 한다.
빛 (Light)
빛은 로봇의 감정이나 상태를 ‘은근히’ 알리는 수단이며, 지속적이고 넓은 시야에서 효과적이다.
특성
선별적: 빛은 시야에 방해되지 않으며, 로봇 고유의 표현 영역으로 유지됨.
전체적: 로봇 전체를 밝히거나 특정 부위를 강조해 전체 형태와 감정 상태를 나타낼 수 있음.
지속적: 사람이 볼 때까지 계속 켜둘 수 있어 정보의 지속성이 있음.
장점
수동적이지만 직관적: 소리나 움직임보다 덜 방해되면서도 전달력 있음.
유연한 해상도: 단순한 컬러 블록뿐 아니라 애니메이션 표현도 가능.
시각적 한눈에 보기: 멀리서도 인식 가능, 단순한 상태 전달에 효과적.
움직임 (Motion)
움직임은 로봇에 생명감을 부여하고, 문화적 장벽 없이 사람들에게 직관적으로 메시지를 전달한다.
특성
주변적(peripheral): 직접 바라보지 않아도, 주변 시야에서 감지 가능.
풍부함: 움직임은 본능적이며, 더 ‘살아있는 존재’처럼 느껴지게 함.
맥락적: 같은 움직임이라도 사용 상황에 따라 다른 의미를 가짐.
보편성: 몸짓 언어처럼 문화에 구애받지 않고 전 세계적으로 이해 가능.
예시
고개 끄덕임 = 수긍
몸을 웅크림 = 불안
소리 (Sound)
소리는 즉각적이고 정서적이며, 가장 빠르게 사용자의 반응을 유도할 수 있는 표현 수단이다.
특성
즉각적 주의 환기: 단 몇 초 만에 사용자의 주의를 끌 수 있음.
인지 효율성: 짧은 시간에 명확한 메시지 전달 가능.
제작 용이성: 작은 부품으로 구현 가능, 회로기판 + 스피커로도 충분.
감정적 연결: 특정 사운드는 향수를 불러일으키거나 브랜드 강화에 효과적.
적용 팁
표현적 순간: 멜로디, 짧은 음악
기능적 피드백/경고: 짧은 음, 효과음
4. 센서와 액추에이터
사람과 제품 사이에는 "대화"가 필요하다. 현실적인 관점에서 이런 대화는 입력과 출력 시스템으로 주고받을 수 있다. 아래 표는 우리가 고려할 수 있는 입출력 방법들을 정리해 주었다.
센싱
1. 촉각
촉각은 우리가 제품과 가장 일반적으로 상호작용하는 방식으로, 단순한 버튼에서부터 복잡한 터치 센서에 이르기까지 손가락 끝을 이용한 의사소통 방식이다. 스위치는 두 개의 도선이 연결되거나 분리되면서 신호를 전달하는 기본적인 구조를 가지며, 제품을 설계할 때 이러한 단순한 온·오프 동작이 사회적으로 어떻게 받아들여지는지를 고려해야 한다. 예를 들어, 전등 스위치는 단순한 기능 이상으로 일상의 환경과 사용자를 연결하며, 사용자가 조명을 통제할 수 있다는 감각을 통해 심리적 안정감과 통제 가능성을 제공한다.
2. 버튼과 핸들
버튼과 핸들은 제품의 기본 작동기를 설계할 때 고려해야 할 중요한 요소이다. 이때의 핵심은 입력 방식이 단순한 온/오프인지, 아니면 연속적인 범위 값(예: 볼륨 조절, 온도 조절 등)을 입력하는지 판단하는 것이다. 이 선택은 사용자와 제품이 어떻게 상호작용할지를 결정짓는다.
디자인 연구자 빌 버플랭크는 버튼은 선택적 제어(예: 피아노 건반), 핸들은 연속적 제어(예: 슬라이더, 다이얼)로 설명한다. 물론 이 둘을 함께 쓰는 경우도 있지만, 제품이 요구하는 사용 방식과 사용자의 행위를 고려해 어떤 입력이 적절한지를 결정하는 것이 중요하다. 가령, 공공장소의 경우 서 있는 사람에게는 발로 작동하는 버튼이 적합할 수 있으며, 허리를 굽힐 필요 없는 버튼 디자인 또한 사용자 편의성을 고려한 적절한 선택이다. 또한 예로 든 Nest 온도 조절기의 경우, 제품 전면 전체가 연속적인 회전 조작(다이얼)으로 온도를 설정할 수 있게 설계되어 있어, 직관적이고 사용자 중심적인 조작 방식을 구현한 예이다. 즉, 버튼과 핸들 디자인은 단순한 입력 방식의 선택을 넘어서 사용 맥락, 편의성, 감성적 경험을 종합적으로 반영해야 한다는 것이 핵심이다.
3. 스위치
전통적인 스위치는 물리적으로 가까운 곳에 배치된 전선이나 회로를 통해 동작하지만, 센서는 특정 조건에 반응해서 작동하는 방식이라서 디자이너가 다양한 형태의 상호작용을 설계할 수 있게 된다. 예를 들어, 램프 전체가 스위치 역할을 하도록 디자인하거나, 컵받침 무게에 따라 불이 켜지는 시스템이 있다. 사람들은 이를 단순한 조작이 아니라 놀이처럼 즐기기도 한다. 또 센서는 진동이나 움직임을 감지해 음악 믹싱을 트리거하거나, 컵이 비었는지 여부를 감지해 자동으로 다시 채우는 시스템도 만들 수 있다. 심지어 새가 날아와 횃대에 앉을 때 자동으로 소리가 나도록 하거나, 물병에서 물을 따라 마시는 행동을 감지하는 시스템도 가능하다.
결국 핵심은, 센서는 단순히 스위치의 대체재가 아니라 사용자의 행위, 환경, 맥락을 감지하고 반응하는 새로운 인터랙션 수단이라는 점이다. 이걸 통해 사용자 경험을 풍부하게 만들 수 있다.
4. 듣기
1980년대에는 박수 소리로 기기를 켜고 끌 수 있는 ‘클래퍼(clapper)’가 광고에서 대중의 상상력을 자극했는데, 그때는 스위치 외에 다른 방식으로 기기를 조작하는 게 매우 신선하고 미래적인 개념이었다. 이런 상호작용은 비현실적으로 여겨졌지만 사실은 매우 실용적이고 필요한 기능이었다고 강조한다.
오늘날에는 아마존 에코, 구글 홈, 애플 홈팟 같은 음성 기반 장치들이 일상화되면서, 검색이나 미디어 제어, 스캔 장치 활성화 등 다양한 기능을 음성으로 수행할 수 있게 되었다. 우리는 여전히 박수 같은 단순한 소리로 기기를 제어할 수 있지만, 이제는 음성 인식 소프트웨어를 통해 훨씬 더 정교하고 세밀하게 작동할 수 있는 시대가 되었다. 특히 이메일, 문자 송수신처럼 음성 입출력이 동시에 필요한 상황에서, 개인화된 음성 제어는 매우 이상적인 방식이 됐고, 지향성 마이크의 보편화로 인해 특정 방향에서 음성을 인식해 다양한 기기를 효율적으로 제어하는 것이 쉬워졌다. 결과적으로 음성은 현대 상호작용 디자인에서 점점 더 보편적이고 바람직한 수단이 되어가고 있다.
5. 보기
입력이 빠르고 안정적으로 가능한 가장 단순한 형태의 초보적인 센서가 일반적인 제품 디자인에 적합하다고 말한다. 복잡한 센서를 사용할 경우 처리 능력 한계로 인해 과부하가 걸릴 수 있기 때문에, 가능한 한 단순한 센서를 활용하는 것이 효율적이다.
이와 관련해 광전지는 가장 기본적이고 저렴한 시각인식 방식으로, 빛의 양에 따라 저항값을 조절하는 방식으로 작동한다. 이는 회로 프로그래밍에서 의사결정 기준으로도 쓰이고, 예를 들어 일정 조도 이하일 때 자동으로 작동하는 시스템에 활용된다. 예시로는 태양열 정원 조명이 어두워지면 자동으로 켜지고, 필요하지 않을 땐 스스로 꺼져 에너지를 절약하는 기능이 있다.
5. 흥미로운 실제 사례들
책에는 상호작용 관련 다양한 사례들이 소개되는데 로봇뿐만 아니라 다양한 자동기계들이 등장한다. 그중 기억에 남는 예시 몇 가지를 정리하고 싶다.
조지아텍의 소셜 로봇 '사이먼(Simon)'
조지아텍(Georgia Tech)에서 개발한 사회적 로봇. 이 로봇은 사람과 자연스럽게 상호작용하는 방법을 탐구하기 위해 만들어졌다. 소리, 움직임, 제스처를 통해 인간과 소통하며, 사람의 주의를 끄는 법을 배우고, 심지어 사람이 자신에게 집중하는지 여부도 감지할 수 있다. 큰 머리와 동그란 눈, 그리고 감정에 따라 색이 변하는 LED 귀를 가지고 있다. 2008년에 처음 공개되었으며, 인간과 로봇의 상호작용(HRI) 연구에 주로 활용된다.
병원용 보조 로봇, Moxi
딜리전트 로보틱스(Diligent Robotics)에서 개발한 병원 보조 로봇. 이 로봇의 핵심 역할은 병원 내에서 의료진, 특히 간호사들의 반복적이고 비부가 가치적인 업무를 대신하여 그들이 환자 치료에 더 집중할 수 있도록 돕는 것임. 병원 곳곳을 자율적으로 이동하며 의료 소모품, 약품, 실험실 샘플, 리넨 등 다양한 물품을 수거하고 원하는 곳으로 배송한다. 간호사들의 업무 부담을 경감하고 효율성을 높이는 데 크게 기여한다.
자전거용 내비게이션 Hammerhead
T자형 디자인은 핸들바에 깔끔하게 장착되며, 내비게이션 방향을 시각적으로도 알려주는 역할을 한다. (예: 좌회전 시 왼쪽 끝에 불이 들어옴)
책을 다 읽고 떠오른 단편적 생각들
위 내용들은 책에 나온 비교정 실용적인 정보들이고 아래 정리한 것은 책을 읽으며 내 머릿속에 떠오른 중구난방 생각들이다. 개인적인 이야기도 있고 나름 쓸만한 것도 있지 않을까 해서 공유한다.
사회적 지능을 갖춘 더 인간다운, 인간을 더 이해하는 로봇이 왜 필요한가? (p8)
제품과 정서관계를 가지는 것을 정서적 약점이라 여기는 사람도 많다. 의도적 인터랙션을 늘릴 것(p19)
이 책 저자처럼 학계와 산업 둘다에 발을 얹고 싶다 (p30)
물리적 실재감을 주는 것은 왜? 좋은가? 인체에 관련된 활동이 가능하다고 하는데 설득력이 낮아 보임(p58)
호텔의 도어맨은 문만 여는 게 아니고 그들이 잘 왔고 환영받는다는 의미를 전달한다 (p63)
제품 의미론- PRODUCT SEMANTICS : 제품에 대해 인간이 만든 상징적 특성임. 디자이너는 심리적, 사회적, 문화적 맥락까지 고려해야 한다. 말을 걸어도 될 것 같은 “느낌”. 이 부분이 흥미로움 (p63)
소셜 어포던스 - 사회적으로 받아들여지는 여러 제스처들임. 제품이 전달하는 사회적 신호를 뜻하는데 이걸 기호학에 연결 지어 설명할 수 있을까?(p80)
사물과 인간의 상호작용은 대화 같은 자연어보다 주변시로 보는 깜빡이는 빨간 조명 등 더 “텔레파시적”인 것이 주류이다 (p88)
인간은 소리에 예민하게 반응한다. 매우 짧은 시간에도 그 노래를 인지할 수 있어- 조엘 베커먼 (p104)
인터랙션 디자이너의 역할은 제품과 사람 사이의 대화를 예측/구성하는 것이다 (p155)
일에 지속적인 동기부여를 가지려면 인간임을, 인간의 가치를 강화시키는 방향을 생각하고 고민해야 하지 않을까?