매거진 Finding

You can make anything
by writing

C.S.Lewis

로봇이 사람의 표현을 이해할 수 있게 하는 멀티모달AI

by 임표정 Mar 18. 2025


자연스럽고 직관적인 사람과의 로봇 상호작용(HRI)을 가능하게하는 멀티모달 AI

Integrating multimodal signals in human-robot interaction: progress and future directions.


멀티모달 AI는 로봇이 언어적 표현과 더불어서 비언어적 표현 제스쳐, 시선, 표정 등을 더 깊은 이해를 돕습니다. 시각, 청각, 촉각  사람들은 대화할 때 표정, 제스쳐, 시선 등 다양한 비언어적 요소를 통해 의사소통을 합니다.


사람의 각각 다른 시선, 얼굴을 인식하는 AI

여러 사람들과 대화할 때

로봇이 여러 사람과 상호작용할 때는 더 복잡한 상황이 발생합니다. 한 공간에 여러 사람이 있을 때 로봇은 시각적 감각과 청각적 감각을 통해 누구와 대화를 이어가야 하는지 파악해야 합니다. AI는 각각의 참여자가 어디에 집중하고 있는지, 누구에게 말하고 있는지를 분석하며, 로봇이 중간에 대화를 방해하지 않도록 조정합니다.




참고한 컨텐츠

https://youtu.be/7CecvnN6mw8?si=axywtWrYRPZNPCSg

매거진의 이전글 사람과 로봇의 상호작용 패널 질의응답

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari