brunch
매거진 Finding

대화속 사회적 정서를 다양한 방법으로 이해하는AI

더 신뢰할 수 있는 답변하기 위해

by 임표정


Multimodal analysis of the socio-emotional level in interactions, Chloe Clavel, INRIA




로봇, 대화형 AI 같은 시스템이 대화 상대방의 사회-정서적(socio-emotional) 맥락을 이해하고 적절히 반응하는 것은 자연스러운 상호작용을 할 수 있습니다. 다중모달(multimodal) 분석 기술이 이해하고 반응하기 위해서 중요한 역할을 합니다.


사회적 정서는 무엇인가?

사람은 대화를 나누는 동안 목소리 톤, 얼굴 표정, 제스처, 사용할 단어 선택 등을 통해 기쁨, 슬픔, 좌절 같은 감정을 표현합니다. 이런 부분들은 대화 상대방에 대한 신뢰, 공감대 형성에 영향을 줍니다. AI가 정서적 단서를 인식하고 이해하는 것은 자연스러운 상호작용을 가능하게 합니다.


다중모달 분석을 활용한 AI

AI가 대화의 맥락을 텍스트, 음성, 이미지, 제스처 등 다양한 형태의 데이터를 통해서 분석합니다. AI는 단순히 언어적 정보를 넘어서 비언어적 표현도 인지할 수 있습니다. 대화에서 상대방이 '괜찮아'라고 말했을 때,AI는 그 사람의 목소리 톤과 표정을 함께 분석해 실제로 괜찮은 상태인지, 아니면 감정을 숨기고 있는지를 판단할 수 있습니다.


AI 모델의 연구 및 적용

AI가 사회적 정서를 다중모달로 분석하기 위해서는 다양한 기술이 결합됩니다. 발표에서 대표적으로 규칙 기반 접근법, 지도 학습, 생성 모델을 소개했습니다. 대중 연설 교육 서비스에서 말하는 사람의 음성 톤, 제스처, 연설의 설득력 등을 분석해서 연설자가 자신의 능력을 향상시킬 수 있도록 돕고, 신경질환 환자의 감정 모니터링에도 활용되어 환자의 음성 데이터를 분석해 감정 상태를 파악하고 의료진이 적절한 치료를 제공할 수 있게 합니다.





참고한 컨텐츠

https://www.youtube.com/watch?v=vKOJLes-36Y&t=998s







keyword
매거진의 이전글사람들에게 친근한 AI로 변화