brunch

You can make anything
by writing

C.S.Lewis

현업에서 인간의 감정을 연구했던 똥통같은 나날들

완전히 잘못된 심리학 감정 이론 모델을 현업에 적용하면 생기는 일

의외로 IT업계에서 마케팅 또는 UX 관련 업무를 할 때 심리학 이론을 참조하는 경우가 많다. 애초에 마케팅이나 UX나 인간의 욕구와 감정에 깊게 관련된 분야이기 때문이다. 특히 감정에 대해 연구할 일이 많다. ‘사용자 경험이나 브랜드 경험 노출시 느끼는 감정을 탐지할 있는가? 또 탐지한 감정을 분류할 수 있는가?’, ‘로봇이나 인공지능에게 인간에게 분류된 감정을 부여하고 표현할 있는가?, 또 인공지능을 경험한 사용자의 감정에 대한 예측을 하고 좋은 감정을 끌어낼 방법이 있는가?’ 등등. 이런 질문들을 잘 정리해서 심리학의 본질적인 질문에 답변할 준비가 되어 있는지를 살펴 볼 필요가 있었다. 이를테면 다음과 같은 질문들이다.


1. 감정은 분류할 수 있는가? - 감정엔 프로토타입(또는 플라톤적 이데아, 또는 진화적 적응, 뭐든.)이 있는가?

2. 분류된 감정은 탐지가 가능한가?

3. 감정의 표현(표정)은 실제 감정과 연관되어 있는가?


지금까지 우리는 이 질문들에 대해 당연히 다음과 같은 답변을 했다. 1. 그렇다, 2. 당연히 그렇다, 3. 말이라고 하는가? 당연하다.


하지만 우리는 정말로 이 질문들에 대한 답을 아는가?




감정에 관한 UX 현업 과제를 예시적으로 살펴 보자. 우리는 스마트폰(아이폰, 갤럭시)을 써 보면서 느끼는 사용자의 다양한 감정의 발생 빈도를 각 브랜드 별로 비교해 보고 싶다. 검증하고 싶은 가설은 이렇다. 애플의 아이폰을 쓸 때 (그 특유의 갬성으로 인해) 사용자는 즐겁고, 유쾌한 감정을 느낀다. 삼성의 갤럭시를 쓸 때 (그 최적화되지 않은 버벅임을 느낄 때마다) 사용자는 짜증나고, 당황하고, 빡친다.


그리하여 우리는 1번의 문제에 대한 답변이 준비되어 있어야 한다. 감정은 분류할 수 있는가?


하지만, 감정은 정말로, 분류될 수 있잖아요? 행복, 슬픔, 분노, 두려움, 놀람, 졸림, 등등등. 모든 카테고리는 명확하고 순수하며, 혹시라도 복합적인 감정의 순간(예를 들어, 분노하면서도 슬픔에 빠진 복수자, 사랑하면서 동시에 증오하기도 하는 연인 관계 등등)이 있을지라도 통계적인 요인 분석(factor analysis)을 통해 순수한 정수와도 같은, 기하학적인 단일 감정의 벡터를 추출할 수 있지 않을까요?


이런 감정에 대한 모형을 만들려는 시도는, 심리학에서 성격을 아주 성공적으로 다섯 개의 요인으로 나눌 수 있었던 성격심리학의 Big 5 이론을 참조할 만하다. (대중 심리학이 아닌) 학문적 심리학에서, 성격이란 다섯 개의 축으로 만들어진 5차원 공간의 한 점이다. 그 다섯 개의 축이란 다음과 같다. 1. 경험에 대한 개방성 2. 외향성 3. 성실성 4. 친화성 5. 신경성. 모든 인간은 모두 이 다섯 개의 축 각각에 대해 값을 측정할 수 있고, 다섯 개의 값이 쓰여진 좌표값을 산출한다면 그것이 바로 인간 개체의 고유의 성격을 나타내는 벡터가 된다.

5차원 Big 5 성격 모델의 축소된 시각화. 세 가지 요인 (외향성, 개방성, 성실성)에 대한 고유의 성격이 공간에 매핑되었다. 나머지 두 개의 요인은 생략했다.


색채 지각 또한 훌륭한 심리학적 벡터 공간 모델이라고 할 수 있다. 심리학이라니 이상하게 들릴 지도 모르지만 원래 색채란 물리학적 속성이 아닌 심리학적 속성이며 심리학으로 연구되어야 한다. 빛은 단지 진동수와 진폭만을 물리적 속성으로 가지지만, 색채를 벡터 공간에 매핑하려 한다면 진동수, 진폭을 조합한 2차원 평면으로는 도저히 가능하지 않다는 사실을 깨닫는다. 즉 색채는 반드시 3개의 축이 필요하다. 기저 벡터를 정하는 방식에 따라 그 모델링은 여러 가지가 있는데, 한 가지 방법은 물리학적 속성에 하나의 가상의 축을 추가한 HSL(Hue-진동수, Saturation-물리적 속성 없음, Lightness-진폭)이 있다. 다른 방법으로는, 생리학적인 원리--세 가지의 색에 대해 각각 반응하는 원추세포--를 가진 RGB(‘빨강’, ‘초록’, ‘파랑’) 모델이다.


왼쪽: HSL 모델. 오른쪽: RGB 모델. 실제로 Saturation은 물리적 속성이 없는 건 아니고, 단일 진동수가 아닌 여러 진동수의 빛이 섞인 것으로 이해할 수 있다


우리는 감정에 대해서도 위의 아주 성공적인 두 가지의 벡터 모델처럼, 수학적이고도 아름다운 모델을 그릴 수 있을 것만 같다. 예를 들어, 다음과 같이 두 수학적 축을 바탕으로 만든 감정 모형을 쉽게 생각해 낼 수 있다.


Russell's Circumplex model

가로축은 valence라고 부르는, 부정적이거나 긍정적인 감정의 수치를 나타내고, 세로축은 arousal이라고 하는, 흥분 상태의 감정 정도를 나타내는 축이다. 연구자들은 이 모델을 바탕으로 수많은 인간의 감정을 분류해 보았고 대체로 성공했다. 예를 들어, 흥분(excied)라는 감정은 약간의 긍정적인 valence와 꽤 높은 arousal로 평면 상에 매핑된다. 일리 있다. 하지만 여전히 풀리지 않는 문제가 있었다. 이 모델의 문제는 두 가지가 있다.


1. arousal 축은 생리적 특성을 감지할 수 있으나, valence는 생리적으로 탐지할 수 있는 방법이 거의 없다.

arousal, 즉 흥분/각성 정도를 나타내는 축으로 여러 가지 생리학적 탐지 도구가 있다. 땀의 발생량을 측정하는 피부전도도, 심장 박동, 눈깜박임 정도, 그리고 뇌파의 델타파/알파파/베타파 비율을 통해 측정할 수 있다. (하지만 실험실에서 잘 측정된 생리학적 탐지 방법론이 실제 상황에서 잘 작동되지 않는 경우가 많다. 이에 대해서는 뒤에 언급하겠다.) 문제는 감정의 부정/긍정의 척도인 valence인데, 내가 알기론 어떤 생리학적 측정 방법론도 이 valence를 ‘정확히’ 측정해 주지 못한다. (하지만, 최근에는 좌우 반구의 비대칭성을 측정한 EEG에서 이 valence를 미세하게 구별할 수 있다는 연구가 있다. 아직은 가설 검증 중인 느낌이 크긴 하다.)


2. 공포(fear)와 분노(angry)는 좌표 상에서 거의 겹친다. 하지만 인간은 이 두 감정을 매우 다른 감정이라고 생각한다. 위의 그림에서는 fear와 angry가 표시되지 않았지만, 두 감정은 arousal와 valence가 거의 비슷한 정도의 특성을 가진 감정이라도 누구나 알 수 있을 것이다. (그러니까, 두 감정 다 높은 흥분도 arousal과 부정적인 valence를 가진다.) 아래 그림과 같이 fear와 angry를 구분하기 위해 세 번째 축을 설정한 모델도 있지만, 이렇게 함으로 해서 문제는 해결되는 게 아니라 더 심각한 상황에 처한다. 왜 fear와 angry는 새로운 축으로 3차원 공간의 위아래로 쪼개지면서, 다른 감정들은 나눠지지 않고 가만히 있을까?


감정의 세 번째 축, stance를 상정한 3차원 모형. fear와 angry는 각각 open stance와 closed stance로 나눠진다. Kim and Andre 2009


이밖에도 감정을 수학적인 공간에 매핑하는 식의 수많은 모형들이 있다. 하지만 성격이나 색채만큼 아주 그럴 듯하고 일리 있게 설명하는 모형은 지금까지 단 한 개도 없었다.


난립하는 감정 모형들. 색깔만 요란할 뿐, 어떤 모형도 성공적으로, 제대로 감정을 설명하지 못한다.




하지만 이 모든 것은 학계의 문제 아니던가? 우리가 아이폰과 갤럭시의 유저 테스트나 브랜드 선호도를 조사한다고 하면, 감정 모형이 얼마나 정밀하느냐는 크게 중요한 문제라고 생각되지 않는다. 모델이 얼마나 이론을 반영하는지에 따라 테스트 결과가 극적으로 달라질 리가 없다. 우리는 감정의 '심리학적 근원'을 탐사하는 박사과정-연구자가 아니다. 단지 '상식적으로 분류되는 유발 감정'을 표면적으로 조사하는 월급쟁이-연구자일 뿐이다. 그러므로 우리는 감정을 어렵게 무슨 좌표 공간에 벡터로 매핑하고 그런 짓거리를 할 필요가 없다. 감정이란 즉 '즐거움', '슬픔', '당황', '괴로' 등 '상식적으로 통용되는 분류'일 뿐이다. 예를 들어 '즐거움'이란, 제품을 사용할 때에 즐겁고 유쾌한 사용자 경험(UX)이고, '당황'은 제품 사용시 예상 못한 결과가 출력되었을 때의 불쾌한 사용자 경험이다. 이런 단순함이야말로 현업의 미덕이다. 좋다. 이제 사용자 조사를 시작하자.


이제 우리는 장소를 대여하고 두 가지의 스마트폰을 마련한다. 그리고 사용자의 감정을 탐지할 준비를 한다. 웬만하면 설문조사나 인터뷰는 배제하기로 한다. 감정이란 무의식적으로 이끌려 나오는 것이라, 이성의 필터를 한 번 거치는 '언어적 조사', 즉 설문이나 인터뷰는 편향의 가능성이 있기 때문이다. 그런데, 우리의 조사 방법론 중 설문조사와 인터뷰를 빼면 무엇이 남지? 우리는 언어적 방법 말고 어떤 방식을 통해 감정을 '탐지'할 수 있을까?


아니 애초에, 감정이 탐지가 가능한가? 바로 글의 처음 부분에서 제기했던 2번 질문인데, 우리는 답을 미리 내 버렸다. "물론이다!" 표정이야말로 실제 감정을 잘 드러내는 피탐지 매개물 아니던가. 우리는 상대방의 감정을 '표정'으로 안다. 그러므로 우리는 가장 무식한 방법으로 피험자의 얼굴을 잘 비출 수 있는 각도에 카메라를 놓고 촬영을 한다. 촬영 데이터는 당시의 최신 인공지능 솔루션인 '표정 분석 솔루션(몇천만원 상당)'을 통해 분석된다.

감정 탐지 솔루션의 예시. 삐빅, 당신의 감정은 표정으로 탐지되었습니다. 당신은 '놀람'을 87.5%, 행복을 11.4% 느꼈습니다.

하지만 비싼 돈 들여 구매한 표정 분석 솔루션에는, 사용자들의 무표정한 얼굴 모습만이 내리 촬영되었을 뿐이다. 왠지 모르겠지만, 이번에 참가한 사용자들이 전부 무슨 포커페이스들만 참석한 모양이다. 웃지도 않고, 화내지도 않고, 공포에 질리지도 않는다. 완전히 똥쓰레기가 된 동영상 데이터는 용량도 엄청 크다. 우리는 솔루션 업체에게 클레임을 걸었는데, 단지 다음과 같은 거지같은 이메일을 받았을 뿐이다. “이봐, 프렌드. 동양인은 표정 변화가 없어서 잘 안잡힐 수 있다네.” 그러면 뭐, 서양인들은 실험할 때 막 웃고 떠들고 울고 화내고 그런답디까?


다른 방법도 있다. 이른바 '뉴로마케팅'이라는 당시 혜성처럼 나타난 새로운 방법론이다. 우리는 피부의 전도도를 측정해 땀이 얼마나 발생하는지(즉, 얼마나 흥분하는지), 눈깜박임의 횟수를 재어 얼마나 집중하는지, 심장이 얼마나 빠르게 뛰는지(솔직히 이것들이 왜 '뉴로'마케팅인지는 모르겠다), 그리고 최고의 신기술인 뇌파 측정으로 뇌파가 얼마나 변화하는지 분석해 감정을 탐지하기로 했다.(그래, 이정도는 되어야 '뉴로'마케팅이지.) 이제 사용자들은 마치 사이버펑크마냥 온 몸에 측정장치들을 덕지덕지 붙인 채 조사에 임한다. 피부전도도(손목), 심박수(심장 근처에 위치한 몸통을 두르는 밴드), 그리고 뇌파 장비. 이 뇌파 장비는 의료용이 아닌 일반 사용자용으로 특별히 디자인된 최신 장비다.  장비의 세련된 자태는 멀리서만 봐야 한다. 가까이에서 직접 그 제품을 만져 보면, 싸구려 플라스틱으로 사출한 제품이라는 걸 대번에 알 수 있다. 하지만 우리는 이 최신 장비에 기대감을 걸었다. 감정이야말로 '이성'의 대척점이므로, 표정보다도 더 심원한 깊이에서 무의식적으로 솟아나오는 것이므로, '뉴로마케팅'이야말로 내면의 감정을 탐지할 최적의 도구가 될 것이다!


이딴 거추장스러운 걸 머리에 끼고 사용자 조사라...우습지만 당시엔 최선의 선택이었다

하지만 결과는 또 한번 처참했다. 사용자들은 땀을 딱히 흘리지 않았다. (아, 피험자가 땀을 무지막지하게 흘린 세션이 있긴 있었다. 에어컨을 틀자 금세 진정되었다.) 심장 박동은 이리 뛰고 저리 뛰고 했지만, 보통은 감정보다는 신체 움직임 - 예를 들어 화장실에 다녀 올 때 - 증가했다. 뇌파 데이터는 갖가지 오염물들로 가득했다. 눈깜빡임, 목 돌리기, 고개 끄덕이기, 말하기, 이 모든 근육 움직임이 섬세한 뇌파를 덮어썼다. 감정에 대한 뇌파는 피험자에게 시킨 과제의 이벤트와 싱크를 맞춰서 분석하기도 힘들었기 때문에, 뇌파의 특성이 이벤트를 '원인으로 가졌기 때문에' 발생했다고 하는 인과 관계로 설명하는 데 어려움을 겪었다.


우리는 이 모든 똥통같은 결과물에서, 감정의 탐지가 어려운 이유를 여러 가지로 설명하려고 해 보았다. 우선, 앞서서 말했던 솔루션 업체의 해답, 서양인 관점으로 바라본 동양인에 대한 평가가 있다. 동양인은 서양인보다 표정 변화가 적다. 그렇다면 우리는 영영 한국에서 사용자 조사를 수행하지 말아야 하겠군. 아니면, 실험실 상황 때문일 수도 있다. 우리가 '실험'을 했다고는 하지만, 이건 실험이 아니다. 이렇게 완전히 통제되지 않고 이것저것 물어보는 조사를 '실험'이라고 부르는 건 심리학 전공 출신으로 한없이 부끄럽다. 완전히 통제된 실험실 상황--근육 움직임 통제, 이벤트 싱크 후 뇌파 데이터 n>30으로 평균, 실험참가자의 종속 변인 통제와 무선 표집 등등--을 현업에서 제대로 구현할 수는 없다. 이러한 실험실 맥락 자체가 한없이 부자연스럽기 때문에, 사용자는 사용자 경험에 대해 완전히 다른 반응을 보일 수 있기 때문이다. 그렇다고 우리의 조사 상황이 완벽히 자연스러운 건 아니다. 말하자면 그 상황은 적당한 타협의 결과이다. 사용자는 자신의 폰이 아닌 걸 사용해 보고, 실험자에게 이것저것 캐물어진다. 이것만 해도 충분히 부자연스럽고 이러한 상황은 인간에게 자신의 감정을 숨기도록 강요될 수 있다. 동양인 특성과 부자연스러운 실험실 특성의 상호작용일 수도 있다. 동양인은 특히 실험실처럼 어색한 상황에 부닥치면 (그 놈의 유교적인 문화 배경 때문에) 감정을 완전히 꽁꽁 숨길 지도 모른다. 제 3의 가설도 있다. 우리가 탐지할 수 있는 감정의 범위는 극도로 격앙된 감정일 때에만 가능한데 스마트폰을 사용해 보는 등의 제품 경험은 인간의 극도로 격앙된 감정을 이끌어 내는 데에는 '너무 작은 자극'일 수 있다. 


이 수많은 '우리가 실패한 이유들'에 대한 가설적 검증은 당연히 이루어지지 않았다. 회사란 그런 것이다. 실패는 실패로 묻어 두고 성공한 것들만 자랑스레 성과로 주장한다. (우리는 실패에 대한 대비책으로, 설문조사와 인터뷰를 같이 수행 했다. 이것들은 웬만하면 어떤 결과든지 낸다.) 그로부터 10년이 지났고, 뉴로마케팅의 시대는 저물었다. 하지만, 우리는 물어야 하지 않을까? 감정이란 무엇인지, 인간이 브랜드나 제품 경험을 통해 느끼는 감정이 진정으로 무엇인지.  분명히, 인간은 감정을 느낀다. 그것이 제품/브랜드의 경험일지라도, 그 경험이 아주 미묘하고 작은 자극일지라도 그렇다. 그리고 그것을 탐지하기 위해, 우리는 이 물음에 감정에 대한 '본질적인 원리'를 정확하고 명징하게 알아야 했었다.


내가 인간의 감정에 대해 완전히 잘못된 전제조건을 설정하고 사용자 조사에 임했다는 것, 즉 글의 처음에 언급한 세 가지의 질문에 대한 답이 전부 '아니오'라는 사실을 알게 된 건 10년이 지난 후였다.


이 글은 다음으로 이어진다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari