brunch

You can make anything
by writing

C.S.Lewis

by 박성준 Jun 11. 2019

상담자의 눈: 내담자의 반응 이해하기 -1-

기계는 심리상담을 이해할 수 있을까

총 세 편의 글에 걸쳐서, 이번 NAACL 2019에서 발표한 "Conversation Model Fine-Tuning for Classifying Client Utterances in Counseling Dialogues"을 다룹니다. 논문의 내용은 "https://www.aclweb.org/anthology/N19-1148" 에서 확인하실 수 있습니다.


아주 오래전부터 갖고 있던 아이디어가 만 2년에 걸친 작업 끝에 논문으로 완성되어, 지난 주에 열린 NAACL 2019에서 발표할 수 있었습니다. 본 연구는 심리상담 메신저 트로스트와의 협업을 통해 완성되었습니다. 

첫 번째 글에서는 이 프로젝트를 시작하게 된 배경, 초창기 목표 설정과 관련된 이야기를 다룹니다.



들어가며


21세기 들어서 심리치료와 상담은 심리적 문제를 해결하는 데 효과적이라는 수많은 연구가 발표되었지만, 아직도 심리치료 및 상담은 국내에서 많은 사람들에게 생소한 것으로 보입니다. 미국이나 유럽 등지와는 달리, 심리상담 혹은 심리치료가 일반인들 사이에서 널리 알려지지 않았을 뿐만 아니라, 이를 받는데 필요한 높은 비용과 시간적 부담, 심리적 장벽은 여전하며, 그리고 상담의 효과성에 대한 의심어린 시선 또한 존재합니다. 더불어, 전문 심리상담사에 대한 열악한 처우 문제 및 관련 제도의 미비라는 문제까지 얽혀있는 것이 현재 국내 심리상담 분야의 현실입니다.


심리상담이 필요한 사람들 중 대다수는 심리적 문제로 인해 일상생활에서 수많은 문제가 발생하고 있음에도 불구하고, 전문적인 심리상담 서비스를 찾지 않습니다. 이러한 현상이 발생하는 이유는 심리상담 서비스에 대한 접근성 차이에서 기인할 수 있습니다. 일반적으로 심리치료 및 상담 서비스는 비용 부담이 크고 장기간 지속되어야 하기 때문에, 이러한 금전적 및 시간적 비용이 장벽으로 작용하기도 합니다. 혹은 개인의 성향 차이일 수도 있습니다. 심리상담을 받았다는 사실로 인해 낙인찍히게 되는 것을 두려워하는 사람들은 이러한 서비스를 이용하는 것 자체를 꺼리게 됩니다. 이러한 수많은 장벽이 있음에도 불구하고 도움이 필요한 사람들이 여전히 많이 있다면, 어떻게든 이러한 장벽을 낮추어 더 많은 사람들이 심리치료 및 상담서비스를 통해서 건강한 심리상태로 회복될 수 있어야 할 것입니다.


그런데 현실은 그리 녹록치 않습니다. 상담사가 처한 환경을 살펴보면 문제는 더 복잡해집니다. 상담사는 내담자의 정서상태를 이해하고 수용하며 내담자가 가지고 있는 주관적 사고에 대해 직면시켜야 하지만, 이는 쉽게 되는 것이 아닙니다. 상담사는 충분한 에너지와 안정적 심리 상태, 그리고 심리상담에 대한 전문적 지식이 필요한데, 이를 갖추기 위해 오랜 기간에 걸친 공부 및 관련 임상 경험이 요구되지만 정작 이러한 역량을 갖춘 전문상담사에게 주어지는 반대급부는 턱없이 부족합니다. 대부분의 상담사들은 계약직으로 일하며 심리상담만으로는 최소한의 삶을 영위하기 어려운 수준의 대우를 받고 있습니다.


또 다른 문제는, 민간자격증 상담사의 난립으로 인해, 필요한 역량을 아직 갖추지 못한 상담사들이 이러한 서비스를 제공하곤 하는데, 일반인들은 어떤 상담사가 역량이 충분한지 판단하기 어렵습니다. 그래서 어떤 사람들은 이들이 제공한 심리상담 및 치료서비스에 대해 실망하곤 합니다. 이는 심리상담에 전체에 대한 인식 저하로 이어지는 문제가 있고, 그리고 인식 저하는 곧 잠재적 내담자들의 이러한 서비스에 대한 지불 의사를 낮출 것입니다.


최근 보건복지부가 오직 정신과 전문의가 하는 심리상담에만 건강보험을 적용한다는 정책을 발표한 것을 보면,이러한 문제를 해결하기 위해 제도적 지원을 이끌어내는 것 또한 요원한 일로 보입니다. 상담자의 처우 개선을 공론화할만한 토양 자체가 없을 뿐만 아니라, 올바른 상담 인식과 전문성에 대한 평가 및 관리 역시 체계적으로 이뤄지고 있다고 보기 어려운 것이 현실입니다. 이러한 교착 상태는 문제 해결을 어렵게 만듭니다.


그래서 이 프로젝트는 이러한 문제 인식에서 출발했습니다. 왜 심리상담이 필요한 사람들이 이러한 서비스에 쉽게 접근할 수 없었는지, 이러한 문제는 어디에서 비롯된 것이며, 왜 이러한 문제를 지금까지 풀기 어려웠는지 살펴보았고, 만약 이 문제가 개인의 노력이나 정치적/제도적 해결법으로 풀기 어려운 것이었다면, 효율적인 기술적 해결책을 통해서 풀어낼 수 있을지에 대하여 나름의 답을 찾고자 한 탐색 과정 중에 발표한 중간 결과물입니다.



심리상담과 자연어처리, 그리고 인공지능


이러한 고민은 최근 해외 임상심리학/전산학 관련 커뮤니티에서 공유되고 있고, 2010년대 들어서면서 심리치료에 대한 장벽을 허물기 위해 IT 기술을 접목하고자 하는 실험적 시도는 여러 곳에서 이루어지고 있습니다. 모바일 기반의 자활(self-help) 프로그램이나, Woebot과 같은 준-규칙기반(semi rule-based) 챗봇, 혹은 HCI 커뮤니티에서 많이 발표되는 스마트 기기를 동원한 치료적 개입 어플리케이션 등이 대표적인 예입니다.


그 중에서도 미국에서 큰 인기를 끌고 있는 것은 텍스트 기반 심리치료인데, 대표적인 예로 2013년 미국에서 창립된 문자 메세지 기반 긴급 상담서비스인 Crisis TextLine이 있습니다. 이는 비영리 단체에서 운영하는 무료 상담서비스로, 전문(licenced)/자원(volunteer) 상담사가 24시간 대기하며 미국 전역에서 지금 당장 도움을 필요로 하는 심리적 문제를 가진 사람들이 보내는 문자에 긴급히 개입(crisis-intervention)하기 위해 즉시 응답을 해줍니다. 이 플랫폼을 통해 지금까지 플랫폼을 통해 1억 건 이상의 문자 메세지가 발송되었고, 이는 고작 3년 만에 미국 전역을 커버하는 핫라인으로 성장했으며, 2019년 현재 이들은 미국을 넘어 영미권 및 영어 사용 국가(영국, 캐나다, 아일랜드, 남아프리카)로 진출하고 있습니다. 또한, 비슷한 시기에 설립된(2012) Talkspace는 전문(licenced) 상담사와 사용자(내담자)를 매칭시켜주는 유료 텍스트 심리상담 플랫폼으로써, 이제 미국 전역에서 수 백만명이 사용하는 상담 서비스로 성장했습니다.


텍스트 기반 심리상담은 비교적 사용이 간편하고 비용이 저렴하다는 장점이 있기 때문에 인기를 끌게 되었고, 서비스 운영자들은 플랫폼을 통해서 수집된 상담 대화록 데이터를 활용하기 위해, 기계학습 기반 자연어처리 기법에 관심을 갖기 시작했습니다. 이러한 데이터를 기반으로 이들이 무엇을 만들고자 했을지 생각해보면, 가장 먼저 쉽게 떠올릴 수 있는 것은 인공지능 상담사이지만, 이들의 선택은 그렇지 않았습니다.


그 이유는 기술적, 윤리적 한계 때문인 것으로 보입니다. 사실 현재의 자연어처리 모델 수준으로는 인간과 일상대화를 무리없이 하는 수준을 만들기조차 다소 버겁기 때문에, 이보다 난이도가 훨씬 더 높은 상담자-내담자의 역동을 다룰 수 있는 인공지능을 개발하는 것은 시기상조입니다. 물론, 일반적인 인공지능 기반 솔루션들이 택하는 쉬운 전략 중 하나는, 먼저 베타 버전의 서비스를 오픈하고 사용자의 데이터를 모으면서 모델을 학습시켜 성능을 향상시키는 방법이 있겠지만, 심리상담이라는 분야의 특성 상 이러한 접근법을 선택하는 것은 굉장한 위험부담이 따르고 윤리적으로 문제가 됩니다. 불완전한 인공지능 상담사를 섣불리 공개했다가, 혹여나 내담자에게 잘못된 영향을 끼칠 경우 돌이킬 수 없는 결과를 초래할 수 있기 때문입니다. 


또 다른 이유는 내담자의 동기입니다. 내담자는 기계가 아닌 사람에게 자신의 이야기를 털어놓고자 하는 욕구가 동시에 존재하기 때문에, 다소 긴 시간이 흐른 후에 이러한 인공지능이 등장한다 한들, 인공지능 기반 상담서비스가 정말로 잠재적 소비자의 니즈를 충족시키는 것인지에 대한 이슈는 의견이 분분합니다.


대신, 텍스트 기반 심리상담 서비스의 운영 주체 및 연구진들은 기계학습 기반 인공지능 상담자를 만들어 상담사를 대체하는 무리수를 두기보다는, 기계학습 모델과 상담사의 공존을 택했습니다. 오히려 반대로 이들은 기계학습 모델을 이용해 상담사를 효과적으로 도울 수 있는 방법을 찾고 있습니다. Crisis TextLine은 미국 전역에서 날아오는 문자 메세지를 기계학습 모델이 자동으로 내용에서 긴급한 정도를 추출하여, 대기하고 있는 상담사들이 보다 긴급한 메세지에 먼저 대응할 수 있도록 돕고 있으며, 2016년 TACL에 발표된 논문에 따르면 좀 더 효과적인 방법으로 내담자를 다루었던 상담자의 발화 전략을 분석하여, 어떻게 위기개입(crisis-intervention)에 대응하는 것이 좋은 지 다각도로 분석하였고, 이러한 내용을 축적하여 신규 자원(volunteer) 상담자교육에 사용하고 있습니다. Talkspace 또한 NAACL 2019에서 열린 Clpsych 워크샵에서 발표한 바에 따르면, 상담 접근법 별 대화전략을 두 단계에 걸쳐서 분석하고 관련 데이터셋을 구축하였다고 발표했습니다.


CrisisTextLine. (https://www.crisistextline.org/)


이러한 방식으로 심리상담 대화록에 기계학습을 접목하면 상담자에게 실용적인 도움을 줄 수 있을 뿐만 아니라, 학문적으로도 공헌할 수 있습니다. 텍스트 상담은 기존에 거의 연구되지 않았던 분야로, 전통적인 심리상담 기법 관련 연구에서 밝혀진 내용들이 똑같이 적용될 수 있는지는 아직 미지수입니다. 특히, 텍스트 상담 환경에서 상담자는 내담자의 비언어적 정보에 전혀 접근할 수 없기 때문에, 이러한 환경에서 상담자가 어떻게 효과적으로 심리상담을 진행해야하는지는 새롭게 연구되어야 할 주제로 학문적으로 큰 의미가 있습니다. 


그리고 연구 결과는 서비스에 접목되어 좀 더 많은 내담자들을 플랫폼 차원에서 소화할 수 있도록 하고, 상담자를 직접적으로 돕는 역할을 하게 되기 때문에 실용적인 의미를 동시에 갖게 됩니다. 이러한 선행 프로젝트와 얼마 되지 않는 선행연구 결과를 토대로, 이 프로젝트 또한 시행착오 끝에 기계학습을 상담 대화록에 적용하여 상담자를 돕고자 하는데 초점을 맞추게 되었습니다. 따라서, 이 프로젝트의 초창기 목표는 상담자에게 어떻게 실용적인 도움을 줄 수 있을지 고민했습니다. 그리고 상담자 인터뷰를 토대로, 상담자에게 지난 상담회기 요약을 자동으로 작성해서 제공하는 방식으로 도움을 주기로 결정했습니다. 


지난 상담 내용을 상담자의 관점에서 요약할 수 있다면 그 자체로 실용적인 의미가 있을 뿐만 아니라, 상담자의 효율적인 상담 진행에 큰 도움이 됩니다. 더 나아가, 상담자의 검수를 거친 요약된 정보를 토대로, 다음 상담 세션이 진행되기 전에 상담자와 약속한 내용이나 내담자의 상태 등 각종 상담 진행에 필요한 내용을 모바일로 알림을 주거나 수집할 수 있게 된다면, 상담자에게 부담을 주지 않으면서 내담자에게 좀 더 스마트한 텍스트 기반 상담서비스를 제공할 수 있는 토대가 될 수 있기 때문에, 지난 상담회기 요약은 매우 중요한 요소라고 보았습니다.


그러나 결론적으로 프로젝트 진행 과정에서 발생한 여러 가지 한계로 인해 상담일지 요약 생성이라는 목표까지 도달할 수는 없었습니다. 대신 우선 데이터셋을 상담자의 관점에서 바라보고, 상담자가 텍스트 상담을 진행할 때 중요하게 여기는 요소가 무엇인지 먼저 정립한 다음, 이를 내담자 대화에서 발견(detect)할 수 있는 모델을 만드는 것으로 목표치를 내렸습니다. 텍스트 상담 대화록에서 나타난 내담자의 언어적 반응에서 상담자가 보고자 하는 내담자 요인 및 주요 정보를 기계학습 모델이 잘 찾아낼 수 있다면, 이를 토대로 지난 상담회기 요약 작성(텍스트 생성)을 하는 모델은 차후에 개발할 수 있을 것으로 내다봤기 때문입니다.



전산사회과학 (Computational Social Science)


이 프로젝트는 임상 및 상담심리학과 전산학 그 어딘가 사이쯤에 위치합니다. 임상 및 상담심리학은 심리학의 세부 분야이고, 심리학은 사회과학의 분야 중 하나입니다. 그리고 이렇게 사회과학의 특정 분야와 전산학을 융합하는 연구분야를 통틀어 전산사회과학(Computational Social Science)이라고 부릅니다. 이 프로젝트는 단순히 기계학습 모델 개발로 끝나는 것이 아니라 연구로써의 완결성 또한 추구했기 때문에, 전산사회과학(Computational Social Science)이라는 상위 연구분야 안에서 이 연구가 어떤 의미를 갖게 되는지 또한 고려했습니다.


먼저 전산사회과학에 대해서 간략히 살펴보려고 합니다. 2009년 저명한 학술지 사이언스(Science)에 실린 전산사회과학(Computational Social Science)의 정의는 다음과 같습니다.


  "A field is emerging that leverages the capacity to collect and analyze data at a scale that may reveal patterns of individual and group behaviors"


즉, 전산사회과학은 개인/집단의 행동 패턴을 대량의 데이터 수집 및 분석에 기반하여 연구하는 것이며, 기존 사회과학 연구와의 차이점은 대량의 데이터 수집 및 분석에 있습니다. 일반적으로 심리학 양적 연구에서 사용되는 샘플 수는 100~200 언저리이고, 설문(심리척도) 결과를 기반으로 연구결과를 도출합니다. 그에 반해 전산사회과학 연구는 그보다 훨씬 많은 표본을 이용합니다. 초창기 저명한 전산사회과학 연구는 수십, 수백만 개의 (온라인) 소셜미디어 네트워크 정보를 이용한 사회학 연구가 주를 이루었습니다.


Computational Social Science (Science, 2009)


예를 들면, 위 그림은 정치 관련 포스팅을 게재한 블로그들 간의 네트워크를 분석한 결과를 시각화 한 것입니다. 이러한 전산사회과학 연구는 점차 다양한 사회과학 분야와 전산학적 방법론을 포괄하게 되었고, 기존 사회과학이 다루던 주제에 전산학적 방법론을 적용해보고자 하는 것으로 좀 더 범위를 넓혀가게 되었습니다. 위키피다아에 수록된 전산사회과학의 정의 또한 이와 유사합니다.


  "The academic sub-disciplines concerned with computational approaches to the social sciences."


이러한 연구의 예시로는, 사용자의 SNS 게시글에서 정치 성향을 예측하거나, 크라우드펀딩 플랫폼에서 어떤 팀이 펀딩에 성공하는지 살펴본 연구들이 있었습니다. 정치학, 경영학, 경제학 등 다양한 분야에 자연어 처리 방법론이나 기계학습 방법들이 적용되기 시작하였고, 2017년 이후에는 사람들의 고정관념이나 bias를 기계학습 방법론을 적용해 연구하는 주제가 각광을 받기 시작했습니다. 특히, 성별이나 인종 등과 관련된 편견(bias)의 양태, 그리고 그것을 어떻게 제거할 것인지가 매우 큰 이슈가 되고 있습니다. 이러한 흐름 속에서 이 프로젝트는 전산사회과학 연구로써, 임상/상담심리학 연구에 전산학을 접목한 연구로 포지션을 잡게 됩니다.




전산심리치료 (Computational Psychotherapy) : 임상심리학과 전산학의 경계


일반적으로 전산심리치료(Computational Psychotherapy) 연구 분야에서 진행되었던 대표적인 연구는 SNS 텍스트에서 자살 혹은 자해위험 예측텍스트 상담을 진행하는 상담자의 언어적 패턴 탐구와 같은 연구가 있습니다. 즉, 임상/상담심리학 혹은 심리치료 관련 주제를 전산학적 연구방법론을 이용해서 연구한 것입니다. 이 프로젝트 또한 전산심리치료 연구로 세분화할 수 있습니다.


구체적으로, 본 연구의 공헌은 다음과 같이 요약될 수 있습니다. 텍스트 기반 심리상담이라는 새로운 환경에서 적합한 내담자 요인을 무엇인지 사례개념화 연구방법론과 전산학적 연구방법론을 동시에 사용해 이를 재정립하고, 더 나아가 이러한 문제를 풀기 위한 전용 기계학습 모델을 디자인하고 학습시켜 실용적 의미를 동시에 갖도록 합니다. 


그리고 이러한 연구를 실제로 진행하기 위해서, 심리상담 메신저 트로스트와의 협업을 통해 적법한 절차를 거쳐 수집된 (내담자/상담자 모두) 익명화된 연구용 데이터를 확보하고, 한국과학기술원 IRB(생명윤리심의위원회)의 연구윤리 심의를 거쳐 승인을 받은 뒤 프로젝트를 진행하게 되었습니다.



(구체적인 연구 내용은 다음 글에서 이어집니다.)




매거진의 이전글 전이 학습 기반 NLP (2): ULMFiT
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari