심리평가도구의 디지털화 사례
빅데이터 열풍이 불면서 디지털 데이터에 대한 니즈를 많이 접하게 된다. 디지털 데이터는 시공간의 제약을 뛰어넘을뿐더러, 의식적으로 응답할 여지가 있는 설문조사/인터뷰에 비해 자연스러운 행동을 수집하기 때문이다. 앱 사용 데이터라던가, 웨어러블 디바이스를 통한 행동 데이터 습득 등은 모두 디지털 세상에서의 행동 데이터를 (왜곡 없이) 수집하려는 시도라고 할 수 있다.
그렇다면 심리학은 디지털 세상에서의 데이터 수집에 제 역할을 하고 있을까? 현재로서는 NO라고 감히 말하고 싶다. (현재 필자가 아는 범위 내에선) 만족스러운 디지털 마커가 존재하지 않기 때문이다.
심리학에서 전통적으로 사용하는 도구는 설문과 심리평가이다. 심리학자들은 이 도구들로 우리의 성격이나 창의성-보통 심리적 구성요소라고 한다-을 측정한다. 그러나 이런 도구들은 웨어러블 디바이스처럼 실시간으로 데이터를 수집하지 못하고, 실험실 혹은 임상 현장에서 사용할 수 있는 전산화된 도구로 제공되는 실정이다.
심리 데이터를 디지털 세상에서 수집하기 어려운 이유는 무엇일까? 필자가 생각하는 가장 큰 이유는 너무 많은 품이 들어간다는 것이다. 이는 마음의 본질이 추상적이기 때문이다. 마음은 눈에 보이지 않기 때문에 "정말로 원하는 내용을 측정하는가?"라는 확인이 필요하며, 일관적이어야 하고, 다른 사람과의 상대적 정도를 알기 위해 비교 준거를 마련해두어야 한다. 이러한 과정을 총칭하여 "검사의 표준화"라고 한다. 심리검사를 비롯한 공식적인 심리 측정 데이터들은 대부분 이 절차를 통해 타당성과 신뢰성을 입증해 왔다.
현재까지의 표준화된 심리검사는 오프라인 검사지가 많으며, 대부분 사람이 실시하게끔 구성되어 있다. 따라서 앱이나 디바이스에서 심리 검사를 구현한다면, 온라인 환경과 디바이스의 영향력을 감안한 새로운 검사 제작을 진행해야 할 것이다. 결과적으로 동일한 결과를 보여주는 측정치를 위해 더 많은 돈을 들여야 하는 셈이다. 이를 보면, 디지털 세상에 알맞은 심리검사가 단기적으로는 수지타산에 맞지 않는 것은 어쩔 수 없는 일일 것이다.
그럼에도 불구하고, 디지털 기기에서의 심리검사가 제공하는 편의성 자체는 분명한 이득이다. 따라서 임상이나 실험 현장에서 심리검사를 디지털화하는 작업이 조심스럽게 진행되고 있다. 가장 눈에 띄는 건 CANTAB과 NIH TOOLBOX라는 디지털 심리검사 도구이다.
CANTAB은 Cambridge 대학에서 시작하여 현재는 가장 유명한 디지털 심리검사 도구로 자리 잡았다. 다양한 연령대를 대상으로 표준화 절차가 완료되었고, 주의에서부터 정서에 이르는 다양한 영역을 측정하는 과제(task)를 제공한다. 타당성이 검증되었다는 점은 많은 연구자들이 CANTAB을 선택하게 만드는 요소로, 실제로 필자가 접하는 꽤 많은 논문들은 CANTAB을 통해 연구 효과를 검증하곤 했다.
NIH Toolbox는 iPad에서 구동 가능한 심리검사 도구로, YouTube를 통한 demo를 공개하고 있다는 것이 특이점이다. 두 검사 모두 기존에 실험실에서 존재하는 측정 과제를 온라인화했으며, 오프라인 검사 개발과 동일하게 표준화 절차를 진행했다는 특징이 있다 [1,2].
그렇다면 디지털 세상에서의 심리검사는 그저 오프라인 검사의 복제본일 뿐일까? 필자는 개인적으로 디지털 심리검사의 진정한 기여는 디지털 마커의 발굴이라고 생각한다. 디지털 마커란, 디지털에서의 행동 패턴을 통해 주의나 기억과 같은 능력을 확인할 수 있는 지표(index)를 의미한다.
최근 NIH Toolbox를 사용한 한 연구에서는, 디지털 기기에서의 심리평가 결과와 일반 신경인지검사의 결과가 유사한 패턴을 나타낸다는 것을 입증하였다 [3]. 이 논문의 결과는 매우 고무적이라 할 만하다. 적은 수(27명)를 대상으로 한 실험이지만, 디지털 심리검사의 유효성에 대한 가능성을 입증하였기 때문이다. 뿐만 아니라 논문에서는 키보드 입력 패턴에 대한 시계열 패턴 분석이라던가, 7일간의 연속 사용 패턴과 같은 새로운 마커를 분석하였다는 언급도 포함되어 있다.
심리학 전공자가 요구받는 역량 중 하나는 "마음을 확인할 수 있는 정보"를 제공하는 것이다. 이를 위해 전통적으로 소비자 분석을 진행해왔고, 데이터 종류가 많아지면서 심리언어학을 중심으로 텍스트 마이닝과 챗봇 등을 적용하고 있다. 그러나 글을 통해 측정하는 (비교적) 간접적인 정보 외에, 현재 능력을 직접적으로 확인하는 방법은 부족한 것이 사실이다. 만약 디지털 세상에서의 행동 패턴이 어떤 특성을 갖는지 검증된다면, 심리학 전공자들이 훨씬 더 풍부하고 다양한 해석을 내놓을 수 있을 것이다. 그 날이 어서 다가오기를 기대해본다.
출처:
[1] De Luca, C. R., Wood, S. J., Anderson, V., Buchanan, J. A., Proffitt, T. M., Mahony, K., & Pantelis, C. (2003). Normative data from the CANTAB. I: development of executive function over the lifespan. Journal of clinical and experimental neuropsychology, 25(2), 242-254.
[2] Heaton, R. K., Akschoomoff, N., Tulsky, D. & Mungas, D. Reliability and validity of
composite scores from the NIH Toolbox Cognition Battery in adults. J. Int. Neuropsychol
Soc. 20, 588–598 (2014).
[3] Dagum, P. (2018). Digital biomarkers of cognitive function. NPJ digital medicine, 1(1), 1-3.