brunch

You can make anything
by writing

C.S.Lewis

by 일상 속 심리학 Apr 13. 2020

빅데이터로 심리학 연구하기

심리학과 빅데이터를 잇는 살롱이 필요하다

심리학 전공자이자 빅데이터를 다루고 싶은 사람으로써, '왜 심리학과에서는 빅데이터를 다루지 않을까?'라는 질문에 답하지 못한지 오래 되었다. 순간적으로 떠오르는 해답은 학계의 게으름-교육 과정과 인력, 장비 등의 부족-이지만, 흔히 그렇듯 이런 생각은 틀리기 마련이다. 문제의 원인이 게으름이라면 노력 혹은 행동으로 해결할 수 있지 않겠는가? 모든 심리학계가 게으르지 않은데도 빅데이터를 사용하지 못한다면, 다른 이슈가 있다고 보는 것이 합리적이다.


최근 읽은 빅데이터를 이용한 심리학 연구 방법(김청택, 2019)라는 논문은 이 질문에 해답을 주는 내용이었다. 개인적으로도 인상 깊은 내용이 많아 간략하게 소개드리고자 한다.



심리학과 빅데이터, 세상을 보는 관점의 차이


심리학과 빅데이터의 가장 큰 차이를 꼽자면 무엇일까? 논문에서는 크게 학문의 목적과 문제에 대한 접근방식 차이-연구방법론이라 부른다-를 언급하고 있다. 특히 연구방법론의 차이는 두 학문의 서로 다른 목적에서 비롯되었다. 심리학의 목표는 인간의 행동을 이해하고 그 작동원리를 파악하는 것인 반면, 빅데이터 분석의 목표는,(기존의 데이터를 통한) 예측에 가까운 것이기 때문이다.


따라서 심리학은 '원리'를 밝히기 위해 주로 모형/이론을 통한 가설을 설계하고, 모형을 검증할 수 있는 '통제된' 환경을 설계해 변수를 수집하고, 이를 분석하는 작업을 우선시한다. 반면 빅데이터는 '자료가 스스로 말하게 하라(Let the Data Speak for Themselves)'는 구호에 걸맞게 수집된 자료를 설명하고 발견한 규칙적 패턴을 통해 예측하는 작업을 우선시하게 된다. 즉, 심리학은 모든 연구 모형과 측정변수, 검증방법을 사전에 설계한 후 자료 수집과 분석을 진행하는 모형 주도적 분석(model-driven analysis)을, 빅데이터 분석은 자료를 먼저 수집하고 자료의 패턴을 통해 가설을 설정하고 분석하는 자료 주도적 분석(data-driven analysis)을 선호한다.


심리학과 빅데이터의 접점은 가능한가?


그러나 심리학의 학문적 정체성과 목적이 분명하더라도, 빅데이터를 언제까지나 무시할 수는 없기 마련이다.

논문에서는 심리학의 틀에서 빅데이터를 활용할 수 있는 방법으로 크게 3가지를 제시하고 있다.


첫째 방법은, 빅데이터의 자료주도적 방법(자료에서 패턴을 찾아내어 설명하는 방식)을 심리학에서 수용할 수 있는 길을 찾는 것이다. 그러나 이 방법은 심리학에서 추구하는 인과관계를 확인하는 방법이 아닐 뿐더러, 연구자의 사후설명이 개입된다는 점에서 바람직하지 않다.


둘째 방법은, 빅데이터에 모형 주도적 방법론,  이론에 의해 모형을 만들고 빅데이터를 이용하여 이를 검증하는 것이다. 이는 매력적이지만 한계점이 존재하는데, 비용과 크기 측면에서 비효율적일 수 있다는 것이다. 특정 이론을 바탕으로 수집한 빅데이터는 (필요 이상의) 데이터를 수집한 것에 불과할 수 있기 때문이다.


셋째 방법은, 심리학 혹은 사회과학에서 빅데이터 이용의 유용성을 탐색적 분석에서 찾는 것이다. 심리학의 모든 연구가 모형/이론에서 출발하는 것은 아니다. 설문지를 통한 탐색적 연구를 진행하기도 하고, 인터뷰를 통한 질적 연구를 수행하기도 한다. 이런 방식은 기존 심리학에서 현상을 파악하기 위해 종종 사용하는 접근법으로, 최근에는 COVID-19가 세계 사람들의 삶과 문화에 미치는 영향에 대한 설문 조사가 진행되기도 하였다.



심리학도가 갖춰야 할 빅데이터 분석 역량


위에서 언급한 세 가지 방법론은 일종의 철학으로, 빅데이터라는 파도 속에서 중심을 잡기 위한 부표 같은 역할을 수행할 것이다. 특히 빅데이터를 통한 탐색적 분석의 경우, 이후 특정 모형/가설을 설계하거나 지표 정의를 위한 기본 자료라는 점에서도 중요하다. 막상 심리학도들은 연구환경을 제외한 상황에서 데이터를 마주하면 할 수 있는 역할이 적은 편이다. 따라서 빅데이터를 통한 다양한 탐색적 분석을 시도해봄으로써 이후 '이유 있는 가설'을 설계하는 역량을 키워나갈 필요가 있다.


다음으로 중요한 것은 심리학도들이 활용할 수 있는 빅데이터의 종류를 파악하고, 관련 인공지능 활용 능력을 꾸준히 갖춰나가야 한다는 것이다. 그 대표적인 분야가 텍스트 분석(Text Mining)일 것이다. 텍스트는 대표적인 비정형 데이터로써, 글을 통해 인간 심리에 대한 이해를 높이려는 노력은 옛날부터 이어져 왔다. 최근 등장한 주제 모형화(topic modeling)이나 잠재 의미 분석(Latent Semantic Analysis, LSA)과 같은 기법은 SNS 텍스트에 대한 접근과 분석을 용이하게 만들어주었다. 이외에도 기계학습이나 딥러닝 같은 분석 기법들을 배워나갈 수 있다면, 심리학도로써 운신할 수 있는 폭이 증가할 것이다.



문제는 여전히 So What, 심리학도 살롱이 필요하다


마지막으로 말하고 싶은 것은, 심리학도가 빅데이터를 다루는 방법을 '어떻게' 배울 수 있는지에 관한 것이다. 아쉽게도 필자가 졸업한 곳은 빅데이터의 활용 분야에 대해서 매우 '느린' 교수법을 가지고 있었다. 아직 '심리학 연구'에는 빅데이터가 본격적으로 사용되지 않기 때문에, 대부분의 심리 대학원은 SPSS와 같은 단순화된 분석 도구에 만족하고 있다. 그러나 단언컨대, 이런 교육 수준으로는 학교 밖 세상에서 요구하는 수준을 절대 만족시킬 수 없다.


이를 해결하기 위해 필자는개인적으로 패스트캠퍼스와 같은 온라인 교육들을 수강하고, 코세라와 같은 무료 온라인 플랫폼을 활용하고자 노력하고 있다. 그러나 이런 교육들은 도메인 날리지(Domain Konwledge)가 생략되어 있기 때문에, 심리학을 활용하고자 하는 갈증에는 2% 부족한 편이다.


따라서 결국엔 심리학을 접목시킨 다양한 경험담이 수집되어야 한다. 빅데이터에 전공 지식을 적용하기 위해 어떤 난관이 있었는지, 학교에서 배운 인사이트는 분석에 어떤 식으로 활용되었는지, 이 과정에서 도움을 받은 철학이나 사례는 무엇인지 등에 대한 정보가 있어야 할 것이다. 이런 작은 case study들에서 심리학의 영역이 확장될 수 있지 않을까 생각해본다.



출처: 김청택 (2019). 빅데이터를 이용한 심리학 연구 방법. 한국심리학회지: 일반, 38(4), 519-548

작가의 이전글 온라인 세상에서 우리 마음 읽기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari