brunch

You can make anything
by writing

C.S.Lewis

by Andy Nov 26. 2024

AI 에이전트를 통한 인간행동 예측

페르소나, 행동경제학을 뛰어넘을 에이전트 기반 분석

최근 AI 기술의 발전은 인간 행동을 분석하고 예측하는 데 획기적인 전환점을 맞이했습니다. 스탠퍼드 대학교, 워싱턴 대학교, 그리고 구글 딥마인드 연구팀은 대규모 생성형 에이전트를 활용해 인간 행동을 85%의 높은 정확도로 예측하는 데 성공했다고 하네요. 이 연구는 사회과학 실험의 정교함을 크게 높이는 동시에, 인공지능 기술이 인류의 복잡한 행동 패턴을 모방하고 이해하는 능력을 증명했습니다.


인간 행동은 사회 정책 수립, 마케팅 전략, 심리학 연구 등에서 필수적인 데이터로 활용됩니다. 기존의 사회과학 연구에서는 실험을 통해 데이터를 수집하지만, 이러한 방식은 시간과 비용이 많이 들며 실험 규모에 한계가 있죠. 특히 복잡하고 예측하기 어려운 행동 양식을 이해하려면 기존의 방법론으로는 충분하지 않은 경우가 많습니다. 이에 따라 연구진은 생성형 AI를 사용하여 인간 행동을 더 정교하게 시뮬레이션하는 방법을 개발했습니다.


인터뷰 기록을 사용한 AI에이전트는 더 높은 정확도를 자랑한다. (arxiv)



스탠퍼드와 워싱턴 대학, 구글 Deepmid의 연구진이 공동으로 진행한 이 연구는 실제 개인을 기반으로 한 생성형 에이전트가 사회과학 실험으로 활용이 가능한지를 알아보는 것입니다. 이 시스템은 GPT-4o를 기반으로 작동하고, 인터뷰 대본은 OpenAI의 Whisper 모델을 사용해 텍스트로 변환한 텍스트를 기반으로 학습한 에이전트를 사용했습니다. 


연구팀은 이렇게 만들어진 에이전으를 일반적인 사회 조사(General Social Survey), 빅5(Big Five) 성격 평가, 행동 경제학 게임(Behavioral economics games)을 사용해서 테스트했습니다. 그리고, 실험결과 인구통계학적(Demographic)인 정보를 사용하는 Agent보다 훨씬 더 나은 정확도를 보였습니다. 




인구통계나 페르소나 보니 인터뷰기반 접근 방식의 정확도가 가장 높았다 (ArxiV)



기존 통계학적인 연구에서의 혁신적인 변화


① 데이터 기반 개인화


연구는 미국 인구를 대표하는 1,052명의 실제 참가자들의 행동과 응답 데이터를 수집하는 데서 시작되었습니다. 기존의 에이전트 기반 모델이 정형화된 규칙에 의존했다면, 이번 연구에서는 인터뷰 데이터를 통해 각 개인의 독특한 태도, 경험, 관점을 반영하는 에이전트를 설계했다고 합니다.  


심층 인터뷰: 2시간 동안 진행된 인터뷰는 참가자의 가치관, 문화적 배경, 의사결정 과정 등을 파악하는 데 초점을 맞췄습니다.


데이터 기반 시뮬레이션: 인터뷰 데이터를 기반으로 생성형 언어 모델(LLM)을 학습시켜, 인간과 유사한 반응과 행동을 보여주는 에이전트를 개발했습니다.



② 새로운 AI 아키텍처


기존의 사회 과학 실험에서 사용되는 모델은 일반적으로 간단한 인과 관계를 기반으로 한 규칙 중심 접근 방식을 사용합니다. 하지만 이번 연구에서 사용된 생성형 에이전트는 대규모 언어 모델(예: GPT) 기반으로 구축되어 복잡한 맥락을 이해하고 인간과 유사한 의사결정을 내릴 수 있습니다.


85%의 예측 정확도: 에이전트는 일반 사회 조사(GSS) 응답 예측에서 85%의 정확도를 기록했습니다. 이는 인간이 자신의 응답을 2주 후에 재현할 때의 정확도와 거의 동일한 수준입니다.


다양한 시뮬레이션 성공: 성격 특성과 복잡한 사회 실험 결과를 예측하는 데 있어서도 기존 방법보다 월등히 높은 정확도를 보였습니다.



인간의 행동에 대한 현실적인 예측이 가능해진다.


이번 연구의 가장 큰 성과는 에이전트가 단순히 데이터를 모방하는 것을 넘어, 인간의 사고 패턴과 유사한 방식으로 행동할 수 있다는 점입니다. 이러한 성과는 사회과학 연구의 패러다임을 변화시킬 수 있는 잠재력을 가지고 있습니다. 


이를 응용하면 사회정책(복지정책, 교육 개혁 등 새로운 변화)에 대한 인구 집단별로 각 집단이 어떻게 반응할지 시뮬레이션이 가능합니다. 또한 기업의 소비자 행동 이해를 위해 기존의 포커스 그룹 인터뷰와 설문, 시장 조사 등에 있어 마케팅 전략 수립 및 평가방법을 혁신하는 것도 가능합니다. 또한, 의료정책 수립에도 도움이 될 수 있습니다. 지난 팬데믹에서 백신 접종이나 격리 방안 시행 등에 있어 거부하거나 혼란이 야기되는 것을 사전에 막을 수도 있습니다. 


전통적으로 AI 모델은 특정 인구통계학적 그룹에서 편향된 결과를 도출하는 경우가 많았습니다. 하지만 이번 연구에서 개발된 에이전트는 다양한 인종 및 이념적 배경을 포괄하도록 설계되어, 그룹 간 정확도 편차가 현저히 줄어들었습니다. 이는 정책 연구나 윤리적 의사결정을 위한 AI 활용에 있어 큰 진전을 의미합니다.


그럼에도 불구하고 개인정보가 오용될 가능성을 더 높인다거나, 편향성이 완전히 제거되지 못하는 AI에 대한 안전장치 부재의 휘험성이 커진다거나, 선거나 미디어에 활용될 경우 잘못된 정치전략으로 활용될 가능성도 있습니다. 이는 AI에이전트의 가능성이 가져올 위험성도 비례해서 커지는 것에 대해 우리가 경계해야 한다는 결론으로 이어지죠. 여튼 이 연구는 단순히 이론적 모델을 제시하는 것에 그치지 않고, 실질적인 사회 문제를 해결하기 위한 도구로 활용될 가능성을 보여줍니다.



> 출처 : [2411.10109] Generative Agent Simulations of 1,000 People

              GitHub - joonspk-research/genagents (박준성님 멋지시당)



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari