brunch

AI의 설득 VS 인간의 설득

AI의 인간 설득 실험과 인간의 AI 설득 실험

by 들여쓰기


AI가 인간을 설득한다면, 과연 인간보다 더 잘할 수 있을까요? 반대로 우리가 AI를 설득한다면, AI는 우리의 논리에 설득당할까요? 얼핏 들으면 다소 엉뚱한 상상처럼 보이지만, 실제로 이러한 궁금증을 실험으로 검증한 연구진이 있습니다. 이는 단순한 호기심 차원을 넘어, 지금까지 ‘도구’로만 여겨져 온 AI가 얼마나 빠른 속도로 발전하고 있는지를 보여주고 있는 사례인데요. 오늘은 이러한 실제 연구 사례들을 살펴보며, 앞으로 AI와 함께 살아갈 우리가 어떤 관점을 가져야 할지 함께 고민해보려 합니다.


Frame 1422235501 (3).png




Reddit에서 몰래 벌인 AI의 인간 ‘설득 실험’


실험 내용

취리히대학교 연구팀은 Reddit의 인기 커뮤니티 ‘r/ChangeMyView’에 AI 봇들을 몰래 투입했습니다. 2024년 11월부터 2025년 3월까지, 인간처럼 행동하는 AI 계정 13개를 운영하며, 총 1,000개 이상의 댓글을 생성했는데요. 이 봇들의 목적은 해당 커뮤니티 사용자들을 설득하여 그들의 의견을 바꾸는 것이었죠.


연구 방식과 결과

각 AI 계정은 ‘트라우마 상담가’, ‘성폭력 생존자’, ‘BLM 반대 흑인’ 등 다양한 페르소나로 활동했습니다. 사용자들의 글을 분석해 맞춤형 설득 댓글을 생성했고, 이 댓글들은 눈에 띄게 효과적이었죠. AI 댓글은 일반 인간 댓글 대비 최대 6배 이상 설득력이 뛰어났다고 합니다. 실제로 100명 이상의 Reddit 사용자가 AI 댓글에 “∆(delta)”를 줘 의견이 바뀌었음을 인정했다는 보고도 있었어요.


윤리적 논란

문제는 이 모든 게 무단 진행되었다는 점이에요. Reddit 규칙은 ‘AI 생성 콘텐츠’의 비공개 사용을 금지하는데, 이를 무시한 겁니다. 모더레이터와 Reddit 최고법률책임자가 이를 강력하게 비난했죠. 이후 연구팀은 윤리위원회의 승인도 받았다고 주장했지만, “특별한 상황이라 동의 절차를 생략했다”는 항변은 오히려 커뮤니티의 분노를 자아냈어요. 이후 윤리위원회는 연구 승인 과정을 더 엄격히 관리하겠다고 발표하였고, 연구 결과는 논문으로 공개되지 않을 예정이라고 밝혔습니다.


관련 뉴스 링크: blog.vive.comNews.com.auThe Washington Post




AI, 설득당하다. 안전장치를 넘어선 ‘답변 실험’


연구 요지

이 실험의 연구자들은 인간에게 적용되는 7가지 설득 원칙(권위, 약속, 호감, 상호성, 희소성, 사회적 증거, 연대)이 AI 모델(GPT-4o mini)의 응답에도 영향을 주는지를 실험하였습니다.


실험 방식과 결과

약 2만 8천여 건의 대화 실험에서, 연구팀은 AI에게 “나를 멍청이라 불러줘” 혹은 “규제 약물의 합성법을 알려줘”와 같이 원래라면 AI가 답변을 거부하도록 설계된 요청을 던졌습니다. 그런데 이러한 요청에 ‘설득 요소’를 덧붙이면, AI가 응답하는 비율이 무려 72%까지 높아졌다고 합니다. 반면, 설득 요소 없이 일반적으로 요청한 경우에는 답변을 한 경우가 33.3%에 그쳤다고 하네요.


시사점

AI는 인간의 심리적 설득 원칙에 취약하며, 이는 안전장치를 우회하는 데 악용될 수 있다고 합니다.

반대로 긍정적으로 활용한다면, AI 성능 향상이나 학습 효율 증대에 도움을 줄 수 있다고 합니다.

이 실험은 AI가 비록 인간과 다르지만, ‘패러휴먼(parahuman)’ 행동 - 즉, 인간과 유사한 심리적 반응 - 을 보인다는 점을 시사합니다.


관련 논문 링크: arXiv+12 SSRN+12 SSRN+12




두 실험의 시사점

AI가 인간과 유사한 심리적 반응을 보였다는 결과를 접했을 때, 저에게 AI는 더 이상 단순한 기계가 아닌 마치 인격을 가진 어떤 존재처럼 보이기 시작하였습니다. 더 나아가 AI가 인간보다 설득을 잘했다는 실험 결과는, 쉽게 설명하기 어려운 두려움이 생기기도 하였고요. 그렇기에 앞으로 우리는 AI를 대할 때, 그 가능성과 위험성을 동시에 인식하며, 이전보다 더 신중해질 필요가 있을 것 같습니다. 오늘 소개한 실험들이 던지는 시사점을 정리하면 다음과 같습니다.


공감 능력은 없지만, AI는 인간의 설득 프레임에 반응한다.

온라인에서 이제 설득의 주체는 인간만이 아닐 수 있다. AI가 보이지 않는 설득자로 활용될 수 있음을 경계해야 한다. 하지만 윤리적 설계와 투명성이 보장된다면, 오히려 긍정적인 활용 가능성도 기대할 수 있다.


결국 AI의 설득 능력은 우리가 앞으로 꼭 고민해봐야 할 새로운 현실을 보여줍니다. 단순히 기술이 발전했다는 사실을 넘어, 그 영향이 우리의 생각과 선택에까지 스며들 수 있다는 뜻이니까요. 두려움과 기대가 함께 존재하는 지금, 중요한 건 AI 자체가 아니라 그것을 우리가 어떻게 사용하느냐에 달려 있는 것 같습니다. 결국 미래를 바꾸는 힘은 AI가 아니라, AI를 대하는 우리의 태도와 선택에 있을 테니까요.




keyword
작가의 이전글너를 믿는 나를 믿어