brunch
매거진 번역한 것

챗GPT가 뇌에 미치는 영향

에세이 작성 시 AI의 도움을 받는 경우의 인지 부채 누적

by 제이드

* 6월에 발표되어 큰 반향을 일으킨 MIT 미디어 랩의 논문 내용 발췌 및 정리

* 원문은 여기






unseen-studio-s9CC2SKySJM-unsplash.jpg


챗GPT가 뇌에 미치는 영향: 에세이 작성 시 AI의 도움을 받는 경우의 인지 부채 누적


지난 6월 MIT에서 거대 언어 모델(Large Langauge Model, LLM) 즉 AI를 사용하였을 때 인지 부채cognitive debt와 비용이 쌓여 학업 성취에 문제가 있을 수 있다는 연구 결과를 발표하였다.

해당 연구는 LLM을 사용한 그룹, 검색 엔진을 사용한 그룹, 본인들의 두뇌만(다른 도구를 사용하지 않음) 사용한 그룹으로 실험 참가자들을 나누어 에세이를 작성하도록 하였다. 그런 뒤 네 번째 세션에서 LLM 그룹에게 다른 도구를 사용하지 않을 것, 반대로 두뇌만 사용한 그룹에겐 LLM을 사용할 것을 요청하였다. 세 번째 세션까지는 54명이 참여하였고, 이 중 네 번째 세션까지 마친 참가자는 18명이었다.


실험진은 참가자들의 인지적 참여 정도cognitive engagement와 인지 부하를 평가하고, 에세이를 쓰는 동안 신경이 활성화되는 정도를 더 잘 알아보기 위해 뇌파 검사(EEG)로 참가자들의 뇌 활동을 기록하였다. 자연어 처리(NLP) 분석도 진행하였고 각 세션 이후 참가자들을 인터뷰하였으며, 인간 선생님과 특별히 제작된 AI를 이용해 참가자들의 에세이를 평가하였다.


그 결과 각 그룹 내에서 개체명 인식Named Entities Recognition, n-그램(텍스트 문서에서 연속되는 항목 n개의 집합), 주제 온톨로지에서 일관된 동질성이 나타났다. 뇌파 검사에서는 각 그룹이 매우 다른 신경 연결 패턴을 보여주었는데, 뇌 연결성이 외부 지원을 받는 정도에 따라 조직적으로 줄어들었다. 즉 두뇌만 사용한 그룹에서 가장 강하고 넓은 범위의 (신경적) 네트워크가 나타났고, LLM을 사용한 그룹은 전체적으로 가장 약한 결합도를 보여주었다.


네 번째 세션에서 두뇌만 사용해야 했던 기존의 LLM 그룹의 신경 연결성은 더 약해졌고 알파와 베타 네트워크 참여도도 떨어졌다. 반면 두뇌만 사용하다 LLM을 사용하게 된 그룹은 기억을 더 잘 떠올렸으며 후두부와 전두엽 집합이 광범위하게 (과업에) 다시 참여하는 형태를 보였는데, 마치 시각적 처리를 지원하는 듯한 이런 모습은 검색 엔진 그룹에서 종종 포착된 것과 비슷했다. LLM 그룹은 에세이를 자신의 것이라고 의식하는 정도ownership가 낮았고, 검색 엔진 그룹, 두뇌만 사용한 그룹 순서로 높았다. LLM 그룹은 몇 분 전에 작성한 에세이 구절도 잘 인용하지 못했다.


처음 LLM을 사용하는 것의 이점은 초반에는 명백하였으나 네 달간 실험해 보니 LLM 그룹 참가자들은 신경적, 언어적, 성적에서 모두 두뇌를 사용한 그룹보다 뒤떨어졌다. 이를 바탕으로 연구진은 LLM, AI 사용이 학업 능력을 저하할 수 있음을 시사하였다.


실험 내용을 자세히 살펴보면 다음과 같다. LLM 그룹의 경우 첫 번째 세션부터 에세이에 대한 주인 의식이 떨어졌고 본인들의 에세이를 제대로 인용하지 못했다. 두 번째 세션에서는 조금 나아지는 듯했지만, 3번째 세션에서는 공을 제대로 들이지 않고low effort 대부분 복사-붙여넣기로 에세이를 채웠으며 작성 내용이 기본적인 챗GPT 답변과 크게 다르지 않았다. 그러다 LLM을 사용하지 않게 된 4번째 세션에서는 내용 통합 수준이 좋아지고 기억을 떠올리는 정도도 좋아졌다.


반면 두뇌만 사용한 그룹의 경우 에세이가 조금 더 짧긴 했으나 작성한 글에 대한 주인 의식이 뛰어났으며 인용도 잘했다. 모든 뇌파에서 견고한 연결성이 나타났고 세 번째 세션에서는 베타파 연결성이 최고점을 찍었다. LLM을 사용하게 된 네 번째 세션에서도 기억을 회상하는 수준은 높았으며, 뇌 연결성 또한 세 번째 세션 수준까지는 미치지 못했으나 첫 번째 세션에서 관찰된 기본값까지 떨어지지도 않았다.


연구진은 가장 놀라운 결과로 두뇌만 사용하던 그룹이 LLM을 사용하게 되고 나서도 LLM 그룹보다 신경 연결성이 높다는 점을 꼽았다. 이는 AI 없이 글쓰기를 한 이후 AI를 활용해 에세이를 다시 쓰면 뇌의 네트워크 상호작용이 더 넓어짐을 뜻한다. 반대로 LLM을 사용했던 그룹은 두뇌만을 사용하게 되었을 때도 뇌파 활동이 조직화되는 정도가 낮았다. 비록 AI와 인간 교사에게 모두 높은 점수를 받았다 하더라도 LLM 그룹의 에세이는 개체명 인식과 n-그램 사용 차이가 좋은 수준은 아니었다. (부연 설명: 개체명 인식이 적게 나타난다는 건 명사가 반복적으로 많이 등장하지 않아 글이 자연스럽다는 것, n-그램이 적다는 건 문장 패턴이 복잡하고 다양하다는 것. 즉 사람이 쓴 글은 개체명이 많이 반복되지 않으며 n-그램 지표가 낮음.)


결론적으로 AI 사용은 인지 발달, 비판적인 사고, 지적 독립성 등에 잠재적으로 큰 영향을 끼칠 수 있으며, AI가 제공하는 편리함에는 인지적 비용이 따른다.





갈수록.. AI가 현 인류에게는 너무나 과한 도구라는 생각이 드는 요즘.



keyword
매거진의 이전글왜 AI는 신뢰성이 높아지지 않고 떨어지는가