피어리뷰가 읽히지 않습니다

[시리즈] 일잘러의 심리학

by 테오

Apr 29. 2026

"올해 피어리뷰는 도저히 읽을 수가 없었어요."

함께 식사하던 스타트업 CHRO가 던진 화두였습니다. 무심코 들릴 수 있는 문장이지만, 뒤따른 설명은 묵직했습니다.

"주장은 있는데 논리가 없고, 논리가 있는 듯하면 맥락이 없어요. 무엇을 전달하고 싶은지 와닿지 않아요."

같은 자리에 있던 다른 스타트업 인사팀 리드가 이어 말했습니다.

"회사 사내 GPT에서 가장 많이 쓰이는 기능이 무엇인지 아세요? 슬랙 내용 요약이에요. 구성원들이 긴 글을 쓰거나 지금까지 진행된 내용을 글로 정리하는 과정을 모두 GPT에 위임하는 거예요."

요약의 함정: 효율을 얻고 관점을 잃다

오해하지 말아야 할 점이 있습니다. 방대한 슬랙 대화나 밀린 업무 히스토리를 AI로 요약하는 것 자체는 결코 잘못된 일이 아닙니다. 오히려 흩어진 정보를 빠르게 파악하고 효율성을 극대화하는 아주 똑똑한 활용법입니다.

진짜 문제는 그 '요약의 편리함'에 길들여져, 내 머리로 직접 해야 할 '생각의 구조화' 과정마저 기계에 위임해 버리는 태도의 전이에 있습니다. 단순한 정보 파악을 넘어, 타인을 깊이 관찰해야 하는 피어리뷰나 나만의 성찰이 필요한 회고마저 AI의 요약본에 기대는 순간, 우리 뇌의 '사고 근육'은 생각보다 빠른 속도로 약화되기 시작합니다.

스타트업에서 리드 역할을 하고 있는 두 사람의 말은 바로 이 지점을 향해 있습니다. 조직 구성원이 스스로 글을 쓰며 고민하는 시간은 줄고, AI가 대신 써준 매끄러운 글을 읽고 '승인'하는 시간만 늘어나고 있는 현실 말입니다.

2025년 마이크로소프트 리서치와 카네기멜론대 연구팀이 발표한 논문은 이러한 흐름을 체계적으로 보여줍니다. [1] 이들은 지식근로자 319명을 대상으로 생성 AI 사용이 비판적 사고에 미치는 영향을 조사했습니다. 핵심 결과는 두 가지였습니다.

첫째, AI 결과물을 강하게 신뢰하는 사용자일수록 비판적 사고 빈도가 유의미하게 낮았습니다. 둘째, 자신의 전문성에 자신감이 높은 사용자는 반대로 AI 결과물에 더 비판적이었습니다.

연구진은 이를 '인지적 노력(Cognitive Effort)의 이전'으로 해석했습니다.

신뢰가 높아지면 사용자는 '검토'가 아니라 '승인'을 합니다. '이게 맞는가?'라고 묻는 대신 '이 정도면 됐다'라고 판단하는 것이죠. 두 질문은 비슷해 보이지만, 뇌가 사용하는 회로는 완전히 다릅니다.

'이게 맞는가?'는 판단 회로를 활성화합니다. 전제를 의심하고, 논리의 결을 따지며, 대안을 검토합니다. 반면 '이 정도면 됐다'는 평가 회로를 정지시킵니다. 빠르고 편하지만, 오래 지속되면 근육이 약해지는 방향으로 작동합니다.

문제는 일상 업무에서 두 모드의 전환을 거의 인식하지 못한다는 점입니다. 우리는 오늘도 '검토'한다고 느끼지만, 실제로는 '승인'하고 있을 가능성이 큽니다.

83%라는 숫자의 무게

같은 해에 발표된 또 다른 연구는 이 전환의 깊이를 여실히 보여줍니다.

Gerlich(2025)는 666명을 대상으로 AI 사용 빈도와 비판적 사고 능력 간의 관계를 측정했습니다. [2]

결과는 통계적으로 유의미한 음의 상관관계로 나타났습니다. AI를 자주 쓰는 사람일수록 비판적 사고 점수가 낮았으며, 이 관계를 매개한 변수는 '인지 부하 이전(Cognitive Offloading)'이었습니다.

더 충격적인 수치는 질적 조사에서 나왔습니다.

ChatGPT를 사용해 에세이를 작성한 사용자 중 83%가 불과 몇 분 전 자신이 작성한 단락조차 기억하지 못했다고 보고했습니다. [3] 이 수치는 단순한 건망증을 의미하지 않습니다. 글쓰기가 기억 형성 자체를 동반하는 인지 활동이라는 50년 된 가설을 역으로 굳건히 방증하는 임상 증거에 가깝습니다.

왜 글쓰기만 이렇게 취약한가

여기서 잠시 이론 하나를 빌려오겠습니다.

교육심리학자 재닛 에미그(Janet Emig)가 1977년 제시한 '쓰기를 통한 학습(Writing-to-Learn)' 개념입니다. [4] 에미그의 주장은 간결합니다. 글쓰기는 다른 언어활동(말하기·듣기·읽기)과 달리 '정보를 받아들이는' 동시에 '정보를 구조화'해야 하는 이중 과업입니다. 바로 이 이중 과업이 학습 효율을 높이고 판단 능력을 키우는 엔진으로 작동합니다.

요약하면 이렇습니다. 읽기는 타인의 구조를 따라가는 활동이고, 말하기는 기존 생각을 현실화하는 활동입니다. 반면 쓰기는 생각을 '새로 구조화'하는 활동입니다.

조직에서 보고서, 제안서, 피어리뷰를 직접 쓰는 과정이 귀찮고 비효율적으로 느껴지는 이유가 여기에 있습니다. 생각을 '새로 구조화'하는 고생 그 자체가 학습의 본체이기 때문입니다.

로버트 비요크(Robert Bjork)의 '바람직한 어려움(Desirable Difficulty)' 이론도 이를 뒷받침합니다. [5]

인간의 학습은 뇌에 적절한 저항이 주어질 때 가장 효과적으로 일어납니다. AI가 그 저항을 제거하면 업무 효율은 올라가지만, 학습 효과는 떨어집니다. 직관에 반하는 듯 보이나 반복 실험으로 굳건히 검증된 사실입니다.

일터에서 이 현상은 두 가지 얼굴로 나타납니다.

한쪽은 '단기 성과'입니다. 흩어진 슬랙 메시지를 요약하고, 회의록을 정리하고, 이메일 초안을 쓰는 속도가 빨라지며 팀 전체의 정보 처리 산출량이 늘어납니다. 다른 한쪽은 '장기 퇴화'입니다. 직접 초안을 쓰고 뜯어고치는 과정 없이 완성된 결과물만 확인하다 보면, 구성원의 '문제 정의 능력'과 '논리 전개 능력'은 조용히 약해집니다.

이 두 얼굴이 공존하는 상태가 현재 많은 조직이 마주한 현실입니다.

피어리뷰가 왜 먼저 무너지는가

그렇다면 왜 하필 피어리뷰가 가장 먼저 무너질까요?

피어리뷰가 조직 내 글쓰기 과업 중 난도가 가장 높기 때문입니다.

보고서는 구조가 표준화되어 있고, 이메일은 앞선 대화에 맥락이 존재하며, 슬랙 메시지는 짧고 즉흥적입니다. 이 세 장르는 앞서 말했듯 AI가 아주 훌륭히 도울 수 있는 '정보 처리'의 영역입니다.

하지만 피어리뷰는 다릅니다.

동료에 대한 관찰, 그 관찰을 뒷받침하는 에피소드, 에피소드가 드러내는 패턴, 그리고 그 패턴이 조직에 갖는 의미까지. 이 네 가지 층위를 하나의 문서로 엮어내는 작업은 정보의 요약이 아닌 깊은 '인지적 통합'을 요구합니다. 안타깝게도 바로 이 통합 능력이 AI 의존도로 인해 가장 먼저 타격을 입는 영역입니다.

단순한 슬랙 요약에 익숙해진 구성원이 피어리뷰마저 AI에게 맡기면 어떻게 될까요? 결과물은 구체적인 에피소드나 주장 없이, 추상적인 내용이나 의미 없는 패턴으로 조합된 '잘 쓴 것처럼 보이는' 텍스트에 불과하게 됩니다.

결국 읽는 사람은 "뭔가 부족한데 무엇이 문제인지 모르겠다"라고 느끼게 됩니다. 글머리에 인용한 CHRO의 "와닿지 않는다"는 뼈아픈 토로는 정확히 이 지점을 증언합니다.

무엇을 어떻게 바꿀 것인가

이 문제는 AI 사용을 금지한다고 해결되지 않습니다. AI는 이미 업무의 필수 도구로 자리 잡았습니다. 지금 우리에게 필요한 것은 '효율'을 취하되 '사고 근육'은 잃지 않는 규율입니다. 현장에서 바로 적용할 수 있는 네 가지 원칙을 제안합니다.

첫째, 'AI-Free 시간대'를 설계하세요. 매주 금요일 오전 두 시간은 AI 도구를 끄고 오직 자신의 사고만으로 짧은 회고를 작성하는 문화를 만들어보는 겁니다. 이 시간의 목적은 '좋은 글'을 완성하는 데 있지 않습니다. '생각을 직접 구조화하는 경험'을 누적하는 데 있습니다.

둘째, '초안은 AI, 사고는 사람'이라는 원칙을 문서화하세요. 모든 주요 문서는 'AI 초안 생성 → 구조 재설계 → 논거 교체 → 최종 수정'이라는 네 단계를 명시적으로 거치게 합니다. 핵심은 두 번째 단계인 '구조 재설계'입니다. AI가 세운 구조를 사람이 한 번 허물고 다시 쌓아 올리는 그 순간, 진짜 사고가 개입됩니다.

셋째, 피어리뷰를 '프롬프트 금지 영역'으로 지정하세요. 정보의 요약은 맡기더라도, 동료를 향한 관찰은 AI가 대신 쓰게 두지 마십시오. 대신 '관찰 메모' 단계를 분리하는 편이 좋습니다. 평소 5분씩 짬을 내어 관찰 메모를 쌓아두고, 분기별 피어리뷰는 이 메모들을 모아 스스로 엮어내는 방식입니다. 관찰은 기계가 결코 대신할 수 없는 사람 고유의 영역입니다.

넷째, '피어리뷰' 대신 '관점 공유'로 이름을 바꿔보세요. 이름은 의외로 중요합니다. 평가나 심판의 뉘앙스는 작성자가 정답을 찾기 위해 AI에 더 의존하도록 만듭니다. 반면 '관점 공유'라는 프레임은 완벽함이 아닌 진실함을 요구합니다. 진실이 담긴 문장은 길이가 짧아도 마음 깊이 와닿습니다.

원칙의 실행은 리더십의 거창한 선언이 아니라 아주 작은 구조적 변화에서 출발해야 한다고 생각합니다. 캘린더에 AI-Free 시간대를 고정 블록으로 넣거나, 문서 템플릿에 '구조 재설계' 칸을 추가하고, 관찰 메모 노트를 신규 입사자 온보딩 과정에 포함하는 식을 말합니다. 작은 구조는 백 번의 선언보다 오래 살아남고, 변화를 일으킵니다.

세 가지 장면으로 그려보면

우리 조직 안에서 실제로 벌어지는 세 가지 장면을 떠올려 보겠습니다.

[장면 1] 팀장이 지난주 업무 회고를 요청합니다. 구성원 A는 슬랙 대화 로그를 긁어 GPT에 붙여 넣고 "회고 스타일로 정리해 줘"라고 입력합니다. 30초 후 완성된 그럴듯한 메모를 쓱 읽어보고 팀 채널에 공유합니다. 이 장면에서 A는 시간을 아꼈습니다. 그러나 정작 A의 머릿속에는 지난주 업무의 구조가 조금도 남지 않았습니다. 다음 주에 비슷한 상황이 닥치면, A는 같은 실수를 겪고도 어디서부터 꼬였는지 기억하지 못할 확률이 높습니다.

[장면 2] 피어리뷰 시즌. B는 동료 C의 평가를 위해 슬랙 대화와 회의록을 GPT에 넣고 "강점과 개선점 3가지를 제안해 줘"라고 입력합니다. 30분 뒤 흠잡을 데 없는 문서가 튀어나옵니다. 하지만 그 리뷰를 받아 든 C는 어딘가 텅 빈 느낌을 지울 수 없습니다. 읽는 사람은 단번에 알아챕니다. 이것이 '나를 애정 어린 시선으로 관찰한 사람의 글'인지, 아니면 '나의 흔적을 기계적으로 조립한 도구의 글'인지 말입니다. 빠져 있는 것은 정보가 아니라, 관점입니다.

[장면 3] CEO가 전사 메시지 초안을 요청합니다. 담당 리더는 GPT에 "전사 공지 톤으로 내용을 정리해 달라"라고 지시합니다. 결과물은 모범 답안이지만, 메시지를 읽은 직원들의 반응은 차갑습니다. "무슨 말인지는 알겠는데, 진짜 우리 회사의 목소리가 맞나요?" 언어의 지나친 매끄러움이 오히려 신뢰를 갉아먹은 셈입니다. 사람 냄새가 사라진 글은 의미를 전달하지 못합니다.

쓰지 않는 뇌의 조용한 퇴화

폴리테크닉 인사이트(Polytechnique Insights)는 2025년 이 현상을 '인지 위축(Cognitive Atrophy)'이라 명명했습니다. [6] 신체 근육을 쓰지 않으면 퇴화하듯, 뇌의 특정 기능 역시 사용 빈도가 줄면 위축된다는 신경과학적 통찰입니다.

여기서 가장 무서운 점은 그 퇴화가 아주 조용히 진행된다는 것입니다. 사고 근육이 녹아내리고 있다는 신호는 당사자에게 거의 감지되지 않습니다. 일상적인 요약 업무를 빠르게 쳐내며 본인은 일을 잘 해내고 있다고 착각하기 쉽습니다.

그 불길한 신호는 오직 외부 관찰자, 이를테면 구성원들의 피어리뷰를 한데 모아 읽는 CHRO의 눈에만 포착됩니다. "도저히 읽을 수가 없다"는 탄식은 사실 해당 조직의 인지 건강을 나타내는 가장 정직한 정성 데이터일지 모릅니다.

조직이 지켜야 할 '느리게 생각하는 시간'

단순 요약과 정보 파악의 짐은 AI에게 넘겨주셔도 됩니다. 하지만 우리 조직이 잃어버려선 안 될 것이 있습니다.

"구성원이 일주일에 한 번쯤은 아무에게도 보여주지 않을 글을 오롯이 자신의 힘으로 쓰게 할 것."

그 글은 업무 회고일 수도, 한 페이지짜리 아이디어 메모일 수도 있습니다. 핵심은 타인의 시선을 의식하지 않고 묵묵히 글을 써 내려가며, 생각을 구조화하는 고생을 온전한 자기 자산으로 만드는 데 있습니다.

이 시간을 허투루 넘기는 조직은 3년 뒤 더 느리게 결정하고, 더 얕게 합의하며, 끝내 아무도 읽지 않는 피어리뷰를 떠안게 될 위험이 있습니다. 그리고 그 청구서는 당장 눈에 보이지 않지만, 예외 없이 날아올 것입니다.

'경계 없음'의 저자 이중학 교수님의 말을 빌리면, "글을 읽을 수가 없다"는 말은, 조직의 '생각하는 시간'의 붕괴를 알리는 탄광 속 카나리아와 같습니다. 보지 않은 것을 요약 기술에 기대어 글로 쓰는 사람은 결국 현상을 스스로 판단하지 못하는 사람으로 전락하고 맙니다.

조직의 사고 근육은 결코 하루아침에 붕괴하지 않습니다. 수천 번의 '짧은 글쓰기 생략'과 AI가 작성한 글에 대한 수만 번의 '영혼 없는 승인'이 켜켜이 쌓여 아주 천천히 약해질 것입니다.

그 조용한 추락을 멈춰 세우는 힘은, 오늘 구성원 단 한 명이 단 10분이라도 온전한 자기 머리와 손으로 메모 한 장을 써 내려가는 그 작고 단단한 순간에서 시작된다고 생각합니다. 거창한 혁신 정책보다 끈질긴 작은 습관이 조직의 근본을 지키는 시대가 온 것 같습니다.

References

[1] Lee, H.-P., Sarkar, A., Tankelevitch, L., Drosos, I., Rintel, S., Banks, R., & Wilson, N. (2025). The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects from a Survey of Knowledge Workers. Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems.

[2] Gerlich, M. (2025). AI tools and critical thinking in knowledge workers: A survey of 666 participants. Preprint.

[3] Fortune. (2025, February 11). AI might already be warping our brains, leaving our judgment and critical thinking 'atrophied and unprepared,' warns new study.

[4] Emig, J. (1977). Writing as a mode of learning. College Composition and Communication, 28(2), 122-128.

[5] Bjork, R. A. (1994). Memory and metamemory considerations in the training of human beings. In J. Metcalfe & A. P. Shimamura (Eds.), Metacognition: Knowing about knowing (pp. 185-205). MIT Press.

[6] Polytechnique Insights. (2025). Generative AI: the risk of cognitive atrophy.

[7] Risko, E. F., & Gilbert, S. J. (2016). Cognitive offloading. Trends in Cognitive Sciences, 20(9), 676-688.

[8] Frontiers in Education. (2025). The impact of generative AI on academic reading and writing: A synthesis of recent evidence (2023-2025).

[9] Microsoft Research. (2025). Lee et al. — AI Critical Thinking Survey Full Paper.

keyword

작가의 이전글맥락을 잃어버린 세대가 왔습니다토큰을 세는 조직과 성과를 내는 조직작가의 다음글