brunch

AI를 팀원으로 받아들이면 팀의 성과는 어떻게 달라질까

인간–AI 혼합 팀(hybrid team)의 새로운 성과 공식

by Kay

업무적으로 한 가지 변화가 생겼다. 원차원에서 진행되는 중요한 Task의 리더 역할을 맡게 된 것인데, 멤버로서 참여했던 그간의 Task 경험들을 돌이켜보면 성공적인 결과는 늘 개인의 그것보다 더 큰 결과물이었고 동료들과 함께 만드는 것이었다. 수많은 자료들을 찾아서 읽고, 또 조직 내외부의 여러 사람들을 만나며, 우리끼리 모여서 함께 밤늦게까지 토론하고 인사이트를 뽑아내는 치열한 팀 중심의 경험이었다.


그런데 지난 몇 년간 개인으로서 일해 온 경험을 떠올려 보자면 분명 다른 상황이지만 이미 경험한 것 같은 기시감이 들었다. 분명 혼자 일하고 있지만, 곁에 AI가 있었다. AI를 활용해 초기 자료를 찾고, 내 생각을 더해 찾은 추가 자료를 함께 분석하고, 대화를 통해 생각을 발전시켜 나가는 과정은 똘똘한 후배들과 함께 일하던 이전 경험과 무척이나 닮아있었다.


시대적으로 업무 장면에서 AI를 활용하는 것은 당연한 것이 되어 있고, 이 Task 역시 여러 장면에서 AI와 함께 진행될 것이 자명하다. 이런 상황에서, 혼자가 아니라 각자의 업무로 바쁜 우리가 모여 함께 일하는 것은 과연 어떤 의미를 가질까? 우리는 어떤 의미 있는 결과를 내야 할까?


혁신을 다루는 저명한 교수가 된 친한 후배와 나눴던 대화가 떠오른다. 혁신의 관점에서 생각해 보자면 사람들은 자신의 전문성과 가까운 곳에서 해결책을 찾으려 해왔지만, AI는 혁신의 지형을 완전히 바꾸어 각자의 전문성과 거리가 먼 곳까지 손쉽게 접근할 수 있게 되었다는 후배의 말에 무척이나 공감했던 기억이 있다. 혁신에 대한 후배의 말은 최근 하버드 비즈니스 스쿨에서 진행한 연구와도 정확히 일치하는 결과를 보였다. P&G의 전문가 776명을 대상으로 진행한 현장 실험을 통해 이뤄진 'The Cybernetic Teammate' 연구는 나의 질문에 대한 구체적인 답이 될 수도 있을 것 같다.


연구의 핵심 결과는 명료하다.

첫째, AI의 도움을 받은 개인은 AI가 없이 함께 일한 팀과 동등한 수준의 성과를 달성했다. 이는 내가 개인으로서 AI와 일하며 느꼈던 팀과 유사한 경험이 틀리지 않았음을 증명한다.

둘째, AI는 R&D(기술)와 커머셜(상업) 전문가처럼 서로 다른 배경을 가진 참가자들이 자신의 기능적 사일로(functional silos)를 넘어 균형 잡힌 솔루션을 만들도록 도왔다. AI가 '먼 곳의 전문성'에 접근하게 해 준다는 후배의 통찰이 입증된 것이다.


하지만 이 연구는 가장 중요한 질문에 답한다. '그렇다면 인간 팀은 왜 필요한가?' 연구팀이 진행한 추가 분석에 따르면, 최상위 10%에 해당하는 '탁월한(exceptional)' 솔루션을 만들어낼 확률은 AI와 인간 팀 조합에서 가장 높았다. 또한, AI는 인간 팀이 협업할 때 발생할 수 있는 특정 의견의 지배력 효과(dominance effects)를 줄여, 구성원들이 더 균형 잡힌 기여를 하도록 도왔다.


이 연구는 AI가 단순히 개인의 생산성을 높이는 도구가 아니라, 팀의 역학을 바꾸고 전문성을 연결하는 팀원 역할을 할 수 있다는 가능성을 보여준다. AI는 AI 없이 사람들끼리 일하는 팀의 평균 성과를 복제할 수 있지만, AI와 함께 일하는 인간 팀은 그 이상의 시너지를 창출한다.


이번 주 미팅에서 Task의 초기 방향성을 논의하기에 앞서 이 연구 결과를 Task 멤버들과 공유하며, 우리가 함께 일하는 것의 의미에 대한 각자의 생각을 나누는 시간을 가져봐야겠다는 생각이 들었다. 우리는 다섯 명이지만 각자가 사용하는 AI까지를 우리의 일원으로 포함했을 때, 새로운 팀원인 AI에게 어떤 역할을 부여하고, 어떻게 활용하며, 그 과정에서 우리들은 무엇에 더 집중해야 할지 함께 고민하면서 그라운드룰을 세팅해봐야겠다.




The Cybernetic Teammate: A Field Experiment on Generative AI Reshaping Teamwork and Expertise


Dell'Acqua, F., Ayoubi, C., Lifshitz, H., Sadun, R., Mollick, E., Mollick, L., ... & Lakhani, K. (2025). The cybernetic teammate: A field experiment on generative AI reshaping teamwork and expertise (No. w33641). National Bureau of Economic Research.


1. 이 연구를 3줄로 요약하면?

본 연구는 P&G 전문가 776명을 대상으로 한 현장 실험을 통해, 생성형 AI가 팀의 성과, 전문성 공유, 사회적 참여에 미치는 영향을 분석한다. AI를 활용한 개인은 AI가 없는 2인 팀과 동등한 성과를 달성했으며, AI는 R&D와 커머셜 전문가 간의 기능적 경계를 허물어 균형 잡힌 솔루션을 도출했다. 결론적으로 AI는 인간 팀원이 제공하는 사회적, 동기 부여 역할을 일부 대체하며 '사이버네틱 팀원'으로서 기능할 수 있음을 시사한다.


2. 저자는 왜 이 연구를 진행했는가?

팀워크는 현대 조직의 핵심이지만, 생성형 AI(GenAI)가 팀 기반 협업에 미치는 영향은 거의 연구되지 않았다. 기존 연구는 AI를 '도구'로 취급했으나, GenAI는 인간 언어로 훈련되어 기계보다 사람처럼 작동하는 독특한 측면이 있다. 저자들은 GenAI가 단순한 도구를 넘어 인간 팀워크의 핵심 이점인 '집단적 성과', '전문성 공유', '사회적 연결'을 제공할 수 있는지, 즉 '사이버네틱 팀원(cybernetic teammate)'의 역할을 할 수 있는지 탐구하고자 했다.


3. 이 연구에서 중요하게 다뤄진 개념은?

팀워크의 3가지 기둥 (Three pillars of teamwork): 전통적으로 팀워크를 정당화하는 세 가지 핵심 요소로, 성과(performance), 전문성 공유(expertise sharing), 인간의 사회성(human sociality)을 의미한다.

사이버네틱 팀원 (Cybernetic teammate): AI가 단순한 도구가 아니라, 인간 협업의 핵심 이점을 제공하며 팀의 일원처럼 기능하는 역할을 지칭한다.

기능적 사일로 (Functional silos): R&D(기술 중심)와 커머셜(상업 중심) 전문가처럼 서로 다른 부서 간에 존재하는 경계와 단절을 의미한다.


4. 저자는 어떤 방법을 사용했는가?

P&G에 재직 중인 776명의 숙련된 전문가를 대상으로 대규모 현장 실험(field experiment)을 수행했다. 참가자들은 실제 비즈니스 요구에 기반한 신제품 개발 과제를 수행했다. 2*2 실험 설계를 사용하여 'AI 사용 여부(With/Without AI)'와 '작업 방식(개인/팀)'에 따라 4개 그룹(1. 개인-AI 없음(통제군), 2. 팀-AI 없음(T1), 3. 개인+AI(T2), 4. 팀+AI(T3))으로 무작위 배정하여 결과를 비교했다.


5. 연구의 결과는?

AI는 성과를 크게 향상시켰다. 특히 AI를 사용하는 개인(T2)은 AI가 없는 2인 팀(T1)과 비슷한 수준의 성과를 달성했다. 또한 AI는 참가자의 전문 배경(R&D 또는 커머셜)과 관계없이 균형 잡힌 솔루션을 생성하도록 유도하여 기능적 사일로를 허물었다. 마지막으로, AI와의 상호작용은 인간 팀원과 협력할 때와 유사한 수준의 긍정적인 감정 반응(흥분, 참여 등)을 이끌어냈다.




1. Introduction (소개)


팀워크는 현대 조직의 초석이다. 신제품 설계, 전략적 과제 해결, 대규모 혁신 조율 등 어떤 작업을 하든, 인간의 협업은 개인이 혼자 일하는 것보다 더 높은 품질의 결과를 달성하는 데 전통적으로 중심적인 역할을 해왔다.

팀워크를 정당화하는 데는 세 가지 근본적인 기둥이 존재한다.

성과(Performance): 첫째, 팀워크는 개인 작업보다 더 효과적이며 더 복잡한 문제를 해결할 수 있게 한다.

전문성 공유 (Expertise sharing): 둘째, 팀워크는 다양한 전문 지식을 가진 사람들이 함께 모여 동일한 문제를 효과적인 방식으로 해결하도록 한다.

인간의 사회성 (Human sociality): 셋째, 사람들은 다른 사람들과 연결되는 것을 즐기며, 이는 작업 동기를 증가시킨다.

팀워크와 협업 기능에 대한 상당한 연구에도 불구하고, 인공지능(AI)이라는 새로운 기술이 이 세 가지 핵심 기둥을 어떻게 유지하는지에 대해서는 거의 알려진 바가 없다.


GenAI의 등장과 새로운 질문

지식 작업에 AI가 통합되는 것은 근본적인 도전을 제기한다. 특히 생성형 AI(GenAI)는 개인의 창의성, 생산성, 의사결정을 향상시키는 능력을 보여주었지만, 팀 기반 협업에 미치는 영향은 대체로 탐구되지 않았다.

이전의 연구들은 AI를 주로 스프레드시트나 계산기처럼 성과 향상에 사용될 수 있는 '도구'로 취급했다. 그러나 GenAI의 가장 일반적인 형태인 대규모 언어 모델(LLM)의 독특한 측면은, 이들이 인간 언어로 훈련되어 종종 기계보다 사람처럼 행동한다는 점이다.

이는 "GenAI가 팀워크에서 인간의 역할을 채울 수 있는가?"라는 핵심 질문으로 이어진다. 본 연구는 AI를 단순한 도구로 간주하는 것을 넘어, AI가 인간 팀워크와 동일한 이점, 즉 집단적 성과, 전문성 공유, 사회적 연결을 제공할 수 있는지 묻는다.


본 연구의 세 가지 핵심 차원

본 연구는 이러한 질문을 해결하기 위해 세 가지 주요 차원을 탐구하는 대규모 현장 실험을 설계했다.

GenAI는 전통적으로 팀워크에 기인하는 성과 향상을 제공하는가?

GenAI는 직원이 특정 전문 지식이나 기술이 부족할 때도 전문성의 확장을 가능하게 하는가

GenAI는 우리가 일반적으로 인간 협업과 연관시키는 종류의 사회적 참여(social engagement)를 제공할 수 있는가?

간단히 말해, 본 연구는 AI가 또 다른 소프트웨어 도구가 아닌, 어느 정도까지 '사이버네틱 팀원(cybernetic teammate)'으로 취급될 수 있는지 탐구한다.



2. Related Literature (관련 문헌)


지식 작업의 본질은 점점 더 협력적으로 변하고 있다. 팀워크는 여러 가지 이유로 현대 조직의 중추를 이루지만, 그중 가장 중요한 것은 성과(performance)이다.

팀워크의 첫 번째 기둥: 성과

광범위한 학술 연구는 협업이 여러 관점을 통합함으로써 조직에서 개인의 노력을 능가할 수 있으며, 복잡한 문제를 더 효과적으로 해결할 수 있음을 보여준다.

팀워크는 높은 과업 복잡성 하에서 광범위한 지식을 동원할 수 있게 한다.

집단적 의사결정은 더 넓은 범위의 입력을 활용하여 오류를 줄인다.

이러한 성과 이점은 근본적으로 팀원들이 실시간 피드백을 공유하고, 다양한 기술을 결합하며, 집단적 문제 해결에 참여할 때 발생하는 시너지에서 비롯된다. 이러한 상호작용은 사각지대를 줄이고, 다양한 관점을 장려하며, 협력적 창의성을 촉진한다.


팀워크의 두 번째 기둥: 전문성 공유

팀워크의 두 번째 핵심 근거는 기능적 또는 학문적 경계를 넘어 전문성을 공유(expertise sharing)하는 것이다. 지식 기반 관점(knowledge-based view)의 핵심 신조는 전문 지식이 개인에게 있으며, 복잡한 문제를 해결하기 위해 이 지식이 통합되어야 한다는 것이다.

서로 다른 기술을 재결합하면 혁신을 촉진할 수 있다.

문제 해결에는 종종 여러 영역의 전문 지식이 함께 작동해야 한다.

팀은 직접적인 상호작용 중에 통찰력을 다듬고 전달할 수 있기 때문에 학습 및 지식 보유의 주요 장소가 된다.

최근 연구들은 협업을 이해할 때 기능적 전문지식(functional expertise, 예: 기술 원칙)과 산업 전문지식(industry expertise, 예: 부문별 규범)을 구별하는 것의 중요성을 강조한다. 두 유형 모두 혁신적인 솔루션을 발굴하고 구현하는 데 중요하다.

현대 작업의 복잡성이 증가함에 따라, 지식의 총량이 증가하면서 깊이(전문가)와 넓이(학제 간 협력)를 모두 달성하기 위해 팀 기반 조정이 필수적인 비계(scaffolding)가 되었다.


팀워크의 세 번째 기둥: 사회적 및 동기 부여 혜택

마지막으로, 인간 협업은 업무 만족도를 향상시키는 중요한 사회적 및 동기 부여 혜택(social and motivational benefits)을 제공한다. 팀워크는 소속감, 집단적 헌신, 상호 지원을 촉진하여 도전적인 과제에서 더 강한 동기 부여와 끈기를 유발할 수 있다.


생성형 AI(GenAI)의 등장과 영향

이러한 팀 기반 지식 작업의 배경 속에서, GenAI는 변혁적인 기술로 부상했다. 초기 연구는 GenAI가 개인의 생산성, 창의성, 의사결정에 미치는 긍정적 영향에 초점을 맞추었다. 그러나 조직적 가치가 가장 자주 창출되는 협업 환경에서 GenAI의 영향을 이해할 필요가 있다.

GenAI는 두 가지 독특한 특성 때문에 팀워크에 특히 중요한 발전을 의미한다.

암묵적 지식(Tacit knowledge) 처리: 이전 기술은 명시적이고 코드화 가능한 작업을 자동화했지만, GenAI는 전통적으로 직접적인 인간 상호작용을 통해서만 공유될 수 있었던 암묵적 지식(implicit understanding)에 관여할 수 있다.

자연어 대화: GenAI는 자연어 대화 능력을 통해 효과적인 팀워크를 특징짓는 개방형, 맥락적 상호작용에 참여할 수 있으며, 잠재적으로 도구가 아닌 협업 프로세스의 적극적인 '참여자' 역할을 할 수 있다.

GenAI를 팀 기반 작업에 통합하는 것은 기회와 도전을 동시에 제시한다. 한편으로 AI는 특정 작업을 자동화하고 팀원이 사용할 수 있는 전문성의 범위를 넓혀 협업 성과를 향상시킬 수 있다. 또한 경계를 넘어 다른 지식 영역을 연결하는 데 도움을 줄 수 있다.

다른 한편으로, 조직 이론은 새로운 기술이 기존 루틴을 불안정하게 만들 수 있다고 경고한다. 최근 실험실 연구는 인간-AI 파트너십의 잠재적인 조정 함정을 강조한다. AI가 특정 작업에서 인간을 능가할 때조차, 신뢰 감소와 조정 실패로 인해 전반적인 팀 성과가 저하될 수 있다. 또한 기술이 작업의 사회적 측면을 약화시켜 인간의 만족도를 낮출 수 있다는 오랜 우려도 존재한다.

그러나 최근 메타 분석 증거에 따르면, GenAI 기반 대화형 에이전트는 고통을 줄이고 웰빙을 증진하는 격려적이고 인간과 유사한 대화를 제공함으로써 개인의 사회적, 정서적 경험을 강화할 수도 있다.



3. Experimental Design (실험 설계)


3.1 Empirical Setting (실증적 환경)

본 연구는 2024년 5월부터 7월까지 글로벌 소비재 기업인 Procter & Gamble(P&G)에서 대규모 현장 실험으로 수행되었다. P&G는 전 세계적으로 구조화된 R&D 프로세스와 숙련된 인력을 보유하고 있어, 혁신 중심의 지식 작업에서 GenAI의 역할을 조사하기에 이상적인 환경을 제공한다.

P&G의 리더십 팀과의 논의를 통해, 연구 설계는 P&G의 기존 혁신 관행과 전략적 우선순위에 맞춰 조정되었다. P&G에서는 혁신 활동, 특히 아이디어가 생성되는 초기 단계가 R&D와 커머셜 대표로 구성된 교차 기능 팀(cross-functional teams)을 통해 이루어지는 것이 일반적이다.

경영진은 이 초기 단계의 작업 품질이 전체 혁신 파이프라인에 중요하다고 강조했다. 그러나 양 기능의 담당자를 소집하는 데 드는 시간이나 R&D와 커머셜 간의 문화적 차이 같은 조정 마찰이 혁신 활동의 질을 저하시킬 수 있다고 보고했다. 이 실험은 AI 팀 구성 모델이 어떻게 혁신에 영향을 미치고 이러한 마찰을 잠재적으로 줄일 수 있는지 테스트하기 위해 동기를 부여받았다.


3.2 Experimental Approach (실험적 접근 방식)

실험 설계는 P&G의 실제 신제품 개발 프로세스, 특히 "씨앗(seed)" 단계로 불리는 초기 아이디어 생성 단계를 반영하도록 신중하게 제작되었다. 실험은 P&G의 커머셜 및 R&D 부서에서 811명의 참가를 받아 하루 동안의 가상 제품 개발 워크숍 형태로 진행되었다. 본 분석은 이 중 4가지 조건에 무작위로 배정된 776명의 참가자에 초점을 맞춘다.

2*2 실험 설계에 따라 참가자들은 4가지 조건 중 하나에 무작위로 배정되었다.

통제군 (Control): AI 없이 개인 작업

T1 (Team No AI): AI 없이 팀(R&D + 커머셜) 작업

T2 (Individual + AI): AI를 사용하며 개인 작업

T3 (Team + AI): AI를 사용하며 팀(R&D + 커머셜) 작업

무작위 배정은 4개의 비즈니스 유닛(베이비 케어, 여성 케어, 그루밍, 오랄 케어)과 2개의 지역(유럽, 아메리카)으로 정의된 8개의 클러스터 내에서 계층화되어 수행되었다.

팀 조건(T1, T3)은 커머셜 전문가와 R&D 전문가를 무작위로 짝지어 구성했다. 협업은 P&G의 표준 방식인 Microsoft Teams를 통해 원격으로 이루어졌으며, 팀원 중 한 명이 무작위로 화면을 공유하고 팀의 솔루션을 제출하도록 지정되었다.

참가자들은 자신의 비즈니스 유닛 내에서 신제품, 포장, 커뮤니케이션 접근 방식 등에 대한 실행 가능한 아이디어를 개발하는 과제를 받았다. 이는 참가자들이 평소 업무와 관련된 문제에 자신의 전문 지식을 활용할 수 있도록 하여 실험의 생태학적 타당성(ecological validity)을 높였다.

AI 지원 조건(T2, T3)에서 사용된 GenAI 도구는 GPT-4(이후 GPT-4o)에 기반하며 Microsoft Azure를 통해 접근했다. 이 그룹의 참가자들은 소비재 관련 작업에 GenAI 도구를 활용하는 방법에 대한 1시간의 프롬프트 교육 세션을 받았다.


3.3 Collected Outcomes (수집된 결과)

데이터는 여러 단계에 걸쳐 수집되었다.

사전 설문: 참가자의 개인 정보를 수집했다.

워크숍 중: 모든 GenAI 프롬프트와 응답이 기록되었고, 팀 상호작용이 텍스트로 변환되었다.

사후 설문 및 인터뷰: 과제 완료 후 데이터와 일부 참가자와의 후속 인터뷰가 수집되었다.

참가자들은 GenAI 지식을 향상시키기 위한 조직의 업스킬링(upskilling) 이니셔티브의 일환으로 연구에 등록했다(내재적 동기). 또한, 최고의 제안은 관리자에게 발표될 기회가 주어져, 자신의 아이디어를 최고 경영진에게 선보일 기회를 가졌다(외재적 동기).

통제군(AI 없이 개인/팀 작업) 참가자들은 초기 과제를 완료한 후, AI 지원 그룹과 동일한 GenAI 교육을 받았다. 그 후 새로 습득한 AI 기술을 사용하여 과제를 다시 수행했다. 이는 참가자 내(within-participant) 비교를 가능하게 하는 교차 실험 설계(cross-over experiment design)를 구성했지만, 본 연구에서 제시된 모든 주요 결과는 교차 발생 전 초기 성과에 대한 참가자 간(between-subject) 비교를 기반으로 한다.



4. Empirical Strategy (실증 전략)


4.1 Analytical Approach (분석적 접근 방식)

본 연구의 실증 분석은 AI 도입 및 팀 구성이 다양한 성과 측정치에 미치는 인과 효과를 추정하기 위해 주로 회귀 분석에 의존한다.

연구진은 이 모델의 세 가지 변형을 추정한다.

모델 1: 치료 지표(treatment indicators)만 포함한다.

모델 2: 비즈니스 유닛 및 참여 날짜에 대한 고정 효과만 포함한다.

모델 3: 고정 효과에 더해 직급 수준, 회사 내 경력 연수, 성별, 업무 및 개인 목적의 사전 AI 사용 경험 등 통제 변수를 추가한다.

분석 전반에 걸쳐 이분산성(heteroskedasticity) 가능성을 고려하여 강건한 표준 오류(robust standard errors)를 사용한다. 또한, 'AI 없는 팀' 대 'AI 있는 팀', 'AI 있는 개인' 대 'AI 있는 팀'과 같이 치료 조건 간의 추가 비교를 수행하여 AI와 팀워크 간의 상호보완성을 이해하고자 한다.


4.2 Dependent Variables (종속 변수)

본 연구는 AI 도입과 팀 구성의 다각적인 영향을 이해하기 위해 성과, 전문성, 감정 상태 등 다양한 차원의 종속 변수를 측정한다.


주요 성과 측정치

Quality (품질): 1점에서 10점 척도로 측정된 솔루션의 전반적인 품질이다. 실험 조건이나 제출자 프로필을 알지 못하는(blind) 비즈니스 및 기술 배경의 전문 평가자들이 독립적으로 평가했다. 이 점수는 통제군(AI 없는 개인)의 평균을 기준으로 표준화되었다.

Novelty (참신성) 및 Feasibility (실현 가능성): 품질 평가와 동시에 전문가들이 평가한 1-10점 척도이다. 참신성은 독창성을, 실현 가능성은 제안의 실용성을 측정한다.

Time Spent (소요 시간): 참가자가 과제에 소비한 시간(초)이며, 자연로그 값을 분석에 사용한다.

Length (솔루션 길이): 참가자가 제출한 솔루션의 총 단어 수로, 솔루션의 포괄성과 세부 수준을 파악한다.

Expected Quality (예상 품질): 참가자가 자신의 솔루션이 상위 10%에 들 것이라고 예상하는지 여부를 나타내는 이진 변수(1=예, 0=아니오)이다.


전문성 측정치

지식 영역 및 경험: 참가자를 R&D 또는 커머셜 영역으로 분류하고, 신제품 개발이 '핵심 업무(Core job)'인지 '비핵심 업무(Non-core job)'인지에 따라 기능적 경험을 구분한다.

Technicality (기술성): 동일한 전문가 평가자가 1-7점 척도로 평가하며, 값이 높을수록 기술 중심 아이디어, 낮을수록 상업적/시장 중심 개념을 의미한다.


감정 상태 측정치

과제 완료 전후에 참가자가 스스로 보고한 감정 상태의 변화를 두 가지 복합 측정치로 측정한다.

Positive emotions (긍정적 감정): 열정, 에너지, 흥분의 수준을 결합한다.

Negative emotions (부정적 감정): 불안, 좌절, 괴로움의 감정을 집계한다.

두 측정치 모두 과제 후 응답에서 과제 전 응답을 뺀 차이로 계산되며, 통제군을 기준으로 표준화된다.



5. Results (결과)


5.1 Performance (성과)

-. 솔루션 품질 (Solution Quality): AI는 솔루션 품질에 결정적인 영향을 미쳤다. AI가 없는 팀은 AI가 없는 개인보다 0.24 표준편차 높은 품질 개선을 보여 전통적인 협업의 이점을 확인시켜 주었다. 그러나 AI의 영향은 더 컸다. AI를 사용한 개인은 0.37 표준편차, AI를 사용한 팀은 0.39 표준편차의 품질 향상을 보였다. 주목할 점은, AI를 사용하는 개인(Individual + AI)이 AI가 없는 2인 팀(Team No AI)과 비슷한 수준의 성과를 달성했다는 것이다. 이는 AI가 특정 맥락에서 팀 협업을 효과적으로 대체할 수 있음을 시사한다. 솔루션 품질의 분포를 비교했을 때도, AI가 없는 팀과 AI가 있는 개인의 품질 분포는 매우 유사하게 나타났다.

-. 시간 효율성 (Time Efficiency): AI의 도입은 과제에 소요되는 시간을 크게 단축시켰다. AI가 없는 개인과 팀은 작업에 비슷한 시간을 소비했다. 반면, AI를 사용한 개인은 통제군(AI 없는 개인)보다 16.4% 적은 시간을 사용했으며, AI를 사용한 팀은 12.7% 적은 시간을 사용했다.

솔루션 길이 (Solution Length): AI는 솔루션의 길이를 크게 증가시켰다. AI가 없는 팀은 AI가 없는 개인보다 약간 더 긴 솔루션을 생산하는 데 그쳤으나, AI를 도입한 그룹(개인 및 팀 모두)은 훨씬 더 긴(상세한) 결과물을 제출했다.


5.2 Expertise (전문성)

-. 전문성 민주화 (Democratization of Expertise): AI는 신제품 개발 과제에 익숙하지 않은 직원들의 성과를 크게 향상시켰다. 신제품 개발이 '비핵심 업무(Non-core job)'인 직원들은 AI가 없을 때(개인 또는 팀) 상대적으로 낮은 성과를 보였다. 그러나 이들이 AI에 접근했을 때, 개인으로 일하면서도 신제품 개발이 '핵심 업무(Core job)'인 직원이 포함된 팀과 비슷한 수준의 성과를 달성했다. 이는 AI가 작업 관련 경험이 적은 직원들에게 필요한 전문 지식과 지침을 효과적으로 제공하며, 조직 내 전문성을 민주화할 수 있음을 보여준다.

-. 기능적 경계 해소 (Breaking Down Functional Boundaries): AI는 아이디어 생성 패턴을 변화시켰다. AI가 없을 때, '커머셜' 참가자들은 상업적 아이디어를, 'R&D(기술)' 참가자들은 기술 중심의 아이디어를 제안하는 경향이 뚜렷했다. 즉, 자신의 전문 배경에 밀접하게 연관된 아이디어를 생성했다. 하지만 AI의 도움을 받았을 때, 커머셜 참가자와 기술 참가자 간의 이러한 구분이 사라졌다. 두 그룹 모두 상업적/기술적 스펙트럼에 걸친 균형 잡힌 아이디어를 제안했다. 이러한 효과는 솔루션의 품질 저하 없이 발생했다. 이는 AI가 참가자들이 기능적 경계를 넘어 더 총체적이고 학제적인 사고를 하도록 잠재력을 확장시킴을 시사한다.


5.3 Sociality (사회성)

AI 통합은 향상된 긍정적 감정 경험으로 이어졌다. AI를 사용한 참가자들은 통제군 대비 유의미하게 더 높은 수준의 긍정적 감정(흥분, 에너지, 열정)과 더 낮은 수준의 부정적 감정(불안, 좌절)을 보고했다.

긍정적 감정: AI를 사용한 개인은 0.457 표준편차, AI를 사용한 팀은 0.635 표준편차 증가했다.

부정적 감정: AI를 사용한 개인과 팀 모두 유의미한 감소를 보고했다.

전통적으로 AI가 없는 개인은 팀으로 일하는 사람들보다 낮은 긍정적 감정 반응을 보였는데, 이는 인간 협업의 심리적 이점을 반영한다.

그러나 AI를 사용하는 개인은 AI가 없는 팀 구성원과 비슷하거나 그 이상의 긍정적 감정 반응을 보고했다. 이는 AI가 개인 작업 환경에서도 팀워크와 관련된 정서적 이점 일부를 대체하여 효과적인 협업 파트너 역할을 할 수 있음을 시사한다. 이러한 긍정적 경험은 AI의 향후 사용 기대치 증가와도 상관관계를 보였다.



6. Additional Analyses (추가 분석)


6.1 Exceptional Performance Measures (예외적 성과 측정)

많은 조직은 평균적인 성과보다는 막대한 수익을 창출할 수 있는 '예외적인 결과', 즉 최상의 아이디어에 불균형적으로 중점을 둔다. 이러한 최상위 솔루션을 식별하기 위해 연구진은 "상위 10% 솔루션(Top 10% Solutions)"이라는 이진 측정 변수를 생성했다. 이는 솔루션의 품질 점수가 전체 표본 중 상위 10%에 속하면 1, 아니면 0으로 표시된다. 분석 결과, AI는 혁신적 성과를 향상시키는 데 기여했다. AI를 사용한 개인과 팀 모두 상위 10%에 속하는 솔루션을 생성할 가능성이 더 높았다.

특히 'AI를 사용하는 팀(Team + AI)'은 통제군(AI 없는 개인)의 평균(5.8%) 보다 상위 10% 솔루션을 생성할 확률이 9.2% 포인트 더 높았다. 이는 상위 10%에 속할 확률이 약 3배 더 높다는 것을 의미한다. 반면 'AI를 사용하는 개인'의 효과는 긍정적이었으나 통계적으로 유의미하지는 않았다. 이는 AI와 인간 팀워크의 결합이 평균적인 성과 향상뿐만 아니라, 조직 성공을 주도하는 돌파구형 솔루션을 생산하는 데 특히 강력할 수 있음을 시사한다.


6.2 Expected Quality (예상 품질)

연구진은 참가자들이 자신의 솔루션이 상위 10%에 들 것이라고 믿는지 여부를 나타내는 '예상 품질(Expected Quality)'을 측정했다. 흥미롭게도, 객관적인 성과는 향상되었음에도 불구하고 AI를 사용한 참가자들은 자신의 솔루션에 대해 실제보다 덜 자신감을 가졌다. AI 지원 참가자들은 통제군보다 자신의 솔루션이 상위 10%에 들 것이라고 예상할 확률이 9.2% 포인트 더 낮았다. 이는 실제 성과와 인식된 성과 사이에 불일치가 존재함을 시사한다.


6.3 Human Team Collaboration (인간 팀 협업)

AI가 팀 내 협업 방식에 미치는 영향을 분석하기 위해, 연구진은 팀이 제출한 솔루션의 유형(기술 중심 대 시장 중심) 분포를 조사했다.

AI가 없는 팀 (Team No AI): 솔루션 유형이 뚜렷한 이봉형 분포(bimodal distribution)를 보였다. 이는 솔루션이 기술적 방향이나 상업적 방향 중 한쪽으로 치우치는 경향이 있음을 나타낸다. 이는 아마도 팀 내에서 더 영향력 있는 구성원의 지배적인 관점을 반영하는 결과일 것이다.

AI가 있는 팀 (Team + AI): 솔루션이 더 균일한 단봉형 분포(unimodal distribution)를 보였다.

이러한 분포의 변화는 AI가 팀 협업에서 지배력 효과(dominance effects)를 줄이는 데 도움이 됨을 시사한다. AI는 기술적 관점과 상업적 관점 모두에서 더 균형 잡힌 기여를 촉진하는 역할을 했다.


6.4 Patterns of AI Use (AI 사용 패턴)

연구진은 참가자들이 AI를 '어떻게' 사용했는지 두 가지 측면에서 분석했다.

1) AI 생성 콘텐츠의 보유율 (Retention Rate)

이는 최종 제출물에서 AI가 생성한 문장이 차지하는 비율을 측정한 것이다. 분석 결과, 두 가지 뚜렷한 사용 패턴이 나타나는 양극화된 분포를 보였다.

높은 보유율 그룹: 상당수의 참가자가 AI가 생성한 콘텐츠의 75% 이상을 최종 솔루션에 유지했다. 이는 AI 역량을 많이 활용했음을 시사한다. 그러나 이것이 수동적인 채택을 의미하지는 않는다. AI 생성 콘텐츠 보유율이 100%인 참가자들은 평균(18.7개) 보다 더 많은 23.9개의 프롬프트를 사용하여, 단순한 복사-붙여넣기가 아닌 광범위한 반복적 상호작용을 했음을 보여준다.

제로(0) 보유율 그룹: 적지 않은 비율의 참가자들이 AI 생성 콘텐츠를 전혀 포함하지 않았다. 이들은 AI를 직접적인 콘텐츠 생성보다는 아이디어 구상, 브레인스토밍, 검증 목적으로 사용했다.

2) 솔루션 간 의미론적 유사성 (Semantic Similarity)

이는 각 조건 내에서 생성된 솔루션들이 서로 얼마나 유사한지를 측정한 것이다. AI의 도움을 받은 솔루션(개인+AI, 팀+AI)은 인간만이 작업한 솔루션보다 의미론적으로 더 높은 유사성을 보였다. 이는 LLM의 표준화 효과와 일치하는 결과이다. 그러나 연구진이 AI(GPT-4o)에게만 동일한 문제를 풀도록("AI Only") 했을 때, 그 결과물은 인간이 참여한 경우보다 훨씬 더 긴밀하게 군집화되었다(유사성이 훨씬 높았다).

결론적으로, AI 보유율이 높았음에도 불구하고 AI의 도움을 받은 인간의 솔루션은 '순수 AI'의 결과물보다 '인간 전용(human-only)' 솔루션에 의미론적으로 더 가까웠다. 이는 인간 참가자가 AI의 제안을 단순히 채택하는 것이 아니라, 의미 있게 다듬고 맥락화했음을 나타낸다.



7. Discussion and Conclusion (논의 및 결론)


본 연구는 직장 내 팀 협업에서 생성형 AI(GenAI)의 변혁적 잠재력에 대한 근본적인 통찰을 보여주며, 이는 이론과 실제 모두에 중요한 함의를 가진다. 연구 결과는 AI 통합이 단순히 기존 작업 프로세스를 보강하는 것이 아니라, 조직 환경에서 협업과 전문성의 본질 자체를 재편할 잠재력을 가지고 있음을 보여준다.


AI의 '팀원 대체' 효과와 한계

연구 결과는 먼저 AI가 없는 팀이 혼자 일하는 개인보다 약간 더 나은 성과(0.24 표준편차 향상)를 보임으로써, 교차 기능 협업의 전통적인 이점을 확인하는 것에서 시작한다.

그러나 AI의 도입은 이 성과 지형을 극적으로 재편한다. AI와 함께 일하는 개인은 AI 없이 혼자 일하는 기준선 대비 0.37 표준편차의 상당한 성과 향상을 보였다. 이 발견은 AI가 전통적으로 팀원들에 의해 제공되었던 다양한 전문 지식과 관점에 대한 접근을 개인에게 부여함으로써, 특정 협업 기능을 효과적으로 대체할 수 있음을 시사한다. 즉, AI가 진정한 팀원처럼 행동하는 것이다.

AI로 강화된 팀은 기준선 대비 0.39 표준편차의 비슷한 수준의 향상을 보였으며, AI를 사용하는 개인의 성과와 통계적으로 유의미한 차이가 없었다. 이러한 패턴은 AI의 즉각적인 영향이 인간 대 인간의 협업을 근본적으로 변화시키기보다는, 개인의 인지 능력을 강화하는 능력에서 더 많이 비롯됨을 시사한다.

이러한 결과 해석에는 두 가지 중요한 주의 사항이 있다.

참가자들은 AI 프롬프트 기술에 비교적 경험이 적었기 때문에, 관찰된 이점은 최소한의 수준(lower bound) 일 수 있다. 사용자가 더 정교한 AI 상호작용 전략을 개발함에 따라 이점은 상당히 증가할 수 있다.

사용된 AI 도구는 협업 작업 환경에 최적화되지 않았다. 목적에 맞게 제작된 협업 AI 시스템은 그룹 역학을 더 잘 지원하여 잠재적으로 훨씬 더 큰 이점을 이끌어낼 수 있다.

또한, 본 연구는 1일간의 가상 협업에 의존했으며 교차 기능 2인조에 초점을 맞췄다는 한계가 있다.


전문성 경계의 파괴

가장 두드러진 발견 중 하나는 전문성의 경계를 변화시키는 AI의 역할이다. AI가 없을 때, 커머셜 전문가는 상업적 솔루션을, R&D 전문가는 기술적 접근을 선호하는 명확한 직업적 사일로(silo)를 관찰했다. AI가 없는 팀은 교차 기능 협업을 통해 더 균형 잡힌 솔루션을 생산했다.

놀랍게도, AI를 사용하는 개인은 팀 협업을 통해 일반적으로 달성되는 지식 통합을 복제하여 스스로 비슷한 수준의 솔루션 균형을 달성했다. 이는 AI가 단순한 정보 제공자가 아니라, 전문가들이 전통적인 영역 경계를 넘어 추론하고 문제에 더 총체적으로 접근하도록 돕는 효과적인 '경계 확장 메커니즘(boundary-spanning mechanism)'으로 작동함을 시사한다.


긍정적 감정 반응과 '사이버네틱 팀원'

AI 통합의 감정적 함의는 특히 주목할 만하다. AI가 부정적인 직장 경험을 만들 것이라는 두려움과 달리, 본 연구는 AI 사용에 대해 지속적으로 긍정적인 감정 반응(흥분 및 열정 증가, 불안 및 좌절 감소)을 발견했다. GenAI의 상호작용 기능은 근로자에게 놀랍도록 긍정적인 경험을 생성하는 것으로 보이며, 이는 대화형 AI의 유익한 심리적 효과에 대한 새로운 증거와 일치한다.

이러한 결과는 AI가 더 이상 수동적인 도구가 아니라 '사이버네틱 팀원(cybernetic teammate)'으로 기능한다는 것을 나타낸다. GenAI는 실시간 피드백 제공, 교차 기능 전문성 연결, 심지어 감정 상태에 영향을 미침으로써 우리가 일반적으로 인간 협력자와 연관시키는 역할을 수행할 수 있는 능력을 보여준다. AI는 개인의 인지 작업을 향상시킬 뿐만 아니라, 아이디어 구상 및 반복적 개선과 같은 핵심적인 집단 기능을 복제한다.


조직적 함의

이러한 발견은 중요한 조직적 함의를 가진다.

팀 구성의 재고: AI 지원 개인이 전통적인 팀과 비슷한 수준으로 수행할 수 있다는 사실은 더 유연하고 효율적인 조직 구조의 기회를 시사한다.

최상위 솔루션의 시너지: 동시에, AI로 강화된 '팀'은 상위 10%에 속하는 제안을 생산할 가능성이 더 높았다. 이는 인간 협업과 AI 증강의 결합이 만들어내는 독특한 시너지를 강조하며, 조직의 목표(효율성 극대화 또는 혁신적 보완성 추구)에 따라 다른 전략이 필요함을 시사한다.

프로세스 및 기술 재설계: AI를 통해 더 짧은 시간에 더 포괄적인 솔루션(더 긴 솔루션)을 생산할 수 있게 됨에 따라, 작업 프로세스를 재설계하고 근로자의 AI 상호작용 역량에 투자해야 한다.


향후 연구 방향

향후 연구는 사용자가 AI 상호작용에 더 정교해짐에 따라 AI 통합의 이점이 어떻게 진화하는지(학습 곡선), AI 시스템의 어떤 기능이 지식 통합을 지원하는지, 그리고 장기적인 AI 사용이 도메인 전문성 개발에 어떤 영향을 미치는지(진정한 전문성 개발인지, 단순한 지식 접근인지) 탐구해야 한다.


결론

본 연구는 AI 채택이 팀 구조와 조직 설계에 대한 근본적인 가정을 재고할 필요가 있음을 보여준다. AI는 개인의 성과를 향상시키고 전문적 사일로를 허물며 긍정적인 감정 효과를 유발한다. AI는 더 이상 단순한 도구가 아니라 협업 네트워크의 적극적인 참여자로서, 팀이 형성되고 기능하는 조건을 재편하고 있다. 이는 '사이버네틱 팀의 새로운 과학(a new science of cybernetic teams)'을 요구한다.

keyword