AI가 인간에게 남긴 것은 전부 '어려운 일'이다
2023년 이후 전 세계 기업들이 생성형 AI 도입에 쏟아부은 투자금은 2,500억 달러를 넘어섰다. 이 거대한 지출의 근저에는 하나의 압도적인 기대가 있었다. AI가 반복적이고 지루한 업무를 대신 처리해주면, 인간은 더 가치 있는 일에 집중할 수 있을 것이라는 믿음이다. 문서 초안을 알아서 써주고, 데이터를 자동으로 정리해주고, 코드의 뼈대를 즉시 생성해주는 도구가 등장했으니, 당연히 사람들은 더 여유로워질 것이라고 생각했다. 경영진들은 이 기대를 숫자로 확인받고 싶어 했다. 생산성이 올라가고, 인력을 효율화하고, 비용이 절감되는 미래. 그것이 AI 도입을 승인한 이사회와 C-suite가 그린 청사진이었다.
그런데 현실은 정반대의 풍경을 보여주고 있다. 2024년 7월 Upwork Research Institute가 미국, 영국, 호주, 캐나다의 2,500명을 대상으로 실시한 대규모 조사에서, C-suite 경영진의 96%가 AI가 생산성을 높여줄 것이라 기대한다고 답했다. 그런데 같은 조사에서 실제로 AI를 사용하고 있는 직원의 77%는 AI가 오히려 자신의 업무량을 늘렸다고 응답했다. 96 대 77. 이 숫자의 간극이 AI 시대의 가장 불편한 진실을 압축하고 있다. 경영진이 상상하는 세계와 직원이 경험하는 세계가 완전히 다른 것이다. 더 구체적으로 들여다보면, 직원들은 AI가 생성한 결과물을 검토하고 수정하는 데 추가 시간을 쓰고 있었고(39%), AI 도구 자체를 학습하는 데 시간을 빼앗기고 있었으며(23%), AI 때문에 새로 생겨난 업무를 처리하느라 바빠졌다(21%). AI가 일을 줄여준 것이 아니라, AI를 위한 일이 새로 생긴 것이다.
Microsoft가 31개국 31,000명을 대상으로 실시한 2024 Work Trend Index 역시 같은 그림을 그린다. 지식노동자의 75%가 이미 업무에 AI를 사용하고 있었고, 이 수치는 불과 6개월 만에 두 배로 뛴 것이었다. 그런데 리더의 59%는 AI의 생산성 효과를 어떻게 측정해야 할지 모르겠다고 답했고, 60%는 자신의 조직에 AI 활용에 대한 비전 자체가 없다고 인정했다. 더 흥미로운 것은 AI 사용자의 78%가 회사가 제공한 도구가 아니라 자기가 알아서 찾은 도구를 쓰고 있었다는 점이다. 조직은 AI를 도입했다고 선언했지만, 실제로는 개인들이 각자도생하고 있는 셈이다. 방향 없이 도구만 던져준 것이다.
Slack Workforce Index의 2024년 가을 조사는 한 발 더 나아간 현실을 보여준다. 15개국 17,372명의 사무직 근로자를 대상으로 한 이 조사에서, 미국 직장인의 AI 도입률은 5개월간 고작 1%포인트 상승하는 데 그쳤다. 32%에서 33%로. 사실상 정체다. AI에 대한 전 세계적 흥분도는 같은 기간 6%포인트 하락했고, 전체 근로자의 3분의 2는 아직 AI 도구를 한 번도 써본 적이 없었다. 93%는 AI의 결과물을 완전히 신뢰하지 않는다고 답했고, 48%는 상사에게 AI를 사용했다고 말하는 것 자체가 불편하다고 했다. AI가 생산성 혁명을 가져왔다는 서사와, 대다수의 직원이 아직 AI를 써보지도 않았거나 써보고 실망했다는 현실 사이에는 거대한 균열이 있다.
기업 차원의 데이터도 이 균열을 확인해준다. McKinsey가 2025년 11월 발표한 State of AI 보고서에 따르면, 105개국 1,993명의 응답자 중 88%의 조직이 최소 하나의 기능에서 AI를 사용하고 있었고, 72%가 생성형 AI를 활용하고 있었다. 그러나 EBIT에 실질적 영향이 있다고 보고한 비율은 39%에 불과했고, 대부분은 EBIT의 5% 미만이라고 답했다. 전사적으로 AI를 확장한 기업은 전체의 3분의 1도 되지 않았고, 업무 프로세스 자체를 재설계한 기업은 21%에 그쳤다. 88%가 도입했지만 6%만이 실질적 성과를 내는 "AI 고성과 기업"에 해당했다. BCG의 2024년 10월 조사도 비슷한 결론에 도달한다. 59개국 1,000명의 CxO를 대상으로 한 이 조사에서 74%의 기업이 AI에서 가치를 창출하고 확장하는 데 어려움을 겪고 있었다. 개념증명(PoC) 이후 실제 비즈니스로 확장할 수 있는 기업은 26%에 불과했고, 지속적으로 유의미한 가치를 만들어내는 기업은 4%뿐이었다.
이 간극은 추상적인 통계에 머물지 않는다. 구체적인 기업 이름과 구체적인 실패가 있다. 스웨덴의 핀테크 기업 Klarna는 2024년 OpenAI 챗봇으로 약 700명의 고객 서비스 인력을 대체하면서 AI 전환의 모범 사례로 떠올랐다. 그러나 채 1년이 지나지 않아 고객 만족도가 하락하기 시작했고, CEO Sebastian Siemiatkowski는 비용 절감에 지나치게 집중한 나머지 서비스 품질이 떨어졌음을 인정했다. 2025년 봄, Klarna는 다시 인간 상담원을 채용하기 시작했다. McDonald's는 2021년부터 IBM과 협력하여 100개 이상의 미국 매장에서 AI 음성 주문 시스템을 시범 운영했지만, AI가 주문을 빈번하게 오해하고 원치 않는 메뉴를 추가하는 문제가 지속되어 2024년 6월 해당 파일럿을 종료했다. Microsoft 자신의 Copilot조차 어려움을 겪었다. Fortune 500 기업의 70%가 Copilot을 도입했지만, 유료 구독자 비율은 2025년 7월 18.8%에서 2026년 1월 11.5%로 오히려 줄었다. 정확도에 대한 순추천지수(NPS)는 마이너스 24.1까지 떨어졌고, 이탈한 사용자의 44.2%가 "답변을 신뢰할 수 없어서"를 이유로 꼽았다.
Gartner는 2024년 7월, 생성형 AI 프로젝트의 최소 30%가 개념증명 단계 이후 폐기될 것이라 예측했다. S&P Global에 따르면, AI 이니셔티브의 대부분을 포기한 기업의 비율은 2024년 17%에서 2025년 42%로 급증했다. MIT NANDA 연구는 300개 이상의 이니셔티브를 분석한 결과, 생성형 AI 파일럿 프로젝트의 95%가 실질적 성과를 내지 못한다는 결론에 도달했다. 노벨 경제학상 수상자 Daron Acemoglu는 AI로 인한 향후 10년간의 생산성 향상을 0.5%로 전망했다. 연방준비은행 세인트루이스 지부는 2022년 말 ChatGPT 출시 이후 누적 초과 생산성 증가가 1.9%에 불과하다고 보고했다.
문제의 본질은 AI의 성능에 있지 않다. AI는 분명히 특정 태스크에서 인간보다 빠르고 정확하다. 문제는 그 성능이 "인간이 편해지는 것"으로 자동 변환되리라는 착각에 있다. AI가 어떤 일을 대신해주면, 그 빈자리에 쉬는 시간이 들어올 것이라는 가정. 이 가정이 틀렸다. AI가 하나의 태스크를 해치우면, 그 자리에는 이전에는 시도조차 하지 않았던 새로운 태스크가 밀려들어온다. 생산성은 올라갔다. 그런데 사람은 더 바빠졌다. 이 역설의 구조를 이해하는 것이 AI 시대를 제대로 읽는 출발점이다.
AI가 업무를 줄여주지 않는 이유는 단순하다. AI가 제거하는 것은 "일" 자체가 아니라 "특정 태스크"이기 때문이다. 그리고 그 태스크가 사라진 자리에는 빈 시간이 남는 것이 아니라, 이전에는 할 수 없었거나 시도하지 않았던 새로운 일이 즉시 채워진다. 이것이 AI 도입 이후 벌어지고 있는 가장 핵심적인 현상이다.
HBR에 게재된 UC Berkeley 연구팀의 8개월간 민족지학적 연구는 이 현상을 생생하게 포착했다. 미국의 약 200명 규모 기술 회사에서, 연구진은 주 2일 현장 관찰, 내부 커뮤니케이션 채널 추적, 40회 이상의 심층 인터뷰를 수행했다. 가장 먼저 눈에 띈 변화는 "업무 영역의 확장(Task Expansion)"이었다. AI가 지식의 공백을 메워주자, 사람들은 원래 자신의 영역이 아니었던 일에 손을 대기 시작했다. 프로덕트 매니저와 디자이너가 코드를 짜기 시작했고, 연구원이 엔지니어링 태스크를 수행했으며, 조직 전반에서 사람들이 이전이라면 외주를 주거나 다른 부서에 넘겼을 일을 직접 시도했다.
이 현상은 이 회사만의 특이한 사례가 아니다. Anthropic이 2025년 8월 자사 내부에서 실시한 연구 — 132명의 엔지니어 설문과 53건의 심층 인터뷰 — 에서도 동일한 패턴이 발견되었다. 보안 팀이 자신에게 익숙하지 않은 코드를 AI의 도움으로 분석하고, 리서치 팀이 프론트엔드 시각화를 직접 구축하고, 비기술 직군의 직원이 네트워크 문제를 디버깅하는 일이 벌어지고 있었다. Anthropic의 연구는 이를 두고 "코딩을 하는 사람과 하지 않는 사람 사이의 장벽이 점점 허물어지고 있다"고 표현했다. 개인이 점점 더 "풀스택"화되고 있는 것이다. 한 사람이 이전에는 세 사람이 나누어 하던 역할을 수행할 수 있게 된 것처럼 보이지만, 실제로는 한 사람이 세 사람 분의 인지적 부담을 짊어지게 된 것이기도 하다.
이 흐름을 상징적으로 보여주는 것이 Vibe Coding 현상이다. 전 Tesla AI 디렉터이자 OpenAI 공동 창립 멤버인 Andrej Karpathy가 2025년 2월 2일 소셜미디어에서 처음 사용한 이 용어는, 코드 자체를 이해하지 않고도 AI에게 자연어로 지시하여 소프트웨어를 만드는 방식을 가리킨다. Karpathy는 이를 "분위기에 완전히 몸을 맡기고, 코드가 존재한다는 사실 자체를 잊는 새로운 종류의 코딩"이라고 묘사했다. 이 게시물은 450만 회 이상 조회되었고, 관련 검색량은 2025년 봄 6,700% 폭증했다. Collins Dictionary는 이를 2025년 올해의 단어로 선정했다. Y Combinator의 2025년 겨울 배치에서는 스타트업의 25%가 코드베이스의 95% 이상을 AI로 생성했다고 밝혔다.
Vibe Coding은 흥미로운 실험이지만, 그것이 실제 업무 환경에 유입될 때 만들어내는 파급 효과는 복잡하다. 코드를 직접 짜본 적 없는 PM이 AI로 프로토타입을 만들면, 그 코드를 검토하고, 수정하고, 실제 프로덕션 환경에서 작동하게 만드는 일은 결국 엔지니어의 몫이 된다. UC Berkeley 연구에서 엔지니어들은 동료가 AI의 도움으로 작성한 코드를 리뷰하고, 교정하고, 가이드하는 데 점점 더 많은 시간을 소비하고 있었다. 이 감독 업무는 공식적인 코드 리뷰를 넘어서, Slack 스레드나 자리 옆에서의 비공식적 상담으로 확장되었다. AI가 비전문가의 참여를 가능하게 했지만, 그 결과물의 품질을 보증하는 부담은 전문가에게 전가된 것이다.
CodeRabbit이 2025년 12월에 470개의 오픈소스 GitHub Pull Request를 분석한 결과는 이 우려를 수치로 확인해준다. AI가 공동 작성한 코드에서 "주요 이슈(major issues)"는 1.7배, 보안 취약점은 2.74배, 설정 오류는 75% 더 많이 발견되었다. Stack Overflow의 2025 개발자 서베이에서 84%의 개발자가 AI 도구를 사용하거나 사용할 계획이 있다고 답했지만, 72%는 Vibe Coding이 자신의 전문적 업무의 일부가 아니라고 답했다. 문화적 유행과 실제 전문적 실천 사이에는 분명한 간극이 존재한다. 그리고 그 간극을 메우는 일 — 검토, 수정, 교육, 통합 — 은 모두 인간의 추가 노동이다.
Gartner는 전문 개발자 대 시민 개발자(Citizen Developer)의 비율이 1대 4가 될 것이라 전망한다. 전체 커스텀 애플리케이션의 약 60%가 이미 IT 부서 바깥에서 만들어지고 있으며, 30%는 기술적 배경이 제한적이거나 아예 없는 직원들이 만들고 있다. 이것은 민주화이면서 동시에 혼란의 원천이다. 더 많은 사람이 더 많은 것을 만들 수 있게 되었지만, 그 결과물의 품질 관리, 보안 점검, 시스템 통합은 사라지지 않는다. 오히려 관리해야 할 대상이 기하급수적으로 늘어난다.
AI가 제거한 것은 반복적인 실행의 부담이다. 그러나 AI가 만들어낸 것은 그보다 더 큰 것이다. 이전에는 존재하지 않았던 가능성의 영토가 열렸고, 인간은 본능적으로 그 영토를 채우려 한다. UC Berkeley 연구의 참여자들은 이것을 "AI와 함께 이것저것 시도해보는 것"이라고 가볍게 표현했지만, 그 실험들은 시간이 지나면서 업무 범위의 실질적 확대로 축적되었다. 과거라면 추가 인력이나 외주를 정당화했을 일들을 개인이 흡수하기 시작한 것이다. 일이 줄어든 것이 아니라, 할 수 있는 일의 영토가 확장된 것. 그리고 영토가 확장되면, 인간은 그 영토를 채운다. 이것이 AI 시대의 첫 번째 역설이다.
AI가 대체하는 업무에는 분명한 패턴이 있다. 입력과 출력 사이의 관계가 명확하고, 과거 데이터에서 패턴을 추출할 수 있으며, 정답의 형태가 비교적 정해져 있는 일들이다. 이메일 초안 작성, 회의록 요약, 데이터 정리와 분류, 코드의 반복적 구조 생성, 문서 서식 정리, 일정 관리, 기본적인 고객 응대. 이것들은 많은 지식노동자들의 하루를 구성하던 핵심 활동이었고, AI는 이 영역에서 압도적인 속도와 정확성을 보여준다.
그런데 이 태스크들이 사라진 뒤, 인간의 하루에 무엇이 남는지를 들여다보면 풍경이 달라진다. 남는 것은 전부 AI가 하지 못하는 일이다. 어떤 프로젝트를 시작할지 결정하는 일. 세 개의 선택지 중 어떤 방향이 6개월 뒤에 옳을지 판단하는 일. 이해관계가 충돌하는 팀 사이에서 우선순위를 조율하는 일. 불완전한 정보 속에서 지금 당장 결정을 내려야 하는 일. 고객이 진짜 원하는 것이 무엇인지 언어 너머에서 읽어내는 일. 이것들은 모두 맥락에 의존하고, 모호성 위에 서 있으며, 정답이 하나로 수렴하지 않는 일이다. 한마디로, 어려운 일이다.
HBS와 BCG가 공동으로 수행한 'Jagged Technological Frontier' 연구는 이 구조를 실증적으로 보여준다. 758명의 BCG 컨설턴트를 대상으로 한 현장 실험에서, AI의 능력 경계 안쪽에 있는 태스크에서는 AI 사용자가 비사용자보다 유의미하게 높은 성과를 냈다. 그러나 AI의 능력 경계 바깥에 있는 태스크 — 복잡한 판단, 맥락 해석, 전략적 사고가 필요한 영역 — 에서는 AI를 사용한 그룹이 오히려 더 낮은 품질의 결과물을 내놓았다. AI가 잘하는 영역에서 AI를 쓰면 성과가 올라가지만, AI가 못하는 영역에서 AI에 의존하면 성과가 떨어진다. 문제는 업무 현장에서 이 두 영역의 경계가 명확하지 않다는 것이고, AI가 반복적 태스크를 흡수할수록 인간에게 남겨지는 일이 점점 더 후자의 영역으로 수렴한다는 것이다.
Microsoft Research와 Carnegie Mellon 대학이 CHI 2025에서 발표한 연구는 더 근본적인 경고를 던진다. 319명의 지식노동자를 대상으로 한 이 조사에서, AI를 사용한 업무의 40%에서 작업자는 비판적 사고를 전혀 적용하지 않았다. AI에 대한 신뢰가 높을수록, 결과물에 대한 비판적 관여는 오히려 줄어들었다. 이것은 직관에 반하는 위험한 패턴이다. AI가 쉬운 일을 처리해주면 인간은 어려운 일에 집중할 여유가 생길 것이라는 가정은, 인간이 실제로 그 "어려운 일"을 하려는 의지와 능력을 유지한다는 전제 위에 서 있다. 그러나 데이터는 반대 방향을 가리킨다. AI가 인지적 노력의 일부를 대신해주자, 인간은 남은 영역에서도 인지적 노력을 줄이는 방향으로 기울고 있는 것이다.
Google의 DORA(DevOps Research and Assessment) 2024 리포트는 이 현상을 조직 수준에서 확인한다. AI 도입이 25% 증가할 때마다 배포 안정성은 7.2% 감소했고, 처리량은 1.5% 줄었다. 개발자의 39%는 AI가 생성한 코드를 거의 또는 전혀 신뢰하지 않는다고 답했다. Faros AI가 10,000명 이상의 개발자를 분석한 결과는 더 흥미로운 분리 현상을 보여준다. 개인 수준에서는 21% 더 많은 태스크를 완료하고 98% 더 많은 Pull Request를 처리했지만, 조직 전체의 배포 지표는 변화가 없었다. 개인은 더 많이 움직이고 있는데 조직의 결과물은 나아지지 않는 것. 이 간극은 AI가 만들어낸 추가 활동의 상당 부분이 실질적 가치 창출이 아니라 관리, 검토, 조율이라는 간접 업무에 흡수되고 있음을 암시한다.
GitClear가 2020년부터 2024년까지 2억 1,100만 줄의 코드를 분석한 결과는 이 구조의 장기적 귀결을 보여준다. 코드 리팩토링 비율은 25%에서 10% 미만으로 급감했고, 코드 복제(Cloning) 비율은 8.3%에서 12.3%로 상승했다. AI가 코드를 빠르게 생성해주지만, 그 코드를 정리하고 구조적으로 개선하는 인간의 작업은 줄어들고 있다는 뜻이다. 기술 부채(Technical Debt)가 조용히 축적되고 있는 것이다. 현재 GitHub Copilot은 사용자 코드의 평균 46%를 생성하고 있으며 Java에서는 61%에 달한다. 그런데 개발자의 71%는 AI가 생성한 코드를 수동 리뷰 없이 머지하지 않는다고 답했다. 이것이 만들어내는 감독 부담은 막대하다.
결국 AI가 만들어낸 변화의 본질은 이것이다. 쉬운 일은 AI가 가져갔다. 남은 것은 전부 어려운 일이다. 방향을 설정하고, 맥락을 읽고, 모호성 속에서 결정을 내리고, AI의 결과물이 맞는지 틀린지 판단하고, 여러 이해관계를 조율하는 일. 이 일들은 더 많은 인지적 에너지를 소모하고, 더 높은 수준의 전문성을 요구하며, 더 깊은 피로를 유발한다. AI가 인간의 업무를 "편하게" 해준 것이 아니라, 인간이 해야 하는 업무의 평균 난이도를 구조적으로 끌어올린 것이다.
지금까지 대부분의 직장인이 자신의 가치를 증명하는 방식은 비교적 명확했다. 시키는 일을 빠짐없이, 정확하게, 꾸준히 수행하는 것. 매일 같은 시간에 출근하여 같은 형식의 보고서를 쓰고, 데이터를 정해진 양식에 맞추어 정리하고, 반복되는 프로세스를 충실하게 따라가는 것. 이런 성실함은 조직 안에서 분명한 보상 체계와 연결되어 있었다. 꼼꼼한 사람이 인정받았고, 빠짐없이 처리하는 사람이 신뢰를 얻었으며, "맡기면 알아서 잘 해놓는 사람"이 승진의 최전방에 섰다. 이 구조에서 대다수의 직장인은 성실한 실행으로 직업적 정체성을 구축했고, 반복적인 업무의 완수에서 작지만 분명한 성취감을 느꼈다.
그런데 AI가 정확히 이 영역을 가져갔다. 보고서 초안은 AI가 10초 만에 쓴다. 데이터 정리는 자동화된다. 이메일 요약은 한 번의 클릭으로 끝난다. 코드의 반복적인 구조는 AI가 순식간에 생성한다. 성실하게 수행하던 일의 상당 부분이 AI의 영역으로 넘어가면서, "성실한 실행"이라는 가치의 시장 가격이 급락하고 있다. 이것은 단순히 특정 직무가 자동화되는 문제가 아니다. 많은 사람들의 직업적 자존감의 기반이 되었던 것, 매일의 근무에서 의미를 부여하던 그 토대가 흔들리는 문제다.
기존의 조직 구조는 암묵적으로 1%의 리더와 99%의 팔로어라는 역할 분담 위에 세워져 있었다. 소수의 리더가 방향을 정하고, 전략을 수립하고, 모호한 상황에서 결정을 내렸다. 나머지 대다수는 그 방향에 따라 구체적인 실행을 담당했다. 이 구조에서 99%에게 요구되는 핵심 역량은 실행력과 성실성이었지, 방향 설정이나 전략적 판단이 아니었다. "무엇을 해야 하는지"는 위에서 내려왔고, "어떻게 해야 하는지"도 대부분 정해진 프로세스가 있었다. 개인에게 남은 것은 그 안에서 얼마나 빠르고 정확하게 실행하느냐의 문제였다.
AI는 이 구조의 하부를 통째로 흡수하고 있다. 정해진 방향에 따라 정해진 방식으로 실행하는 일, 그것이 정확히 AI가 가장 잘하는 영역이기 때문이다. 그 결과, 99%에게도 1%에게 요구되던 역량이 요구되기 시작한다. "무엇을 해야 하는가"를 스스로 정의할 수 있는 능력. "왜 이 방향이어야 하는가"를 설명할 수 있는 능력. AI가 내놓은 결과물을 보고, 이것이 맥락에 맞는지 판단할 수 있는 능력. 불완전한 정보와 모호한 상황에서 결정을 내리는 능력. 이것은 전통적으로 "리더십"이라 불리던 역량이다. AI 시대에는 이 역량이 조직의 모든 층위에서 요구된다.
문제는, 이 전환이 대다수에게 해방이 아니라 고통이라는 점이다. "이제 반복 업무에서 벗어나 더 창의적인 일을 할 수 있다"는 서사는 맞는 말이지만, 그 서사가 간과하는 것이 있다. 많은 사람들은 반복 업무를 싫어하지 않았다. 오히려 그 안에서 안정감을 찾았다. 매일 같은 유형의 일을 처리하면서 "오늘도 내 할 일을 다 했다"는 완결감은 직업 생활의 중요한 심리적 보상이었다. 그런데 이제 남겨진 일은 완결감을 주지 않는다. 방향 설정은 "끝"이 없고, 판단은 항상 불확실하며, 전략적 사고는 명확한 정답을 돌려주지 않는다. 성실하게 일한 하루의 끝에서 "다 했다"고 느낄 수 있었던 사람들이, 이제는 하루 종일 일했는데도 "뭘 한 거지?"라는 공허함을 경험하는 것이다.
데이터는 이 고통을 숫자로 보여준다. Upwork Research Institute의 2025년 후속 연구는 가장 충격적인 발견을 담고 있다. AI를 가장 적극적으로 활용하여 가장 높은 생산성을 보여주는 고성과자 그룹에서, 88%가 번아웃을 보고했다. 이 그룹은 AI를 덜 활용하는 그룹에 비해 퇴사 의향이 2배 높았다. AI를 가장 잘 쓰는 사람이 가장 지치고 있다는 것. 이것은 AI의 문제가 아니라, AI가 인간에게 남겨놓은 일의 본질이 달라졌다는 구조적 문제의 증거다. 이 고성과자들의 3분의 2는 AI를 동료보다 더 신뢰한다고 답했고, 64%는 인간 동료보다 AI와의 관계가 더 낫다고 말했다. 생산적이지만 고립되고, 효율적이지만 소진되는 역설적 상태이다.
Gallup의 2025 State of the Global Workplace 보고서는 이 현상의 글로벌한 규모를 보여준다. 160개국 250,000명을 대상으로 한 이 조사에서, 전 세계 직원 참여도는 2024년에 21%로 하락했다. COVID-19 봉쇄 이후 가장 큰 하락폭이었다. 미국의 직원 참여도는 31%로, 10년 내 최저치를 기록했다. 전 세계 직원의 41%가 매일 "상당한 수준의 스트레스"를 경험한다고 답했다. AI가 도입되고, 생산성 지표가 올라가는 동안, 실제로 일하는 사람들의 심리적 상태는 오히려 악화되고 있는 것이다.
HBR에 게재된 De Cremer와 Koopman의 연구는 이 악화의 특정한 경로를 밝힌다. 여러 기업에 걸친 조사에서, AI를 핵심 업무 도구로 사용하는 직원들이 그렇지 않은 직원들에 비해 더 외롭다고 느끼고, 음주량이 늘었으며, 불면증이 심해졌다. Northeastern University의 2024년 연구는 이 메커니즘을 더 구체적으로 설명한다. AI를 많이 사용하는 직원일수록 인간과의 연결에 대한 욕구가 강해지지만, 실제로 그 욕구가 충족되지 않는 구조적 간극이 존재한다는 것이다. AI가 동료의 역할 일부를 대체하면서, 이전에는 자연스럽게 발생하던 인간 간 상호작용의 빈도와 깊이가 줄어들었다. 협업이 필요 없어진 것이 아니라, 협업의 계기가 사라진 것이다.
International Journal of Information Management에 2025년 게재된 600명 대상 3차 종단 조사는 이 과정을 시간 축에서 추적한다. AI 관련 테크노스트레스가 증가할수록 직원의 소진은 심해지고, 일-가정 갈등이 악화되며, 직무 만족도가 하락했다. Frontiers in Artificial Intelligence에 발표된 2025년 연구에서는 젊은 전문직 종사자들이 AI 의존도 증가에 따라 자신의 창의적 역량이 퇴화하고 있다는 불안감을 보고했다. 성실한 실행에서 정체성을 찾던 사람들이 AI에게 실행을 빼앗기고, 대신 떠맡게 된 판단과 설계의 영역에서 자신의 역량 부족을 절감하는 것. 이것이 AI 시대가 99%에게 안기는 구조적 위기의 본질이다.
이 전환은 특정 산업이나 특정 직군에 한정되지 않는다. AI가 가장 먼저 진입한 소프트웨어 개발 분야에서 번아웃률이 47%로 전 산업 최고를 기록한 것은 우연이 아니다. AI 도구를 가장 빨리, 가장 많이 사용한 영역에서 인간적 비용도 가장 먼저, 가장 크게 나타나고 있다. 이것은 다른 산업들이 AI 도입을 확대하면서 같은 경로를 밟게 될 것이라는 선행 지표다.
AI 시대에 인간에게 요구되는 핵심 역량은 프롬프트 엔지니어링이 아니다. 프롬프트는 도구의 사용법일 뿐이고, 도구의 사용법은 도구가 바뀌면 함께 바뀐다. 변하지 않는 것은 도구 너머에 있는 역량이다. 무엇을 만들지 정하는 능력. 왜 이 방향이어야 하는지 근거를 가지고 설명하는 능력. AI의 결과물을 받아들고 그것이 현재 맥락에서 적절한지 부적절한지를 판단하는 능력. 정보가 불완전하고 상황이 모호할 때에도 결정을 내리고 그 결정에 책임을 지는 능력. 이것들은 오랫동안 "리더십"이라는 이름으로 조직의 소수에게만 요구되던 역량이다. AI 시대에는 이 역량이 조직의 모든 구성원에게 필요하다.
왜 그런지를 이해하려면, AI가 조직 내 역할 분배를 어떻게 재편하고 있는지를 봐야 한다. 이전의 조직에서 주니어 직원의 역할은 비교적 명확했다. 시니어가 설계한 프레임 안에서 구체적인 실행을 담당하는 것이다. 리서치 자료를 모으고, 발표 자료의 초안을 만들고, 데이터를 정리하고, 회의록을 작성하는 일. 이 일들은 그 자체로 가치가 있었을 뿐 아니라, 주니어가 조직의 맥락을 체득하고 판단력을 길러가는 학습의 과정이기도 했다. 그런데 AI가 이 실행 단계의 상당 부분을 흡수하면서, 주니어에게 남겨지는 역할이 달라지고 있다. 자료를 모으는 것이 아니라 어떤 자료가 필요한지 정의하는 것. 초안을 쓰는 것이 아니라 AI가 쓴 초안의 방향이 맞는지 검증하는 것. 이것은 경험이 적은 사람에게 경험 많은 사람의 판단을 요구하는 구조적 모순이다.
HBS와 BCG의 'Jagged Technological Frontier' 연구가 정확히 이 지점을 짚는다. 연구진은 AI의 능력이 매끄러운 선이 아니라 울퉁불퉁한 경계(jagged frontier)를 가진다는 것을 발견했다. 어떤 태스크에서는 인간 전문가를 압도하고, 바로 옆의 비슷해 보이는 태스크에서는 완전히 실패한다. 이 경계를 읽는 능력 — AI가 잘하는 영역과 못하는 영역을 실시간으로 판별하는 능력 — 자체가 새로운 핵심 역량으로 부상하고 있다. 그런데 이 능력은 AI를 많이 써봤다고 자동으로 길러지지 않는다. 오히려 해당 도메인에 대한 깊은 이해가 전제되어야 한다. AI의 결과물이 틀렸다는 것을 알려면, 맞는 답이 무엇인지를 먼저 알고 있어야 하기 때문이다.
이것이 "모두가 리더여야 한다"는 명제의 실질적 의미다. 과거에 리더에게 요구되었던 역량 — 불확실성 속에서의 의사결정, 다양한 정보원의 신뢰도 평가, 전체 맥락 안에서의 우선순위 설정, 결과에 대한 책임 의식 — 이 이제 개별 기여자(Individual Contributor)에게도 일상적으로 요구된다. AI가 초안을 만들어주고, 데이터를 분석해주고, 옵션을 제시해주는 상황에서, 인간의 역할은 "그중에 무엇을 선택하고 왜 그 선택을 하는지"를 결정하는 것으로 수렴한다. 선택과 판단. 이것이 AI 시대에 인간에게 남겨진 고유 영역이다.
Cal Newport는 이 전환의 방향을 "실행의 속도에서 사고의 깊이로"라는 프레임으로 제시한다. 그의 Slow Productivity 프레임워크는 세 가지 원칙으로 구성된다. 더 적은 수의 일에 집중하고, 자연스러운 속도로 작업하며, 결과물의 질에 집착하는 것. 이것은 AI 시대 이전에 제안된 프레임워크이지만, AI 시대에 와서 오히려 더 절실한 의미를 갖는다. AI가 속도와 양의 문제를 해결해줄수록, 인간이 차별화할 수 있는 유일한 영역은 깊이와 질이 되기 때문이다. Newport는 많은 조직이 "의사 생산성(pseudo-productivity)" — 눈에 보이는 바쁨을 실제 생산적 성과와 혼동하는 것 — 에 갇혀 있다고 진단하며, AI가 이 함정을 심화시킬 위험이 있다고 경고한다. AI로 더 많은 결과물을 더 빠르게 쏟아내는 것이 생산성이 아니라, 정말로 중요한 문제를 깊이 있게 해결하는 것이 생산성이라는 것이다.
Adam Grant는 Wharton에서 현대 직장의 인간 중심적 측정 수준에 "C 마이너스" 학점을 매긴다. 그는 개인의 산출량뿐 아니라 다른 사람의 성과를 어떻게 끌어올리는지를 평가해야 한다고 주장한다. AI 시대에 이 관점은 특히 중요해진다. AI가 개인의 실행력을 증폭시켜주는 상황에서, 차별화되는 인간의 가치는 "혼자 더 많이 하는 것"이 아니라 "함께 더 나은 방향을 찾는 것"에 있기 때문이다. 조율, 설득, 공감, 갈등 해결. 이것들은 AI가 흉내 낼 수 없는 영역이며, 동시에 전통적으로 "리더의 소양"으로 분류되던 역량이다.
구체적으로, AI 시대에 개인이 갖춰야 할 역량 전환의 방향은 몇 가지 축으로 정리된다. 첫째, 실행력에서 설계력으로. "어떻게 하느냐"의 문제에서 "무엇을 왜 하느냐"의 문제로 무게중심이 이동한다. 둘째, 정보 처리에서 맥락 판단으로. 정보를 수집하고 정리하는 능력은 AI가 압도적이다. 인간에게 남는 것은 그 정보가 현재 상황에서 어떤 의미를 갖는지 해석하는 능력이다. 셋째, 지시 수행에서 자기 주도적 의사결정으로. 누군가가 "이것을 해라"라고 말해주기를 기다리는 것이 아니라, 스스로 "이것을 해야 한다"는 판단을 내리고 실행으로 옮기는 능력. 넷째, 전문 분야의 깊이에서 경계를 넘나드는 유연성으로. Anthropic의 내부 연구가 보여주듯, AI는 개인의 활동 반경을 넓혀주지만, 그 넓어진 반경에서 효과적으로 작동하려면 자기 전문 분야의 깊이와 함께 인접 영역에 대한 이해가 필요하다.
이 전환은 쉽지 않다. 특히 오랫동안 실행 중심의 역할에서 전문성을 쌓아온 사람들에게, "이제 설계하고 판단하라"는 요구는 갑작스럽고 당혹스럽다. 그러나 이것은 선택의 문제가 아니다. AI가 실행의 영역을 흡수하는 속도는 가속하고 있고, 그 흡수가 진행될수록 인간에게 남겨지는 역할은 점점 더 설계와 판단의 영역으로 수렴한다. 준비가 되었든 되지 않았든, 이 전환은 이미 시작되었다.
AI가 도입되면 인간의 역할이 편해질 것이라는 기대는 역사를 돌아보면 구조적으로 틀린 기대임을 알 수 있다. 기술이 특정 영역의 효율을 높여주면, 그 영역의 기준이 올라가면서 결국 인간의 부담은 줄어들지 않는다. 이것은 예외적인 현상이 아니라, 기술과 노동의 관계에서 반복되어 온 역사적 패턴이다.
Ruth Schwartz Cowan은 1985년 저서 "More Work for Mother"에서, 20세기 초 가전제품의 등장이 가사노동을 어떻게 변화시켰는지를 추적했다. 세탁기, 냉장고, 진공청소기, 전기 다리미. 이 도구들은 분명히 개별 작업의 효율을 높였다. 빨래를 손으로 빠는 것보다 세탁기가 빠르고, 빗자루보다 진공청소기가 효과적이다. 그러나 결과적으로 가사노동 시간은 줄어들지 않았다. Joann Vanek의 연구에 따르면, 1924년에 비취업 여성이 주당 약 52시간을 가사노동에 쓰고 있었는데, 가전제품이 대중화된 1960년대에는 오히려 55시간으로 늘어났다. 전기세탁기에 대한 장기 추적 연구(1925~1965)는 세탁 시간이 오히려 증가했음을 보여준다. 이유는 단순했다. "사람들이 옷을 더 많이 갖게 되었고, 더 자주 빨게 되었다." 효율이 올라가자 기준이 올라간 것이다. UC San Diego의 경제학자 Valerie Ramey는 2008년 연구에서 가전제품이 "1965년 이전까지 가사노동 시간에 거의 영향을 미치지 못했다"고 결론지었다. 가전제품이 대체한 것은 노동 자체가 아니라 하인과 도우미였다. 기술이 제거한 것은 인간의 수고가 아니라 다른 인간의 도움이었고, 남겨진 모든 일은 한 사람의 몫으로 집약되었다.
이메일도 같은 경로를 밟았다. McKinsey에 따르면 현재 지식노동자는 주당 업무 시간의 28%, 즉 11~12시간을 이메일 관리에 쓰고 있다. 전 세계 일일 이메일 발송량은 2017년 2,690억 통에서 2025년 3,760억 통 이상으로 증가했다. Harvard Business School의 연구에 따르면, 이메일이 보편화된 이후 평균 근무일이 8.2% 연장되었다. 커뮤니케이션 도구가 커뮤니케이션을 줄여준 것이 아니라, 커뮤니케이션의 총량과 속도를 폭발적으로 늘린 것이다. 스마트폰은 이 패턴을 시간과 공간의 차원으로 확장했다. NIH(미국 국립보건원)에 게재된 스코핑 리뷰(2024)에 따르면, 23개 연구 중 19개(83%)에서 업무 시간 외 스마트폰 사용과 일-삶 갈등 사이에 유의미한 상관관계가 확인되었다.
이 반복되는 패턴의 밑바닥에는 하나의 경제학 원리가 있다. 제번스 역설(Jevons Paradox)이다. 영국의 경제학자 William Stanley Jevons는 1865년, 증기 기관의 석탄 효율이 개선될수록 석탄 소비량이 오히려 증가한다는 역설적 현상을 관찰했다. 효율이 좋아지면 단위당 비용이 낮아지고, 비용이 낮아지면 사용량이 늘어난다. 절약이 아니라 확대가 일어나는 것이다. 이 원리는 에너지에만 적용되는 것이 아니다. 인지 노동에도 정확히 같은 역학이 작동한다. AI가 문서 작성의 효율을 3배로 높여주면, 사람들은 문서를 3분의 1만 쓰는 것이 아니라 3배 더 많은 문서를 만들어낸다. 방사선과 영역의 사례가 이를 구체적으로 보여준다. AI 진단 보조 도구가 의료 영상 판독을 빠르게 해주자, 의사들은 여유 시간에 쉬는 것이 아니라 더 많은 검사를 지시하기 시작했다. Georgetown CSET의 Jack Karsten이 발견한 것처럼, AI는 방사선과 전문의를 대체하는 것이 아니라 오히려 이들의 업무량을 증가시키고 서비스 수요를 높이고 있다. Microsoft CEO Satya Nadella가 2025년 1월 AI와 관련하여 제번스 역설을 공개적으로 언급한 것은, 이 구조가 업계 최고 경영자 수준에서도 인식되고 있음을 보여준다.
이 역사적 맥락에서 현재의 AI를 바라보면, 결론은 명확하다. AI가 도입되었다고 인간의 역할이 편해질 것이라는 생각은, 세탁기가 가사노동을 줄여줄 것이라는 기대와 구조적으로 동일한 착각이다. 효율이 올라가면 기준이 올라간다. 기준이 올라가면 요구되는 역량도 올라간다. AI 시대에 인간이 해야 할 일은 AI와 경쟁하는 것이 아니라, AI가 올려놓은 새로운 기준선 위에서 더 높은 지적 수준과 설계 능력을 갖추는 것이다.
이것은 개인의 노력만으로 되는 일이 아니다. 조직이 이 전환을 지원할 수 있는 구조를 만들어야 한다. HBR의 연구진은 이를 "AI 프랙티스(AI Practice)" — AI 사용에 관한 의도적 규범과 루틴의 집합 — 라고 명명했다. 그 핵심은 세 가지다.
첫째, 의도적 멈춤(Intentional Pauses). AI가 업무 속도를 가속시키는 환경에서, 인위적으로 멈추는 순간을 설계해야 한다. Gloria Mark의 연구에 따르면 현재 인간의 화면 주의 지속 시간은 평균 47초에 불과하며, 컨텍스트 스위칭은 코르티솔 분비와 혈압 상승을 유발한다. Microsoft가 Viva Insights에 도입한 Focus Time 기능 — 캘린더를 차단하고, 알림을 무음으로 전환하며, 회의 초대를 방지하는 기능 — 은 이 원칙의 기술적 구현이다. 중요한 의사결정 전에 반드시 하나의 반론과 조직 목표와의 명시적 연결을 요구하는 "결정 멈춤(Decision Pause)" 같은 절차는, 속도가 아닌 방향을 점검하는 장치가 된다.
둘째, 업무 순서화(Sequencing). AI가 백그라운드에서 끊임없이 결과물을 생성하는 환경에서, 그 결과물에 실시간으로 반응하는 것이 아니라 일의 흐름을 의도적으로 조절하는 것이다. MIT Sloan Management Review의 76개 기업 조사에 따르면, 회의를 40% 줄인(주 2일 회의 없는 날 시행) 기업에서 생산성이 71% 증가했다. 최적 구성은 주 3일의 회의 없는 날이었으며, 이때 협력은 55% 증가하고 마이크로매니지먼트는 68% 감소했다. Shopify는 2023년 초 3인 이상 참석하는 모든 정기 회의를 취소하고 수요일을 회의 없는 날로 지정하여, 10,000~12,000개의 일정(76,500시간)을 제거했다.
셋째, 인간적 접지(Human Grounding). AI가 개인의 자기 완결적 업무를 가능하게 할수록, 의도적으로 인간 간 연결의 시간과 공간을 보호해야 한다. Cigna 조사에 따르면 직원의 52%가 직장에서 외로움을 경험하며, 외롭지 않은 직원의 생산성(74%)이 외로운 직원(63%)보다 유의미하게 높다. 미국 의무총감(Surgeon General)은 2023년 외로움을 국가적 전염병으로 선언하며, 사회적 고립이 하루 15개비의 흡연에 맞먹는 건강 위험을 갖는다고 경고했다. 4 Day Week Global이 245개 조직에서 실시한 실험에서, 4일제 근무는 번아웃을 67% 줄이고, 정신건강을 41% 개선했으며, 생산성이나 매출의 감소 없이 92%의 기업이 이를 유지하기로 결정했다.
이 세 가지 — 멈춤, 순서, 연결 — 은 결국 하나의 원칙으로 수렴한다. AI가 일의 속도와 범위를 확장시키는 시대에, 인간은 의도적으로 속도를 조절하고, 범위를 선별하며, 서로와의 연결을 유지해야 한다는 것이다. AI가 더 많이, 더 빨리 할 수 있게 해줄수록, 인간은 더 깊이, 더 천천히, 더 함께 해야 한다. 이것이 역설적으로 들린다면, 그것은 AI 시대의 본질 자체가 역설적이기 때문이다.
여기까지의 논의를 관통하는 하나의 통찰이 있다. AI는 인간의 일을 줄여주지 않는다. 일의 종류를 바꾼다. 그리고 바뀐 일은 이전보다 더 어렵다.
2,500억 달러가 넘는 투자에도 불구하고, 거시경제적 생산성 향상은 미미하다. Daron Acemoglu의 0.5% 전망, 덴마크 25,000명 추적 연구의 3% 시간 절약, 미 연방준비은행의 1.9% 누적 증가. 88%의 기업이 AI를 도입했지만 실질적 가치를 만들어내는 곳은 4~6%에 불과하다. 개인은 24% 빨라졌다고 믿지만 통제된 실험에서는 19% 느려졌다. 이 숫자들이 말해주는 것은 AI의 실패가 아니다. AI는 분명히 특정 태스크에서 놀라운 성능을 보여준다. 문제는 그 성능이 "인간이 편해지는 것"으로 자동 전환되리라는 기대가 잘못되었다는 것이다.
AI가 반복적인 실행 업무를 흡수하면서, 인간에게 남겨진 것은 전부 판단, 설계, 방향 설정, 맥락 해석, 이해관계 조율이다. 과거에 1%의 리더에게만 요구되던 역량이 이제 조직의 모든 구성원에게 요구된다. 성실하게 시키는 일을 수행하는 것으로 자신의 가치를 증명하던 대다수에게, 이 전환은 직업적 정체성의 위기이기도 하다. AI를 가장 잘 활용하는 고성과자의 88%가 번아웃을 보고하는 현실은, 이 전환이 단순한 기술 적응의 문제가 아니라 인간 존재의 방식 자체에 대한 도전임을 보여준다.
역사는 이것이 새로운 현상이 아님을 알려준다. 세탁기는 빨래를 줄여주지 않았고, 이메일은 커뮤니케이션을 줄여주지 않았으며, 스마트폰은 업무 시간을 단축하지 않았다. 제번스 역설이 예측하는 대로, 효율이 올라가면 기준이 올라간다. AI 시대에도 마찬가지다. AI가 문서를 10초에 써주면 사람들은 10배 더 많은 문서를 만들어내고, AI가 코드를 자동 생성해주면 관리해야 할 코드의 양이 폭발적으로 늘어난다.
그렇다면 남는 질문은 하나다. "AI가 무엇을 해줄 수 있는가"가 아니라, "AI가 남겨놓은 일을 할 준비가 되어 있는가"이다.
이 질문에 답하기 위해 인간이 움직여야 하는 방향은 명확하다. 실행의 속도에서 판단의 깊이로. 정보 처리에서 맥락 해석으로. 반복의 성실함에서 설계의 탁월함으로. 혼자 더 많이 하는 것에서, 함께 더 나은 방향을 찾는 것으로. 이것은 편안한 전환이 아니다. 그러나 AI가 실행의 영역을 흡수하는 속도를 감안하면, 이 전환을 미루는 것은 선택지가 되지 못한다.
조직의 역할은 이 전환을 개인의 의지에만 맡기지 않는 것이다. 의도적 멈춤, 업무 순서화, 인간적 연결의 보호를 제도화한 'AI 프랙티스'는 번아웃을 예방하는 복지 프로그램이 아니라, AI 시대에 조직이 지속 가능하게 성과를 내기 위한 전략적 인프라다. 4일제를 실험한 245개 조직에서 번아웃이 67% 줄고 생산성은 유지되었다는 사실은, 일을 덜 하면서도 더 나은 결과를 낼 수 있는 구조가 가능하다는 증거이다.
AI 시대의 생산성은 더 많이 하는 것이 아니다. 더 어려운 일을 해낼 수 있는 역량을 갖추는 것이다. 그리고 그 역량은 AI가 대신 길러줄 수 없는, 철저히 인간의 몫으로 남는 영역이다. AI가 올려놓은 기준선 위에서, 더 높은 곳으로 올라가야 한다. 이것이 AI가 인간에게 남긴 진짜 과제이며, 이 과제를 회피하는 개인과 조직에게 AI는 해방이 아니라 또 다른 형태의 속박이 될 것이다.