MS <Working with AI> 연구의 "재배치"라는 말장난
"AI는 직업을 대체(Displacement)하지 않는다. 업무가 재배치될 뿐이다."
최근 AI와 노동을 다루는 거의 모든 연구와 정책 문서에서 반복되는 문장이다. 이 문장은 불안을 잠재우는 데에는 효과적이지만, 사실을 설명하는 데에는 충분하지 않다. 특히 실증 데이터를 바탕으로 한 연구에서조차 이 문장이 결론처럼 제시될 때, 우리는 한 번쯤 물어야 한다. 이것은 경험적 관찰인가, 아니면 사회가 선택한 서사인가.
최근 마이크로소프트가 직접 수행한 <Working with AI: Measuring the Applicability of Generative AI to Occupations> (이하, AI Applicability) 연구는 그 질문을 던지기에 적절한 사례다. 이 연구는 생성형 AI가 어떤 직업을 "위협할 것인가"를 예측하지 않는다. 대신, 사람들이 실제로 AI를 어떻게 사용하고 있는지를 관측한다. 그 결과는 차분하고, 정량적이며, 표면적으로는 중립적이다.
그러나 이 연구가 공개되자마자, 사회의 반응은 연구자들의 의도와 정반대 방향으로 흘렀다. 그리고 그 반응이 터무니없다고 보기도 어려운 것이, 현실에서는 이미 AI를 이유로 한 대규모 해고가 진행 중이었기 때문이다. 연구의 수식이 말하는 바를 끝까지 따라가면, 연구자들이 말하지 않으려 한 결론이 뚜렷하게 드러난다.
이 연구가 2025년 7월 공개되자마자, 미디어는 연구자들의 의도와 다른 방향으로 읽었다. Fortune은 "AI와 높은 교차점을 가진 40개 직업 목록이 바이럴되고 있으며, 전문가들은 이것이 '가장 위험에 처한' 커리어를 보여준다고 경고한다"고 보도했다. Windows Central은 더 직설적이었다: "이론적으로는 생산성 향상에 활용될 수 있지만, 실제로는 팀 규모 축소를 정당화하는 데 사용될 가능성이 높다."
반응이 확산되자, Microsoft Research는 별도의 블로그 포스트를 통해 해명에 나서야 했다. "모든 논의가 연구의 범위나 결론을 정확하게 묘사한 것은 아니었다. 구체적으로, 우리 연구는 직업이 사라진다는 어떤 결론도 도출하지 않는다." 연구자들은 자신들의 데이터가 '대체'로 읽히는 것을 막으려 했다.
그러나 현실의 숫자는 다른 이야기를 하고 있었다. 아웃플레이스먼트 컨설팅 기업 Challenger, Gray & Christmas에 따르면, 2025년 미국에서 약 55,000건의 해고가 AI를 직접적 원인으로 명시했다. Amazon은 역사상 최대 규모인 14,000명의 기업 인력을 감축하면서 AI 투자를 이유로 들었고, CEO Andy Jassy는 직원들에게 "AI로 인해 오늘날 수행되는 일부 업무를 하는 사람이 더 적게 필요할 것"이라고 경고했다. 아이러니하게도, 이 연구를 발표한 Microsoft 자체도 2025년 15,000명 이상을 해고한 것으로 알려졌으며, AI 성장을 사업의 다른 부분보다 우선시한다는 이유였다.
Yahoo Finance의 설문조사에서 1,200명 이상의 응답자 중 20%가 AI로 인해 향후 몇 년 내 직장을 잃을 것을 우려한다고 답했다. 43%는 AI를 다루는 것 자체를 싫어한다고 했다. HuffPost의 표현대로, "AI에게 직업을 빼앗길지 모른다는 불안은 마이크로소프트 연구가 정확히 그런 결론을 내리지 않았음에도 불구하고, 매우 현실적으로 남아 있다."
연구자들이 말하려 한 것, 사회가 읽어낸 것, 그리고 실제로 벌어지고 있는 것 사이의 간극. 이 에세이는 그 간극의 구조를 분석한다.
그렇다면 연구 자체는 정확히 무엇을 측정했는가. 이 질문에 답하기 위해서는 연구의 설계를 들여다볼 필요가 있다. 이 연구는 흔히 떠올리는 "AI가 어떤 직업을 대체할 것인가"라는 질문에서 출발하지 않는다. 오히려 그 질문을 의도적으로 피한다. 연구진의 관심은 예측이 아니라 관측이다. 다시 말해, AI가 앞으로 할 수 있을지가 아니라, 사람들이 이미 AI를 어떻게 쓰고 있는지다.
연구진이 설정한 문제의식은 단순하다. 기존의 "AI와 노동" 논의는 대체로 두 극단을 오간다. 하나는 기술 낙관론이고, 다른 하나는 직업 소멸론이다. 하지만 이 두 담론 모두 실제 노동이 수행되는 단위, 즉 업무(task)를 충분히 다루지 못한다는 것이 연구의 출발점이다.
그래서 이 연구는 직업 전체가 아니라, 각 직업을 구성하는 세부 업무가 AI와 어떻게 겹치는지를 측정하려 한다. 연구진이 사용한 표현을 빌리면, 목표는 "AI가 특정 직업을 대체하는지"가 아니라 "AI가 어떤 업무에 적용 가능(applicable)한지"를 파악하는 것이다.
이를 위해 연구진은 Microsoft Bing Copilot의 대규모 사용 로그를 분석 대상으로 삼았다. 2024년 1월부터 9월까지 수집된 미국 내 대화 약 20만 건이다. 이 로그는 익명화된 상태에서, 사용자가 AI에게 무엇을 요청했는지, AI가 어떤 응답을 했는지, 그리고 그 상호작용이 어떤 유형의 작업에 해당하는지를 포함한다.
이 대화 로그를 미국 노동부의 표준 직무 데이터베이스인 O*NET과 연결해, 각 대화가 어떤 직업의 어떤 업무(IWA: Intermediate Work Activity)에 해당하는지를 매핑한다. 즉, 실제 AI 사용 사례를 기존의 직무 분류 체계 위에 올려놓는 방식이다.
연구의 중심에는 AI Applicability Score(AI 적용 가능성 점수)라는 지표가 있다. 이 점수는 세 요소의 곱으로 계산된다.
Coverage: 특정 직업의 업무가 AI 사용 로그에서 얼마나 자주 등장하는가. 전체 대화의 0.05% 이상 빈도로 나타나는 업무를 '커버됨'으로 분류했다.
Completion: AI가 해당 업무 요청을 성공적으로 완료했는가. LLM 기반 분류기와 사용자의 실제 피드백(thumbs up/down)으로 검증했다.
Scope: 해당 업무에서 AI가 수행한 작업의 깊이/비중은 어느 정도인가. 6단계 척도(none, minimal, limited, moderate, significant, complete)로 측정했다.
중요한 점은 이 지표들이 성능 평가나 만족도 조사가 아니라, 행동 로그 기반의 구조적 측정치라는 사실이다. 연구진은 설문이나 전문가 판단을 사용하지 않는다. 오직 "등장했는가, 끝냈는가, 얼마나 맡았는가"만을 본다.
이 지표를 적용했을 때, Applicability 점수가 높게 나타난 직업들은 공통된 특성을 보인다. 통번역, 고객 서비스, 서비스 영업, 작가·저자와 같은 직무들이다. 이 직무들은 고용 규모가 작지 않으며, 대부분 언어 기반이고, 목표가 비교적 명확하며, 절차적으로 분해 가능한 업무 비중이 높다.
반대로 시각·공간·신체적 판단이 중요한 직무나, 고도의 암묵지가 핵심인 직무는 상대적으로 낮은 점수를 받는다. 연구진은 이를 두고 "AI가 아직 못해서"라기보다 "이 데이터 소스에서는 관측되지 않았기 때문"이라고 명시한다.
연구진은 이 결과를 직업 소멸의 증거로 해석하지 않는다. 논문의 결론부에서 반복적으로 강조되는 메시지는 다음과 같다. 이 결과는 직업의 대체 가능성이 아니라, 업무의 재배치 가능성을 보여준다는 것이다.
AI가 일부 업무를 수행하게 되면, 인간은 다른 업무로 이동할 수 있으며, 이는 협업과 역할 재구성의 문제라는 해석이다. 연구진은 특히 이 점수가 "자동화 확률"이나 "고용 감소 예측"으로 오용되어서는 안 된다고 주의를 덧붙인다.
다시 말해, 이 연구는 자신이 측정한 것을 넘어선 결론을 의도적으로 말하지 않는다. 데이터는 업무의 구조를 보여줄 뿐이며, 그것이 어떤 사회적 결과로 이어질지는 정책과 제도의 영역이라는 입장이다.
그러나 바로 이 지점에서 분석적 질문이 시작된다. 연구가 측정한 것이 업무의 구조라면, 그 구조가 이미 대체 조건을 충족하고 있다는 사실을 우리는 어디까지 인정해야 하는가.
수식을 다시 들여다보자. Coverage × Completion × Scope. 이 세 변수의 곱이 높다는 것은 무엇을 의미하는가?
Coverage가 높다는 것은 해당 업무가 AI 사용 맥락에서 빈번하게 등장한다는 뜻이다. 이것은 단순한 '노출'이 아니다. 사용자들이 해당 업무를 AI에게 위임하려는 시도가 반복적으로 발생한다는 것이다. Completion이 높다는 것은 AI가 해당 업무를 성공적으로 완료할 수 있다는 뜻이다. 사용자가 thumbs up을 누르거나, LLM 분류기가 '완료'로 판정할 정도의 품질을 달성한다는 것이다. Scope가 moderate 이상이라는 것은 AI가 해당 업무의 상당 부분을 단독으로 수행할 수 있다는 뜻이다. 부분적 보조가 아니라, 업무의 핵심 영역까지 AI가 커버한다는 것이다.
세 조건을 결합하면, 논리적 귀결은 명확하다. 해당 업무는 외주 가능하다. AI 단독 수행이 가능하다. 인간 개입 없이도 목표 달성이 가능하다. 이것이 수식이 말하는 것이다.
연구의 또 다른 독창적 구분은 User Goal(사용자 목표)과 AI Action(AI 행위)의 분리다. 하나의 대화에서, 사용자가 달성하려는 업무와 AI가 실제로 수행하는 업무는 다르다. 예를 들어, 사용자가 "마케팅 전략을 짜달라"고 요청하면, User Goal은 '마케팅 기획'이고, AI Action은 '정보 제공', '분석', '문서 작성' 등 여러 업무로 분해된다.
연구 결과에 따르면, 하나의 User Goal당 AI는 평균 2개의 AI Action을 수행한다. 그리고 User Goal 점수가 높은 직업과 AI Action 점수가 높은 직업이 다르다. 컴퓨터·수학 직군은 User Goal 점수가 높다—AI를 '도구로 활용'하는 협업 모드다. 반면 미디어·금융 운영 직군은 AI Action 점수가 높다—AI에게 '업무를 위임'하는 대행 모드다.
이 구분이 함의하는 바는 중요하다. AI Action 점수가 높은 직업군은 협업이 아니라 위임의 구조로 이동하고 있다. 위임이 반복되면, 인간의 역할은 '감독'으로 축소된다. 감독 역할마저 자동화되면, 해당 직무의 인간 필요성은 구조적으로 감소한다.
연구자들은 이 결과를 두고 "직업 대체가 아니라 업무 재배치"라고 해석한다. 그러나 이 해석은 데이터에서 자동으로 도출되지 않는다.
데이터가 보여주는 것: 특정 업무들이 AI에 의해 성공적으로, 상당한 범위까지 수행되고 있다.
연구자들이 말하는 것: 인간과 AI가 역할을 나누게 될 것이다.
전자는 관측이고, 후자는 시나리오다. 재배치가 일어나려면 최소한 세 가지 조건이 필요하다. 첫째, 해당 직업 내에 AI가 커버하지 못하는 업무가 충분히 남아 있어야 한다. 둘째, 인간이 그 잔여 업무로 이동할 수 있는 역량과 기회가 있어야 한다. 셋째, 기업이 비용 최적화 대신 역할 재구성을 선택해야 한다.
연구는 첫 번째 조건에 대해서만 부분적 정보를 제공한다. 두 번째와 세 번째 조건은 데이터 바깥의 영역이다. 따라서 '재배치'는 데이터의 결론이 아니라, 특정 조건이 충족될 경우의 가능성이다. 그 조건이 충족되지 않으면, 기본값은 대체다.
이 연구의 데이터 소스는 Bing Copilot—언어 모델 기반 대화형 AI—의 사용 로그다. 이것이 측정하는 것은 본질적으로 언어 기반 지식 노동이다.
연구 자체가 인정하듯, 물리적 노동, 로보틱스 영역, 감각적·공간적 판단이 핵심인 직무는 분석에서 배제된다. 이것은 연구의 오류가 아니라 측정 도구의 한계다. 그러나 이 한계는 결과 해석에 직접적 영향을 미친다.
"AI는 정보 작업에 주로 적용된다"는 결론은 정확하다. 그러나 이 결론은 "우리가 정보 작업에 적용되는 AI만 측정했기 때문"이라는 전제 위에 성립한다. Large Action Model(LAM)과 로보틱스의 발전을 고려하면, 현재 측정된 Applicability는 AI 적용범위의 하한선일 가능성이 높다.
연구가 보여주는 것은 2024년의 스냅샷이다. 이 시점에서 많은 업무의 Scope는 'moderate' 수준에 머물러 있다. AI가 업무의 일부를 수행하지만, 전체를 커버하지는 못한다. 인간 보조가 필요하다.
그러나 이 상태를 '지속 가능한 협업 균형'으로 해석하면 오류가 발생한다. Scope가 moderate에서 significant로, significant에서 complete로 이동하는 것은 기술 발전의 방향이다. 현재의 '협업' 상태는 기술적 과도기의 스냅샷이지, 안정적 균형점이 아니다.
연구진도 이 점을 인지한다. 논문에서 "AI 기능이 확장됨에 따라 적용가능성의 프론티어가 어떻게 이동하는지 추적할 수 있다"고 언급한다. 그러나 이 인식이 결론부의 '재배치' 해석과 어떻게 양립하는지는 명확하지 않다.
기업 현장에서 AI 도입은 흔히 '티어(Tier) 분리'라는 구조로 구현된다.
Tier 0은 완전 자동화 영역이다.
Tier 1은 AI 보조를 받는 인간 작업자 영역이다.
Tier 2는 고숙련·고책임의 감독 및 예외처리 영역이다.
이 구조는 표면적으로 '협업'처럼 보인다. 그러나 경제적 논리를 따라가면 다른 그림이 나타난다. Tier 0은 서버를 늘리면 무제한 확장 가능하다. Tier 1의 인간 작업자는 AI 보조로 생산성이 올라가므로, 같은 산출물을 더 적은 인원으로 달성할 수 있다. Tier 2는 소수 정예로 수렴한다.
결과적으로, 티어 분리는 역할 재구성이 아니라 인력 압축 모델이다. '재배치'가 일어나더라도, 재배치될 자리 자체가 줄어든다.
이에 대한 표준적 대응은 re-skilling/up-skilling 담론이다. "AI 시대에 맞는 새로운 기술을 배우면 된다."
그러나 이 담론의 논리적 구조를 분석하면 순환이 발견된다.
Up-skilling의 목적지는 더 고차원적 업무다. 데이터 입력 담당자가 데이터 분석가가 되고, 번역가가 번역 감수자가 되는 식이다. 그런데 이 연구의 데이터가 보여주는 것은, 고임금 정보 노동이 AI Applicability 상위에 포진해 있다는 사실이다. 데이터 사이언티스트(0.357), 경영 컨설턴트(0.353), 시장 조사 분석가(0.350) 등이 상위 25위권에 있다.
Up-skilling된 업무 역시 시간이 지나면 더 언어화되고, 더 모델화되며, 다시 AI Applicability가 상승한다. Up-skilling의 목적지가 이미 AI의 다음 타깃이라면, 이것은 대체의 지연이지, 대체의 방지가 아니다.
연구자들이 '대체'라는 단어를 피하고 '재배치'라는 단어를 선택한 것에는 두 가지 해석이 가능하다.
첫째는 과학적 겸손이다. 이 연구는 현재 사용 패턴을 측정할 뿐, 미래 고용 변화를 예측하지 않는다. 따라서 '대체'라는 인과적 함의가 강한 단어를 피하는 것은 방법론적으로 정당하다.
둘째는 정치적 완충이다. "AI가 직업을 대체한다"는 문장은 사회적 충격을 유발한다. 정책 대응 압력을 높이고, 기업의 AI 도입에 대한 저항을 키우며, 노동자들의 불안을 증폭시킨다. "업무가 재배치된다"는 문장은 같은 데이터에서 도출되었지만, 이러한 부작용을 완화한다.
두 해석 모두 일리가 있다. 문제는 두 해석이 혼재될 때 발생한다. 과학적 겸손의 언어가 정치적 완충의 기능을 수행하면, 청중은 '재배치'를 데이터의 결론으로 오인하게 된다.
데이터가 말하는 것을 가장 보수적으로 재진술하면 이렇다: "특정 업무들에서 AI는 이미 성공적으로, 상당한 범위까지, 반복적으로 사용되고 있다."
이 진술에서 '대체'로 가는 길과 '재배치'로 가는 길은 동등하게 열려 있다. 어느 쪽으로 갈지는 기업의 비용 계산, 정책의 개입, 노동시장의 조정 속도에 달려 있다. 아무런 개입이 없다면, 비용 효율이 높은 쪽—즉 인력 감축—이 기본값이 된다.
연구자들의 해석이 문제적인 이유는 이 간극을 명시하지 않기 때문이다. '재배치'가 자동적 결과가 아니라 조건부 가능성임을 강조하지 않으면, 청중은 기술적 대체 조건이 이미 충족되었다는 사실을 간과하게 된다.
이 연구가 실제로 말하는 것을 가장 정직하게 재정의하면 이렇다:
"재배치가 없다면, 대체가 발생한다."
재배치는 기술의 결과가 아니다. 재배치는 사회의 개입이다. 정책이 개입하고, 기업이 역할 재구성을 선택하고, 개인이 전환에 성공할 때만 재배치는 현실이 된다. 개입이 없으면 기본값은 대체다.
남겨진 질문들은 기술에 관한 것이 아니다.
누가 Tier 2—고숙련 인간 노동 영역—로 올라갈 수 있는가? 그 기회는 어떻게 배분되는가? 탈락한 다수의 비용은 누가 부담하는가? '일'이 더 이상 보편적 생계 기반이 되지 않는 사회에서, 어떤 새로운 분배와 기여의 기준이 가능한가?
AI Applicability 연구는 노동의 미래를 예측하지 않는다. 이미 시작된 구조를 보여줄 뿐이다. 통번역, 고객 서비스, 콘텐츠 작성, 데이터 분석—고용 규모가 큰 지식·서비스 직무에서 기술적 대체 조건은 이미 충족되었다.
문제는 이제 기술이 아니다. 사회가 무엇을 선택할 것인가다. 그리고 그 선택을 미루는 순간, 선택은 우리를 떠나 기업과 기술의 손으로 넘어간다.
참고 문헌: Tomlinson, K., Jaffe, S., Wang, W., Counts, S., & Suri, S. (2025). Working with AI: Measuring the Applicability of Generative AI to Occupations. Microsoft Research.