Anthropic과 OpenAI가 만드는 새로운 사무실 풍경
“AI가 동료가 된다면 어떤 모습일까?”
이 질문은 더 이상 공상 과학의 영역이 아니다. 최근 Anthropic과 OpenAI는 AI를 단순한 텍스트 생성기가 아니라 실제 직장에서 협업하는 ‘가상 동료(virtual collaborator)’로 키우는 작업을 본격적으로 시작했다.
핵심은 AI가 사람과 똑같은 소프트웨어를 다룰 수 있도록 훈련시키는 것이다. Salesforce 같은 CRM, Zendesk 같은 고객지원 툴, Excel 같은 분석 도구, 그리고 Cerner 같은 헬스케어 기록 관리 앱까지, AI가 실제 화이트칼라 업무에서 사용하는 도구들을 ‘몸으로 익히는’ 방식이다.
이 과정의 기반이 되는 기술은 강화학습 환경(RL Environments, RL Gyms)이다. 쉽게 말해, AI를 위한 가짜 사무실을 만드는 것이다.
연구자들은 실제 소프트웨어의 복제 버전을 만들어, AI가 실험적으로 사용해보도록 한다. 예를 들어 Salesforce 안에서 고객 데이터를 검색하고, LinkedIn에서 담당자 재직 여부를 확인하고, Calendly로 미팅 일정을 잡고, 다시 Salesforce에 기록을 업데이트하는 완전한 영업 프로세스를 AI가 스스로 시도하도록 하는 것이다.
이를 통해 단순히 “정답을 맞히는 AI”가 아니라 과정을 이해하고 수행하는 AI로 발전할 수 있다. 연구자들은 각 업무를 작은 단계로 쪼개고, 각 단계가 올바르게 수행됐는지 체크리스트를 만든다.
예를 들어 영업 담당자의 CRM 활용을 학습시키는 경우:
Salesforce 필터링 → 최근 30일간 접촉이 없는 고객만 추출했는가?
LinkedIn 검증 → 담당자가 여전히 그 회사에 재직 중인지 확인했는가?
이메일 발송 → Calendly 링크가 포함된 맞춤형 메일을 보냈는가?
CRM 업데이트 → 고객 상태를 “재참여(re-engaged)”로 기록했는가?
이런 단계별 검증 과정을 거치며 AI는 단순 텍스트 생성이 아닌 실제 업무 절차 수행 능력을 얻게 된다.
문제는 비용이다.
OpenAI는 올해만 데이터 및 RL 환경 구축, 전문가 고용 등으로 **10억 달러(약 1조 3천억 원)**를 지출할 것으로 예상된다. 2030년에는 이 비용이 8배 증가한 80억 달러에 이를 것으로 전망된다. Anthropic 또한 RL 환경 구축에만 향후 10억 달러 투자를 논의한 바 있다.
왜 이렇게 비용이 높을까?
단순한 데이터 라벨링을 넘어, 이제는 실제 산업 전문가가 필요하기 때문이다.
NASA 데이터 과학자가 모델에게 실험 데이터를 처리하는 방법을 보여주고,
화학자는 에너지부 프로젝트에 쓰이는 분석을 재현하며,
의료 레지던트는 방사선 판독 과정을 AI와 함께 수행한다.
이러한 현업 시뮬레이션은 AI가 단순 교과서 지식을 넘어서 실제 직무 수행 능력을 갖추게 만든다. 하지만 전문가들의 시간은 비싸다. 최근에는 일부 전문가가 시간당 150~250달러까지 받는 것으로 알려졌다.
기존 학습은 방대한 데이터를 주고 패턴을 찾게 하는 방식이었다. 이로 인해 AI는 정답을 잘 맞히지만, 맥락에 따른 업무 처리 능력은 부족했다.
예를 들어 Excel에서 세율 변경이 기업 가치 산출에 어떤 영향을 주는지를 계산하는 것은 단순 지식으로 해결되지 않는다. AI는 직접 DCF(할인현금흐름) 모델을 돌려봐야 한다. 연구자들은 전문가가 만든 정답과 AI가 도출한 결과를 비교해, AI가 동일한 결론에 도달할 때마다 이를 학습 데이터로 쌓는다.
이는 단순히 Q&A 데이터셋을 주입하는 것이 아니라, 문제 해결 과정 자체를 학습시키는 것이다.
이런 훈련이 성공하면, 가까운 미래의 사무실은 지금과 크게 달라질 것이다.
영업팀: AI가 Salesforce에서 잠재 고객을 발굴하고, LinkedIn에서 담당자 신원을 확인하며, 개인화된 이메일을 자동 발송한다.
고객지원팀: Zendesk에서 티켓을 분류하고, 긴급도에 따라 자동 응답 초안을 작성한다.
재무팀: Excel에서 복잡한 시뮬레이션을 돌려 가정 변화에 따른 기업 가치 변화를 즉시 보여준다.
의료 현장: 환자 기록 관리 앱에서 기존 진단 데이터를 참고해 의사가 놓친 부분을 제안한다.
즉, AI는 단순히 “조언하는 존재”에서 벗어나, 직접 앱을 다루며 인간과 같은 도구 환경 속에서 협업하는 동료로 자리 잡게 된다.
물론 이 길이 순탄한 것만은 아니다.
비용 부담: RL 환경 구축과 전문가 고용은 매우 비싸며, 대규모 확장은 쉽지 않다.
정확성 보장: AI가 잘못된 절차를 자동화하면, 오히려 리스크가 커질 수 있다.
윤리적 문제: 실제 직무 데이터가 학습 과정에 활용되면서 프라이버시와 데이터 보호 이슈가 불거질 수 있다.
그러나 초기 실험에서 긍정적 결과가 나오면서, OpenAI와 Anthropic은 앞으로 RL 환경 투자를 크게 늘릴 것으로 전망된다.
AI의 다음 단계는 더 똑똑한 챗봇이 아니다.
바로 우리와 같은 소프트웨어를 사용하며 협업하는 동료다.
OpenAI의 한 고위 임원은 “경제 전체가 일종의 RL 머신이 될 것”이라고 말한 바 있다. 이는 앞으로 의료, 금융, 법률, 제조 등 모든 산업의 전문성이 AI 학습에 포함될 수 있음을 의미한다.
이제 중요한 질문은 “AI가 사람을 대체할까?”가 아니다.
진짜 질문은 “AI와 함께 일할 준비가 되어 있는가?”이다.