회계사들의 업무 30% 절약
2023년에 설립된 스타트업 Basis는 AI 기술을 활용해 회계 업계에 혁신을 가져오고 있습니다. 최고 수준의 회계 법인들이 사용하는 정교한 AI 에이전트를 개발하여, 반복적이고 구조화된 회계 업무를 자동화하는 것이 목표입니다. 이들의 핵심 전략은 AI 모델의 발전과 함께 스스로 진화하는 시스템을 구축하는 것입니다. Basis는 OpenAI의 모델들, 즉 o3, o3-Pro, GPT-4.1, 그리고 최신 GPT-5를 활용하여 회계사들이 조정, 분개 항목 입력, 재무 요약과 같은 작업에 소모하는 시간을 최대 30%까지 절약할 수 있도록 돕습니다. 이를 통해 회계사들은 고객 자문이나 신규 비즈니스 개발 등 더 높은 가치를 창출하는 업무에 집중할 수 있게 됩니다.
Basis의 공동 창립자 미첼 트로야노브스키(Mitchell Troyanovsky)는 "우리는 첫날부터 OpenAI와 협력해 왔습니다"라고 말하며, "모델이 개선될 때마다 에이전트가 처리할 수 있는 범위가 넓어집니다. 추론 능력이 향상되면서 더 복잡하고 장기적인 워크플로우를 처리할 수 있게 되었고, 에이전트에게 더 큰 자율성을 부여할 수 있었습니다"라고 강조했습니다.
Basis는 회계 업무를 다양한 맥락과 복잡성을 지닌 워크플로우 시스템으로 이해합니다. 이를 효율적으로 처리하기 위해, 가장 적합한 OpenAI 모델을 각 작업에 할당하는 다중 에이전트 아키텍처를 구축했습니다.
이 시스템의 핵심은 감독 에이전트입니다. 원래 OpenAI o3 기반으로 구축되었으나, 현재는 GPT-5로 마이그레이션되어 전체 프로세스를 총괄합니다. 이 감독 에이전트는 작업의 복잡성, 대기 시간, 입력 유형 등을 분석하여 해당 단계를 가장 적합한 하위 에이전트에게 라우팅합니다. GPT-5는 Basis가 평가한 모델 중 추론, 일관성, 설명 가능성 측면에서 가장 강력한 성능을 보여주므로, 최소한의 감독으로도 복잡한 워크플로우를 처리하는 데 최적화되어 있습니다.
하위 에이전트는 다양한 OpenAI 모델들로 구성됩니다. 각 모델은 Basis의 자체 내부 벤치마크를 통해 주요 기능과 특성에 따라 점수가 매겨져 있습니다. 예를 들어, 검토 중에 질문을 명확히 하거나 빠른 피드백을 제공하는 등 속도가 중요한 작업에는 GPT-4.1을 사용합니다. 반면, 비정상적인 거래 패턴 해석, 모호한 분류 문제 해결, 월말 마감과 같은 복잡한 시나리오에서는 깊이 있는 추론 능력이 뛰어난 GPT-5를 활용합니다. 이러한 시스템 덕분에 Basis는 모델의 기능이 향상됨에 따라 작업의 범위와 정확성을 끊임없이 개선할 수 있습니다.
회계 분야에서 자동화는 검토가 가능할 때 진정한 가치를 발휘합니다. Basis의 에이전트는 독립적으로 작동하지만, 중앙 레이어를 통해 맥락을 공유하며 모든 결정의 배경이 되는 가정, 데이터 출처, 논리를 명확하게 제시합니다. 초기에는 OpenAI o3-Pro를 사용하여 추론을 확장했지만, 현재는 GPT-5를 통해 구조화된 프로세스를 바탕으로 결과를 도출하는 과정을 설명할 수 있게 되었습니다.
예를 들어, 분개 항목을 생성하는 과정을 보면 명확합니다. 감독 에이전트는 관련 자료를 검토하고, 데이터를 검색하며, 공유된 맥락과 모범 사례를 참고하여 하위 에이전트를 조정합니다. 그 결과, 회계사는 어떤 데이터가 사용되었는지, 왜 그렇게 분류되었는지, 시스템이 권장 사항에 대해 얼마나 확신하는지에 대한 상세한 설명을 함께 받아볼 수 있습니다.
트로야노브스키는 "우리가 하는 모든 일은 추론에 달려 있습니다. 바로 이것이 OpenAI의 모델, 특히 GPT-5가 매우 중요한 이유입니다"라고 말합니다. 그는 GPT-5가 이전 모델보다 훨씬 뛰어난 추론 능력을 보여주기 때문에, 이를 통해 고객에게 어떤 일이 일어나고 있는지 투명하게 보여주고, 의사 결정에 대한 통제권을 제공할 수 있다고 덧붙였습니다.
또한, GPT-5의 함수 호출 기능 덕분에 Basis의 시스템은 단순한 작업 자동화를 넘어 실제 워크플로우를 위임하는 수준으로 발전했습니다. 이제 에이전트는 조정이나 분개 항목과 같은 다단계 프로세스를 제안하는 것을 넘어, 회계사가 실제로 업무에 접근하는 방식과 동일하게 작업을 직접 완료할 수 있게 되었습니다.
Basis 팀은 새로운 모델이 출시될 때마다 실제 회계 워크플로우에 대한 상세한 벤치마크를 실행합니다. 이 벤치마크는 단순한 정확도뿐만 아니라, 모델이 추론 과정을 얼마나 명확하게 설명할 수 있는지도 함께 평가합니다. 이를 통해 팀은 어떤 작업에 어떤 모델을 사용해야 할지, 그리고 새로운 워크플로우를 에이전트에게 안전하게 맡길 수 있는 시점을 결정할 수 있습니다.
특히 GPT-5는 Basis 스택에서 가장 강력한 모델로 자리 잡았습니다. 병렬 도구 호출 및 고급 추론 성능 덕분에 깊이와 정밀도가 요구되는 복잡한 워크플로우에 매우 적합합니다.
Basis의 벤치마크에서 GPT-5는 병렬 도구 호출 기능에서 돋보이는 성능을 보였습니다. 코드 인터프리터와 웹 검색을 모두 활성화한 상태에서 여러 도구를 동시에 사용하는 능력을 테스트한 결과, GPT-5는 추론 벤치마크에서 다른 모든 모델을 능가하며 100%의 성공률을 달성했습니다. 이는 Basis 에이전트가 단일 워크플로우 내에서 여러 구조화된 작업을 동시에 처리할 수 있는 핵심 역량입니다.
이러한 뛰어난 성능은 OpenAI 팀과의 긴밀한 협력 덕분에 가능했습니다. Basis는 개발 단계에서 실제 사례와 예외적인 상황들을 공유하며, 프로덕션 환경에서 모델의 동작을 개선하는 데 중요한 피드백을 제공했습니다. 트로야노브스키는 "OpenAI의 모델은 성능과 배포 속도 면에서 항상 앞서가고 있습니다. 추론 능력과 접근성의 조합이 우리 아키텍처를 가능하게 합니다"라고 말하며, "우리는 모델 개선에 단순히 반응하는 것을 넘어, 그 발전을 함께 이끌어 나가고 있습니다"라고 강조했습니다.
현재 Basis는 미국 전역의 수많은 대형 회계 법인들을 지원하고 있습니다. Basis를 사용하는 기업들은 평균 30%의 시간 절약을 경험하고 있으며, 시스템에 대한 신뢰가 높아짐에 따라 에이전트에게 더 많은 책임을 부여하고 있습니다. 무엇보다 중요한 것은 회계사들이 단순 반복 업무에서 벗어나 고객 자문, 새로운 실무 영역 탐색 등 전문성을 발휘할 수 있는 업무에 집중할 수 있게 되었다는 점입니다.
트로야노브스키는 "OpenAI는 이러한 변화에 결정적인 역할을 했습니다. 그들의 모델은 단순히 성능을 제공하는 것을 넘어, 우리가 무엇을 어떻게 만들 수 있는지를 함께 고민하는 파트너였습니다"라며, "모델이 발전하는 만큼 에이전트가 할 수 있는 일의 범위가 넓어지고, 이는 곧 회계사들이 할 수 있는 일의 영역을 확장하는 것을 의미합니다"라고 말하며 Basis의 비전을 다시 한번 강조했습니다.