AI를 품은 소프트웨어의 진화

대답하는 AI에서 실행하는 AI로 대전환

by OOJOO

우리는 지난 30년간 컴퓨터나 스마트폰에서 “화면을 보고 메뉴를 마우스로 클릭하거나 손가락으로 터치해서” 사용해왔다. 검색을 하려면 브라우저를 띄우고, 문서를 열람하려고 파일을 열고, 보고서를 쓰기 위해 워드나 파워포인트나 스프레드시트를 실행했다. 또한 도착한 메일을 확인하고 회의·미팅 일정을 캘린더에서 파악해 “가능 시간”을 맞추는 과정도 여러 앱을 넘나들며 수행했다. 누군가의 일정이 한 번 바뀌면 메일과 메신저를 다시 오가며 조율을 반복했고, 메일함에 도착한 메일들을 읽고 분류하고 답장 초안을 만드는 데 많은 시간을 소모했다.


그런데 2024년 ChatGPT 이후 2026년부터 본격화된 Agent는 새로운 인터넷, 소프트웨어 사용 경험을 만들고 있다. 기존의 ChatGPT로 시작된 생성형 AI들의 사용자 경험은 대화창에 프롬프트를 넣으면 텍스트나 이미지 같은 결과를 “생성”해주는 것이 중심이었다. 즉, 사람이 직접 워드나 엑셀로 옮겨 붙이고, 메일을 작성해 보내고, 폴더를 정리할 뿐 최종 마무리 단계는 결국 온전히 인간의 몫으로 남았다. 즉 AI가 만들어준 것은 ‘초안’이었지 업무가 끝난 ‘완성품’은 아니었다.


반면 최근의 AI를 품은 소프트웨어는 챗봇과 달리 “실행”까지 맡기며 작업을 온전히 수행해내는 방향으로 진화하고 있다. 즉, 최근 Agent는 실제 실행한 결과물을 만들어내고 있다. “대화가 더 똑똑해졌다”가 아니라 AI가 소프트웨어 안으로 들어가 파일을 읽고 고치고 만들고 더 나아가 필요하면 여러 단계를 거쳐 대신 실행까지 해준다. 이 변화의 핵심은 답을 잘하는 AI가 아니라 일을 끝내는 AI, 즉 ‘실행형 AI’로 완성되고 있다는 점이다.


대표적인 사례가 앤쓰로픽의 Cowork로 사용자가 컴퓨터 속 특정 폴더를 작업공간으로 지정하면, 그 폴더 안의 파일을 읽고, 고치고, 새로 만들 수 있게 해준다. 일례로 특정 폴더 내 파일들을 용도에 맞게 정리해 파일명을 바꾸고 분류하거나, 영수증 스크린샷을 저장한 폴더에서 지출 항목을 뽑아 스프레드시트로 만드는 일, 흩어진 메모로 보고서 초안을 만드는 일을 직접 수행해낸다. Cowork는 더 높은 자율성을 가지고 실제 작업을 진행하며 실행해 내는 실행력을 갖추었다. 덕분에 내 컴퓨터 속 파일들을 쉽게 탐색하고 분류 정리해서 필요로 하는 정보를 추출하는데 유용하다. 기존 ChatGPT가 인터넷 속 정보들을 기반으로 자료를 취합 정리하는데 탁월했다면 Cowork는 내 컴퓨터 속 파일들 기반으로 정보를 추출하고 요약 정리해주는데 유용하다.


또한, OpenAI의 Codex는 컴퓨터 속 특정 폴더를 지정해서 그 안에서 작업을 수행할 수 있도록 해준다. 예를 들어 영업팀원이 월간 실적 내역을 특정 폴더에 저장하고, "이 폴더 데이터로 상위 10개 고객을 추출해 요약 스프레드시트를 만들어줘"라고 지시하면 Codex가 데이터를 정리해 파일로 생성해준다. 또, 기존 보고서 탐색에서 "지난 3개월 보고서 폴더에서 매출 추이를 분석해 변화를 1페이지 PDF로 요약해줘"라고 하면 AI가 파일을 읽고 산출물을 만들어준다. 개발자 외에도 회사 데이터 분석에서 "CRM에서 뽑은 엑셀을 정제해 KPI 표를 업데이트하고 이상치가 있으면 경고 메시지를 붙여줘"처럼 추가 분석을 위임할 수 있다. Codex에서 스킬이라는 기능을 이용하면 매번 같은 품질로 결과물들을 주기적으로 받아보는 것도 가능하다.


더 나아가 OpenClaw는 이보다 더 편리하게 사용할 수 있을 뿐 아니라 수행할 수 있는 기능 또한 더 강력하다. Telegram이나 WhatsApp 같은 메신저로 컴퓨터에 설치된 OpenClaw에 메시지를 보내어 “이메일 내용 중 여행이나 출장 관련한 사항을 체크해서 항공편을 예약하고 확정된 여행 일정을 캘린더에 기록해”라고 하면 이런 일련의 과정을 알아서 내 컴퓨터를 작동시켜 수행해낸다. 특정 폴더 내 파일을 읽고 분석하는 정도를 넘어 직접 컴퓨터의 제어권을 가지고 AI가 내 대신에 웹브라우저를 열고, 캘린더나 이메일 앱을 열어 로그인을 해서 정보를 확인하고 직접 쇼핑도 하고 결제도 할 수 있을 정도의 다양한 기능을 수행해낼 수 있는 것이다.


이렇게 AI를 탑재한 에이전트형 소프트웨어는 컴퓨터와 인터넷 서비스를 사용하는 경험을 바꿔가고 있다. 기존에 우리가 사용하던 소프트웨어는 “어디에 메뉴가 있고 무슨 기능이 있는지”를 학습하고 실행하는 구조였다. 하지만 AI를 품은 소프트웨어는 먼저 명령을 말하면 소프트웨어가 알아듣고 계획을 세우고, 필요한 실행을 이어 붙인다. 예를 들어 매월 말 경비 정산을 하려면 메신저로 받은 영수증 사진, 메일에 붙은 거래명세서, 다운로드 폴더에 쌓인 PDF를 열어 항목을 옮겨 적고 서식을 맞춰야 했는데 AI가 이러한 파일들과 내역을 자동으로 체크해서 정리해주는 것이 앞으로의 Agent 소프트웨어의 미래다.


이렇게 AI를 탑재한 소프트웨어가 컴퓨터나 스마트폰에서 구체적인 실행을 해내면서 기존에 사람이 화면을 보며 하나하나 눌러가며 수행하던 작업을 AI에 위임할 수 있게 된다. 우리는 덜 클릭하고 더 시간을 줄일 수 있어 생산성이 개선될 가능성이 크다. 다만 동시에 권한과 책임의 경계가 흐려질 수 있다. 실행형 AI는 “틀린 답”보다 “틀린 행동”의 대가가 훨씬 크다. 파일 삭제, 잘못된 발송, 과도한 권한 부여 같은 문제가 현실의 피해로 이어질 수 있다. Cowork 공식 안내도 폴더 접근은 사용자가 선택하지만 지시가 모호하면 파일 삭제 같은 파괴적 행동이 발생할 수 있으니 주의하라고 직접 경고한다. OpenClaw는 그 위험이 훨씬 더 크다. 이메일·메신저·계정에 깊이 들어가는 도구일수록 악용 여지가 커지기 때문이다. 실제로 The Guardian는 OpenClaw가 바이럴 확산되면서 일부 사용자가 지나치게 광범위한 권한을 부여하고 그만큼 보안·윤리 위험이 커질 수 있다고 전문가 경고를 함께 보도했다.


이런 우려를 막기 위한 결론은 단순하다. 처음부터 ‘전체 권한’을 주지 말아야 한다. Cowork든 Codex든 작업공간(폴더)을 지정할 수 있게 만든 이유 자체가 “안전한 경계”를 두기 위해서다. Cowork도 사용자가 허용한 폴더만 보게 하고 중요한 행동은 확인을 받게 설계했다. Codex도 기본값은 네트워크 접근을 끄고 쓰기 권한을 작업공간으로 제한하며 작업공간 밖 수정이나 네트워크가 필요한 행동은 승인하도록 보안 문서에 명시돼 있다.


더 나아가 삭제·외부 발송·결제처럼 되돌리기 어려운 행동은 최종 결정을 AI가 아니라 사람이 하도록 권한 설정을 해야 한다. 실행형 AI는 ‘자동화’가 아니라 ‘위임’이기 때문에 위임의 마지막 문턱은 사람이 쥐고 있어야 한다. 무엇을 했는지 로그가 남아야 하는 원칙도 필수다. 실행형 AI는 편의만큼이나 책임의 문제를 명확하게 구분해야 하기 때문이다. 즉, 많은 것을 AI에게 맡기는 과정에서 우리의 역할이 단순 실행에서 판단과 책임으로 이동한다는 사실을 직시해야 한다. AI가 일을 더 많이 맡을수록 사람의 가치는 “손이 빨라서”가 아니라 “무엇을 맡길지, 어디까지 맡길지, 결과를 어떻게 검토하고 책임질지”를 결정하는 것에서 비롯된다.

작가의 이전글데이터센터 다음은 온디바이스AI