클로드 ‘Computer Use’, 행동하는 인공지능

이용호의 손에 잡히는 인공지능

by 호몽 이용호
260402 브런치.jpg [클로드 Computer Use']


우리가 일하고 공부하는 환경이 완전히 새로운 국면을 맞이하고 있다. 불과 얼마 전까지만 해도 인공지능은 우리가 던진 질문에 방대한 지식을 요약해 주는 똘똘한 백과사전 역할에 머물렀다. 하지만 기술은 이제 화면 속에서 빠져나와 우리가 쓰는 마우스와 키보드를 직접 통제하기 시작했다. 앤스로픽이 선보인 클로드 ‘Computer Use’는 단순한 정보 제공을 넘어 자율적 실행이라는 새로운 지평을 열었다. 학생이 학교 과제를 위해 자료 조사를 지시하면 인공지능이 스스로 웹 브라우저를 열고 정보를 찾은 뒤 발표용 슬라이드를 척척 만들어내는 일이 현실이 된 것이다. 대화형 기술에서 행동하는 에이전트 시스템으로의 진화는 기술 역사에 기록될 획기적인 도약이다.


이러한 변화의 배경에는 언어 모델의 눈부신 발전이 있다. 처음 등장했던 인공지능 모델들은 문장을 그럴듯하게 이어붙이는 수준이었으나 이후 일상적인 업무 질문에 정확히 답하는 수준으로 발전했다. 그리고 마침내 논리적으로 생각하고 스스로 계획을 수정하며 최종 목표를 달성하는 능력을 갖추게 되었다. 앤스로픽은 이 시기를 놓치지 않고 새로운 생태계를 확장하는 데 집중했다. 최근 몇 달간 그들은 사용자가 외부에서도 스마트폰을 통해 자신의 데스크톱에 접근해 인공지능에게 작업을 지시할 수 있는 도구들을 연이어 내놓았다. 과거에는 인공지능이 찾아준 자료를 복사해 텍스트 문서에 옮겨 적는 것이 온전히 사람의 몫이었다면 이제는 인공지능이 직접 문서를 열고 내용을 다듬어 폴더에 저장하는 철저한 과정까지 도맡아 처리한다. 인공지능이 진정한 의미의 독립적인 디지털 조수 역할을 수행하게 된 것이다.


이 지능적인 조수는 세 가지 정밀한 방식을 통해 컴퓨터를 제어한다. 첫 번째는 소프트웨어 간의 직접적인 연결망을 활용하는 방식이다. 예를 들어 트렐로 같은 일정 관리 프로그램에 새 프로젝트를 등록하거나 구글 드라이브에 파일을 업로드하라는 지시를 받으면 눈에 보이는 화면을 조작하지 않고 시스템 이면의 통신망으로 즉각 처리한다. 두 번째는 이런 내부 연결이 불가능할 때 웹 브라우저를 직접 띄워 사람처럼 웹사이트 메뉴를 클릭하고 페이지를 넘기며 작업하는 방식이다. 마지막 세 번째는 앞의 두 방법이 모두 통하지 않을 때 사용하는 화면 직접 제어 방식이다. 인공지능이 현재 모니터 화면 전체를 사진 찍듯 인식한 뒤 어디에 마우스 커서를 올려야 할지 파악해 직접 클릭하고 타이핑한다. 이 방식은 인간의 눈과 손을 가장 비슷하게 모방하지만 연산 속도가 느리다는 단점이 있어 사용자가 자리를 비운 사이 대용량 파일을 정리하거나 복잡한 서식을 맞추는 작업에 활용하기 좋다.


그러나 자율성이 커진 만큼 보안과 안전에 대한 우려는 피할 수 없는 숙제다. 내 컴퓨터의 모든 권한을 넘겨주었다가 인공지능이 실수로 중요 문서를 통째로 삭제하거나 엉뚱한 사람에게 민감한 메일을 보낼 수도 있기 때문이다. 앤스로픽은 이런 부작용을 막기 위해 훌륭한 통제 시스템을 마련했다. 인공지능이 새로운 파일이나 프로그램에 접근할 때는 반드시 사용자에게 권한을 묻도록 설계했다. 특히 인터넷 쇼핑 결제창이나 기업의 자금 관리 시스템 등 금전적인 피해가 발생할 수 있는 곳에는 아예 접근하지 못하도록 강력하게 막아두었다. 통제 불능의 위험을 안고 있던 초기 자율 기술들에 비해 훨씬 튼튼한 방어벽을 구축한 것이다. 다른 거대 정보통신 기업들도 속속 이 시장에 뛰어들고 있지만 아직은 앤스로픽이 기술적 완성도와 안정성 면에서 한발 앞서 나가며 시장의 표준을 만들어가고 있다.


결과적으로 행동하는 인공지능의 등장은 특정 전문가들만 누리던 업무 자동화의 혜택을 일반 대중에게 돌려주는 계기가 될 것이다. 복잡한 코딩이나 프로그래밍 언어를 몰라도 일상적인 말로 지시만 하면 컴퓨터가 내 의도를 파악해 대신 움직이는 환경이 조성되었다. 머지않아 인공지능은 묻기도 전에 나의 업무 패턴을 파악해 주기적으로 이메일함을 정리하고 내일의 일정을 점검하는 능동적인 수준에 이를 것이다. 아직은 초기 단계라 예상치 못한 오류를 지켜봐야 하는 유예 기간이 필요하지만 우리가 컴퓨터를 활용하는 방식은 이미 돌이킬 수 없는 변화의 강을 건넜다. 인공지능이 내 마우스를 대신 쥐는 이 놀라운 기술은 앞으로 우리의 일상과 노동의 형태를 얼마나 더 편리하게 바꿔놓을지 깊은 기대를 품게 만든다.


| 작가 프로필


@2026 손잡인_이용호 프로필_브런치.jpg


이용호 작가는 스마트공장에서 주로 사용되는 ‘AI 머신비전’ 전문회사인 ‘호연지재’를 경영하고 있다. ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 10년 이상 연구한 AI 분야에 대해서도 해박한 지식을 가지고 있다.


다양한 분야에 관심이 많아 현재는 인공지능 커뮤니티인 ‘AI 에이전트 연구회’를 운영하고 있으며, SKT 이프랜드 플랫폼에서 3년 이상 인플루언서로 활동하며 ‘호몽캠프’를 110회 이상 진행한 바 있다.


작가는 ‘50플러스 오픈랩’이라는 중장년과 시니어의 디지털 역량강화를 위한 교육 플랫폼에서 수석 가디언즈로 AI 분야의 전도사로 활동하기도 한다.


주요 강의 분야는 “챗GPT 시대 생산성을 500% 높여주는 인공지능”, “머신비전에서의 인공지능 활용”, “손에 잡히는 인공지능”, “스마트폰 AI 활용하기”, “시니어와 MZ세대간의 소통”등이 있으며, 저서로는 『프롬프트 엔지니어링 황금키』, 『손에 잡히는 인공지능』, 『나는 시니어 인플루언서다』가 있다.


작가의 이전글클로드 코드 자율 에이전트 기능의 선과 악