보는 AI에서 분석하는 AI로, 구글 에이전틱 비전

이용호의 손에 잡히는 인공지능

by 호몽 이용호
260219 브런치.jpg [구글 에이전틱 비전]


인공지능 기술의 발전사를 되짚어보면, 그것은 언제나 인간의 감각을 모방하고 확장하려는 시도와 맞닿아 있었다. 그중에서도 시각 지능, 즉 컴퓨터 비전 기술은 자율주행차나 안면 인식 등 우리 삶 깊숙이 들어와 있다. 하지만 지금까지의 시각 지능에는 치명적인 한계가 있었다. 그것은 바로 수동성이다. 카메라는 렌즈에 들어오는 빛을 받아들일 뿐, 그 너머의 맥락을 능동적으로 탐구하지는 못했다. 그러나 구글의 제미나이 3 플래시가 선보인 에이전틱 비전은 이러한 한계를 넘어, AI가 주체적으로 대상을 분석하는 새로운 지평을 열었다.


에이전틱 비전을 이해하기 가장 쉬운 비유는 현미경을 다루는 생물학자다. 생물학자가 세포를 관찰할 때 한 번 보고 모든 것을 파악하지 않는다. 배율을 조절하고, 초점을 맞추고, 시료의 위치를 옮겨가며 관찰한다. 에이전틱 비전도 이와 같다. 사용자가 건넨 이미지 한 장을 그대로 받아들이는 것에 그치지 않고, 그 안에서 필요한 정보를 얻기 위해 스스로 도구를 사용한다. 여기서 도구란 바로 프로그래밍 코드다. AI가 이미지를 분석하기 위해 즉석에서 파이썬 코드를 작성하고 실행한다는 점은 기존 기술과 구분되는 가장 큰 특징이다.


이러한 기술적 진보는 의료 영상 분석 분야에서 획기적인 변화를 예고한다. 예를 들어 엑스레이 사진 한 장에서 미세한 골절을 찾아야 한다고 가정해 보자. 기존 AI는 전체 이미지를 학습된 패턴과 대조하여 골절 확률을 제시했다. 하지만 에이전틱 비전은 의심스러운 부위를 발견하면 코드를 실행하여 해당 영역을 고해상도로 자르고(Crop), 명암비를 조절하여 뼈의 미세한 금을 더욱 명확하게 드러낸다. 더 나아가 다른 각도에서 찍은 사진이 있다면 이를 불러와 대조하고, 논리적인 추론 과정을 통해 이것이 단순한 노이즈인지 실제 골절인지를 판별한다. 이는 AI가 의사의 진단을 보조하는 수준을 넘어, 의사와 대등한 수준의 치밀한 검토 과정을 수행할 수 있음을 시사한다.


또한 이 기술은 일상생활 속 비정형 데이터의 관리에도 큰 도움을 줄 수 있다. 대형 마트의 진열대를 찍은 사진을 생각해 보자. 수백 개의 상품이 빽빽하게 놓여 있는 상황에서, 기존 AI는 상품의 종류를 대략적으로 식별하는 데 그쳤다. 반면 에이전틱 비전은 각 상품의 라벨에 적힌 유통기한을 확대하여 읽어내고, 잘못 진열된 상품의 위치를 좌표값으로 계산해 낸다. 심지어 수십 종류의 음료수가 섞여 있어도 각각의 재고 수량을 정확히 세어 표로 정리하고, 부족한 물품이 무엇인지 시각적인 리포트로 만들어낼 수도 있다. 이 모든 과정이 인간의 개입 없이 AI의 자체적인 판단과 코드 실행으로 이루어진다.


금융 투자 분야에서도 에이전틱 비전의 활약이 기대된다. 복잡한 주식 차트에서 단순히 패턴을 찾는 것을 넘어, 특정 기간의 저점과 고점을 정확히 수치로 추출하고 이동 평균선을 직접 계산하여 그려볼 수 있다. 차트의 기울기를 수학적으로 분석하여 매수 또는 매도 타이밍에 대한 근거를 제시할 때, "그럴 것 같다"는 추측이 아닌 검증 가능한 데이터를 제시한다는 점은 투자자들에게 큰 신뢰를 줄 것이다.


에이전틱 비전은 인공지능이 환각이라는 고질적인 문제에서 벗어나 신뢰할 수 있는 도구로 진화하고 있음을 보여준다. 확률에 의존해 답을 찍는 것이 아니라, 코드를 통해 검증하고 논리적으로 추론하는 과정은 AI의 답변에 무게감을 더해준다. 물론 이 기술이 인간의 직관이나 통찰력을 완전히 대체할 수는 없을 것이다. 하지만 적어도 방대한 시각 데이터를 처리하고 그 안에서 객관적인 사실을 찾아내는 일만큼은 인간보다 더 끈질기고 철저하게 수행할 수 있다.


이제 우리는 AI에게 "이 사진에 뭐가 있어?"라고 묻는 시대를 지나, "이 사진을 분석해서 보고서를 써줘"라고 명령하는 시대를 맞이하고 있다. 생각하고 행동하며 관찰하는 AI의 등장은 우리에게 더 높은 차원의 생산성을 가져다줄 것이다. 꼼꼼한 관찰력과 지칠 줄 모르는 분석력을 갖춘 이 새로운 AI 파트너와 함께 만들어갈 미래가 우리 삶을 얼마나 편리하고 풍요롭게 만들지 기대해 본다.


| 작가 프로필


@2026 손잡인_이용호 프로필_브런치.jpg


이용호 작가는 스마트공장에서 주로 사용되는 ‘AI 머신비전’ 전문회사인 ‘호연지재’를 경영하고 있다. ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 10년 이상 연구한 AI 분야에 대해서도 해박한 지식을 가지고 있다.


다양한 분야에 관심이 많아 현재는 인공지능 커뮤니티인 ‘AI 에이전트 연구회’를 운영하고 있으며, SKT 이프랜드 플랫폼에서 3년 이상 인플루언서로 활동하며 ‘호몽캠프’를 110회 이상 진행한 바 있다.


작가는 ‘50플러스 오픈랩’이라는 중장년과 시니어의 디지털 역량강화를 위한 교육 플랫폼에서 수석 가디언즈로 AI 분야의 전도사로 활동하기도 한다.


주요 강의 분야는 “챗GPT 시대 생산성을 500% 높여주는 인공지능”, “머신비전에서의 인공지능 활용”, “손에 잡히는 인공지능”, “스마트폰 AI 활용하기”, “시니어와 MZ세대간의 소통”등이 있으며, 저서로는 『프롬프트 엔지니어링 황금키』, 『손에 잡히는 인공지능』, 『나는 시니어 인플루언서다』가 있다.


작가의 이전글1달러짜리 최신형 자동차와 거짓말쟁이 AI 챗봇