구글, AI 응답을 UI로 만들어주는 'A2UI'출시

by 유훈식 교수
AI 에이전트 시대의
새로운 상호작용 패러다임

인공지능 기술이 단순한 정보 검색과 텍스트 생성을 넘어 사용자의 목표를 자율적으로 수행하는 에이전트 형태로 진화함에 따라, 사용자와 시스템이 상호작용하는 방식인 인터페이스(UI) 역시 근본적인 변화의 기로에 서 있다. 지난 수십 년간 소프트웨어 디자인의 중심은 사용자가 사전에 설계된 메뉴와 버튼을 따라 이동하는 내비게이션 구조에 머물러 있었다. 디자이너들은 사용자가 취할 수 있는 모든 경로를 예측하여 정적인 화면을 구성해 왔으나, 거대언어모델(LLM) 기반의 에이전트가 복잡하고 예측 불가능한 업무를 수행하기 시작하면서 기존의 고정된 대시보드나 단순한 채팅 창은 에이전트의 역량을 온전히 담아내지 못하는 한계에 봉착했다. 이러한 기술적 간극을 메우기 위해 구글은 에이전트가 상황에 최적화된 인터페이스를 직접 생성하고 제어할 수 있도록 돕는 오픈 소스 프로토콜인 A2UI(Agent-to-User Interface)를 출시했다.

A2UI

A2UI는 에이전트가 단순한 텍스트 응답을 넘어 풍부하고 인터랙티브한 사용자 인터페이스를 직접 '말할 수 있게' 만드는 표준 규격이자 라이브러리 세트다. 이는 사용자가 특정 작업을 완수하기 위해 에이전트와 여러 차례 대화를 주고받으며 정보를 확인하고 수정하는 번거로운 과정을 획기적으로 단축하는 데 목적이 있다. 예를 들어 식당 예약을 돕는 에이전트가 날짜와 인원수를 텍스트로 묻고 답하는 대신, 즉석에서 날짜 선택기와 확인 버튼이 포함된 폼 형태의 UI를 생성하여 제시함으로써 상호작용의 효율성을 극대화한다. 이러한 접근 방식은 생성형 AI가 텍스트와 이미지, 코드를 만드는 단계를 넘어 맥락에 맞는 인터페이스를 동적으로 생성하는 '생성형 UI(Generative UI)' 시대로의 진입을 의미한다.


A2UI의 기술적 정의와 핵심 철학

A2UI는 에이전트가 원격지에 있거나 서로 다른 신뢰 경계를 가로질러 작동할 때도 안전하고 일관된 네이티브 인터페이스를 제공할 수 있도록 설계된 개방형 표준이다. 기존의 방식이 에이전트가 직접 HTML이나 자바스크립트와 같은 실행 코드를 전송하여 클라이언트에서 렌더링하는 방식이었다면, A2UI는 UI의 구조와 의도를 담은 선언적 JSON 페이로드를 전송하는 방식을 취한다. 이러한 방식은 에이전트가 UI의 구체적인 구현 방식(How)에 관여하는 대신 어떤 컴포넌트가 필요한지(What)에 집중하게 함으로써 높은 유연성과 보안성을 동시에 확보한다.

5555555.png

A2UI의 핵심 철학은 보안 우선(Security First), LLM 친화성(LLM Friendly), 그리고 플랫폼 독립성(Framework Agnostic)으로 요약된다. 인공지능이 생성한 실행 코드를 그대로 받아들이는 것은 시스템 보안에 치명적인 위험을 초래할 수 있으나, A2UI는 이를 데이터 형태로 처리함으로써 위험을 원천적으로 차단한다. 또한 대규모 언어 모델이 UI 구조를 점진적으로 생성하고 수정하기 용이하도록 평면적인 컴포넌트 목록 형태의 데이터 구조를 사용하여 실시간 업데이트가 가능한 환경을 구축했다. 이는 에이전트가 복잡한 레이아웃을 한 번에 계산할 필요 없이 대화의 흐름에 따라 UI를 실시간으로 조립하고 보완할 수 있게 만든다.


A2UI의 시스템 구조

A2UI는 UI의 생성, 전송, 그리고 해석 단계를 명확히 분리하는 파이프라인 구조를 가지고 있다. 상호작용의 시작은 사용자가 채팅이나 다른 인터페이스를 통해 에이전트에게 메시지를 보내는 것으로부터 이루어진다. 사용자의 의도를 파악한 에이전트는 제미나이(Gemini)와 같은 모델을 활용하여 A2UI 규격에 맞는 JSON 응답을 생성한다. 이 응답은 단순히 화면을 그리는 명령이 아니라 컴포넌트 간의 관계, 데이터 바인딩, 그리고 이벤트 처리 로직을 포함한 정교한 청사진의 성격을 띤다.

66666666.png

생성된 A2UI 메시지는 A2A(Agent-to-Agent) 프로토콜이나 AG UI 프로토콜과 같은 전송 계층을 통해 클라이언트 애플리케이션으로 스트리밍된다. 클라이언트는 내부적으로 A2UI 렌더러 라이브러리를 보유하고 있으며, 수신된 JSON 페이로드를 파싱하여 각 추상 컴포넌트 타입을 해당 플랫폼의 구체적인 네이티브 위젯으로 매핑한다. 예를 들어 에이전트가 'text-field'라는 컴포넌트를 요청하면, 웹 애플리케이션에서는 리액트(React)나 앵귤러(Angular) 컴포넌트로, 모바일 앱에서는 플러터(Flutter) 위젯이나 스위프트UI(SwiftUI) 뷰로 렌더링되는 방식이다. 사용자가 렌더링된 UI에서 버튼을 클릭하거나 폼을 제출하면, 이러한 액션은 다시 이벤트 형태로 에이전트에게 전달되어 새로운 인터페이스 업데이트를 유도하는 순환 구조를 완성한다.


다양한 AI 에이전트와의 협업

A2UI는 독립적인 솔루션이라기보다 다른 에이전트 프로토콜들과 결합하여 강력한 생태계를 형성하는 요소다. 현재 에이전트 기술 스택은 데이터를 연결하는 MCP(Model Context Protocol), 에이전트 간 협업을 규정하는 A2A(Agent-to-Agent), 통신 채널을 담당하는 AG-UI, 그리고 인터페이스 규격인 A2UI로 구성되는 양상을 보인다. MCP가 외부 도구와 데이터 소스에 접근하는 '손과 발' 역할을 한다면, A2A는 여러 에이전트가 협력하여 복잡한 작업을 분담하는 '조직화'를 담당하며, A2UI는 이 모든 과정의 결과물을 사용자에게 전달하는 '얼굴' 역할을 수행한다.

https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F5dvuj2vh86i5okhlt9d1.png

이러한 분리된 아키텍처 덕분에 개발자들은 필요에 따라 프로토콜을 조합하여 사용할 수 있는 유연성을 얻는다. 예를 들어 기업용 고객 지원 시스템을 구축할 때, 메인 에이전트는 A2A를 통해 기술 지원 에이전트에게 업무를 위임하고, 기술 지원 에이전트가 생성한 A2UI 페이로드를 메인 인터페이스에 통합하여 보여줄 수 있다. 이때 AG-UI 프로토콜은 프론트엔드와 에이전트들 사이에서 실시간 상태 동기화와 세션 관리를 수행하며 전체적인 상호작용의 흐름을 조율한다. 이러한 프로토콜 간의 유기적인 연동은 파편화된 AI 서비스들을 하나의 일관된 사용자 경험으로 통합하는 원동력이 된다.


플러터(Flutter) 진영에서의 활용 역시 주목할 만하다. 플러터 GenUI SDK는 내부적으로 A2UI 규격을 사용하여 에이전트의 응답을 네이티브 위젯으로 변환하는데, 이를 통해 개발자는 하나의 에이전트 로직만으로 iOS, 안드로이드, 웹 등 모든 플랫폼에서 각 OS의 디자인 언어에 완벽히 부합하는 UI를 구현할 수 있다. 이러한 크로스 플랫폼 호환성은 기업이 신규 서비스를 출시할 때 플랫폼별로 인터페이스를 중복 개발해야 하는 비용을 획기적으로 줄여주며 서버 기반의 UI 제어를 통해 앱 업데이트 없이도 사용자 경험을 실시간으로 개선할 수 있는 기술적 기반을 제공한다.


생성형 UI 구축을 위한
실무 지침과 가이드라인

A2UI를 도입하려는 팀은 먼저 신뢰할 수 있는 컴포넌트 카탈로그를 구축하는 일부터 시작해야 한다. 카탈로그는 단순히 버튼이나 입력창의 모음이 아니라 에이전트가 이해할 수 있는 명확한 의미 정의와 데이터 모델을 포함해야 한다. 에이전트가 각 컴포넌트의 용도를 정확히 이해하도록 프롬프트 구성 시 컴포넌트의 명세와 사용 예시를 상세히 제공하는 것이 중요하다. 또한 에이전트의 출력이 항상 유효한 JSON 형식을 따르도록 구조화된 출력(Structured Output) 기능을 활용하거나 엄격한 스키마 검증 절차를 거치는 것이 시스템의 안정성을 보장하는 길이다.

a2ui-blog-1-component-gallery_2.original.png

개발 과정에서는 에이전트의 자유도와 시스템의 통제권 사이에서 적절한 균형점을 찾아야 한다. 모든 UI 생성을 에이전트에게 맡기기보다 자주 사용되는 레이아웃은 템플릿화하여 제공하고, 에이전트는 템플릿에 들어갈 데이터와 미세한 조정만을 담당하게 함으로써 일관성을 유지할 수 있다.


디자인 패러다임의 혁명:
정적 내비게이션에서 동적 의도 맵핑으로

A2UI의 등장은 전문 디자이너들에게 전통적인 사용자 여정 설계 방식에서 벗어날 것을 요구한다. 지금까지의 디자인이 사용자가 클릭할 메뉴와 이동할 페이지를 미리 정의하는 '경로 설계'였다면, 생성형 UI 시대의 디자인은 사용자의 의도를 시스템이 어떻게 해석하고 대응할지를 규정하는 '가이드라인 설계'로 변모해야 한다. 디자이너는 이제 개별 화면을 그리는 대신 에이전트가 사용할 수 있는 컴포넌트들의 논리적 결합 규칙과 제약 조건을 설계하는 '의도 건축가(Intent Architect)'의 역할을 수행하게 된다.


이러한 변화 속에서 인터페이스는 필요에 따라 생성되고 목적을 달성하면 사라지는 '휘발성 상호작용'의 성격을 띠게 된다. 디자이너는 에이전트가 어떤 상황에서 사용자에게 승인 절차를 요구해야 하는지, 혹은 어떤 데이터를 시각화할 때 가장 효과적인 위젯을 선택해야 하는지에 대한 정책을 수립해야 한다. 특히 에이전트가 자율적으로 판단하여 UI를 구성할 때 발생할 수 있는 오류를 방지하기 위해 사용자가 결정을 내리기 전 충분한 정보를 제공하고 확인을 유도하는 '확인 마찰(Confirmation Friction)' 설계를 적절히 배치하는 것이 핵심적인 역량이 된다. 이는 단순히 미학적으로 훌륭한 디자인을 넘어 시스템의 지능과 사용자의 신뢰 사이를 조율하는 고차원적인 설계 역량을 요구한다.


기술적 완성도만큼이나 중요한 것은 이 새로운 도구를 대하는 디자이너와 개발자의 사고방식 변화다. 우리는 더 이상 완벽하게 정제된 하나의 정답 화면을 만드는 데 집착하기보다 에이전트가 수많은 상황에 유연하게 대응할 수 있도록 돕는 지능적인 시스템 아키텍처를 고민해야 한다. 구글 A2UI는 그러한 여정을 돕는 가장 강력하고 안전한 나침반이 될 것이며, 이를 통해 구현될 진정한 의미의 개인화된 생성형 UI는 인류가 기술과 소통하는 방식을 한 단계 더 진화시킬 것이다.


AI에이전트를 활용한 UX/UI 디자인을 공부하고 AI디자인 자격증도 취득하고 싶다면?

에이전트디자인.png

https://onoffmix.com/ch/aidesign

AI를 활용하는 UXUI 디자이너들과 함께 소통하며 성장하고 싶다면?

https://litt.ly/aidesign


AI를 활용한 UX/UI 디자인을 책으로 공부하고 싶다면?

https://www.yes24.com/product/goods/148121780

AI 시대에 나만의 AI스타트업/비즈니스 시스템을 만들고 싶다면?

https://www.smit.ac.kr/major/ai-startup-introduce.php


keyword
매거진의 이전글멀티에이전트 Manus AI와 UXUI 디자인하기