미래에 어떤 기술이 생길까? 우리 일상에 어떤 영향을 미칠까?
*미래기술, 신기술, 미래예측과 디자인, 사회적 이슈 등의 주제로 신중히 읽고 분류하여 유용한 정보만을 큐레이팅하고 있습니다.
멀티모달 AI로의 전환은 앞으로의 수년간의 많은 노력이 필요합니다.
프로젝트 아스트라 (Astra)
"프로젝트 아스트라(Project Astra)"는 구글 I/O 2024에서 공개한 새로운 AI 어시스턴트 시스템으로 강력한 멀티모달(Multi-modal)의 보조기능을 탑재하게 됩니다.
이는 제미나이(Gemini)의 지능과 구글 렌즈(Google Lens)의 이미지 인식 능력, 그리고 강력한 자연어 응답을 결합한 새로운 AI 시스템입니다.
*멀티모달 (Multi-modal) : 여러 가지 방식이나 모드를 결합한 것으로, 텍스트, 이미지, 소리 등 다양한 형태의 데이터를 동시다발적으로 처리하고 이해할 수 있는 인공지능
*제미나이 (Gemini) : 구글에서 개발한 인공지능 언어 모델. 멀티모달 기능을 갖추고 있습니다.
*자연어 (Natural Language) : 인간이 일상에서 사용하는 언어
실시간 "기억" 기능
현재 대부분의 사람들은 음성을 통해 디지털 어시스턴트와 상호작용합니다. 아스트라는 시각과 청각을 추가하여 AI와 소통하는 멀티모달 방식을 제공합니다. 위 영상을 보시면 휴대폰으로 상황을 비춰주면서 실시간으로 AI와 소통을 합니다. 예를 들어 "지금 소리가 나는 곳이 어디야?" "지금 이곳이 어디인 것 같아?" "이게 뭐야? (화면에 어떤 물체를 가리키는지 표시하면서)"와 같은 질문들이 가능하게 됩니다.
멀티모달 AI는 가장 흥미로운 연구 중 하나인데요, 아스트라는 실시간으로 주변 환경을 인식하고 질문에 응답할 수 있는 AI를 제공합니다. 예를 들어, 물건을 스캔한 뒤에 카메라를 비추며 내가 안경을 30초 전에 어디다 뒀는지 물어보면 AI가 알려줍니다.
여전히 남은 개발과제
아스트라는 아직 초기 단계로서 기기 자체가 아닌 클라우드의 도움이 필요하며, "기억" 기능은 단기간에만 지속됩니다. 더 많은 기능을 제공하기 전에 극복해야 할 많은 장애물이 있습니다.
연구자들은 아스트라의 멀티 모달 기능을 확장할 수 있는 가능성을 언급하며, 이는 더 많은 기능을 가능하게 할 것입니다.
큐레이터: 골뱅이무쵸
번역 및 요약: AI낭어
원본: Sam Rutherford&Karissa Bell, Google Project Astra hands-on: Full of potential, but it’s going to be a while, May 2024, Engadget