brunch

매거진 Future Nugget

You can make anything
by writing

C.S.Lewis

by 낭만 스케치북 Jun 09. 2024

[미래기술 아티클 요약] 멀티모달 AI

미래에 어떤 기술이 생길까? 우리 일상에 어떤 영향을 미칠까?

*미래기술, 신기술, 미래예측과 디자인, 사회적 이슈 등의 주제로 신중히 읽고 분류하여 유용한 정보만을 큐레이팅하고 있습니다.




구글 프로젝트 Astra: 풍부한 잠재력, 하지만 시간이 걸릴 예정

Google Project Astra hands-on: Full of potential, but it’s going to be a while



멀티모달 AI로의 전환은 앞으로의 수년간의 많은 노력이 필요합니다.

Photo by Sam Rutherford/Engadget


프로젝트 아스트라 (Astra)

"프로젝트 아스트라(Project Astra)"는 구글 I/O 2024에서 공개한 새로운 AI 어시스턴트 시스템으로 강력한 멀티모달(Multi-modal)의 보조기능을 탑재하게 됩니다. 

이는 제미나이(Gemini)의 지능과 구글 렌즈(Google Lens)의 이미지 인식 능력, 그리고 강력한 자연어 응답을 결합한 새로운 AI 시스템입니다.


*멀티모달 (Multi-modal) : 여러 가지 방식이나 모드를 결합한 것으로, 텍스트, 이미지, 소리 등 다양한 형태의 데이터를 동시다발적으로 처리하고 이해할 수 있는 인공지능

*제미나이 (Gemini) : 구글에서 개발한 인공지능 언어 모델. 멀티모달 기능을 갖추고 있습니다.

*자연어 (Natural Language) : 인간이 일상에서 사용하는 언어


이곳을 클릭해서 영상을 확인해 보세요


Photo by Sam Rutherford/Engadget



실시간 "기억" 기능

현재 대부분의 사람들은 음성을 통해 디지털 어시스턴트와 상호작용합니다. 아스트라는 시각과 청각을 추가하여 AI와 소통하는 멀티모달 방식을 제공합니다. 위 영상을 보시면 휴대폰으로 상황을 비춰주면서 실시간으로 AI와 소통을 합니다. 예를 들어 "지금 소리가 나는 곳이 어디야?" "지금 이곳이 어디인 것 같아?" "이게 뭐야? (화면에 어떤 물체를 가리키는지 표시하면서)"와 같은 질문들이 가능하게 됩니다. 

멀티모달 AI는 가장 흥미로운 연구 중 하나인데요, 아스트라는 실시간으로 주변 환경을 인식하고 질문에 응답할 수 있는 AI를 제공합니다. 예를 들어, 물건을 스캔한 뒤에 카메라를 비추며 내가 안경을 30초 전에 어디다 뒀는지 물어보면 AI가 알려줍니다.


Photo by Sam Rutherford/Engadget



여전히 남은 개발과제

아스트라는 아직 초기 단계로서 기기 자체가 아닌 클라우드의 도움이 필요하며, "기억" 기능은 단기간에만 지속됩니다. 더 많은 기능을 제공하기 전에 극복해야 할 많은 장애물이 있습니다.

연구자들은 아스트라의 멀티 모달 기능을 확장할 수 있는 가능성을 언급하며, 이는 더 많은 기능을 가능하게 할 것입니다.




큐레이터: 골뱅이무쵸

번역 및 요약: AI낭어


원본: Sam Rutherford&Karissa Bell, Google Project Astra hands-on: Full of potential, but it’s going to be a while, May 2024, Engadget

매거진의 이전글 [미래기술 아티클 요약] 치아 재생
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari