네이버의 하이퍼클로바X

#칼럼/에세이

네이버의 하이퍼클로바X, 이미지 이해 및 멀티모달 기술로 본격적인 글로벌 AI 경쟁 시작


메타ai뉴스 논설위원

이현우 교수


네이버가 대형언어모델(LLM) '하이퍼클로바X'에 시각 정보 처리 능력을 업데이트하며 대형멀티모달모델(LMM)로 업그레이드했다. 지난해 8월 24일 하이퍼클로바X 공개 이후 1년 만에 이뤄진 메이저 업데이트로, 네이버는 이를 통해 외산 인공지능(AI) 챗봇들과 본격적인 경쟁을 펼치겠다는 의도를 드러냈다.


네이버(대표 최수연)는 22일 하이퍼클로바X를 이미지 및 음성 처리가 가능한 LMM으로 고도화한다고 발표했다. 이미지 인식 및 처리 기능은 27일부터 대화형 AI 에이전트 '클로바X(CLOVA X)'에 추가될 예정이며, 하반기 중 '클로바 스튜디오'에도 도입을 계획하고 있다.


이번 업데이트로 사용자는 클로바X 대화창에 이미지를 업로드해 추출된 정보와 입력한 질의를 바탕으로 다양한 대화를 나눌 수 있게 된다. 클로바X는 사진 속 현상을 묘사하거나 상황을 추론하는 등 다양한 지시를 수행할 수 있으며, 표나 그래프 분석까지 가능하다. 기존 클로바X의 글쓰기, 코드 생성, 번역 기능 외에도 이미지 이해 능력을 기반으로 활용 범위를 넓혀가겠다는 계획이다.


하이퍼클로바X는 이미지 기반 문제 해결에서도 우수한 성능을 보였다. 국내 초중고등학교 검정고시 총 1480개 문항을 이미지 형태로 입력해 문제를 풀게 한 결과, 클로바X는 84%의 정답률을 기록해 GPT-4o의 78%보다 우수한 성과를 보였다.


지난 20일에는 클로바 공식 기술 블로그를 통해 생성 AI 기반 음성 합성 기술 '스피치 X(Speech X)'도 공개했다. 이 기술은 텍스트와 음성 데이터를 결합해 자연스러운 음성을 생성하며, 복잡한 음성 패턴 인식 및 문맥 이해 능력을 기반으로 사람과 자연스러운 대화가 가능하도록 설계되었다.


하이퍼클로바X의 발전은 B2C 서비스에서의 멀티모달 기능 적용뿐만 아니라 기업용 AI 솔루션으로도 제공될 예정이다. 네이버는 AI 안전성 역시 강화하고 있으며, 이를 위해 ‘네이버 ASF(AI Safety Framework)’ 체계를 기반으로 AI 시스템의 잠재적 위험을 평가하고 다각도로 검토를 진행 중이다.


성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “하이퍼클로바X는 LLM에서 시작해 이미지 이해 능력을 더한 VLM으로 진화하고, 음성 멀티모달 언어 모델로 발전하고 있다"며, "하이퍼클로바X의 발전된 능력을 다양한 네이버 서비스에 도입해 새로운 사용자 가치를 창출하겠다"고 밝혔다.



1 하이퍼클로바X의 이미지 인식 및 처리 기능이 사용자 경험에 어떤 변화를 가져올 수 있는가


하이퍼클로바X의 이미지 인식 및 처리 기능이 추가되면서 사용자는 훨씬 직관적이고 다양한 방식으로 AI와 상호작용할 수 있게 됩니다. 예를 들어, 이미지 속에 포함된 정보를 직접 분석하고 텍스트와 연계해 종합적인 답변을 제공할 수 있으므로, 이미지 기반 질문이나 복잡한 시각적 데이터 해석이 필요한 경우에도 높은 수준의 지원을 받을 수 있습니다. 사용자는 이제 단순히 텍스트 입력이 아닌, 이미지를 기반으로 대화를 진행하거나 문제를 해결할 수 있어 업무 효율성을 크게 높일 수 있습니다. 이러한 기능은 특히 디자인, 광고, 리서치 등 시각적인 데이터가 중요한 분야에서 큰 변화를 가져올 수 있습니다.


2 네이버의 '스피치 X' 기술이 음성 기반 AI 서비스에 어떤 영향을 미칠 것으로 예상되는가


스피치 X 기술은 음성 기반 AI 서비스의 자연스러움과 사용자 친화성을 크게 향상시킬 것으로 예상됩니다. 복잡한 음성 패턴을 인식하고 언어적 맥락을 이해할 수 있어, 단순 명령을 넘어서 자연스러운 대화가 가능해집니다. 예를 들어, 고객 상담, 음성 비서, 교육 도구 등에서 스피치 X가 적용되면 기존의 단조롭거나 기계적인 음성을 벗어나 감정 표현이나 문맥 이해가 강화된 대화형 AI 서비스가 제공될 수 있습니다. 이는 사용자와의 상호작용을 보다 인간적인 경험으로 변화시키며, 음성 기반 서비스의 사용자 만족도를 크게 높일 것입니다.


3 이번 업데이트로 하이퍼클로바X는 글로벌 AI 경쟁에서 어떤 포지셔닝을 확보할 수 있는가


이번 업데이트로 하이퍼클로바X는 이미지와 음성을 동시에 이해하고 처리할 수 있는 멀티모달 AI 모델로 진화하며, 글로벌 AI 시장에서의 경쟁력을 강화했습니다. 특히 한국어 기반의 높은 정확성과 성능을 무기로 국내 시장뿐 아니라 다국어 AI 모델이 중요한 아시아 지역에서도 차별화된 경쟁력을 확보할 것으로 기대됩니다. GPT-4o 등 글로벌 모델과의 비교에서도 우수한 성과를 기록한 만큼, 네이버는 이번 업그레이드를 통해 글로벌 AI 시장에서 기술적으로 뒤처지지 않으며 독자적인 경쟁 우위를 유지하는 전략을 펼칠 수 있습니다. 이는 네이버가 B2C와 B2B AI 서비스 분야 모두에서 주도적인 위치를 차지하는 데 기여할 것입니다.


wmaif.com


세계메타버스AI연맹 이사장

이현우 교수

keyword
매거진의 이전글AI 맞춤형 모델 전쟁