네이버의 반격: ‘하이퍼클로바X 씽크’

by 글로벌연합대학교 인공지능융합소장 이현우교수

Jul 1. 2025

#AI산업혁명

한국어 중심 멀티모달 AI 추론 시대를 열다

글로벌연합대학교 인공지능융합연구소장

버지니아대학교 이현우 교수

1. 한국어 특화 AI의 진화, ‘하이퍼클로바X 씽크’의 등장

2025년 6월 30일, 네이버는 또 하나의 중대한 이정표를 발표했다. 바로 멀티모달 추론 모델 ‘하이퍼클로바X 씽크’의 개발 완료다. ‘씽크(THINK)’라는 이름에서 알 수 있듯, 이번 모델은 단순한 언어 생성이나 회귀적 대화 기능을 넘어 인간과 유사한 추론 능력을 갖춘 점이 핵심이다. 특히 ‘한국어’에 초점을 맞춰 고도화된 이 모델은, 국내외 오픈소스 모델보다 월등한 한국어 이해도를 보여주며 글로벌 AI 경쟁 시장에서 한국 기술의 정체성을 공고히 하고 있다.

그동안 대부분의 대형 언어모델이 영어 중심으로 학습되고 벤치마크되던 상황에서, 네이버는 KoBALT-700 및 HAERAE-벤치와 같은 한국어 특화 평가 지표를 활용하여 정교하고 전문적인 언어 능력을 증명했다. 이는 네이버가 ‘사용자 중심의 AI’, 그 중에서도 ‘한국 사용자 중심의 AI’로 전략의 초점을 맞추고 있다는 것을 분명히 보여준다.

또한 하이퍼클로바X 씽크는 단순한 언어처리뿐만 아니라, 멀티모달(다중모드: 이미지+텍스트) 기반 추론 능력까지 포함하고 있어, 미래형 AI 에이전트 시대에 걸맞는 핵심 기술 플랫폼으로 평가된다.

2. 추론 기반 AI와 기존 모델의 차별성: 인간처럼 ‘생각하는’ AI

‘하이퍼클로바X 씽크’의 가장 두드러진 특징은 바로 ‘추론 기반’이라는 구조적 설계다. 단순한 언어 생성을 넘어, AI가 문맥을 파악하고 의미를 해석하며, 숨은 정보 간의 관계를 종합적으로 판단하는 기능이 추가되었다는 점에서 이는 단순한 LLM의 한계를 넘는 진화라고 할 수 있다.

예컨대, 기존의 GPT-4나 GPT-4o와 같은 비추론 언어모델이 주어진 정보 내에서만 정해진 틀에 따라 답을 생성했다면, 하이퍼클로바X 씽크는 시각 정보와 언어 정보를 통합해 추론하는 능력을 보여준다. 실제로 한국의 대학수학능력시험(STEM 분야) 문제에서, 시각적으로 주어진 생태계 그림을 읽고, 그것이 의미하는 ‘시간에 따른 식생 변화’와 ‘총생산량 그래프’ 등을 분석한 후, 이를 기반으로 올바른 선택지를 고르는 능력까지 구현되었다.

이는 단순한 '답변 제공'이 아닌, ‘문제 해결형 AI’, 나아가 ‘지시 수행형 AI’로의 전환을 의미하며, 향후 일상 속에서 인간의 복잡한 요구사항을 더 세밀하게 인지하고 대응할 수 있는 지능의 기반이 되는 기술이다.

3. 벤치마크 결과가 말해주는 ‘씽크’의 실력

‘하이퍼클로바X 씽크’는 다양한 벤치마크에서 의미 있는 결과를 보여주며 기술적 완성도를 입증했다. 서울대학교 언어학과와 함께 설계한 KoBALT-700, 그리고 HAERAE-벤치에서는 국내외 대부분의 오픈소스 모델들을 압도했으며, 특히 한국어 기반 이해와 응답의 정밀성에서는 독보적인 결과를 나타냈다.

STEM 기반 시각추론 능력을 평가하는 KCSAT STEM 벤치마크에서도, 평균 46.4%의 정확도를 기록하며 오픈AI의 추론 모델인 o1(50.9%)에 근접한 성능을 보였다. 이 수치는 GPT-4.1(40.3%)과 GPT-4o(32.0%)보다는 높은 수치이며, 네이버가 단순히 모델의 규모가 아닌 문제 해결 능력 중심의 성능에 집중하고 있음을 시사한다.

특히, 네이버가 멀티모달 추론을 주된 목적으로 이 모델을 개발한 것이 아님에도 이러한 성과를 낸 점은, 차후 멀티모달 기능 중심의 후속 모델 개발에 있어 더 큰 가능성을 예고하고 있다.

4. 기술의 경량화와 오픈소스 전략: 소버린 AI의 확산

이번 발표에서 또 하나 주목할 만한 점은 바로 **추론 모델의 경량화(pruning)**와 증류(distillation) 버전의 오픈소스 공개 계획이다. 이는 대형 AI 기술이 대기업이나 초거대 클라우드 인프라 기업만의 것이 아니라, 스타트업과 학계로 기술 민주화가 확산될 수 있도록 하겠다는 네이버의 의지로 읽힌다.

이러한 전략은 최근 전 세계적으로 확산되고 있는 소버린 AI(Sovereign AI) 흐름과도 맞물린다. 즉, 특정 글로벌 플랫폼에 의존하지 않고, 자국 내에서 독자적으로 운영 가능하고 고도화할 수 있는 AI 기술 생태계를 마련하겠다는 것이다.

실제로 하이퍼클로바X 기반 모델은 이미지, 영상, 음성까지 확장된 멀티모달 기술을 이미 확보하고 있으며, 이들 기술을 경량화해 API 또는 온디바이스 형태로 확산시킬 경우, AI 보급의 경제성과 접근성 모두를 충족시킬 수 있는 기반이 마련될 것으로 기대된다.

5. ‘지능의 향상’과 ‘감각의 확장’으로 나아가는 네이버의 AI 철학

네이버의 성낙호 하이퍼스케일 AI 총괄은 “하이퍼클로바X는 ‘지능의 향상’과 ‘감각의 확장’이라는 두 축을 중심으로 고도화되고 있다”고 밝혔다. 이번 ‘씽크’ 모델은 그 중에서도 ‘지능의 향상’에 해당하는 진화라고 볼 수 있다. 인간의 사고 방식, 특히 논리적 추론과 문제 해결 능력에 가까운 기능을 AI에 부여하려는 시도는, 이제 막 시작된 멀티모달 AGI(Artificial General Intelligence)로 가는 긴 여정의 중요한 출발점이 된다.

앞으로 네이버는 현재 확보한 이미지·영상·음성·텍스트 융합 능력을 바탕으로, 보다 정교한 감각 확장형 AI로의 진화를 예고하고 있으며, 이는 단순히 챗봇이나 검색 보조를 넘어, 일상의 문제 해결 파트너로서의 AI 시대를 선도할 수 있는 기반이 될 것이다.

결론: 한국어 중심 추론 AI의 시작, ‘씽크’의 미래

‘하이퍼클로바X 씽크’는 단지 네이버의 기술 성과가 아니다. 그것은 한국 AI 산업이 자국어 기반에서 독립적이고 고도화된 AI 생태계를 구축할 수 있다는 신호탄이며, 글로벌 AI 시장에서 언어와 문화의 다양성을 반영하는 새로운 패러다임을 제시한다.

지금 이 모델이 보여주는 46.4%의 정확도는 숫자에 불과할 수 있지만, 그 뒤에 숨은 맥락은 크다. 인간처럼 '생각'하는 AI, 그리고 그것이 ‘한국어’로 이뤄진다는 점. 이 두 가지는 곧 기술이 우리 언어, 우리 문화, 우리 삶을 중심으로 돌아오고 있다는 강력한 메시지이다.

이제 하이퍼클로바X 씽크는 단순한 기술을 넘어, 우리가 어떤 언어로, 어떤 가치로 AI를 만들어갈 것인가에 대한 철학적 출발선에 서 있다. 그 출발선에서, 한국이 주도권을 잡을 가능성은 그 어느 때보다 뚜렷해지고 있다.

keyword

매거진의 이전글AI 칩 전쟁의 그림자SK텔레콤 ‘에이닷 엑스 4.0’의 오픈 소스 공개매거진의 다음글