[경제 신문 정리] 매경 2023/05/10
개발자 회의서 '팜2' 공개 예정
코딩·수학연산 기능 수행하고
전세계 100개 이상 언어학습
한국어 특화 토종LLM 위협
구글이 세계 100여 개 언어로 글쓰기와 코딩을 지원하는 등 성능이 대폭 개선된 새로운 인공지능(AI) 모델을 내놓는다.
검색형 플랫폼 시대가 저물고 명령형 플랫폼을 선점하려는 경쟁 구도가 가열되면서 대표 빅테크들이 초거대 AI 파운데이션 모델 개발의 가속페달을 밟고 있다. 특히 마이크로소프트(MS), 구글 등이 새롭게 내놓은 AI 모델은 언어 능력을 크게 개선한 것이 특징으로, 국내 정보산업과 플랫폼 업계를 위협할 수준이라는 분석이 나온다. 전 세계적으로 자체 AI 모델을 보유한 나라는 한국을 비롯해 미국, 중국, 이스라엘 등 4개국이다.
LLM 등 파운데이션 모델은 챗GPT와 같은 생성형 AI 서비스의 근간이 된다. 오픈AI LLM 'GPT'의 대항마 격인 팜2는 지난해 4월 처음 선보인 팜을 개선한 모델로 100개 이상의 언어를 지원한다. 구글 내부에서는 코드명 '통합언어모델'로 불리는 프로젝트다. 특히 팜2는 창의적인 글쓰기, 분석을 비롯해 광범위한 코딩, 수학 연산 등 고난도 작업을 수행할 수 있을 정도로 성능이 획기적으로 개선된 것으로 보인다.
주목할 점은 구글이 한국어와 일본어로 확장을 콕 짚어 언급한 것이다.CNBC가 입수한 구글 내부 문서에 따르면 일본어와 한국어로의 확장은 구글이 바드와 서치(검색)를 발전시키기 위해 언급한 '생성적 경험' 계획 중 일부로 포함됐다. 이에 따라 바드는 한국어와 함께 일본어 서비스도 시작할 것으로 점쳐진다.
한국을 대표하는 네이버와 카카오는 '한국어 특화'를 무기로 한 자체 LLM을 개발하고 있어 구글·MS와 경쟁하는 것이 불가피하다. 네이버는 오는 7월 말 한국어·일본어에 특화한 자체 LLM '하이퍼클로바X'를 공개할 계획이다. 카카오도 올해 하반기 카카오브레인을 통해 초거대 AI 언어 모델인 '코GPT(KoGPT)'의 업그레이드 버전을 출시할 예정이다.
업계 일각에서는 국내 AI를 보호하는 역할을 해온 '언어장벽'이 무너지고 있다는 우려가 나온다. 실제로 오픈AI가 공개한 GPT-4의 '테크니컬 리포트'에 따르면 인문학, 사회과학, 수학 등 다양한 분야 문제를 각국 언어로 번역한 뒤 GPT-4 기반의 챗GPT에 풀게 한 결과 영어에서는 85.5%, 한국어에서는 77%의 정확도를 보였다.
구글은 챗GPT가 선풍적 인기를 끌자 기존 LLM인 '람다(LaMDA)'에 기반한 AI 챗봇 바드를 부랴부랴 출시했지만 성능에서 한계를 보였다. 팜2가 탑재된 바드는 완전히 새로운 모습을 보일 가능성이 높다. 팜은 람다보다 학습 매개변수가 3배 이상 많다.
구글은 올해 3월 "기업이 간단한 자연어 프롬프트에서 텍스트, 이미지, 코드, 동영상, 오디오 등을 생성하는 데 도움이 될 것"이라면서 팜용 응용프로그램 인터페이스(API)도 공개했다.