brunch

You can make anything
by writing

C.S.Lewis

by 호몽 이용호 Nov 09. 2023

LG AI 엑사원 2.0은 챗gpt를 이길까?

이용호가 말하는 ‘생활 속의 인공지능’

[사진출처=LG AI연구원]

2023년 7월 LG AI연구원이 초거대 인공지능(AI) '엑사원(EXAONE) 2.0' 모델을 공개했다. 2021년 12월 ‘엑사원’을 처음 소개한 지 약 1년 7개월 만에 업그레이드 버전을 발표한 것이다. 이번 칼럼에서는 챗gpt가 선보인 이후 수많은 생성형 인공지능 모델들이 쏟아져 나오고 있어 그 영향력이 과연 어느 정도일까 의심과 궁금증을 동시에 가지고 살펴보고자 한다. 국내 대기업이 발표하는 인공지능모델이라 좀 더 기대감을 가지고 바라보게 되는 것 또한 인지상정이라 하겠다. 이번에 발표된 ‘엑사원’이 기존 챗gpt와 비교해 어떤 차별성이 있는지 살펴보면 가장 이해가 쉬울 것이라 생각한다.


우선 가장 눈에 띄는 사항은 챗gpt가 언어의 중점을 둔 모델이었다면 엑사원은 언어뿐 아니라 이미지도 학습해 사고하고 판단할 수 있는 인공지능이다. 엑사원은 언어와 이미지 간의 양방향 생성이 가능한 멀티 모달(Multi Modal) AI 기술을 통해 사진을 사용자가 업로드하면 해당 사진에 어울리는 멘트를 직접 적어 주고 SNS에 올릴 해시태그 내용까지 추천해준다. 처음 보는 이미지를 보고도 사람처럼 언어로 표현하는 것이 가능하다는 게 기존 생성형 인공지능기술들과 가장 큰 차별점이다. 


그리고 전문가용 인공지능으로 신뢰성이 높은 답변만 하도록 설계되어 LG 계열사와 국내외 협력사들을 주 사용자로 타케팅하여 보다 빠르고 편리하게 각 분야에 특화된 AI를 사용할 수 있도록 개발되었다고 한다. LG는 연내에 신소재와 신약개발에 엑사원을 투입한다고 발표도 하였다. 엑사원을 활용하면 수십 개월의 개발 기간을 수개월로 단축할 수 있다고도 한다.


이를 위해 ‘엑사원 2.0’은 파트너십을 통해 확보한 특허와 논문 등 약 4500만 건의 전문자료와 3억5000만장의 이미지를 학습했다. 특히 저작권, 신뢰성 등에서 AI 윤리원칙을 엄격히 준수하며 데이터 학습을 진행해왔다고 한다. 엑사원 2.0의 언어모델은 기존 모델과 동일한 성능을 유지하면서도 추론 처리 시간은 25% 단축하고, 메모리 사용량은 70% 줄여 비용을 약 78% 절감했다고 한다. 멀티 모달 기술에서는 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸지만, 추론 처리 시간을 83% 단축해 약 66%의 비용 절감을 달성했다고 한다.


기존 전문 지식 자료의 대부분이 영어인 점을 고려하여 엑사원은 한국어와 영어를 동시에 처리할 수 있는 이중 언어모델로 개발하였다. 특히 생성 AI의 고비용 문제를 해결하기 위해 대형언어모델과 멀티 모달 모델의 경량화 및 최적화 기술에 집중하고 원하는 용도나 예산에 맞게 모델의 크기, 종류, 사용 언어까지 맞춤형으로 설계할 수 있게 개발했다고 한다.


이번에 LG는 엑사원 3대 플랫폼인 유니버스(Universe), 디스커버리(Discovery), 아틀리에(Atelier)도 차례로 공개했다.


첫째, ‘엑사원 유니버스’는 전문가용 대화형 AI 플랫폼으로 완전히 탈바꿈하여 바이오, 의료, 금융 등 각종 분야의 전문 데이터를 근거로 답변을 한다. 챗gpt가 뻔뻔한 거짓말로 답변하는 이른바 할루시네이션 현상을 자주 보이는데 엑사원 유니버스는 이런 환각 현상을 최소화하여  각 분야 전문가들이 믿고 정보를 탐색하며 인사이트를 찾을 수 있는 플랫폼으로 만들기 위해 전문성과 신뢰성을 높이는 데 주력했다고 한다. 이를 위해 다른 대화형 AI들과 달리 사전 학습한 데이터는 물론 도메인별 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다. 또 질문에 대한 답변과 함께 각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 좌우 상단에 표시하여 사용자가 할루시네이션 여부를 재검증할 수 있게 해준다.


둘째, ‘엑사원 디스커버리’는 화학 및 바이오 분야에 특화한 플랫폼이다 이는 기존에 없던 새로운 지식을 발견하는 분야에 특징 지워져 가장 먼저 신소재 및 신약, 신물질 관련 개발 도움을 주는 플랫폼이다. 이를 위해 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 이미지 정보까지 데이터베이스화하는 심층 문서 이해(DDU, Deep Document Undestanding) 기술을 적용했다고 한다. 그 결과 엑사원 디스커버리를 통해 1만회가 넘었던 합성 시행착오를 수십 회로 줄이고, 40개월의 연구 개발시간은 5개월로 단축할 수 있을 것이라 한다. 올해 안에 엑사원 디스커버리 서비스를 제공되면 신소재, 신약, 신물질 관련 연구개발이 혁신적으로 변화 할 것으로 예상된다고 한다.


셋째, ‘엑사원 아틀리에’는 사진을 인식하고이를 토대로 텍스트를 생성하는 것과 같이 인간에게 창의적 영감과 아이디어를 제공하기 위해 개발한 플랫폼으로, 저작권을 확보한 이미지 데이터 3억5000만장을 학습하여 이미지 생성과 이미지 이해에 특화된 기능을 제공한다. 화장품 사진을 업로드 한 뒤에 제품 광고를 위한 마케팅 문구를 생성해 달라는 명령어를 입력하는 식으로 사용할 수 있다. 미국 파슨스 디자인 스쿨과의 공동 연구개발을 통해 인간과 AI가 상호작용을 통해 디자인을 완성해가는 ‘디자인 싱킹 프로세스’를 엑사원 아틀리에에 접목하기 위해 지속적인 연구를 이어가고 있다고 한다. 또 ‘캡셔닝 AI’ 기능도 탑재하여 처음 보는 이미지까지 자연어로 설명하고, 이미지 검색에 활용할 수 있는 문장이나 키워드 등의 메타 데이터를 생성할 수 있게 해준다.


LG는 이번 엑사원을 발표하면서 상위 1%의 전문가들을 위한 AI를 개발하기 위해 향후 5년간 3조6000억 원을 투입하여 미래 기술을 선점하겠다고 공언하였는데 현재의 1주가 과거의 10년간 보다 더 큰 기술변화가 이루어지는 세상에서 어느 정도 경쟁력을 가지고 생존해 나갈지 귀추가 주목된다. 특히 Open AI, 구글, 애플, 마이크로소프트, 아마존, 메타 등 초거대 기업들이 웅크리고 있는 글로벌 마켓에서 경쟁력 있게 생존한다는 것은 결코 만만치 않을 것이다. 그리고 엑사원은 전문가용 AI이고 철저하게 B2B 비즈니스 분야에 집중되어 개발이 될 것이기에 일반인들이 엑사원을 직접 체험하기는 어려울 것이고, 관련 기술이 접목되는 프로그램, 애플리케이션 그리고 생산제품을 통해서 간접 경험을 하게 될 것으로 예상된다. 과거 스마트폰 시장에서 애플과 삼성에 밀려 쓴맛을 본 LG가 인공지능분야에서는 선도적인 역할을 하여 실추된 명예를 다시 회복하기를 응원해본다. 


| 작가 프로필


이용호 칼럼니스트는 스마트 공장에서 주로 사용되는 ‘머신비전’ 전문회사인 ‘호연지재’를 경영하고 있으면서 다양한 분야에 관심이 많아 메타버스와 유튜브 인플루언서로 활동하고 있다. 특히 ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 AI 분야에 대해서도 해박한 지식을 가지고 있다. 또한 SKT 메타버스 플랫폼인 이프랜드(ifland)에서 매주 월요일 오후 9시에 정기적으로 ‘힐링토크쇼 호몽캠프’를 진행하고 있으며 86회 이상 진행된 토크쇼에는 작가, 강사, 가수, 연주가, 아티스트, 사업가 등 여러 분야의 전문가들이 초대되었다. 


주요 강의 분야는 “챗gpt 시대 생활 속의 인공지능 발견하기”, “시니어와 MZ세대 간의 원활한 커뮤니케이션”, “시니어 세대 인플루언서 활동으로 인생 이모작”, “워라밸 시대 워크닉으로 행복한 인생 만들기” 등이 있으며, 저서로는 『나는 시니어 인플루언서다』가 있다. 

작가의 이전글 챗gpt로 제안서 작성을 잘하기 위한 노하우 
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari