[IT린이] 대기업인데, ChatGPT를 못 만든다?

국내 빅테크는 LLM 말고 버티컬 AI에 집중하자

by 제나팡

Mar 24. 2023

안녕하세요! IT린이 제나팡입니다.

오늘도 찾아주셔서 정말 감사합니다!!

ㅠ,ㅠ 현생이 너무 바빠 정말 오랜만에 돌아왔습니다.

오늘은 ChatGPT 열풍에서 드러난 글로벌 빅테크 vs 국내 빅테크의 차이를 알아보면서,

아주 자연스럽게 초거대 AI의 동향까지 알아볼게요 :)

ChatGPT에 이어 GPT-4까지 발표되다

작년 12월부터 지금까지 줄곧 오픈AI가 만든 인공지능 챗봇 ChatGPT에 대한 언급이 끊이지 않고 있습니다. 최근 대기업 공개채용 시즌이 시작하면서, ChatGPT로 자기소개서를 작성하는 꿀팁에 대한 유튜브 영상도 나오더라고요.

이처럼 ChatGPT가 사람처럼 대화를 나눌 수 있었던 이유는 대규모 자연어 처리 언어모델(LLM) GPT-3.5를 기반으로 했기 때문입니다. 게다가 차세대 최신 언어 모델인 GPT-4까지 발표되면서, 앞으로 더욱더 답변의 정확도는 높아지고, 인식 범위가 이미지까지 확장이 되어 심지어 의학적 조언까지 제공할 수 있다고 해요.

(GPT-4 모델의 Exam Results (GPT-3.5 성능과 비교) / 출처:OpenAI)

오픈 AI는 GPT-4 모델의 성능을 GPT-3.5와 비교한 결과를 발표하기도 했습니다. 초록색이 GPT-4, 파란색이 GPT-3.5의 결과 수치예요. 특히, 언어 모델 성능의 지표로 사용되는 MMLU 점수를 비교해 보면, GPT-4 정확도는 약 86%로, 약 70%를 기록한 GPT-3.5 대비 16% 포인트 더 높은 수치를 보이고 있습니다.

물론 아직도 부정확한 답변을 내놓을 가능성은 있지만, 빠른 시간 안에 업그레이드 버전을 놓았다는 점에 주목이 되었습니다.

ChatGPT가 쏘아 올린 초거대 AI 열풍

이제는 단순 초거대 AI 모델에서 나아가, 협업툴 플랫폼과 같이 결합되어 생산성을 제고하려는 시도가 많이 보이고 있어요. 비즈니스 분야에서의 혁신이 가속화되는 듯해요.

2019년부터 마이크로소프트와 오픈 AI는 전략적 파트너십을 맺고 다양한 업무 부문에서 협업을 해오고 있습니다. 특히 지난 2월, 마이크로소프트는 협업툴 팀즈에 ChatGPT를 결합한 ‘팀즈 프리미엄'을 출시하기도 했죠. 자동으로 회의록을 작성해 주거나, 업무 체크리스트를 알려주는 기능을 해준다고 해요.

초거대 AI 격차를 줄이기 위한
국내 빅테크 업체 동향

이와 같은 시도에 맞서서, 국내 빅테크 기업들도 국내 사용자에 최적화된 AI를 생성하고 있습니다. 아무리 ChatGPT의 성능이 좋아도, 한국어 버전은 아쉬운 점이 많다는 후기에서 알 수 있듯, 아직 ‘한국어' 버전의 초거대 AI는 블루오션처럼 남아있습니다.

(다만, GPT-4가 한국어를 포함한 다국어 버전을 강화하여, 다국어 서비스가 3.5 버전의 영어능력을 넘어섰다는데,,, 앞으로의 험난한 과정이 예상되네요ㅠㅠ)

네이버 : 하이퍼클로바X - 한국어 데이터 학습량 증가

카카오 : KoGPT 3.5 업그레이드 & 카카오톡 기반의 AI 챗봇 서비스 ‘다다음(ddmm)’

LG : EXAONE -3000억 개의 파라미터 보유

한글과컴퓨터 : 한컴오피스에 AI 기능 접목한 AIaaS 솔루션

우선, 네이버의 동향부터 알아볼게요. 위에서 언급했듯이, ChatGPT의 한국어 버전이 아쉽다는 점을 공략하여 하이퍼클로바x는 ChatGPT보다 한국어 데이터를 6500배나 더 많이 학습시켰다고 해요. 오는 7월에 공개될 예정입니다.

(출처:네이버)

특히 네이버는 국내의 대표적인 검색 엔진이죠? 그동안의 검색엔진 운영 노하우와 방대한 양의 데이터를 기반으로, 한국인 최적 맞춤 검색용 생성 AI 서비스를 제공할 계획이라고 합니다. 또한, 지난 21일, SK C&C와 네이버클라우드는 사업 협력 협약을 체결하며, 네이버의 초거대 AI ‘하이퍼클로바X’와 결합해 금융 분야별 맞춤형 초거대 AI 모델을 발굴하기로 했습니다.

다음으로, 카카오도 알아볼게요. 카카오는 카카오브레인을 중심으로 AI 연구와 개발을 진행하고 있는데요. 카카오브레인 대표는 올 상반기 내에 KoGPT를 3.5버전으로 고도화하며, 올 하반기 내에 'Ko챗GPT'를 선보이겠다는 계획을 발표하기도 했습니다. 또한네이버와 다른 점은 이미지 생성용 AI 서비스를 공개했다는 점이에요. 지난해 12월, AI 아티스트 ‘칼로 1.0’ 오픈소스로 공개했는데, 입력 제시어로 빠르게 고품질 이미지를 만들어줍니다.

Image generation, Image painting, Image variation으로 총 3 종류의 서비스를 제공하고 있더라구요. (https://kakaobrain.com/techplayground/karlo/demo 궁금하시다면, 한 번 데모버전을 사용해보시는 건 어떠세요 :))

(출처: 칼로 데모버전 사이트)

Image Generation 서비스에 ‘puppy playing on the ground’를 입력했더니, 아래와 같은 이미지가 생성되었습니다 ㅎㅎ

BhbopbClI8dFzZwfzzCMKeP2ghvoUdV9R4ArM9jCto0V30mrmBmXkVnIhIY-80r7zyXa2Ut2EcvAAUROkBEB5a6vSPxe4CDWP8MTM5ZLr9NjNjth-KUYOK99hDJnOaqb_Sm_2fZU9emJXSTS33ys_rM

(출처: 칼로 데모버전 사이트)

LG는 AI 연구원을 중심으로, 3000억 개의 파라미터를 보유한 초거대 AI ‘엑사원 EXAONE’을 개발했습니다. LG그룹 초기 개발에만 1억 달러, 한화로 약 1283억 원에 달하는 거액을 과감히 투자하는 결정을 내리기도 했습니다.

또한, 한글과컴퓨터는 30년 이상의 업무 플랫폼 운영 능력과 챗봇 AI 기술을 결합한 AIaaS (AI as a Service )솔루션을 본격적으로 개발하고 있습니다.

초거대 AI 진입장벽, 국내 빅테크에도 해당된다?

그럼에도 제가 오늘 말씀드리고 싶은 건, 국내 빅테크 기업의 상황이 앞으로도 힘들어질 전망이라는 것입니다. 워낙 글로벌 빅테크 AI의 성능 향상 속도가 빠르기 때문이죠.

일례로, 오픈AI는 GPT-3.5를 공개한 지 4개월도 지나지 않아 GPT-4를 발표했습니다. GPT-3에서 GPT-3.5로 진화하기까지 2년이 넘는 시간이 소요된 것에 비해, 훨씬 더 속도를 낸 것을 알 수 있죠?

또한, 초거대 AI의 개발과 운영에 막대한 비용이 들어갑니다. 이러한 이유로 스타트업에게 너무나도 진입장벽이 높은 시장이기도 한데요. 실제로 국내 IT 스타트업들은 초거대 AI를 직접 개발하기보다는, ChatGPT를 특정 버티컬 서비스에 접목한 2차 서비스를 가공하여 제품을 내놓는 경우가 많죠.

알고 보니 이러한 진입장벽은 글로벌 시장으로 진출하려는 국내 빅테크 기업에게도 해당되는 지론이었네요. 글로벌 빅테크 사업체가 가지고 있는 막대한 자본력 때문이죠. 네이버는 파라미터 2040억 개를 하이퍼클로바에 학습시키며 1000억 원이 넘는 비용을 투자했지만, 비용 투자에 비해 체감되는 효용성이 적습니다. (리뷰요약과 상품설명에 하이퍼클로바가 적용됐다는데, 사용자가 알아채기엔 아직 한계가 있는 것 같아요)

또한, 역량이 부족하지만 시장에 진입한 사례도 있습니다. 바로, 지난 19일에 잠깐 공개되었다가 사라졌던, 카카오브레인이 다다음(ddmm)! 이는 카카오톡에 적용되는 AI 챗봇 서비스인데, 카카오는 오픈베타 사용자를 모집했으나 하루 만에 재정비를 결정하기도 했죠. 완성도가 낮은 상황에서 트렌드에 맞춰 성급하게 공개한 것 같습니다.

초거대AI를 개발하기에 역부족한 국내 사업 환경

종합적으로 봤을 때, 단순히 국내 기업의 기술력만이 문제는 아닙니다. 국내 사업 환경은 클라우드 인프라, 데이터 센터와 같은 물리적인 요소뿐만 아니라 데이터 공유와 관련된 인식으로 인해, ‘빅테크와 대적할 만한' 초거대 AI를 개발하기에는 여러 제약이 많습니다.

세계 시장에서 경쟁력을 갖기 위해 niche market을 타기팅한 모델을 개발하는 것이 우선적으로 필요해 보이네요. 사업 환경면에서도, 비용 투자면에서도 가시밭길이 예상되는 LLM(거대 언어모델, 초거대 AI의 기반이 되는 언어모델)을 직접 개발하기보다, 기존 초거대 AI의 API를 활용해 버티컬 서비스를 구축하는 것이 훨씬 더 효율적일 것 같습니다.

keyword

작가의 이전글[IT린이] 데이터웨어하우스와 데이터레이크?![IT린이] 노션과 구글워크스페이스에 AI가 더해지면?작가의 다음글