AI시대 새로운 챗gpt 출시 ChatGPT-5 특징

챗gpt

by 윤영돈 코치

Jul 4. 2024

AI 기술이 우리 삶과 사회에 혁명적인 변화를 불러왔다. 2030년 AI 글로벌 시장 규모가 1800조원으로 2023년 9배에 달할 것이다. 최근 AI 업계에서 깜짝 놀랄 만한 소식이 있다. OpenAI에서 만든 챗GPT(Generative Pre-trained Transformer)의 최신 버전인 GPT-5 출시 소식이다. 오픈AI는 GPT-5 출시와 함께 사용자의 작업을 돕는 ‘AI 에이전트’라는 새로운 기능을 내놓을 것으로 알려졌다.

특히 앤트로픽이 'GPT-4 터보'의 성능을 뛰어넘는 '클로드 3'를 출시하면서, 마이크로소프트(MS)가 코파일럿 유료 서비스에 제공하던 GPT-4 터보를 무료에 공개하며, GPT-5 새로운 GPT가 등장한다는 것은 기정사실화됐다. 코파일럿 유료 서비스에는 더 강력한 모델을 제공해야 하기 때문이다. MS가 딥마인드 창업자인 슐레이만을 영입했다는 것도 해외에서 큰 뉴스였다. 이는 슐레이만이 재직하던 유망 스타트업 인플렉션 AI를 사실상 인수하는 내용이라, 경쟁당국의 조사에 처한 MS에는 문제가 될 수 있기 때문이다.

애플이 구글과 AI 파트너십을 맺고, 아이폰에 '제미나이' 챗봇을 탑재할 것이라는 소식이 충격적이었다. 부진한 아이폰 판매를 위해서 당연한 일이라는 반응도 있다.

샘 올트먼 오픈AI 최고경영자(CEO)가 “고급 추론(reasoning) 기능을 기대하고 있다”고 말한 차세대 대규모언어모델(LLM) ‘GPT-5′가 이르면 올 여름 출시될 예정이다. 일론 머스크의 뉴럴링크에서 첫 두뇌 칩을 이식받은 환자가 생각으로 온라인 체스 게임을 플레이한 영상이 화제였다. 수술을 마친 뒤 두달 만에 나온 결과이다. 이 회사는 최근 로봇 개발 스타트업 피규어AI와 협업해 인간과 대화하면서 작업을 수행하는 휴머노이드 로봇 ‘피규어 01’을 공개했다. GPT-5가 나오면 로봇의 성능 개선에 도움이 될 전망이다.

GPT-5는 단순히 '더 똑똑해진' 수준을 넘어, 인간처럼 생각하고 판단할 수 있는 인공 일반 지능(AGI)으로의 진화를 목표로 하고 있다. AI 동향을 추적하는 에포크연구소는 오픈AI가 개발 중인 차세대 거대언어모델(LLM) GPT-5가 60조 개에서 최대 100조 개의 토큰(문장의 최소 단위)을 학습할 것으로 전망했다. 반면 지난해 출시된 GPT-4는 최대 12조 개를 학습한 것으로 추산했다. GPT-5를 훈련시키는 데 GPT-4가 학습한 양의 8배가 넘는 데이터가 필요할 수 있다는 얘기다. 하지만 오픈AI가 GPT-5에 현재 사용 가능한 고품질의 글과 이미지 데이터를 총동원해 학습시켜도 여전히 10조~20조 개가 모자랄 것으로 예측됐다.

샘 알트만(Sam Altman) 오픈에이아이(OpenAI) 대표는 중소벤처기업부 주최로 열린 '오픈에이아이와 케이(K) 스타트업(신생 벤처기업) 밋업' 행사에서 이렇게 이야기했다. "챗지피티(ChatGPT) 5 출시가 지연되는 건 아니다. 모델 간 차이가 있고 데이터 취합 등 많은 노력이 필요하다. 높은 수준의 스탠더드를 지키기 위해 노력이 필요하고 인풋을 개선하고 통합·진행하는 것"이라고 말했다. "오픈소스 커뮤니티는 오픈소스가 중요한데 모델 오픈소스, 많은 논문을 발표하는데 응용 프로그램 인터페이스(API)를 내놓고 싶다. 이 미션은 인공일반지능(AGI) 안전 전개가 중요하고 전술이고 계속 바낄 수 있다. 모델은 중간에 바낄 수 있다"고 설명했다. "2030년에는 놀라운 과학적 진보를 볼 것이다. 기후변화, 암 치료 등 놀라운 변화가 일어날 거 같다. 지금까지 못 본 놀라운 것 들이 이뤄질 거 같다"고 언급했다. OPEN AI의 샘 올트먼 최고경영자(CEO)는 GPT-5가 더 발전한 추론 능력을 선보일 것이라고 발표했다. 즉, AI와의 대화 중에 지연 시간을 줄이고 빠르고 정확한 추론을 기대할 수 있다는 것을 의미한다.

그렉 브록만 오픈에이아이 사장은 "챗지피티5는 많은 사람들이 궁금해 하는데 회사 역사를 보면 기술에 대해 모든 세대마다 여러 발전을 이뤄왔다"며 "챗지피티5에는 새로운 기능을 추가 제시하고 앞으로도 다른 요소가 들어간다. 많은 사람들이 엔지니어링을 하면서 노력하고 있다"고 말했다.

GPT-5는 GPT-4보다 훨씬 많은 매개변수를 보유하고 있다. 매개변수란, AI가 대화를 학습하는 데 필요한 정보량을 의미한다. 매개변수가 많을수록 사용자의 다양한 요구와 상황에 맞춰 더욱 효과적으로 대응할 수 있다. GPT-5는 GPT-4 대비 훨씬 더 많은 정보를 처리하며, 다중 멀티모달 기능을 통해 사용자에게 더욱 편리하고 맞춤화된 대화 경험을 제공한다. '멀티모달(Multi Modal)'은 텍스트, 이미지, 영상, 음성, 생체신호 등 다양한 형태의 입력을 인식할 수 있다는 것을 의미한다.

이에 따라 양질의 데이터를 더 빨리, 더 많이 확보하려는 개발사 간 경쟁이 치열해지고 있다. 오픈AI는 GPT-5 학습 데이터 확보를 위해 최근 유튜브 동영상 녹취본 활용이 가능한지를 논의했다고 WSJ는 전했다. 경쟁사인 구글의 플랫폼까지 잠재적 정보 공급처로 검토할 만큼 양질의 데이터 확보에 애를 먹고 있다는 것이다. AI 학습용 데이터가 빠르게 고갈되는 것은 언론사 등이 저작권 보호를 명분으로 데이터 사용을 막고 있기 때문이기도 하다.

업계에서는 오픈AI가 이날부터 계정 가입이나 로그인 없이도 챗GPT를 이용할 수 있게 한 것 역시 데이터 확보를 위한 것으로 보고 있다. 이용 절차가 간편해지면 이용자가 증가할 가능성이 크고, 이용자층이 확대되면 자연히 데이터 수집량도 늘기 때문이다. GPT-5에서 기대하는 5가지 기능을 꼼꼼하게 살펴보자.

다음은 챗GPT 5의 주요 특징 5가지이다.

1. 고급 추론 능력(advanced reasoning skills)

고급 자연어 이해(NLU) 및 생성(NLG) 능력이 향상된다. 인터넷에 있는 방대한 양의 텍스트 데이터로부터 학습하여, 자연어를 이해하고 생성하는 능력을 갖추게 된다. GPT-5는 이러한 능력을 한층 더 발전시켜, 더 긴 형식의 콘텐츠도 잘 이해하고 생성할 수 있다. 사용자와 더 인간처럼 소통할 수 있게 되었다. GPT-4가 출시되었을 때, 미국의 모의 변호사 시험과 대학 입학 자격 시험(SAT)에서 인간 수준의 능력을 보여서 화제였다. 소설, 시, 스토리 등 창의적인 글쓰기(Creative Writing) 작업에서 더 높은 수준의 창의성을 발휘할 수 있다. 이만큼 향상된 이해력(Comprehension)을 보여준다. 복잡한 문장 구조와 더 다양한 언어 표현을 이해할 수 있다. 이는 다양한 문맥에서의 문장을 더 정확하게 해석할 수 있게 해준다.

2. 멀티모달(Multi Modal) 기능 통합

멀티모달 생성 AI는 텍스트와 이미지를 넘어, 비디오와 보이스까지 포함하는 여러 가지 데이터 모드를 결합하여 창의적이면서 다양한 결과물을 생성하는 기술을 의미한다. GPT-5는 멀티모달 생성 AI 기술을 통해, 상황을 더 정확하게 인식하고 의사 결정을 명확히 진행할 수 있다. 얼마 전 공개한 동영상 생성 인공지능(AI) '소라'와 GPT-5 출시 시기와 맞물린다. 사용자 감정(Emotion)을 인식(Recognition)하고 그에 맞는 반응을 할 수 있는 능력이 향상되어 더 자연스러운 대화가 가능한다.

3. 다양한 언어 지원(Multilingual Support)

여러 언어를 더욱 잘 이해하고 생성할 수 있어 다국어 지원도 빼놓을 수 없다. GPT-4에 비해 더 많은 데이터를 학습하여 최신 정보와 다양한 주제에 대해 다양한 언어로 폭넓은 지식을 가지고 있다. 오픈AI는 지난해 다양한 국가의 데이터셋을 확보하는 이니셔티브를 공개했다. 최근 소버린 AI(Sovereign AI) 목소리가 높아지는 터라, 외국어도 소홀히 할 수 없는 입장이다.

4. 환각(Hallucination) 감소 및 정확한 대답(Accurate Responses)

챗GPT 기술의 응답을 신뢰하기 어려운 이유는 잘못된 데이터를 학습하여 오류를 정확한 정보처럼 제공하는 할루시네이션(hallucination) 때문이다. AI 할루시네이션(hallucination)은 정확하지 않거나 사실이 아닌 조작된 정보를 생성하는 것을 의미한다. 질문에 대해 더 정확하고 구체적인 답변을 제공하며, 맥락에 맞는 답변을 제시하는 능력이 향상되었다. GPT-5는 더 정교한 데이터 필터링과 학습 과정으로 정확도를 높이고, 사용자의 질문 맥락을 더 잘 이해하려고 노력한다.

5. 초개인화된 사용자 경험(Hyper-personalized User Experiences) 제공

개인화된 추천으로 사용자의 이전 대화와 선호도를 기반으로 맞춤형 추천을 제공할 수 있다. GPT-5의 핵심 GPT-5의 핵심 기능 중 하나로 개인화 서비스이다. 대화 유지(Conversation Continuity) 긴 대화에서도 일관성을 유지하며, 앞서 언급된 내용을 기억하고 적절히 참조할 수 있다. 지속적인 학습 과정으로 대화 내 문맥을 잘 이해하고 사용자 정보 및 대화 이력에 대한 기억을 강화함으로써 보다 자연스러운 대화가 가능해진다. 안전성 강화(Enhanced Safety)는 유해한 콘텐츠 생성 방지 및 사용자 프라이버시 보호를 위한 강화된 안전 메커니즘이 적용되었다. 사용자는 더욱 개인화된 경험을 즐길 수 있다.

지난해 말 알트먼 CEO가 "AGI 개발을 앞당길 중요한 발견"이라며 자랑한 새로운 모델 'Q스타(Q*)'가 반영될 것으로 보인다. 이는 완벽한 답을 내놓는 수학적 추론이 가능한 모델로, 기존 언어모델의 한계를 뛰어넘을 기술이라는 설명이다. 오픈AI는 지난해 '아라키스'라고 알려진 AGI 프로젝트를 진행했으나, 성능 미달로 폐기했다. 그리고 1년이 지났다. 알트먼 CEO도 GPT-5에 대해 "언제 나올지는 말할 수 없지만, 놀라운 것이 될 것은 장담한다"라고 말한다. GPT-5의 등장은 판도를 바꿀 전망이다.

keyword