brunch

라이킷 9 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by TEN Dec 11. 2023

이번엔 달라?! OpenAI의 GPT-5 소문 파헤치기

GPT-5가 그렇게 대단할 거라던데요?!?!

오픈AI에 대한 관심의 열기가 아주 뜨겁습니다. 바로 GPT-5 때문인데요. GPT-4가 나온 이후로 오픈AI의 주 활동들은 판로 확보, 파트너십 등 매출과 연관된 것들이 많았는데요. 그 때문에 GPT-5의 학습이 이미 진행 중이라는 사실은 공공연히 알려져 있었어도, 출시는 좀 늦어질 수도 있겠다는 예측이 있었습니다. 하지만, 저희가 모르는 새에 OpenAI는 GPT-5의 개발과 학습을 마무리하고, 새로운 LLM의 방향성을 제시하고 있습니다. :)

이번 주 AI 뉴스룸에서는 OpenAI의 새 LLM, GPT-5에 대해 알아보겠습니다. 왜 화제의 중심이 되었는지 알아보고, 오픈AI의 청사진도 슬쩍 들여다보자고요. ;)

[ GPT-5, 출시 전부터 기대가 엄청났다던데? ]

GPT-5는 출시 전부터 여러 가지 소문을 안고 있었습니다. 소문의 내용은 가지각색이었지만, 대부분 “차원이 다른 모델이 나온다”가 핵심 메시지였는데요. 매개변수가 현재 출시되고 있는 LLM 들의 수십 배일 것이라거나, AGI에 가까운 수준의 모델일 것이라는 등 장밋빛 기대가 한가득하였습니다. (!!!)

아, 여기서 AGI란 Artificial General Intelligence(인공일반지능)의 약자로, Strong AI로 분류되는 인공지능 중 하나입니다. 인간이 할 수 있는 어떠한 지적인 업무도 성공적으로 해낼 수 있는 막강한 인공지능을 의미하는데요. GPT-5가 그에 도달했을 것이라는 기대가 있었던 것이지요.

이런 기대 섞인 시선이 쏟아질 때마다 OpenAI의 CEO인 샘 알트먼은 단호하게 “그렇지 않다.”라고 말하곤 했습니다. 하지만 그런 부인의 제스쳐가 있을 때마다 사람들의 기대는 다양한 방향으로 확산하였어요. AGI가 아니라면, 그에 준하는 수준의 변화와 혁신이 있을 것이라는 거죠. :)

그러던 중 10월 초, GPT-5에 대한 새로운 소문이 퍼지기 시작했습니다. AGI 정도는 아니더라도, 그에 가까운 ‘아라키스(Arakis)’라는 모델을 개발 중이라는 거였어요. AGI는 아니지만, AGI에 가까운 모델이다? 또 한 번 GPT가 전 세계 인공지능 시장의 판도를 바꾸는 것 아닌가 싶은 이야기인데요. 이 소문은 심지어 일부 사실인 것으로 밝혀졌습니다. 개발한 것은 사실인데, 성능 부족 등 다양한 사유로 인해 현재는 개발 중단된 상태라고 해요. 프로젝트 폐기 수순이라고 하니, 당분간 아라키스(Arakis) 개발이 재개될 일은 없어 보입니다. @.@

이렇게 소문이 더해지고, 그 소문들이 점점 더 구체화하기 시작하자, 오픈AI가 직접 입을 열었습니다. 7월, 미국 특허청에 ‘GPT-5’의 상표 등록을 마쳤다는 이야기였지요. :0

[ 소문이 무성했던 GPT-5, 실제 어떤 모습일까? ]

그래서, 그 수많은 소문이 다 사실이냐고요? 아쉽게도, 구체적으로 OpenAI의 입을 통해 확인된 내용은 없습니다. 대신 거의 확실시되는 내용들도 있습니다. 예를 들면, 올여름부터 GPT-4에 적용된 멀티모달 기능입니다. 비디오 입출력까지 가능한 GPT-5는 이전 모델들보다 더 안정성을 갖출 것이라고 하는데요. 이 안정성은 정보의 측면과 비용의 측면으로 나누어 볼 수 있습니다. 정보의 안정성이란, LLM의 최대 문제점이라고 하는 ‘환각’과 관련이 있는데요. 이 ‘환각’을 거의 없애는 데에 중점을 두었다고 합니다.

LLM에서 나타나는 ‘환각’ 현상이란, 인간이 겪는 ‘환각’의 의미와 유사한 양상을 갖습니다. 보통 인간들이 겪는 ‘환각’이라는 것은 어떤 자극이나 정보를 받지 않았는데, 그게 있었고, 사실인 것처럼 감각/인지하게 되는 것을 의미하지요. GPT와 같은 LLM에도 이런 현상이 있었는데, 예를 들면, ChatGPT 기존 모델에 이런 질문을 했다고 가정하겠습니다.

“이순신 장군이 2차 세계대전에서 승리한 전투의 이름을 알려줘.”

이 경우, 우리는 알 수 있습니다. 분명히 잘못된 명제로 한 질문이지요. “이순신 장군이 2차 세계대전에 어떻게 참전해?”하고 헛웃음을 터뜨리시는 분들도 계실 겁니다. 그런데 과거의 ChatGPT는 이 질문을 받고 잠시 시간이 지나면 이런 식의 답변을 내놨습니다. “이순신 장군은 2차 세계 대전의 해상 전투에서 공을 세웠습니다…” @.@

지금은 GPT도 이순신 장군의 임진왜란 활약을 알고 있습니다 ;)

지금은 이 환각 현상이 많이 개선되어, 잘못된 질문을 정정하는 답변을 받을 수 있습니다. ‘환각’ 현상의 해결은 OpenAI의 CTO인 미라 무라타가 직접 언급한 내용입니다. GPT-5에서는 이 ‘환각’ 현상이 거의 없도록 개선한다고요. LLM으로 인한 잘못된 정보 확산을 우려하는 목소리들이 일부 있었는데, 상당 부분 개선될 것으로 보이네요.

덧붙여서 비용 문제 해결에도 힘썼다고 하는데요. MOE(전문가 믹스)라는 서버 분할 방식을 사용한다고 합니다. 이 역시 GPT-4에도 적용된 기술입니다. 정리하면, 새로 찾아올 GPT-5는 정확도와 비용 안정성을 갖춘, 강력한 멀티모달 모델, 그러니까 LLM이 아닌 LMM이 되겠습니다. 공개 시점이 정말 기다려지네요.

[ 오픈AI가 새로운 도구를 개발하고 있다고? ]

OpenAI 하면 GPT만 떠오르시나요? OpenAI는 새로운 도구도 준비하고 있습니다. 무려 ‘AI 이미지’를 가려내는 도구인데요. Chat이라는 커뮤니케이션 방식을 바탕으로 한 LLM만 강세인 줄 알았던 OpenAI에서 나올 새로운 AI 도구 소식이라, 역시나 많은 사람들이 주목하고 있습니다. 이미지 생성 AI인 '달리'가 만든 이미지를 정확하게 가려낸다고 합니다. OpenAI의 CTO인 미라 무라타는 이 도구에 대해 “99% 신뢰할 수 있다”라며 자신감을 표하기도 했습니다.

그 동안 AI로 생성한 이미지에 대해 저작권, 사용권 등 지적 재산권 측면에서 다양한 논쟁들이 불거지고 있었지요. 그에 관해서 어느 정도 해결책을 제시해 줄 수 있는 도구가 될 것으로 보입니다. AI가 만든 창작물을 AI가 걸러내는, AI 간의 싸움이 되겠어요. 아직 출시 일정에 대해 나온 이야기는 없지만, 세상에 공개된다면 AI에 대해 잘 아는 사람, 모르는 사람 할 것 없이 정말 흥미로워할 도구이지 않을까, 싶네요.

한편, 오픈AI에 관해서 다양한 소문들이 남아 있습니다. AGI 개발과 자체 AI 칩 개발, 챗GPT 전용 하드웨어 제작 등에 관련된 내용도 있고, 새로운 모델 개발을 위한 추가 투자 유치 소식도 있는데요. 자체 칩 개발의 경우, CEO인 샘 알트먼이 직접 언급하며 사실을 부인하기는 했지만, “가능성이 없진 않다”고 밝혀 귀추가 주목됩니다.

AI 모델 시장의 주류인 ‘LLM’은 어떻게 변화하게 될까요? 사실상 이 흐름을 시작하고, 선도하고 있는 오픈AI의 움직임으로 볼 때, 앞으로 출시될 구글이나 메타의 모델들도 GPT-5와 유사하거나 그보다 나은 성능을 보여야 경쟁에서 생존할 수 있을 것 같습니다. 멀티모달, 환각 방지 기능, 비용 안정성 등 고려해야 할 조건도 다양하고, 각 조건 충족의 난이도 역시 높아 보이네요.

AI 모델에 관한 기술이 고도화될 때마다 ‘비용’에 대한 언급이 당연해지고 있습니다. 민감한 이슈로 여겨질 만큼 큰 비용이 들기 때문이겠지요. 인프라의 효율적인 활용 방식을 계속 고민하게 되는 이유인 것 같습니다. 주식회사 텐이 열심히 달려야 할 이유를 GPT에서 또 발견하네요. 자! 에디터 SA는 다음에도 흥미로운 AI 이슈들을 가지고 찾아뵙겠습니다!

keyword

TEN 소속 주식회사텐 직업 개발자

AI가 모두에게 일상이 될 수 있도록 쉽고 간단한 AI툴과 환경을 만드는 주식회사 텐의 AI 이야기

구독자 15

작가의 이전글 GPU를 이렇게 쓴다고? MIG 모드와 분할 사용! 주피터 노트북이요? 어느 회사 노트북인가요? 작가의 다음글

작품 선택

키워드 선택 0 / 3 0

댓글여부

댓글 쓰기 허용 afliean

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari