브런치 스토리

매거진 슬기로운 디지털 전환 X DT

라이킷 30 댓글 9

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

모두가 하고 싶어 하는 GPT 4.0

#7 모두가 하고 싶어 하는 디지털 트랜스포메이션

by Don Lee Apr 17. 2023

초기 디지털 전환에 대한 다른 주제를 이야기하려다 장안에 화제가 되고 있는 생성형 AI인 GPT4.0에 대해 이야기하고자 합니다. 얼마 전 Microsoft에서도 전 세계가 열광하는 신기술인 GPT를 기업에 빠르게 적용하기 위한 방법에 대해 Co-Pilot 서비스를 소개했었습니다.

다른 한편에서는 이러한 AI(GPT) 기술의 등장으로 "나의 직업이 없어지지는 않을까?" 하는 불안함을 가지는 이들도 많이 있습니다. 이번 글에서는 GPT를 어떻게 활용하는 것이 이러한 불안한 요소를 없애고 나의 삶에 도움이 되게 할지에 대해 고민해 보고자 합니다.

몇 년 전 SF 영화인 아이언맨(Iron Man I/II/III)의 AI 비서인 자비스(Jarvis)는 아이언맨의 전략 분석 및 정보 제공 그리고 항상 함께하는 친구 역할을 담당할 정도로 영화에서 큰 비중을 차지하고 있었습니다. ChatGPT(GPT3.5)는 AI 비서인 자비스가 현실에 나왔다는 찬사와 함께 대중의 엄청난 관심을 받으며 오픈 2개월 만에 월평균 사용자 1억 명을 달성하는 쾌거를 이루었습니다. 사용자 1억 명은 페이스북이 4.5년 걸렸고 틱톡이 9개월 걸린 것에 비하면 GPT는 엄청나게 빠르게 대중의 중심으로 들어왔습니다.

<출처. Create by Microsoft Bing with DALL-E Service : create Ironman's Jarvis images>

또한, GPT4.0은 1999년부터 글로벌 최고의 검색 서비스를 제공하던 구글 검색을 위협하는 존재로 단번에 올라왔습니다. 구글이 얼마나 놀랐으면 사내 "코드 레드"를 발령할 정도였고 오픈 준비가 되지 않은 "Bard"를 급히 출시하다 여론의 몰매를 맞기도 했습니다.

ChatGPT란?

먼저 ChatGPT에 대해 알아보면 다음과 같습니다.

   GPT(Generative Pre-trained Transformer) 모델은 OpenAI에서 개발된 자연어 처리(NLP) 인공지능입니다. 이 모델은 다양한 버전이 개발되어 왔으며, 아래에 변천사를 간단하게 정리해 봤습니다.
- Google Transformer(2017): 구글의 자연어 처리 모델 "트랜스포머" 공개
- GPT-1 (2018): 최초의 GPT 모델로, 이 모델은 딥러닝 기술과 Transformer 구조를 기반으로 합니다. GPT는 1억 1,700만 개의 파라미터를 기반으로 한 빅 데이터셋에서 사전 훈련을 받은 후, 다양한 NLP 작업에 맞게 미세 조정할 수 있는 특징을 가지고 있습니다. (학습 데이터 크기 : 4.5 GB)
- GPT-2 (2019): GPT-2는 원래 모델의 확장 버전으로, 15억 개의 파라미터를 가지고 있습니다. 이전 모델에 비해 텍스트 생성 품질이 향상되었으며, 더욱 다양한 언어적 지식을 다룰 수 있습니다. 당시 GPT-2의 성능은 높은 성능과 함께 잠재적인 부정적 영향으로 인해, 초기에는 완전한 버전의 공개가 제한되었습니다. (학습 데이터 크기 : 40 GB)
- GPT-3 (2020): GPT-3는 놀랍게도 1750억 개의 파라미터를 가지며, 그 성능은 크게 향상되었습니다. 이 모델은 더욱 다양한 작업에 대해 높은 성능을 보였고, 제로샷 학습, 원샷 학습, 그리고 퓨샷 학습 능력을 갖추었습니다. GPT-3는 인간과 구별하기 어려운 수준의 자연어 생성능력을 보여주며, NLP의 가능성을 확장시켰습니다. (학습 데이터 크기 : 570 GB)
- GPT-3.5 (2022): GPT-3 모델에 인가 교육자의 평가를 반영한 Reward Model 기반 강화학습 방식을 도입한 업그레이드된 버전입니다. Chat-GPT의 생성형 AI 기능으로 대중에게 알려진 모델입니다.
- GPT-4 (2023): 아직 공식적인 발표는 없지만, GPT-3.5의 후속작인 GPT-4가 개발되었습니다. GPT-4는 기존 GPT-3 대비 인식 및 추론 능력이 향상되어 창의성 및 문제 해결 능력이 증가한 것으로 평가되며 시각, 청각 등 텍스트 외의 다양한 방식으로 정보를 습득할 수 모델로 더 많은 파라미터와 더 큰 학습 데이터셋을 사용하여 세부적인 언어 모델링과 다양한 작업에 뛰어난 성능을 보이고 있습니다. GPT-4 기반 ChatGPT Plus 유료 서비스를 같이 출시하였습니다. (파라미터 수 및 학습 데이터 크기 미공개)

   이렇게 변천사를 거쳐 GPT 모델은 계속 발전하며, 인공지능 분야에서 많은 연구와 개발이 진행되고 있습니다. 질문-답변, 텍스트 분류, 감성 분석 등 다양한 자연어 처리(NLP) 작업에 사용되고 있습니다. GPT 모델들은 다양한 언어와 도메인에서의 활용 가능성을 증명하며, 인공지능 기반 서비스와 애플리케이션 개발에 큰 영향을 미치고 있습니다.
   그러나 GPT 모델의 발전에도 불구하고, 여전히 해결해야 할 문제들이 존재합니다. 예를 들어, 모델이 생성하는 텍스트가 항상 진실한 정보를 담고 있지는 않으며, 때때로 미흡한 지식이나 편견을 담을 수 있습니다. 또한, 모델의 이해력은 여전히 제한적이며, 추론 능력이나 상황 인식에 부족함이 있을 수 있습니다.
   또한, GPT 모델의 크기와 복잡도 증가로 인한 컴퓨팅 자원의 사용량이 증가하여, 환경적 영향과 비용 측면에서도 문제가 발생하고 있습니다. 이에 따라 모델의 효율성과 가용성을 높이는 연구가 진행되고 있으며, 지속적인 발전을 위한 노력이 이루어지고 있습니다.
   결론적으로, GPT 모델의 변천사를 통해 인공지능과 자연어 처리 기술의 발전이 얼마나 빠르게 진행되고 있는지 확인할 수 있습니다. 앞으로도 연구자들은 모델의 성능 향상, 효율성 개선, 그리고 새로운 응용 분야 발굴에 지속적으로 노력하며, 인공지능 기술의 미래를 이끌 것으로 기대됩니다.

<출처. OpenAI GPT 4.0 서비스 기반의 생성 콘텐츠 재구성>

<출처. OpenAI GPT-4 Service>

OpenAI ChatGPT

OpenAI는 Microsoft와 손잡으며 날개를 달게 되었습니다. 일반적인 스타트업 기업이 서비스를 현실화시키는 데는 많은 비용과 함께 인프라 투자 등이 수반되어야 합니다. 이때 마이크로소프트는 비용 투자와 함께 통 크게 자사 클라우드 인프라의 방대한 스토리지와 서버를 OpenAI에서 활용할 수 있도록 제공하며 OpenAI의 기술이 빅테크 기업과 만나서 재탄생할 수 있게 되었습니다. 또한, 마이크로소프트의 캐시카우(Cash Cow) 역할을 하는 Office365/Microsoft365 서비스에 GPT 기술을 결합하고 구글에 밀려 지지부진하던 Bing 검색을 GPT4.0과 DALL-E 서비스와 연계하여 새로운 판로를 만들게 되었습니다.

그리고, OpenAI는 ChatGPT와 같은 대화형 인공지능 텍스트 서비스와 함께 이미지 생성 서비스인 DALL-E 2를 제공함으로 써 AI 서비스 기반의 동화 작가 등이 현실로 다가왔습니다. 아직 Microsoft Bing 서비스의 이미지 생성 서비스는 영문으로 명령을 했을 때 창작 이미지 생성 서비스를 제공합니다.

OpenAI DALL-E 2.0는 OpenAI에서 개발한 인공지능(AI) 모델입니다. 이 모델은 이미지 생성에 사용됩니다.

이 모델은 입력된 텍스트 설명을 기반으로 새로운 이미지를 생성합니다. 예를 들어, "노란색 배경에 빨간색 사각형이 있는 파란색 고양이"라는 설명을 제공하면, DALL-E 2.0은 해당 설명에 부합하는 이미지를 생성합니다.

DALL-E 2.0은 이전 모델인 DALL-E의 업그레이드된 버전입니다. 이전 모델은 특정 단어를 입력하면 해당 단어와 관련된 이미지를 생성하는 기능만 있었지만, DALL-E 2.0은 더 많은 복잡한 이미지를 생성할 수 있습니다.

이 모델은 영감을 얻기 위해 인터넷에서 수집한 수천 개의 이미지를 학습하고, 학습된 이미지와 설명을 결합하여 새로운 이미지를 생성합니다. 이 모델은 자연어 처리(NLP)와 컴퓨터 비전(Computer Vision) 기술을 결합하여 이미지 생성을 수행합니다.

DALL-E 2.0은 디자인, 광고, 영화 및 게임 개발 등 다양한 분야에서 사용될 수 있습니다. 이 모델은 창의적인 디자인 작업에 도움이 되며, 실제 존재하지 않는 제품이나 이미지를 미리 시각적으로 보여줌으로써 비용과 시간을 절약할 수 있습니다.

<출처. OpenAI GPT 4.0 서비스 기반의 생성 콘텐츠 재구성>

이미지 생성 명령어 :
create a cartoon-style version of the cover image for the future fashion magazine.

<출처. Microsoft Bing with DALL-E 서비스를 이용한 이미지 생성>

마지막으로 마이크로소프트에서 인수한 Github에 GPT의 코딩 가이드와 버그 픽스 등의 서비스를 융합하여 Github Co-Pilot 서비스를 출시했습니다.

<출처. Github Enterprise Service 설명 자료>

GPT의 문제점

하지만 이러한 신기술의 이면에는 조심해야 될 부분이 많습니다. 그중 하나는 AI의 환각(Hallucination) 현상입니다. 할루시네이션(환각)은 인공지능 모델, 특히 대화형 AI 모델이 사용자의 입력에 대해 부정확하거나 관련 없는 답변을 생성하는 현상을 의미합니다.

GPT-4와 같은 대화형 AI 모델은 텍스트 패턴을 학습하여 사용자의 질문에 대해 응답을 생성합니다. 이러한 모델은 대규모 텍스트 데이터에 대한 학습 과정에서 때로는 오류를 포함한 정보를 학습하기도 합니다.

이로 인해, 결과적으로 할루시네이션과 같은 현상이 발생할 수 있습니다.

하지만 이러한 할루시네이션 현상을 극복하며 기업 비즈니스에 활용해야 될 만큼 혁신적인 기술이 GPT 4.0인 생성형 AI 기술입니다. 검색엔진 시장의 1위인 구글에서는 검색을 사람이 선택하고 판단하게 하지만 이번에 새로 나온 OpenAI GPT4.0의 경우에는 원하는 정보를 바로 사용할 수 있는 결과를 제공하고 바로 활용할 수 있도록 도와주고 있습니다.

GPT 3.5 Vs GPT 4.0

GPT4.0은 GPT3.5의 환각 현상과 진짜 같은 거짓말과 같은 부정확한 답변에 대해 많이 최적화한 모델입니다. 데이터 처리 능력 측면에서 GPT3.5가 영어 단어를 3,000개 처리한다면 GPT4.0의 경우 데이터 처리 및 전문지식을 강화하여 영어단어를 25,000개를 처리하여 오답률을 최소화하고 있습니다.

또한 미국 변호사 시험에서 GPT-3.5가 213점을 획득하여 하위 10%의 성적인데 반해 GPT4.0은 298점으로 상위 10%을 점수를 받은 것도 큰 차이점 중에 하나입니다. SAT의 읽기/쓰기를 보면 GPT3.5는 670점인 반면 GPT4.0은 710점을 받을 정도로 능력이 향상되었습니다.

한때 GPT3.5에서 "대한민국을 건국한 사람은?" 이라는 질문에 답이 "김일성"이라는 답변이 있었을 때도 많은 논란이 있었습니다. 지금은 오류가 Fix 되어 이승만이라는 답변이 나옵니다.

GPT4.0에서 한글에 대한 기능이 많이 향상되었다고 하지만 아직 한글에 대한 답변에 대한 오류는 아래와 같이 여전합니다. 만약 필자가 "신사임당의 남편은?" 이라는 질문을 했을 때 필자가 지식이 없는 상태에서 첫 번째 답변을 본다면 너무도 진실된 답변으로 인지 됩니다. 하지만 필자의 경우 신사임당의 남편이 이원수 임을 알고 연속된 질문을 다시 던졌습니다.

<출처. OpenAI GPT4.0 Plus 서비스>

GPT3.5와 달라진 부분 중 하나는 연속된 질문에 대해 기억하고 연결하여 답변하는 부분은 실제 원하는 답변을 찾는데 많은 도움을 주고 있습니다. 또한, 아직 미비한 부분 중 하나는 실시간 정보를 검색하지는 못합니다. 아직 GPT 기술은 2021년 9월까지의 정보를 기반으로 결과를 도출하기 때문에 가장 최근 이슈와 트렌드는 답변할 수 없습니다.

<출처. OpenAI GPT 4.0 Plus 최신 주가 동향 질의 결과>

Prompt Engineering 기술

   GPT4.0을 보다 잘 활용하고 할루시네이션(환각 현상)을 최소화하기 위한 방법 중 하나로, prompt engineering이 사용됩니다. Prompt engineering은 사용자로부터 입력되는 프롬프트(prompt)를 더욱 명확하게 구성하거나 의도를 명확히 전달하는 방식으로 AI 모델을 안내하는 것을 말합니다. 프롬프트를 개선함으로써, AI 모델은 보다 정확한 정보를 생성하고 이상한 답변을 줄일 수 있습니다.

Prompt engineer의 역할은 다음과 같습니다:
- 명확한 질문: 사용자의 의도를 정확하게 이해하도록 프롬프트를 수정하거나 명확한 문장으로 재구성합니다.
- 콘텍스트 제공: 질문에 관련된 추가적인 배경 정보를 제공하여 AI 모델이 보다 정확한 답변을 생성할 수 있도록 합니다.
- 가정 설정: 프롬프트에 가정을 설정하여 AI 모델의 답변 범위를 제한하고 더 구체적인 답변을 얻도록 합니다.
- 테스트 및 반복: 프롬프트 개선 과정에서 실험하고 결과를 분석하여 최적의 프롬프트를 찾아냅니다.

   이러한 역할을 통해 prompt engineer은 AI 모델의 출력 결과를 개선하여 할루시네이션 현상을 최소화하고 사용자가 원하는 답변을 얻을 수 있도록 돕습니다. 신기술의 단점을 보완하여 ChatGPT를 통해 새로운 혁신의 시작점을 만들고 DT에서 이야기하는 비즈니스 모델의 변화를 고민해야 될 것 같습니다. 또한, ChatGPT로 만들어진 콘텐츠에 대해서는 출처 검증 및 지식 검증 작업이 꼭 수반되어야 됩니다.

Microsoft Co-Pilot 서비스 with OpenAI

Microsoft Co-Pilot 서비스는 마이크로소프트의 대표적인 솔루션(Microsoft365, Github, Security 등)에 GPT 기술이 내장되어 Co-Pilot (부조정사) 개념으로 우리의 일상 업무를 도와주는 서비스입니다. 사람이 주조종사(Pilot)가 되고 GPT와 같은 AI가 Co-Pilot(부조정사)가 되어 지원하는 형태로 우리가 사용하는 오피스(Office), 개발소스 관리(Github Enterprise), 보안관점의 해킹 대응 기술(Security) 등의 제품에 포함되어 지원할 예정입니다. Github는 상용 서비스로 출시되어 서비스를 제공하고 있습니다.

<출처. Microsoft Co-Pilot(부조정사) 서비스>

필자는 이번에 마이크로소프트가 큰 마음먹고 서비스를 준비했다는 느낌을 받았습니다. 3월에 사티아 나델라 마이크로소프트 CEO의 발표는 "The Future of Work with AI"라는 제목으로 37분짜리 짧은 Youtube 동영상이었지만 그 파급력은 엄청났습니다. 단지 AI를 활용한 미래의 콘셉트를 이야기하는 것이 아닌 실제 Microsoft Office와 Teams, Outlook 등에 내장된 AI의 실제 Demo 영상을 보여 줬습니다. 사람은 아이디어와 AI의 잘 정리된 명령을 전달하면 PPT를 만들고 Excel을 통해 데이터를 분석하고 모임을 위해 메일 초안을 작성하여 전달하는 등 실제 AI를 활용한 일하는 방식의 변화를 보여주는 영상이었습니다. 한국에서 사용하기에는 한글 문제 등 많은 이슈가 처리되면 시간이 조금 걸릴 수 있지만 실제 이러한 서비스를 활용할 수 있다는 실제 우리가 일하는 시간을 혁신적으로 줄일 수 있는 비전(Vision)을 제시하는 영상이었습니다. 실제 우리 일상에 적용되기 위해서는 안정적으로 한글이 지원되고 기업 보안 체계가 정리되어야지 실제 적용할 수 있겠지만 많은 기업에서는 먼저 사용하겠다고 손을 들고 있는 것이 현실입니다.

갑자기 드는 생각이지만 마이크로소프트 오피스 97에서 2003까지 클립모양의 마법사가 나와서 도움말 기능을 제공하던 것이 20년 지난 지금 OpenAI GPT4.0을 만나서 진정한 마법사 기능으로 다시 태어난 것 같습니다.

<출처. 마이크로소프 Office 97~2003 오피스 길잡이 / 마법사)

GPT의 등장으로 사라질 수 있는 직업군

얼마 전 월스트리트저널(WSJ, 3월28일 기사)에서는 회계사, 수학자, 통역사, 작가 등의 순으로 사라질 수 있고 가장 영향을 덜 받는 직업군은 요리사, 오토바이 정비사, 석유 및 가스노동자 순이라고 합니다. 하지만 필자의 생각은 조금 다릅니다. GPT는 활용하는 도구이고 마이크로소프트의 콘셉트와 같이 Co-Pilot(부조정사) 또는 조력자의 역할로 활용하는 것이지 나의 밥줄(직업)을 당장 흔들 수 있는 건 아닙니다.

예를 들어 GPT4.0을 통해 구직활동을 효율적으로 한다던지 프로그램을 개발할 때 찾고자 하는 명령어와 샘플 코드를 확인하여 빨리 적용한다던지 활용 방법에 따라 직장생활을 윤택하고 여유롭게 만들 수 있습니다.

아래 사례는 필자가 새로운 제약 회사로 이직하기 위한 준비 작업을 GPT4.0을 활용하여 샘플을 만들어 보았습니다. 일반적으로 필자가 회사를 이직할 때 자기소개서를 준비하면 최소 일주일이상 고민하고 다듬어서 작성할 수 있습니다. 하지만 GPT를 활용하면 자기소개서 초안을 만들고 초안을 보완해 나가는 형태로 작성한다면 직접 작성하는 것보다 빠짐없이 정리하여 작성할 수가 있습니다.

<출처. OpenAI GPT4.0 기반의 자기소개서 샘플>

또한, 한글 소개서를 만들고 다시 영문 소개서를 만든다면 또 다른 부담으로 다가옵니다. 이를 위해 앞서 언급한 것과 같이 GPT4.0의 앞 질문에 대한 추가 작업을 명령하여 번역하는 사례입니다.

GPT를 통해 영어로 번역된 내용을 다시 구글번역을 통해 한국어로 재번역을 하면 거의 내용 측면에서 훌륭하게 번역된 것을 알 수 있습니다.

<출처. 구글번역을 통한 번역 내용 검증 샘플>

이번 글은 GPT4.0에 대한 글입니다. 이번 글 중 박스 부분 콘텐츠의 대부분은 GPT4.0을 통해 작성된 부분이고 출처가 Microsoft Bing으로 된 이미지는 DALL-E 서비스를 통해 생성된 이미지입니다. 업무의 주체가 사람이 되고 GPT4.0을 활용하여 일하는 방식에 변화를 준다면 실제 업무 프로세스 시간을 줄이고 비즈니스를 최적화하는데 GPT4.0은 많은 기여를 할 수 있을 것 같습니다. 나의 일을 GPT가 빼앗아 가는 것을 고민하는 것보다는 GPT를 활용하여 어떻게 나의 업무를 개선하는 하고 나의 삶을 개선할 수 있을 지에 대해 더 고민할 필요가 있습니다.