brunch

You can make anything
by writing

C.S.Lewis

by 헤르메스JK Oct 12. 2024

GPT-4o로 수렴되는 생성형 AI 사용 이유

혁신을 지속하고 있는 OpenAI의 ChatGPT

ChtGPT 사용 심화

생성형 AI를 처음 배우기 시작할 때는 ChatGPT 이외에도 기능별 전문 Tool들을 다양하게 활용했었는데, 멀티모달 기능이 되고 유료 기능을 활용하기 시작하면서 당연한 일일 수 있지만, 이제는 웬만한 기능은 ChatGPT Plus(GPT-4o)를 우선으로 활용하고 있다. 


사용 목적에 따라 최적의 Tool을 찾아 활용하려는 노력이 줄어들고, 귀차니즘이 늘어난 것도 아닌데, 다른 Tool을 찾아 비교하거나 보완하게 되는 경우가 대폭 줄어들고 있다. 이런 편중된 사용 과정에서도 OpenAI는 끊임없이 새로운 기능을 내놓고 있다. 구글의 검색기능을 위협할 정도가 되었으면 웬만하면 느슨해 질만도 하지만, 무서운 속도로 혁신은 지속되고 있다.


사용 용도와 활용도를 정리해 보면

우리가 PC나 휴대폰 등 신제품을 선택할 때 노력 투입대비 효과를 포함한 가성비는 얼마나 좋고, 다양한 기능 중 어느 정도까지 사용할 것인가 하는 궁금증을 가지듯이, ChatGPT도 어느 정도의 기능과 성능을 가지고 있을까 하는 궁금증이 있어, 사용 용도와 경쟁 Tool을 당사자(GPT-4o)에게 조사해서 정리해 달라고 했다. 타 Tool 대비 상당히 구체적인 답이 돌아왔다. 

다소 일반적인 내용을 정리해 준 것이기는 하지만, 그만큼 정리하는 시간을 단축할 수 있었다.

게다가 동일한 질문에 2023년에 받아 들었던 답과는 상당한 질적인 차이도 확인할 수 있었다. 

내가 ChatGPT Plus로 수렴하고, 업계에서 1등이라 평가되는 이유일 것이라는 생각이 들었다. 

.



나는 다양한 기능과 용도 대비 얼마나 사용하고 있을까?

예를 든 기능 이외에도 더 다양하고 많은 기능을 활용할 수 있는데, 

내가 사용하고 있는 주요 기능은 지식탐구, 콘텐츠 요약과 이미지 생성이고, 

가끔 글쓰기와 시나리오의 초안 정도이다. 

이렇게 정리하다 보니 유료 사용에 걸맞게 더 많은 기능을 사용해야 하겠다는 

의무감마저 들게 된다. 


사무업무보다 창의적 콘텐츠 제작 Tool 활용 비중이 확대

콘텐츠 제작을 위해서는 자료 조사와 검증, 시나리오 구성, 이미지 제작 등이 주 용도가 된다. 따라서 초기 시장조사나 사업기획 등에 활용하던 패턴에서 많은 변화가 있다. 글쓰기나 강의자료에 사용하는 메인 이미지나 참고용 이미지는 GPT-4에서 활성화되는 DALL-E로 생성해서 사용하고 있다. 이전 같으면 이미지 성격에 따라 잘 만들어주는 Tool을 비용부담 없이 사용할 수 있는 선에서 손 품을 많이 팔았었다.


이미지 편집은 주로 Canva를 메인으로 사용하고, ClipDrop과 CutOut을 보조 Tool로 활용하고 있다. 외국어 번역을 위한 DeepL과 구글 Translate정도를 자주 사용하는 편이다. 

그 이외에 Gen2나 Pika 등 동영상 생성 Tool은 동영상 촬영과 편집으로 대체되었다.


2023년 8월 작성한 초기 단계 ‘AI Tool 활용 소개’에서는 

ChatGPT와 Google Bard, 뤼튼(wrtn)과 AskUp 정도였던 것이, 

2024년 4월 작성한 ‘생성 AI의 매력’에서는  

드디어 ChatGPT Plus로 전환하고, Gemini, BingChat, DALL-E 3, ClipDrop, Cutout

hama, Deepimage, BlueWillow, Lenardo, Playground, Imagen Canva, MiriCanvas, DeepL, 구글 Translate, Polaris office, PDFgear, Photopea, ONline converter, 뤼튼(Wrtn), CLOVA X, Cue, CLOVA Note, Upstage, Lilys, SummerEyes, traw(Goodnotes에 합병) 등 상당히 다양한 Tool 들을 활용하고 있다고 소개했었다. 

당시에 비하면 많이 축소되었지만, 사용이 많이 정형화되었다는 표현이 적합할 것이다.




AI모델은 정말 1등만 살아남을까?

10월 2일 자 IT조선에 ‘AI모델 1등만 살아남는다’ [AI 패권 경쟁] 2편이 게재되었다. 

나부터 실제 사용에 있어 실감하고 있는 부분이어서 공감이 가는 기사였다.

GPT-4o는 ‘생각의 사슬(CoT-Chain of Though)’라는 기술이 적용돼 논리추론이 강화되어 기존의 LLM 대비 한 차원 다른 대화가 가능할 만큼 영리해졌다는 것이다.

앤트로픽, 메타, 구글, 마이크로소프트 등의 AI 모델 경쟁이 가속화되는 AI 패권경쟁에서 과연 누가 살아남고, 승리할까?


생성형 AI Landscape을 보면 대형 Tool 수십 개, 중소형 Tool 수백 개 모델이 있지만, 

멀티테스크(멀티모달)가 실현되고 있는 환경 속에서 주요 기능의 경쟁구도는


2024년에도 혁신을 거듭하고 있는 ChatGPT

 2023년까지 : GPT-1~4, ChatGPT, GPT-4 Turbo, DALL-E 1~3 출시, Sora 발표 

 2024.02.13일 ChatGPT가 ‘기억력’이 생겼다 (과거 대화를 기억해 답변하는 기능) 

 2024.05.13일 GPT-4o가 인간과 훨씬 더 자연스럽게 상호작용을 향한 한걸음

   오디오, 비전, 텍스트를 실시간으로 추론할 수 있는 새로운 플래그십 모델인

   GPT-4o(Omni)를 발표하면서 여러 변형 모델들을 각기 다른 사용 사례에 맞춰

  성능, 효율성, 기능을 조정하여 다양한 사용자 요구에 대응하기 위해

   GPT-4o, GPT-4o with Canvas, o1-preview, o1-mini, GPT-4o mini로 세분화 

   ▪ GPT-4o: 효율성 및 비용 절감이 목적으로 기업용에 최적화, 응답 속도가 빠르다

   ▪ GPT-4o with Canvas: 창의적 비주얼 작업 지원, 인터랙티브 한 시각적 콘텐츠 생성 

   ▪ o1-preview: 연구와 새로운 기능 테스트를 위한 실험적 모델

   ▪ o1-mini: 저자원 작업을 위한 경량 버전으로, 가벼운 AI 작업에 적합

   ▪ GPT-4o mini: 임베디드 시스템 및 저전력 장치를 위한 매우 경량화된 AI 모델


 2024.09.12일 GPT-4o용 API 대거 발표

* 단일 전송 제어 프로토콜 (TCP) 연결을 통해 동시 양방향 통신 채널을 제공하는 컴퓨터 통신 프로토콜




OpenAI 목표는 최첨단 AI를 널리 이용되는 자원화

샘 알트만 OpenAI CEO는 9월 24일 블로그에서 “산업화 시대를 넘어, 지능화 시대가 오고 있다”면서, 과학적 발견과 기술 발전을 통해 사람들의 능력이 향상됐다. 

AI는 인류가 해결하기 어려운 문제들을 해결하는 도구가 될 것이며, 

우리가 직접 해결하지 못한 부분을 보완해 줄 것”이다.

인류가 AI 기술을 통해 과거와는 비교할 수 없는 번영을 이룰 것이라고 확신하며, 

“미래는 그 어느 누구도 지금 이 글로 충분히 설명할 수 없을 정도로 밝을 것”이라고 강조(매일경제)


10월 2일 회사 블로그 게시물에서는 “모든 인류에게 AI로 혜택을 준다는 미션을 향해 나아가고 있다”면서, “매주 전 세계 2억 5000만 명 이상의 사람들이 업무, 창의성, 학습 능력 향상을 위해 챗GPT를 사용하고 있다” 

이어서 66억 달러(약 8조 7000억 원) 규모의 투자금 조달에 성공했다고 발표, 

“자금 조달을 통해 첨단 AI 연구 분야의 리더십을 강화하고, 컴퓨팅 능력(capacity)을 확대하며 어려운 문제를 해결하는 데 도움이 되는 도구를 지속적으로 구축할 수 있을 것”이라면서, 

“최첨단 AI를 널리 이용되는 자원(resource)으로 만드는 게 오픈AI의 목표”라고 덧붙였다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari