brunch

You can make anything
by writing

C.S.Lewis

by insight coco May 14. 2024

챗GPT-4o, 완전 럭키비키잖아

인공지능비서의 끝판왕 Open AI 챗지피티-4o

Q. 2024년 5월 13일 출시한 오픈AI의 '챗GPT-4o' 무엇이 그렇게 특별한가요?

- ChatGPT 기존 버전과 비교해 훨씬 더 일반 사람과의 대화를 모방하는 사용자 경험(UX) 제공
- 텍스트, 오디오, 이미지 등 멀티모달(Multimodal) 입력을 실시간으로 받아들이고 출력 생성
- 사용자의 감정을 실시간으로 감지 및 표현
- ChatGPT-4o의 평균 응답 시간은 232밀리초로, 인간의 평균 답변 속도인 320밀리초와 매우 유사
- 텍스트 및 이미지 기능 일반 사용자에게 무료 제공 예정
*(참조) ChatGPT-4o의 'o'는 모든 것을 아우른다는 의미인 Omni를 의미


OpenAI가 5월 13일(현지시간)에 발표한 챗GPT의 신규 버전이 업데이트되었는데, 현재 이에 대한 반응이 전 세계적으로 상당히 뜨겁습니다. 기존에도 생성형 AI 기술을 활용하여 글, 이미지 창작이나 SORA 플랫폼을 이용한 비디오 생성에 사용되어 왔지만, 신규 버전은 보다 실시간으로 일반 사람과의 대화를 모방하는 듯한 환경을 반영하여 더욱 주목받고 있습니다. 특히, 이번 버전은 마블의 인기 캐릭터인 아이언맨이 인공지능 비서인 자비스와 대화하는 모습과 아주 유사한 환경까지 제공한다는 점에서 주목받고 있습니다. 이번 업데이트 세션에서 소개된 다양한 챗GPT-4o를 활용 방안에 대해 함께 알아보겠습니다.


#1 실시간 화상 대화: 사용자가 자신의 상황을 카메라로 비춘 상황에서, ChatGPT와 실시간 대화

두 명의 직원이 실시간으로 자신들을 비춘 상황에서 ChatGPT에게 현재 상황을 물었을 때, ChatGPT는 케이크와 촛불을 인식하여 현재 생일 축하를 하고 있는 중이라고 추측합니다. 그리고 사용자가 생일 축하 노래를 요청했을 때, ChatGPT는 감정과 음성을 반영해 생일자의 이름과 함께 노래를 불러주었습니다. 특히, 이때는 사용자의 말투를 고려하여 장난스럽게 표현하여 노래를 불러 주었습니다.

시각 정보 수용 및 추론: 케이크와 촛불을 인식해 생일 축하 중임을 추측

노래 부르기: 생일 축하송을 불러줌

기억: 생일 축하 대상의 이름 '조던'을 기억해 노래에 삽입

감정 표현: 생일 축하 노래를 장난스럽게 부름

Happy Birthday_출처: Open AI

#2 실시간으로 끼어들고 다른 요청사항하기

사용자가 실시간 화상 대화 중에 있을 때, 챗GPT의 응답이 돌아오는 동안에도 사용자는 다른 요청사항을 즉시 전달할 수 있습니다. 이러한 요청사항은 실시간으로 고려되어 응답이 반환됩니다. 시연에서는 1-10까지 숫자를 세어달라고 최초 요청 한 뒤 중간중간 사용자가 다른 요청사항을 전달하면, 챗GPT는 이를 즉각 반영하여 답변합니다. 이처럼 사용자는 챗GPT 답변 중간중간 끼어들어 다른 주제에 대한 대화를 이어나가거나 추가 정보를 요청할 수 있어 보다 유연하고 자유로운 대화를 경험할 수 있습니다.

Talking faster_ 출처: Open AI


#3 종이에 수학 방정식을 쓴 뒤 카메라로 보여주며 풀어달라고 요청하기

종이에 수학 방정식 3X+1 = 4를 쓴 뒤 카메라로 보여주며 “정답을 말하지 말고 풀이 과정을 도와줘”라고 요구하자 마치 선생님처럼 풀이 방식을 자세히 설명해 가며 유도합니다. 이 이외에도 도형 문제를 보여주고도, 챗GPT는 이를 자세하게 풀이하며 과정을 알려줍니다.

이런 사용 사례가 교육 분야에서의 잠재력이 상당할 것으로 예상됩니다. 챗GPT가 수학 방정식을 인식하고 풀이 과정을 설명하는 데 도움을 줄 수 있다면, 학생은 개별적으로 학습을 지원받을 수 있을 뿐만 아니라 자신의 학습 수준에 맞는 맞춤형 지식을 얻을 수 있을 것입니다. 또한, 학생들은 선생님의 개별적인 지도를 받는 것과 유사한 경험을 얻을 수 있어 학습의 효율성을 높일 수 있을 것입니다. 이러한 기능은 교육 방식을 혁신하고 학생들이 수학과 같은 어려운 과목을 보다 쉽게 이해하고 습득할 수 있도록 도울 것입니다.

Math with Sal and Imran Khan_ 출처: Open AI

이 외에도 금번 시연에서는 로봇과 관련된 동화를 들려달라고 요청한 뒤, 조금 더 드라마틱하게 들려줘라고 요청하자 챗GPT는 바로 어조를 바꾸어 얘기하기도 합니다. 또한, 실시간으로 사용자가 자신의 기분을 묻자, 챗GPT는 사람의 감정과 얼굴 표정도 인식했습니다.


마무리

챗GPT를 포함한 이러한 인공지능 서비스들의 급격한 발전으로 인해 사람들의 반응은 주로 두려움과 호응으로 나뉩니다. 두려움의 한 가지 예로는 사용자와의 상호작용이 지나치게 자연스러워져서 인간 대화보다는 더 현실적인 가상 상대와의 대화로 이어질 수 있다는 점입니다. 이로 인해 사람들은 현실에서의 사회적 교류가 줄어들고, 더욱 개인화된 세계에서 살게 될 우려가 있습니다.


반면, AI를 반기는 사람들은 이러한 기술을 활용한 서비스 개선과 삶의 편의성 향상에 대한 기대를 갖고 있습니다. 예를 들어, 챗GPT는 사용자가 대화하는 동안 추가적인 질문을 받아들이고 그에 맞는 대답을 제공할 수 있어 사용자의 이해를 돕고 필요에 따라 자세한 정보를 제공할 수 있습니다. 또한, 챗GPT가 사용자의 대화에 끼어들어 추가적인 질문이나 정보를 요청함으로써 사용자 경험을 보다 더 향상시킬 수 있습니다.


인공지능 기술은 현재 거대한 트렌드로 자리 잡고 있으며, 이제는 이를 되돌이킬 수 없는 시점에 도달했습니다. 이러한 상황에서 우리는 현재의 환경에 감사하며, 이러한 기술을 활용하여 더 나은 세상을 만들기 위해 노력해야 합니다. 일명 '장원영식 사고법'을 활용하여 이러한 기술이 우리 코앞에 다가왔음을 인식하고, 이를 적극적으로 활용하여 우리의 삶과 사회를 발전시키는데 기여할 수 있는 방법을 모색해 보는 것이 중요해 보입니다.


By insight.coco

    See the Unseen


[insight.coco 작가의 인기글이에요! ▼]   


<참조>

https://openai.com/index/hello-gpt-4o/ (업데이트 소개 및 시연 영상)



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari