GPT -4o 발표를 보고
저는 SF를 참 좋아합니다. 소설, 영화 모두 좋아하는데 스타워즈나 듄 같은 거대한 스케일의 영화도 있지만 2013년에 나왔던 Her(그녀)는 잔잔하지만 독창적인 영화였습니다. 제가 좋아하는 호아킨 피닉스가 주연이고 역시 제가 좋아하는 스칼렛 요한슨이 목소리 출연했습니다.
보신 분들은 아시겠지만 스마트폰(?)에 탑재된 대화로 작동되는 AI OS에 사랑에 빠진 한 남자의 이야기입니다. 영화를 보다 보면 남자가 변태가 아니라 정말로 인간과 AI가 서로 교감하며 감정을 나누는 모습에 감정이입하는 저를 경험했습니다.
저는 아이폰 유저라 시리를 아주 가~~끔 사용합니다. 손을 쓰기 불편한 상황에서 전화 걸기 정도로나 씁니다. 묻는 말에 원하는 답변도 잘 못하고 처음보다 나아졌다고 해도 여전히 특유의 감정 없는 기계음 느낌의 목소리도 맘에 안 들어서죠. 언제쯤이나 영화 Her와 같은 수준이 가능할까 생각했습니다.
갈수록 결혼도 잘 안 하고 재택근무도 늘어가는 시대에 AI가 발달하면 언젠가 특이점(Singularity)이 오겠지 하면서도 막연히 먼 이야기겠거니 했습니다. 하지만 이제 특이점이 이미 온 건가 싶네요.
오늘(한국시간 2024년 5월 14일. 미국 시간 5월 13일) Open AI에서 GPT-4o (GPT-4 omni)를 발표했습니다.
뉴스에서 먼저 보고 Open AI 공식 유튜브 영상을 봤습니다. 충격적이면서도 신선했습니다.
아래 영상을 보시면 핵심 데모를 다 모아놨습니다.
최근 딥 페이크 등 AI가 발전했다고 해도 사람과 AI가 실시간 대화를 할 수준은 아니었는데 이제 그게 가능해졌습니다.
지금까지 AI와 달리 사람과 대화를 하는데 거의 딜레이가 없습니다. 그리고 무엇보다 목소리에 감정이 담겨 있어서 정말 사람 같습니다. 자연스러운 억양은 물론 큭큭 웃음을 섞어서 이야기하고, Well well well... 또는 음... 하면서 시간을 끈다거나, 살짝 유머를 섞기도 합니다. 요구하면 목소리도 남성과 여성을 오가고 로봇 목소리도 냅니다.
지금까지 음성 AI와는 달리 사람이 중간에 말을 끊고 끼어들면 멈추고 들은 뒤 다시 대답을 합니다.
이태리어, 스페인어, 중국어로 중간에 실시간 번역을 해줍니다. 50개국 언어를 지원한다는 한국어도 가능할까요?
그리고 카메라로 사람을 비추며 설명을 해달라고 하면 가죽옷을 입고 있고 뒤에 식물이 있고 어쩌고 저쩌고 설명을 합니다. 그 설명을 가사로 바꿔서 즉석에서 노래를 작곡해 부르기도 합니다.
간단한 방정식을 쓰고 카메라로 비추고 푸는 방법 힌트를 알려달라면 단계적으로 푸는 방법을 알려줍니다. 아이패드에서 스플릿 화면을 띄우고 애플펜슬로 직각삼각형 문제를 필기하면서 물어보면 푸는 방법을 알려줍니다. 노트북 화면에 프로그램 코드를 띄워놓고 문제점을 질문하면 해결방법을 알려줍니다.
맹인이 런던 버킹검궁 근처에서 스마트폰으로 거리로 비치며 택시를 기다리는데 이제 택시가 가까이 왔으니 손을 들어라고 알려줍니다.
제가 제일 놀란 건 두대의 스마트폰에서 GPT-4o를 켜놓고 서로 대화를 시키면 중간에 사람이 끼어들지 않는데도 대화가 물 흐르듯 자연스럽게 이어집니다.
이 정도면 'Her' is here라는 썸네일이 틀린 말이 아니죠?
https://youtu.be/mvFTeAVMmAg?si=Jn7ekM6QBsLkJwmC
그런데 올 가을 출시할 아이폰에 Open AI의 Chat GPT 가 탑재된다는 기사가 나왔습니다.
Open AI가 발표한 시점이 구글 IO 행사 하루 전이라고 합니다. 테크나 경제 유튜버 중에는 구글이 어떤 것을 발표할지 모르겠지만 만약 아이폰에 구글 제미나이(Gemini)가 아닌 Chat GPT가 탑재된다면 구글이 한방 먹게 되는 것이라 말하기도 합니다. 그동안 중동의 시리아 이야기를 하건 KT 기가지니를 '지니야'라고 부르기만 해도 튀어나오던 '시리'가 아닌 스칼렛 요한슨 목소리의 Her가 실현될지도 모르겠습니다.
이미 하드웨어적으로 On Device AI 칩이 탑재될 거란 소문이 무성했지요. 신형 아이패드 프로에 M4를 탑재하고 오래전부터 Neural Engine을 칩에 탑재해서 기기 자체로 학습을 할 수 있던 애플이 과연 GPT를 탑재할까요?
다음 달 WWDC에서 발표할 새 iOS18, iPadOS18이 몹시 기다려집니다.
https://n.news.naver.com/mnews/article/293/0000054494
4월 초에 미국 개기일식 관측 여행 때 뉴욕 애플스토어에서 애플 비전프로(Vision Pro)를 체험해 봤습니다. 자세한 후기는 여행기에 적겠습니다.
지금까지 나와있는 VR 기기와는 차원이 다른 현실감과 너무 쉬운 조작법이 놀라웠습니다. 하지만 이걸로 당장 뭘 할지는 잘 모르겠더군요. VR 기기가 아닌 공간 컴퓨팅(Spatial Computing)이라고 정의했는데 영화를 본다면 정말 실감은 나겠지만 이걸로 지금 맥북에서 글 쓰듯이 글을 쓸 것 같지는 않았거든요.
하지만 아이폰도 2007년에 처음 나왔을 때 반응도 비슷했지만 2009년 3GS가 나오고 앱스토어가 열리면서 본격적인 스마트폰의 시대가 열렸듯이 비전프로도 앞으로 어떻게 될지 모르겠습니다.
만약에 아이폰에 이어 GPT-4o가 탑재돼서 말이나 동작, 기본 탑재된 3D 카메라를 통해 업무나 창작이 가능해진다면 앞으로 비전프로는 또 하나의 도약이 될지도 모르겠다는 생각이 들었습니다.
이제라도 애플 주식을 사야 할까요?
https://magazine.hankyung.com/business/article/202405148245b