brunch

You can make anything
by writing

C.S.Lewis

by mizan May 09. 2023

메타버스의 부활: IVA의 시작

지능형 가상 에이전트 (IVA)



수년간 메타버스와 메타버스 관련 분야에 대해 공부하고 일해온 저도. 여전히 메타버스의 정의에 대해 떠올리려 하면, 안개 낀 것처럼 뿌옇게 제대로 보이지가 않습니다.

메타버스라는 것이 단순히 가상의 환경인지, 현실의 활동을 가상으로 확장시킨 것인지, 사람과 사람이 모이는 가상의 장소인지, 삼차원 공간만을 가리키는 것인지...

아직까지도 불분명하고 안개 낀 것처럼 뿌옇게 보이지 않는 메타버스의 정의를 약간은 좁혀서 이야기를 시작해 보도록 하죠.


metaverse - 메타버스


서성은 - [메타버스 개발 동향과 발전 전망 연구]에서는 메타버스를 가상공간과 현실이 적극적으로 상호작용하는 공간이며 방식이라고 말하고 있습니다. 저 또한 여기에 동의하며,


앞으로 제가 쓰는 글에서는 메타버스를 가상공간과 현실을 잇는 매개체로서 바라보려 합니다.


 메타버스 - 가상공간과 현실이 상호작용하도록 이어주는 매개체 혹은 방식


위 정의에서 생략된 부분이 많기는 하지만, 글을 진행해 나가며 차차 설명해 나가도록 하겠습니다.




메타버스는 그 실체가 모호하다는 것이 드러난 이후로, 많은 이들에게 외면받기 시작했습니다.

정말 이렇게 많은 기업들이 뛰어들 만큼 수요가 존재하는 실체가 있는 시장인가?라는 의문에 답할 수 있는 사람들은 아무도 없었죠.

메타버스를 준비하던 많은 기업들은 콘텐츠와 콘텐츠를 제공하는 플랫폼의 경계에서 혼란을 겪다가 결국 대분 포기했고, 그 결과로 메타버스 시장은 현재까지도 불안정하고 더딘 성장을 진행 중입니다.



하지만, 최근 chat GPT의 등장과 함께 인공지능들이 크게 발전하며 메타버스의 판도가 뒤집힐 것으로 기대되고 있습니다.

여러분은 혹시 다음 두 가지 단어에 대하여 알고 계시나요?


Intelligent Virtual Agent (IVA)
Mulimodal


이 두 가지 단어는 메타버스뿐만 아니라, 모든 분야에 걸쳐 사람들의 삶을 극적으로 변화시킬 키워드입니다.



Intelligent Virtual Agent (IVA)


Microsoft Copilot

Intelligent Virtual Agent (IVA)는 인공지능 기반의 가상 에이전트를 말하며, 사용자와 상호작용하며 다양한 업무와 서비스를 지원하는 역할을 합니다. 빅스비와 시리의 상위호환이랄까요?

이미 이러한 변화는 시작되고 있고, 거대 기업부터 스타트업까지 다양한 기업들에서 시도되고 있습니다. 가장 먼저 찾아볼 수 있는 것이, 마이크로소프트에서 준비 중인 365 Copilot 서비스입니다. 365 copilot은 쉽게 말해 저희가 흔히 사용하는 엑셀과 파워포인트 등에서 인공지능에게 지시를 내리면, 사용자의 지시에 따라 문서를 생성해 주는 가상 에이전트입니다.(다른 다양한 기능들도 많습니다.)


멀티모달


멀티 모달이란 두 가지 이상의 서로 다른 유형의 데이터를 사용하여 인공지능에게 데이터를 전달하거나 처리하는 것을 말합니다. 쉽게 말해 원래 텍스트만 이해하던 Chat-GPT에게 이미지를 주어 이해시킬 수 있게 된다면 이를 멀티모달이라고 부를 수 있습니다. 듣기만 해도 엄청 어려운 기술처럼 보이죠?


https://openai.com/customer-stories/be-my-eyes

 

그런데 짜잔~ 그것이 실제로 일어났습니다.


알고 계신 분들도 많겠지만, Chat-GPT를 만든 회사 OPEN AI는 GPT4에서 멀티 모달을 지원할 계획이라고 밝힌 바 있습니다. 그들이 제시한 예는 gpt에게 헬륨 풍선 이미지를 보여주며, '이 풍선의 줄을 끊으면 어떻게 될까?'라고 묻자, '풍선이 날아갈 것 같네요'라고 대답했다는 것입니다.


인간에게는 아무것도 아닌 이 일은, 사실 인공지능에게 한동안 넘기 힘든 큰 벽 중 하나였습니다.


인간은 태어나서부터 시각이라는 감각기관을 가지고 태어났으며, 시각과 청각 촉각, 언어능력 등을 통해 종합적으로 사고하는 것이 습관화되어 있기 때문에, 시각으로서 정보를 받아들이고 받아들인 정보를 통해 추론하며 판단하는 것이 직관으로 가능했습니다. 물론, 인공지능이 이미지에서 사물이나 상황을 추출해 내는 것까지는 흔히 우리가 보아왔던 기술들을 통해 가능한 영역에 있었습니다. 하나, 이미지의 맥락을 이해하고 이를 토대로 이후에 벌어질 상황을 추론해 내는 것은 최근까지만 해도 정말 어려운 일들 중 하나였습니다.



아직 Open ai가 멀티모달 기능을 공개하지는 않았지만, 이미 위와 같이 유사 멀티모달 혹은 멀티모달들이 계속해서 출시되고 있습니다. 인공지능에 눈이 달리는 날이 정말 머지않았습니다.



이 두 가지 개념을 이해하셨다면, 이미 여러분의 머릿속에서는 상상의 나래가 펼쳐지고 있을 거라고 생각합니다. 눈이 달린 챗 지피티와 인공지능 에이전트는 메타버스를 어떻게 변화시킬까요? 더 나아가서는 우리의 삶을 어떻게 변화시킬까요?

다음 글에서 구체적으로 알아보도록 하겠습니다.






Reference:


                     

작가의 이전글 XR, 메타버스의 현주소

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari