brunch

You can make anything
by writing

C.S.Lewis

by Vintage appMaker May 31. 2024

생성AI 멀티모달이 바꾼 삶의 변화

생존형 개발자의 생각 #102


우리 삶에 파고든 생성 AI

어느순간부터 모바일 디바이스에는 "ChatGPT, Bing, Gemini"가 필수가 되었다.


생성 AI가 우리 생활에 자리잡은 지 벌써 1년 6개월이 되었다. 업무관련 준거집단(개발자, 기획자) 사람들의 Mobile Device와 Desktop에는 각자 취향에 맞는 "생성AI 서비스 한 두개"는 설치되어 있다. 개인적으로는 ChatGPT 이상으로 Gemini를 사용하게 된다. 아무래도 code generation과 그 결과를 공유하는 interface가 개발자 친화적이기 때문일 것이다.


그럼에도 불구하고 ChatGPT, Bing, Gemini는 각자의 이점을 가지고 있기에 어느 한 쪽만 집중적으로 사용하지 않는다. 자료정리를 원한다면 ChatGPT를 선호하지만 Code generation 및 실행테스트를 한 번에 하고자 한다면 Google의 Gemini을 선호하게 된다. 그리고 블로그 포스팅에 사용할 이미지나 레퍼런스 체크가 필요하다면 원픽으로 MS의 Copliot을 탑재한 Bing을 애용한다. GPT 4.0을 오래  전 부터 제공해주었기 때문이다. 그리고 Dall-e를 무료로 사용할 수 있기 때문이다.   


“인공지능”이야말로 인간적인 것이 아닌가?

인공지능이 이슈화 되기 오래 전부터 “알콜배틀”을 해왔던 주제가 하나 있다.  바로 “니 생각이 정말 니 생각이냐? 누군가의 생각이 주입된 것이라 생각해 본 적은 없는거야?” 였다. 이런 질문을 던지게 되면 “이 닝겐이 또 시작이다”라는 식으로 오펜스를 디펜스하는 사람들이 대부분이었다.


그들은 말같지 않은 주제라고 생각했겠지만, 20대이후부터 30년 넘는 동안 줄기차게 화두로 사용했던 내용이었다. 아무리 생각해도 “인간의 삶에서 인공”이 아닌 것이 을 수 없다. 그럼에도 사람들은 “자연적”이고 원초적인 것에 미신(나만의 영혼?)을 가지고 있다. 신화, 종교, 문학, 예술과 같은 창의적인 부분에서조차 “템플릿”이 존재하고 같은 뿌리의 유사함이 존재한다. 결국, “삶에서 내가 생각해 낸 것”은 생각보다 많지 않다. “어디선가 학습된 것”을 특정한 맥락(Context)에서 발현할 뿐이다. 라는 말을 하다보면 “동석한 다른 사람들과 다른 화제로 이야기 하는 닝겐들”을 쉽게 볼 수 있었다.


그들에게는 “논리보다 감성”이 더 중요했을 것이다.
문제는 감성조차 “인공”이라는 의심을 하지 않는다는 것이다.


그런 점에서 생성AI는 “프롬프트”를 활용하여 지적인 사고방식을 공유할 수 있다. 만약 비정형적 사고로 똘똘 뭉친 닝겐들과 대화를 하며 스트레스를 받았다면 생성 AI에게 단순명료한 맥락으로 프롬프트를 던지면서 유의미한 대화(생성결과물)을 경험할 수 있다.


멀티모달의 힘. 과연 인간세상의 산출물(역사, 문화, 사상, 종교)과 AI와 차이점은 존재하는가?라는 의도의 프롬프트를 사진으로 보낸 것.

특히 몇 달전부터 지원했던 멀티모달의 인터페이스 덕분에 음성, 이미지를 통해 인터렉티브한 재미를 느낄 수 있다(OCR 기술이 이렇게 발전했었나?).


 멀티모달이란?

멀티모달(multimodal)은 여러 가지 서로 다른 형태의 데이터나 입력 방식을 통합하여 처리하는 것을 의미한다. 생성AI에서는 프롬프트를 이미지나, 음성, 동영상으로 대처해서 사용할 수 있는 것을 의미한다. 그런 점에서 맥락과 논리, 데이터 기반의 대화를 선호하는 사람이라면 생성AI에서 제공되는 멀티모달에 높은 만족을 느낄 수 있다. 감정과 편견으로 삐뚤어진 대화를 이끄는 닝겐과 달리 “생각을 나눌 수 있는 지능”으로써 괜찮은 결과물을 제공하기 때문이다.


결국, 도구를 다루는 원숭이만 남는다

SF 관련 영화, 만화를 좋아하는 편이다. 80년대 암울했던 5공시대 청소년들에게는 교과서라 불리는 과학서적이 있었다. 바로 칼 세이건 삼촌의 “코스모스”였다. 이 책을 영접한 이후, 과학(기술)과 인간과 사회는 언제나 관심 대상이었다. 그 책에 열광한 것은 미지세상에 대한 환희같은 것이 존재했기 때문이다. 그걸 통해 닝겐의 대단한 역사와 문화라는 것은 한 줌 모래정도로 느껴졌었다.


어떤 사람들은 과학적 해석과 진보적 변화에 대해 극한의 거부감을 나타내기도 한다.


Legacy에 친숙한 사람일 수록 진보를 거부하고 현실에 안주하려고 한다. 이를 두고 폄하할 생각은 전혀없다. 누구나 “사고가 멈추는 시점”이 존재하기 때문이다. 그러나 이번 생성 AI의 이슈는 인터넷의 탄생, 오픈소스 혁명 이후 급격한 변화를 만들고 있다. 나또한 넋놓고 바라보고 있지만, 다가오는 뉴월드에 대해 매우 우호적이게 된다. 편한 세상이 도래하고 있음은 틀림없기 때문이다.


며칠 전부터 GPTs 쪽이 일반 유저들에게 노출된다. 이를 통해 GPTS의 시장을 넓힐 수 있을 지는 지켜보아야 할 것 같다.


     진보에 대한 시각의 차이(뉴월드, 아포칼립스)

테크홀릭들이 바라보는 뉴월드를 감성충만 레거시 매니아들은 디스토피아로 바라보는 경향이 있다. 그러다보니 미래의 진보를 대하는 자세는 창작자의 가치관에 따라 크게 3가지로 보여진다.     


(1) 공포 (2) 고민할 문제 (3) 다를 것 없다.     

영화 버드박스를 재미있게 보았는 데, 새로운 세상에 대한 부정적이며 암울한 내용들이 인상적이다. 특히 알 수 없는 존재가 주는 공포는 단연 압권인데, 이는 미래에 대한 실체보다는 미래에 대한 (1) 공포에 초점을 맞춘 작가의 성향이 드러나있다고 본다.     


버드박스 - 2018


그리고 20년 전 영화 인 “아이로봇”은 지금 시점에서 다시 한 번 보기를 추천한다. 닝겐과 AI 그리고 공존이라는 이슈를 던지며 과연 인간과 AI, 로봇의 차이가 무엇인지 궁금해지게 된다. 이 영화에서는 (2) 고민할 문제, 공존을 다루고 있다. 시대를 앞서간 명작이 아닐가 싶다.     


아이로봇 - 2004


개인적으로 팬덤을 가지고 있는 만화작가 “우라사와 나오키”. 그의 작품 중 명작이 너무 많아 열거하기 귀찮다. 그러나 그 중 원픽을 한다면 “데츠가 오사무”를 향한 헌정작으로 시작한 “철인아톰”의 오마주였던 “플루토”이다. 오사무의 아들이 찾아와 “오마주가 아닌 당신의 작품을 만들어 달라”고 했기에 이런 명작이 나오지 않았을까 싶다. 이 영화에서 느끼는 것은 “인간과 AI의 차이점”이 존재하는가? 였다.  특히 후반부로 갈 수록 “각성”이라는 주제가 머리 속에 지워지지 않았다.


우라사와 나오키 원작 "플루토" - 2023 넷플릭스


정리하기

생성ai는 사용자의 프롬프트를 맥락에 맞게 결과를 생성할 뿐이다. “결국 프롬프트 작성자의 맥락이 중요한 것”일뿐 생성 AI가 자신의 가치관으로 판단(생성) 하지 않는다. 그럼에도 불구하고 만족도가 높은 것은 닝겐의 모든 사고는 템플릿이 존재하고 적절한 맥락으로 선택되기 때문일 것이다. 논리적으로도 인공지능과 사람의 사고방식에는 차이가 없어보인다. 감정이라는 것조차 인공적일 수 있기 때문이다.


범용인공지능(AGI)에 대한 판타지는 둘째치더라도 생성AI를 사용자 ux에 맞게 인터페이스만 하더라도 꽤 재미있어질 것 같다.


인류, AI에 일자리 뺏길까?…'SORA 영화' 감독의 답변은 / SBS 8뉴스


매거진의 이전글 아날로그 전환
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari