brunch

You can make anything
by writing

C.S.Lewis

by Vintage appMaker Jun 08. 2024

생성 ai, 멀티모달의 일상(a.k.a 노잼대전)

생존형 개발자의 생각 #103

“노잼대전”이라는 말을 들을 때마다 “왜?”라는 자문을 한다. 내게는 재미있는 도시이기 때문이다. 처가친척과 지인이 산다는 이유 외에는 연관없는 도시이건만 대전에 도착하면 나름 놀거리가 있어 즐겁다.   


탁트인 개방감

조화로운 녹지구성

내게 무관심한 사람들(말없고 예의바름)

인구분포상 박사가 많은 도시


이 중에 무엇보다도 마음에 드는 것은 개방감이다. 평지가 주는 재미가 있건만 산으로 익사이팅과 인사이트를 느껴야 하는 국민정서때문에 “평지에서는 놀거리가 없다고 폄하”하는 것이 아닐까 싶다.


개인적으로 대전이 좋은 이유가 하나 더 있다. 대전에 오면 까페에서 글정리 하는 시간이 많아진다. 결국 대전에 오면 복잡한 생각을 정리할 수 있는  기회가 생긴다. 그리고 최근 “생성ai의 멀티모달 생활화”에 힘입어 다양한 생각을 편리하고 즐겁게 정리할 수 있게 되었다. 생성 AI에서 멀티모달이 주는 사용자 경험(UX)은 “객관적이고 조용한 조수(assistant)를 옆에 두고 회의”를 하는 것과 같다. 불필요한 맥락(감정소모)을 만들 필요가 없어 매우 만족스럽다.


1. 멀티모달의 활용

멀티모달의 활용에서 가장 “상업적 가치”가 뛰어난 영역은 “문서판독” 즉, OCR에 해당하는 부분이다. 수많은 대기업과 정부산하 기관들이 수십년간의 아날로그 기록을 디지털화 하면서 엄청난 비용을 들여 “광파일(20세기때 용어임)” 또는 EDMS(Electronic Document Management System)을 구축했다. 중소기업조차 엄두가 안되는 EDMS를 개인들이 생성 AI의 멀티모달을 통해 편하게 활용할 수 있다. 개인적으로는 문서를 디지털로 백업 및 데이터베이스화 하는 작업은 vFlat 만으로도 완벽하기에 생성 ai의 활용은 적은 편이다.


개인적으로 제미나이가 OCR 분석기능은 월등하다고 판단된다.
윈본Note를 vFlat으로 스캔. OCR 판독 및 AI 정리는 유료이지만 몇 회에 한 해, 1달에 무료사용 가능하다.


개인적으로 멀티모달을 사용할 때는 ChatGPT보다 제미나이(Gemini)를 선호한다. 문서판독력이 비교우위에 있다고 판단하기 때문이다. 특히 Outline 글쓰기(들여쓰기 목차) 같은 시각적으로 구조적인 내용조차 “만족스러운 산출물”로 만들어준다.  그리고 pdf로 작성된 기술문서나 기획서를 분석할 때는 어떠한 생성 AI를 사용해도 만족스러운 결과를 얻어낼 수 있다.


2. 위치기반 지역검색

상대에게 지금의 장소를 알려줄  때마다 GPS를 키고 지금의 위치를 공유할 때가 있다. 그런데 생각보다 편하지 않다. 가장 직관적인 것은 “주위의 눈에  보이는 건물을 말하는 것”이다. 이런 것을 생성 AI의 멀티모달을 사용하면 유용하게 활용할 수 있다.

위치정보를 공유할 때, 이정표만 던져주고 싶을 때가 많다. 이때 멀티모달은 이름값을 한다.


거듭 강조하지만 “멀티모달을 활용 시”에는 제미나이(gemini)를 애용하게 되는 데, 이유는 구글의 강력한 서비스와 자연스럽게 연동되기 때문이다.


3. 일상을 학습

일상에서 흔히 일어나는 것이 “이해력 부족”으로 인한 “소통의 오류”이다. 인간이라면 누구나 경험하는 현상이지만 이로 인해 감정이 생기기도 한다. 재대로 된 답변을 했음에도 불구하고 이해력 부족으로 인해 엉뚱한 질문을 반복하기 때문이다. 이럴 때, 생성 AI의 멀티모달 기능은 은근 괜찮다. 마이크 버튼을 누르고 감정을 섞어가며 “멍청한 질문”을 계속해도 생성 AI는 이해를 시키려고 꾸준히 답변을 내놓기 때문이다. 호르몬 이상으로 인해 꼰대력이 급상승 하고 있는 중년 관리자나 임원들에게는 “인성교정 및 인간관계 유지” 차원에서도 꽤 좋다고  판단된다.


아래 예제는 우리집에 같이 살고있는 거북이 “부기”의 모습이다.

6개월만에 2.5배가 성장한다는 것만 빼면 "거북이"는 은근 귀엽다. 사람처다보는 눈도 큐티큐티하다.


우리집 부기는 “페닌슐라종이면서 노란속살흰점(=노란배) 거북”이었다.

제미나이는 재대로된 결과물을 생성했다. 문제는 호르몬 이상현상으로 갱년기를 경험하며 육체적 정신적 능력저하를 유발하는 나님이였다. 그럼에도 불구하고 나님은 재미나이에게 음성프롬프트로 “짜증”을 냈다. “넌 ChatGPT보다 못해!” 그랬더니 감정없이 자신의 회사가치를 대변하는 정치적 결과물을 내놓았다.


4. 아직은 미완성

유튜브에서 여행유튜버가 ChatGPT의 멀티모달을 사용하면서 여행하는 장면을 보았다. 그래서 시도해보았다.

많은 것을 바란 것 같다.

아직 만족스럽지 못하다. 사실, 구글 번역도 완벽하지 못하건만 너무 많은 것을 요구한 것이 아닐까라는 생각을 하게 되었다.


“검색과 생성 ai의 하이브리드”가 은근 만족도가 높다. Bing(신)님을 모바일에 설치하고 자주 사용하는 이유는 “서점에서 책을 발견하고 큐레이션을 받고 싶을 때”가 있기 때문이다.

생성 AI와 검색의 하이브리드 상품은 "지식기반 산업종사자"들에게는 만족도가 높다.


5. 정리

멀티모달을 무료로 사용하는 몇달 동안, 적지않은 변화가 생겼다. 바로 생성 AI가 조수(assistant)로서 생활에 “단디 자리잡아가고 있다”는 점이다. 외부에서 회의를 마친 후, 기록한 메모(회의록을 노트북으로 기록하지 않는다 속도와 소통의 문제가 생기기 때문이다)를 문서(Google Docs, Notion, etc)화 할 때, 소요되는 시간을 극적으로 줄여주었다. 심지어 내가 정리한 문서를 분석하여 “전략”에 대한 고민을 할 수 있었다. 그리고 몇몇 일상에서 “전화로 대화”를 하듯 생성AI에게 말을 하거나 사진을 던지며 생각을 정리할 수 있었다.


이런 것들이 무료라는 것이 믿어지지 않는다. 아날로그 세상은 아포칼립스로 치닫고 있지만 디지털 세상은 르네상스로 들어서는 것 같아 묘한 감정이 생긴다.


여하튼, 다시 “대전이 노잼인가?” agenda로 돌아와서 생각해보면 멀티모달이건 생성 AI이건 평지 등등이 중요하지 않다. 대전은 서울을 제외한 지자체 중 가장 -핫플레이스-유잼이라는 것이다.


누구나 알고 있는 치트키 성심당을 보유했기 때문이다.


어제는 가장 사람없다는 엑스포점에 갔건만  주차장 2군데가 만차였고 길거리 주차도 불가능한 상태였다. 그리고 창문넘어 성심당에 줄서서 구매를 기다리는 전국의 열성신도들이 보였다. 오늘은 오전 8시 넘어서갔더니 11시에 튀소세트가 나온다고 했다. 오픈런에 엔꼬가 난 것이다.


코레일의 오만방자함이 성심(聖心)을 추구하는 신도들의 마음에  분노의 불을 지폈다. 결국 성지순례를 초래했다. 나님은 2일동안 구매를 못했다. 반반세트! 아쉽다. 코레일 너님이 나에게 2일간의 손해에 대해 보상해줘야 한다. 엑스포(93) 때도 오지 않았던 곳을 성심당 때문에 2번이나 출책했다.


아침부터 신도들이 참배 중이다.
매거진의 이전글 생성AI 멀티모달이 바꾼 삶의 변화
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari