아이언맨의 자비스가 꿈은 아닐지니....
아이언맨의 자비스가 꿈은 아닐지니....
미국이 달리 천조의 나라이던가?
달러, 금융, 산업, 할리우드, 전쟁, 우주, IT에 이어 AI까지 미국의 독주가 시작된 지 오래다.
알파고에 열광하던 게 얼마 전쯤으로 착각하고 살던 게 이제는 "ChatGPT" 광풍이라니 격세지감쯤으로 해두자.
필자가 그동안 연재한 AI 및 ChatGPT에 대한 글들에서 언급되었던 내용과 관련된 아이언맨 스타일로 전문용어로 '특공대식'(뭐 좋은 표현은 아니지만 직관성 향상 측면으로 보아주시길...) 개발작업을 계속 진행해 보았다.
어느덧 개발 방향이 좌충우돌을 겪으며, 하나의 목표점을 지향하게 되었고 이는 멋진 표현을 빌리자면 "맞춤형 AI 챗봇 퍼스널리티"란 개념에 플랫폼 서비스("SAAS"라고 생각하자.)란 상위 클래스로 정의해 보았다.
관련 자료를 찾던 중 벤치마킹이랄까 유사한 콘셉트의 서비스를 발견하였다.
해외의 character.ai란 서비스인데, AI 챗봇에 각각의 페르소나를 투영하여 독립된 전문성과 이를 기반으로 한 커뮤니티를 지향한다는 서비스이다.
서비스에 접속하여 '마리오'와 대화를 시도해 봤다.
일단, "한글" 안된다.
이후 영어로도 대화를 해보았지만 이건 ChatGPT가 아니라고 판단되었다.
기존 챗봇에 약간의 NLP(자연어 처리)를 추가하여 특정 페르소나를 주입한 수준으로 느껴졌다.
대한의 남아는 이보다 더욱 크고 훌륭한 것을 해야 한다는 선현의 말씀에 따라 유사 콘셉트의 선도자를 능가하기 위한 나름의 서비스(알파 테스트 버전)를 개발하였고 브런치를 통해 공개한다.
필자는 '맞춤형 AI 챗봇 퍼스널리티 플랫폼 서비스'를 지향하였으며, 가장 중요한 프로젝트 코드명은 'BooCae'(부캐)라고 정했다.
부캐릭터의 그 부캐, "맞다."
‘BooCae’는 ChatGPT를 기반으로 LLAMA, ALPACA 등 다양한 초거대 AI 모델과 다양한 API 및 플러그인들이 결합된 ‘커스텀 AI 챗봇 퍼스널리티’ 플랫폼을 목표로 하였다.
BooCae의 AI 챗봇은 공통적으로 ChatGPT-3.5-Turbo API를 기반으로 각 분야별 ‘맞춤 학습’이 독립적으로 구성되었고, 알파 테스트 서비스에는 멀티모달 AI 아바타도 포함되어 운용이 가능하다.
AI로 아바타를 만드는 모델은 별도로 '네이티브 앱'으로 개발하였고 아직 스토어에 등록하지 않고 오프에서 테스트를 진행 중인데, 이건 추후 별도로 소개하기로 하겠다.
회원가입 및 로그인 개념도 생략하였고 알파테스트 버전이다 보니 일단 무료다.
필자에겐 가용 디자이너도 없기에 기본적인 UI/UX 콘셉트는 최대한 직관적일 것을 목표로 하였다.
'특공대식' 개발 콘셉트에 맞게 목표 수준만큼 모든 인프라를 혼자 만드는 것은 불가능하므로, 최종단계 서비스는 Notion을 이용하였고, oopy를 통해 웹서비스로 빌드하였다.
각각의 AI 캐릭터는 독립적이며, 각각의 키워드를 가져야 한다. 이는 카테고리 분류를 통해 지정하게 하였으며, 화면에서처럼 클래스(중요도 또는 우선순위로 해석)에 따라 자동으로 상위에 랭크되는 구조로 구성하였다.
각각의 AI 챗봇은 모두 각 캐릭터별 전문 지식이 맞춤 학습된 ChatGPT가 내장되어 있으며,
BooCae(부캐) 서비스 자체의 메인 AI 챗봇은 서비스 사이트 우측 하단에 표시된다.
BooCae 서비스의 메인 AI 챗봇을 열어서, 오늘 환율을 물어보았다.
자주 쓰는 빈도성 높은 질의어등은 버튼 형태로 지정하게 설정하였다.
실시간 조회성 정보들은 학습이 무의미하기에 ChatGPT와 별개로 AI 챗봇이 실시간 조회 API를 통해 정보를 가져온다.
API가 사실상 플러그인이기에 무한한 확장과 연동이 가능하다.
비록 알파 테스트 버전이지만, BooCae 서비스 내에서 오늘의 뉴스 내지는 실시간 뉴스에 특화된 AI 챗봇을 선택하여 오늘의 주요 뉴스를 물어보았다.
동영상의 달리는 '스머프'들을 보면, 학습 중인 상태라며 열심히 달리는 모습이 보인다.
이제 기본 서비스 구성의 구조, 차별점 등을 설명하겠다.
-AI 모델: ChatGPT를 기본 적용하였고, 알파카와 라마 등 다른 GPT들도 곧 추가 반영 예정이다. ChatGPT는 오픈 API로 GPT3.5-TURBO를 근간으로 하였다.(반응속도와 비용도 감안해야겠죠.)
-AI 페르소나: 기본은 AI 어시스턴트로 정의된 표준적인 프롬프트셋을 사용하였고, 한국적 실정에 맞게 약간의 변형을 가했고 이는 추가적으로 계속 업데이트할 계획이다.
-맞춤형 추가 학습 데이터셋: 공개된 정보(공공정보 포털, 저작권 없는 공개 정보 등)를 기반으로 뉴스, 사전 등의 내용을 실험적으로 학습시켰고 계속 양과 질을 개선 중에 있다. 향후 전문 유료 데이터 구매에 대한 부분도 필요한 요소이다.
-실시간 정보 조회용 API: 실시간성(예를 들어, 환율 정보 등) 데이터 활용을 위해 여러 API를 사용하였고 계속 추가 중에 있는데 실시간 API 조회 역시 비용적 측면을 무시할 수 없다.
-챗봇 플랫폼: 공개 버전부터 상용버전까지 다양한 챗봇 플랫폼들이 존재하고 있어서 여러 가지 챗봇 플랫폼들의 모듈과 API를 이용하였고, 더욱 많은 플랫폼들을 지원할 수 있게 하려 한다.
챗봇 플랫폼들은 크게 시나리오 등 조건 설정이 가능한 구조를 근간으로 한다. 이는 ChatGPT가 기본 내장(이경우 사실상 챗봇 플랫폼이라고 보기에는 다소 무리가 있는 경우가 많았음) 되었거나, 내장되지 않았지만 API가 열려있어 수동으로 API 설정을 하여 ChatGPT를 연결할 수 있는 구조이다.
두 가지 모두 각 장점들이 존재하고 있고 중요한 건 더 많은 플랫폼들을 자유롭게 지원할 수 있는 다양성의 확대라고 판단한다.
-적용 및 배포: 웹위젯, URL 링크, API 방식으로 정의할 수 있겠으며 이를 통해 웹/ 웹앱/ 네이티브앱/ 또는 구글 어시스턴트등 보이스 서비스 등 멀티 플랫폼 지원이 가능하다.
-검색 기능: 키워드 등록 및 활용을 위해 검색 기능은 Notion에서 제공되는 것을 그대로 적용하였고 DB 구조체도 활용성이 좋다고 본다.
-광고: 수익 모델을 고려했을 때, AI가 답변할 때마다 스폰서 광고를 노출하는 것을 전제로 실험적으로 적용 테스트를 진행하였다.
광고의 방식은 1) 동영상 2) 이미지 3) 텍스트 및 URL 4) 답변에 PPL성 내용 포함 등이라 본다.
-AI 아바타: 가장 큰 차별화 포인트를 준비한 부분이 멀티모달 측면이다.
AI를 통해 텍스트 생성, 음성 생성/복제/합성, 이미지 생성, 동영상으로의 합성, 배경 등 비디오 처리 등이 모두 복합적으로 적용된 것이 Boocae에서 정의하는 진정한 멀티모달 AI 아바타라고 판단한다.
Boocae 알파 테스트에 공개된 동영상 이미지의 대부분은 Wav2LIP등을 이용하여 만들어진 것으로 사전 테스트 시 확실히 이용자 반응성이 높았다는 판단에 이를 차별화 포인트로 집중을 하였다.
서비스 카테고리를 수십여 가지로 정의하였고, 이는 계속 추가가 될 거라 본다.
서비스의 클래스 구성에 따라 Special(특별함), Brand(기업 등 브랜드 서비스), Expert(전문가 서비스), Ready(학습 진행 중), coming soon(학습 대기 중)로 분류된다.
끝으로 실제 서비스 동작 동영상을 간단하게 보겠다.
웹 화면을 동영상으로 캡처하였고, 동영상 설명은 'BooCae' AI 아바타가 생성되어 참여하였다.
"자비스가 정녕 꿈은 아닐지니...."
'부캐' 알파 테스트 URL: https://boocae.oopy.io/