생활 속 스며든 AI ②

AI 문자 응용 폭발

by 권혁민

May 10. 2023

학습의 인풋이 문자 텍스트와 이미지를 기반으로 학습되었기에 결과로 문자와 이미지를 내어 놓을 수

있습니다.

이렇듯 텍스트를 받아 다양한 아웃풋을 보여주는 다양한 기술과 서비스가 소개되었습니다.

그중 대표적인 사례로 최근에 큰 인기를 얻은 ChatGPT 가 있죠.

GPT모델을 이용한 DALL.E는 문자를 입력해 이미지를 내어 놓는 서비스입니다.

최근 사용하는 DALL.E 와 미드져니(Midjourney)는 GPT모델을 STABLE DIFFUSION은 DIFFUSION

모델을 사용하고 있습니다. 그리고 막강한 자본을 가진 기업이 주축이 되어 모델을 개발하고 고객이 사용의 편리성을 높여 UI로 제공하는 DALL.E 와 미드져니(Midjourney)가 현재 사용층이 두터운 서비스로 자리

잡고 있습니다. 사용 편의성은 좋으나 유료화 서비스입니다.

반면 STABLE DIFFUSION 모델은 무료로 오픈하였고 사용자 편의성을 제공하는 다양한 UI도

무료 오픈으로 공개하는 일이 많으며 파인 튜닝으로 독특한 아이디어가 적용된 다양한 모델을 공개하고

있습니다.

흡사 OS시장의 윈도(Windows)와 리눅스(LINUX)의 상황 이라고나 할까?

어떻든 모두 활발하게 사용되어 이미지 생성에 크게 사용되고 있습니다.

이제는 원하는 텍스트만 주고도 영상을 만드는 것이 너무 쉽고, 이미지에 소리와 얼굴 표정, 입의 움직임을

주는 모션 기능의 추가도 너무 쉬어진 세상입니다.

스토리 라인만 잘 구성하고 (*이 부분도 ChatGPT의 도움을 받는다면 더 쉽게 가능) 이미지로 영상으로 쉽게 제작할 수 있으니 그 활용의 범위가 공식 보고서이든 상품을 소개하는 마케팅이든 유튜브의 영상이든 특별한 기술이 없어도 할 수 있는 시대가 오고 있는 것이죠.

이제는 스크립트만 입력하면 알아서 제목과 영상을 입혀 동영상을 제공하는 서비스는 다양하게 있습니다.

스크립트를 기준으로 AI는 신속하게 스토리 라인을 잡아 주고 여기서 사람이 개입해 수정해 줄 수 있는데

수정의 의미는 AI가 제안한 것 외에 다른 것을 제안해 달라고 리오더 하는 것이랍니다. 즉 다시 요구 컨펌의 과정이라고 보면 됩니다.

Lumen5 서비스 사례

스크립트를 주면 알아서 제목부터 내용을 순차적으로 구성해 최종 사람의 컨펌을 받고 결과를 동영상으로

출력합니다.

Midjourney 사례

프롬프트 (=명령어 : 원하는 내용을 텍스트로 작성 )를 주면 아래와 같은 이미지 생성.

이미지를 생성해 가면서 선택해 가는 과정을 통해 내가 원하는 이미지로 만들어 가는 과정만 거치면 일러스트를 전혀 몰라도 완성도가 높은 고 퀄리티의 이미지가 완성됩니다.

[ Midjourney 프롬프트에 입력된 키워드로 그림을 생성합니다. ]

인풋(Input)에 문자와 이미지를 동시에 입력하고 결과를 요구하니 이미지의 요소를 반영해 프롬프트 대로 원하는 이미지를 출력(Output) 해 줍니다. 모사할 이미지를 주고 그 이미지를 참고해 그려주니.. 조금 더 다양하고 스스로 원하는 이미지를 확인하면서 누구나 쉽게 수준 높은 이미지를 만들어 내는 것이죠.

[ 반고흐의 별의 빛나는 밤에 화풍을 고려해 프롬프트와 연관된 이미지를 연출합니다. ]

keyword

권혁민 IT 분야 크리에이터 직업 CEO

ChatGPT 재테크 비서로 고용하기 저자

권혁민의 브런치스토리입니다. ( 중국 상해 소재 패션 인공지능 회사 F&PLUS CEO )

팔로워 15

작가의 이전글생활 속 스며든 AI 열린 기회 작가의 다음글