어떻게 사용할 것인가는 여러분의 몫입니다.
챗 GPT가 표면에 드러난 후 여러 가지 형태의 생성형(Generative) AI가 빠른 속도로 우리의 일상에 파고들었습니다. 이와 관련된 많은 글들이 생산되고 있으며 이 글 또한 다르지 않습니다. 현재 저는 AI의 흐름과 체계, 용어와 목적 등을 정리하여 AI관련 사전을 만들고 싶어 정리 중에 있습니다만 제가 정리하는 양보다 출시되는 AI 모델 기반 소프트웨어의 등장 속도가 더 빨라서 매우 당황 중입니다. 돈 모으는 속도보다 집값이 오르는 속도가 더 빠른 기분이랄까요.
현재 Open AI(Chat GPT) 및 Google Gen AI(Bard) 등에서 파생된 소프트웨어 중 가장 각광을 받고 있는 분야는 위에서 언급한 생성형 AI며 주어진 입력값(Prompt)에 기반하여 새로운 데이터를 생성하는 인공지능 모델을 의미합니다. 이 모델을 기반으로 우리는 여러 가지 형태의 소프트웨어들을 경험할 수 있으며 대표적으로 5가지로 구분할 수 있습니다.
1. 정제되지 않은 글을 목적에 맞는 글로 생성
2. 글을 기반으로 이미지 생성
3. 글을 기반으로 음성 생성
4. 글을 기반으로 음원 생성
5. 글을 기반으로 영상 생성
이 5가지는 현재 어느 정도의 단계에 이르렀고 대표적인 소프트웨어는 무엇이 있는지 대략 살펴보도록 할게요.
챗 GPT와 같은 모델은 자연어 처리를 사용하여 문장, 답변, 이야기 등을 생성합니다. 이러한 모델은 현재 고객 지원, 챗봇, 대화 기반 검색, 개인 비서 등 다양한 대화형 인터페이스에서 활용되고 있으며 대표적 사례는 아래와 같습니다.
https://gemini.google.com/?hl=ko
입력값을 바탕으로 새로운 이미지를 생성하거나 이미지를 수정하는 등의 작업에 사용될 수 있습니다.
https://stablediffusionweb.com
https://firefly.adobe.com/?ff_channel=adobe_com&ff_campaign=ffly_homepage&ff_source=firefly_seo
텍스트 입력값으로 음성을 생성합니다. 이러한 모델은 음성 합성, 음성 인식 시스템, 음성 동화 등의 응용 프로그램에 사용될 수 있습니다.
https://cloud.google.com/text-to-speech?hl=ko
https://app.typecast.ai/en/login
다양한 장르와 스타일의 음악을 생성할 수 있습니다. 이러한 모델은 작곡가나 음악 제작자를 돕는 데 사용될 수 있습니다.
https://www.capcut.com/ko-kr/tools/ai-song-generator
이러한 모델은 주어진 텍스트 설명에 따라 비디오를 생성합니다. 예를 들어, 텍스트 설명을 사용하여 애니메이션 비디오를 생성할 수 있습니다.
개인적으로 가장 기대하고 있는 소프트웨어입니다. 정말 기다리고 있습니다.
만화 주술회전에 보면 주력과 술식이 있습니다. 다양한 술식(생성형 AI)을 익히면 주력(디자인 내공)이 강화될 수 있고, 결국 자기만의 영역을 전개할 수 있게 됩니다. 어떠한 술식을 익힐지는 여러분들의 몫입니다. 피할 수 없다면 익힐 수밖에 없습니다. 난이도가 낮은 것부터 차근차근 익혀보시길 바랍니다.
2번 이미지와 5번 영상 생성 AI에 관한 내용은 더 자세하게 글을 작성하여 추후 업로드 하도록 하겠습니다. 읽어주셔서 감사합니다.