2024 아르떼 아카데미 연수 과정, AI Prompt에 대해 이해하기
하루에도 몇 번씩 궁금한 질문들이 떠오를 때마다 ChatGPT(챗지피티) 앱을 열곤 한다. 일상에서의 사소한 질문부터 분야에 상관없이 던지는 질문 공격(!)에도 번호를 매겨가며 차례로 알려주는 정보를 받아볼 때면 신기함과 시간의 효율성에서 오는 짜릿함은 여전히 감출 수 없다.
물론, 한 번 더 정확성에 대한 검증 작업을 거쳐야 하겠지만 원하는 정보에 가까운 답변을 찾고 다시 웹사이트에서 찾아보며 확인하는 과정만으로도 꽤 흥미롭다. 예전 같았으면 정보를 찾는데 많은 시간을 할애했을 테지만 ChatGPT(챗지피티)를 활용하면서는 줄어들었기 때문이다.
필자뿐만 아니라 주변에서도 더 나아가 여러 분야에서도 인공지능(AI)을 활용한 사례들을 만나게 된다. 낯설게 느껴졌던 인공지능(이하 AI)이 일상에 들어오고 하루가 다르게 변화와 진화를 거듭하며 새로운 시대의 문을 열고 있다.
이러한 시대에 발맞추어 최근 들어 문화예술 관련 아카데미에서도 AI와 예술을 엮은 이슈와 AI를 활용한 다양한 강좌들을 개설하고 있다. 필자는 예술과 AI에 대한 관심이 많고, 특히 창작의 영역까지 진입하는 AI에 대한 이슈들과 관련 주제에 대해 궁금한 점이 많다. 그래서, 이와 관련된 현 이슈와 정보를 얻을 수 있는 강좌를 찾던 중 해답을 얻을 수 있을 만한 정보를 찾았고 듣게 되었다.
이는, 얼마 전 11월 30일에 열렸던 ‘2024 아르떼 아카데미’에서 “디지털 기술을 활용한 문화예술교육 프로그램 개발(문학, 음악) - 행동변화를 이끄는 문화예술교육의 확장 : 디지털 헬스케어/AI 활용 가능성”을 주제로 한 집체 연수 과정이다.
4시수(14:00~18:00)로 진행되었던 연수 과정에서는 AI 프롬프트(AI Prompt)에 전반적인 이해와 생성형 AI(Generative AI)를 활용한 통합예술교육 프로그램 실습을 바탕으로 다양한 프로그램 툴을 활용하며, 이를 콘텐츠로 제작하는 등 AI 활용 및 연계한 문화예술교육 응용 방안 등을 모색해 보는 시간을 가졌다.
무엇보다 이론과 실습을 병행한 교육으로 진행되어서 활용도 측면에서 의미 있었던 교육이었다. 이번 교육을 통해 얻은 정보를 바탕으로 크게 세 가지로 나누어보려고 한다.
하나, AI 프롬프트(AI Prompt)의 전반적인 이해
둘, 생성형 AI(Generative AI)를 활용한 기존 프로그램 탐색
셋, 생성형 AI(Generative AI)를 활용한 다양한 프로그램 툴을 활용으로 콘텐츠를 제작 실습이다.
우선, 이 글에서는 하나, AI 프롬프트(AI Prompt)의 전반적인 이해 부분에 대해 적어보겠다. 여기서, AI 프롬프트(AI Prompt)란 무엇일까. 이는, 특정 작업을 수업하도록 지시하는 명령어를 뜻한다. 명령어는 사용자가 어떻게 입력하는지에 따라 원하는 정보를 도출되는지에 차이가 발생하기 때문인데 이를 효과적으로 하기 위해서는 프롬프트 엔지니어링(Prompt Engineering) 능력이 필요하다. 즉, LLM(대규모 언어 모델)으로부터 좋은 답변을 얻기 위해서 좋은 질문을 할 수 있는 능력을 의미한다.
연수에서는 프롬프트(Prompt)의 중요성을 인식하기 위해서 실습으로 A, B를 나누어 활동을 진행했다. 즉, A는 강사님이 보여주시는 그림을 최대한 자세히 한 문장으로 설명하고, B는 A의 설명대로 놓인 A4용지에 그대로 그리는 것이었다. 쉽게 말하면, A는 인간(사용자)이고 B는 인공지능(AI)을 체험해 보는 것이었다. 필자는 B를 맡아 A분의 설명을 듣고 그림을 그렸다. 한 문장으로 말씀해 주시는 설명을 듣고 그림을 그려냈는데 실제 그림과 비교해 보니 그 차이점과 공통점을 두드러지기도 했다. 다른 분들의 A, B의 발표를 들으며 설명과 그림을 비교해 보았는데 같은 그림에서도 각자 설명이 다르고, 그로 인해 나오는 그림도 비슷하면서도 같은 그림은 없었던 모습에 차이가 발견하기도 했다. 이러한 과정 속에서 프롬프트의 구체성 등이 좋아질수록 원하고자 하는 그림의 방향성에 맞는 데이터를 도출할 수 있다는 것도 알게 되었다.
이를 통해, 프롬프트 엔지니어링(Prompt Engineering)을 할 때는 5가지의 방법을 적용해서 적는 것이 더욱 효과적임을 알게 되었다.
프롬프트 엔지니어링(Prompt Engineering)
1. 명확하고, 간결하게, 구체적인 지침 주기
2. 무슨 역할로 수행하는 '페르소나'를 정의하기
(예 : 너는 한식집 요리사야. 요즘 같이 추운 영하의 날씨에 먹기 좋은 음식을 알려줘.)
3. 단계 별로 생각할 수 있도록 지시하기
4. 반복적으로 시도하기 (안 된다면 원하는 정보가 나올 때까지 물어보기!)
5. 다그치기 (예 : 이게 최선이야?)
위 설명에 대해서 프롬프트(Prompt)를 작성할 때 새롭게 알게 되었던 것은 5번 '다그치기'였다. AI는 '다그치기'를 하면 할수록 더욱 정확한 정보를 얻기 때문이다. '이게 최선이야?' 등과 같은 강한 어조로 말할 때 좀 더 구체적인 정보를 도출할 수 있다고 한다.
또한, 생성형 AI를 활용할 때는 '중심 주제를 단순화하고 세분화하기', '설정을 시각적으로 상상하며 구성하기', '핵심 요소를 시각화하기'하며 사용해야 한다. 먼저, '중심 주제를 단순화하고 세분화하기'에서는 대상을 정의한 후에 디테일을 쌓아 올리는 것인데 단순히 "숲 속 풍경"보다는 "햇살이 스며드는 울창한 숲 속, 개울과 야생화가 있는 풍경"과 같이 조금 더 구체적으로 적을수록 좋다는 것이다.
또한, '설정을 시각적으로 상상하며 구성하기'이다. 시간대라든지, 감정 상태라든지, 주위 환경 등 좀 더 머릿속에 시각적으로 떠오르는 것을 상상해서 이를 프롬프트에도 옮겨 적어야 한다. 앞서 언급했던 것과 같이 '구체적'으로 적어보는 것이다.
그리고, '핵심 요소를 시각화하기'가 있다. 카테고리를 구분해서 핵심요소를 결정하고 지정하는 방법이다. 이를테면, 주제, 스타일, 조명, 감정, 구성 등 요소를 더해서 적는다면 좋다.
즉, 주제 : 무엇을 그릴 것인가? (예 : 마법의 숲, 서울 도시의 야경, 푸른 바다)
스타일 : 어떤 방식으로 표현할까? (예 : 수채화 스타일, 아르누보 스타일, 픽셀 아트, 리얼리즘)
조명 : 조명이 어떻게 보일까? (예: 따스한 색채의 빛, 강렬한 햇빛, 은은한 달빛)
감정 : 어떤 느낌을 주고 싶은가? (예: 따뜻하고 희망적인, 고독하고 차분한, 불현듯 발견해 놀란)
구성 : 주요 구도나 배경은? (예: 중앙의 울창하게 곧게 선 나무, 멀리 보이는 산, 가까운 초점)
등에 요소에 관해 질문하는 것이다.
생성형 AI 활용 방법
1. 중심 주제를 단순화하고 세분화하기 : 디테일하게 구체적으로
(예 : 숲 속 풍경 -> 햇살이 스며드는 울창한 숲 속, 개울과 야생화가 있는 풍경)
2. 설정을 시각적으로 상상하며 구성하기 : 시간대, 감정 상태, 주위 환경 등
3. 핵심 요소를 시각화하기 : 주제, 스타일, 조명, 감정, 구성 등
- 주제 : 무엇을 그릴 것인가? (예 : 마법의 숲, 서울 도시의 야경, 푸른 바다)
- 스타일 : 어떤 방식으로 표현할까? (예 : 수채화 스타일, 아르누보 스타일, 픽셀 아트, 리얼리즘)
- 조명 : 조명이 어떻게 보일까? (예: 따스한 색채의 빛, 강렬한 햇빛, 은은한 달빛)
- 감정 : 어떤 느낌을 주고 싶은가? (예: 따뜻하고 희망적인, 고독하고 차분한, 불현듯 발견해 놀란)
- 구성 : 주요 구도나 배경은? (예: 중앙의 울창하게 곧게 선 나무, 멀리 보이는 산, 가까운 초점)
반면, 프롬프트(Prompt)를 사용하다 보면 입력해도 원하는 자료를 얻지 못할 때가 많다. 대체로 사용하면 많이 발생하는 실수로 인해 주의해야 할 점으로는 '추상적인 표현을 명료화하지 못한 경우'와 '한국어(혹은 언어)가 가진 모호한 표현으로 인한 경우'와 'AI Prompt는 영어 기반이라는 점'이다.
즉, '추상적인 표현을 명료화하지 못한 경우'로 예를 들면, '슬픈 표정'이 있다. 단순히 '슬픈 표정'이라고 하면, 우는 표정인지, 울상인 표정인지, 찡그린 표현인지, 시무룩한 표정 인지 등 유추해 내기가 힘들다는 것이다. 추상적이기 때문에 슬픈 표정이라고 하면 감정의 원인이나 신체적 표현, 분위기나 상황을 넣어서 설명해 주면 좋다. 이를테면, 눈썹이 처져 있고, 입꼬리가 아래로 내려간 표정이라든지, 소중한 것을 잃어버린 뒤의 허탈한 표정이라든지, 고개를 숙이고 손으로 얼굴을 감싸는 모습이라든지 등으로 말하는 것이다.
만약, 어떻게 명료화할지 모르겠다면 직접 ChatGPT에게 물어보는 방법도 있다!
실제로 물어보면, 모호한 표현은 "슬픈 표정을 알려줘."이며, 명료한 표현은 "누군가에게 배신당한 뒤 느껴지는 슬픔과 분노가 섞인 표정을 묘사해 줘."라고 표현하면 더 구체적이고 풍부한 답변을 받을 가능성이 높아진다고 말해준다.
또한, '한국어(혹은 언어)가 가진 모호한 표현으로 인한 경우'도 있는데 이를테면, 한이 서린 얼굴 또는 따뜻하면서도 차가운 이미지 등 한국 문학에서는 장점이 될 수 있으나 프롬프트에 입력할 시에는 원하는 표현이 나오지 못할 가능성이 높다는 것이다. 미국에서 만들어진 Open AI이기 때문에 문화적 차이나 표현은 모호함을 줄 수 있다.
이어, 'AI Prompt는 영어 기반이라는 점'이다. 이는, 앞선 내용과 연결된다. 영어를 기반으로 두어 우리가 한국어로 입력하면 AI가 영어로 번역한 후 질문 내용을 AI에게 명령하는 것이기 때문에 한국어로 원하는 데이터를 표현하고자 할 때 정확한 명령이 입력되지 않을 수도 있다는 점이 있다.
AI 프롬프트(AI Prompt) 사용 시 주의해야 할 점
1. 추상적인 표현을 명료화하지 못한 경우
2. 한국어(혹은 언어)가 가진 모호한 표현으로 인한 경우
3. AI Prompt는 영어 기반이라는 점
을 유의해서 작성해야 한다.
한편, 여기서 잠깐! 앞서 AI를 언급하면서 LLM라는 단어가 있었다. LLM은 무엇일까. AI가 인공지능이라는 것은 알겠지만 전혀 보지 못했던 단어와 어디서 본 듯하나 정확한 개념이 잡히지 않는 단어에 생소하고 어렵게까지 느껴진다. 잠시, 개념 정리가 필요할 것 같다.
전반적인 이해를 돕기 위한 도식은 다음과 같다.
AI
﹂ 생성형 AI
﹂ LLM(대규모 언어 모델)
﹂ GPT(LLM의 특정 구현체)이다.
(ChatGPT를 활용하여 작성하였다.)
우선, ‘인공지능’이다. 즉, ‘AI(Artificial Intelligence)’라고도 하는데 인간처럼 학습, 추론, 문제 해결, 창작 등의 작업을 수행할 수 있는 기술이다. 이 하위 영역에는 머신러닝, 딥러닝, 자연어 처리, 컴퓨터 비전 등이 있다.
그리고, AI의 발전으로 진화된 '생성형 AI(Generative AI)'가 있다. 말 그대로 AI가 무언가를 ‘생성’한다는 것이다. 즉, 스스로 새로운 콘텐츠 이를테면 텍스트, 이미지, 음악 등의 다양한 콘텐츠를 만들어내는 AI 모델로 학습된 대량의 정보를 기반으로 필요한 자료를 만들어낸다. 즉, LLM(Large Language Model/대형언어모델)은 주어진 프롬프트(Prompt)에 대해 인간하고 유사한 응답을 만들어내기 위해 방대한 데이터 학습을 기반으로 언어 관련 인공지능 모델로 텍스트 위주의 생성, 번역, 학습, 감성 분석, 요약 및 질문-응답 등의 역할을 한다. 생성형 AI의 하위개념으로 ChatGPT와 Geminal을 예로 들 수 있다.
한편, GPT(Generative Pre-training Transformer)(LLM의 특정 구현체)는 OPEN AI에서 개발한 LLM의 일종이다. LLM의 하위개념이라고도 본다. 예를 들면, GPT-3.5, GPT-4o이다. LLM과 GPT에 대해서 다룰 내용은 상당하지만 이번 글에서는 ‘생성형 AI’에 집중해서 적어보려 한다. 추가적인 부분은 또 다른 글을 통해 이어가 보겠다.
다시 돌아와서, 생성형 AI 그러니까 새로운 콘텐츠를 생성하는 AI모델을 두루 일컫는 말이다. 연수에서는 이를 활용한 ‘생성형 AI 플랫폼(Generative AI Platforms)’을 다루어보았고, 분야는 ‘문학, 미술, 음악’이었다.
‘문학’에서는 ChatGPT와 Rytr를 활용하여 시나 가사 등 스토리를, Lewis로는 소설을 창작해 보는 시간을 가졌다. 또한, ‘미술’에서는 Adobe Firefly를 활용해 원하는 이미지를 활용해 동화책 속 그림을 만들어보았다. ‘음악’에서는 Suno와 Musia One을 활용해 가사를 넣고, 원하는 음악 장르와 스타일, 템포 등 프롬프트에 적어 음악을 만들어보았다. 내용 길이 상으로 다음 편에서 계속 이어갑니다!
생성형 AI 플랫폼과 관련한 웹사이트 정리
1. 문학
* Rytr - https://rytr.me/
* Lewis AI - https://lewis.keytalkai.com/en
2. 미술
* Adobe Firefly - https://www.adobe.com/kr/products/firefly.html
3. 음악
* SUNO - https://about.suno.com/
* MUSIA ONE - https://musiaone.com/signin