brunch

You can make anything
by writing

C.S.Lewis

결과물의 완성도를 높여주는 AI 프롬프트 UX

#PromptUX #Gen AI


다섯 번째 주제는 프롬프트 패턴입니다. 이번 글은 Generative(생성형) AI 서비스에서 사용하는 프롬프트 패턴의 구조, 유형, 한계, 개선 방향에 관해 이야기하고자 합니다.



한 설문조사에 따르면, 직장인 10명 중 7명은 생성형 AI를 사용한 경험이 있다고 합니다. 이는 우리가 생성형 AI에 점차 익숙해지고 있음을 의미합니다. 또한, 정답보다 질문이 중요한 시대가 도래했다는 관점도 널리 퍼지고 있습니다. 어떤 질문을 하느냐에 따라 대화의 질과 방향이 달라지는데요, 이는 생성형 AI를 사용할 때도 마찬가지입니다. 프롬프트를 통해 AI에게 원하는 바를 명확히 설명해야 기대치에 맞는 결과물을 생성할 수 있습니다.


여러분은 원하는 결과물을 얻기 위해 프롬프트를 여러 번 수정한 경험이 있으신가요? 혹은 프롬프트를 어떻게 입력해야 할 지 어려움을 겪은 적이 있으신가요? 닐슨노먼그룹의 연구에 따르면, 이는 60여 년 만에 등장한 새로운 인터랙션 방식이라고 합니다. 새로운 방식이기에 처음에는 낯설게 느껴질 수 있습니다. 어떻게 하면 원하는 결과물을 효과적으로 생성할 수 있을까요? 이를 돕기 위해 프롬프트 UX Pattern이 활용되고 있습니다. 






프롬프트 UX 패턴이란?


프롬프트는 사용자가 AI에 결과물을 생성하도록 요청하는 입력값입니다. 텍스트뿐만 아니라 이미지, 음성 등 다양한 형태로 전달될 수 있습니다. "요즘 키우기 좋은 식물 추천해 줘", "대한민국의 수도가 서울이야?"와 같은 요청이나 질문의 형태가 흔히 볼 수 있는 간단한 프롬프트의 예시입니다.


프롬프트가 무엇인지 기본적인 개념을 이해했으니, 프롬프트 구조에 대해 더 깊게 알아볼까요? 닐슨노먼그룹의 연구에서 정의한 프롬프트에 자주 사용되는 네 가지 구성 요소가 있습니다.

▲프롬프트의 구성요소 (NN/g Nielsen Norman Group)


1) Format

결과물이 어떠한 형태로 생성되어야 하는지 구체적으로 지정하는 요소로, 텍스트의 길이·말투·형식 등을 포함합니다. 예를 들어, “500자 이내의 블로그 포스팅 형식으로 작성해 줘“라고 요청할 수 있습니다.


2) Reference

동일한 대화 내에서 이전 답변을 인용하는 것과 외부 문서·소스를 인용하는 것, 크게 두 종류로 나뉩니다. Reference는 프롬프트에 필수적인 요소는 아니지만, 인용한 내용에 가까운 결과물을 생성하는 데에 도움이 됩니다.


3) Request

프롬프트에서 가장 간단하며 핵심적인 요소로, 사용자가 AI에 원하는 결과물이 무엇인지 또는 해결하고자 하는 것이 무엇인지를 명확하게 전달하는 역할입니다.


4) Framing

사용자가 해결하려는 문제나 상황에 대한 설명입니다. 이는 AI가 문제를 이해하고 적절한 결과물을 제시하는 데 필요한 맥락을 제공합니다. 예를 들어, “너는 지금부터 심리상담가야. 내가 말하는 내용에 대해 조언을 해줘“라고 요청할 수 있습니다.






프롬프트 패턴 유형


LLM 기반 생성형 AI와 이미지 생성형 AI를 사례로 살펴보겠습니다.


생성형 AI 서비스는 주로 빈 화면에 추천 질문을 제공하는 방식을 활용합니다. 이는 3편에 언급한 Product Education의 일종으로, 사용자에게 프롬프트 작성법을 알려주고 제안하는 역할을 합니다. 이미지 생성형 AI는 텍스트 프롬프트 외에도 스타일을 설정할 수 있는 옵션을 제공하는 것이 특징입니다.


1. 프롬프트를 제안하고 작성해 주는 추천 질문(Suggested Question) 

1-1. 자동 전송되는 프롬프트 방식의 추천 질문

LLM 기반 생성형 AI 서비스 ‘Chatsonic’은 추천 질문을 클릭하면 프롬프트가 자동으로 전송되어 대화가 바로 시작됩니다. 사용자는 복잡한 지시나 설정 없이 빠르게 대화를 시작할 수 있으며, 서비스를 이해하고 사용할 수 있도록 돕는 데에 중점을 두고 있습니다.      

▲ 추천 질문 클릭 시 자동 전송되는 방식의 Chatsonic



1-2. 사용자가 수정할 수 있는 프롬프트 방식의 추천 질문

이미지 생성형 AI 서비스 ‘Potato’는 추천 질문을 클릭하면 프롬프트가 텍스트 입력창에 작성됩니다. 이때 프롬프트가 바로 전송되지 않고, 사용자는 제공된 프롬프트를 수정할 수 있습니다. 이러한 UX는 자신의 요구사항에 맞게 변경할 수 있는 유연함과 개인화된 대화 경험을 제공합니다.

▲ 추천 질문 클릭 시 텍스트 입력창에 반영되는 방식의 Potato


1-2 유형이 발전된 사례로 Google의 Gemini를 살펴보겠습니다. Gemini는 추천 질문을 클릭하면 기본적인 구성 요소가 갖춰진 프롬프트가 자동으로 텍스트 입력창에 작성됩니다. 이때, 프롬프트 내의 핵심 단어나 문장이 형광펜으로 그은 것처럼 하이라이트 되어 표시됩니다. 이러한 UX는 사용자가 프롬프트를 어떻게 수정해야 결과물이 달라지는지 쉽게 파악할 수 있고, 중요한 정보를 빠르게 식별할 수 있도록 도와줍니다.

▲ 프롬프트 내의 핵심 단어 및 문장이 하이라이트로 표시되는 Google의 Gemini




2. 이미지/영상 생성형 AI의 프롬프트 스타일 설정 옵션

주로 텍스트로만 프롬프트를 작성하는 LLM 기반 생성형 AI와 달리, 이미지/영상 생성형 AI는 텍스트 외에도 결과물의 스타일을 설정할 수 있는 프롬프트 옵션을 제공합니다. 사용자는 Slider와 Select UI 등을 통해 이미지의 비율·스타일·화질·생성 개수 등을 설정할 수 있습니다. 또한, 생성할 이미지의 기반이 될 초기 이미지를 설정하여 비슷한 스타일의 이미지를 쉽고 빠르게 생성할 수도 있습니다.

▲ Slider UI로 카메라 모션을 설정하는 Runway(왼쪽), Select UI로 이미지 스타일을 설정하는 DreamStudio by stability.ai(오른쪽)


LLM 기반 생성형 AI에 비해 이미지 생성형 AI가 프롬프트 설정 옵션이 세분화된 이유는 무엇일까요? 이미지는 시각적인 요소이다 보니, 텍스트에 비해 AI가 해석해야 할 범위가 넓은 영역입니다. 사용자가 기대하는 완성도의 기준 역시 더욱 구체적일 겁니다. 또한, 이미지는 텍스트와 달리 생성된 결과물을 사용자가 직접 수정하기 어렵다는 특징도 있습니다.


따라서, 이미지 생성 과정 초기 단계에 사용자의 기본적인 요구사항을 가능한 구체적으로 파악하는 것이 중요합니다. 이는 사용자가 원하는 결과물을 얻기 위한 최소한의 가이드라인이며, 맞춤형 이미지 결과물을 얻는 데 중요한 역할을 합니다.






프롬프트 패턴의 한계


1-1. 사용자의 프롬프트에 의존하는 결과물

생성형 AI 서비스는 프롬프트에 따라 결과물의 완성도가 천차만별로 달라집니다. 프롬프트가 명확하지 않을 경우, AI는 사용자의 의도를 정확하게 이해하지 못하면 기대와 다른 결과물을 생성할 수 있습니다. 원하는 결과물을 얻기 위해서 요구사항을 명확히 전달하는 것도 중요하지만, 결과물을 조정하는 과정에서 사용자가 훨씬 주도적어야 합니다. 일례로, 사용자들은 프롬프트를 반복적으로 수정하며 더 나은 결과물을 얻기 위한 시도를 하곤 합니다. 


그러나 단순히 시도 횟수를 늘리는 것이 결과물의 완성도를 보장하는 것은 아닙니다. 프롬프트를 잘 작성하기 위해선 사용자가 자신의 기대를 텍스트로 명확히 전달하고, AI가 작업 수행 중 발생할 수 있는 예상치 못한 상황들을 미리 고려해야 합니다. 이 과정은 생각보다 복잡하고 많은 시간이 필요할 수 있습니다.


프롬프트를 잘 작성하는 방법에 대한 수많은 아티클과 영상도 존재합니다. 이는 사용자가 별도로 추가적인 학습을 하여 결과물의 완성도를 향상시키려는 경향이 있음을 보여줍니다. 또한, 결과물의 완성도가 사용자에 일부분 의존하고 있다는 것을 의미하기도 합니다.




1-2. 프롬프트 수정 과정에서 발생하는 Apple Picking

사용자들은 더 높은 완성도를 위해 프롬프트를 반복적으로 수정하여 결과물을 재생성합니다. 닐슨노먼그룹의 연구에 따르면, 이 과정에서 ‘Apple Picking'현상이 발생할 수 있습니다. 사용자는 이전 답변의 일부를 설명하거나 인용하기 위해 텍스트를 입력하거나 복사하여 붙여 넣는 경우가 많습니다.


이를 'Apple Picking’이라 하며, 사용자가 원하는 결과를 얻기 위해 이전에 생성된 AI의 답변을 인용할 때 주로 발생합니다. 이 과정을 반복하면서 많은 양의 텍스트가 쌓이고, 반복적으로 스크롤 해야 하는 불편함이 생깁니다. 행동의 빈도를 고려할 때 'Apple Picking’은 사용자에게 많은 노력을 요구합니다.

결과물을 생성할 때 이전 답변을 인용하는 과정에서 발생하는 ‘Apple Picking’ ▲ NN/g Nielsen Norman Group



1-3. 글의 종류에 따른 프롬프트 옵션의 필요성 

프롬프트 패턴 유형에서 언급했듯이, ChatGPT·Gemini와 같은 LLM 기반 생성형 AI는 이미지 생성형 AI에 비해 프롬프트 설정 옵션이 간단한 편입니다. 그러나 번역·보도자료 작성·SNS 캠페인 등 텍스트도 다양한 종류를 가지고 있으며, 목적에 따라 요구사항도 달라집니다. 하지만 사용자가 직접 프롬프트를 입력하여 요구사항을 전달하는 경우가 많고, 이 과정은 사용자에게 추가적인 노력과 번거로움을 초래할 수 있습니다.






프롬프트 패턴의 개선방향


2-1. 누구나 높은 완성도의 결과물을 생성할 수 있는 프레임워크

MIT의 연구진이 개발한 ‘GATE(Generative Active Task Elicitation)’ 프레임워크는 프롬프트 작성 경험이 부족한 사용자도 높은 완성도의 결과물을 생성할 수 있게 도와줍니다. GATE는 사용자와 AI 사이의 대화를 통해 요구사항을 이해한 후, 이를 기반으로 프롬프트를 생성하여 결과물을 도출하는 프레임워크입니다.


실험 방식을 아래 그림과 함께 살펴보겠습니다. 사용자는 정리되지 않은 여러 생각과 선호도(1)를 가지고 있습니다. 사용자의 생각을 AI와 대화하며 학습(2)시키고 프롬프트를 생성하여 도출된 결과물이 사용자가 실제 내린 결정과 얼마나 일치하는지 평가하는 방식(3)으로 진행되었습니다.

▲ 사용자의 의도와 일치하는 테스트 결과 (논문 중 이미지 일부 재구성)

(2)단계에서 다른 방식의 학습 모델과 비교하여 실험하였으며, 세 가지 학습 모델 중 GENERATIVE ELICITATION 방식으로 도출된 결과물이 사용자의 의도와 가장 적합한 것으로 나타났습니다. 또한, 3개 영역에서 테스트 한 결과, GATE 프레임워크가 다른 학습 모델보다 유의미한 결과를 보였습니다.


아직은 일부 영역에서만 효과가 검증된 프레임워크지만, 이처럼 프롬프트 작성 경험이 부족한 사용자도 높은 완성도의 결과물을 얻을 수 있도록 지속적인 개선과 연구가 필요합니다.



2-2. 클릭만으로 이전 답변 인용이 가능한 프롬프트 방식

아직 상용화되지 않았지만, Google의 Gemini 데모 영상에서 답변을 인용하는 방식이 개선된 모습을 볼 수 있습니다. Gemini에선 이전 답변을 인용하기 위해 텍스트를 복사하고 붙여 넣을 필요가 없습니다. 대신, 사용자가 인용하고 싶은 텍스트를 선택하면 해당 내용에 대해 후속 질문을 할 수 있는 입력창이 나타납니다. 이로 인해 불필요하게 반복되는 텍스트의 양이 크게 줄어들며, 스크롤 또한 감소합니다. 사용자는 정보를 효율적으로 처리할 수 있게 되며, AI와의 상호작용도 더욱 원활해집니다.

▲ 텍스트 클릭만으로 이전 답변에 대한 후속 질문이 가능한 Google의 Gemeni(데모 영상 중 일부)



2-3. 글의 종류와 목적에 따른 프롬프트 옵션 제공

Notion AI는 스페이스바를 누르는 것만으로 다양한 텍스트 생성 옵션을 쉽고 빠르게 선택할 수 있습니다. 이 기능을 통해 사용자는 직접 텍스트를 입력하거나 수정할 필요 없이 자신의 요구사항을 효율적으로 전달할 수 있습니다. 

▲ 글의 종류와 목적에 따른 프롬프트 옵션을 제공하는 Notion

최근 LLM 기반 생성형 AI가 대중화되면서, GPT Store와 같은 플랫폼을 통해 많은 사람이 자신만의 챗봇을 제작하고 공유하고 있습니다. 커스텀 챗봇은 이미 특정 맥락이나 분야에 대한 지식을 갖추고 있어 사용자가 목적에 맞는 프롬프트를 편리하게 작성할 수 있습니다. 이를 통해 문제점 1-2(프롬프트 수정 과정에서 발생하는 Apple Picking)가 일부분 보완되고 있습니다.


그러나, 사용자가 원하는 목적에 맞는 챗봇을 선택하는 것은 시간과 고민이 필요한 행동입니다. 기본 시스템 내에서도 사용자가 쉽게 접근하고 탐색할 수 있는 옵션을 제공한다면 챗봇을 찾는 과정이 간소화되고, 효율적으로 사용할 수 있습니다.







결론

생성형 AI 서비스에서 프롬프트 UX 패턴은 사용자가 원하는 결과물의 완성도를 생성할 수 있도록 도와주는 역할을 합니다. 그러나, 프롬프트 작성은 사용자 간 이해도 차이로 인해 어려움을 겪을 수 있는 새로운 인터랙션 방식입니다.


사용자가 원하는 결과물을 얻기 위해서는 명확하고 구체적인 프롬프트 작성이 필요하며, 이 과정에서 발생할 수 있는 어려움을 최소화하는 것이 중요합니다. 아직까지는 생성된 결과물의 완성도가 사용자에게 일부 의존하는 부분이 있습니다. 이를 고려하여 프롬프트 UX 패턴을 지속적으로 개선하고, 프롬프트에 대한 이해도가 낮은 사용자도 쉽게 원하는 결과물을 생성할 수 있는 환경을 조성해 나가는 것이 중요합니다.






그렇다면, BELLA QNA는 어떤 프롬프트 UX 패턴을 제공하고 있을까요?

2024년 3월 현재, 벨라 큐나는 대화 시작 전 추천 질문을 제공하는 방식을 활용하고 있습니다. 스켈터랩스 회사와 서비스에 대해 파악할 수 있는 질문을 구성함으로써 대화를 이끌어내고 있습니다. 첫 대화 시작 뿐 아니라, 대화를 지속적으로 잘 이어나갈 수 있도록 프롬프트 UX 패턴을 개선하고 있습니다.

▲ BELLA QNA의 추천 질문(Suggested Question)





참고자료


https://www.nngroup.com/articles/ai-prompt-structure/

https://www.nngroup.com/articles/accordion-editing-apple-picking/

Eliciting Human Preferences with Language Models





스켈터랩스 블로그에서 대화형 AI에 대해 더 알아보세요.


[생성형 인공지능 UX 패턴 시리즈]


매거진의 이전글 체감 대기 시간을 줄여주는 AI Loading
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari