챗봇인터페이스가 LLM프로덕트의 미래가 아닌 이유 번역
최근 LLM모델을 활용한 프로덕트를 만들며 어떤 인터페이스가 가장 적합하고, 지배적 디자인이 될까에 대한 고민을 많이 하고 있다.
지배적 디자인은 시장에서 지배적으로 쓰이는 디자인을 의미하며, 경쟁업체와 혁신가가 시장에서 중요한 위치를 차지하려면 반드시 따라야 하는 디자인을 의미한다.
만약 어떤 도메인의 프로덕트에서 많은 사용자가 사용하고, 익숙하게 느끼는 디자인이어서, 경쟁사에서도 따라 할 수밖에 없는 디자인이라고 할 수 있다 예를 들면, 커머스는 아마존의 원클릭 구매, 소셜미디어분야에서는 페이스북의 좋아요 등이 그중에 하나라고 할 수 있다.
지배적 디자인의 출현은 시장이 성숙하고 경쟁자들이 출현하면서 공고해진다.
아직까지 LLM모델을 활용한 프로덕트는 대표적으로 ChatGPT, Bard 외에 특별한 우위를 점하는 프로덕트가 많이 나오지 않고 있다.
Phind, Tome, 한국에서는 뤼튼 등 다양한 서비스가 나오고 시장의 선택을 받으면서 결정될 것이며,
LLM모델을 활용한 프로덕트도 "콘텐츠 생산을 돕는 서비스". "어시스턴트 서비스" 등 방향성에 따라 지배적 디자인이 달라질 수 있다.
wattenberger의 "Why Chatbots Are Not the Future"에서는 필자가 만들고 있는 개발자들의 문서작성을 도와주는 서비스에서 "챗봇"(대화형 인터페이스)를 선택하지 않은 이유에 대해 기술하고 있다.
ChatGPT라는 지혜로운 신에게 질문을 하러 산에 올라가면, 그의 무표정한 얼굴을 마주하게 됩니다. chatGPT는 무엇을 알고 있을까요? 어떻게 질문해야 할까요? 그리고 GPT가 대답할 때는 끝없이 자신만만합니다. 실제로 제 질문을 이해하고 있는지, 이 정보가 어디에서 왔는지 알 수 없습니다.
좋은 도구는 어떻게 사용해야 하는지 명확하게 알려줍니다. 그리고 더 중요한 것은 어떻게 사용하면 안 되는지 명확하게 알려줍니다.
일반적인 채팅 인터페이스를 보는 것과 비교해 보세요. 텍스트 상자에 문자를 입력해야 한다는 단서만 있을 뿐입니다. 인터페이스는 Google 검색 상자, 로그인 양식, 신용카드 입력란과 동일하게 보입니다.
시간이 지남에 따라 어떤 프롬프트가 잘 작동하고 어떤 프롬프트가 작동하지 않는지 학습할 수 있지만, 어떤 프롬프트가 작동하는지 학습해야 하는 부담은 여전히 모든 사용자에게 있습니다.
생각해 보면 프롬프트에 입력하는 모든 내용은 맥락의 일부입니다. ChatGPT 프롬프트의 간단한 예를 살펴봅시다:
Prompt 예시)
I want you to act as a dream interpreter. (당신은 어떤 역할인가요?)
I will give you description of my dreams, and you will provide interpretations based on the symbols and themes presnt in the dream. (어떤 대답을 하지 해야 하까ㅛ)
Do not provide personal opinions or assimptions about the dreamer. (당신이 어떤 대답을 하지 말아야 할까요?)
Provde only factual interpretations based on the information given. (내가 어떤 정보를 얻길 원하나요?)
My first dream is about being chase by a spider. (어떻게 시작해 볼까요?)
어떻게 하면 사용자가 이 모든 콘텍스트를 더 쉽게 제공할 수 있을까요?
저는 사용자가 더 나은 글쓰기를 할 수 있도록 하는 데 초점을 맞춘 AI 글쓰기 인터페이스를 연구하고 있습니다.
모든 사용자의 글쓰기 목표가 같은 것은 아닙니다! 글의 대상이나 어조가 동일한 것은 아닙니다. 응답을 개인화하기 위해 사용 사례를 지정할 수 있는 몇 가지 컨트롤을 추가했습니다: 어떤 유형의 글인지, 작성자는 누구인지, 어떤 느낌이어야 하는지, 영감을 받은 사람은 누구인지 등 몇 가지 컨트롤을 추가했습니다.
채팅 인터페이스를 고수하기로 결정했더라도 사용자가 더 쉽게 작업할 수 있도록 만들 수 있습니다. 사용자의 질문과 가장 관련성이 높은 정보를 찾는 것과 그 정보를 사용하여 답변을 합성하는 것, 두 가지로 나누어 생각할 수 있습니다. 답변을 합성할 때 특정 질문자에 맞게 답변을 맞춤화할 수 있습니다. 이 아이디어에 대한 대략적인 첫 번째 탐색으로 몇 가지 슬라이더를 추가했습니다.
신입 개발자는 숙련된 개발자나 라이브러리를 처음 접하는 사람과 같은 답변을 원하지 않습니다. Copilot for Docs의 개발자로서 이 도구가 가장 잘하는 것이 무엇인지, 어떤 종류의 정보가 가장 유용한 응답을 이끌어내는지 잘 알고 있습니다. 사용자가 각 질문에 대해 일일이 검색하도록 하는 대신 가능한 한 많은 정보를 인터페이스에 담는 데 시간을 할애합니다.
ChatGPT에게 글쓰기 개선을 도와달라고 요청한 후, 첫 응답에서 더 개선된 버전을 위해 "더 좋게 만들어줘"라고 지시하며 개선된 답변을 합니다.
하지만, 문서를 생산하는 사람들에게 어떤 부분이 수정되었고, 추가되었고, 삭제되었는지 이전 버전과 비교하기 어려워 취사선택을 하기 어렵습니다.
화가가 작업을 할 때는 가까이서 캔버스에 물감을 칠하는 것과 한 발짝 물러서서 평가하고 계획을 세우는 두 가지 작업이 있습니다.
좋은 도구는 사용자가 구현과 평가 사이를 언제 전환할지 선택할 수 있게 해 줍니다. 챗봇으로 작업할 때 이 두 가지 모드를 자주 전환해야 합니다. 질문(구현)을 한 다음 응답(평가)을 읽습니다. 응답을 읽기 위해 몇 초마다 멈추면 '흐름' 상태가 유지되지 않습니다.
AI가 대신 글을 써줄 수 있는데 왜 굳이 글을 써야 할까요? AI가 코드를 작성할 수 있는데 왜 생각을 해야 할까요? 작업에는 사람의 입력이 얼마나 필요한지에 대한 스펙트럼이 있습니다:
부분적으로만 자동화할 수 있는 경우라면, 인터페이스가 매우 중요합니다. 맹목적인 효율성 향상 대신 인간성을 포용해야 합니다. 그러기 위해서는 사람이 평가할 콘텐츠를 더 많이 생성하는 것보다 새로운 AI 기술을 더 능숙하게 활용하는 것이 중요합니다. 진정한 게임 체인저는 단순한 콘텐츠 생성이 아니라 생각을 명확하게 하는 데 도움이 되는 제안을 제공하는 도구라고 생각합니다.
저자가 챗봇이 아닌 다른 형태로 제품을 만든 이유, 챗봇이 미래가 아닌 이유로 아래를 꼽습니다.
Affordance (행동유도성)이 부족함. 사용자 입장에서 제품에 대한 기대치를 맞추기 어려워 사용성에 문제가 발생함. 이 서비스가 잘할 수 있는 것을 경험하기 어려움
프롬프트(질문)의 맥락의 묶음인데, 어떤 맥락에서 필요한 질문들을 잘하기 어려우며, 매번 텍스트로 이 맥락을 생각하며 질문하는 것이 매우 귀찮음.
콘텐츠작성(생성)을 도와주는 프로덕트에서는 콘텐츠 하나를 완성하기까지 추가 작성, 수정 등의 핑퐁이 필요한데 > 이는 챗봇 인터페이스와는 맞지 않음 (어떤 영역을 추가했고 어떤 걸 바꿨는지 알기 어려움)
콘텐츠 작성 툴로서, 100% AI에 의존하게 되는 상황을 방지하기 어려움 (이 작업에 사람의 입력이 얼마나 필요한지 조절하기 어려움)
LLM들 모델을 활용한 프로덕트가 어떤 가치를 주려고 하는지에 따라 적합한 인터페이스는 다를 수 있다.
콘텐츠 생성을 돕는 툴에서 사용자가 얻어야 하는 것은 눈에 보이는 결과물 하나를 완성하는 것이기에 대화형(챗봇)보다는 생산물이 강조되고 그 작성을 도와주는 과정을 분리할 필요가 있다.
하지만, 생산물이 글/이미지와 같이 눈에 보이는 것이 아닌, 어떤 정보를 보고 어떤 의사결정을 하는 것이 프로덕트를 사용하는 최종 결과물인 경우에는 대화형이 매우 적합하다고 생각한다.
이는, 어떤 전문가나 친구, 내가 어떤 의사결정을 하기 위해 조언을 구하는 것과 동일한 행동방식이다.
의사결정에 필요한 ‘이미 존재하는 방대한 정보 기반으로 필요한걸 잘 찾은 콘텐츠를 전달’ 해주는 서비스라면, 챗봇인터페이스가 적합하며, 요약된 정보를 보고 더 알고 싶으면 더 많은 정보나 원문을 탐색하는 경험에 대화형이 적합하다.
의사결정을 돕는 정보를 제공하는 서비스라면, 정보가 필요한 순간에 능동적으로 알려줄 수 있어야 하며, 이때, 메시지로 정보를 전달한다면 배너 UI나 팝업보다 수용도가 훨씬 높을 수 있다.
LLM모델을 활용한 프로덕트의 지배적 디자인이 어떤 기준으로 나눠져 다양하게 나타날지, 혹은 통합될지는 모르겠지만, 현장에서 일하면서 새로운 지배적 디자인의 탄생을 목격할 수 있을 거라는 기대감에 흥분된다. :)