brunch

You can make anything
by writing

C.S.Lewis

by 박영민 Jun 07. 2024

D-ID를 활용하여 음성대화가 가능한 알바봇 만들기

쉽고, 빠르게 샘플 챗봇 만드는 방법

이번 포스팅은 가상 캐릭터 생성형 AI인 D-ID를 활용해서 음성대화가 가능한 알바봇을 만드는 방법에 대해 설명 드리고자 합니다. 

우선 본 포스팅에서는 빠르게 이해하실 수 있게 방법적인 측면에서 간략하게 설명 드리고자 하며 좀 더 깊이 있는? 챗봇을 생성하는 방법에 대해서는 이 후 포스팅을 통해 하나씩 추가해 나가도록 하겠습니다. 



우선 D-DI 채널에 들어가 회원가입 후 로그인 하신다면 왼쪽 메뉴의 'Agents' 메뉴를 클릭 합니다. 


D-ID

*이미지 출처 : https://www.d-id.com



해당 메뉴에 들어가시면 'Creat agent' 버튼을 보실 수가 있습니다. 클릭 합니다.

*이미지 출처 : 저자 작업 문서




1. Apperance 세팅 (1단계)


클릭 하시게 되면 먼저 가상 캐릭터를 선택하는 화면이 나옵니다. D-ID에서 기본적으로 제시하는 캐릭터를 선택해도 되고, 아님 직접 생성한 캐릭터 이미지를 업로드 하셔도 됩니다. (정면으로 얼굴이 나온 이미지로)

*이미지 출처 : 저자 작업 문서



저는 맥도널드 알바봇을 만들 보고자 미드저니에서 별도로 캐릭터 이미지를 생성했습니다.

*이미지 출처 : 저자 생성 이미지 (미드저니)



참고로 해당 이미지의 미드저니 프롬프트 공유 드립니다. 

cinematic, Portrait photography, McDonald's store employee, female, Korean, face focus, Hopeful,Afternoon,Canon EOS 5D Mark IV --style raw --s 750 --v 6.0 --ar 16:9


이미지 생성 후 D-ID 포멧에 맞게 이미지를 정사각형으로 잘라 업로드 하시면 됩니다.


*아니면 상단의 미드저니 프롬프트에서 --ar 16:9를 삭제하시고 생성하시면 미드저니 기본 생성 형태인 1:1 비율의 이미지를 얻으실 수 있습니다. 허나 이럴 시 얼굴이 크게 나올 수 있으나 미드저니에서 Zoom out을 통해 조정할 수는 있습니다. 둘 중 편하신 방법으로 선택하셔서 생성하시면 되겠습니다. (두 가지 방법으로 다 해보시면서 비교해 보시는 것도 도움이 되실 것입니다.)  





2. Agent details 세팅 (2단계)


이미지를 업로드 하신 후 다음으로 넘어가시면 챗봇(Agent)에 대한 기본 세팅 화면이 나옵니다.  

챗봇(Agent) 이름 설정

음성 언어 설정 (Language, Voice)

Agent Instructions


*이미지 출처 : 저자 작업 문서



Agent Name은 생각하시는 대로 작성.

Language는 어느 나라 언어로 음성을 제공할 것인가에 대한 선택이며, Voice는 말 그대로 목소리를 선택하는 것입니다.

D-ID에서 기본적으로 제공하는 보이스도 있으나, 다른 곳에서 생성한 보이스(본인 또는 특정인 등)를 업로드해 적용 할 수도 있습니다. (Imported voices) 


참고로 보이스를 만들어내는 대표적인 생성형 AI인 ElevenLabs가 있습니다. 가상 캐릭터 생성 시 ElevenLabs(일레븐랩스)와 D-ID 두 개를 조합해 많이들 사용하곤 하는데요, 일레븐랩스의 경우 언어별로 다양하게 제공되는 보이스와 본인의 보이스를 비롯 생성하고자 하는 보이스를 만들어 낼 수도 있습니다. 여기서 보이스를 만들어 낸 뒤 MP3로 다운 받아 D-ID에 업로드 하셔도 됩니다.


*일레븐랩스는 생성하고자 하는 내용 입력 후 보이스 선택하면 바로 음성 파일로 생성되는, 사용법이 쉽기에 따로 설명 드리지는 않겠습니다. 그럼에도 혹 궁금하신 점 있으시면 본 포스팅에 댓글 남겨주시면 답변 드리도록 하겠습니다.



ElevenLabs

*이미지 출처 : https://elevenlabs.io


 Agent Instructions는 쉽게 말하 챗봇(Agent)에게 가이드를 설정하는 것입니다. (텍스트로 내용 입력)

저는 테스트를 위해 간단하게 다음과 같이 설정하였습니다. 


•한국말로 질문과 대답을 해주고, 누군가 영어로 물어보면 영어로 대답해 줘.

•언제나 친절하고 상냥한 말투로 대답해 줘.

•잘 모르는 것이 있으면 “ 다시 한번 요청해 주시겠어요?”라고 물어봐 줘.

•맨 마지막엔 “ 제가 더 도와드릴 일이 있을까요?” 라고 물어봐 줘.


*이미지 출처 : 저자 작업 문서




3. Knowledge source 세팅 (3단계)


기본 가이드(Instructions)까지 설정이 되셨으면 이번에는 챗봇이 활용할 지식(소스)을 업로드 하는 단계 입니다. 사용자가 질문 및 요청 시 챗봇이 업로드된 정보를 활용하여 답변을 주게 됩니다. 

저는 맥도널드 알바봇으로 설정하였기에 테스트 차원에서 간단하게 맥도널드 메뉴 일부를 작성해 업로드 했습니다.

* 참고 되시라 작성한 맥도널드 메뉴 파일 첨부합니다.

*이미지 출처 : 저자 작업 문서



참고로 업로드 시 다음의 옵션을 선택할 수 있습니다.

• Grounded : 오직 업로드한 지식만 활용하여 답변

• Hybrid : 업로드한 지식과 일반적인 지식을 같이 섞어서 답변

• Ungrounded : 업로드한 지식을 활용하지 않고 답변


이는 챗봇 목적에 맞게 선택하신 후 지식파일을 업로드 하시면 되겠습니다. 



4. Chat settings (4단계)


마지막 단계로 챗봇 시작 시 웰컴 메시지와 기본 질문을 세팅하는 단계 입니다.

저는 다음과 같이 설정했습니다. 


Welcome message 

안녕하세요 저는 선희 입니다. 무엇을 도와 드릴까요? (알바봇 이름을 임의로 '선희'로 설정)


Starter questions 

어떤 메뉴로 주문하시겠어요?

혹시 추가로 필요한 것은 없으세요?

세트 메뉴는 어떠세요?

*이미지 출처 : 저자 작업 문서



질문을 세팅하신 후 'Create agent'를 클릭 하시면 가상 캐릭터 챗봇이 생성 됩니다. 

*이미지 출처 : 저자 작업 문서



이렇게 4단계를 통해 쉽고 빠르게 간단한 알바봇을 생성하실 수 있습니다. 


아래 링크를 통해 제가 생성해 놓은 챗봇을 확인 및 테스트 해 보실 수 있으며컴퓨터의 마이크를 켜신 후 채팅 창 우측 하단에 마이크 버튼을 눌러 음성으로 얘기하면 가상 캐릭터가 직접 말하는 액션으로 답변을 주게 됩니다. (채팅 창에 텍스트도 노출)

ex.

R : "세트 메뉴를 추천해줘" 

A : "세트 메뉴로는 1995버거 세트가 맛있는데 어떠세요?" 

참고로 아직 D-ID Agent가 Beta 버전이기도 하여 다소 오류도 있으며, 더불어 활용 지식(업로드한 지식 내용)을 얼마나 정교하게 설정했으냐에 따라 챗봇의 대응이 달라질 수 있겠습니다만, 해당 기술도 빠르게 정교화 될 것으로 방법에 대해 인지하고 있다가 이 후 업무에 활용하셔도 도움이 되실 것입니다.



링크  - 맥도널드 음성 알바봇 




                    더 많은 이야기는 링크를 클릭하시면 보실 수 있습니다. supermarketing.io



#음성챗봇 #음성알바챗봇 #생성형AI챗봇 #D-ID #ElevenLabs

작가의 이전글 대화형 생성형 AI 비교
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari