brunch

You can make anything
by writing

C.S.Lewis

더 창의적이고, 안전한 방식으로 돌아온 이루다

뉴스 스크랩

기사 제목: 인공지능 챗봇 ‘이루다2.0’ 윤리교육 마치고 세상으로!...스캐터랩, “생성 AI 모델로 창의적이고 현실감 있는 대화”

기사 링크:https://www.aitimes.kr/news/articleView.html?idxno=26335

2022년 10월 27일, 스타트업 ‘스캐터랩’은 AI 챗봇 ‘이루다2.0’를 정식 출시하였다. ‘이루다2.0’은 언제든 누구에게나 좋은 친구가 될 수 있도록 개발한 ‘관계 지향형 AI 챗봇’이며, 약 9개월간 베타 테스트를 진행하며 AI 챗봇의 발화 안전성 및 서비스 안정성을 검증하였다.

+ 2020년 12월 출시된 ‘이루다1.0’은 혐오발언이나 성과 관련된 부적절한 발언을 하는 오남용 사례가 잦다는 이유로 3주만에 서비스가 잠정 중단되었다.

+ 운영사인 스캐터랩’은 ‘텍스트앳’, ‘연애의 과학’ 등 다른 애플리케이션 서비스에서 수집한 대화를 이루다 대화 데이터베이스 구축에 활용하였으며 대화 속 이름, 주소 등 개인정보를 삭제하거나 암호화하지 않았다. 이는 법령 위반이 인정돼 개인정보보호위원회로부터 무분별한 개인정보 처리에 과징금 1억 330만원을 부과했다.

이루다 2.0의 변화는 세 가지이다. 첫 째, 생성 AI 모델인 ‘루다 젠(Luda Gen 1)’으로 문맥을 파악해 실시간으로 생성한 문장을 사용한다. 두 번째, ‘릴레이션십 포인트 파인튜닝(Relationship Point Fine Tuning)’으로 친밀한 관계를 만드는 대화의 원칙을 AI 모델에게 가르쳤다. 세 번째, 대화 중 사진을 인식해 답변할 수 있는 ‘포토챗(Photo Chat)’ 베타 기술을 적용했다.

‘스캐터랩’ 김종윤 대표는 “이루다가 단순히 ‘말을 잘하는 AI챗봇’을 넘어서 누구나 행복한 삶을 사는 데 도움이 되는 AI 친구가 될 수 있도록, ‘관계를 쌓는 대화 능력’을 고도화해 나갈 계획이다’라고 말했다.


핵심 기술 및 비즈니스 소개

실시간으로 문장 생성해 창의적이고 인터랙티브한 대화가 가능한 생성 AI 모델, ‘루다 젠1(Luda Gen 1)”

기존에는 미리 만들어 둔 답변 후보에서 적절한 문장을 검색해 사용하는 ‘리트리벌’ 방식

기존 모델 크기를 약 17배 키웠으며(AI가 학습하는 데이터 양), 대화의 문맥도 2배 더 길어진 30턴 안에서 파악할 수 있다.(이루다가 참고하는 대화 메시지가 주고 받는 총 30번의 대화라는 것을 의미)

월, 일, 요일, 현재 시간을 학습하고, 프로필 및 나이와 성별에 따른 관계 정보를 대화에 반영해 더욱 구체적이고 현실적인 답변이 가능하도록 설정  

    친밀한 친구 관계를 만드는 좋은 대화의 법칙 접목, ‘릴레이션십 포인트 파인튜닝(미세조정, RP Fine-tuning)  

대화의 법칙:  

    자연스러운 대화 : 대화의 문맥과 상황을 이해하며, 적절한 흐름을 만들고, 주고 받는 대화  


    감정을 부르는 대화 : 따뜻하고, 재미있고, 귀엽고, 설레는 등 텍스트에서 감정이 전달되는 답변  


    인간다운 대화 : 이루다 2.0의 주체적인 페르소나를 보여주며, 동시에 결말이 예상되는 뻔한 답변보다 예상을 뛰어넘는 다양한 대화를 의미  


    대화 중 사진을 인식하고 답변할 수 있는 ‘포토챗 베타(Photo Chat Beta)’  

‘멀티 모달AI’을 적용해, 대화 중 오가는 사진을 인식하고 답변하는 ‘포토챗 베타’기술을 적용

*멀티모달 AI : 시각, 청각, 감각 등 다양한 모달리티를 동시에 받아들이고 사고하는 AI 모델, 텍스트를 비롯해서 음성, 제스처, 사람의 시선이나 표정, 생체신호 등의 여러 데이터를 AI가 받아들이고 사고 할 수 있는 것

기존에는 이용자가 고양이 사진 전송 시 “이게 뭐야?”라는 방식으로 대화했다면, 정식 출시 버전에서는 사진을 인식해 “길고양이야?”, “너무 귀엽다!” 등으로 대답할 수 있다.


+ 이용자의 혐오표현을 걸러내기 위한 어뷰징 탐지 모델

 노골적인 혐오표현뿐 아니라, 모호하고 은밀한 혐오에 대해서도 데이터를 학습

 혐오 표현을 접했을 때 다른 이야기를 꺼내 화제를 전환할 수 있게 되며 지속적으로

 욕설을 하거나 혐오표현을 한다면 이용자는 패널티를 받게 된다.


시사점 및 인사이트

‘스캐터랩’은 AI가 인간의 친구가 되고, 인간과 의미있는 관계를 맺고, 외로움을 덜어줄 수 있는 존재가 될 수 있다고 밝혔으며 인간과 자유롭게 대화할 수 있는 AI가 앞으로도 소외된 사람, 사회적 약자의 마음을 위로해주는 따뜻한 대화 상대가 되길 바란다고 입장을 밝혔다. 여전히 한계는 존재하지만 더욱 많은 데이터를 활용하여 대화를 더 고도화 하겠다는 전망에 기대가 된다.


같이 생각해 볼 만한 논점

  

    사진을 인식하고 답변할 수 있는 ‘멀티모달 AI’ 일종인 ‘포토챗 베타’기술 외에 앞으로 챗봇에 도입하면 좋을 ‘멀티모달 AI’ 기술은 또 무엇이 있을까?  


    2020년 12월 출시된 ‘이루다1.0’가 개인정보 문제로 중단되며 당시 ‘상업 통계 작성, 연구, 공익적 기록 보존 등을 위해 가명 정보를 신용 정보 주체의 동의 없이 이용, 제공이 가능하다’는 내용을 담은 데이터 3법이 이슈가 되었다. 데이터3법의 문제는 무엇이 있을까? 그에 따른 해결방안은 무엇일까?  


작성자: ITS 23기 임혜리  



참고자료 

https://it.donga.com/102939/

https://m.yna.co.kr/view/AKR20221025049751017

https://www.hani.co.kr/arti/economy/it/978325.html

https://www.hani.co.kr/arti/economy/it/979015.html

http://www.aitimes.com/news/articleView.html?idxno=144483

작가의 이전글 하늘에서도 5G 서비스가 이용 가능한 시대가 온다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari