[후기] 텍스트 스타일을 바꾸는 딥러닝 기술

by 사만다


안녕하세요, 카카오엔터프라이즈의 사만다입니다.


오늘은 INLG 2020에 어셉된 논문을 하나 소개하고자 합니다. 논문 제목은 "Stable Style Transformer: Delete and Generate Approach with Encoder-Decoder for Text Style Transfer"로, 문장의 스타일을 효과적으로 변환하는 모델 SST를 새롭게 제안했습니다.


아직 많은 사용자는 챗봇에 '사람 수준의 대화까지는 바라지도 않으니 질문에 적절한 답이라도 해라' 정도만 기대하고 있습니다. 하지만 과중한 업무에 치이는 상담사의 완벽한 파트너가 되려면 공감적 대화 능력도 반드시 갖춰야 할 날이 올 거로 보입니다.


이런 감정 교감형 챗봇을 만드는 첫걸음은 바로 같은 질문이더라도 맥락과 상황, 또는 대화 대상자에 따라 다른 반응을 보이도록 설계하는 데 있습니다. 하지만 현재 많은 챗봇은 특정 문장에 항상 같은 패턴의 반응을 보이죠. 이에 많은 곳에서는 챗봇의 답변 내용은 그대로 유지하면서도 사용자의 나이나 인종, 성격 등 다양한 요소로 조합된 그룹을 대표하는 스타일의 문장을 생성하는 기술을 만드는 데 힘쓰고 있습니다. 카카오엔터프라이즈 AI기술실 또한 이와 관련한 주제로 연구를 하게 된 배경입니다.


카카오엔터프라이즈는 입력 문장에서 '스타일' 토큰을 명시적으로 삭제하고, '내용 토큰과 타깃 스타일 속성값만을 가지고 문장 벡터를 생성하는 접근 방식에서 영감을 얻었습니다. 카카오엔터프라이즈가 고안한 SST 모델 또한 1)문장에서 ‘스타일' 토큰을 삭제한 뒤, 2)’콘텐츠’ 토큰만을 가지고 입력 문장과는 반대되는 스타일 속성값을 가진 문장을 생성합니다. 다만 기존과는 다른 방식으로 각 모듈을 구현했는데, 이는 포스트에 자세히 소개돼 있습니다.


카카오엔터프라이즈 AI기술실 자연어처리팀 소속의 이주성 연구원을 만나 텍스트 스타일 변환에 관한 선행 연구와 SST의 작동 원리와 그 성능, 향후 연구 계획에 관한 이야기를 들어봤습니다. 그럼 재미있게 읽어주세요 :)

: http://bit.ly/kep_inlg20_sst


+참고로 카카오엔터프라이즈는 회사가 보유한 AI 원천 기술의 연구 및 개발 성과를 한데 모아서 볼 수 있는 플랫폼인 "Kakao Enterprise AI Research'를 어제부로 외부 오픈했습니다. 보시면 2021년 올 상반기 여러 저널과 컨퍼런스에 어셉된 12편의 따끈한 논문도 살펴볼 수 있습니다.

: https://kakaoenterprise.github.io/


앞으로 개발자 커뮤니티에 많은 기여를 해보고자 플랫폼은 github pages+jekyll을 이용해 제작했습니다. 플랫폼 초기 기획 및 개발에는 AI기술실 선행연구팀의 정보현 엔지니어, 최종 개발 및 배포는 기술전략팀의 김도현 개발자와 함께했습니다. 지난 1월 중순부터 준비한 회사 프로젝트를 이제야 선보일 수 있게 돼 정말 기쁩니다. 카카오엔터프라이즈의 우수한 기술 역량을 집약한 플랫폼으로써의 성장을 함께 지켜봐 주세요. 감사합니다.

매거진의 이전글혐오 발언 분류 모델 토이 프로젝트를 소개합니다