brunch

You can make anything
by writing

C.S.Lewis

by 작은 불씨 May 30. 2024

수화 제스처 생성 AI 모델

Prompt2Sign 탄생

대부분의 불편함은 AI를 통해 사라질 것 같다.

SignLLM 연구팀은 세계 최초의 다국어 수화 데이터셋인 Prompt2Sign을 공개했습니다. 이 데이터셋은 미국 수화(ASL)를 포함한 8개의 다양한 수화를 포함하고 있으며, 이를 대규모 비디오 형식으로 변환하여 모델 학습에 최적화된 형식으로 제공됩니다.


Prompt2Sign은 텍스트나 프롬프트 입력을 통해 수화 제스처를 생성할 수 있는 최초의 다국어 AI 모델입니다. SignLLM 모델은 수화 생산(SLP) 작업에 최적화되어 있으며, 8개의 수화 언어에서 뛰어난 성능을 자랑합니다. 이 모델은 강화 학습을 활용하여 고품질 데이터를 자율적으로 샘플링하고 학습 속도를 가속화하여 최적의 성능을 달성했습니다.


주요 성과와 비교 분석

SignLLM 연구팀은 다양한 수화 생산 성능을 비교하며 미국 수화(ASLP)와 독일 수화(GSLP) 등에서 우수한 성능을 입증했습니다. 또한, 다양한 데이터 증강 기법을 적용한 Ablation Study를 통해 모델의 성능을 더욱 향상했으며, 훈련 효율성 연구에서는 설정의 효과가 DTW 값(낮을수록 좋음)에 미치는 영향을 분석하여 최적의 학습 조건을 찾았습니다.


SignLLM의 미래 전망

SignLLM은 수화 번역과 생산 분야에서 혁신적인 변화를 가져올 것으로 기대됩니다. 이 모델을 통해 수화 사용자들이 더욱 쉽게 의사소통할 수 있으며, 수화 교육 및 연구에도 큰 도움이 될 것입니다. 앞으로 SignLLM 팀은 더욱 발전된 기능과 성능을 제공하기 위해 지속적인 연구를 진행할 예정입니다.


이번 연구는 수화 사용자들에게 큰 도움이 될 것이며, 특히 의사소통의 어려움을 겪고 있는 많은 사람들에게 새로운 가능성을 열어줄 것입니다. SignLLM의 발전은 수화 커뮤니티와 기술 연구자들 모두에게 희망찬 소식이 될 것입니다.


매거진의 이전글 기술 혁신의 새 시대,중국의 475억 달러 반도체 투자
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari