안녕하세요
오늘은 2024년 AI 기술과 관련된 키워드 중
대두되고있는 멀티모달에 대해 알려드릴게요!
멀티모달의 의미와 중요성
2023년 생성형 AI가
정말 핫한 키워드였는데요.
2024년에는 이 생성형 AI의 새로운 목표가 있습니다.
바로
텍스트, 이미지 및 오디오 등 여러 데이터를
단일 모델로 학습하고 처리할 수 있도록 하는 것입니다.
이것이 바로 멀티모달 AI를 구현하는 것입니다.
다시 말해, 멀티모달이란 직역하면
여러개의 정보표현방식을
다루고 처리한다는 뜻인데요.
여기서 정보표현방식은 텍스트, 이미지, 음성,
제스처 등 여러 종류의 데이터를 말합니다.
인공지능 기술에서 멀티모달은
인간의 학습방식을 모방한 것입니다.
인간은 생활하면서 필요한 정보를 습득할때
5가지의 감각기관을 통해 데이터를 수집하고
이를 바탕으로 학습하게 됩니다.
즉, 오감을 통해 수집된 정보를 학습 및 처리하는데
이러한 인간의 인지적 학습법을 모방한 것이
멀티모달이라고 할 수 있습니다.
다시말해, 멀티모달은 여러가지 유형의 정보를
인간과 컴퓨터가 주고 받을 수 있게 해주는
[인터페이스 기술]입니다.
그럼 왜 멀티모달이 2024년에 중요한 AI 기술로
떠오르는 이유는 어느정도 예상을 할 수 있으실겁니다.
바로 인간처럼 여러 정보를
한번에 학습할 수 있기 때문입니다.
뿐만 아니라,
여러 정보를 상호 보완적으로
활용하여 오류를 줄일 수 있다는 점도 장점입니다.
나아가 인간과의 상호 작용을 더욱 자연스럽고
효율적으로 만들 수 있습니다.
마지막으로
기존에는 불가능했던 새로운 응용 분야의
개발을 가능케합니다.
멀티모달은 아직 더 AI 기술이 발전해야 하지만
앞으로는 다양한 분야에서 활용될 것입니다.
예를 들어,
의료분야에서는 멀티모달 이미징 기술을 통해
영상과 이미지에 존재하는 객체의 종류와 특징들을
추출할 수 있습니다.
추출한 특징들로 정확하고 효율적으로
질병을 식별해주는 솔루션을 제공할 수 있습니다.
이외에도
멀티모달 센서를 활용한 경비로봇,
다양한 이미지와 텍스트로
소통이 가능한 챗봇 서비스,
공장에서 불량품을 걸러내는 기술에
활용될 수 있습니다.
오늘은 멀티모달의 의미와
멀티모달이 왜 중요한지 알아보았는데요.
기존 생성형 AI는 단일 데이터를 학습하고
처리하지만 멀티모달은 여러 종류의 데이터를
학습하고 처리할 수 있음을 알 수 있었습니다.
앞으로 더욱 멀티모달 기술이 발전해
새로운 AI 기술들이 나올 것으로
예상이 되네요~!
감사합니다.
https://brunch.co.kr/@brunchk1wj/148