brunch

2024 AI 키워드(1) 멀티모달의 의미와 중요성

by 김도환


안녕하세요


오늘은 2024년 AI 기술과 관련된 키워드 중

대두되고있는 멀티모달에 대해 알려드릴게요!



멀티모달의 의미와 중요성




디피니트 블로그_복사본-001.png



2023년 생성형 AI

정말 핫한 키워드였는데요.


2024년에는 이 생성형 AI의 새로운 목표가 있습니다.


바로

텍스트, 이미지 및 오디오 등 여러 데이터를

단일 모델로 학습하고 처리할 수 있도록 하는 것입니다.


이것이 바로 멀티모달 AI를 구현하는 것입니다.






1. 멀티모달이란?


다시 말해, 멀티모달이란 직역하면

여러개의 정보표현방식을

다루고 처리한다는 뜻인데요.



여기서 정보표현방식은 텍스트, 이미지, 음성,

제스처 등 여러 종류의 데이터를 말합니다.



002.png




인공지능 기술에서 멀티모달은

인간의 학습방식을 모방한 것입니다.


인간은 생활하면서 필요한 정보를 습득할때

5가지의 감각기관을 통해 데이터를 수집하고

이를 바탕으로 학습하게 됩니다.




즉, 오감을 통해 수집된 정보를 학습 및 처리하는데

이러한 인간의 인지적 학습법을 모방한 것이

멀티모달이라고 할 수 있습니다.




003.png






2. 멀티모달 인터페이스




다시말해, 멀티모달은 여러가지 유형의 정보를

인간과 컴퓨터가 주고 받을 수 있게 해주는

[인터페이스 기술]입니다.





004.png





3. 멀티모달이 중요한 이유



그럼 왜 멀티모달이 2024년에 중요한 AI 기술로

떠오르는 이유는 어느정도 예상을 할 수 있으실겁니다.


바로 인간처럼 여러 정보를

한번에 학습할 수 있기 때문입니다.




뿐만 아니라,

여러 정보를 상호 보완적으로

활용하여 오류를 줄일 수 있다는 점도 장점입니다.


나아가 인간과의 상호 작용을 더욱 자연스럽고

효율적으로 만들 수 있습니다.



마지막으로

기존에는 불가능했던 새로운 응용 분야의

개발을 가능케합니다.



005.png




4. 멀티모달의 활용분야



멀티모달은 아직 더 AI 기술이 발전해야 하지만

앞으로는 다양한 분야에서 활용될 것입니다.


예를 들어,

의료분야에서는 멀티모달 이미징 기술을 통해

영상과 이미지에 존재하는 객체의 종류와 특징들을

추출할 수 있습니다.


추출한 특징들로 정확하고 효율적으로

질병을 식별해주는 솔루션을 제공할 수 있습니다.



이외에도

멀티모달 센서를 활용한 경비로봇,


다양한 이미지와 텍스트로

소통이 가능한 챗봇 서비스,


공장에서 불량품을 걸러내는 기술에

활용될 수 있습니다.



006.png



오늘은 멀티모달의 의미와

멀티모달이 왜 중요한지 알아보았는데요.


기존 생성형 AI는 단일 데이터를 학습하고

처리하지만 멀티모달은 여러 종류의 데이터를

학습하고 처리할 수 있음을 알 수 있었습니다.


앞으로 더욱 멀티모달 기술이 발전해

새로운 AI 기술들이 나올 것으로

예상이 되네요~!


감사합니다.










https://brunch.co.kr/@brunchk1wj/148




keyword
매거진의 이전글앱을 기획하는 챗봇,  심지어 피그마에서 수정 가능!