brunch

You can make anything
by writing

C.S.Lewis

by 김도환 Feb 29. 2024

2024 AI 키워드(1) 멀티모달의 의미와 중요성


안녕하세요


오늘은 2024년 AI 기술과 관련된 키워드 중

 대두되고있는 멀티모달에 대해 알려드릴게요!



멀티모달의 의미와 중요성






2023년 생성형 AI가 

정말 핫한 키워드였는데요.


2024년에는 이 생성형 AI의 새로운 목표가 있습니다.


바로

 텍스트, 이미지 및 오디오 등 여러 데이터를 

단일 모델로 학습하고 처리할 수 있도록 하는 것입니다.


이것이 바로 멀티모달 AI를 구현하는 것입니다.






1. 멀티모달이란?


다시 말해, 멀티모달이란 직역하면 

여러개의 정보표현방식을

다루고 처리한다는 뜻인데요.



여기서 정보표현방식은 텍스트, 이미지, 음성,

제스처 등 여러 종류의 데이터를 말합니다.






인공지능 기술에서 멀티모달은 

인간의 학습방식을 모방한 것입니다.


인간은 생활하면서 필요한 정보를 습득할때

 5가지의 감각기관을 통해 데이터를 수집하고

이를 바탕으로 학습하게 됩니다.




즉, 오감을 통해 수집된 정보를 학습 및 처리하는데

이러한 인간의 인지적 학습법을 모방한 것이

멀티모달이라고 할 수 있습니다.









2. 멀티모달 인터페이스 




다시말해, 멀티모달은 여러가지 유형의 정보를 

인간과 컴퓨터가 주고 받을 수 있게 해주는

[인터페이스 기술]입니다.









3. 멀티모달이 중요한 이유 



그럼 왜 멀티모달이 2024년에 중요한 AI 기술로

떠오르는 이유는 어느정도 예상을 있으실겁니다.


바로 인간처럼 여러 정보를 

한번에 학습할 수 있기 때문입니다.




뿐만 아니라,

여러 정보를 상호 보완적으로 

활용하여 오류를 줄일 수 있다는 점도 장점입니다.


나아가 인간과의 상호 작용을 더욱 자연스럽고 

효율적으로 만들 수 있습니다.



마지막으로

기존에는 불가능했던 새로운 응용 분야의 

개발을 가능케합니다.






4. 멀티모달의 활용분야 



멀티모달은 아직 더 AI 기술이 발전해야 하지만 

앞으로는 다양한 분야에서 활용될 것입니다.


예를 들어,

의료분야에서는 멀티모달 이미징 기술을 통해

영상과 이미지에 존재하는 객체의 종류와 특징들을 

추출할 수 있습니다.


추출한 특징들로 정확하고 효율적으로 

질병을 식별해주는 솔루션을 제공할 수 있습니다.



이외에도 

멀티모달 센서를 활용한 경비로봇, 


다양한 이미지와 텍스트로

소통이 가능한 챗봇 서비스,


공장에서 불량품을 걸러내는 기술에

활용될 수 있습니다.





오늘은 멀티모달의 의미와

멀티모달이 왜 중요한지 알아보았는데요.


기존 생성형 AI는 단일 데이터를 학습하고

처리하지만 멀티모달은 여러 종류의 데이터를 

학습하고 처리할 수 있음을 수 있었습니다.


앞으로 더욱 멀티모달 기술이 발전해

새로운 AI 기술들이 나올 것으로

예상이 되네요~!


감사합니다.










https://brunch.co.kr/@brunchk1wj/148




매거진의 이전글 앱을 기획하는 챗봇,  심지어 피그마에서 수정 가능!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari