brunch

You can make anything
by writing

C.S.Lewis

by 권혁민 May 10. 2023

생활 속 스며든 AI

AI 이미지 폭발 

코로나는 전 세대를 디지털 세대화 했습니다. 일을 하려면 화상 회의에 익숙해야 했고, 온라인 채널로만 

의사 소통하는 하는 것에 익숙해져야 했죠. 

질병을 관리하는 수단으로 QR 코드가 쓰이는가 하면 쇼핑하고 구매하는 방식도 큰 변화를 겪었습니다.  

학습하는 방법도 새로운 정보를 얻는 방법도 사람을 대면하지 않고도 접근할 있는 새로운 채널에 익숙해져 

버렸습니다. 


세상이 원자로 구성 되었다면 디지털은 0과 1 이 두 조합으로 만들어진 세상입니다. 

숫자, 문자, 이미지, 소리, 영상도 온라인 세상에서는 결국 0,1로 만들어진 세상이라는 것을 아실 겁니다.  

신경망 모델은 인풋(input) 이 히든 과정을 거쳐 아웃풋(output)을 만드는 모델입니다. 인풋에는 그것이 

무슨 데이터이든 결국 0,1의 값이 들어가고 나오는 값도 결국 0,1의 조합 인 셈이죠.  


얼마 전까지 인공지능을 학습할 때 한 가지 유형의 데이터를 인풋으로 했습니다. 또한 결과도 한 가지 형태의 

아웃풋으로 학습을 진행했습니다. 

예를 들어 이미지를 인풋하고 이미지 속 물체의 이름을 맞추는 인공지능이라면 인공 지능 학습은 이미지를 

인풋하고 그 아웃풋은 문자를 얻어 내는 학습 과정인 것들이 한 예입니다. 


하지만 GPT 모델만 하더라도 학습을 위해 인풋 되는 데이터가 이미지와 문자로 데이터 타입이 다양하게 

동시에 학습되었습니다. 이런 인풋 데이터의 타입이 다양해지는 것을 멀티 모달리티(Multi Modality)라고 합니다.


모달리티(Modality)는 모드 또는 데이터 타입이라고 이해하면 좋아요. 멀티가 붙게 되면 한 가지 타입이 아닌 여러 타입이 동시에 사용된다고 이해하면 됩니다.

한마디로 학습을 위한 신경망 모델이 더 진화한 것이고 다양한 인풋과 다양한 아웃풋을 만들 수 있다는 

얘기인 것이죠. 


우리가 경험하는 그림 그려주는 AI를 생각해 보면 텍스트를 넣었는데 이미지가 나오는 것도 멀티 모달리티(Multi Modality) 학습이 가능해졌기 때문입니다.

그리고 서비스가 다양해지도록 인공지능 모델의 활용 다양성을 지원하는 파운데이션 모델이 발전하고 있는 것도 지금의 여러 다양한 인공 지능 서비스가 폭발하는 상황을 만드는 원인이랍니다. 


큰 범용의 인공지능을 만들어 누군가가 그것을 사용해 생태계를 만들고 서비스화 하지 않으면 그런 투자를 

할 수도 없겠죠. 네이버, 구글, MS, BAIDU와 같은 IT 공룡 기업이 범용 인공지능을 만들고 API로 공개해 

사업화하도록 하는 것도 결국 생태계를 만들어 고객층을 확장하고 궁극적으로 그 시장의 지배자가 되기 위한 것일 겁니다. 한마디로 다양한 서비스를 만들도록 중소기업을 돕는 환경을 조성해 지원하는 것이 IT 공룡 

기업의 생존을 위한 필수 조건인 셈이죠.  


지금은 학습을 시키는 방법도 멀티 모달리티(Modality)로 다양화되었고 활용 측면에서 그 어느 때보다 활발하게 응용되도록 지원하는 파운데이션 모델도 빠른 속도로 진화하고 있으니 다양한 인공 지능 서비스의 

생태계가 하루가 다르게 급 성장하고 있는 배경이 된 것이죠. 


아래 내용은 이미지가 인풋 되어 다양한 아웃풋의 결과를 만들어 내는 사례들입니다.






작가의 이전글 ChatGPT의 태생은?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari