What's Driving the Obsession
PHOTO: SHAUN BOTTERILL — FIFA/FIFA VIA GETTY
리오넬 메시는 2022년 카타르 월드컵을 우승하며 커리어의 정점을 찍었다.
충격적으로 등장한 알파고라는 인공지능의 출현 이후, 인공지능 역시 지속적으로 기록을 갱신하며 달려가고 있다. 인간의 언어와 추상적 개념을 이해하는 이미지 생성 인공지능 애플리케이션의 대중화와, 인공지능을 통해 생성된 멀티미디어 컨텐츠의 출현, 심지어는 그림 대회에서의 수상까지.
21세기는, 현대사회의 몇 가지 직업분야에 인간의 직접적인 노동을 필요로 하는 마지막 세기일지도 모른다는 흥미롭고 구체적인 그리고 무서운 단서를 흘리고 있다. 작년은 인공지능이 전 산업분야에 빠른 속도로 스며드는 해였다. 빠르게 인간의 직감을 초월해 내고 있는 ‘생성형 인공지능’의 출현은 이 모든 상황을 촉발한 근본적인 이유가 되었다.
https://www.sequoiacap.com/article/generative-ai-a-creative-new-world
가장 성공적인 대형 VC 중 하나인 Sequoia에서는 작년 여름 생성형 인공지능에 대한 레포트를 퍼블리싱 했다.
OpenAI의 CEO Sam Altman은 그의 블로그 포스팅(’Moore’s Law for Everything’)을 통해 인공지능을 통해 좋은 삶을 누릴 수 있음을 주장한다. Sam Altman은 구매력의 향상은 삶의 만족감을 향상시키는 중요한 요소이며, 인공지능 혁명을 통해 제품과 서비스 비용이 낮아져 동일 비용으로 더 많은 구매력을 행사할 수 있는 인간의 삶 만족도 향상에 기여할 것이라고 주장한다.
Google Trend “Generative AI”
Midjourney, DALL·E 2, ChatGPT 등 놀라운 퍼포먼스를 지닌 생성형 인공지능의 출현으로 생성형 인공지능에 대한 검색량 역시 폭발적으로 증가하고 있다.
생성형 인공지능은 다양한 이름으로 소비되고 있다. 생성 AI, Foundation Model, Large(초거대) Generative Model, General Purpose Model 등이 그 예시이다.
(이번 포스팅에서는 생성형 인공지능으로 통일해 적을 예정입니다)
생성형 인공지능 이전에도 Narrow 모델이라는 타입의 모델이 존재했다. Narrow 모델은 OCR 등의 특정한 Task를 높은 효율로 수행하기 위해서 고안된 인공지능이다.
특정 이미지를 판별하거나, Machine Translation 등 한 가지의 Task(임무)만 효율적으로 수행할 수 있었다. 물론, 한가지 Task에 한해서는 인력보다 높은 수준의 효과를 볼 수 있었지만, 한 가지 Task를 학습시키기 위한 방대한 데이터 셋 구축, 인간의 노동이 필요한 학습 단계의 레이블 작업 등이 큰 한계이다. 이유는 자명하다, 세상에는 수만 가지 Task(임무)가 존재하고 이를 각 테스크 당, 최적화된 모델을 학습시켜 해결한다는 것은 불가능에 가깝기 때문이다.
생성형 인공지능의 혁신성을 수식할 수 있는 방법은 무수히 많지만 가장 본질적인 혁신성은 높은 수준으로 인간과의 유사성을 가진다는 것이다. 특정 분야의(Ex: 언어) 하위 항목(EX: 번역)인 Task를 학습하는 것이 아닌, 전체 상위 범주의 개념 자체를 이해하기 때문에 가능하다.
예를 들어, 언어를 이해하고 있는 사람은 “글을 쓰고, 말을 하고, 번역을 하고”등의 언어를 기반으로 한 수백 가지의 행동을 한다. 생성형 인공지능 역시 마찬가지라는 것이다. 이는 한 가지 Task만 해결할 수 있는 Narrow Model과의 가장 핵심적인 차이이다.
생성형 인공지능은 최상단의 개념 자체를(ex:언어) 이해하기 위해, 특정 개념을 학습시키지 않고 데이터 원본을 제공하고 나머지 부분을 예측하도록 유도한다. 그리고 그 과정에서 추상적인 표현의 영역마저 이해해나가고 있다.
이 과정에서, Narrow Model의 인공지능의 산업적 한계였던, 현실에 존재하는 수만 가지 태스크를 각각 분화한 모델로 학습시켜야 하는 단점을 극복할 수 있다는 가능성을 시사한다.
애매한 수준으로 인간을 모방하는 ‘불쾌한 골짜기’의 영역을 넘어, 2022년부터는 생성형 인공지능이 만들어내는 다양한 멀티미디어 컨텐츠가 대중의 관심과 인정을 받기 시작했다.
GPT-3, LaMDA, Midjourney, DALL·E 2, Stable-Diffusion 등 다양한 생성형 인공지능 모델이 출시되었다.
ChatGPT가 100만 유저를 모으는데 걸린 시간 (와우..)
실제로 미드저니의 경우 디스코드 서버를 통해 서비스를 오픈하였는데, 2개월째인 2022년 9월에 2백만 명 이상의 사용자를 확보했다. 이는 디스코드 서버 1위였던 포트나이트의 이용자 수 보다 두 배 이상 많은 수이며, 현재 미드저니는 720만 명의 사용자가 사용 중이다. 이는 디스코드 서버의 2위 ~ 20위를 합친 것보다 높은 유저 수이다.
grandviewresearch.com
실제로 1,000여 개 이상의 Generative AI Application이 등장하였고, 이중 몇 개의 서비스는 이미 1 million 이상의 유저를 획득한 상태이다. 더 놀랍고 충격적인 것은, 생성형 인공지능이 산업의 종류를 불문하고 영향을 미칠 것이라는 것이다.
생성형 인공지능의 영향에 따른 반작용이 Illustration, Marketing 등의 분야에서 일어나고 있다.
(추후, 각 산업분야에서 나타난 다양한 application을 소개해 볼 예정입니다)
생성형 인공지능의 등장을 통해, 언어의 장벽을 넘어 실시간으로 의사소통이 되는 세상, 혹은 이미지를 창작할 수 있는 능력이 없는 사람들도 자유롭게 멀티미디어 컨텐츠를 생성할 수 있는 미래를 현실적으로 상상하는 것이 가능해졌다. 그러나 여전히 헤쳐 나가야 하는 문제들이 존재한다.
첫 번째 문제는 AI 와 소프트웨어에 관련이 있다. Uber, Netflix, Expedia, Facebook 및 Airbnb와 같은 제품은 의심할 여지 없이 해당 산업을 혁신하였지만 이러한 제품과 생성형 인공지능을 활용하는 제품 간에는 분명한 구조적 차이점이 있다. 차세대 AI 네이티브 제품의 잠재력을 완전히 실현하기 위해서는 AI와 소프트웨어 모두 개선할 수 있는 지표를 제공하는 분석 도구와 이러한 애플리케이션의 근본인 AI 모델을 재학습 시킬 수 있는 파이프라인 툴에 대한 니즈가 있다.
무엇보다, 생성형 인공지능이 직면한 모델 오염 및 편견, 유해 컨텐츠 생성 등의 이슈를 컨트롤할 수 있게 해주는 소프트웨어들의 출현 또한 필요하다.
전통적인 애플리케이션과 AI-Native 애플리케이션의 구조적 차이
GPT-3, DALL·E 2, Stable-Diffusion 등의 모델을 생성형 인공지능 산업의 Bottom Layer의 근본으로 본다면, 엔드유저인 사용자에게 닿는 애플리케이션들은 Top Layer이다. 원활하고 높은 품질의 컨텐츠를 제공하기 위한 Middle Layer의 출현이 필요하다.
생성형 인공지능 애플리케이션의 특징인 자연어 인터페이스, 비 결정적 출력 결과물, 자가개선의 기능에 맞춘 새로운 방식의 Analytics 툴의 출현이 필요하다.
www.artsation.com NO TO AI GENERATED 운동
최근 Midjourney, Stable-Diffusion, DALL·E 2 등 다양한 Image generation model를 기반으로 한 이미지 생성 서비스들이 대중의 관심을 받게 되었다. 그와 동시에 인공지능 창작물의 저작권 문제, 학습 데이터의 출처 문제, 관련 업종 종사자들의 생존권 문제 등, 가볍지 않은 사회적 문제가 대두되었다. 실제로 이에 몇 창작자들은 온라인을 통해 AI 반대 운동을 전개하기도 했다. 갑작스러운 큰 변화는, 갈등을 유발한다. 생성형 인공지능이라는 이전에 존재하지 않았던 기술을 마주하며, 인간과 인공지능 간의 관계를 성숙한 태도로 재정립하기 위한 사회적, 기술적 논의를 진행해야 한다.
(실제로, 특정 나라에서는 인공지능에 대한 법적 규약으로서, 아이작 아시모프에 나오는 로봇의 3원칙을 그 기초로 삼고 있는 수준이다.)
여러 장벽이 있음에도 불구하고, 나는 가까운 시일 내 현실에 존재하는 많은 문제들을 넘어 인류와 인공지능이 함께하는 것이 당연한 사회가 될 것이라고 믿는다. 이미 인공지능 분야에는 천문학적인 자원과 인력이 투입되었고, 경험할 수 있는 결과물을 내놓고 있다. 상기의 글에서 우려하는 문제점을 해결하기 위해 이미 많은 사람들이 노력하고 있다. 무엇보다 이런 흐름 또한 반복되던 인류 역사의 일부이다.
방적기가 출현해, 인력을 대체하고 역설적으로 사람들이 방적기의 부품처럼 치환되자, 사람들은 러다이트 운동을 벌였다. 이후로도 기계의 고도화로 인한 자동화, 내연기관의 등장 등 수많은 신기술이 출현해왔다. 이미 많은 시간을 거쳐 관계를 정립해온 기계에 대해서는 적대감을 찾아보기란 어렵다. 인공지능도 이와 같은 역사의 평행한 흐름을 거치게 될 것이라고 생각한다.
절대적인 흐름을 목도하기보다는, 더 가치 있고 공유될 수 있는 방향으로 만들 수 있도록 일조할 것이다.
중요한 것은 끊임없이 유저를 관찰하고 그들의 피드백을 적용한 모델을 지속적으로 서비스할 수 있는 파이프라인의 구축이다. 인간은 불온전한 존재이고, 인간의 불온전함을 닮은 인공지능이 탄생할 가능성이 높다. 하지만 지속적으로 사람이 피드백을 줄 수만 있다면 모델은 ‘공공의 선’을 실현하는 방향으로 변화해 나갈 수 있을 것이다.