brunch

매거진 Easy IT Talk

You can make anything
by writing

C.S.Lewis

by 피아비키 Oct 19. 2022

창작 분야까지 진화하는 AI, 어떻게 활용해야 할까?

KT엔터프라이즈 9월호 칼럼

지난 달에 작성했군 KT엔터프라이즈 'DX스토리' 9월호 원고입니다.  "창작" 및 "콘텐츠" 관점에서 다룬 글입니다. 인공지능의 창작 수준 발전 속도가 놀랍네요~




 [연관 글 읽기]

국내 은행권의 AI 기반 ‘초개인화’ 서비스 현황

데이터 전성시대의 딜레마:데이터 공유-데이터 주권 사이
 
네비게이션 제왕 "티맵(T-map)"의 유료 전환



‘창작’에 특화된 인공지능(AI) 사례들


며칠 전 세계 창작자들과 IT산업 종사자들을 깜짝 놀라게 하는 일이 발생했다. 미국 콜로라도 주립 박물관에서 개최한 미술대회의 ‘디지털 아트’ 부문에서 인공지능(AI)이 그린 그림이 우승을 차지했다는 것이다. 그림을 그린(?) 인공지능의 이름은 ‘미드저니(Midjourney)’, 미드저니를 개발한 이는 게임 기획자인 ‘제이슨 앨런’이었다.


<그림 1> 콜로라도 주립박물관 미술대회 우승작 ‘스페이스 오페라 극장’ (AI 미드저니 作)


사실 ‘미드저니’의 사례는 새로운 현상은 아니다. 이미 ‘달리 미니(Dall E. Mini)’, ‘스테이블 디퓨전(Stable Diffusion)’ 등 미드저니와 비슷한 기능을 가진 인공지능 프로그램이 출시된 상태고, 그에 앞서 2016년 렘브란트 미술관과 MS가 공동 개발한 AI ‘넥스트 렘브란트’가 공개된 바 있다. 2018년에는 로봇 아트대회에서 자체적으로 그림을 그리는 AI 화가 ‘AICAN’이 등장하여 화제를 모으기도 하였다.


그런가하면, 인간을 ‘대신해서그림을 그려주는 보조기능의 AI 아졌. 2017년에 출시되어 스케치 초안을 작품으로 바꿔주는 ‘빈센트 비롯해서, 국내에서도 2022 2월에 네이버에서 웹툰 작화를 그릴  있는 ‘웹툰 AI 페인터 공개한  있다. 30만장의 이미지를 학습한 네이버 AI 페인터는 스토리 아이디어가 있어도 그림 실력이 없었던 이들에게 진입장벽을 낮춰주는 기술로 평가받는다.



<그림2-1> AI ‘빈센트’의 그림 (출처: 엔비디아)
<그림 2-2> 네이버 AI 웹툰 작화 프로그램 ‘웹툰 AI 페인터’ (출처: 네이버)


비슷한 시기, LG AI휴먼 ‘틸다 뉴욕 패션위크에서 디자이너 데뷔전을 가졌다. 틸다는 뉴욕 데뷔전에서 컬렉션 구성을 위해 3천여장의 이미지와 패턴을 학습하여 200여개의 디자인을 선보였다. 틸다의 경우, 언어 데이터 6000억개와 고해상도 이미지 2 5천만 장의 데이터를 학습한 AI 엑사원이 적용된 사례다.


<그림 2-3> AI휴먼 '틸타'의 뉴욕 패션위크(NFW) 데뷔 콜렉션 (출처: 아시아타임즈, 2022.2.15)


AI 작곡가와 AI 소설가의 등장은 더욱 활발하다. 이미 2012년에 런던 교향악단이 AI ‘이아모스(Iamos)’가 작곡한 ‘심연 속으로(Transits Intoan Abyss)’라는 곡을 연주할 정도로 AI 작곡은 역사가 제법 오래되었다. 최근 사례로는 지난 7월 방영했던 MBC 드라마 <닥터로이어>에서는 AI가 작곡한 BGM을 들 수 있다.


현재 AI 기술은 국내외 할 것 없이 곡 하나를 만드는 데 길어도 5분~10분 남짓 걸리는 것이 일반적일 정도로 높은 수준을 자랑한다. AI가 곡을 만들어서 연주하고 콘서트를 개최하는 것은 더 이상 새로운 현상도 아니다. 심지어는 음악 플랫폼 사업자인 KT의 ‘지니뮤직’조차 최근 올레TV의 오리지널 콘텐츠인 ‘가우스 전자’의 로고송을 AI로 제작하기도 했다.


출판계에서 2021 8월에 국내 최초로 AI  장편소설 <지금부터의 세계> 출간되었는데, 당시 대문호인 이문열이 추천사를  정도로 보수적인 문학계에서도 AI 소설에 대한 관심은 폭발적이었다.


2016년에 일본에서 AI가 작성한 SF단편소설이 문학상 예심을 통과한 적이 있지만 이는 작품성이 아닌 ‘AI가 썼다’는 부분에서 관심을 모았던 터였다. 그러나 <지금부터의 세계>는 AI가 직접 소설쓰기를 학습했고, 문장력의 경우 인간 작가보다 더 뛰어날 정도라는 평가가 쏟아졌다.  


<그림3-1> AI 작곡의 ‘가우스전자 로고송’ (출처: KT스튜디오 지니)


<그림 3-2> AI 장편소설 ‘지금부터의 세계’ (출처: 교보문고)



AI의 창작이 불러오는 논쟁들

AI가 인간처럼 창작을 통한 ‘공감’과 ‘관계형성’ 능력을 할 수 있을까?


AI의 창작 기능이 화제가 되는 것은 ‘창작’이 인간의 영역이라는 믿음을 흔들기 때문이다. 창작은 ‘감성’의 영역이다. 그리고 감성은 ‘공감’을 이끌어낸다. 사람들은 공감능력을 발휘하여 관계를 맺고 사회를 구성하는데, 이를 위한 매개체가 ‘창작물’ 이기 때문에, 창작 행위를 ‘기계’가 대신 한다는 것에 모두가 놀라는 것은 당연하다.


1.

미드저니의 우승 소식은 일차적으로 다음과 같은 의문을 제기한다. 우승의 자격은 인공지능인 ‘미드저니’와 미드저니를 개발한 사람 ‘앨런’ 중 누구에게 돌아가야 할까?


창작영역에서 AI와 인간이 직접 경쟁하는 시대가 되면서, ‘창작자’를 기술에 적용할 수 있는가에 대한 논쟁은 끊이지 않고 있다. 창작자의 권리가 인정되면 ‘저작권’을 소유할 수 있는 권리를 보장받기 때문이기도 하지만, 보다 근본적인 이유는 위에서 언급했든 ‘창작’이 인간 고유의 영역이라는 기본 전제가 흔들린다는 점에서 찾아야 한다.


2.

AI의 ‘기능’에 집중하면 문제가 더욱 복잡해진다. AI가 완성한 작품을 ‘예술’이라 할 수 있는가의 부분이다. 미드저니 사례의 경우, 사람이 텍스트를 입력하면 컴퓨터가 해당 텍스트에 적합한 여러 이미지 소스들을 조합해서 보여준다. 재미있는 것은 그 퀄리티가 나쁘지 않다는 것이다.


개인마다 기준이 다르겠지만, 미드저니의 우승작인 <스페이스 오페라 극장>만 해도 그림의 퀄리티가 제법 뛰어나다. 시각적으로만 보면 ‘예술’이라는 단어를 붙이는 것이 이상하다고 느껴지지 않을 수준의 그림이다.


‘투입 시간’은 비교조차 되지 않는다. 다른 화가들이 붓과 물감으로 그림을 그리는 동안, 미드저니에 제목 텍스트를 입력하면 AI가 텍스트와 관련된 수많은 스톡 이미지들(기존 이미지)을 조합하여 작품을 완성하는데, 이 과정에 걸리는 시간은 단 2~3초에 불과하다.


소설이나 음악도 마찬가지다. 소설의 경우, 아직까지는 인물, 사건, 공간, 시간 등 전체적인 구성과 줄거리 설정은 처음에 사람이 입력해야 한다. 음악 또한 수많은 기존 음악들의 데이터를 분석을 통해 AI가 코드 구성 및 코드 전개 패턴을 학습하여 결과물을 완성해낸다. 즉, 인간의 다양한 창작물들이 ‘학습 데이터’가 되어 AI의 창작 기능을 높이고 있는 것이다.  


3. 

‘표절’ 범위의 적용 여부도 인공지능의 창작이 증가하면서 발생한 이슈다. 기본적으로 인공지능은 ‘기존 데이터’를 바탕으로 패턴을 ‘학습’하는 기술이다. 그 학습기능을 인간이 수식을 입력하느냐 또는 최소한의 정보만 입력하고 자체 학습하게 하느냐에 따라 머신러닝(ML)과 딥러닝(DL)로 구분될 뿐, 인간처럼 순수하게 ‘무에서 유를 창작’하는 기능은 아직 완성되지 않았다.


이처럼 아직까지 우리가 접하는 대부분의 AI는 ‘창작’의 영역이라 할지라도 수많은 기존의 데이터 학습을 통해 몇 초 만에 결과물을 도출하는 기능으로 설계되어 있다. 따라서 AI가 그려내는 미술작품이나 음악 창작물 등은 인간 창작자들이 그동안 만들었던 수천 만 개의 기존 창작물들을 학습하고 이를 조합하여  나온 결과물이다. AI의  작품들이 ‘표절’ 범위에 해당하지 않을까에 대한 논쟁이 계속 제기될 수밖에 없는 이유다.


혹자는 AI가 이제 ‘스스로 생각’하는 수준에 이르렀다고 주장하기도 한다. ‘이야기’를 전개·발전해가는 문학 작품의 경우, 단순 텍스트 나열이 아닌 ‘문맥’ 또는 ‘맥락’까지 고려해야 하는데, <지금부터의 세계>의 사례와 같이 AI가 소설을 집필하는 사례도 등장했기 때문이다.  


그러나 이는 ‘데이터’의 양이 셀 수 없을 만큼 방대해지면서 AI가 대응하고 제시할 수 있는 경우의 수가 그만큼 무궁무진해진데 따른 결과일 뿐, 창의력, 상상력이라는 순수한 ‘감성’의 영역에서는 AI가 인간을 따라잡았다고 보기 어렵다. 인공지능은 특성상 ‘데이터’를 분리해서 독립적으로 존속할 수 없는 알고리즘 기술이기 때문이다.



진화하는 인공지능(AI), 어떻게 활용해야 할까?

‘공감능력’을 표방한 <AI 2.0 프로젝트>


창작이 인간의 고유 영역이라지만, 앞으로 AI의 창작 활동은 더욱 증가할 것이 분명하다. 따라서 이제는 인공지능의 창작 활동이 우리 생활에 긍정적 효과를 가져올 수 있는 방법에 대한 고민을 하는 것에 보다 집중해야 한다. 어차피 예술의 발전은 ‘도구’, 즉 ‘기술’의 활용을 수용하면서 발전해온 부분도 있다.


KT의 경우, 지난 5월 ‘AI 2.0’ 계획을 통해 청각, 언어, 클라우드, 시각 지능을 핵심 기술로 하여 AI 서비스를 발전시키겠다는 연구 방향을 발표했다. 이러한 KT의 AI 개발 계획은 인공지능의 ‘창작’ 기능을 예술 분야 뿐 아니라 일상에서 실제적인 효과를 발생시킬 수 있는 부분을 연구하겠다는 의지로 읽힌다.


KT의 AI 2.0 프로젝트는 ‘공감기술’이 적용된다는 것이 핵심이다. KT의 초거대 AI는 한국어 언어모델의 진화를 기반으로 하여 ‘공감능력’을 갖추는 방향으로 고도화되고 있다. ‘기술’의 대명사인 인공지능에 ‘공감’이라는 감성적 키워드가 결합된다는 것의 의미하는 것은 명확하다. 엄청난 기술의 발전 속도를 대하는 대중의 불안함을 해소할 수 있다는 확신이자 기술을 개발, 적용하는 기업의 ‘의지’ 또는 ‘비전’을 표방한 셈이다.


연산 작용 같은 이성적 영역만이 아니라, 감각과 감정 같은 감성적인 영역도 일부는 ‘데이터 분석’을 통해 구현해내는 단계까지 기술이 발전했다는 것은 이미 앞선 사례들이 보여주었다. 따라서 공감 능력(을 발생시킬 수 있는 데이터 분석)을 통해 기술이 고도화될수록, 감성적 영역에서도 우리의 삶은 매우 획기적으로 개선될 수 있다. KT의 AI 2.0 프로젝트는 ‘공감’, ‘감성’의 분야에서 사람들의 삶을 혁신시키는 것을 목표로 한다.


<그림 4> KT 공감 기술 적용 서비스 분야 (출처: 서울경제, 2022.5.22.)


실제로 AI 2.0프로젝트는 독거노인, 청각장애인 등 사회약자들을 돕는 공공 영역에서 먼저 활용된다. 가령, 후천적으로 목소리나 청각을 잃은 이들을 위해 AI가 데이터 분석을 통해 이들의 목소리를 생성해낸다. 이를 위해 가족, 비슷한 연령대와 성별의 수많은 사람들 데이터를 분석하고, 구강구조 등 개인의 특성을 반영하여 실제와 비슷한 맞춤형 목소리를 되살리는 것이다.


일례로 최근 상영되었던 영화 <탑건: 매버릭>에서 ‘아이스맨’으로 등장했던 ‘발 킬머’의 목소리도 AI가 구현한 결과물이었다. 배우가 지병으로 인해 실제로 목소리를 잃은 상황임에도 기술의 발전 덕분에 영화 출연이 가능했던 사례다.


KT의 ‘AI 2.0 프로젝트’는 향후 보험, 메타버스 등과 연계해 일반 시장으로도 확장, 적용될 예정이다. 이 경우, 앞서 수많은 AI가 선보였던 기능들이 높은 수준을 자랑한 것은 오히려 희망적이다. ‘창작’은 ‘감성’의 영역이며, 감성은 타인과의 ‘공감’을 이끌어낸다. 기술의 발전이 인간을 두렵게 하는 것이 아니라, 인간과 ‘연결’되고 사회적 약자나 소외된 이들, 나아가 일반 대중의 필요를 채워줄 수 있는 방향으로 활용될 것이기 때문이다.  



이제는 ‘기술’의 효율적인 활용을 고민할 때


기술의 발전으로 공장이 세워지면서 제조업이 본격적으로 발전했듯이, AI가 몇 초 만에 그림을 만들 수 있게 되면서, 이제 예술도 ‘제조’의 영역으로 들어가게 되는 것 아닌가라는 전망들이 늘고 있다.


기술의 발전은 필연적으로 ‘창작’의 개념을 확장시킨다. 지금까지는 창작이라는 개념에 인간만이 포함되었다. 그러나 인공지능이 우리의 삶과 연결되는 시대, 따뜻한 기술이 부상하는 시대에는 ‘창작’의 개념에 ‘수많은 데이터 분석을 통해 인간의 한계를 보완하는 새로운 영역을 제시하는 것’을 추가하는 것도 더 이상 무리는 아니다. AI가 선보인 결과물이 인간들이 축적한 데이터를 조합한 것임을 고려한다면, 미드저니가 받아야 할 상은 ‘데이터 조합상’, 또는 인간 개발자를 잘 도와준 ‘조력상’이 적합하다고 주장하는 이들도 있을 만하다.


이런 점에서 AI의 창작 기능의 고도화는 긍정적 측면이 있다. 창작은 ‘도구’, 즉 ‘기술’이 적용되었을 때 본격적으로 발전한다. 오늘날 창작의 기술이 된 AI는 인간이 생성하는 데이터를 해석하기에, 인공지능의 발전은 그 자체로 인간과 기술의 조화로운 ‘연결’되는 것을 의미한다.


이미 AI의 연산과 예측 기능은 우리 생활의 편의성을 크게 향상시켰다. 여기에 이제는 AI가 창작을 비롯한 ‘감성’의 영역에서도 인간을 보조하는 역할도 조금씩 하고 있는 상황이다. 앞으로 AI의 창작 기능이 더욱 발전할 것이 분명한 상황에서, AI 창작은 더 이상 새로운 화제가 되지 못한다. 이제는 인간과 AI의 ‘협력’의 관점에 집중하는 것이 필요할 때다.



 [연관 글 읽기]

국내 은행권의 AI 기반 ‘초개인화’ 서비스 현황

데이터 전성시대의 딜레마:데이터 공유-데이터 주권 사이
 
네비게이션 제왕 "티맵(T-map)"의 유료 전환





브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari