brunch

You can make anything
by writing

C.S.Lewis

by 음병찬 Apr 18. 2023

예스터데이, 렛잇비, 그리고 ChatGPT

'생성 AI'를 어떻게 바라봐야 할까

1968년 존 레논, 오노 요코가 마약 소지 혐의로 재판받은 후 법정을 떠나는 모습. (Andres Maclear / Getty)

* 이 글은 2023.4.18 한국경제신문에 기고한 글의 원본입니다 (글의 내용은 동일합니다)


비틀즈(The Beatles), 그리고 '창의성'


"모든 음악은 (이전에 만들어진 음악들의) '재탕'이다. 고작 몇 개의 음표를 가지고, 단지 테마만 변형한 것일 뿐이다 (All music is rehash. There are only a few notes. Just variations on a theme)"


1981년 1월 플레이보이가 공개한, 영국의 전설적인 록밴드 비틀즈의 멤버 존 레논, 그리고 그의 파트너이자 뮤즈 오노 요코와의 인터뷰 중에 존 레논이 한 말이다. "비틀즈 이후의 모든 록음악은 비틀즈가 만든 음악의 아류작일 뿐이라고 주장하는 많은 사람들에게 무슨 말을 해 주고 싶은가?"라는 물음에 대한 답이었다.


인간의 '창의성'이라는 것이 이전에 존재했던 여러가지 요소에 기대어 발휘된다는 것을 존 레논은 강조한 것이 아닐까? 어떤 예술가, 음악가, 작가라도 동시대 또 그 전에 살았던 사람들의 아이디어, 기술과 기법, 전통에 영향을 받기 마련이다. 이런 관점에서는, 비틀즈 뿐 아니라 우리 모두가 하는 행동은 다른 누군가가 하는 행동의 복제품이라고 할 수 있을 것이다. 아마도 존 레논은 비틀즈라는 밴드, 그리고 스스로가 음악을 만들었던 과정을 돌아보면서 일종의 자기 비판적인 의미로서 '우리가 했던 작곡은 결국 누군가가 이전에 생각해 봤던 것을 다양하게 조합한 것일 뿐이고, 순수하게 독창적인 요소는 없었다'는 이야기를 한 것일지도 모르겠다.


비틀즈의 노래들 중 'Come together' (존 레논 작곡), 'I saw her standing there' (폴 매카트니 작곡), 'Hey Jude' (폴 매카트니 작곡) 등 표절이나 자기 복제 의심을 받는 곡들도 있고, 'Let it be' (폴 매카트니 작곡)와 같이 머니 코드 (파헬벨의 캐논을 재해석해 만든 코드 진행으로, 귀에 쏙 들어오는 친숙한 멜로디를 많이 만들 수 있어 음악 장르를 불문하고 자주 쓰임)를 따르는 곡이 있는 것도, 어찌보면 너무 자연스러운 일이다. 오히려, 이런 사실만으로 비틀즈 음악의 창의성, 독창성, 그리고 예술적 성취를 논하는 것이 부적절한 것일 수도 있다.


그런데, 1965년 발표된 'Yesterday' (폴 매카트니 작곡)만큼은 하늘에서 뚝 떨어지듯이, 느닷없이 폴 매카트니의 꿈에서 얻은 영감을 통해서 만들어졌다고 한다. 자서전에 따르면, 폴은 여자친구의 집에서 자는 도중 꿈 속에서 이 노래의 멜로디를 들었고, 깨자마자 멜로디를 잊지 않으려고 피아노로 달려가서 연주를 했다고 한다. 그런데 무의식 중에 다른 사람의 곡을 표절한 것이 아닐까 하는 걱정에, 폴은 한 달 가량 주위의 음악 산업 관계자들에게 혹시 이 멜로디를 들은 적이 없는지 물어보고 다녔고, 몇 주가 지나도 모두가 처음 듣는다고 한 다음에야 이 멜로디를 가지고 음악을 만들기 시작했다고 한다.


그렇다면, 'Yesterday'는 창의적이고 독창적인 곡이라고 할 수 있을까? 다른 곳에서 들어보지 못한, 폴의 영감에서 출발했다는 점에서는 그렇게 이야기할 수 있을지 모르지만, 떠오른 멜로디를 바탕으로 멋진 선율을 가다듬고, 가사를 붙이고, 발표하기까지 약 2년 동안 여러 사람들과 함께 각고의 노력을 쏟아 만들어낸 결과물이라고 본다면, 창의적이라는 것의 본질은 단순히 '무(無)'에서 '유(有)'를 창조하는 행위 자체가 아니라 다양한 지적 과정의 조합일 가능성이 커 보인다.



챗GPT는 지능적, 창의적일까


요즘 어디를 가도 챗GPT 이야기다. 챗GPT는 미국의 '오픈AI(OpenAI)'라는 인공지능 회사가 개발하여 2022년 11월 출시한, GPT-3.5 기반의 대형 언어모델 (LLM; Large Language Model) 챗봇이다. LLM은 입력된 단어를 바탕으로 다음 단어를 예측하는 작업을 수행하는데, 챗GPT는 RLHF (Reinforcement Learning w/ Human Feedbabck)이라는 방법을 사용해서, 인간의 피드백을 지속적으로 학습해서 예측의 정확도를 높이면서 사용자의 기대에 더 부합하는 결과를 생성하고 대화할 수 있도록 만든 서비스다.


누구든지 쉽게 대화를 나누면서 이용할 수 있도록 무료로 공개한 이후, 챗GPT는 여러 소셜 미디어를 통한 엄청난 바이럴과 모든 미디어의 주목을 받았다. 공개한지 5일 만에 사용자 100만명을 돌파, 40일 만에 일 사용자 1,000만명을 돌파하는 등 전세계의 이목을 집중시켰다. 지난 2월 2일에는 출시된지 2개월 만에 월간 활성 사용자 수(MAU; Monthly Activity User) 1억 명을 돌파하면서 인터넷 등장 이후 가장 빠른 MAU 증가율을 보이고 있다. 한 마디로 '미친 존재감'을 보이고 있다.


주요 서비스 별 이용자 100만 명 달성 소요 기간, OpenAI CEO 샘 알트만의 트윗 (NIA The AI REPORT)


어떻게 챗GPT는 이렇게 사람들의 관심을 끌었을까? 다른 여러가지 이유가 있겠지만, 무엇보다 챗GPT가 대화의 맥락을 파악해 마치 사람과 얘기하는 것과 같은 경험을 주고, 더불어 챗GPT를 훈련하는데 활용된 엄청난 규모의 데이터를 바탕으로 논문을 작성한다거나 소설을 써 주고, 개발자처럼 웹사이트, 앱 개발에 필요한 코드를 작성하거나, 심지어 코드 리뷰까지 하는 등, 마치 '사람처럼' '창의적인' 작업을 할 수 있다는 것 때문일 것이다.


돌이켜보면, 우리는 항상 '인간과 같이' 생각하거나 판단하고, 창의적인 활동을 할 수 있는 존재에 큰 관심을 보여왔다. 인공지능 업계에서도 2016년 이세돌 9단을 4승 1패로 격파하면서 충격을 주었던 '알파고', 또 인터뷰 도중 '인류를 파멸시겠다'는 말을 해서 화제가 되었던, (상징적인 제스처이긴 하지만) 사우디아라비아에서 시민권을 받았다는 로봇 '소피아' 등이 떠오른다.


사실 챗GPT는 '생성AI'라는 개념에 속하는 기술의 일종이라 할 수 있다. 생성AI는 신경망과 같은 딥러닝 알고리즘을 활용하여 텍스트, 이미지, 음악, 비디오 등의 데이터를 학습하고, 입력 데이터와 유사한 패턴을 가진 새로운 데이터를 만들어낸다. 생성AI 기술 중 이전에 많이 알려졌던 기술로 GAN (Generative Adversarial Network; 적대적 생성 신경망)이 있는데, GAN은 '생성자'와 '판별자'라는 두 개의 네트워크를 경쟁시켜 보다 완성도 높은 이미지를 생성한다. 챗GPT가 텍스트 데이터를 다루는 생성AI 기술이라면 이미지 데이터를 다루는, 즉 이미지를 생성하는 생성AI 모델로 오픈AI의 DALL-E, Stability AI의 Stable Diffusion, 그리고 미드저니의 Midjourney 등이 있다. 이 이미지 생성 모델들도 챗GPT 못지 않은 관심을 받으며 수많은 개인, 기업들이 현실 세계에 활용하기 위한 시도를 계속하고 있다.


Stable Diffusion 기반으로 생성된 이미지들. Source: HuggingFace


챗GPT나 미드저니와 같은 생성AI 모델, 도구들은 '지능적', '창의적'이라고 할 수 있을까? 챗GPT를 비롯한 다양한 생성AI 기술에 대한 각계 전문가들의 의견이 엇갈리지만, 대체로 '인간과 같은 형태로 세상과 사물을 이해하거나, 창조적인 작업을 하는 것은 아니다'라는 데는 동의하는 것 같다. 물론, 역사학자이자 작가 유발 하라리와 같이 인공지능이 창의성과 같이 인간 고유의 것이라고 간주되는 능력을 충분히 대체할 수 있다는 입장을 보이는 경우도 있지만, 대부분은 인공지능의 작업은 기본적으로 패턴을 인식하고 패턴을 생성하는 작업일 뿐, 연역적인 추론, 논리적인 귀납, 직관에 근거한 창작 등 다양한 종류의 사고를 하는 것은 아니라는데 공통의 인식이 있다.


생성AI가 학습한 패턴에 근거하여 그럴 듯한 새로운 패턴을 만드는 것일 뿐이라는 것을 보여주는 재미있는 예시가 있다.


Stable Diffusion (좌측), DALL-E 2 (우상), Midjourney (우하)가 생성한 사람의 손 이미지. Source: BuzzFeed


위 그림은 여러 가지 생성AI 기반 이미지 생성 모델들이 만들어낸 손 모양인데, 사람이라면 손가락의 갯수, 해부학적 구조나 모양 등 뭔가가 이상하다는 것을 알아챌 수 있다. 사람은 이론적으로, 그리고 경험적으로 손이라는 부분이 뼈, 근육 등을 포함해서 해부학적으로, 물리적으로 어떻게 움직이는지 등에 대해 이해하고 있지만, 생성AI 모델은 입력으로 주어진 2D의 손 이미지들을 학습하고 그 패턴에 근거하여 '가능한' 새로운 패턴을 생성해내는 것이기 때문에 위와 같은 결과물이 나올 수 있는 것이다. 결국, 현재를 기준으로 챗GPT를 비롯한 생성AI 기술이 '인간과 같은 방식으로 작동하는 지능을 가졌거나 창의적인' 인공지능이라고 부르기는 어려울 것이다.



중요한 것은 생성AI를 바라보는 우리의 관점


그렇다면, 단순히 '생성AI는 지능적이거나 창의적이지 않다'고 결론을 내면 될까? 이 글의 서두에서 비틀즈의 음악을 이야기하면서 살펴보았듯이, 우선 '지능', 그리고 '창의성'이 무엇인지에 대한 우리 인간의 이해 자체가 많이 부족하고, 생각이나 지능이 과연 무엇인지에 대해 생물학, 심리학 등 다양한 학문에서 정확한 규명이 아직은 이루어지지 않고 있다. 확실한 것은, 우리가 '인간만이 할 수 있다'고 믿었던, 소위 '지능적', '창조적'이라고 분류했던 작업들의 상당수가 다분히 '기계적'인 작업이었고, 그 결과 기계가, 즉 인공지능이 인간을 뛰어넘는 수준의 성과를 보이는 작업이 점점 늘어나고 있다는 점이다. 체스가 그랬고, 바둑이 그랬다.


그렇다면, 명확히 정의내리기 어려운 인간의 지능, 창의성을 중심에 놓고 단선적으로 챗GPT를 비롯한 현재 인공지능이 지능적인지 창의적인지를 논하는 것보다, 이 새로운 기술이 '인간'과 같은 방식으로 생각하지도 않고 '인간'과 같은 방식의 '창의성'을 가지고 있지는 않을지 모르지만 우리의 지능적, 창의적 작업 과정을 도와주는 도구 내지 파트너로 활용할 수 있다는 관점이 보다 유용해 보인다.


<와이어드>를 공동 창간하고 편집장을 역임했으며 <뉴욕타임즈>로부터 '위대한 사상가'라는 칭호를 얻은 '케빈 켈리(Kevin Kelly)'는 2022년 <와이어드>에 기고한 글에서 창의성을 '대문자 창의성 (Uppercase Creativity)'과 '소문자 창의성 (Lowercase Creativity)'로 구분하고, 현재의 생성AI 모델들이 보여주는 능력은 소문자 창의성이라고 불렀다. 디자이너가 만드는 새로운 로고나 책 표지, 시즌에 맞게 새로 만드는 의상 등 우리가 '창조적' 작업이라고 인식하는 작업의 상당 부분이 이 '소문자 창의성'의 영역이고,  '대문자 창의성'은 판을 바꾸고 세상을 바꾸는, 정말 새로운 개념을 만들어내는 것으로, 예를 들자면 DNA의 발견, 특수 상대성 이론의 수립, 피카소의 '게르니카' 같은 것들이다. 필자가 위에서 예로 든 비틀즈의 경우로 보자면, '예스터데이'는 대문자 창의성, '렛잇비'는 소문자 창의성을 기반으로 한 작품이라고 할까? 우리가 일상적으로 업무를 하는데 필요한 대부분의 '창의성'이라는 것이 '소문자 창의성'의 영역에 해당된다고 생각하면, 챗GPT와 같은 현재의 생성AI 서비스가 우리의 일과 삶을 얼마나 생산적으로 만들어줄 수 있는지는 자명하다.



장인은 도구 탓을 하지 않지만, 모두가 장인일 수는 없다


단, 생성AI 기술을 활용해서 유의미하게 생산성을 높일 수 있다는 것이 모두에게 해당되는 것은 아니다.


물론, 이미 시장에는 챗GPT나 미드저니와 같은 생성AI 서비스를 활용해서 마케팅 문구나 이미지 자료, 비디오 등을 만들고, 작문을 하게 도와주고, 웹사이트나 앱 개발용 코드를 작성해 주도록 하는 수많은 프롬프트들이 있고 이 프롬프트를 올려서 공유하거나 거래할 수 있는 사이트들이 빠르게 성장하고 있다. 뿐만 아니라, 마이크로소프트는 워드, 엑셀, 파워포인트 등 업무 생산성 도구 전반에 챗GPT에 들어간 대규모 언어모델을 통합, '코파일럿'이라는 이름으로 사용자의 업무 효율성을 극대화해 주겠다고 발표했고, 세일즈포스, 구글, 노션 등의 기타 생산성 도구 및 소프트웨어 사업자들도 뒤질세라 챗GPT 등의 생성AI 모델을 자사 제품에 통합하면서 생성AI 기반 소프트웨어의 춘추전국시대를 만들고 있다.


또 유튜브에만 해도 챗GPT 소개와 활용법, 챗GPT로 돈 버는 방법, 미드저니로 디자인하는 법 등 따라하기 식의 비디오가 3,000만개 정도는 쉽게 넘을 정도로, 생성AI에 대한 모두의 관심과 배우고자 하는 열망도 뜨겁다.


그렇지만 비전문가나 초급자가 어떤 영역에 대해 사전에 학습된 지식이나 전문성이 없이 무작정 사용하기에는 어렵고 위험한 부분이 많다. 예를 들어, 코딩을 배워보거나 직업적으로 코딩을 해 본 적 없는 사람이, 챗GPT를 소개하고 사용법을 알려주는 유튜브나 책을 보고 따라하면서 전문가처럼 웹사이트나 앱을 만들어내기는 쉽지 않다. 특히 고부가가치 작업의 경우에는, 생성AI와 사람이 여러 차례 '프롬프트'라는 매개체를 통해 상호 작용을 하면서 작업을 하게 되기 때문에, 활용하는 사람의 지식, 경험, 그리고 센스가 생산성과 그 결과물에 직접적인 영향을 주게 되어 있다.


오픈AI, 오픈리서치, 그리고 펜실베니아 대학 연구진이 올해 3월 발표한 '대규모 언어모델이 노동 시장에 미칠 수 있는 잠재적 영향' 보고서에 따르면, 통역사, 시인, 작가, 세무사, 엔지니어, 언론인 등 대부분의 화이트 칼라 직종에 챗GPT 등의 대규모 언어모델의 영향이 있을 것으로 보고 있다. 특히 연봉 약 80,000달러까지에 해당하는 경우 그 영향이 가장 클 것이라고 예측하고 있는데, 이는 대규모 언어모델을 비롯한 생성AI의 능력이 대략 해당 분야의 '경험과 지식을 어느 정도 쌓기 시작한' 주니어-미들급 매니저의 역량에 해당한다고 본다는 것으로 해석된다. 이런 경우에 해당하는 직장인들의 가장 큰 위협은 인공지능 그 자체가 아니라, 생성AI를 자유자재로 활용하면서 작업 속도와 효율을 극적으로 높여, 직업을 2~3개 갖거나 그만큼의 일을 해낼 수 있는, 해당 분야와 연관 분야의 지식과 경험을 오랜 기간 쌓은 전문가가 될 것이다. 이런 변화가 확대되면서 챗GPT 등의 생성AI는 '긱 워커(Gig Worker)'나 'Fractional Employee' - 다수의 회사와 계약하여 정해진 시간만큼 근무하는 형태의 피고용인' - 들이 주종이 되는 '온디맨드 경제'의 촉매로 작용할 것이다.



생성AI의 확산을 위한 안전판


챗GPT 등 다양한 생성AI 모델과 서비스를 테스트하고 활용해 보면서, 장점과 함께 그 단점 내지 위험요소들도 많이 발견되고 논의되고 있다. 많이 언급되는 챗GPT의 이슈로 '환각(Hallucination)', '표절(Plagiarism)' 문제 등이 있는데, 이런 문제들은 인터넷에 이미 '존재하는 데이터를 기반으로 학습'해서 이를 절묘하게 조합, '그럴 듯한' 답을 내어놓게 만들어진 생성AI의 특성 상 어찌보면 당연히 발생하는 것이라 할 것이다.


미국의 저명한 언어학자 '노엄 촘스키(Noam Chomsky)'처럼, '악의 평범성'이라는 표현으로 챗GPT의 잦은 환각 문제나 표절을 '방조'하는 등의 이슈를 강하게 지적하는 목소리도 많지만, 현재 약 15%에서 20%에 달하는 것으로 알려진 챗GPT의 환각률을 낮추고 표절에 해당하는 답변과 생성물을 걸러내기 위해 대규모 언어모델 자체도 끊임없이 발전하고, 'Autonomous Articlebot', 'AI Classifier' 등 솔루션도 개발되고 있다. 앞으로 이런 문제들이 점진적으로 해결되어 가면서 생성AI 기술의 긍정적 효익을 극대화하고 부정적 효과를 최소화하기를 기대한다.


그런데, 생성AI 기술을 활용하여 새로운 제품이나 서비스를 만들어 제공하려고 하는 기업의 입장에서는 또 다른 계층의 리스크가 존재한다. B2C든 B2B든 자사의 고객을 대상으로 인공지능 기반의 제품과 서비스를 제공하는 기업의 경우, 기본적으로 확률에 근거하여 작동하는 - 즉 작동 조건에 대해 100% 확신을 할 수 없는 - 인공지능 모델의 경우, 항상 자사 서비스에 대한 신뢰와 통제의 리스크를 수반한다. 때문에, 한 조사에  따르면, 약 30%에 달하는 기업 임원이 'AI로 인한 사고 책임소재의 불명확성' 때문에 인공지능 기술의 도입을 꺼리는 것으로 나타나고 있다.


생성AI 기술은 지난 몇 년간 수많은 기업에서 도입했던 분류 및 회귀 작업 중심의 인공지능 모델 연구, 개발, 배포의 라이프사이클과 또 다른 인프라, 플랫폼 서비스를 필요로 한다. 따라서 기업의 인공지능 서비스를 둘러싼 개발 및 운영 상의 복잡성이 증가하게 되고, 이는 다시 테스트, 검증, 모니터링 관점의 복잡성을 증가시킨다. 생성AI를 중심으로 향후 인공지능 시대가 정말 열리게 된다면, 기하급수적으로 증가할 인공지능 모델을 적절히 테스트, 검증하고, 리스크를 관리하는 작업 그 자체가 하나의 거대한 산업으로 열리게 될 것이다.


이미 이런 인공지능 모델의 리스크를 평가하고 헷지하려는 시도와 사업자들이 등장하고 있다. 전세계 1위 규모의 재보험 사업자인 Munich Re:는 'aiSure'라는 이름으로 고객의 인공지능 모델이 의도하는 성능을 발휘하지 못하는 경우 보상을 해 주는 서비스를 출시한 바 있다. 필자가 몸담고 있는 캐나다의 인공지능 스타트업 Armilla AI도 전세계 2위 재보험 사업자 Swiss Re: 등과 손잡고 대규모 언어모델을 중심으로 생성AI 모델의 성능 기준, 윤리적 기준, 편향성 등을 검증하고 이를 기반으로 문제가 발생했을 때 고객사에 재무적 보상을 제공하는 서비스를 제공한다.



맺으며


인공지능 기술은 지난 수십년 간 우리 곁에 있어 왔지만, 작년 말 공개된 챗GPT로 인해 생성AI 기술을 중심으로 인공지능 기술에 대한 관심이 환기되고 엄청난 투자가 이어지고 있다. 생성AI 기술은 과거 인류가 발명했던 다른 어떤 기술과도 다르게, 각종 자연적인 현상 뿐 아니라 우리 자신에 대한 '창' 역할을 하면서 인간과 '과학적 협력'을 하고 인간의 '창의성'을 극대화하도록 도와주는 도구이자 파트너로 계속해서 진화하리라 예상된다. 기술의 발전과 발맞추어, 우리 인간도 이 기술을 더 잘 이해, 활용, 제어할 수 있는 높은 수준의 지적, 사회적 역량을 갖추고 준비하는 것이 중요할 것이다.


스탠포드 대학의 페이페이 리 (Fei-Fei Li) 교수가 이야기한 바와 같이 "우리 모두는 생성AI가 만들어낼 AI 시대의 변곡점에 서 있다".




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari