AI와 ChaGPT 개념 및 작동원리

by 박세연

AI와 GPT, 시대의 화두

2024년을 관통하는 키워드 하나만 선정해 보라면 아마도 “AI”나 “GPT”를 가장 많이 손꼽지 않을까 합니다. 지금도 그렇지만, 웬만한 콘텐츠에는 이 두 단어 중 하나, 혹은 두 개 모두가 붙어 나오는 게 일상이 되었습니다. 그러나 재미있게도 “AI”의 개념이나 “GPT”의 작동원리를 속 시원하게 말하는 사람은 몇 되지 않습니다. 사실 그럴 필요를 느끼기도 전에 우리 생활에 밀착해 버렸기 때문이죠.


AI가 인공지능이라고 뜻하는 것은, 많은 사람이 잘 알고 있습니다. 특히 우리나라에서는 2016년 이세돌 9단과 인공지능인 알파고가 바둑으로 세기의 대결을 펼쳤기에 더욱 뚜렷이 각인되어 있습니다. 5번의 대국에서 인간인 이세돌 9단은 단 한 번 이겼지만, 이것은 인간이 인공지능을 마지막으로 이긴 사건이 되었습니다. 이 경악스러운 사건 전에는 아직 인공지능이 인간을 따라오기는 멀었다고 여겨졌습니다. 또한, 어느 분야는 인간을 따라잡더라도 그것이 바둑이나 미술, 음악 분야가 될 줄은 꿈에도 알 수 없었죠.


알파고의 충격으로 한동안은 인공지능이 주도할 “4차 산업혁명”이라는 키워드가 크게 주목받았습니다. 특히 4차 산업혁명 이후에 살아남을, 혹은 사라져 버릴 직업군에 대한 의견이 여럿 있었는데요, 이때 예측으로는 디자인이나 문학, 음악 등의 창작 영역은 마지막까지 인간의 영역으로 남을 것이라는 게 지배적이었습니다. 인공지능이 주로 지배하리라 여긴 것은, 조금 더 기계적인 범위라고 여겼죠. 예를 들어, 빅데이터를 통해 금융시장의 흐름을 분석하면 인간이 그것을 토대로 미래를 예측해 보는 것이라거나, 살짝 더 양보해서 금융시장 예측까지는 인공지능, 즉 AI가 하지만 인간의 검수를 반드시 받아야 한다고 여겼습니다. 그러나 지금 상황은 어떻습니까?




창작 영역을 넘은 AI의 확장

바둑은 2016년에 이미 따라 잡혔습니다. 2020년에는 가수 하연이 AI가 작곡한 곡으로 데뷔를 했고요, 2022년에는 AI가 그린 <스페이스 오페라 극장>(제이슨 마이클 앨런이 지휘하고 AI로 그린 그림)이 콜로라도 주립 박람회에서 인간 창작자를 제치고 1등을 차지했습니다. 이것만 해도 놀라운데, 2022년 말에는 전 세계를 더욱 경악하게 하는 일이 있었습니다. 바로 대규모 인공지능 모델을 기반으로 개발한 AI 챗봇, ChatGPT의 등장입니다.


ChatGPT는 공개 후 단 5일 만에 하루 이용자가 100만 명을 돌파했습니다. 이용자들은 그저 신기한 게 나왔다고 몰려든 게 아니었습니다. 1950년대부터 이어져 오는 AI 역사를 보면서도 아직 인간을 따라오려면 멀었다고 여겼는데, ChatGPT는 그 생각을 한순간에 져버리게 했습니다. 이 놀라운 AI 챗봇은, 우리가 당연하게 AI가 수행할 거라고 본 코딩 작업을 포함해서 글을 쓰고, 음악 작업을 하고, 그림을 그리는 일까지, 정말 광범위한 일을 해냈습니다. 그것도 오로지 대화를 통해서 말입니다. 전 세계 사람들은 경악했고, 흥미와 함께 두려움도 동시에 느꼈습니다. 이제 곧 인간이 AI의 지배를 받게 되는 게 아닌가 하는 두려움 말입니다. 언젠가는 AI의 지배를 받는 인간의 모습이 나올 수도 있겠지만, 그것이 아주 먼 미래의 일이었으면 좋겠습니다. 또한, AI를 활용하지 못해서 일자리를 잃거나 못 얻는 일도 없었으면 합니다.




팬데믹과 가속화된 디지털 전환

그러나, 코로나 팬데믹(pandemic) 시기를 거치면서 우리의 미래는 불확실성이 더욱 짙어졌습니다. 비대면이 필수였던 그 시기에 디지털과 친해지지 못한 사람이 먼저 낙오되었습니다. 줌이나 웹엑스 등의 도구를 사용할 줄 모르면 교육이나 회의 참가가 불가능했습니다. 매장에서는 키오스크를 이용하지 못하면 맥도날드 햄버거 하나 사 먹을 수 없었죠. 그렇게 코로나 팬데믹 시기가 끝날 즈음, 우리는 이전보다 더 거대한 “AI로 모든 걸 진행하는 세계”를 접하게 되었습니다.




AI의 역사와 거대 언어 모델

사실 AI의 역사는 생각보다 꽤 오래전부터 시작합니다. 2000년대에 뿅, 하고 나타난 게 아니란 말이죠. 1956년 다트머스 회의에서 AI란 말을 공식적으로 사용하기 시작했고 1970~1980년대를 거쳐오면서 AI 부흥기와 AI 겨울이 번갈아 찾아왔습니다. 2006년에는 제프리 힌턴이란 사람이 딥러닝 논문을 발표했습니다. 참고로, 딥러닝은 머신러닝의 한 분야입니다. 머신러닝은 사람이 프로그래밍하는 게 아니고 기계가 직접 패턴을 학습하고 결과를 도출해 내는 것입니다. 여기에 사람의 신경망을 베껴 온 인공신경망을 만들어서 더욱 복잡한 패턴을 학습하는 기술이 딥러닝이지요. 그러니까 더 깊이 있게 학습한다는 뜻입니다. 이 인공신경망은 놀라운 발전 속도를 보였고, 지금은 세상 모든 것에 ‘AI’란 말이 붙는다는 농담이 나올 정도입니다.


거대 언어 모델(LLM : Large Language Model)은 지난해에 지겹게 들었을 ChatGPT 같은 AI 챗봇 기술을 가능하게 하는 핵심기술입니다. 이 역시 딥러닝 알고리즘인데요, 문장 안의 문맥을 파악해서 다음에 나올 단어가 어떤 게 등장해야 문장이 자연스러운지 확률적으로 예측하는 것입니다. 높은 확률로 적중하기 위해서는 데이터가 정말 많아야 합니다.


OpenAI사(社)에서 정확하게 밝히지는 않았지만, 소문에는 GPT가 이미 5조 5억 개 이상의 문서를 학습했다고 알려져 있습니다. 아, 여기에서 GPT와 ChatGPT가 조금 다른 의미라는 걸 알고 있는지요? GPT는 텍스트를 이해하고 생성하는 인공지능 모델이고, GPT를 활용해서 상호작용하는 대화형 챗봇으로 만든 모델이 ChatGPT입니다. 통칭해서 GPT라고 부르고 있기는 하지만 둘은 엄밀히 말하면 조금 다른 의미입니다. 간단하게 정리하자면, 범용 언어 모델인 GPT에서 대화에 특화된 버전이 ChatGPT가 되겠습니다.




생성형 AI와 창작의 패턴

ChatGPT는 수많은 데이터를 학습한 결과 지식의 양이 그 어떤 인간이나 컴퓨터보다 많고 그것을 논리적으로 잘 정리해서 대화하는 능력 또한 탁월합니다. 그냥 지식 자랑에 그치는 것이 아니라 창의적인 아이디어를 도출하는 부분도 뛰어나서 이제는 과제나 보고서 등을 작성할 때 이 친구를 필수로 참여시켜야 합니다. 특히 패턴화된 작업을 한다면 그 활용 분야가 무궁무진합니다. 예를 들어, 직장인들이 출장 후 가장 귀찮지만 중요하게 해야 하는 일 중 하나가 보고서 작성입니다. 회사별 혹은 팀별 양식이 정해져 있고, 대부분 작성 패턴이 일정한 편입니다. 이 경우 ChatGPT를 활용해서 보고서 자동 작성을 할 수 있습니다. 아주 사소한 예를 들었지만, 이 외에도 수많은 규칙과 패턴이 일정한 작업에 이 친구를 참여시킬 수 있습니다. 창의성 영역이라고 했던, 예술 작업도 포함해서요.


글쓰기나 미술, 음악도 일정한 패턴 작업에 속한다는 건 예전이라면 미처 깨닫지 못했을지 모릅니다. 인간의 마지막 영역으로 놔두었던 예술 분야에서 AI는 오히려 더 주목받고 있는 요즘입니다. 입시 미술이나 실용 음악을 해 본 사람들은 잘 알 것입니다. 글을 쓴다는 것도 마찬가지인데요, 처음 이 기술을 배울 때는 어떤 법칙이나 패턴을 따라가게 되어 있습니다. 창작이란 것도 수많은 자료(reference)를 보고, 듣고, 연구하면서 기존의 것을 새롭게 재해석하는 것이 태반입니다. 가령, 기존에 없던 ‘바퀴’를 만들었다고 해 봅시다. 최초의 누군가는 둥근 물체-돌이나 통나무 따위와 같은-를 깔아 놓으면 물건 이동이 유용하리라는 것을 알아서, ‘둥근’ 패턴을 ‘바퀴’ 형태로 재해석했을 것입니다. 창작의 방식은 이런 패턴으로 만들어지는데요, 이것은 또한 생성형 AI의 개념이기도 합니다.


ChatGPT를 포함하여 요즘 나오는 AI툴은 거의 생성형 AI입니다. 생성형 AI의 선두주자인 GPT의 G는 ‘Generate“의 약자인데요, 번역하자면 ’생성하다‘라는 뜻입니다. 생성형이란, 기존의 콘텐츠를 재해석해서 사용자 입맛에 맞게 새롭게 다시 작성해 내는 콘텐츠를 아우르는 말입니다. 하늘 아래 새로운 것은 없으니 기존 것을 새롭게 재해석해 낸다는 것이죠. 일정한 패턴만 있다면 인간이고 AI고 모두 가능한 일입니다. 다만 AI가 다양한 결과물을 빠르게 만들어 낼 수 있다는 점이 다릅니다. 이렇게 보니 시간이 자산인 현대인에게 ChatGPT는 참으로 든든한 친구입니다.




한계와 환각(Hallucination) 현상

하지만, ChatGPT를 무한 신뢰할 수는 없습니다. 2022년 11월 30일, 사람들은 처음 접한 ChatGPT와의 대화가 신기했습니다. 이전의 챗봇들과는 달리, 앞서 대화를 기억하고 맥락을 파악해서 사용자가 듣고 싶은 말을 그럴듯하게 답변해 주는 게, 마치 사람과 대화하는 느낌을 주었습니다. 방대한 지식의 양이 그 어떤 인간이나 컴퓨터보다 많고 논리적이고 체계적으로 정리해서 보여주는 능력 또한 탁월하니 팬들이 열광하지 않을 수 없습니다. 공개 직후 단 5일 만에 100만 명이 이용했다니, 엄청난 역사를 써 내렸지요. 그런데, 이 똘똘하고 매력적인 친구에게도 맹한 구석이 있습니다.


처음 공개 당시 ChatGPT는 2021년까지의 데이터만 학습했기에 새로운 정보를 습득하지 못한 상태였습니다. 지금은 웹 검색 기능이 있습니다만, 이 기능을 업데이트하기 전인 2023년 9월 전에는 인터넷과의 연결이 전혀 이뤄지지 않았습니다. 오로지 학습된 데이터로만 대화를 나눌 수 있었다는 것이죠. 문제는 최신 정보가 없는데도 그럴듯한 답을 내놓는 것에 있었습니다. ChatGPT의 답변이 너무 그럴듯해서 거짓말이라고 알아채기까지 시간이 걸렸는데요, 심지어 ChatGPT 스스로 그것을 거짓 정보라고 여기지 않으니 더 심각한 문제가 되었습니다.


이렇듯 ChatGPT가 거짓말 혹은 환각 증상을 보이는 것을, ‘할루시네이션(hallucination) 현상’이라고 합니다. 국내에서 잘 알려진 대표적인 할루시네이션의 예시로는 “세종대왕의 맥북 던짐 사건”이 있습니다. 간략하게 내용을 요약하자면, 집현전 학자와 한글 창제에 대해 논의하던 중 화가 난 세종대왕이 맥북을 던졌다는 이야기입니다. 그런데 조선 초기인 세종대왕 시절(1397~1450)에 맥북이 있었겠습니까? 맥북이 2006년에 출시되었으니까 세종대왕이 맥북을 던지려면 500년 넘게 기다렸다가 던져야만 합니다. 그런데 이 말도 안 되는 이야기를 ChatGPT가 천연덕스럽게 ‘조선왕조실록’에 적혀 있는 조선의 유명한 일화라고 소개한 적이 있었습니다. (다행히 이 글을 쓰면서 다시 물어보니까 이 이야기는 실제 역사적 사실이 아니라 인터넷에서 만들어진 가상의 이야기라고 바로 잡아 나옵니다)

세종대왕 맥북던짐 사건

이 밖에도 업데이트 전에는, 세상에 존재하지 않는 교향곡의 번호나 가상의 논문을 출처에 적는 등 어이없는 만행을 종종 저지르곤 했습니다. 너무 그럴듯해서 해당 주제를 잘 아는 전문가나 관련 업무를 하는 사람은 할루시네이션을 피해갈 수 있지만, 그렇지 못한 일반인들은 잘못된 정보를 믿을 수밖에 없었습니다. 몇 번의 업데이트가 빠르게 이뤄진 2025년 현재, 많이 수정되었다고 해도, ChatGPT의 할루시네이션 현상은 아직 남아 있습니다.




AI 시대, 피할 수 없는 동반자

요즘은 할루시네이션을 염려해서 여러 해결책이 나오고 있습니다. 우선 최신 정보와 관련된 내용이라면 ChatGPT 내의 ‘웹 검색’ 기능을 사용하거나, 신뢰할 수 있는 다른 출처를 찾아보는 방법이 있습니다. AI 검색에 특화된 Perplexity나 Genspark 등의 AI 툴에서 교차 검증을 하는 것이죠. 이러한 AI 검색 사이트(혹은 툴)에서는 더 많은 고품질 데이터로 학습해서 틀린 답변을 거를 수 있도록 피드백을 끊임없이 반영해야 합니다. 최근에는 딥서치(Deep Search) 기능을 여기저기에서 공개하고 있는데요, 이것도 하나의 교차 검증 방법이 될 수 있습니다.


ChatGPT의 할루시네이션을 줄이는 또 다른 방법은, OpenAI의 플랫폼 페이지에서 해당 모델의 “Temperature”를 “0”으로 해 놓는 것입니다. 보통은 “1”로 되어 있는데요, 이것은 GPT 모델의 창의성의 정도를 뜻한다고 합니다. 그러니까 “1”은 적당한 창의성을 부여해서 신선한 아이디어도 불쑥 나오곤 하지만, “0”으로 갈수록 사용자가 가장 많이 채택한 답변만 하게 됩니다. 좀 재미가 없어진다고 하니 사용자의 목적에 따라 조절하면 좋을 것 같습니다.


어찌 되었든 간에 생성형 AI의 출현으로 현재 우리는 엄청난 변화 속에 내던져진 것만은 틀림없습니다. 디지털의 끝자락이라도 쥐고 있는 사람이라면 하나 이상의 콘텐츠를 반드시 소비하게 될 것입니다. 불과 얼마 전까지만 해도 콘텐츠는 특정 직업군의 사람들만 제작할 수 있는 것으로 알았습니다. 일만 하는 사람이라서 콘텐츠를 소비한 적 없는 사람일지라도 요즘은 엑셀에도, 포토샵에도 AI가 탑재해 있어서 나는 AI 디톡스하겠다는 말을 할 수 없게 되었습니다. 그러나 걱정할 필요는 없습니다. 피할 수 없으면 마음껏 누리면 됩니다. 생성형AI로 콘텐츠를 쉽게 만들 수 있으니 이제는 누구나 SNS 인플루언서도 될 수 있고, 유튜버도 될 수 있습니다. 업무에서도 간단하고 반복적인 업무는 AI 툴을 활용하세요. 사용자는 더 고차원적인 일을 할 수 있습니다. 그러면 이제 어떻게 효과적으로 AI를 활용할 수 있는지 이야기해 보겠습니다.

keyword
작가의 이전글위기에서  스물 두 번째 직업을 엿보다