라이킷 24 댓글 공유 작가의 글을 SNS에 공유해보세요

You can make anything
by writing

C.S.Lewis

생성형 AI는 왜 오류를 범하는가?

지금은 AI시대

by 이상옥 Mar 08. 2025
브런치 글 이미지 1


"신라가 한국의 문화와 정치에 큰 영향을 끼친 반면 백제와 고구려는 신라보다 덜 알려져 있고, 쌀을 주식으로 한 백제와 고구려와 달리 신라에서는 밀가루로 만든 면 요리가 발달했기 때문입니다."




생성형 AI의 하나인 구글의 제미니(GEMINI)에게 "신라면은 있는데 왜 백제면, 고구려면은 없는지 이유를 알려주세요"라고 묻는 것에 대한 답이다. 오픈AI의 챗GPT에게 물어도 답은 비슷하게 나온다. 인공지능의 대답을 보면 문장이 전혀 어색하지 않고 내용도 매우 깔끔한 보고서 형식으로 그럴듯하다. 내용을 정확히 알지 못한 사람들에게는 이런 잘못된 정보를 사실인양 활용하거나 인용할 가능성이 높다.


왜 이런 현상이 나올까? 

생성형 AI의 기본 알고리즘이 '초거대 언어모델'에 있기 때문이다. 초거대 언어모델, 즉 LLM(Larg Language Model)은 인간의 뇌를 모방한 심층신경망을 활용한 딥러닝 모델이다. 초거대 언어모델은 기본적으로 '다음에 나올 적절한 단어를 확률적으로 예측'하는 역할을 하는 것이지, 정확한 정보를 찾아 제공하는 것이 아니라서 나타나는 현상이다. 초거대 언어모델은 블랙박스 안에서 무슨 이유인가로 어떤 단어나 문장을 생성하는 것이 더 적합한  결과일 확률이 높다고 계산되면 그를 따르는 것뿐이다. 여기서 내용이 사실인지 아닌지, 말이 되는지 안 되는지 등은 중요하지 않다.


심층신경망은 인간이 약 800억~1000억 개의 신경세포와 100조 개의 시냅스를 활용하여 학습하는 것처럼, 데이터가 들어가는 입력층과 최종 결과물을 내는 출력층 사이에 수많은 다른 층으로 구성된 은닉층을 구성하는 데에서 나온 말이다. 이런 이유로 인공지능을 활용한 모델의 결과에 대해 말은 하지만, 과정에 대해 설명할 수 없는 이유가 되기도 한다. 과거 2016년 이세돌을 4:1로 완파한 '알파고'가 왜 그런 묘수를 내는지 정확히 모르는 것과 같다. 


입력층에 고양이 사진이 들어가면, 수많은 은닉층을 거쳐 출력층에서 고양이인지 개인지 분류한 결과가 나오는 식으로 입력층과 출력층은 뉴런에 비유되고 은닉층은 시냅스에 비유된다. 은닉층 각각에서는 인공지능 모델이 규정한 연산이 이루어지는데, 학습모델에 활용된 데이터가 작거나 잘못된 데이터가 들어가면 정확한 결과값을 기대하기 어렵다. 왜를 들어 고양이와 개의 사진을 통해 학습을 시키는데, 사진의 수가 충분하지 않거나, 고양이의 사진을 보여주며 개라고 입력시키면 기계적인 학습을 하는 '인공지능'은 혼란스러운 것이 당연하다.


따라서 생성형 AI는 많은 데이터를 충분히 학습한 경우에만 현실과 부합하는 대답을 할 수 있고, 그렇지 않은 경우에는 엉뚱한 소리를 종종 하게 된다. 주어진 정보 안에서 최대한 그럴듯하게 문장을 생성할 뿐이라는 것을 알고 나면, 우리가 알고 있는 챗GPT를 비롯한 인공지능이 언제나 옳다는 생각을 해서는 안된다. 


브런치 글 이미지 2


여기서 우리가 주목해야 할 것은 '주어진 정보 안에서 최대한 그럴듯하게'란 문장이다. 생성형 AI는 사실인지 아닌지 판단하기 애매한 것도 자신 있게 제시한다. 사용자는 자신도 모르게 이를 사실로 받아들일 가능성이 크다. 생성형 AI는 말이나 그림을 만들어 내는 일을 하는 것이지, 정확한 자료를 찾아 정보를 제공하는 역할을 하는 것이 아니란 점을 다시 강조하고 싶다.


이런 측면에서 보면 인간도 변반 다를 것이 없다. '주어진 정보와 데이터를 기반으로' 편협되고 편파적인 자기주장을 마치 사실인양 앞세우는 사람들이 한 둘인가. 착각이고, 환상일 뿐이다. 인공지능의 언어모델이 데이터 자체에 잘못된 정보나 편견이 숨겨져 있거나, 어떤 분야에 대한 데이터가 부족해 일어날 수 있는 착각이나 환상처럼, 인간의 편협한 정보력과 잘못된 학습에서 오는 오류는 일맥상통한다.




생성형 AI는 기본적으로 '다음 말을 계속 이어 가는 기계'라는 점을 염두에 두고 결과물을 활용해야 한다. 적절한 정보가 없는 경우에는 그냥 없는 말도 만들어 내기 때문에 인공지능 답변이라고 철석같이 믿을 것이 아니라 항상 비판적인 시각을 가질 필요가 있다. 인간의 말도 마찬가지다. 나를 비롯한 이 땅의 소시민들은 주어진 환경 속에서 최선을 다하고 인간답게 살기 위해 노력한다. 평온하고 평범한 일상이 요즘처럼 중요하다고 느낀 적이 없다. 작금의 세상은 너무 혼란스럽고 오염된 데이터가 너무 많다. 차라리 부족한 정보 속에서 올바름을 추구하며, 미흡한 데이터 속에서 여유를 느낄 수 있었던 과거로 회귀하고 싶은 마음이 굴뚝같다. 이런 마음은 비단 나만의 생각은 아닐 것이다. 




작가의 이전글 결코, 배불리 먹지 말것

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari