brunch

You can make anything
by writing

C.S.Lewis

by Alcide Mio Sep 07. 2024

인공 지능이 바꾸고 있는 인터넷

지난 5 월에 OpenAI에서 발표한 GPT-4o와 구글에서 소개한 여러 가지 인공 지능 도구들이 저에게는 충격적으로 다가왔습니다. 인공 지능의 능력에 대한 획기적인 발전이 있었던 것 같지는 않았지만 그동안 문자로만 답을 하던 것에 사람의 목소리를 더함으로써 한층 더 이용자들에게 가까이 다가갈 수 있게 되지 않았나 하는 생각을 했습니다. 이런 기능을 통해 인공 지능을 더욱더 사람처럼 생각하게 만들어서 이에 접하는 이용자들의 부담을 줄임으로써 결국 인공 지능을 이용하는 사람들이 더 늘어나지 않을까 싶었습니다.


그런데 저에게 더 큰 생각거리를 던져 준 것은 구글 검색에 새로 추가된 기능이었습니다. AI 개요(AI Overview)라는 이름이 붙여진 이 서비스는 내가 구글을 검색하고 검색 결과로 나온 웹사이트를  직접 찾아가서 필요한 정보를 발견하는 기존의 구글 이용법을 변화시키고 있습니다. 검색 결과를 나열하는 대신, 검색하는 내용에 따라, 인공 지능을 이용해서 검색 결과를 요약하면 이용자들이 더 빨리 정보를 찾으리라고 구글이 판단한 경우, 구글은 검색된 사이트를 중에서 이용자들이 가장 많이 클릭할 것 같은 사이트들의 정보를 가져와서 인공 지능을 이용해 그 정보를 요약해서 보여주는 것이 이 서비스의 핵심입니다. 


예전 공상 과학 영화에서 종종 볼 수 있는 장면이 있지요. 우주선의 선장이 마치 옆에 있는 부관과 대화하듯 말로 컴퓨터에게 질문을 던집니다. 그러면 컴퓨터는 선장이 필요한 정보를 음성으로 답을 해주지요. 이와 같은 묻고 답하는 방식의 정보 검색은 이미 구글이 처음 시작되었을 때부터 회사 안에서 이야기해 오던 서비스라고 하는데 30년도 지나지 않아 그것이 가능해진 것이지요. 


AI 개요 서비스에서는 요약된 정보의 전체 내용이 실려 있는 웹사이트의 링크도 포함이 되어 있고 또 검색 결과 페이지의 아래로 내려가면 우리에게 익숙한 검색 결과의 목록이 제시되기는 합니다. 하지만 과연 얼마나 많은 이들이 원래 정보를 가지고 있는 웹사이트로 가서 추가적인 정보 탐색을 할지는 의문입니다. 그리고 그렇게 보여주는 정보는 구글의 판단에 따라 이용자가 가장 많이 클릭할 것 같은 사이트의 정보라는 점도 걱정거리입니다. 사람들이 많이 클릭하는 정보라고 해서 그것이 반드시 정확한 정보는 아니기 때문입니다. 


무엇보다도 이 기능에 대해 염려스러운 점은 그동안 인터넷이 작동해 온 기존의 방식을 완전히 바꿀 수 있는 위험 때문입니다. 


인터넷을 통해 여러 가지 유용한 정보나 뉴스거리를 생산하는 이들이 많은데 그중에는 경제적인 이익에 대한 생각 없이 개인이 취미로 만드는 블로그나 웹 페이지도 있지만 이용자들의 방문을 통해 수입을 얻는 온라인 언론이나 웹 사이트들도 많이 있습니다. 이들은 이용자들을 유료로 가입하게 하는 방법으로 수입을 얻는 경우도 있지만 검색 엔진에 웹사이트를 노출시켜서 방문객을 끌어들이고, 그 방문객에게 광고를 보여 줌으로써 웹사이트의 수입을 얻고 그 수입으로 계속해서 정보를 생산합니다.  


구글의 새로운 정보 검색 방식은 이들의 수입에 큰 위협이 될 수 있는 변화입니다.  이들의 입장에서 보았을 때 설사 자신들이 만든 정보가 구글 AI 개요를 통해 노출이 된다고 하더라도 그것을 본 이용자들이 자신들의 웹사이트를 방문하는 일이 줄어들 것이라는 걱정이 당연히 나올 것입니다. 그리고 당장은 아니겠지만 이렇게 수입이 줄어들게 될 사이트들은 점점 새로운 정보를 생산해 내기 힘들 것이고 급기야 사이트를 닫아야 할 일이 생길 런지도 모릅니다. 


이런 위험은 온라인 정보 생산자(특히 문자로 된 정보 생산자)들에게는 당장 생존이 달린 문제가 되겠지만 더 멀리 본다면 이런 문제의 시작점이 된, 인공 지능 서비스 제공자들에게도 결코 도움이 되는 일이 아니라는 생각이 듭니다.  


그동안 인터넷을 통해 생산이 된 엄청난 양의 정보들은 사람들이 직접 생산한 정보들이었습니다. 인터넷 게시판이나 블로그 혹은 웹페이지를 통해 단위로 잴 수 없을 만큼 많은 정보, 특히 문자 정보들이 생산되었는데 그것들은 초거대언어모델(Large Language Model)을 학습시키는 데이터로 이용이 되었습니다. 그런데 그런 언어모델의 학습데이터가 될 인터넷상의 사이트들이 사라지게 된다면 인공 지능 서비스에는 어떤 일이 생길까요? 


학습 데이터를 확보하기 위해 인공 지능 회사들은 생산자들의 동의 없이 엄청난 양의 문자 데이터를 수집했고 심지어 출판사를 통째로 사서 그 출판사에서 만들어 낸 책 전체의 내용을 학습 데이터로 이용하려는 생각도 했다고 합니다. 그것도 모자라 유튜브의 비디오에 실린 목소리를 추출해서 텍스트화하고 그것을 학습데이터로 이용했다고 하고 최근에는 사람이 쓴 문서가 아니라 인공 지능이 만든 인조 텍스트(Synthetic Text)를 학습 데이터로 이용하려는 시도도 하고 있다고 합니다. 


그런데 사람들이 만들어 내는 정보를 인터넷에서 찾아보기 힘들어지는 상황이 되고 인공 지능이 만들어내는 인조 데이터를 인공 지능이 다시 학습하여 서비스를 할 때 그렇게 만들어지는 정보의 질이 어떨지는 아직 누구도 장담할 수 없는 일입니다. 물론 당장 일어날 일은 아닙니다, 하지만 그럴 가능성도 충분히 있지요.

지금 우리 곁에서 성장하고 있는 인공 지능 기술은 우리가 되돌릴 수 없는 일입니다. 우리의 의사와는 상관없이 우리는 이것과 함께 살아가야 합니다. 그렇다면 이런 상황에서 우리는 어떻게 생각하고 행동해야 할까요? 


정보를 생산하는 이들의 입장에서 본다면 인공 지능이 도저히 따라올 수 없는, 적어도 쉽게 흉내내기 힘든 내용을 이용자들에게 제공할 수 있어야 하지 않나 싶습니다. 생산하는 정보의 질에 대해 언제나 신뢰를 줄 수 있는 사이트를 만들거나 이용자들이 쉽고 가까이 접근할 수 있는 고유한 방식으로 정보를 생산하는 것, 그리고 굳이 인공 지능에 물어보지 않아도 그곳에 가면 내게 유용한 정보를 얻을 수 있으리라는 믿음을 이용자들에게 줄 수 있는 그런 곳을 만든다면 인공 지능과의 경쟁에서도 살아남을 확률이 있지 않을까 하는 생각을 해봅니다.  


아울러 정보를 소비하는 입장에서도 AI 개요와 같은 인공 지능 검색이 주는 편리함을 이용하되, 그것이 가진 한계를 알고 절대 있는 그대로 인공 지능이 토해 놓는 정보를 받아들이지 않는 현명함이 필요합니다. 그리고 정말 내게 중요한 정보라면 최대한 신중하게 정보의 출처를 살펴보고 몇 주 전 글에서 말씀드린 처럼 정보의 질을 따져보고 그에 맞추어 행동을 하셔야 되지 않겠나 싶습니다. 사람처럼 대화를 한다고 해서 그것이 더 믿을 만한 정보는 아니라는 점을 명심하셔야 합니다. 오히려 사람처럼 대화하면서 우리를 인공 지능을 만든 이들이 원하는 방향으로 생각하고 행동하게 할 수도 있다는 점을 생각해야겠지요. 


검색 엔진 최적화(SEO, Search engine optimization)에 대해서 많이 들어 보셨을 겁니다. 내가 팔고 싶은 물건 혹은 내가 보여주고 싶은 내용이 검색 결과의 상단에 오도록 조절하는 일들은 이미 일반적인 영업 전략이 되어 있습니다. 그런데 최근에는 검색 엔진 최적화와 같은 맥락에서 "인공 지능 최적화(A.I. optimization)"란 말이 나오고 있고 인공 지능에서 토해내는 말들을 자신들이 원하는 내용으로 만드는 기술들을 이야기하고 있습니다. 다음 주에는 그 이야기를 해 보겠습니다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari