스카이넷이 아니더라도

AI에 대한 몇 가지 염려

by 블랑슈

AI 기술은 부정할 수없이 사람들의 주된 관심사다. (NVIDIA 주가만 보아도 알 수 있다 - 요즘은 다시 좀 떨어지긴 했지만) 어떤 사람들은 AI를 인류의 마지막 발명품이라고 하며 두려워하고, 어떤 사람들은 세상을 훨씬 나은 곳으로 만들 것이라 하며 적극적으로 나선다. 내 입장은 그 둘 사이 어딘가에 있지만, 오늘은 다소 부정적 가능성을 몇 가지 제시해 보려 한다.



더 크게, 더 많이 - 정보의 독과점

일반인들에게 널리 알려져 있는 ChatGPT를 비롯한 여러 AI 모델은 사실 AI의 넓은 분야 중 LLM(거대언어모델)이라는 한 분야에 속한 것들이다. 이름이 뜻하듯이 이런 모델은 매우 크다. GPT 3.5는 1750억 개의 변수를 가진 것으로 추정되고, (오픈AI가 오픈을 안 해서 정확히는 모른다) GPT 4는 1조 8천억, 내년 초에 나올 것으로 예상되는 GPT 5는 5천억 개의 변수를 가질 것으로 예상된다.


이게 어느 정도냐면, GPT 4 기준으로 엔비디아 최고의 GPU 칩인 V100 1만 대를 가져다가 150일 동안 내리 돌려야 훈련시킬 수 있는 양이다. 이 과정에서 소모하는 전력은 화력발전소 2대에 맞먹으며 (이산화탄소 2000만 톤 배출 - AI의 환경적 측면도 큰 문제다) 들어가는 비용은 샘 알트만 말마따나 1억 달러를 넘는다고 한다.


그런데 문제는 AI 모델은 계속 커지기만 한다는 것이다. 기본적으로 새로 나오고 있는 모델들은 크게 혁신적으로 바꾸지 않고 (다 Transformer이라는 구조를 기본적으로 사용한다) 그저 기존 버전에서 사이즈를 늘린 변형에 가깝다. 하지만 주먹구구식으로 사이즈를 늘리기만 해도 성능이 증가하니 계속 크기는 늘어난다.


이렇게 되면 당연하게도 문제가 발생한다. 수억 달러를 들여 더욱 커지는 AI 모델을 학습시킬 수 있는 회사는 손에 꼽을뿐더러, 그만큼 방대한 양의 데이터 (오로지 텍스트로만 수 TB에 달한다)를 가져올 수 있는 회사들도 드물다. 지금 나오는 모델은 대부분 OpenAI (MS와 함께), 구글, 메타 셋 중 하나가 개발한 것이다. 결국 모두가 활용하는 이 강력한 툴은 몇 개의 빅 테크 기업이 독과점하며, 요즘은 인터넷에서 정보를 얻을 때 AI가 중간에 한 번 가공해주는 것을 볼 때 머지않아 현 시대에 가장 중요한 자원인 “정보”를 통제할 수 있게 될 것이다.



Strawberry에는 2개의 R이 있습니다 - 그리고 만약 블랙박스를 이해한다면?

LLM을 비롯해 Midjourney 같은 이미지 생성 AI, ElevenLabs 같은 목소리 생성 AI를 통틀어 “생성형 AI"라 부른다. 생성형 AI의 기본 로직은 수많은 데이터 중 주어진 문제에 가장 확률적으로 개연성이 높도록 결과물을 생성하는 것이다. 예를 들어 LLM에서 "테일러 스위프트는..." 을 쿼리로 넣는다고 하자. 그러면 가수부터 농구선수까지 온갖 가능한 후보들이 나오고, 읽어들인 데이터를 바탕으로 그중 가장 확률이 높은 "가수"를 답변으로 채택한다.


문제는 위에서 말했듯이 AI 모델이 너무나 크기 때문에 그 사이에 정확히 어떠한 과정으로 데이터를 변환하고 확률을 계산하는지 알 수가 없다는 것이다. 지금까지 인간이 만든 모든 발명품과 AI가 다른 점은 이것이다. AI를 만든 인간도 AI의 작동 방식을 이해하지 못한다. 이를 블랙박스 문제라고 부르는데, 입력과 결과는 알고 있지만 그 사이를 모르기 때문이다. 그래서 여러 가지 프롬프트 (질문)으로 AI의 능력을 테스트해보는 것이 재미있는 것이다. 마치 미지의 물체를 찔러보듯, 나도 어떤 답변이 나올지 예상할 수 없기 때문이다.


한 가지 확실한 것은, AI는 귀납적(data-driven)이지, 연역적(rule-driven)이지 않다. 그래서 때로는 AI가 우리가 원하는 방향과 다르게 튀어나가기도 한다. 이를 할루시네이션(hallucination)이라고 부르는데, 제대로 알지도 못하는 것을 안다고 말하거나 꾸준히 잘못된 답을 한다. 유명한 문제로 "Strawberry"라는 단어에 "R"이 몇 개 들어가는지 질문하는 문제가 있다. 연역적으로 푼다면 이건 초등학생도 코드를 짤 수 있는 아주 간단한 문제다. 그런데 수억 달러를 들여 만든 AI는 이것을 답하지 못한다. 문제를 "이해하고" 푸는 것이 아니라 그저 위 문장에 이어질 말들 중 가장 확률이 높은 단어들을 내뱉기 때문이다.


그래서 요즘 AI 연구의 추세는 쓸데없이 커다란 모델을 줄이고 (위에서 언급한 수천억 개의 변수 중 꽤 많은 수는 필요가 없다는 것이 밝혀졌다) AI의 작동 로직을 이해하기 위해 블랙박스를 까보는 쪽으로 가고 있다. 우리가 발명한 물건을 다시 연구 대상으로 삼아 원리를 파악해 보는 것이다. 한 층 한 층 뜯어보고 이런저런 실험을 하며 이 부분은 논리를 담당하는구나, 이 부분은 이미지 인식을 담당하는구나, 알아보는 것이 흡사 뇌과학과 닮았다.


다만 블랙박스를 이해해서 조작할 수 있게 된다면 어떻게 될까? 당연히 AI에 대한 과학자들의 이해는 높아지겠지만, 이를 바탕으로 특정 방향으로 편향된 결과를 내놓게 할 수도 있을 것이다. 위에서 언급한 독과점 현상, 그리고 많은 사람들이 AI를 무비판적으로(정보를 얻는 과정이 쉬워질수록, 이것이 과연 타당한지 알아보는 과정은 더 귀찮아진다) 제2의 뇌처럼 쓰는 경향을 생각하면 꽤나 무서운 결과로 이어질 수도 있겠다.



위 이미지는 AI로 생성되었습니다 - 콘텐츠의 범람과 되먹임 현상

어디선가 이런 농담성 글을 본 적이 있다 - "AI가 집안일을 하는 동안 저는 글을 쓰고 싶었는데, 제가 집안일을 하는 동안 AI가 글을 쓰고 있네요." 글뿐만이겠는가. 사진, 영상, 음악까지 생성형 AI가 안 닿는 분야가 없다. 생각보다 실제로 귀찮은 일 (ex. 설거지)에는 아직 도움이 별로 안되지만... ChatGPT가 나온 게 2년 전인데, GPT 세대로 입학한 친구들은 이미 학업에 GPT의 도움을 받는 것을 당연하게 하더라. 나는 아직까지 그저 갖고 놀기만 했는데 말이다.


문서 서식을 컴퓨터가 알아서 해주는 것은 편하다. 그런데 이제는 글도 써주고 디자인도 해주고 음악도 만들어준다. 예전의 기계는 단순 반복 작업을 대체했다면, 이제는 가장 "인간적인" 영역이라고 여겨왔던 "콘텐츠"의 제작까지 대량생산할 수 있게 되었다. 물론 인간이 쓴 것에 비해 질이 떨어지지만, 어짜피 인터넷에 떠도는 많은 콘텐츠는 수준이 그리 높지 않았다. 그중에서 진짜 좋은 콘텐츠를 찾는 것이 이전에도 어려웠는데, 이제는 AI가 대량으로 생성한 콘텐츠까지 있으니 더욱 하늘의 별 따기가 되겠다.


다소 섬뜩한 것은, 정보의 되먹임 현상이다. AI는 학습을 하기 위해 데이터를 긁어오는데, 그렇게 대량의 데이터를 얻어올 수 있는 곳은 인터넷밖에 없다. 그런데 인터넷에 AI가 생성한 콘텐츠의 비중이 점점 커진다면 (그리고 분명 그렇게 될 것이다 - 인간이 한 편의 글을 쓸 동안 AI는 수십 수백 편을 풀 수 있다) 나중에는 AI가 AI가 생성한 콘텐츠를 바탕으로 학습되고, 그러면 점점 AI를 제어하는 데에 있어 인간이 만든 콘텐츠의 비중은 줄어들고, 그러면 AI의 할루시네이션 현상은 자기-강화되고, 그러면 어디로 튈지 진짜 예측 불가능하다. 그리고 정보를 얻는 것을 AI와 인터넷에 의존하고 있는 인간은 이 정보가 과연 진짜인지, 아니면 이해할 수 없는 AI의 블랙박스 속에서 난데없이 창조된 것인지 구분할 수 없을 것이다. 피곤하게 정보의 사실성을 따지는 사람은 더욱 소수가 되고, 대중은 더욱 쉽게 "맞춤형"으로 찢어질 것이다.


<트랜스포머>의 스카이넷처럼 AI가 자의식이 생겨서 세상을 정복할 확률은 극히 적다고 생각하고 있다 (물론 이 글은 아직 2030년의 AI 대혁명이 일어나기 전에 쓰였다). 하지만 그보다 쉽게 세상을 나쁜 쪽으로 변화시킬 수 있는 방법들이 많으며 그중 일부는 이미 일어나고 있다. 근본적으로 AI의 문제라기보다는 (AI는 그저 도구일 뿐이다!) 이를 활용하는 사회 구조와 시스템의 문제일 것이다. 어떻게 "막을" 수 있는지는 모른다. 혹은 과하게 불길하게 예측한 것일지도 모른다. 하지만 분명한 것은 AI 시대에 또렷하게 살아남으려면 인간의 사고력, 특히 비판적 사고력을 예리하게 훈련시켜야 할 것이라는 점이다.

keyword
작가의 이전글글로 선물하기