그리고 그것이 넘어야 할 산들
미래학자이자 앞을 내다보는 예견이 비교적 정확한 것으로 유명한 visionary인 레이 커즈와일이 최근 AGI(aritificial general intelligence)의 출현 가능성에 대해 이러한 이야기를 했습니다.
AI의 수준이 아직 거기에 도달하지는 못했지만 2029년에는 어느 누구와도 맞먹는 수준이 될 것입니다. 저는 사실 보수적인 편입니다. 사람들은 내년이나 내후년이면 그렇게 될 거라고 생각하죠.
스스로 보수주의자라 평하는 레이 커즈와일의 '보수적인' 전망에 따르더라도, 결국 AGI의 출현은 이미 정해진 결론 같이 보입니다. 더구나 AGI vs. 개인은 물론이고, AGI vs. 인류 전체, 나아가 AGI vs. 인류 문명 전체로 비교해도 AGI가 압도하게 되는 것은 시간문제처럼 보입니다.
한 가지 주목할 사실은 레이 커즈와일의 예상에 따르면, 인간의 집단 지성은 결국 기껏해 봐야 선형 혹은 지수함수 정도 밖에 안 되는 것으로 평가하고 있다는 것입니다. 예를 들어, 2030년대 중반에 지구 상에 살고 있는 인간이 대략 100억 명 정도라고 가정해 봅시다. 커즈와일의 전망에 따르면 2029년 경에, AGI는 인간 1 개체 지능을 뛰어넘고, 매년 AGI의 성능은 증강될 것으로 예상됩니다. 그것도 선형이 아닌 비선형으로, 예를 들어 매년 r배씩 기하급수적으로 증가한다고 가정할 수 있습니다. 이러한 단순한 등비수열을 따른다면, 대략 매년 300배 정도씩 AI의 성능이 (지능이?) 강화될 것이라는 예상이 나옵니다.
이러한 전망은 단순히 인상적인 개인의 느낌적인 느낌에 기반한 것으로 치부하기에는 무리가 있습니다. 커즈와일은 누구보다도 AGI의 등장 가능성에 대해 오래 전부터, 심지어 현재의 딥러닝이나 LLM이 등장하여 대세가 되기 훨씬 전부터 계속 추적하고 연구해온 사람이기 때문이죠 (이에 대해 더 알고 싶으신 분들은 아래 링크 기사를 참고하시기 바랍니다).
https://m.khan.co.kr/opinion/column/article/201708092120025?fbclid=IwAR16PmaX8PV7hPvG0Paebu_aZiMkGk112IbjOq7MFq7WE3DBjD9QFVf1FrQ#c2b
문제는 이러한 기술적 진보가 가능한지 여부, 그리고 이렇게 단순히 인간 전체의 집단 지성을 계측 가능한 함수로 치부할 수 있냐는 것 같습니다.
일단 컴퓨팅 하드웨어가 그 정도의 급속한 발전을 담보할 수 있는지부터 생각해 봅시다. 일단 커즈와일의 예견에 내포된대로, 매년 300배씩 AGI의 지능이 강화된다는 것은 다른 말로 하면 매년 300배씩 AGI의 계산 성능이 강화된다는 것을 의미합니다. 이러한 멱함수(power function) 증가 추세가 가능해지려면, 무엇보다도 그러한 대규모 계산을 할 수 있는 컴퓨팅 하드웨어의 성능이 매년 300배씩 강화될 수 있어야 한다는 것을 의미합니다. 예를 들어, 어떤 IT 자이언트가 AGI 개발을 꿈꾸며 GPU를 매년 300배씩 더 증강하거나(즉, 사들이거나), 아니면 GPU 한 장의 성능을 300배씩 강화하거나, 혹은 둘 사이의 어디쯤에서 그에 상응하는 성능이 증강된 하드웨어가 갖춰져야 함을 의미합니다. 현재 엔비디아의 H100 GPU 서버가 대략 1억원 정도에 육박하는데, 예를 들어 IT 자이언트가 이러한 서버를 1만대 보유하고 있다면 1조원에 달하는 값어치의 하드웨어를 보유한 셈이 됩니다. 그런데 이러한 엄청난 값어치의 서버를 매년 300배씩 증강해야 한다면, 연간 300배씩 투자를 늘려야한다는 이야기가 됩니다. 물론 그렇게 300배는 커녕, 매년 3배씩, 4-5년간 하드웨어 구매 비용을 급증하는 것을 감당할 수 있는 회사는 지구 상에 존재하지 않습니다. 그럴 수도 없습니다.
다른 문제도 있습니다. 하드웨어 뿐만 아니라, AI 알고리즘 자체도 그에 버금가는 성능 향상을 이뤄야 하는 압박에 놓입니다. 그렇지만 현재까지 AGI를 향한 알고리즘 자체의 가속 경향은 대개 parameter 개수를 늘리는 volume expansion 방식에 의거하고 있어서, 여기에는 한계가 있을 것으로 생각합니다. 아주 단순하게 생각한다면, 수학적 알고리즘 자체야 파라미터 개수만 놓고 본다면 300배가 아니라, 3만배, 3억배로 늘리는 것은 아무런 문제가 안 될 것입니다. 문제는 그렇게 덩치가 커진 알고리즘을 돌릴 수 있는 인터페이스와 하드웨어일 것입니다.
결국 매년 비선형함수로 증강되어야 하는 AGI 입장에서, 그 현실화에 대한 bottleneck은 그것을 가능하게 하는 하드웨어 단에서 결정될 것입니다. 현재로서는 하드웨어가 그러한 성능 팽창을 충분히 뒷받침하기에는 역부족이라는 것이 AGI 연구자들, 그리고 IT 자이언트들의 고민인 것 같습니다.
그렇지만 사실 더 큰 문제가 기다리고 있습니다.
알고리즘이나 하드웨어가 어쨌든 더 많은 돈이든 더 새로운 혁신으로든, volume expansion을 할 수 있다손 치더라도, 그것을 가능하게 하는 에너지, 즉, 전력 수급 여부는 전혀 별개의 문제입니다. 특히 더 핵심적인 문제는 알고리즘이나 하드웨어 volume 팽창은 어쨌든 비선형으로 이루어질 수는 있다고 하더라도, 전력 수급은 그렇게 만들기가 불가능에 가까울 정도로 어렵다는 것입니다. 왜냐하면 전력 생산은 기본적으로 선형 함수이기 때문입니다. 신재생에너지의 대세인 태양전지를 예로 들 것 같으면, 발전량을 2배 증가시키기 위해서는 태양전지 패널 면적을 정직하게 정확히 2배로 가져가야 합니다. 이는 태양전지 발전소에 설치된 태양광 패널의 2차원 면적을 2배로 늘리는 것을 필요로 합니다. 그렇지만 우리가 태양전지 패널을 설치할 수 있는 지표의 면적, 나아가 지구상 전체의 표면적은 한계가 있습니다. 원자력 발전도 다르지 않습니다. 원전 발전량을 2배로 증가시키기 위해서는 원자력 발전 연료가 2배 필요합니다. 따라서 원전 1기에서 2기로 발전소 규모를 증가시켜야 할 것입니다. 더구나 이제는 RE100 같은 탄소중립충족 요건(carbon neutrality)으로 인해 과거의 화석연료 기반 발전 같은, 비교적 손쉬운(?) 발전 방식은 퇴출되는 상황이고, 원자력 발전소 역시 발전 단가에 고준위 방사성 폐기물 처리 비용이 산정되기 시작하면서 점점 불리해지고 있는 추세라, 신재생에너지 수급은 제조업 전반에 걸쳐, 그리고 IT 산업도 예외가 될 수 없는 상황으로 요구되고 있습니다.
이러한 신재생에너지 발전량을 매년 비선형함수로 증강시키기 위해서는 지금보다 훨씬 더 많은 자본이 에너지 기반 확보에 들어가야 합니다. 그렇지만 그 어떤 IT 자이언트들도 하드웨어 개발이나 알고리즘 개발에 비해, 발전원의 자력 확보에 더 많은 돈을 투자하겠다는 이야기를 들어본 적은 없습니다. 기껏해봐야 자사의 클라우드 서버 냉각 용 태양전지 패널 확장이나 풍력발전 시설 투자를 하겠다, ESS 같은 에너지 저장장치 시설을 확장하겠다는 정도 밖에는 없습니다. 물론 IT 업계에 있어 이러한 냉각용 전력 소모량도 상당하므로, 이를 스스로 감당하겠다는 것은 매우 중요한 작업이긴 합니다만, 사실 하드웨어 컴퓨팅 운용에 필요한 전력에 비하면 이는 새발의 피에 불과할 것입니다. 문제는 대부분의 IT 자이언트들은 그들이 사용하려는 대규모의 전력 수급에 대해, 그리고 매년 기하급수적으로 증가할 전력 수요량에 대해, 스스로 내밀 수 있는 솔루션이 없다는 것입니다. 이는 그 회사들이 속한 사회의 결단을 요구합니다. AGI의 발전을 위해 그 회사가 속한 지역 커뮤니티에 이른바 순환 단전을 요구할 수 있을까요? 빈번해지는 정전을 감당할 수 있을까요? 엄청나게 뛰어오를 전기료를 시민들이 감당할 수 있을까요? 민간 전력회사들은 이러한 투자를 감당할 자본을 조달할 수 있을까요?
이미 이러한 문제들은 TSMC가 위치한 대만에서 본격화되고 있습니다. 에너지 자급도가 매우 낮은 (10% 미만) 대만은 그렇지 않아도 신재생에너지 발전 여건이 매우 불리한데다가, 국토 면적도 좁고, 그나마도 대부분 산지입니다. 거기에 그나마 그간 잘 운용하던 원자력 발전소도 수명이 다해 폐쇄하거나 운용 유효 기간이 임박해 있는 상황에 처해 있습니다. 추가로 원전을 신규 건설할 계획도 없으려니와, 그럴만한 회사도 없죠. 그렇지만 대만을 대표하는 반도체 회사인 TSMC는 매년 훨씬 더 많은 전력을 필요로 합니다. 더 작은 패턴의 반도체를 만들어야 하고, 더 비싼 칩을 만들기 위해서입니다. 문제는 이렇게 에너지 수급이 불리한 대만에서 TSMC가 매년 10, 15% 씩 전력을 더 소모하게 될 경우, 대만 전체의 전력 수급은 매우 어려워질 것이라는 점입니다. 혹자는 2030년이 되기도 전에, 대만의 수도 타이페이에서조차 일반 가정집의 제한 송전이 이뤄질 가능성이 높다고 봅니다. 설사 제한 송전까지는 안 가더라도, 현재로서는 공급에 비해 수요가 무지막지하게 올라가는 상황에서 대만 시민들은 매년 최소 15에서 많게는 35%까지도 올라갈 전기료를 감당할 준비를 해야 합니다. 2030년쯤 되면 대만 시민들은 2024년에 비해 2-3배나 올라버린 그야말로 살인적인 전기세 고지처를 받아들여야 할 지도 모릅니다. 이렇게 되면 대만 시민들은 외부에서의 제한 송전이 아닌, 전기료가 무서워서 자발적인 전력 사용 감축을 해야 할지도 모를 것입니다. 이는 사실 대만만의 문제가 아닙니다. 불행히도 반도체를 위시로 하는 제조업 강국인 한국이나 일본, 독일도 예외가 될 수 없으며, AI 팹리스가 몰려 있는 미국도 예외가 될 수 없습니다.
사실 AGI가 꿈꾸는 비선형 팽창에 대해 이러한 물리적, 기술적 맥락에서 한계를 더 깊이 논하기 전에, 과연 인간 개체 한 단위의 지능과 인류 집단 전체의 지능(?) 사이에는 어떤 관계가 있는지조차 불확실하다는 것도 생각해 보아야 합니다. 혹자는 개체와 집단 사이의 지능 비교를 위해 단순한 선형 함수를 이야기하지만, 그보다는 더 복잡한 관계가 놓여 있을 가능성이 높습니다. 예를 들어 인류 집단 지성의 특징은 N^n (n>=2)에 비례할 것임이 확실합니다. 이는 인류가 개인 단위의 생활에서 현재 같은 집단 단위의 생활로 진화해 온 과정에서 누려온 사회적 잇점이기도 합니다. 다른 말로 표현하자면 충분한 문명을 이룰 정도로 진화를 해온 호미닌 계열 중, 현재 호모 사피엔스가 주력이 된 이유는 바로 호모 사피엔스가 사회적 동물로서의 기능을 획득하면서 이러한 N^n 함수 형태의 상호 작용에 기인한 정보의 공유와 확장에서 오는 잇점을 누려 왔기 때문이라고 볼 수 있습니다.
아주 단순하게 생각한다면 이러한 함수는 C(N,2)의 조합 공식을 생각한다면, N^2이 되어야 할 것 같지만, 인간은 단순한 independent & individual agent 이상의 기능을 발휘한다는 것도 기억해야 할 특징이지 않을까 합니다. 예를 들어 A, B, C 세 사람이 있을 때 이들의 상호작용은 A-B, A-C, B-C 세 종류만 있는 것이 아니라, A-B-C , AB-C, A-BC, AC-B도 가능해집니다. 그리고 상호작용 후, 각 개체 혹은 집단의 정보는 원래의 정보만 같을 뿐, 이미 각 개체 혹은 집단 내에서의 처리를 거쳐 전혀 다른 형태의 정보로 바뀌기 때문에, 정보의 상호작용에 의한 개인, 혹은 집단의 지성은 상수로 고정되었다고, 혹은 변하지 않는다고 보기도 어렵습니다. 따라서 N^n에서 n은 2보다 커질 수 있는 것입니다. 이를 확장한다면 개인 대 사회의 상호작용, 집단 간 상호작용, 오프라인은 물론, 온라인에서의 상호작용, 나아가 과거와 현재, 혹은 현재와 미래 (추정) 시대 간 상호작용 등으로 얼마든지 추상적으로 확장될 수 있습니다.
물론 이러한 모든 종류의 정보 상호작용을 모두 고려하는 것이 가능하다면, 아마도 보다 정밀한 인류 집단 전체의 지성 측도(measure)를 정의할 수 있는 함수를 만드는 것이 가능해질지도 모릅니다. 그렇지만 그렇게 할 수 있다손 치더라도, 그 함수는 우리의 예상보다 훨씬 더 큰 확장력을 갖는 함수가 될 것임은 자명해 보입니다. 물론 그 함수가 NP(non-deterministic polynomial) 형태의 함수, 즉, 다항시간 이내에 계산이 가능하지 않은 수준의 함수가 될 것이라고 생각하지는 않습니다. 만약 그랬다면 인류는 지금보다 훨씬 더 빠르게 진화를 해 왔을 것이고, 아마도 멸망도 훨씬 빨리 맞았을테니까요 (fast foward). 다만 불과 5년 안에 인류 1명의 지성에서, 인류 전체 수십 억명, 역사를 통틀면 수백 억명 전체와 그들이 이뤄 온 과거와 현재의 크고 작은 모든 집단이 만들어 낸 지성을 압도하는 AGI가 쉽게 나올 것이라 생각하지는 않습니다. 단순하게 생각하여 AGI의 알고리즘과 컴퓨팅 하드웨어와 전력 소모량이 300배씩 빨라진다고 해도, 그것은 그저 인류 집단의 지성을 약한 비선형함수로 추정한 것에 근거한 외삽 계산 결과에 불과할 것이기 때문입니다.
사실 인류가 AGI에 대해 정말 염려 혹은 각성해야 하는 부분은 인류가 그간 쌓아 온 지적 문명의 발전 방향이 이제 인류가 아닌 AGI에 의해 결정되는 것을 인류가 손 놓고 바라보아야 하는 상황이 도래하는 것일 것입니다. 물론 혹자는
AGI도 결국 인류 지성의 연장선 상으로 볼 수 있으니, AGI에 의해 이러한 발전 방향이나 원동력이 생기는 것은, 그간 인간이 수많은 도구를 개발하고, 그를 통해 새로운 기능을 획득하여 각종 시행착오를 거쳐 더 발전된 문명을 이룩해온 방식과 근본적으로는 차이가 없는 것 아닌가?
라며 이야기하기도 합니다. 그렇지만 지금까지의 도구와는 달리, 이 AGI는 단순히 도구 차원을 넘어, 도구가 다른 도구를 스스로의 판단과 필요에 의해 얼마든지 창출하고 창조하게 된다는 것이 주목할 차이점이지 않을까 합니다. 또한 지금은 거기서 거기처럼 보이는 여러 종류의 AGI 후보군들이 나중에는 다변화되어, 마치 개성이 서로 다른 인류 개체처럼, 서로의 개성이 다른, 그리고 각각의 장점이 뚜렷하게 구분되는 개체들로 분화된 후, 인류가 그랬던 것처럼, 다양한 집단적 상호작용을 거듭하여 인류가 수백 만년 동안 이룩한 진화 속도를 불과 수천 년, 수백 년 단위로 단축시킬 수 있는 방식을 체득할 수 있다는 것도 우리가 더욱 주의깊게 바라봐야 하는 지점이 아닐까 합니다. 물론 그렇게 되기 위해서는 AGI를 이루는 생태계 자체가 더 다양해져야 할 것인데, 이러한 다양성의 획득 대비, 각 AGI의 성능 개선 중, 어떤 것이 더 중요한 작용을 하게 될지는 두고 봐야 할 것 같습니다.
미래학자로서, visionary로서 레이 커즈와일의 통찰력과 전망은 늘 우리에게 깊은 인상을 주어 온 것은 사실입니다. 그렇지만 AGI의 본질이나, AGI가 가지게 될 '지능'과 그것을 가능케 할 하드웨어/알고리즘의 실현 가능성, 에너지 한계, 그리고 인류 전체의 집단 지성과의 비교 방식과 앞으로의 전망은 한 사람의 visionary가 바라보는 예상을 넘어, 더 많은 토론이 필요한 영역이라고 생각합니다. 기술적 내용은 물론, 다층위에 걸친 회의적 사고가 필요한 지점으로 바뀌고 있다고 생각합니다. 이러한 논의는 이제 기술적 영역을 넘어, 문명 전체, 문명의 근간, 그리고 인간이 지금까지 문명을 이룩해온 역사 스케일 전체로 확장되어 생각해 볼 시점이 된 것이라 생각합니다.