brunch

You can make anything
by writing

C.S.Lewis

마시미니와 토노니의 『의식은 언제 탄생하는가?』를 읽고

의식의 양을 재는 파이(Φ), 한 발자국도 들어가지 못한 의식의 신비

2019년에 Templeton Foundation에서 2000만 달러를 걸고 상반되는 의식 이론을 경연을 걸어 누가 더 나은 실증적 예측을 하는지 조사했다. 일명 ‘Cogitate 프로젝트’. 붙은 두 이론은 스타니슬라스 드앤의 ‘전역 신경 작업 이론(GNWT: Global Neuronal Workspace Theory)’줄리오 토노니의 ‘통합 정보 이론(IIT: Integrated Information Theory)’이었다. 4년이 지나고 2023년 올해 드디어 결과가 발표되었다는 소식이 들렸는데, 줄리오 토노니의 IIT이 드앤의 GNWT보다 더 좋은 점수를 얻은 모양이다. 


나는 드앤의 GNWT에 대해서 공부해 보거나 들어보진 못했지만, 눈꼽만큼의 조사를 통해 다음과 같이 이해할 수 있었다. 의 전두엽 감각 입력으로부터 정보를 수집하고 행동의 우선 순위를 매기는 중앙 컴퓨터 역할, 즉 의식에 있어서 아주 중요한 역할을 하므로 전두엽이 중요하다. 나는 토노니의 IIT에 대해서 많이 알지는 못하지만, 적어도 GNWT보다는 완전 눈꼽만큼은 배움이 있다. 자그마치 내가 석사과정생일 때, 그의 논문을 읽어본 적이 있었다. 이 이론은 뇌의 특정 부위(예를 들어, 전두엽)보다는 뇌의 전반적인 연결성과 통합성이 의식을 만드는 데 있어서 중요하다고 말한다.


두 이론은 상반된 특성을 가지고 있기 때문에, 경연을 하고 예측력을 비교해 승를 가리기 좋은 쌍이라고 생각된다. GNWT는 모듈주의적이다. 전두엽처럼 뇌의 특정 모듈이 중요한 역할을 한다. IIT는 연결주의적이다. 모듈이 중요한 게 아니라 전체적인 통합성과 정보가 어떤 식으로 구되는지가 중요하다. ‘모듈주의’와 ‘연결주의’라는 인식의 틀로 이 두 복잡하고도 고차원적인 이론의 대결의 함의를 정리하고 축소시키는 게 옳은지에 대해 자신은 없다. 나는 이제 연구자도 전문가도 전공 학생도 아닌, 일개 독서가일 뿐이니까. 그러나 나는 이 주제와 연관된 책들에 대해 몇 개의 서평을 써갈긴 적이 있다. 아래에 몇 개의 글들의 링크를 걸어 본다.


 나에겐 누가 이겼는지에 대해서 큰 관심은 없다. 왜냐하면 분명히 의식의 신비 고작 두 이론 중 하나만으로 완전하게 설명될 수 있는 주제가 아닐 것이므로. 일단은 IIT에 대해 설명해 놓은 책, 『의식은 언제 탄생하는가?』를 어 보았으니 그에 대한 (연구자도 뭣도 아닌) 독서가로서의 나의 감상을 말하려 한다.




이탈리아 출신 과학자 줄리오 토노니의 통합 정보 이론 (Integrated Information Theory), 일명 IIT는 버전이 있다. 최신 버전은 IIT 4.0이고, 2023년 올해 쓰인 논문을 참조할 수 있다. 이번에 읽었던 책, 『의식은 언제 탄생하는가?』의 이탈리아판 원서 『Nulla Di Più Grande』(2013)는 아마 IIT 2.0 시절에 쓴 책인 걸로 보여진다. 책이 쓰고 1년 후인 2014년에 3.0 버전이 나왔는데, 이후 2018년에 『Sizing up Consciousness』라는 영어 번역본 안에 3.0의 내용이 포함되었을 수도 있다. IIT 버전 1.0도 있었을 테지만, 그건 너무나 오래 전이라 그것이 언제 발흥되었는지에 대한 정보는 얻기 힘들다. 버전이 1.0인 시절에 이론 이름에 ‘1.0’이라는 명명을 하지 않았을 테니 검색도 잘 안 된다. 그것은 내가 대학원생으로서 논문으로 읽었던 시절의 버전일 테다. 여튼 대략 2010년 이전의 모든 IIT는 모두 1.0 버전이겠다.


Marcello Massimini & Giulio Tononi - Nulla di più grande (2013)


이게 다 뭐냐면, 한낱 독서가로서 이 IIT의 진면모를 습득하고 파악하기는 너무나 험난하다는 핑계에 대한 빌드업이다. 사실 과학 서적으로서 꽤 얇은 『의식은 언제 탄생하는가?』로 IIT의 진면목을 파악하기엔 조금 부족하다고 느껴지는데, 그 책엔 가장 중요하고 필요할 내용인 의식의 양 지수 파이(Φ)를 계산하는 방법이 들어있지 않기 때문이다. 스스로 ‘연구자’가 아닌 ‘독서가’임을 스스로 컨셉화하고 있음에도 불구하고 그 이론의 면모를 자세히 살펴보기 위해서는 논문을 참조해 볼 수밖에 없는 상황이었다. 그래서 나는 2.0부터 4.0까지의 모든 논문을 ‘펼쳐’는 보았다. 하지만 그 이론에 대한 방대한 수식과 부가적인 설명들을 이해하기에는 시간도, 노력도 부족함을 인정할 수밖에 없었다.


핑계처럼 들리겠지만, 이건 온전히 내 실력이 부족한 탓은 아니다. 텍사스 대학교의 컴퓨터과학 교수 스콧 아론슨 또한 IIT의 복잡하고 단순하게 정리되지 않는, 너무나 방대한 이론의 설명에 약간의 불만을 제기하기도 했다.

IIT에 관한 문헌은 블로그 게시물에서 정의하기에는 너무 방대하다. 놀랍게도, “1차” 문헌 외에도  “2차” 문헌도 있는데, 그것 또한 IIT의 의식에 대한 추가적인 추측을 취급하는 확립된 기반이다. (...) 이 주장을 정당화하려면 먼저 Φ를 정의해야 한다. 놀랍게도 Φ에 관한 대규모 문헌에도 불구하고 나는 그것에 대한 명확한 수학적 정의, 즉 공식을 나열했을 뿐만 아니라 공식이 말하는 구조를 완전히 정의하는 정의를 찾는 데 어려움을 겪었다. 문제를 더욱 복잡하게 만드는 것은 문헌에 ΦDM(이산 기억 없는), ΦE(경험적인), ΦAR(자기 회귀) 등 서로 다른 상황에 적용되는 여러 경쟁적인 정의가 있다는 점이다.



나는 이 타이밍에 이론이 복잡하다면 좋은 이론이 아니라는 “오컴의 면도날” 카드를 만지작거린다. 하지만 아직은 때가 아니다. IIT라는 이론이 아직은 미완성 단계이기 때문에, 내가 이해하지 못하는 그 엄청나게 복잡하고 방대한 수식 사이에 미래에 발견될 보석과도 같이 대칭적으로 잘 커팅, 아름답고 심플한 ‘의식의 신비’가 숨어 있을 지도 모른다. IIT 4.0은 아직도 버전 넘버가 많이 부족할 지도 모른다.




그러므로 는, IIT의 핵심인 의식의 양 지수 파이(Φ) 계산에 대해 아주 성글고 두루뭉술한, 거의 비유에 가까운 설명으로 이해하려고 한다.  『의식은 언제 탄생하는가?』의 설명을 참조하면, 의식은 정보의 통합에 대한 양과 함께 실현되지 않은 가능성의 다양함에 대한 양의 복합적 지수이다. 즉, ‘정보의 통합’과 ‘가능한 조합의 다양성’을 동시에 수치로 나타내는 양다. 아래 그림은 에 실린 그림 5-3이다.

그림 5-3. A. 정보 연결 통합성이 낮은 경우. B. 가능한 조합의 다양성이 낮은 경우. C. 정보 연결 통합성과 가능한 조합의 다양성이 동시에 높은 경우.

그림의 A를 보자. 이 그림은 정보의 연결이 네 모듈로 쪼개져 있으며, 그 때문에 통합성이 낮다. 그림 B는 이와는 반대로 모든 정보의 가능한 연결이 전부 이어져 있으며, 정보의 통합성은 극도로 높다. 하지만 그로 인해 조합의 다양성이 감소되는 일을 겪었다. 그렇게 해서, 모든 가능한 연결을 모두 잇지 않은, 듬성듬성한 연결성만을 가진, 적절히 통합되고 적절히 다양한 가능성을 내포한 그림 C야말로 IIT에서 계산하는 의식의 양 지수 파이(Φ)가 가장 높다.


나에게 이 파이(Φ)에 대한 계산법은, 중고등학교 수학 시간에 배웠던 ‘조합에 대한 경우의 수’라는 아주 단순한 계산처럼느껴다. 예를 들, “열 명의 사람 중 몇 명을 선출할 때, 그 경우의 수가 가장 많아지겠는가?”라는 질문을 생각해 보라. 정답은 5명이다(₁₀C₅=252). 열 명 중 한 명을 뽑 것은(₁₀C₁=10) 열 명 중 아홉 명을 뽑는 경우의 수와 동일하며(₁₀C₉=10), 경우의 수를 최대한 다양하게 하려면 너무 많지도, 너무 적지도 않은 중간 수치를 골라야 한다. (이 설명은 단지 비유적인 의미로만 받아들이자. 실제 계산법은 논문을 참고해 보았을 때 굉장히 방대하고 복잡하다.)


사실 IIT에서 기술하는 파이(Φ)에 대한 정의는 좀 복잡하게 들린다. 왜냐하면 두 가지의 양을 복합해 정의에 이용하고 있기 때문이다. 그것은 '정보의 통합에 대한 양'과, '실현되지 않은 가능성의 다양함에 대한 양'이다. 나는 이런 정의가 좀 만족스럽지 않다고 생각하여, 조합 경우의 수 계산을 비유하여 파이(Φ)의 더 간단하고 단일한 정의를 내 맘대로 만들어 보려고 한다. 조합 경우의 수 계산을 볼 때, 한 명을 뽑는 것과 아홉 명을 뽑는 것은 의미적으로 큰 차이가 있음에도 불구하고 그 본질은 같다. 왜냐하면 아홉 명을 뽑은 경우는, 단지 '뽑히지 않을 한 명을 뽑는 것'과 같기 때문이다. (그래서 계산 또한 같다.) 조합 경우의 수와는 다르게, 파이(Φ) 값 두 방향의 극값에 대한 의미가 서로 다르다. ('정보의 통합에 대한 양'과, '실현되지 않은 가능성의 다양함에 대한 양') 그러나 나는 그것이 본질적으로 큰 차이를 발생시킨다고 느껴지지 않는다. 너무 많은 정보의 연결 또한 너무 적은 정보 연결과 비슷한 상태처럼 취급하고 싶다. 두 가지 상태의 공통적인 특성으로 이렇게 말할 수 있지 않을까? '단순함'.


그렇다면, 반대로 파이(Φ) 값이 최대가 되는 상태의 특성을 두 단어가 아닌 한 단어로, '복잡함'이라고 말할 수 있겠다. 좋다. 의식은 '복잡'하다. 그것은 일리가 있다. 우리의 뇌는 복잡하며, 또한 그렇기 때문에 의식이 있다. 온도조절기나 8비트 컴퓨터와 같은 단순한 시스템은 단순해 보이며, 그래서 의식이 없는 것처럼 보인다. 그러나 이런 시스템에서도 의식의 양 파이(Φ)를 계산해볼 수는 있을 것이다. 온도조절기의 파이(Φ)는 어쩌면, 완전히 0은 아닐 지도 모른다. (내가 모르는 계산법에 따르면 아마도 그럴 것이다) 엥? 그렇다면, 온도조절기에도 양의 값을 가지는 의식이 있을 수도 있다는 얘기가? 그렇다. 철학자 대니얼 데넷에 의하면, 온도조절기가 아주 단순한 계산을 수행하긴 하지만 그것에도 아주 단순한, 우리가 의식이라고 정의내리지도 못할 만큼 단순한 의식이 내재되어 있을 수도 있다. 그와는 반대로, 우리의 뇌나 어쩌면 ChatGPT 4.0에는, 온도조절기의 하찮은 의식의 양 파이(Φ)와는 비교조차 불가능할 정도로 어마어마한 파이(Φ) 값이 계산될 것이 거기에는 의식이 깃들어 있음이 분명하다. 나는 이런 식의 접근이 의미있다고 생각하며 IIT에 찬성표  표를 던진다.




하지만...나는 이걸로 모든 것이 다 아름답게 끝났으리라고 보진 않는다. 의식은 복잡하다. 그리고 그 수치는 측정 가능하다. 하지만, 어떤 복잡한 시스템 그 복잡함 자체로 인해 의식의 소유를 담보하는지에 대해선 확실하지 않다. 다시 말해, 그 조건은 필요충분하지 않을 수 있다. IIT의 파이(Φ) 계산이 우리의 뇌 수준으로 산출죄도록 '일부러' 설계한 인공 시스템을 생각해 보자. 여기엔 의식이 있을까? 위에서도 언급한 컴퓨터과학자 스콧 아론슨은 그의 블로그 글에서, 일부러 파이(Φ) 값이 높게 나올 수밖에 없는 어떤 수학 행렬에 대해 소개했다. 당연히 행렬엔 의식이 없다. 그것은 단지 종이에 쓰여지거나, 디지털 저장소에 가만히 잠자고 있는 것이기 때문이다. 즉 의식은 복잡하지만, 복잡하다고 모두 의식을 가지는 건 아니다.(어쩌면, 스콧 아론슨은 그 행렬에서 의식을 가지기에 꼭 필요한 것을 놓쳤을 수 있다. 그것은 '시간'일지도 모른다. 우리의 뇌 스냅샷이 의식을 가지지 않고 오직 시간이 흐르는 뇌만이 의식을 가지듯이, 행렬도 시간이 흐르면 의식을 가지게 될 수도? 그렇다면, '행렬은 종이에 쓰여져 있기 때문에 의식을 가지지 않는다'는 반론은 불합리하다. 행렬이 시간-의존적인 함수로 재정의된다면 그 행렬은 의식을 가질 수도 있다. 일단 이 이상한 아론슨-행렬에 대해서는 이정도만 생각해 보넘어가자.)


예상되는 반론 두 가지를 제시해 보겠다. 그중 하나를 "거창한 반론"이라고 칭하겠다.

거창한 반론: IIT의 방식으로 정의된 값 파이(Φ)는 그냥 단순한 복잡함을 나타내는 지표가 아니다. 그것은 어떤 시스템의 복잡성이 의식의 특성을 나타내는 데 꼭 필요한 방식으로 정의된 복잡함의 지표이다. 파이와 다르게 정의된 복잡성 지수가 있다면, 그 지수는 파이 지수에 비해 시스템이 의식을 가졌다거나 덜 가졌다거나 하는 식의 정보를 주지 못할 것이다. 오직 파이 값만이 그런 의식에 대한 정보를 정확이 측정한다. 그러므로 파이가 높다면, 거기엔 반드시 의식이 있다. 의식이란, 바로 파이 값이 높다는 것으로 필요충분하게 정의되는 것이다.


이 반론은 마치 범심론처럼 들린다. 우주와 자연의 곳곳에 신이 존재하듯이, 아니 그것이야말로 신이라는 정의이듯이, 파이 값이 높다면 그것이야말로 의식이다. 이러한 주장에 따르면, 우리는 우리가 원래대로라면 의식으로 생각하지 않았던 모든 시스템들, 온도조절기, 8-bit 컴퓨터, 시간-의존적 아론슨 행렬, (안에서 입자들을 주고받는) 은하계 등에 모두 작거나 큰 의식들이 있다고 보아야 한다. 나 또한 이런 관점을 꽤 흥미로워하며 지지를 보내고 싶다. 하지만...정말로 이런 게 괜찮을까? 온도조절기의 파이가 1이고, 8-bit 컴퓨터의 파이가 100이고, 우리 뇌의 파이가 1억이라면, 정말로 온도조절기엔 우리보다 1억분의 1만큼의 의식이 존재한다는 건가?8-bit 컴퓨터는 정말로 온도조절기보다  배나 뛰어난 의식이 있는가? 이런 의식에 대한 정의가 정말로 의식의 신비를 탐구하는 우리를 만족시키는가? 우리는 의식이 인간과 동물 (개, 고양이, 소, 어쩌면 문어 정도, 아주 작게는 곤충)만이 가지고 있는 의식, 컴퓨터에 탑재될 의식의 설계도, 그리고 진짜로 있을지 없을지 모를 외계인의 의식만을 연구하고 싶었다. 온도조절기의 의식은...솔직히 그다지 알 필요가 없는 논외의 주제처럼 들린다. 모든 것을 의식으로 정의하는  우리에게 큰 도움이 안 된다.

 



두 번째 소박한 반론이라고 이름 붙였다. 사실 줄리오 토노니의 입장은 이보다는 '거창한 반론' 쪽에 가깝지만, 그래도 이런 식의 주장이 존재할 수 있다고 난 본다.

소박한 반론: IIT의 파이는 의식을 정의하기 위한 게 아니다. 단지 인간과 동물들, 개, 고양이, 소, 어쩌면 문어, 아주 작게는 곤충 들과 같이, 또 우리가 컴퓨터에 탑재하고 싶어하는 의식의 설계도, 의식이 있을지 없을지에 대해 궁금한 시스템들에 있어서, 그 정량적 수치와 비율, 크기의 대소 비교를 산출하는 실용적인 용도로 쓰이도록 만들어졌을 뿐이다. 온도조절기에 파이 값을 산출하는 등 우리의 상식 선에 정해진 테두리 바깥으로 그 잣대를 들이대는 건 허용된 행위가 아니다.


이 반론은 하는 말은 너무나 옳고 반박 불가능하다. IIT의 목적이 바로 이 정도로 소박하다면, 이 이론은 실용주의적으로 위대하다. 이 이론은 대뇌와 소뇌의 의식의 유무를 계산해 내었고, 식물인간과 의식이 있는 무슨 환자의 차이점도 예측해 냈다. 하지만, 소박한 건 소박한 대로 문제가 있다. 의식이 있을 법한 시스템에만 제한적으로 쓴다 하는 것은, 우리가 이미 어떤 시스템에는 의식이 존재할 것이라는 사실을 예견하는 능력이 있음을 뜻한다. 그렇다면, 파이의 목적은 소박해도 너무 소박하다. 이 이론은 의식의 신비(의식의 어려운 문제, 즉 감각질 문제)에 대해 한 발짝도 들어가보지 못하는 와중에, 우리가 통밥으로 대강 맞추는 의식의 있고 없음에 대해 엄청 어렵고 방대한 계산을 하여 우리에게 약간의 확신만을 더해 주는 역할만을 한다. 이 이론은 의식을 만들어 내는 특수한 설계의 인공지능 설계도를 제작하지 못하고, 단지 무작정 시스템의 파이 값만 키워서 거기에 요행히 의식이 깃들길만을 바라야 한다. 이 이론은 그렇게 설계된 인공지능이 의식적 존재임을 보이는 수많은 증거에도 불구하고, 인공지능이 인간의 뇌와 특성 면에서 꽤 다른 면모를 보이기 때문에 인공지능에 파이 계산법을 적용해 의식의 존재 검증을 수행하는 게 맞는지 영원히 확신할 수가 없다 (물론 파이-범심론에 따라, 파이만 무조건 키우면 의식이 있다고 주장할 수는 있다. 지금 논의하고 있는 입장은 파이-범심론이 배제된 소박한 반론이다.)




그럼애도 불구하고 내가 IIT를 지지하는 이유가 있다. 우선, 내가 IIT를 반대한다 할지라도 현재 그 이상으로 더 낫게 의식을 설명하는 이론이 없다. (IIT가 그나마 낫다는 게 아니라, 전부 형편없을 정도로 못한다) 둘째로, 딥 러닝 인공지능의 급격한 발전을 볼때, 모듈주의와의 기계적인 중립 위치보다는 연결주의 쪽으로 더 치우친 의식 이론이 더 나아 보인다.


우리는 딥 러닝 방법론과 그를 통해 탄생한 인공지능, ChatGPT의 그 놀라운 성능보고 있다. 우리는 어쩌면 의식을 담는 인공지능의 탄생 바로 초입에 다다른 것처럼 느껴진다. 하지만 ChatGPT의 설계우리의 뇌가 가진 것같은 모듈--전두엽, 해마, 운동중추, 언어피질--이 없다. 거기엔 무식하게 때려넣은 뉴런과 시냅스, 그리고 방대한 학습량만 있을 뿐이다. 그러므로 지능이란 모듈이 없어도 잘 작동한다. 의식 또한 그럴 지 모른다. 우리는 ChatGPT를 바라보며 마치 범심론처럼, 특별한 설계 없이도 의식이 짠 하고 나타날 지도 모른다는 가능성에 베팅할 수도 있게 되었다.


그러므로 IIT의 창시자 줄리오 토노니는, 오컴의 면도날에 입해 나 같은 아마추어 독서가도 이해하기 어렵지 않을 정도로 잘 다듬어진 의식의 양 파이 계산 방정식을 내놓아야  것이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari