brunch

라이킷 30 댓글 3

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 김주환 Apr 14. 2021

자유에너지 원칙과
마코프 블랭킷 모델 (1/4)

능동적 추론 과정으로서의 내면소통

헬름홀츠: 지각과정에서의 무의식적 추론

우리의 뇌가 무엇인가를 지각하는데에는 추론의 과정이 필요하다는 아이디어는 퍼스보다 조금 앞서서 물리학자이자 생리학자인 헬름홀츠가 약 150년 전에 최초로 제시했다. 헬름홀츠는 열역학뿐만아니라 시지각에도 많은 관심을 갖고 이론을 정립했다. 눈으로 무엇인가를 보는 과정에서 나타나는 무의식적이고도 자동적으로 이루어지는 메카니즘을 헬름홀츠는 "무의식적 추론 (unconscious inference)"이라 개념화했다(Helmholtz, 1925/1867). 무의식적 추론은 우리가 무엇을 보거나 들을 때마다 언제나 일어나고 있다. 착시 현상은 무의식적 추론의 대표적인 것이다.

헬름홀츠에 따르면 시지각은 인간의 의식의 통제를 넘어서는 어떤 자체적인 룰을 갖고 있다. 우리 눈에는 해가 동쪽에서 떠서 서쪽으로 지는 것으로 보인다. 지구가 자전한다는 사실을 분명히 안다해도 그러한 지식이 우리의 시지각에 영향을 미치지는 않는다. 지구가 자전한다는 것을 우리 의식은 분명히 알고 있지만 그러한 지식이 있다고 해서 서쪽 하늘로 지는 태양이 갑자기 가만히 있는 것으로 보이고 대신 지구가 움직이는 것으로 보이지는 않는다는 것이다.

무의식적인 추론이 자동적으로 일어난다는 것은 감각정보가 의식이나 우리의 마음에 의해서 처리되는 것이 아니라 그보다는 하위의 감각신경시스템에서 일어난다는 증거라고 헬름홀츠는 보았다. 우리가 어떤 것을 "사실"이라고 지각하는 것은 감각시스템에 의해서 의식에 주어지는 것인데, 이 감각과정에 의식이 적극 개입하여 영향을 줄 수는 없다고 본 것이다. 이러한 무의식적인 추론 과정은 인간관계에서도 작동된다. 다른 사람과 커뮤니케이션을 할 때, 상대방의 비구어적 단서들을 무의식적으로 자동 해석하여 상대방의 의도나 감정을 파악해는 것이다.

헬름홀츠는 이러한 무의식적 추론이 일반적인 의미에서 귀납법적인 논리에 기반한다고 생각했다. 하지만 퍼스는 지각의 과정에 있어서의 추론은 상당히 다른 논리구조를 가진다는 점을 부각시키면서 과연 "지각이 무의식적 추론인가?"라는 질문을 던지면서 헬름홀츠의 아이디어에 대해 반론을 편다(Peirce, 1994: CP 8.62-90). 지각의 과정에 "추론"이 존재한다는 점은 인정하되 그 추론의 논리적 구조는 귀납법이 아니라 가추법임을 강조했던 것이다. 퍼스는 여기서 한 걸음 더 나아가 우리의 모든 지각 과정뿐만 아니라 역사적 사실에 대한 인식과 개인적인 기억까지도 가추법에 의해서 작동하고 있다고 본다. 내가 어제 이러저러한 일을 겪었다고 "기억"하는 것은 내가 지금 지니고 있는 기억의 파편들과 느낌들로부터 추론해낸 것이라고 본다(CP. 2. 625). 경험에 대한 기억과 사실에 대한 인식이 일종의 생성적(generative) 모델의 탑-다운 과정을 통해 이루어진다고 보았던 것이다.

분명한 사실은 헬름홀츠가 인간의 뇌의 작동방식의 핵심에는 무의식적인 추론의 시스템이 있다는 것을 가장 먼저 이론화했다는 것이다. 그러나 너무 빨랐다. "추론은 의식만이 할수 있는 것"이라는 철학자와 심리학자들의 고정관념에 가로막혀 그의 아이디어는 100년 이상 외면 받아왔으며 오랜 세월동안 빛을 보지 못했다. 그러나 뇌의 본질을 "추론하는 기계"로서 파악했던 헬름홀츠의 아이디어는 1995년 다이얀과 힌튼 등의 "헬름홀츠 머신"이라는 논문을 통해 머신러닝을 위한 기본 알고리즘 하나로 부활했고 인공지능의 발전에 큰 도움을 주게 되었다(Dayan et al., 1995). 재미있는 사실은 딥러닝의 알고리즘을 창안해낸 제프리 힌튼 역시 헬름홀츠와 마찬가지로 생리학자, 물리학, 심리학에 정통한 학자라는 사실이다.

헬름홀츠 머신은 인간의 지각 시스템을 통계적 추론 엔진으로 보아 모델링한 것으로 인지(recognition)모델과 생성(generative)모델의 결합으로 이루어진다. 인지모델은 외부로부터 유입되는 감각정보를 바탕으로 그러한 감각정보를 불러일으키는 가능성있는 원인들의 확률분포를 추론하는 것이고, 생성모델은, 이것 또한 학습되는 것인데, 이러한 인지모델을 훈련시키는데 사용된다. 이러한 모델을 통해 헬름홀츠 머신은 유입되는 감각정보에 대해 "레이블"을 붙여주는 지도교사가 없어도 감각정보의 원인에 대해 확률적 추론을 할 수 있음을 보이고 있다.

헬름홀츠 머신의 비지도학습의 알고리듬은 뉴런이 다층으로 이루어진 확률적 네트워크를 이룬다고 전제한다. 인지연결망은 유입되는 감각정보에 반응하여 네트워크를 이루고 이러한 연결의 형태 정보는 숨겨진 윗단계의 네트워크로 올라간다. 반면에 생성연결망은 상위 단계내서 내려오는 형태정보를 바탕으로 이러한 연결 형태의 정보를 재구성해서 하위 단계로 내려보낸다.

감각정보에 관한 네트워크를 윗단계로 계속 올리는 상향식 과정을 힌튼은 "각성상태(wake phase)"라 불렀는데, 이 때는 주로 인지연결망 중심의 뉴런들이 작동하여 생성연결망의 예측 확률을 높일수 있도록 재구성하고 변화시킨다. 한편, 내부모델을 바탕으로 계속 아랫단계로 영향을 주는 하향식 과정이 "수면상태(sleep phase)"인데 이 때는 주로 생성연결망 중심의 뉴런들이 작동하여 인지연결망의 예측 확률을 높을수 있도록 재구성하고 변화시킨다. 각성상태가 바텀-업의 상향 적응과정이고 (감각정보로부터 내부 모델을 구축하고 재구성하는 과정이고), 수면상태가 탑-다운의 하향 적응과정이다 (내부모델에 기반해서 감각정보 처리하는 모델을 구축하고 재구성하는 과정이다.) 생성모델이 유입되는 감각정보 처리 방식에 탑다운 방식으로 영향을 미친다는 아이디어는 헬름홀츠에 의해서 최초로 제시되었으므로 이러한 알고리듬을 "헬름홀츠 머신"으로 부르게된 것이다 (Hinton et al., 1995).

프리스턴의 자유에너지 원칙: 추론하는 뇌

칼 프리스턴은 영국 유니버서티 칼리지 런던(UCL)의 신경과학 교수로서 현재 뇌과학 분야에서 가장 영향력있는 학자 중에 하나로 꼽힌다. 의학이나 생리학 분야에서 가장 영향력 있는 학자 중에서 노벨상을 받을만한 후보 리스트가 매년 발표되는데 프리스턴 교수는 여러 차례 이 리스트에 이름에 올리고 있다. 2009년 그가 컨퍼런스 참석차 서울을 방문했을 때 신촌에서 불고기와 소주로 저녁식사를 같이 한 적이 있다. 그 자리에는 뇌 연결망 연구의 대가인 미국 인디애나 대학의 올라프 스폰스 교수와 나의 오랜 공동 연구자인 연세대 의대의 박해정 교수도 있었다. 스폰스 교수는 즐겁게 웃고 떠들며 처음 마셔보는 소주를 신나게 계속 마셔댔는데, 반면에 프리스턴 교수는 상당히 조용하고 부드럽고 내성적인 마치 선비같은 느낌의 학자라는 인상을 받았던 기억이 난다.

프리스턴은 현재 뇌영상을 연구하는 전세계 뇌과학자들이 대부분 다 사용하고 있는 통계 패키지 프로그램인 SPM (Statistical Parametric Mapping)을 개발한 것으로도 유명하다. 학술지에 발표되는 fMRI 연구들은 거의 다 이 프로그램에 의존하고 있다. 처음에는 PET 데이터 분석을 위해 개발된 툴이었으나 1994년 fMRI 데이터 분석을 위해 업그레이드되었고 지금은 SPM12 까지 나와 있다. SPM은 복셀 (볼륨+픽셀의 개념)을 기본 분석 단위로 해서 뇌의 공간적 볼드 시그널의 활성화의 차이를 통계적으로 검증해볼 수 있게 한다. fMRI는 물론 PET, SPECT, EEG, MEG 등 다양한 뇌영상 데이터를 통계적으로 분석할 수 있다. 전세계 뇌과학자들이 거의 다 사용하는 이 엄청난 프로그램은 놀랍게도 오픈소스이며 무료로 배포되고 있다. SPM 개발과 보급만으로도 프리스턴은 뇌과학 발전에 지대한 공덕을 쌓고 있는 셈이다. 그러나 그의 진정한 업적은 자유에너지 원칙 이론에 있다.

프리스턴의 자유에너지 원칙은 현대 뇌과학에 있어서 계산신경학, 신경과학, 인공지능, 정신건강의학, 뇌과학, 행동과학 등 여러 분야에 걸쳐서 실질적이고도 의미있는 영향을 미치고 있다. 마음근력의 의미와 그것의 향상을 위한 내면소통 훈련과 관련해서도 자유에너지 원칙의 관점은 많은 통찰을 주고 있으니 이제부터 좀 더 자세히 살펴보도록 하자.

프리스턴의 자유에너지 원칙(free energy principle)은 기본적으로 뇌를 일종의 "헬름홀츠 머신"으로 보는 것에서 시작한다. 즉 뇌를 상향적 과정과 하향적 과정을 통해 능동적 추론과 예측적 조절을 수행하는 다층적인 위계적 네트워크로 파악한다. 이는 두 가지 이론적 전통을 결합한 것인데, 하나는 위계적인 예측 모형에 입각한 헬름홀츠의 지각의 심리학이고, 다른 하나는 통계적 확률론에 입각한 베이지안 추론이다(Friston, 2008). 베이지안 추론은 추론하고자 하는 사건의 확률적 사전 정보와 추가적으로 주어지는 정보를 종합해서 특정 사건이 발생할 사후 확률의 분포를 추정하는 것을 의미한다.

감각자료를 바탕으로 지각편린을 생산해내는 과정이 헬름홀츠 머신의 인지(recognition) 모델이고, 그러한 지각편린에 대해 사전믿음을 바탕으로 지각이라는 경험을 생산(= 예측오류를 최소화)해내는 것이 생성(generative) 모델이다. 앞에서 보았던 소그림을 통해서 경험했던 것과 같은 지각적 학습과 추론은 지금 현재 유입되는 감각 자료에 대해 과거의 예측을 끌어오는데 필요하고, 행위는 이러한 예측을 완성시키기 위해서 환경으로부터 관련된 정보를 찾아내는데 필요하다.

시지각을 예로 들자면, 인간의 뇌는 시각정보로부터 주어지는 모든 감각자료를 제로베이스에서 분석하여 시지각을 형성하는 것이 아니다. 오히려 내적모델을 만들어 놓고 이에 기반하여 "예측 오류(prediction error)"에 집중하여 주로 처리한다. 이 내적모델이 가추법에서 말하는 주어진 "규칙"이고, 베이지안 추론에서 말하는 "사전 확률"이다. 이렇게 하는 것이 엄청난 양의 감각정보를 처리하는데 훨씬 더 효율적이기 때문이다. 우리의 뇌는 이처럼 "예측 에러"를 최소화하려는 본질적인 경향을 갖는다.

뇌는 감각 시스템을 통해서 받아들인 감각 자료를 바탕으로 그러한 감각자료를 발생시킨 원인에 대해 최대한 정확하게 추론해내야 한다. 뇌는 물론 그러한 외부적 "원인"에 대해 직접적으로 접근하거나 확인할 수 없다. 우리의 의식에는 감각 시스템을 통해 유입되는 일련의 감각 정보들만이 주어질 뿐이다. 뇌는 이를 바탕으로 되도록 "정확한 추론"을 해내야만 한다. 여기서 "정확하다"는 것은 객관적 정확성을 의미한다기 보다는 주어진 환경 속에서 살아남고 번식하는데 도움이 된다는 뜻이다.지금 들려오는 소리가 정말 나의 생명의 위협이 될만한 맹수가 내는 소리인지 아닌지, 혹은 지금 내 눈 앞에 보이는 저 사과가 진짜 존재하는 것인지, 먹을 수 있는 것인지 등에 대해 여러 감각 기관을 통해 흘러들어오는 다양한 정보를 바탕으로 최대한 정확하게 추론해내야만 한다.

자유에너지 원칙에 따르면 모든 생명시스템은 내부와 외부를 구별하는 경계를 지니고 있는데, 이 경계 밖으로부터 주어지는 외적인 정보와 내적인 모델간의 괴리가 곧 "서프라이즈"이며 예측의 오류다. 예컨대 물 밖에 나와 퍼덕이는 물고기의 상태가 곧 서프라이즈의 상태다. 모든 생명체는 이러한 "서프라이즈"를 줄이기위해 끊임없이 자신의 내적인 모델을 수정한다. 내적인 모델을 수정함으로써 서프라이즈를 줄여간다는 것이 자유에너지 최소화의 법칙이다.

하나의 생명체가 자신의 행동의 결과에 대해 추론을 한다는 것은 과거로부터 적절한 데이터를 가져와서 미래를 가정한다는 뜻이다. 즉 능동적 추론에는 반드시 과거와 미래에 관한 개념, 즉 시간적 두께(temporal thickness)가 필요하다(Friston, 2013). 능동적 추론은 베이지안 원칙에 따른 확률적 추론에 의해서 수행된다. 지금 현재 주어진 감각자료의 의미, 즉 이 감각 자료를 발생시킨 외부 원인이 무엇인가에 대한 해석은 이미 지니고 있는 "사전 믿음(prior belief)"에 의해서 영향을 받게 되는 것이다.

다양한 감각기관으로부터 뇌에 전달되는 정보를 바탕으로 뇌는 사전에 이미 주어진 정보를 바탕으로 추론을 해서 지각편린(percept)을 생산해낸다. 우리가 보고 듣고 느끼는 모든 것이 다 뇌의 추론의 결과다. 물론 퍼스가 이야기했듯이 이러한 추론의 논리 구조는 가추법이다. 프리스턴은 이를 능동적 추론 (행위적 추론)이라고 부르는데 감각정보에 대해서 나의 행위의 결과가 영향을 미칠 수 있다는 의미다.

능동적 추론은 "active inference"를 번역한 것인데, "active"는 "행위와 관련된, 행위적인"의 의미도 갖고 있다. 나는 여기서의 "active"를 "능동적"이라 번역할까 "행위적"이라 번역할까 많은 고민을 하다가 일단 "능동적"으로 번역하기로 했다. "active inference"에는 뇌가 수동적으로 추론한다기 보다는 적극적으로 예측오류를 수정해가면서 능동적으로 추론한다는 의미도 담겨 있기 때문이다. 하지만 동시에 움직임과 행위(action)을 통해서 감각정보에 영향을 준다는 뜻도 함축하고 있다.

예측오류 수정에 행위가 관여한다는 개념은 헬름홀츠도 이미 갖고 있었던 것 같다. 헬름홀츠는 지각에 대한 글에서 다음과 같이 이야기하고 있다. "우리는 움직이면서도 지각한다. 우리 몸을 움직이면서도 어떤 사물을 계속 바라볼 때 우리는 동일한 대상을 바라보는 것이지만 우리가 얻게 되는 시각 정보는 계속 약간씩 달라지게 마련이다. 이것은 일종의 실험이라 할 수 있다. 즉 우리가 애초에 이해한 것이 맞는지를 특정한 공간적 관계속에서 계속 테스트해보는 것이다"(Helmholtz, 1971/1878). 이처럼 헬름홀츠는 비록 "예측 오류"라는 용어 자체는 사용하지 않았지만 뇌는 지각 과정에서 움직임을 통해 자신의 가설을 테스해본다고 보았기에 프리스턴의 예측오류와 매우 유사한 개념을 이미 갖고 있었다고 할 수 있다. 움직임을 통해 감각정보를 다양하게 획득함으로써 사전 믿음을 계속 업데이트해나가는 과정이라고 본 점에서 헬름홀츠도 능동적 추론의 개념을 이미 갖고 있었던 것이다. 움직임이 시지각 처리 과정에 필요하다는 것은 이제는 단순한 가설이 아니라 붉은털 원숭이를 이용한 실험 등을 통해 이미 입증된 사실이다(Pascual-Leone & Walsh, 2001).

프리스턴은 자유에너지 원칙은 감각정보의 처리과정과 행위정보의 처리과정이 본질적으로 동일한 구조를 갖고 있다고 본다. 실제로 움직이는 물체를 바라보는 안구운동을 분석해보면 물체의 움직임을 "예측"해서 안구는 움직이고, 그렇게 움직이는 안구는 계속 새로운 시각정보를 유입시켜 생성모델을 지속적으로 업데이트 시킨다. 감각정보에 따른 행위와, 그러한 행위의 결과에 따른 감각정보에 대한 예측적 추론 (혹은 예측 오류)의 피드백이라는 순환 과정을 계속해야 하므로 이러한 감각과 행위의 소용돌이 가운데에 "주인"이 필요하게 되고 이것이 자의식이 된다(Friston, 2018). 의식 발생은 능동적 추론의 필연적 결과다.

정리하자면, 능동적 추론은 감각 자료에 대한 베이지안 추론을 통해서 자유에너지를 최소화하는 것이다. 이미 주어진 기존 정보 중에서 현재 주어지는 감각자료의 해석과 관련성이 있는 정보를 적극적으로 선택하고 그것을 바탕으로 서프라이즈를 최소화하는 방향으로 예측을 하는 것이다. 즉 능동적 추론은 액션(움직임, 지각, 해석 등)을 통해서 예상되는 서프라이즈(엔트로피 또는 불확실성)를 최소화한다. 이러한 과정에는 반드시 "의도"나 "목적"(배고픔을 피하자, 부상을 피하자 등)이 있게 되고 이것이 바로 의식의 기반이 된다. 이러한 관점에서 보자면 의식은 나의 의도나 행동이 가져올 수 있는 미래에 관한 추론 그 자체다(Friston, 2018).

자유에너지 원칙은 내적인 상태를 주관하고 자유에너지를 최소화하는 에이전트를 필요로 한다. 이러한 에이전트가 곧 의식이라 할 수 있다. 특정한 감각이 발생했을 때 이러한 감각의 발생 원인에 대해 최적의 확률 모델을 수립해서 이를 바탕으로 수많은 감각 데이터들로부터 유용하고 의미있는 것들을 골라낼 수 있어야 한다. 이것이 바로 지각과 행위가 환경을 통해 서로 상호작용한다는 의미고, 능동적 추론의 목표는 서프라이즈(예측의 오류)를 최소화하는 것이다(Friston et al., 2010).

뇌에게 전달되는 감각 정보는 외부 환경에 대한 것만이 있는 것이 아니다. 내 몸의 움직임이나 위치에 대한 고유감각(proprioception)정보와 내장기관으로부터 전해지는 내부감각(interoception)정보도 지속적으로 주어진다. 이러한 정보의 의미에 대해서도 뇌는 끊임없는 추론을 수행한다. 특히 내부감각에 대한 추론을 통해 감정도 인지된다(Friston, 2018). 특정한 감각 정보에 대해 나의 내부로부터 오는 것과 외부로부터 오는 것에 대한 정확한 구분은 특히 움직임과 관련해서 매우 중요한 요소다. 고유감각과 내부감각을 발생시키는 요소들의 집합을 포괄적으로 "나"라고 느끼게 된다. 자의식 역시 다양한 감각정보에 대한 베이지안 모델에 따른 능동적 추론의 결과물임에 분명하다. 물론 이러한 추론 과정에 문제가 발생하면 자의식의 혼란이나 감정조절에 있어서 심각한 장애가 발생하기도 한다.

프리스턴에 따르면 생명체의 뇌는 자신의 내적 모델과 외부로부터 주어지는 감각 정보간의 괴리를 최소화하려 한다. 이를 위해 예측의 오류를 줄이려는 내재적인 시스템을 발전시켰는데, 이것이 곧 자의식이다. 예측 오류를 최소화하는 것은 어떤 에이전트를 위해 감각정보의 확실성을 최대화하는 것이 되므로 예측 오류의 최소화 과정의 논리적이고도 필연적 결과로서 에이전트가 반드시 등장할 수 밖에 없다는 것이다(Friston, 2010).

이와 관련해서 중요한 개념이 자기확증(self-evidencing)이다. 자기확증이란 어떠한 가설에 대한 근거가 특정한 하나의 사건밖에 없고, 동시에 그 사건 자체의 의미는 전적으로 그 가설에 의존하는 경우다. 자기확증의 경우에는 설명 - 증명의 순환(explanatory-evidentiary circle)이 존재한다. 즉 가설은 사건을 설명하고 동시에 사건은 가설의 근거가 되는 것이다. 예측오류의 최소화를 계속해나가다보면 결국에는 자기확증의 상태에 이르게 된다. 감각정보의 유입과 능동적 추론을 통한 예측 오류의 최소화라는 사건 자체가 에이전트(의식)의 존재를 증명하게되는 일종의 설명-증명의 순환관계가 성립하게 되는 것이다. 그래서 우리의 뇌는 본질적으로 자기확증적이다(Hohwy, 2016). 다시 말해서 의미부여(스토리텔링)이 있는 곳에 당연히 등장하게되는 자기확증적 에이전트(스토리텔러)가 바로 "나"다.

인간의 뇌의 존재 이유는 자유에너지를 최소화하기 위한 시스템이고, 따라서 모든 행동, 지각, 학습, 의사결정 등이 자유에너지 최소화의 법칙을 따른다는 것이다 (Friston, 2010). 자유에너지 최소화의 법칙은 수학적인 모델을 통해서 인간의 지각, 인지, 운동, 감정, 의사결정 등 폭넓은 뇌의 작동 기제를 모두 설명하고자 하는 야심찬 이론적이라 할 수 있다. 서프라이즈를 줄이기 위해 자신의 내적인 모델을 수정한다는 것은 곧 환경 안에서 움직임에 관하여 끊임없는 의미부여와 예측을 한다는 뜻이다. 우리의 의식에는 자유에너지 최소화의 과정이 곧 스토리텔링으로 나타난다. 이것이 의식의 본질이 지속적인 스토리텔링인 이유다.

마코프 블랭킷: 자유에너지 원칙의 작동 방식

자유에너지 원칙은 뇌의 기능만을 설명하기 위한 이론이 아니다. 나는 자유에너지 원칙이 모든 생명현상은 물론 인간사회의 조직이나 인공지능 시스템등 유사 생명 현상을 위해서도 유용한 설명적 틀이 될 수 있다고 믿는다. 생명체에 대해 논의하려면 생명체인 것과 아닌 것을 구분하는 경계(boundary)에 대해 먼저 논의해야 한다. 내부와 외부(환경)를 완절히 단절하지 않고 에너지와 물질을 주고 받으면서도 내부와 외부의 구분을 지속적으로 유지시켜나가는 것이 생명 작용의 본질이다. 경계가 없으면 생명도 없다. 그런데 이 "경계" 자체는 시간의 진행에 따라 확률적으로 랜덤하게 변화해가는 속성(probabilistic stochastic)을 지닌다(Friston, 2012). 내적인 상태를 둘러싸고 있는 통계적인 의미에서의 경계다.

경계는 내부를 직접 관찰할 수 없게 한다. 오직 내부를 둘러싸고 있는 경계만이 관찰될 수 있다. 이 경계는 통계적인 의미에서 내부와 외부를 구분한다. 생명체의 경계가 본질적으로 마코프 블랭킷이라는 의미는 내부 상태가 자신의 경계의 자유에너지를 최소화하기 위해 작동한다는 뜻이다. 즉 내부상태와 경계는 베이지안 추론을 통해서 항상성(homoeostasis)을 유지하고 나아가 자기생성(autopoiesis)을 할 수 있게 된다는 뜻이다(Friston, 2013). 따라서 이러한 유기체의 "경계"를 어떻게 개념화하고 이론화하는가는 자유에너지 원칙에 있어 매우 중요한 과제가 된다. 프리스턴은 유기체의 경계를 마코프 블랭킷(Markov blanket)으로 개념화할 것을 적극 주장한다.

마코프 블랭킷은 "마코프 체인(Markov chains)"이라는 개념을 퍼얼(Pearl, 1988)이 확장해서 발전시킨 것이니만큼 우선 마코프 체인의 의미에 대해 간략히 살펴보자. 수학자 마코프는 하나의 사건이 다른 사건에 확률적인 영향을 미치는 과정을 논의하면서 "마코프 체인"의 개념을 제안했다. 하나의 사건이 발생할 확률이 그 이전의 사건에 영향을 받을 때, 두 사건은 마코프 체인으로 묶여있다고 정의한다. 동전던지기를 계속 한다고 가정해보자. n번째에 앞면이 나올 확률은 그 직전이나 그 이전에 앞면이 나왔는지 뒷면이 나왔는지에 전혀 영향을 받지 않는 독립적인 사건이다. 그 전에 무엇이 나왔던 상관없이 동전던지기는 매번 던질 때 마다 앞면이 나올 확률은 항상 2분의 1이다.

하지만 우리는 동전던지기처럼 사전에 무슨 일이 벌어졌는지에 영향을 전혀 받지 않는 독립적인 사건들의 관계에는 별 관심이 없다. 예컨대 내가 오늘 저녁에 무엇을 먹었는지가 내일 비가 내릴 확률에 영향을 미치지는 않을 것이다. 따라서 두 사건은 독립적이고 우리는 그러한 두 사건이 어떠한 관계를 갖고 있는지에는 별 관심이 없다. 따라서 두 사건을 같이 고려하지 않는다. 그보다는 우리가 확률적 관심을 갖는 사건들은 서로 영향을 주고 받는 것들이다.

한 지역구에서 이번 선거에 어느 당 후보가 당선되었는가는 다음 선거 결과에 영향을 미칠 것이다. 따라서 두 사건은 마코프 체인으로 연결되어 있다. 오늘 내가 무슨 색 옷을 입을 것인지는 아마도 내가 어제 무슨 색 옷을 입었는지에 따라 영향을 받을 가능성이 높다. 점심 때 무엇을 먹었는지는 아마도 저녁 메뉴 선택에 영향을 미칠 가능성이 높다. 이런 것들은 모두 마코프 체인으로 연결되어 있는 사건들이다.

마코프 체인의 개념이 특히 유용한 분야는 커뮤니케이션이다. 한 음절이나 단어의 의미는 바로 직전이나 직후에 등장하는 음절이나 단어에 상당한 영향을 받는다. "아이 엠 어 보이, 아이…."라는 말을 누군가 한다고 할 때, 두번 째 나오는 "아이"의 의미는 영어의 "아이(I)"일 가능성이 높다. 앞 문장이 영어이기 때문에 그 다음 문장도 영어일 가능성이 높은 것이다. 반면에, "아이들이 참 많네, 아이…"라는 경우에서는 두번째 나오는 "아이"의 의미가 한국어 "아이(child)"일 가능성이 더 높다. 그 직전에 나온 문장이 한국어이기 때문에 그 다음에 나올 단어도 한국어일 가능성이 높기 때문이다. 이처럼 모든 소통에서는 앞에서 어떠한 문장이 발화되었는가가 나중에 나오는 동일한 음가의 단어의 의미 해석(추측)에 커다란 영향을 미치게 마련이다. 문맥(context)에 따라 문장의 의미가 달라지거나, 상황에 따라 발화의 의미가 달라지는 화용론적인 모든 현상의 바탕에는 이러한 마코프 체인이 있다. 따라서 마코프 체인은 오래전부터 인공지능에서의 자연어 처리에 기본적 알고리듬을 제공하는 이론적 기반이 되어 왔다.

마코프 블랭킷이라는 개념은 마코프 체인으로 묶여있는 여러 사건들의 네트워크에 관한 것이다. 퍼얼은 사건(변인)들간의 확률적인 관계를 그림으로 묘사하는 그래프 모델에 대해 논의하면서 마코프 블랭킷을 다음과 같이 정의한다(Pearl, 1988). 여러 사건들의 발생 확률들이 서로 복잡하게 얽혀서 서로 영향을 주고 받는 네트워크를 이루고 있다고 가정해보자. 이 때 특정한 하나의 노드(사건)의 상태에 대해 충분히 예측할 수 있기 위해 필요한 다른 노드들의 최소한의 집합이 곧 그 특정 노드의 마코프 블랭킷이다. 달리 말해서 어느 특정 노드의 마코프 블랭킷은 그것들의 상태에 대한 정보가 주어지면 그 밖의 다른 모든 노드들의 상태가 어떻게 되든 영향을 받지 않지 않고 특정 노드의 상태를 확률적으로 조건짓는다. 이것이 마코프 "블랭킷"인 이유는 마치 담요처럼 타겟이 되는 특정 노드를 둘러싸서 보호하는 듯한 느낌을 주기 때문이다. 요약하자면, 마코프 블랭킷은 특정 노드(내부)와 다른 모든 노드(외부)를 구분하는 경계로서의 노드다.

어떤 유기체의 내부를 노드X라고 하자. 이때 마코프 블랭킷은 노드 X를 둘러싼 일종의 "경계"를 의미한다. X에게 영향을 미치는 부모와 X의 영향을 받는 자식과 그 자식에게 영향을 미치는 또다른 부모 노드들을 모두 다 모아놓은 집합이 곧 브랭킷이다. 참고로, 여기서 "부모", "자식"이라는 것은 확률론적 의미에서 영향을 미치는 관계라는 뜻이다. 즉 영향을 주는 것이 부모고, 영향을 받는 것이 자식이다. 마코프 블랭킷의 의미는 이들 블랭킷 노드들의 정보가 모두 다 주어진다면, 이들 이외의 다른 외부 노드 Y의 정보가 추가로 주어진다고 해서, X에 대해 추가로 더해지는 정보는 없다는 뜻이다.

아래 그림에서 "5"가 내부(노드X)이며, 2,3,4,6,7은 이 노드5를 둘러싸고 있는 경계, 즉 5를 내부로 삼아 둘러싸고 있는 5의 블랭킷이다. 블랭킷을 이루는 것에는 내부(5)에게 영향을 주는 부모(2, 3)와 영향을 받는 자식(6, 7)이 있고, 자식을 공유하는 배우자(4)가 있게 된다. (참고로, 4는 여기서 부모(2)를 공유하고 있으므로 형제라고 할수도 있겠다). 아무튼 이러한 상태에서는 5의 블랭킷인 2,3,4,6,7의 정보만 다 주어지면 5의 상태에 대해 충분히 예측할 수 있다. 블랭킷 바깥에 있는 외부인 노드 1에 관한 정보가 추가적으로 더 주어진다고 해서 5에 대해 더 주어지는 정보가 없다는 뜻이다(Kirchhoff et al., 2018).

(그림 출처: Kirchhoff et al., 2018)

마코프 블랭킷은 공간적 관점에서 보자면 내부와 외부의 "경계"이지만, 시간적 관점에서 보자면 과거를 바탕으로 미래를 예측하는 "현재"다. 미래를 예측하기 위해서 필요한 과거 경험으로부터의 정보는 지금 여기에 존재한다는 뜻이다. 마코프 블랭킷은 안과 밖을, 나와 남을, 과거와 현재를 통계적인 관점에서 구분지으면서 동시에 연결시켜주는 존재라 할 수 있다.

자유에너지 원칙에 따르면 생명체에는 외부, 내부, 감각, 행위의 4가지 상태(states)가 있게 된다(Ramstead et al., 2019). (아래 그림 참조)

그림 출처: (Ramstead et al., 2019).

감각상태와 행위상태는 거의 비슷한 작동방식을 갖는다. 둘 다 예측 오류를 생산하며 동시에 예측오류에 의해서 업데이트된다. 예컨대 어떤 시각 정보가 유입되면 그것을 해석하는데 가장 적합한 과거로부터의 정보를 골라내어서 그 시각정보를 발생시킨 원인에 대해 추론을 한다. 추론한 결과를 계속 유입되는 시각정보에 적용시킬 때의 차이가 나게 마련인데 이 차이가 바로 예측오류다. 뇌는 그 예측 오류를 줄이기 위해서 추론을 계속 업데이트하고 수정해나간다.

외부로부터 주어지는 감각정보와 내부 모델에서 생성하는 예측 간의 차이가 바로 예측 오류고 그 예측 오류를 바탕으로 감각정보를 바꾸기 위한 것이 행위(눈을 크게 뜨고 다시 본다든지, 좀더 가까이 다가가서 본다든지)고 그 예측 오류를 바탕으로 예측 내용을 바꾸는 것이 지각(perception)이다. 아래 그림들을 통해 살펴보자. 먼저 그림자를 본다 (그림1).

그것의 의미를 해석하기 위해서 즉각적으로 이미 사전 정보로 저장되어 있는 다양한 내부 모델로부터 가장 적절한 모델을 적용해서 그것의 의미를 1차적으로 추론해낸다 (그림 2).

그 다음 한걸음 뒤로 물러선다든지 하는 행위를 통해서 이전과는 다른 정보들을 계속 얻고 거기서 얻어지는 예측 오류를 바탕으로 감각 정보들을 계속 업데이트함으로써 시지각을 생산해낸다 (그림 3).

그림 1. 처음 주어진 시각 정보

그림 2. 다양한 내부 모델을 동원해서 저 이미지를 만들어낸 "원인"이 무엇인지에 대해 추론 (늑대 그림자?)

그림 3. 뒤로 물러나서(액션)을 통해서 새로운 시각정보를 얻음으로써 예측 오류를 수정 (고양이 그림자구나!)

(그림 1, 3 출처: https://perfectlytimedpics.com/that-shadow-is-different/)

예측 오류의 역할에 대해 프리스턴은 아래 그림과 같은 도표로 개념화한다. 예측 오류를 바탕으로 행위를 통해 새로운 감각정보를 얻고 동시에 감각정보에 대한 예측을 바꾸어서 지각내용을 업데이트시킨다. 좌측의 순환서클이 행위상태이며 우측의 순환서클이 감각상태를 이룬다. 그런데 이러한 "추론"과 "예측 오류"에 대한 설명은 일종의 비유적인 것이라 할 수 있다. 수많은 감각 정보를 실시간으로 처리하는데 있어서 매번 우리가 의식적으로 "아! 내 예측이 틀렸으니 수정해야겠다"라는 구체적인 의도를 갖고 수정한다는 뜻이 아니다. 실제 감각시스템은 여러 층위로 이루어져 있고 각 층위마다 실시간으로 계속 감각 정보로부터 올라오는 예측오류와 생성모델로부터 내려오는 예측오류가 계속 피드백을 주게 되는데, 이러한 과정 자체는 우리의 의식 저변에서 자동적으로 이루어지는 과정이다. 즉 예측오류의 최소화가정은 모든 층위의 신경시스템의 차원에서 자동적으로 이루어지는 것이며 그 최상위 시스템에 존재하는 에이전트가 의식인 것이다. 이처럼 감각기관으로부터 유입되는 불분명하고 흔들리고 노이즈도 많은 정보(시각이든 청각이든 촉각이든)로 부터 끊임없이 능동적 추론을 하여 구체적인 "지각편린"을 생산해내는 것이 뇌의 기본 임무다.

마코프 블랭킷의 능동적 상태는 환경을 바꿀 수 있으며 내부상태와 마코프블랭킷 자체의 엔트로피를 감소시킬 수 있다. 행위는 구조적-기능적 통합성을 유지시킨다. 이것을 우리는 스스로를 조직하고 만들어낸다는 의미에서 자기생성(autopoiesis)과정이라 할 수 있을 것이다. 내부상태는 베이지안 추론에 입각해서 감각상태의 원인이 되는 외부환경에 대해 추론을 하게되는데, 행위를 통해 스스로 추론하는 대상에 영향을 미칠 수 있다는 점에서 프리스턴은 이를 능동적 추론(active inference)라 부른다 (Friston, 2017b).

(그림 출처: 프리스턴의 강의 슬라이드: https://www.slideserve.com/tyrone/consciousness-by-inference-karl-friston-university-college-london)

(부탁의 말씀: 이 글은 곧 출간될 예정인 책 원고의 일부이며, 아직 교정 전 원고이니 인용은 하지 말아주시기를 부탁드립니다.)

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari

brunch

자유에너지 원칙과마코프 블랭킷 모델 (1/4)

자유에너지 원칙과
마코프 블랭킷 모델 (1/4)