brunch

듀얼 브레인의 멘탈 모델과 월드 모델

지식 덕후의 탄생

by 안영회 습작

<월드 모델 (World Models)이란 무엇인가?>라는 글을 보았습니다. 지적 자극이 빵빵 터지는 글이었습니다. 인공지능 연구자가 아닌 제가 흥미를 갖게 되는 데에는 분명 장기간 <월말김어준>에서 들어온 박문호 박사님 강의가 배경 지식을 쌓아준 덕분입니다.


예측 기계로 작동하는 우리의 뇌와 판단의 근거

우선, <제정신이라는 착각>을 읽으면서 우리 뇌가 일종의 '예측 기계'로 작동한다는 사실을 배웠습니다.

거기에 더하여 <AI 최강의 수업>을 읽으면서 '에이전트' 개념을 익혔습니다.

그러고 나니. 생물이 생존을 위한 판단을 하기 위해 환경을 대체하는 모델이 내면에 있어야 함을 깨닫게 됩니다. 박문호 박사님은 이를 '현상적 세계'라고 표현했습니다.[1]


줏대와 관점: 세상을 보는 멘탈 모델의 출발점

여기에 더하여 최근에 쓴 <줏대와 관점: 비슷한 듯 다른 두 낱말을 두고 따지기>에서 다룬 줏대와 잣대를 움직이게 하는 사람의 욕망도 항상 작동하고 있음을 떠올립니다. 우리가 그것을 인지하지 못하는 순간까지도 작동하는 욕망 말이죠. 욕망은 대개 감정의 형태로 드러나는 듯합니다. 그런 사실들은 <무의식은 어떻게 나를 설계하는가>를 읽는 과정에서 배울 수 있었습니다.

지금까지 즉흥적으로 써 내려간 문장들이 최근 몇 년간 배경 지식으로 쌓아온 상태에서 글을 읽었기에 촉발된 지적 자극이란 점을 기록에 남기고 다시 <월드 모델 (World Models)이란 무엇인가?>로 돌아가 봅니다.


의식을 구성하고 판단을 내리는 모델이 있다

다음 그림을 보자마자 바로 두 개의 개념이 겹쳐진다 느껴집니다.

이를 이미지로 표현해 볼까요? 가능하면 독자님들도 공감할 수 있도록 먼저 이미지의 설명에 해당하는 글을 인용해 봅니다.

사람의 뇌는 우리가 보는 세상에서 일어나는 모든 일의 디테일한 세부 사항까지 하나하나 처리하지는 않습니다. 대신, 이전에 했던 경험으로부터 형성된, 추상적인 표현 - 즉, 멘탈 모델 (Mental Model) - 에 의존해서 복잡하고 정신없이 들어오는 정보들로부터 의사결정을 하게 되죠. 어떤 사건이 발생하기도 전에, 우리의 뇌는 이런 멘탈 모델, 그리고 이전에 했던 행동과 그 결과를 기반으로 해서 연속적으로 결과를 예측하게 됩니다.

예측 기계로 작동하는 우리의 뇌에서 의식하지 못하는 영역이 대부분이기 때문에 현실 그 자체가 아닌 정신에 거하는 모델이라고 부를 수밖에 없다는 생각이 듭니다.


인공지능의 월드 모델 이전부터 쓰이던 인간의 멘털 모델

그리고, 기사 제목에 있던 월드 모델이란 말이 등장합니다.

AI 영역에서 이야기하는 월드 모델 (World Models)이 바로 이런 개념이라고 할 수 있습니다.

지난 8월에 <인공지능으로 구축하는 월드 모델과 들쭉날쭉함의 원인>을 쓴 덕분에 자연스럽게 구글의 월드 모델이 떠오릅니다. 하지만, AI 영역에서 말하는 월드 모델 이전에 인간의 두뇌 속에 있다고 여겼던 세상 모델이 있었기에 위키피디아를 찾아봤습니다.

추정해 보면 아직 위키피디아에도 AI 영역의 월드 모델에 대한 지식은 올라오지 않았습니다. 퍼플렉시티를 이용해 arXiv에서 논문을 찾아볼 수는 있었습니다. 결과적으로 인공지능 연구자라면 월드 모델을 자신들이 구현하고 있는 시스템을 말하는 것으로 받아들일 가능성이 높겠지만, 조금 더 보편적인 월드 모델은 멘탈 모델(혹은 정신 모델)을 지칭한다고 하겠습니다.


멘탈 모델의 위키피디아 페이지에서 크롬 번역을 했더니 어디는 '정신 모델'로 나오고 다른 곳은 '멘털 모델'로 나와 어리둥절했습니다. 그래서 이번에는 한국의 사전을 찾았는데, 네이버 사전에는 둘 다 결과가 없고, 그나마 위키백과에 간단한 설명이 있었는데, 두 가지 표현을 혼용한다고 설명합니다.

정신 모델 또는 정신 모형 또는 멘털 모델(mental model)은 인지, 추론의사결정에서 중요한 역할을 한다고 가정된 외부 현실의 내부 표현이다.


글을 읽기 시작하며 / 쓰기를 마치며

애초부터 <월드 모델 (World Models)이란 무엇인가?>라는 글은 쉽게 읽히지 않았습니다. <월드 모델 (World Models)이란 무엇인가?>를 모두 읽지는 못했는데, 그래도 영감이 넘치는 글이었습니다. 이후에 다시 읽게 될지 알 수 없어서 일단 앞부분만 먼저 보고 생겨나는 생각으로 글 쓰기를 먼저 합니다.


주석

[1] 정확히 말하면 내면 모델 자체가 아니라 멘탈 모델 혹은 정신 모델이 파악한 세상을 말하는 것일까요? 아니! 모델로 파악한 결과도 결국 모델이 되나요? 헷갈리기 시작했습니다.


지난 지식 덕후의 탄생 연재

(62회 이후 링크만 표시합니다.)

62. 미디어 문해력, 협상론적 세계관 그리고 문화의 힘

63. 적대적 트리거와 충조평판 그리고 감정의 민첩성

64. 기억의 3 계층 그리고 점진주의와 프레임 문제의 관련성

65. 인공지능으로 구축하는 월드 모델과 들쭉날쭉함의 원인

66. AI 에이전트의 보상과 가치 그리고 RLHF

67. Validation 번역은 검증이 아닌 타당성으로 하자

68. '복사-붙여 넣기' 패턴과 레거시 코드의 공통점

69. LLM 벤치마크의 세 가지 평가 기준

70. 지식의 체화는 무의식적 유능을 쌓는 일입니다

71. 찰라살이에서 두 가지 나로, 다시 느슨한 결합으로

72. 인터페이스로 등장한 자연어와 일관성 기술의 등장

73. 개발 조직에도 정의란 것을 생각해 볼 수 있을까?

74. 멀티모달 토큰화에 대해 가볍게 듣기

75. 콘텐츠를 사료로 제공하는 비즈니스와 습관을 만드는 힘

76. 인간은 특별한 기계이고, 지능은 창발적 현상이다

77. 케데헌이 보여주는 문화적 시대정신은 어떤 모습인가?

keyword
작가의 이전글세상이 바뀌면 내가 쓰던 말도 바꿔야 할 필요가 있다