탐욕의 과학적 메커니즘

탐욕이란, '보상예측 값 이상의 도파민을 얻으려는 행위' 이다.

Aug 25. 2025

글로 보기 싫으신 분들은, 영상으로 보시는 것을 추천드립니다.

히에로니무스 보스의 작품. 칠죄종과 네 가지 종말.

흔히, 필요 이상의 것을 탐하는 마음을 탐욕이라 합니다. 탐욕의 범주에는 음식, 물건, 사회적 지위 등 온갖것이 들어가지요. 몇몇 사람들은 탐욕이 인간의 전유물인 것 처럼 이야기하기도 하며 탐욕이 인간을 망치는 마음이라고 말하기도 합니다. 가톨릭에서는 탐욕을 죄악이라 여기며 탐욕을 칠죄종으로 정의해놓기도 했죠.

그렇다면, 탐욕은 진정 인간에게만 있는 것이며, 우리를 망치게 만드는 것일 까요?

"그렇지 않습니다."

라고 자신있고 단호하게 말하겠습니다.

먼저, 탐욕의 메커니즘에 대해서 설명드릴게요.

탐욕을 이해하기 위해서는 두 개의 실험을 알아야 합니다.

1. 기회탐지와 보상예측오류(RPE)

97년, 신경과학자 울프람 슐츠의는 원숭이를 대상으로 한 실험을 통해, '기회탐지'와 '보상예측오류'를 밝혀내고 설명했습니다. 간단히 설명하면 다음과 같습니다.

기회탐지(Reward opportunity detection)

원숭이는 감각기관을 통해 받아들인 정보를 기반으로, 이에 대한 보상을 예측합니다. 예를 들어, 원숭이에게 빛이나 소리를 인지시킨 후 일정한 양의 쥬스(juice)를 제공하는 것을 반복하고 원숭이가 이를 학습한 상태라고 해봅시다. 원숭이가 빛이나 소리(조건자극)를 감지하면 당연히 쥬스가 제공 될 것이라고 인지하게 됩니다.

이처럼, 일련의 조건자극이 보상을 예고하도록 학습하는 것을 '기회탐지'라고 합니다.

보상예측오류(Reward prediction error, RPE)

예측보상오류(RPE)란, 뇌가 예상했던 보상과 실제 받은 보상의 차이를 의미합니다. 즉, 감각기관으로 인식한 조건자극으로 어느 정도의 보상을 받을지 예측하는 것이죠. 기회탐지 단계에서 설정한 보상예측값과 실제 결과와의 차이가 보상예측오류로 발화되는 것입니다. 여기서 중요한 점은, 어떤 형태의 보상을 받던간에 뇌는 도파민이라는 보상호르몬을 받는다는 것입니다. 이는 우리의 뇌가 도파민이라는 물질을 위해 예측을 하고 행동함을 암시합니다.

1) 예상치 못한 보상

조건자극(빛과 소리) 후 당연히 쥬스가 제공될 것이라고 학습된 원숭이에게, 조건자극을 제공하지 않고 쥬스를 제공한다고 해봅시다.

이 경우 원숭이의 뇌는 강하게 도파민을 발화합니다. 예측이 되지 않은 상황에서 보상이 주어질 경우에 도파민은 강하게 발화합니다.

생각으로 표현하자면,

"오! 완전 개꿀!" → 보상예고 조건자극에 도파민 발화, 추가적인 도파민 발화 증가 (+)

2) 예측된 보상

조건자극이 학습된 원숭이에게 조건자극 후 정량의 쥬스를 제공하는 경우를 살펴보겠습니다. 조건자극(빛과 소리)을 인지한 시점에 도파민 발화가 일어나고, 쥬스가 주어진 시점에서 추가적인 도파민 발화는 일어나지 않습니다. 예측 값과 실제 보상의 차이가 없다는 것으로 인지하는 것입니다.

생각으로 표현하자면,

"맞아, 내가 기억한 그대로야" → 보상예고 조건자극에 도파민 발화, 추가적인 도파민 발화 없음 (0)

3) 예측 후 보상없음

조건자극(빛과 소리) 후 쥬스가 당연히 제공되어야 하는 상황인데, 쥬스가 제공되지 않은 경우를 확인해 볼게요. 우선, 조건자극을 감지 후 도파민이 발화되는 과정까지는 같습니다. 하지만 쥬스가 주어지지 않음으로써 도파민 발화는 억제됩니다.

생각으로 표현하자면,

"예상보다 안 좋네.." → 보상예고 조건자극에 도파민 발화, 추가적인 도파민 발화 억제 (-)

2. 중뇌 도파민 뉴런의 정량적 보상예측오류 신호 인코딩.

2005년, bayer와 glimcher가 원숭이를 대상으로 한 연구는, 보상을 어떻게 원하는지 명확하게 설명해줍니다. 실험과정은 링크로 생략하고 결과만 말씀드리면,

Midbrain dopamine neurons encode a quantitative reward prediction error signal - PubMed

The midbrain dopamine neurons are hypothesized to provide a physiological correlate of the reward prediction error signal required by current models of reinforcement learning. We examined the activity of single dopamine neurons during a task in which subje

https://pubmed.ncbi.nlm.nih.gov/15996553/

이 실험은,
원숭이가 도파민(보상호르몬)을 더 많고 빠르고 확실하게 얻으려 한다는 것을
증명했습니다.

즉, 도파민 뉴런이 예측된 보상보다 많은 경우에 정량적인 보상예측값을 인코딩한다는 것입니다. 여기서 정량적이라고 하는 것은, 더 많고 빠르고 확실하게 도파민을 얻는 것 입니다. 설정한 보상예측값 이상의 보상을 얻어야만 추가적인 도파민이 발화됩니다. 설정한 보상예측값 이상의 보상을 얻으면 이를 다시 기본값으로 인코딩하는 알고리즘인 것이죠.

3. 탐욕은 상향되는 보상예측 신호의 인코딩 값이다.

위 두개의 실험은 원숭이를 대상으로 한 실험이지만, 인간도 크게 다르지 않을 것으로 추측됩니다.

이 실험들을 근거로 생각하고 정리해보면,

1. 인간은 보상 호르몬을 더 많이, 빠르게, 확실하게 얻는 것을 추구하고 행동합니다.

2. 자극을 통해 얻었던 호르몬을 인코딩하고 이것을 기준으로 보상을 예측하게 됩니다.

3. 기존에 예측된 결과만으로는 더 많은 보상호르몬을 발화시킬 수 없습니다.

4. 더 크고 빠르고 많은 도파민을 얻기 위해 이상의 결과를 기대하는 행동을 추구하고 실행합니다.

5. 결국 인간은 기존의 결과만으로는 만족할 수 없는 동물입니다.

기존 월급이 부족하지 않음에도, 더 많은 급여를 갈구하는 마음.

갖고 싶었던 비싼 고급차를 사도 곧 질리게 되는 마음.

충분히 좋은 성적임에도, 더 좋은 성적을 받아야 만족되는 마음.

등이 이를 통해 설명이 가능하다고 생각합니다.

예측된 보상보다 많은 경우에 보상예측 인코딩을 하게되며, 이것이 충족될수록 인코딩값은 상향되기 때문이죠.

탐욕이란, 상향되는 보상예측 신호의 인코딩 값입니다.
상향되는 부분은, 도파민을 더 많이 빠르게 확실하게 얻는 것 입니다.
탐욕은 인간 뿐 아니라 인코딩이 가능한 모든 생물에게서 관찰가능 합니다.

keyword