도파민이 학습과 관련된 핵심 신경전달물질 중에 하나라는 거 아세요?
그거 아세요? 도파민이 사실은 학습과 관련된 핵심 신경전달물질 중에 하나라는 거?
내 기억력과 집중력을 높여 나를 더 똑똑하게 해지기 위한, 이건 첫 번째 레슨. 도파민 이용하기!
1. 큰 목표를 작은 단계로 쪼개라, 이때 작은 단계 목표는 될 듯 말 듯하게
2. 행동하고 나서 충분히 칭찬하고 때때로 더 큰 보상을 섞어라
이게 갑자기 대뜸 무슨 말이냐고? 일단 들어보세요.
제가 공부 많이 했거든요.
일단 큰 목표를 하나 세워볼까요?
저는 영어를 정말 못합니다. 이게 제 인생의 발목을 단단히 잡고 있다고 생각할 정도예요. 그런 의미에서 저는 말도 안 되는 목표를 하나 세워볼게요.
영어 단어장 1권, 영단어 1000개 일주일 만에 마스터하기
그렇게 일주일이 지났고, 작가는 말이 없었다..
로 끝나면 제가 너무 부끄러우니까, 이 말도 안 되는 목표를 달성하기 위해서 앞의 레슨대로 목표를 구체화해 볼게요. 제 목표 같은 경우에는 이미 큰 목표가 정량화하기 쉬워서 작은 단계로 쪼개는 것이 어렵지 않아요. 저도 도파민 이용하기는 처음이라 최대한 쉬운 걸로 정했거든요. 다른 건 뭐가 있을까요? 우리는 뇌를 똑똑하게 하기니까, 논문 쓰기를 실험 계획을 짠다거나 서론만 일단 작성하기와 같이 작은 조각으로 나눠볼 수 있겠죠? 다시 저의 이야기로 돌아가면, 저게 말도 안 되는 목표 같긴 하거든요, 저 내일 출근도 해야 하고요, 사실 제가 정한 단어장도 전에 3달이 넘는 시간 동안 잡고 있었는데 Chapter 10을 다 못했거든요(Champter 40까지 있음). 아 안 될 거 같은데!!
목표를 세우는 법을 보다 이해하기 위해서, 도파민이 뭐 어쩌라는 건지 잠깐 짚고 넘어가는 것이 좋을 것 같습니다. 도파민은 학습, 동기 부여와 관계가 있는 신경전달물질입니다. 물론 여러 도파민 뉴런이 있지만, 특히 A10계 도파민에 집중해 볼게요. 중뇌의 복측피개영역(VTA)라고 불리는 곳에 A10이라고 묶어 놓은 신경세포(뉴런)들이 수 천 개가 모여있습니다. 여기서 만들어진 도파민은 자극을 받으면 두 가지 경로로 이동합니다.
1. 중뇌 - 변연계 경로(Mesolimbic Pathway) : 측좌핵과 편도체, 해마로 이동
2. 중뇌 - 피질계 경로(Mesocortical Pathway) : 전전두엽으로 이동
그런데 이 도파민이 이동하는 목적지가 결국 "새로운 기억을 저장하는 능력을 담당하는 해마"와 "지속할 수 있는 동기와 집중력을 높여주는 전전두엽"을 자극하기 때문에 도파민이 분비되면 우리는 뇌의 학습 능력을 끌어올릴 수 있습니다. 그럼 뭔가 집중이 필요한 일이나 학습이 필요한 일을 할 때 도파민을 뿜뿜 시키면? 우리는 더 효율적인 시간을 보낼 수 있다는 거죠!
그럼 도파민은 언제 분비될까요? 도파민은 철저하게 보상을 예측하고 그 예측이 맞았는지 틀렸는지 학습하는 신호[1]에 따라 분비됩니다. 쉽게 생각하면 강아지를 훈련시키는 것과 똑같아요. '손' 하고 간식을 주면, 처음에는 예상치 못한 간식에 도파민이 나옵니다. 그러다 '손'을 올리면 간식을 준다는 것을 깨닫고 나면, "손!"이라는 말만 들어도 도파민이 나옵니다. 보상을 예측하고 도파민이 분비되는 거죠. 그다음에 그 예측이 맞았을 때, 그러니까 간식을 먹었을 때는 도파민이 나오지 않습니다. 대신, 간식을 평소보다 더 많이 주었을 때! 그때 도파민이 폭발합니다. 강화 학습(Reinforcement Learning)을 공부하신 분이라면, 똑같다고 생각할 수 있어요! 강화 학습이 여기서 나온 거니까요
즉, 예상했던 것보다 더 많은 보상이 주어질 때, 도파민은 폭발하고, 예상과 동일하면 변화가 없으며, 예상보다 적게 나오면 도파민이 오히려 억제됩니다.
이 보상 예측 오차를 기억하면 내 머릿속 도파민을 조물딱거릴 수 있습니다. 아, 그럼 하나 성공할 때마다 케이크를 일단 먹으면 되나요? 다행히(?) 그런 것이 우리에게 보상이 되진 않습니다. 오히려 이런 외적인 보상은 악효과를 줄 수도 있어요. [2] 사람에게는 성공했다는 쾌감, 긍정적인 결과 그 자체가 보상이 됩니다.
앞서 이해한 보상 예측 오차 이론을 따르면, 확실히 성공할 것이라고 예측되는 일을 성공하고 칭찬했을 때에는 예상했던 대로이기 때문에 도파민이 더 나오지 않습니다. 그렇다면 70-80%로 성공할만한 목표라면? 성공했을 때, 30-20% 만큼의 오차가 발생하죠. 그럼 매번의 목표와 시도마다 작은 예측 오차가 발생하고, 도파민을 끊기지 않게 유지시킬 수 있습니다. 제 큰 목표는 사실 영어를 쏼라 쏼라 멋들어지게 하고, 영어 논문을 GPT의 도움을 받지 않고 읽는 건데요, 이 목표는 사실 단번에 70-80% 성공할만한 목표는 아닙니다. 그렇기 때문에 이 목표를 달성할 수 있는 작은 하위 목표(subgoal)로 쪼갭니다. 다행히 우리 뇌는 이런 하위 목표도(활성화되는 뇌의 영역이 다르긴 하지만) 만족감을 느낀다네요! [3] 정말 다행이죠?
다시 한번 말하지만, 도파민은 mbti P입니다. 예상치 못한 delta에 크게 반응합니다. 그렇기 때문에 목표를 달성할 듯 말 듯한 것으로 설정해 주어야 하는데, 이렇게 되면 의문이 하나 발생합니다.
"실패하면 어쩌죠? 도파민이 오히려 떨어지잖아요!"
그러게 말이에요. 저는 이미 말도 안 되는 단어장 1개 1주 만에 다 외우기 같은 거대 목표를 세웠는데 말이에요. 실패하면 도파민이 그냥 차단되고 저는 이 단어장을 버리게 되는 건 아닐까요?
이때, 부정적인 감정(실패)을 우회시켜서 도파민이 끊기지 않게 하는 것이 또 하나의 Tip이 될 수 있습니다. 자, 일단 심호흡을 하는 거예요. 우리의 머릿속의 작은 아기 강아지 도파민은 지금 굉장히 낙담했어요. 목표를 달성하지 못했거든요. 우리의 아기 강아지를 위해 일단 내가 한 일을 일부의 성공과 일부의 실패로 나눕니다. 분명하게 보기 위해서 에요. 몇 %는 달성했다면 그 부분은 인정해줘야 합니다. 그러고 나서 왜 실패했는지 분석해야 해요. 왜 실패했지? 그 실패의 패턴을 파악하거나 새로운 정보를 추출해 냅니다. 도파민은 새로운 것, 신상에 주목하거든요. [4] 이 것도 강화 학습에서 탐색하는 것과 같아요. 우리 뇌는 새로운 정보에 반응하고 탐색적으로 행동하도록 진화했나 봐요.
이 부분은 이제 도파민의 기작을 이해하고 나니 당연하게 느껴지시죠? 도파민은 예상치 못한 성공, 또는 생각지 못했던 새로운 정보에 꼬리를 흔들고 있어요. 이런 자기 자신을 충분히 칭찬해주어야 해요. 충분히 칭찬받고, 보상받지 못하면 도파민은 오히려 억제되니까요. 아, 이까짓 작은 목표 달성, 당연했던 거야. 더 달려야 해. 이런 채찍질로는 오히려 도파민의 분비를 억제할 뿐입니다. 오히려, 기분이다! 코인 노래방, 넣어! 이렇게 성공을 적극적으로 축하해줘야 해요. 축배를 충분히 들어야 합니다. 이게 저는 오히려 가장 어려운 부분이었어요. 저는 저를 달달 볶는데 아주 익숙한 사람이었거든요.
도파민을 이용하기로 마음을 먹고, 단어를 외우는 과정에서도 이 부분을 소홀히 하기 쉽더라고요.
공부 첫 번째 날 저는 하루 만에 단어 80개 외우기를 도전했고, 12시가 되어서야 겨우 해냈어요. 전 평소에 10시 반에 잠들거든요. 이 대단한 나를 마구 칭찬해줬어야 했는데, 저는 이 부분을 생략하고 다음 날 도전을 시작했답니다. 그렇게 다음 날의 더 어려워진 목표인 100개 외우기는 장렬히 실패했습니다. 도저히 의욕이 생기지 않더군요. 아마 칭찬이 부족해서 도파민이 연결되지 않았기 때문인 것 같아요. 공부한 대로라면 더 신나서, 점심시간도 투자하는 의욕 넘치는 모습을 보였어야 했는데 말이죠. 이 부분을 잘하려면 평소에 내가 어떤 것에 기뻐하고, 어떤 것을 보상으로 느끼는지도 잘 알아야 할 것 같아요. 하나의 목표를 성공하고 다음 목표를 의욕적으로 연장될 수 있도록 하기 위해서 내가 해낸 것에 대한 무한한 칭찬 잊지 마세요! - From 그걸 잊은 자.
이 외의 많은 Tip들과 연구 내용들도 공부했는데, 해봤을 때 큰 효과를 제가 느끼진 못했어요. 역시 본질인 저 2가지에만 집중하는 것이 좋을 것 같아요.
일단 여기까지 읽어주신 분들은 제가 결국 단어장을 외웠는지 외우지 못했는지 궁금하신 분들이겠죠? 사실 장렬히 실패했습니다. 허무하죠? 근데, 우리 실패한 경험에 대해서도 잘한 부분은 칭찬하고, 왜 실패했는지 새로운 정보를 캐내기로 했잖아요?
일단 결론부터, 저는 40강, 총 1000개의 단어가 이뤄져 있는 단어장 중에 1주 동안 25강까지 외웠습니다. 알고 있는 단어를 제외하고 모르는 단어들만 추리면 총 447개의 단어를 외웠더라고요. 마지막에 이 글을 작성하기 전에 TEST를 보았을 때, 80점을 맞았습니다. 따흐흑. 사실 최초의 목표에 비하면 턱없이 60%를 조금 넘는 성공률로 턱없이 부족하지만, 개인적인 성과로는 사실 굉장한 편이긴 해요. 그전에는 1주일에 50여 개의 단어를 외웠었거든요. 그렇지만 솔직히 말하면, 첫 날을 제외하면 도파민 이용하기는 아니었던 것 같습니다. 오히려 원래 다음 글로 적으려 했던 노르에피네프린 기작을 더 잘 이용한 것 같아요. 브런치 글을 써야 하는데 단어를 하나도 안 외우면 큰일이잖아요. 이 마음이 제가 단어를 외우도록 이끌었습니다. 처음은 정말 좋았어요. 외우고자 하는 단어를 정리했고, 첫날은 무려 출근을 했음에도 80여 개의 단어를 외웠잖아요? 될 듯 말 듯했던 목표를 이루는 첫날에는 도파민을 이용한 것 같았습니다. 조금만 더 외우면, 단어 시험 100점을 이룰 수 있을 것 같았거든요. 어플 상에서 보이는 점수가 70점에서 80점, 그리고 한참을 98점 즈음에 머물며 '진짜 조금만 더 하면 될 것 같은데'를 되뇌었습니다. 그 힘이 결국 100점까지 만들었어요. 그땐 짜릿했습니다. 제가 제시한 첫 번째, <목표는 될 듯 말 듯하게> 는 정말 말도 안 된다고 생각했던 목표의 첫 계단을 성공하도록 만들어 줬어요. 정말 되더라고요! 근데 문제는 보상 체계였습니다. 엄청 노력했는데, 뭔가 예상했던 것만큼 기쁘지 않았어요. 그때, 그걸 알아채고 더 칭찬해줬어야 했는데 제 뇌는 힘들게 고생했지만, 그만큼의 보상을 받지 못했다고 생각했던 것 같습니다. 그다음 날 단어장을 드는 행위가 그 전 날보다 더 힘들었거든요. 그 이후에는 저는 다시 아주 쉬운 '단어장을 펴기'라는 아주 작은 목표부터 다시 시작했어야 했습니다.
그럼 어떻게 나에게 보상해야 도파민을 이용한 학습을 더 잘 이용할 수 있을까요?
다음 화에서 이 부분을 조금 더 파볼게요 : )
to be continue.
[1] Schultz, Dayan, Montague, 1997 - A Neural Substrate of Prediction and Reward
[3] Ribas-Fernandes et al., 2011 - A Neural Signature of Hierarchical Reinforcement Learning
[4] Kakade, Dayan, 2002 - Dopamine: generalization and bonuses