조작적 조건화

학습이론 2 : 결과에 의한 학습

Feb 22. 2021

첫 번째 학습이론으로 반응적 조건화(연합에 의한 학습)를 배웠다면, 두 번째 알아볼 학습이론은 조작적 조건화(operant conditiong)이다. 이는 동물이 타고난 반응 양식만으로는 절대로 따라가지 못할 방법을 동원해 환경 변화에 적응하는 잠재력을 갖도록 한다.

조작적 행동이란, 의도적이거나 도구적인(instrumental) 행동을 뜻하며, 행동을 수행하고 난 다음에 일어나는 결과와 깊은 관계를 맺는다.

예를 들어, 서랍에 숨겨놓은 사탕을 발견하였을 때, 다음에도 먹고 싶으면 서랍을 열어보게 된다. 즉, 이런 행동은 타고난 반응이라기보다는 경험에 영향을 받는 것으로, 자기 행동으로 나타난 결과로 계속 배우게 되는 것이다. 이런 종류의 학습을 통해 개체는 계속해서 새롭게 적응하게 나간다.

결과가 행동에 영향을 주는 방식

결과는 특정 행동이 일어날 확률을 높일 수도 있고, 줄일 수도 있다. 또한, 특정 행동에 관한 결과가 추가될 수도 제거될 수도 있다.

우선, 오해하기 쉬운 용어가 있어 먼저 짚고 넘어가겠다. 정적이나 부적이라는 말은 좋은 것과 나쁜 것이라는 평가적 의미와는 아무런 관련이 없다는 것.

정적(positive), 어떤 결과가 더해지거나 증가
부적(negative), 어떤 결과의 제거나 감소
처벌(punishment), 특정 행동이 일어날 확률이 줄어드는 것
강화(reinforcement), 특정 행동이 일어날 확률을 높이는 것

강화

위 용어 설명대로, 강화는 행동이 일어날 확률이 높아지는 것으로 정적 강화와 부적 강화가 있다. 부적 강화는 정적 강화만큼이나 기본적이고 필수적이다. 우리가 겨울에 추워서 두꺼운 옷을 입는다면, 이 행동은 춥다는 혐오스러운 결과를 없애면서 행동을 강화하기 때문에 부적 강화의 영향을 받는다. 반대로, 불법 약물을 복용할 때 쾌감이라는 결과가 더해지므로, 약물 복용이라는 행동이 강화가 되는데 이는 정적 강화로 봐야 한다.

예를 들어, 자해하는 환자가 있다. 자해를 하면 주변 사람들이 관심을 보이게 되는데, 특정 사람들의 관심을 유지하는 기능이 있다는 측면에서 보면 자해 행동은 정적 강화로 볼 수 있다. 하지만, 일시적으로 불안이 감소한다는 이유로 자해를 하게 되는 경우도 있다. 이 경우에는 불안(혐오스러운 결과)을 줄인다는 측면에서 볼 수 있기 때문에 이 행동은 부적 강화가 되는 것이다. 정리하면, 자해 행동은 주위 관심을 늘리는 동시에 자기 불안을 줄이는 효과가 있다. 따라서, 자해 행동이 점점 늘어나는 것은 정적 강화가 될 수도 있고, 부적 강화가 될 수도 있는 것이다. 어느 쪽을 중요하게 여길 지는 임상에서 맥락을 파악하고 치료자가 판단하는 것이다.

처벌

처벌은 자주 혼란을 초래하는 개념이다. 일상 언어에서는 이 말이 주로 법적이나 도덕적인 의미로 사용되지만, 학습 이론에서는 행동에 영향을 주는 관계라는 측면에서 다뤄야 한다. 과거에 일어났던 행동이 그에 따른 결과로 인하여 다시 일어날 확률이 줄어드는 것을 의미한다.

회초리로 손을 때리거나, 큰소리로 겁을 주는 것은 어떤(혐오스러운) 결과가 더해지면서 행동을 줄이기 때문에 정적 처벌인 반면, 벌금을 매기는 것은 돈이나 관심 같은 구미를 당기게 하는 결과가 없어지거나 줄어드는 것이므로 부적 처벌로 볼 수 있다.

하지만, 스키너도 행동을 바꾸려는 수단으로 처벌을 사용하는 것이 장기적으로 효과가 없다고 지적했다. 그럼에도 직관적으로 처벌을 해결책으로 사용하려는 유혹에 빠지는 것을 보면 안타깝다. 처벌과 관련한 수반성은 눈 앞에 있을 때는 작동할지 몰라도, 멀어지면 행동에 미치는 영향력이 점점 작아지고, 오히려 회피 기능이 있는 자극을 도입하게 된다. 우리는 혐오스러운 결과를 받으면, 이를 줄이기 위한 행동을 늘리고 싶어 하기 때문이다.

정적 처벌 -> 부적 강화

이를 임상에서는 대표적으로 우울증 환자에서 볼 수 있다. 예를 들어, 죄책감이 자주 드는 환자가 있다고 하자. 어떤 행동을 하더라도 다 내 잘못인 것 같고, 그러다 보면 주변 사람들이나 환경에 다가가려 할 때마다 죄책감이 더 강해질 것이다. 혐오스러운 결과가 더해지면 더해질수록 다가가려는 행동은 줄어들게 되는데 (정적 처벌), 결과적으로 회피 행동이 점점 늘어나게 된다. (부적 강화)

물론, 죄책감이 일어나는 상황을 피하면 잠시 혐오스러운 경험이 줄어든다. 하지만, 회피는 그 환경을 없애지는 못하기 때문에 장기적으로는 오히려 죄책감이 커지는 토양이 될 수 있다. 즉, 잠재적으로 혐오스러운 경험을 일으키는 맥락이 삶에서 더 많이 생기게 될 것이고, 이렇게 되면 삶 전체에서 행동반경이 좁아지게 된다. 친구들과 만나기도 어렵고, 직장생활도 어렵게 된다. 이러한 맥락에서는 좌절, 우울, 불안이 자연스럽게 따라온다.

임상 맥락에서 행동의 기능적인 측면을 분석하는 치료자의 역할은 환자로 하여금 단기적인 처벌적 결과를 견디고, 장기적인 관점에서 바람직한 경과와 접촉하도록 돕는 것이다.

이처럼 우리는 여러 자극 조절 속에서 행동을 지배한다고 이해할 수 있다. 첫 번째 학습이론(반응적 조건화)과 두 번째 학습이론(조작적 조건화) 모두 개인이 실제로 겪은 역사적 경험에 기초한 학습이다. 이는 동물에게서도 마찬가지로 나타난다. 하지만, 우리 인간은 동물과 다르게 직접 경험하지 않아도 행동을 지배하는 것이 또 있다. 바로 규칙이다. 그리고 이 규칙에 따라 행동하고 영향받는 방식을 규칙 지배 행동(rule-governed behavior)이라 한다.

규칙은 무엇으로 이루어졌을까?

바로 언어이다. 우리의 생각이 어떻게 작동하고 어떤 식으로 영향을 받는지 묘사할 수 있는 것. 이것을 이해하려면 인간의 언어를 자세히 살펴야 한다. 다음에는 언어와 인지(관계 구성에 의한 학습)에 대해 정리해보겠다.

Ref. 인간행동의 ABC, 대한맥락행동과학연구회

keyword

ㅇㅅㅇ 직업 의사

떠오르는 생각을 정리하고 싶을 때, 휴대폰을 꺼내 조금씩 끄적여봅니다.

팔로워 101

매거진의 이전글반응적(고전적) 조건화관계구성이론매거진의 다음글