brunch

강화계획reinforcement schedule

행동을 유지하는 심리의 법칙

by 마음 자서전

심리학자 B. F. 스키너는 인간과 동물의 행동이 강화(reinforcement)라는 원리에 따라 학습된다고 보았다. 강화란 어떤 행동 뒤에 주어지는 결과가 그 행동의 빈도를 높이는 작용을 할 때, 그 결과를 가리킨다. 스키너는 강화가 언제, 어떤 방식으로 주어지느냐에 따라 행동의 지속성과 형태가 달라진다고 보았고, 이를 강화계획(reinforcement schedule)이라 불렀다.

강화계획은 크게 연속강화(continuous reinforcement)와 부분강화(partial reinforcement)로 구분된다. 연속강화는 원하는 행동이 일어날 때마다 매번 강화가 주어지는 방식이다. 예를 들어, 아이가 손을 씻을 때마다 칭찬을 듣거나 스티커를 받는 경우가 이에 해당한다. 이 계획은 새로운 행동을 빠르게 학습시키는 데 매우 효과적이지만, 동시에 그만큼 소거가 빠르게 일어나는 단점이 있다. 즉, 강화가 중단되면 행동이 금세 줄어들 수 있다. 따라서 연속강화는 학습 초기, 즉 새로운 행동을 형성하거나 습관을 만들 때 가장 유용하다.

반면, 일정한 행동이 학습된 이후에는 부분강화로 전환하는 것이 효과적이다. 부분강화는 모든 반응마다 강화가 주어지지 않고, 간헐적이고 불규칙한 시점에 강화가 주어지는 방식이다. 스키너는 이러한 부분강화를 네 가지로 세분화하였다: 고정비율 강화계획(Fixed Ratio Schedule), 변동비율 강화계획(Variable Ratio Schedule), 고정간격 강화계획(Fixed Interval Schedule), 변동간격 강화계획(Variable Interval Schedule)이 그것이다.


먼저, 고정비율 강화계획은 일정한 횟수의 목표 행동이 일어날 때마다 강화가 주어지는 방식이다. 예를 들어 영업사원이 상품을 다섯 개 판매할 때마다 보너스를 받는다면, 이는 고정비율 강화라고 할 수 있다. 일정한 노력과 보상이 연결되어 있으므로 행동을 빠르게 증가시키지만, 강화 직후에는 잠시 행동이 줄어드는 경향이 있다.

반면, 변동비율 강화계획은 강화가 주어지는 행동의 횟수가 일정하지 않은 경우이다. 어떤 때는 세 번의 행동 후에, 또 어떤 때는 일곱 번의 행동 후에 강화가 주어지는 식이다. 피험자는 언제 보상을 받을지 예측할 수 없기 때문에, 오히려 그 행동을 끊임없이 반복하게 된다. 도박이 대표적인 예이다. 사람들은 언제 당첨될지 모르지만 ‘언젠가는’이라는 기대감으로 계속 행동을 이어간다. 이러한 변동비율 강화는 가장 강력한 강화계획으로 알려져 있으며, 행동을 장기적으로 유지시키는 데 탁월하다.


고정간격 강화계획은 반응의 수와 상관없이 일정한 시간이 지나면 강화가 주어지는 경우이다. 예를 들어, 매주 수요일마다 주급을 받거나 매달 20일에 월급을 받는 것은 고정간격 강화의 사례이다. 사람들은 시간이 다가올수록 행동을 늘리고, 강화 직후에는 잠시 반응이 줄어드는 일정한 패턴을 보인다.

마지막으로 변동간격 강화계획은 강화가 주어지는 시간 간격이 일정하지 않은 경우이다. 예를 들어, 작업장 감독자가 불규칙한 시간에 순회하며 성실한 직원을 칭찬하는 상황을 떠올려보자. 직원은 언제 칭찬을 받을지 모르기 때문에 항상 꾸준한 태도로 일하려고 노력한다. 이 강화계획은 예측 불가능한 보상이 주어지기 때문에, 지속적이고 안정된 행동 유지에 매우 효과적이다.


스키너의 연구는 부분강화가 연속강화보다 훨씬 강한 행동 지속력을 만들어낸다는 점을 보여준다. 매번 보상을 받는 행동은 보상이 끊기면 쉽게 약화되지만, 간헐적으로 보상을 받는 행동은 오히려 더 오래 유지된다. 이를 부분강화 효과(partial reinforcement effect)라고 한다.

이 원리는 우리의 일상 속에도 깊숙이 스며 있다. 학생이 불규칙하게 받는 교사의 칭찬은 학습 동기를 오래 유지하게 하고, 부모의 예기치 않은 격려는 아이의 책임감을 강화시킨다. SNS의 ‘좋아요’ 알림이나 게임의 무작위 보상 시스템 또한 변동비율 강화의 구조를 띠며, 사람들의 행동을 끊임없이 자극한다.


결국 강화계획은 단순히 보상 시점을 정하는 기술이 아니라, 인간 행동의 리듬을 조절하는 심리적 원리이다. 스키너의 강화이론은 우리가 어떻게 배우고, 어떻게 지속하며, 왜 때로는 멈추지 못하는지를 설명해준다. 인간의 행동 뒤에는 언제나 보상의 패턴이 숨겨져 있으며, 그 패턴을 이해하는 것이 바로 인간 심리를 이해하는 첫걸음이다.

keyword
매거진의 이전글습관화(habituation)