강화와 보상에서 찾은 HR 팁들
*과학으로서의 심리학 시작 = 빌헬름 분트(Wilhelm Maximilian Wundt)
: 객관적 절차를 만들어 실험 진행
-> 내성법(introspection)이란 방법론 사용 : 자기의 정신 과정을 성찰하는 방법( 이런 생각을 했다. 이런 게 느껴졌다 를 절차에 따라 작성)
-> 인간의 마음에 관심(정서, 인지, 성격, 행동...) : 보이지 않는 마음을 조작적 정의
*행동주의- 학습심리학
행동주의자들은 왜 인간의 '행동'에 초점을 둘까?
-> 프로이트 '무의식'-> 무의식은 눈에 보이지도 않음. but 행동은 눈에 보임. 눈에 보이니 객관성 확보가능. / 사고과정, 자유의지 등에 대해서 행동주의자들은 별로 관심을 갖지 않음(눈에 보이지 않아서)
-B.F 스키너 : 행동주의 심리학 견인
: 행동주의 심리학파에서는 사람을 어떻게 볼까? 사람과 동물의 차별점보다 공통점을 더 많이 가진다고 봄
인간을 바라보는 관점 = 동물을 바라보는 관점
<- 파블로브(러시아 생리학자)의 개 실험(개 침샘 연구)이 스키너에 영향.
:관련이 없는 자극들을 연결짓는 작업 = 조건화
침 흘리는 것처럼 불수의적인 반응을 학습한 것을 "고전적 조건화"
but 스키너가 관심을 가진 것은 의지를 갖고 하는 것(버튼 누르기), 의도를 갖고 하는 행동들의 조건화.
"조작적 조건화"
-강화 : 어떤 행동의 빈도를 늘리는 조건 형성
-강화 행동: 스위치 누르는 행위
-먹이(강화물, 보상) 를 통해서 강화(강화물을 통해 행동의 빈도 증가)
:스위치를 누른다(의지적 행동) -> 조작적 조건화
:강화는 조작적 조건화의 한 종류 / 처벌도 있음!
처벌은 행동의 빈도를 낮추는 거
강화는 행동의 빈도를 높이는 거
**옆길 이야기)
심리학의 연구 방법론이 발달하면서 연구 윤리도 같이 발전!
실험에 정말로 필요한 경우만, 고통을 우회할 수 있는 방법을 찾고,
사람한테도 이런 실험 연구가 전혀 해가 없다는 것을 증명을 해야함. 그러면서도 과학적 연구를 해야 함
(왜 이 얘기를 하냐? 파블로프 개실험 당시 침 흘린 걸 측정하기 위해 개를 고정, 턱에 구멍 뚫어 침 모아 기록...종을 쳐서 반응했다는 것을 증명하기 위해 종 이외의 다른 시각,후각 등의 냄새도 다 차단,,,)
*학습된 무기력
1step
: 바닥에 전기자극 코일세팅, 강아지가 shock zone과 no shock zone중 한 곳에 머물지 않도록 세팅.
: 경고음 후 전기자극 -> No shock 구간으로 이동 = 강화 (보상=고통으로부터의 해방)
2step
:no shock zone에도 전기자극 나오게 세팅 바꿈(어딜가든 전기자극 가해짐)... 피할 수 없는 상황이 반복-> 강아지가 그냥 바닥에 엎드려있음. 무기력 학습.
=>가정폭력, 왕따, 괴롭힘 등의 상황에 지속 노출될 경우 인간도 무기력 학습됨
피해자가 처음부터 아무런 반항을 안한 게 아니라 아무리 해도 못벗어나다보니 무기력이 학습됨.
특히나 가정폭력에 노출된 아동들에게서 학습된 무기력이 잘 관찰됨.
... 왜 답답하게 잘 대처못할까 이해하지 못할 수 있지만 심리적으로 무기력해진 것...
* 조형 : 일련의 연속된 강화 계획
eg. 강아지 배변훈련 : 배편패드 위에 올라가면 먹이 주고-> 거기에 쉬를 싸면 또 먹이 주고…
=> 행동을 조금씩 정교화(조형)
*소거 : 행동의 빈도를 원래대로 줄여버리는 것. how? 더이상 먹이(보상)를 주지 않음
*간헐적 강화 : 버튼을 누를 때 먹이가 나올 때도 있고 안나올 때도 있음.
단순강화 : 버튼-먹이-버튼-먹이
=> 둘 다 학습은 이루어짐. 그러나 먹이 주는 주기를 길게 잡으면 학습이 잘 안될 수도 있음
=> 간헐적강화 it's like 도박 : 상당히 보상 확률이 낮은편, 강화물은 돈도 있지만 도파민처럼 스스로에게 줄 수도 있음.(중독)
* 효과적인 강화&처벌 방법
-강도/
-일관성/ 특히, 양육방식에 있어 같은 행동에 대해 일관되지 않은 반응 보이면 아이가 혼란경험해 학습이 잘 되지 않음.
-시간적 근접성/강아지 훈련 시, 한참 전에 했던 행동(카펫에 오줌 쌈)에 대해 혼내면 직전에 한 행동(주인을 반갑게 맞이함)에 대한 처벌로 알고 주인에 대해 반갑게 맞이하지 않음.
** 옆길 이야기)
좋아하는 일 vs 잘하는 일... 무엇을 선택해야 할까?
좋아하는 일의 보상은 재미, 근데 재미있는 활동이 일이 되는 순간 돈이라는 강화물이 들어오는데, 돈이 너무 강력한 강화물/동기이다 보니 돈맛이 재미를 대체하게 됨. 지속되기 어려움.
So...잘하는 일을 해서 월급뿐 아니라 주변의 인정, 칭찬이라는 강화물을 추가적으로 받는 것을 조심스럽게 추천...
=> HR 입장에서 새로운 일하는 방식 도입-> 강화랑 처벌 중 어떤 게 더 효과적일까?
효과적=행동이 교정되고 지속되는 것 이라고 정의한다면!
강화가 더 효과적. 처벌은 빈도를 낮추는 것!
노력을 통해 목표달성이 가능한 것으로 세팅해야! 노력에 상관없는 IQ이런 게 아닌 시도한 횟수, 노력한 시간 등으로 목표를 제시해야 사람들의 행동 유인 가능!
=> HR 팁1 ) 즉각적 보상 제공이 지연제공보다 강화가 더 효과적! 목표 달성해도 보상을 너무 늦게 주면 강화학습 이루어지지 않음. 보상 시기도 중요(시간적 근접성)!
=> HR 팁 2 ) 수업방해하는 행동을 감소시키려면
처벌(소리지르기, 뒤에 나가서있으라하기) Vs 강화(집중하면 상 주기) ??
처벌을 하면 감소시킬 방해 행동 대신 할 수 있는 행동이 없음.
강화는 감소시키는 행동을 대체할 행동을 제안. 단순 "뭐 하지마 "라는 지시는 따르기가 어려움.
처벌이 유의미하려면 "너 이거 하지마"가 아니라 "대신 이거 해"
=> HR 팁 3 ) 인센티브는 행동에 대한 보상이 아니라 행동의 결과물에 대한 보상임. 따라서 행동에 대한 확정된 보상이 아니기 때문에 동기부여 안되기도하고 효과적이지 않을 때가 많음. 인센티브제도 수립 시 정교하게!
eg. 우울한 사람이 가장 많이 하는 행동 = 침대에 누워있는, 아무것도 안하는 행동
=> 침대에 누워있지 마세요 (X)
=> 산책을 하고 오세요 (0) 운동을 하세요(0) : 대체 행동을 제시해야 학습자에게 쉬움.