'기획'과 '전처리'만 잘해도 반은 간다
지난 이야기
염원했던 HR 데이터 프로젝트를 시작했지만, ‘데이터’를 구하는 것부터 막혔다. 자사의 인사 데이터를 외부에 공개해주는 맘 좋은 회사를 찾는 것부터 난제였다. 그렇다고 접근성이 높은 우리 회사 데이터를 써보자니, 표본수가 극히 적었다. 그래서 기존 연구 결과를 활용하는 식으로 프로젝트 방향을 틀었다. 마침 HR 데이터를 정량화하여 ‘성과’로 연결되는 요인을 분석한 <무엇이 성과를 이끄는가(Primed to Perform)>라는 책이 있었다. 이 책이 연구한 결과에 그나마 쉽게 구할 수 있는 ‘공무원’의 HR 데이터를 치환시켜보기로 했다.
우리 프로젝트의 1차 목표는 ‘무엇이 한국 공무원의 성과를 이끄는 요인인지’ 알아내는 것이었다.
프로젝트는 <무엇이 성과를 이끄는가>의 ‘일에 대한 동기가 성과를 만든다’는 연구 결과가 맞다는 것을 가정 하에 시작됐다. 여기에 공공데이터 포탈에서 다운받은 공무원의 근무환경 만족도 평가 데이터를 <무엇이 성과를 이끄는가> 책에 나와 있는 ‘일에 대한 동기’ 데이터로 치환하고자 했다. ‘대한민국 공무원의 동기지표’라는 새로운 데이터셋을 만들어 독립변수(x)로 두고, 여기에 공무원의 성과(행정 서비스에 대한 국민만족도)를 종속변수(y)로 만들어 ‘상관관계’를 살펴보는 방식이다.
양의 상관관계가 존재한다면 대한민국 공무원 또한 일에 대한 동기가 성과로 이어진다고 볼 수 있다. 음의 상관관계가 존재한다면 대한민국 공무원은 오히려 일에 대한 동기가 적을수록, 성과가 증가한다는 괴랄한 결과가 나온다.(설마하니 이럴 가능성은 굉장히 낮다고 봤다.) 상관관계가 없다면, 대한민국 공무원에게는 ‘일에 대한 동기’와 성과가 아무 상관이 없다는 결과를 얻을 수 있다는 가정이었다.
이 과정에서 필요한 것이 ‘데이터 전처리’다. 데이터 분석을 공부하고 있는 한 팀원에 따르면 “데이터 전처리는 데이터 분석 프로세스의 70% 이상을 차지하고, 가장 많은 시간이 투하되는 부분”이다. 알고리즘을 굴리거나 무슨 기법을 적용할지 고민하는 것도 중요하지만, 그 전에 그게 굴러갈 수 있는 데이터셋을 만드는 데 드는 시간이 만만치 않다는 이야기다.
먼저 프로젝트 진행의 이해를 위해 <무엇이 성과를 이끄는가>에 나타난 HR 데이터의 ‘정량화’ 방법을 소개한다.
<무엇이 성과를 이끄는가>는 조직문화가 성과(수익창출)를 이끈다는 것을 연구, 검증한 책이다. 여기서 조직문화란 조직원의 ‘동기(Motivation)’다. 이 책이 정의한 동기를 유발하는 요소는 크게 여섯 가지(즐거움, 의미, 성장, 정서적 압박감, 경제적 압박감, 타성)다. 이 여섯 가지 동기요소를 정량화하여 ‘총 동기지수’(-100부터 100 사이의 값)를 산출한다.
직접동기(‘즐거움’, ‘의미’, ‘성장’)는 성과(총 동기지수)에 긍정적인 영향(+)을 미친다. 반면 간접동기(‘정서적 압박감’, ‘경제적 압박감’, ‘타성’)는 성과(총 동기지수)에 부정적인 영향(-)을 미친다. 각 동기에는 서로 다른 ‘가중치’가 부여되며, ‘높은 직접동기’와 ‘낮은 간접동기’로 총 동기가 높아질수록 직원들이 시간당 창출하는 이익은 커진다는 게 이 책이 내린 결론이다.
‘총 동기’를 산출하는 방법은 매우 간단하다. 책이 제시한 총 6개 질문에 대한 응답을 통해 가능하다. 6개의 질문에 자신의 상황에 맞춰 1점부터 7점까지의 점수를 입력하면 각 답변에 대해 가중치를 적용해 합산된다. 이 결과가 ‘총 동기지수’다.
총 동기지수 검사는 홈페이지(primetoperform.com)를 통해 누구나 무료로 간단히 해볼 수 있다. 프로그램을 통해 바로 '총동기'를 산출해서 노출시켜준다. 궁금하신 분들은 한 번 해보기를 권한다.
사우스웨스트(41, 경쟁사 3곳 평균=27), 스타벅스(18, 경쟁사 5곳 평균=0), 애플스토어(26, 경쟁사 3곳 평균=12), 노드스트롬(27, 경쟁사 15곳 평균=12), 홀푸드(21, 경쟁사 3곳 평균=7) 등 이 책에서 꼽은 높은 성과를 내는 조직의 총 동기지수는 경쟁사에 비해 10~20점 높게 나타난 것으로 확인됐다.
총 동기지수는 ‘업종’, ‘직무’ 등에 영향을 받는다. 기본적으로 타업종 대비 총 동기지수가 높게 나타나는 ‘업종’도 존재한다는 것을 염두에 둬야 한다. (가령 항공사의 총 동기지수 평균치는 비단 사우스웨스트(41점)가 아니더라도 27점으로 꽤 높게 나타난다. 이는 스타벅스(18점)보다 높은 수치다.)
<무엇이 성과를 이끄는가>에 나온 총 동기지수 계산법을 이해한 다음 필요한 것은 이것을 ‘대한민국 공무원’ 사례에 적용시키는 것이었다.
먼저 공공데이터 포탈에서 다운 받은 <2016년 공직생활에 대한 인식조사>를 살펴봤다. 이 데이터셋은 크게 40개(세부항목까지 들어가면 질문항목은 180개가 넘는다.)의 질문에 대한 중앙행정부처 및 광역지방자치단체 공무원 표본 2,071명의 근무 만족도에 대한 답변을 정리한 자료다.
질문항목이 180개가 넘는데, <무엇이 성과를 이끄는가>에서 총 동기를 산출하는 질문과 일치하는 질문도 당연히 있을 것이라 생각했다. 실제로 몇 가지 질문들이 보였다. 가령 ‘나는 담당업무에 흥미가 있다’라는 질문은 ‘즐거움’ 동기를 측정하는 질문으로 사용할 수 있을 것 같았다.
단, <2016년 공직생활에 대한 인식조사> 데이터는 답변항목을 5단계로 구성했기 때문에, 7단계의 답변을 하는 <무엇이 성과를 이끄는가>에 맞춘 변환은 필요했다. (가령 <2016년 공직생활에 대한 인식조사> 데이터에서 3점은, <무엇이 성과를 이끄는가>의 기준에 맞춰 4.2점(7*3/5)으로 변환된다.)
하기 전엔 잘 몰랐지만, 직접 데이터를 만져보니 문제가 드러났다. 애초에 <2016년 공직생활에 대한 인식조사> 설문지의 질문 자체가, <무엇이 성과를 이끄는가>에서 사용한 설문지의 질문과 다르기 때문에 우리의 치환에는 태생적으로 ‘비약’이 존재할 수밖에 없었다.
구글문서를 통해 공무원의 근무환경 평가 데이터를 <무엇이 성과를 이끄는가>의 질문 데이터로 치환하는 과정. 이 과정에서 비약은 수두룩하게 나타날 수 있다. (평균치를 산출하는 과정에서 ‘노가다’가 들어가는 것은 또 하나의 어려움이다.)
더욱이 <무엇이 성과를 이끄는가>의 질문은 굉장히 ‘세밀하게’ 설계돼있었기 때문에, 자세한 설명을 안 듣고 봤을 때는 비슷한 맥락의 답변이 나오는 질문이 있었다. ‘의미’와 ‘성장’ 동기를 측정하는 질문 구분이 특히 어려웠다.
‘의미’ 동기란 쉽게 말해 자신이 추구하는 가치와 회사가 추구하는 가치가 일치할 때 나타나는 동기다. 반면 ‘성장’ 동기란 자신이 추구하는 가치와 회사가 추구하는 가치가 직접적으로 일치하지는 않지만, 회사에서 하는 일이 장차 자신이 하고자 하는 일을 위한 ‘성장’에 도움을 준다고 했을 때 높아지는 동기다.
가령 인권변호사가 돼 세상을 이롭게 하고자 하는 사람 A가 있다고 하자. 이 사람이 사법연수원을 마치고 변호사가 돼 인권 전문 법무법인에 들어갔다고 한다면, 이 사람의 ‘의미’ 동기는 높아질 수 있겠다. 그러나 A가 로스쿨에 가기 전 먼저 ‘법무법인’에 들어가서 인턴 생활을 했다면, 이 사람의 ‘의미’ 동기는 낮을 수 있다. 그러나 A는 법무법인 근무 경험이 장차 인권변호사가 되기 위한 ‘성장’에 도움을 줄 수 있다고 생각할 수 있기에, 이 경우 A의 ‘성장’ 동기에는 긍정적인 영향을 미칠 수 있다.
실제 <2016년 공직생활에 대한 인식조사> 데이터의 질문 중에는 ‘나는 우리 조직을 일하기 좋은 조직이라고 추천한다’는 질문이 있다. 이 질문은 ‘즐거움’ 동기를 측정할 수 있을까. ‘의미’ 동기를 측정할 수 있을까. ‘성장’ 동기를 측정할 수 있을까.
또 다른 예로 ‘나는 이 조직에 남기 위하여 어떤 직무라도 수행할 용이가 있다’는 질문도 있다. 이 질문은 ‘의미’일까, ‘성장’일까, 그것도 아니면 ‘정서적 압박’(정서적 압박 동기란 일 자체에선 의미를 찾을 수 없지만, 자신이나 누군가의 기대나 외부요인이 동기가 되는 것을 말한다.)일까.
우리 팀원 중 누구도 이에 대해 쉽게 답변할 수 없었다. 애초에 두 설문지의 질문 자체가 일치하지 않는 한 ‘비약’이 가득한 상태의 치환이 진행될 수밖에 없었다.
치환 과정의 비약을 안고 프로젝트를 진행하기에는 불확실성이 컸다. 이에 우리는 전체 2,071명의 공무원 데이터 중 30개 데이터만 꼽아서 치환 결과를 먼저 살펴보기로 했다. 최소한 한국 공무원의 ‘총 동기지수’와 6개 개별 동기지수가 유의미하게 나타나는지 확인해보고 싶었다.
확인 결과 공무원 표본 30명의 총 동기지수 평균은 20.1점으로 나타났다. 스타벅스(18점), 홀푸드(21점) 등 <무엇이 성과를 이끄는가>에서 꼽힌 조직문화가 우수한 기업과 근소한 수치다. 이것만 봐선 대한민국 공무원은 ‘동기부여’가 되기에 충분한 직종이다.
개별 동기의 평균치도 살펴봤다. 즐거움(4.57), 의미(4.03), 성장(4.07), 정서적 압박(4.1), 경제적 압박(3.1), 타성(4.23)으로 ‘직접동기’와 ‘간접동기’가 두루 평균치에서 약간 높게 나타나는 것으로 확인됐다. 단, ‘경제적 압박’ 동기 수치는 상대적으로 낮게 나타났다. 이를 통해 유추해 봤을 때 대한민국 공무원들은 최소한 ‘경제적’으로 압박을 받아서 일을 하는 사람은 적은 것으로 볼 수 있다.
결과적으로 우리는 ‘동기’와 ‘성과’와의 연결점을 찾지 못했다. 앞서 표본 검증 과정에서 나타난 대한민국 공무원의 높은 총 동기지수를 봤을 때 <무엇이 성과를 이끄는가>의 공식이 맞다면, 대한민국 공무원의 ‘성과’는 꽤나 긍정적이어야 한다. 하지만 애초에 정성적인 비약이 들어간 데이터인지라, 이 수치의 신뢰성에 대해서 의문이 남았다. 실제 표본 30명의 동기지수도 표본간 격차가 컸다.
결정적으로 ‘성과’와 연결되는 상관관계를 볼 수 있는 데이터를 찾지 못했다. 처음 공무원의 동기를 측정하는 데 활용했던 데이터셋인 <2016년 공직생활에 대한 공무원 인식조사>를 기반으로 ‘성과’와의 상관관계를 찾기 위해서는 이 데이터에 해당하는 2,071명 공무원 각각의 성과를 1:1로 평가하는 데이터셋(y)이 필요했다. 하지만 우리가 공무원의 성과를 측정하기 위해 활용한 데이터셋 <2016년 행정에 관한 국민 인식조사>은 특정 공무원이 아닌 ‘공공 서비스’ 자체에 대한 국민 평가 데이터였다. 이 데이터로는 동기와 성과 사이의 상관 관계 도출 자체가 불가능하다.
부족한 기획 과정에서 나타난 실수다. 씁쓸한 교훈을 남기고 첫 번째 프로젝트는 뒤집어졌다. 결과 발표까지 남은 시간은 불과 4주. ‘백지’를 낼 수는 없는 상황이다. 다시 새롭게 무엇인가 해봐야 했다. (계속)
(연재) 물류기자의 데이터사이언스 도전기
Special Thanks : 얼리버드 프로젝트팀(엄지용, 이인영, 김진, 양동욱)
0. '얼리버드'가 무엇인고 하니
1. 물류기자의 데이터사이언스 도전기
2. 기본의 쓴 맛, 프로젝트팀에 참여하기까지
3. HR프로젝트팀 발족 "무엇이 공무원의 성과를 이끄는가"
4. 데이터로 공무원의 성과를 만드는 동기요소 찾기
5. 퇴사는 기업 성과에 악영향을 미칠까