brunch

왜 우리 인사팀은 데이터분석을 안 쓸까

사실 쓰고 싶어도 쓰질 못합니다

HR 부서는 사람을 다루다 보니 많은 정보를 접하고 만들어냅니다. 많은 정보가 머무르고 만들어지는 부서에서 데이터 분석을 잘 활용하면 무시무시한 위력을 보일 텐데 주변에서 그런 케이스를 찾아보긴 힘듭니다. 현실적인 어려움이 있다는 얘기겠죠. 왜 그럴까요? 오늘은 그 이유를 한 번 살펴보겠습니다.


HR 데이터는 조직 내에서 인재관리 프로세스(채용, 육성, 평가, 보상, 경력개발 등) 안에서 발생하는 데이터들을 의미합니다. 흔히 보는 인구통계학적 정보 외에도 급여 수준, 부서 이동 이력, 수행 프로젝트 이력, 내외부 평가 등급, 성과급 수령여부, 징계 여부 등등 다양한 데이터들이 발생합니다. 이렇게 발생한 데이터들이 체계적으로 관리, 분석되고 가공되어 새로운 가치를 창출하고 있다 생각하기 쉽습니다. 과연 그럴까요.


새로운 서비스를 추진하려고 하는데 적합한 경험을 보유한 사람을 찾아내야 한다고 칩시다. 조직별로 처리 프로세스는 다르겠지만 구성원들의 관련 업무 수행 이력, 당시 평가, 현재 수행기술 보유여부 및 학습이력 등이 필요할하겠죠? 하지만 이런 데이터들이 체계적으로 기록, 관리되고 있는 조직은 극히 드뭅니다. '에이..설마' 하시는 분도 계실 텐데 뚜껑을 열어보면 기록, 취합도 되지 않은 경우가 대부분 입니다. 기록만 있어도 양호한 축에 듭니다.

png-transparent-iphone-x-iphone-7-apple-worldwide-developers-conference-steve-jobs-celebrities-mobile-phones-ipad (1).png 기록이라도 되어 있으면 그나마 양호한 축에 든다




민감한 정보로 인한 기록의 어려움

앞서 잠시 언급했지만 조직에서 생산되는 HR 데이터는 대략 어떤 게 있을까요. 한 번 정리해 봤습니다.


Employee Performance (성과 데이터)

구성원의 성과와 관련된 정보. 성과 평가 결과, 목표 달성도, 생산성 지표 등이 해당됩니다.

Recruitment Data (채용 데이터)

채용 과정에서 수집되는 정보. 지원자 정보, 채용 결정, 채용 소요 시간 등이 이 카테고리에 속합니다.

Turnover Data (이직 데이터)

구성원의 퇴사와 관련된 정보. 이직 사유, 이직률, 자발적/비자발적 퇴사 비율 등이 포함됩니다.

Diversity and Inclusion Data (다양성 및 포용성 데이터)

조직의 다양성과 포용성을 가늠하는 정보. 대부분의 인구통계학적 정보가 해당됩니다.

Compensation Data (보상 데이터)

구성원의 급여와 혜택에 관한 정보. 기본급, 보너스, 초과근무 수당, 복리후생 등의 데이터가 이에 해당됩니다.



대강 이 정도로 정리될 거 같은데요. 하나같이 개인정보와 밀접하게 연관되어 있고 민감한 내용입니다. 새어나가서도 안 되지만 만에 하나 새어나가면 골치 아픈 내용들이죠. 한국에선 다소 예외지만 대체로 개인정보 보호 규정을 강하게 적용받고 페널티 역시 매우 강합니다. EU의 경우 개인 데이터 처리규정을 위반하면 최대 2천만 유로 또는 전 세계 연간 매출의 4% 중 더 큰 금액의 벌금을 부과할 수 있습니다. 여기에 대규모 소송도 각오해야 하죠. 이처럼 부실한 관리나 유출은 심각한 문제를 야기할 수 있는 만큼 데이터 수집과 관리 단계에서부터 매우 조심스러운 접근을 취하게 됩니다. 자연스럽게 데이터 분석의 범위와 깊이도 제한받게 됩니다.


이런 법적, 금전적 리스크가 수집 및 활용 이후 단계에서 감수해야 할 부분이라면 피수집자가 느끼는 심리적 장벽은 수집 및 활용 이전 단계에서 감수해야 할 부분입니다. 민감한 정보를 수집하고 분석하기 위해서는 피수집자의 명시적인 동의가 반드시 있어야 하거든요. 대부분은 개인정보 제공에 대해 불편함을 느끼거나 거부감을 표현합니다. 어떻게 될지 모르니까요. 보안에 대한 우려와 잠재적 불이익에 대한 두려움, 불투명한 활용 가능성까지 감안하면 지극히 당연한 반응입니다. 흔쾌히 동의해 주는 비율은 극히 적습니다. 그게 민감성이 높은 정보라면 장벽은 더 높아지겠죠.


첫걸음부터 무겁죠? 민감함을 기록한다는 게 감수해야 할 부분이 적지 않습니다.




산더미처럼 불어나는 다양한 데이터

HR 데이터는 스프레드시트나 DB에서 보는 구조화된 얌전한 데이터, 반듯하게 정돈된 데이터와는 거리가 있습니다. 대부분 텍스트나 음성, 영상처럼 다양한 형태와 출처를 가진, 날 것 그대로의 덩어리입니다. 내년 즈음엔 생산되는 데이터의 최대 90%가 비정형 데이터로 구성되어 있을 거라는 IDC의 추정치를 감안해 보면 HR 데이터에서 비정형 데이터가 차지하는 비율 역시 거진 비슷하지 않을까 생각합니다.


Screen_Shot_2023-05-.png 폭발적으로 늘어나는 데이터 앞에 장사없다


비정형 데이터의 매력은 확실합니다. 일례로 이력서와 면접 녹취록에 자연어 처리(NLP) 기술을 활용하면 핵심 키워드를 추려내고 접근할 수 있습니다. 사내메신저 채팅 데이터에 감정 분석 기술을 활용하면 어떨까요. 조직 문화와 임직원 만족도에 대해 순도 높은 영감을 얻을 수 있겠죠. 혹시 여유가 있다면 직원 피드백이나 면담데이터에 성과 평가 같은 다양한 비정형 데이터 소스를 붙여서 딥러닝 알고리즘을 거치면 어떨까요. 이직 가능성이 높은 직원을 사전에 예측하고 선제적으로 대응할 수 있을 것입니다. 어떻게 바라보고 깎아내서 붙이느냐에 따라 잠재력의 차원이 달라집니다.


문제는 이런 비정형 데이터의 다양성이 데이터 관리와 분석, 활용을 복잡하게 만든다는 점입니다. 포맷마다 처리하는 기술과 요구사항이 다 다르거든요. 음성 데이터라면 텍스트로 변환하고 검수하는 과정을 거쳐야 하고 영상이라면 프레임 별로 쪼개서 표정을 읽어내는 작업을 추가해야 합니다. 다양성과 복잡성에 더해 저장하고 처리하는 인프라도 만만치 않습니다. 그래프에서도 보이듯 증가세까지 폭발적입니다. 가공하기도 까다로운데 양까지 많아지니 효과적으로 관리하고 활용하는 것이 점점 더 어려워지고 있습니다. 감히 할 엄두가 안 난다고 할까요.


이러한 딜레마는 HR부서에겐 일종의 도전입니다. 통합부터 쉽지 않습니다. 서로 다른 시스템과 플랫폼에 저장되어 있는 비정형 데이터를 기존 HR시스템에서 활용할 수 있도록 하는 작업은 기술적으로 무척 복잡하죠. 가지고 있는 데이터의 품질도 그리 매끄럽지 못할 가능성이 높습니다. 이런 난제를 보완하려면 비정형 데이터를 효과적으로 처리할 수 있는 고급 인력(여기선 HR에 능하면서 데이터를 다룰 줄 아는 인력을 말합니다)과 고급 분석 도구(각종 통계 프로그램 및 프로그래밍 언어 등), AI 기술(자연어처리, 감성분석 등)이 필요합니다. 항상 그렇겠지만 비용과 시간은 늘 부족합니다. 어느 것 하나 쉽지 않습니다.


마치 손질해야 할 고기, 생선, 채소가 산더미처럼 쌓여있는 오픈 직전의 주방이랄까요.

Leonardo_Anime_XL_A_man_sighing_as_he_is_left_alone_in_the_kit_2.jpg 손질 방법도 제각각이고 양도 많다




문자와르 서로 사맛디 아니할쎄

거의 모든 기업에서 HR 부서는 가장 오래된 부서 중 하나입니다. 오래되다 보니 과거의 아날로그 데이터와 현재의 디지털 데이터가 공존하는 경우를 심심치 않게 찾아볼 수 있습니다. 최근에 입사한 직원들의 정보는 디지털 파일 형태로 저장되어 있지만, 오래 근무한 직원들의 초기 기록은 여전히 종이 문서로 보관되어 있는 식이죠. 디지털 형태로 변환하는 작업을 별도로 거쳐야 합니다. 필드에서 이런 케이스를 만나면 저도 모르게 침을 삼키게 됩니다.


그래도 아날로그 기록을 디지털 파일로 변환하는 작업은 그나마 낫습니다. 아무 생각하지 말고 입력하면 되거든요. 미묘하게 맞지 않거나 비어있는 데이터를 정렬하고 메우는 작업은 마른 침 여러 번 삼킬 각오를 해야 합니다. 예를 하나 들어볼까요. 사내 복지증진의 일환으로 추진되는 프로젝트의 기초자료로 구성원들의 출퇴근 실 소요시간이 필요하다고 합시다. 출근지와 실 거주지의 상세 좌표를 두고 통신사의 생활 데이터를 활용해서 추정값을 뽑아내야겠죠. 일일이 붙잡고 물어보면 정확하니 좋겠지만 필드에서 그럴 여유는 없습니다.


파일을 받아보면 새로운 세상이 열립니다. A 부서 파일엔 '구'까지만 표기되어 있고 B 부서 파일엔 '동'까지, C 부서 파일엔 아예 누락되어 있는 식입니다. hwp, xls, doc, pdf.. 포맷까지 다르면 말 그대로 종합선물세트죠. 이런 현상은 자료의 수집시점, 수집자가 달라서 발생합니다. 폼을 만들어서 뿌려도 결과물을 보면 다를 때가 많으니 일정 부분 감수해야 정신건강에 이롭습니다. 별 수 있습니까. 찾아서 채워 넣어야죠.


상당한 시간과 비용이 들어갑니다. 각 기업마다 처한 사정이 다르니 차이는 있겠지만 예상보다 길고 많이 잡아먹는다는 점은 확실히 말씀드릴 수 있습니다. 한국의 자료를 찾지 못해서 2021년 미국 노동 통계국(Bureau of Labor Statistics)의 통계를 찾았습니다. 미국 기업들은 데이터 입력 비용으로 매년 7조 1200억(53억 불) 가량을 쓰고 있네요. 한국은 얼마나 쓰고 있을지, 그중 HR데이터는 얼마나 될지 궁금해집니다. 다만 조직 내부에서도 돌아다니면 안 되는 민감한 데이터니 함부로 외주는 못 줍니다.


어떻게든 HR 부서 내부에서 소화해야 한다면, 소화할 수 있을까요.

Leonardo_Anime_XL_A_man_decorating_a_wall_with_pasteltoned_til_2.jpg 빠진 데이터 메꿔넣고 맞추는 작업이 정말 사람잡습니다




일할 시간이 없어요

아마 이 부분이 핵심인 거 같은데요. 일할 시간이 없습니다. 단순 반복업무에 상당한 시간을 뺏기니 생산적인 활동을 수행하기 어렵습니다. HR 담당자들은 하루 근무시간의 73%가량을 일상적인 행정 업무에 할애하고 있다는 조사결과도 있던데 체감하는 단순 반복업무 비율은 그보다 더 높을겁니다. 단순히 양의 문제를 넘어 기업 문화와 업무 방식 전반에 걸친 구조적인 문제라 비단 HR부서에만 해당되는 얘기는 아니라는데서 안타까움이 더해집니다.


출근하면 이메일 처리, 보고서 작성, 행정서류 작성 같은 활동들이 쉴 새 없이 이어집니다. 대충 처리하고 나면 '과연 내가 필요한가' 싶은 회의가 소집됩니다. 예정된 회의 시간은 넘기기 일쑤죠. 회의가 끝나면 반려된 기획서가 기다리고 있습니다. 간단한 수정사항이지만 여러 곳에서 오케이 사인을 받아야 하니, 처리속도는 현저히 떨어집니다. 머리 써야 할 일들은 가장 후순위로 밀려납니다. 바쁘게 일했지만 생산된 부가가치는 매우 낮습니다. 나와 조직의 경쟁력 향상에 기여했다 말하기 어려운 그런 하루가 지나갑니다. 익숙한 그림 아닙니까.


일상적인 업무에 매몰되는 경험이 누적될수록 새로운 아이디어를 생각하고 발전시킬 여유는 사라집니다. 창의적 사고는 충분한 시간과 여유가 있을 때 가능한데, 치이는 환경에서는 이를 기대하기 어렵습니다. 고객의 니즈를 파악하고 이에 맞는 제품이나 서비스를 개발하는 활동 역시 마찬가지입니다. 내 코가 석자인 상황에서 소비자의 코를 바라볼 여유는 그저 사치일 뿐입니다. 데이터 분석 역량 확보는 말할 것도 없죠. 데이터 분석을 위한 전문인력, 기술, 인프라, 데이터 기반 의사결정 문화 모두 중요하다 말은 하지만 시급한 건 아니거든요. 이 모든 게 언젠간 감당해야 할 비용이 됩니다.


그저 당장 눈에 보이지 않을 뿐이죠.




HR 부서가 데이터 분석을 효과적으로 활용하기 위해서는 넘어야 할 산이 많습니다. 민감한 정보 처리의 어려움, 다양한 형태의 데이터 처리, 디지털과 아날로그 데이터의 혼재, 그리고 과도한 실무로 인한 시간 부족 등을 극복해야 합니다. 어려움도, 필요성도 이해가 갑니다. 많이 안타깝죠.

m_20240801222047_bClBfXt1iG.png 필드에선 사실 이게 맞는 반응이다


삼중고를 넘어선 사 중고, 어떻게 극복할 수 있을까요.

keyword
작가의 이전글전문가 되기 참 힘듭니다