brunch

You can make anything
by writing

C.S.Lewis

by 허태훈 Mar 11. 2024

[PA] #5. People analytics 추론통계

피플 애널리틱스 입문서

1. Intro

People Analytics(PA)의 여정을 이어가며 기술통계에서 한 단계 더 나아가 '추론통계(Inferential Statistics)'의 세계로 들어가고자 합니다. 추론통계는 데이터의 작은 샘플로부터 전체 모집단에 대한 결론을 도출하는 통계적 방법입니다. HR 실무자가 추론통계를 이해하고 활용함으로써, 데이터에 근거한 보다 신뢰할 수 있는 의사결정을 내릴 수 있게 됩니다.


2. 추론통계(Inferential Statistics)

(1) 개념

추론통계는 표본 데이터로부터 모집단에 대한 통계적 추론을 이끌어내는 방법론입니다. 기술통계가 데이터 자체를 요약하고 설명하는 데 초점을 맞추는 반면, 추론통계는 표본으로부터 모집단의 특성을 추정하고 가설을 검정하거나 예측모델을 생성하는데 목적을 둡니다.


(2) 주요 유형

1) 상관관계 분석

① 개념

상관관계 분석은 두 변수 간의 관계의 강도와 방향을 측정하는 통계적 방법입니다. 상관계수는 이러한 관계를 수치화한 것으로, -1에서 +1 사이의 값을 가집니다. 값이 +1에 가까우면 완벽한 양의 상관관계, -1에 가까우면 완벽한 음의 상관관계를 의미하며, 0은 두 변수 간에 상관관계가 없음을 나타냅니다. HR 분야에서 상관관계 분석은 직원 만족도, 성과, 이직률 등 다양한 인사 지표 간의 관계를 이해하는 데 유용합니다.


② 사례

소프트웨어 개발 회사 'PA 주식회사'는직원 참여도와 이직률 간의 상관관계를 조사합니다. HR 부서는 이 두 변수 간의 상관관계를 분석하여 인사 전략을 개선하기 위한 인사이트를 얻고자 합니다.HR 부서는 최근 1년간의 직원 참여도 조사 결과와 같은 기간 동안의 이직률 데이터를 수집합니다. 이 데이터를 사용하여 참여도 점수와 이직률 간의 상관계수를 계산합니다.

변수: 직원 참여도 점수(1-10점)와 이직률(%)

 분석 결과, 직원 참여도 점수와 이직률 간에는 음의 상관관계(-0.8)가 있음을 가정하였을 때 이는 직원의 참여도가 높을수록 이직률이 낮아진다는 것을 의미합니다. 상관계수의 음수 값은 두 변수가 반대 방향으로 움직인다는 것을 나타냅니다. 다만 참여도가 높을수록 이직률이 낮아질 경향이 있음을 나타내지만, 이것이 참여도가 이직률을 직접적으로 감소시킨다고 주장할 수는 없으며 다른 외부요인과 변수가 이 관계에 영향을 미칠 수 있음을 늘 명심해야 합니다. 


③ 해석 및 적용

이러한 상관관계는 'PA 주식회사'의 HR 부서에게 직원 참여도 향상이 이직률 감소에 긍정적인 영향을 미칠 수 있음을 시사합니다. 따라서 HR 부서는 직원 참여 프로그램을 강화하고, 직원 참여도를 높이기 위한 조치를 취함으로써 이직률을 관리하고 조직의 안정성을 높일 수 있습니다. 또한 상관관계 분석을 통해 다양한 인사 지표 간의 관계를 이해하고, 조직 내 문제를 진단하는 데 필요한 근거를 확보할 수 있습니다. 이를 통해 데이터에 기반한 인사 전략을 수립하고, 조직의 전반적인 효율성과 직원 만족도를 향상시키는 데 기여할 수 있습니다.


2) 회귀분석

① 개념

회귀분석은 변수 간의 관계를 모델링하고 예측하는 통계적 기법입니다. 회귀분석을 통해 하나의 변수(독립변수)가 다른 변수(종속변수)에 어떤 영향을 미치는지, 그 관계의 강도와 방향을 파악할 수 있습니다. HR 분야에서 회귀분석은 직원의 성과, 만족도, 이직률 등과 관련된 다양한 요인을 분석하는 데 사용될 수 있습니다.


② 사례

제조업체 'PA 주식회사'는 최근 직원들의 기술 역량을 강화하기 위한 교육 프로그램을 도입했습니다. HR 부서는 이 교육 프로그램이 직원들의 생산성에 미치는 영향을 평가하고자 합니다.

독립변수: 교육 프로그램 참여 시간(시간)

종속변수: 생산성 지표(예: 완료된 작업의 수)

HR 부서는 교육 프로그램에 참여한 직원들로부터 교육 시간과 해당 기간 동안의 생산성 지표 데이터를 수집합니다. 이 데이터를 사용하여 선형 회귀분석을 수행하고, 교육 시간이 생산성에 미치는 영향을 분석합니다.회귀분석 결과, 교육 시간이 증가함에 따라 생산성이 유의미하게 향상되는 것으로 가정한다면 회귀계수는 양의 값으로, 추가적인 교육 시간 당 생산성 증가량을 나타나게 됩니다. 이러한 결과는 교육 프로그램이 직원들의 생산성 향상에 긍정적인 관계가 있음을 시사합니다. 


③ 해석 및 적용

회귀분석을 통해 얻은 결과는 'PA 주식회사'의 HR 부서가 교육 프로그램의 효과를 입증하고, 이를 기반으로 추가 교육 자원의 배분과 투자를 결정하는 데 중요한 근거를 제공합니다. 또한, 교육과 생산성 간의 관계를 이해함으로써, HR 부서는 더 효과적인 교육 프로그램을 설계하고 실행할 수 있습니다. 회귀분석은 HR 실무에서 인적 자원 관리의 다양한 측면을 분석하고 예측하는 데 유용한 도구입니다. 이를 통해 조직 내 인재 개발, 성과 관리, 이직률 감소와 같은 핵심 영역에서 데이터에 기반한 전략적 결정을 내릴 수 있습니다.


3) 통계적 가설검정

① 개념

통계적 가설검정은 특정 가설이 통계적으로 유의미한지를 검정하는 과정입니다. 이 과정은 귀무 가설(Null Hypothesis, H0)과 대립 가설(Alternative Hypothesis, H1)을 설정하고, 샘플 데이터를 분석하여 귀무 가설을 기각하거나 기각하지 않을지 결정합니다. 가설검정의 목표는 샘플 데이터가 귀무 가설을 지지하는지, 아니면 대립 가설을 지지하는지 확인하는 것입니다.


② 사례

글로벌 IT 회사 'PA 주식회사'는 리더십 개발을 위한 새로운 교육 프로그램을 도입했습니다. HR 부서는 이 프로그램이 관리직 직원들의 리더십 능력 향상에 실제로 효과가 있는지 검증하고자 합니다.

귀무 가설(H0): 리더십 교육 프로그램은 관리직 직원들의 리더십 능력에 유의미한 변화를 주지 않는다.

대립 가설(H1): 리더십 교육 프로그램은 관리직 직원들의 리더십 능력에 유의미한 변화를 준다.  

교육 프로그램에 참여한 관리직 직원들로부터 교육 전후의 리더십 평가 점수를 수집합니다. 이 데이터를 사용하여 리더십 능력의 평균 변화량을 계산하고, 통계적 가설검정(예: t-검정)을 수행하여 평균 변화량이 통계적으로 유의미한지 검증합니다.

가설검정 결과, p-값이 0.05 미만으로 나타난다면 귀무 가설을 기각하고 대립 가설을 지지하는 결론을 내립니다. 이는 리더십 교육 프로그램이 관리직 직원들의 리더십 능력에 유의미한 긍정적 변화를 주었다는 것을 의미합니다.


③ 해석 및 적용

이 결과는 'PA 주식회사'의 HR 부서에 교육 프로그램의 효과를 입증하는 근거를 제공합니다. HR 부서는 이 데이터를 바탕으로 교육 프로그램의 지속적인 개선과 투자 결정을 내릴 수 있으며, 리더십 능력 강화를 통해 조직 전반의 성과 향상에 기여할 수 있습니다. 통계적 가설검정은 HR 실무에서 다양한 프로그램과 정책의 효과를 객관적으로 평가하고, 데이터에 근거한 의사결정을 내리는 데 필수적인 도구입니다. 가설검정을 통해  조직 내 인적 자원 관리와 관련된 중요한 문제에 대한 통찰력을 얻고, 이를 바탕으로 조직의 전략적 목표 달성에 기여할 수 있습니다.


4) 표본추출과 추정

① 개념

표본추출은 모집단(전체 대상 집단)에서 일부를 선택하여 관찰하는 과정입니다. 이렇게 선정된 표본을 분석하여, 모집단의 특성을 추정합니다. 추정은 표본 데이터를 바탕으로 모집단 매개변수(예: 평균, 비율)에 대한 결론을 내리는 과정입니다.


② 사례

'PA 주식회사'는 전 직원을 대상으로 직무 만족도 조사를 계획하고 있습니다. 그러나 전체 직원에 대한 조사는 시간과 비용이 많이 들기 때문에, HR 부서는 전체 직원의 10%를 무작위로 선택하여 표본 조사를 실시하기로 결정했습니다. 이후 직무 만족도 조사를 실시하고 만족도 평균을 구한 후 데이터의 표준편차를 구하고, 데이터의 크기를 바탕으로 표준오차를 계산했습니다. 

그 후 95% 신뢰수준에서의 z-값(약 1.96)을 사용하여 95% 신뢰구간을 도출했습니다. 표본 조사 결과, 평균 만족도 점수는 4.2(5점 만점)로 나타나고, 95% 신뢰구간은 4.0에서 4.4로 추정되었다면 이는 HR 부서가 95%의 확신을 가지고 전체 직원의 평균 만족도 점수가 4.0에서 4.4 사이에 있을 것이라고 말할 수 있음을 의미합니다.


③ 해석 및 적용

이 사례에서 HR 부서는 표본추출과 추정을 통해 전체 직원의 직무 만족도를 효율적으로 파악할 수 있었습니다. 이 결과는 HR 정책 및 프로그램 개선, 근무 환경 조성 등에 중요한 기초 자료로 활용될 수 있습니다. 표본추출과 추정을 통한 데이터 분석은 HR 실무에서 중요한 의사결정을 내리는 데 있어 강력한 도구가 될 수 있으며, 조직의 인적 자원 관리 및 개발 전략 수립에 크게 기여할 수 있습니다.


이상 대표적인 추론통계 방법을 간단한 사례와 함께 살펴보았습니다. 2회에 걸친 기술통계 및 추론통계에 대한 개념을 짚어두고 더 깊은 People Analytics(PA) 세계로 들어가보겠습니다. 


E.O.D

작가의 이전글 [생각] 균형파괴
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari