9-Box Grid & 데이터 분석 [1편] - 카이제곱검정
오늘의 학습방향
안녕하세요? 우리는 데이터와 변수를 시작으로, 기술통계 및 추론통계의 중요한 개념과 원리를 학습하며 달려왔습니다. 몇몇 단원에서는 데이터 샘플을 통해 학습한 내용을 실습할 수 있는 기회를 가졌지만, 지금까지 보셨던 모든 내용을 한 번에 이해하기란 어렵습니다. 틈날 때마다 찾아 보시면서 나만의 통계 지도와 인사이트를 차곡히 쌓아가셨으면 하는 바람입니다.
우리는 이제 Predictive HR analytics (PHRA)를 위한 주요한 통계 검정 방법을 학습할 것입니다. [Jamovi]라는 데이터 분석 프로그램을 활용하여 [HR 데이터 샘플]을 바탕으로 [상황별 통계 검정]을 시도하고, [검정 결과에 대한 해석과 인사이트]를 발견하는 일련의 시간들을 가질 예정입니다.
그 전에 제가 추론통계 (2)편에서 소개했던 'Key PHRA Metrics'의 내용 중 'Talent/Potential Index'의 대표적인 예시였던 '9-Box Grid'에 대한 이야기를 하고자 합니다. 9-Box Grid는 조직에 속한 인력들이 현 시점에서 보이고 있는 성과(Performance)뿐 아니라 미래의 성장 가능성(Potential)을 함께 조명함으로써 HR의 전략적 포트폴리오를 가능하게 만드는 프레임워크라고 할 수 있습니다.
그런 점에서 9-Box Grid는 비즈니스 임팩트 창출에 필요한 장기적이고 전략적인 인력 운영이라고 할 수 있으며, 이와 관련한 개념과 내용을 충실히 학습하면서 HR analytics의 개념도 접목할 수 있다면, HR의 검증된 이론과 데이터 분석에 관한 인사이트를 동시에 넓힐 수 있는 좋은 기회가 되지 않을까 싶습니다.
자, 그럼 시작해 보겠습니다.
CH1. 9-Box Grid의 등장배경과 기본개념
1990년대 이후 글로벌 기업들이 공통적으로 직면한 고민이 있었습니다. 그것은 ① 고성과자는 많은데, "미래 리더"가 부족하다는 점, ② 성과만 보고 승진을 시켰더니, 리더로서 오히려 조직을 망가뜨리는 경우가 발생하고 있었다는 점, ③ 후계자(Successor) Pool이 비어 있어, 핵심 인재가 이탈하였을 경우 조직 리스크가 매우 커진다는 점이었습니다.
이런 맥락에서 나온 개념이 바로 "지금의 성과(Performance)뿐 아니라 미래의 성장 가능성(Potential)을 함께 살펴보자." 라는 것이며, 여기에 기반한 Framwork 중 하나가 바로 9-Box Grid입니다.
CH2. Performance vs Potential
(1) 축의 정의
9- Box Grid는 Performance(x축)와 Potential(y축)의 조합을 9가지 영역으로 나눈 것입니다. x축에 있는 Performance는 '현재 역할에서의 실제 성과와 실행력 수준'을 말합니다. 그리고 y축에 있는 Potential은 '더 복잡하고 더 큰 역할을 맡았을 때, 빠르게 학습하고 성장할 수 있는 가능성'을 말합니다. 따라서 Performance와 Potential은 서로 다른 변수로 정의됩니다. 현재의 성과가 높다고 하여 잠재력까지 무조건 높다고 볼 수 없습니다.
(2) 9-Box Label
x축의 Performance는 왼쪽(Low), 가운데(Mid), 오른쪽(High) 순으로 갈수록 성과의 수준이 높아집니다. y축의 Potential은 아래쪽(Low), 가운데(Mid), 위쪽(High) 순으로 갈수록 잠재력의 수준이 높아집니다. 따라서 맨 오른쪽 윗부분(Top-right)은 [High Performance × High Potential] 입니다.
(3) 각 박스의 의미와 운영 전략
① HiPo Core Leader
[HiPo Core Leader]는 [High Performance × High Potential]에 위치합니다. 현재 성과도 매우 훌륭하고, 더 큰 스케일의 리더십 역할을 충분히 감당할 수 있는 잠재력을 보유한 그룹입니다. 이 그룹의 인력들은 회사의 미래를 책임질 사람들로서 조직에서 이탈할 경우 타격이 매우 큰 존재들입니다.
따라서 이들 그룹은 조직의 승계계획(Succession Plan)에 반드시 포함하고, 비즈니스 전략 과제, 크로스보더/부문 간 주요 프로젝트의 리더로서 역할을 부여해야 합니다. 또한 조직의 주요 리더들과 코칭 및 멘토링 등 네트워킹을 연결할 필요가 있습니다.
주의할 점은 이 그룹의 인력들을 너무 빨리 올리게 되면 개인의 번아웃을 초래할 위험이 있고, 너무 늦게 올리게 되면 조직에서 이탈할 위험이 있다는 점입니다. 따라서 승계계획을 비롯한 미래 리더 육성 플랜을 단계적으로 설정하고, 지속적인 코칭/멘토링과 적절한 Commit를 부여하는 과정이 병행되어야 합니다.
② Core Talent
[Core Talent]는 [High Performance × Mid Potential]에 위치합니다. 현재 성과는 높고, 잠재력은 중간 정도의 수준을 보유한 그룹입니다. 이 그룹의 인력들은 조직에서 안정적인 허리 역할을 하며, 팀에서 꾸준하게 성과를 유지해주는 역할을 합니다.
이들 그룹은 직무 영역의 확장(Job Enlargement), 팀 프로젝트의 리더나 멘토 역할을 수행할 수 있도록 지원해 줄 필요가 있습니다. 다만, HiPo 그룹으로 Overlable하지 않는 것이 중요하며, "핵심 기여자"로서 충분한 인정을 해 줄 필요가 있습니다.
주의할 점은 이들 그룹에 대하여 과도하게 리더십을 요구하지 않아야 한다는 점입니다. 그렇게 할 경우 이들 그룹은 본인 역할에 대해 빠른 속도로 소진되고 있다고 느낄 수 있으며, 그러한 영향을 받아 조직에서 이탈할 가능성이 높아질 수 있습니다.
③ Expert Track
[Expert Track]은 [High Performance × Low Potential]에 위치합니다. 본인이 수행하고 있는 직무 분야에서는 탁월하지만, 관리자/리더로서 역할을 확장하기에는 어려운 그룹입니다. 이 그룹의 인력들은 주로 조직 내에 전문가 또는 특수 직무를 장기간 동안 수행하고 있는 장인(長人)의 포지션을 수행 중인 사람들입니다.
이들 그룹에 대하여는 Technical Ladder와 Expert Career Track으로 분리할 필요가 있습니다. 따라서 리더십을 향한 승진 플랜에 반영하기보다는 전문가 집단 또는 직무수행 역량의 레벨에 따라 직무등급이나 그에 걸맞는 직위를 제공할 필요가 있습니다.
주의할 점은 이들 그룹에 대하여 관리직으로의 승진을 강요하는 것이 역효과를 낼 수 있다는 점입니다. 그렇게 될 경우 본인 뿐만 아니라 팀 성과 창출에도 부정적인 영향을 미칠 수 있습니다.
④ Rising Star
[Rising Star]는 [Mid Performance × High Potential]에 위치합니다. 성과의 수준은 중간 정도밖에 되지 않지만, 잠재력이 높기 때문에 "조금만 도와주면 빠른 성장을 이룰" 그룹입니다. 이 그룹의 인력들은 빠른 성장세를 보이고 있는 인재 후보군으로, 조직 내에서 적절한 기회가 주어진다면 HiPo로 올라갈 수 있는 인재들입니다.
이들 그룹에 대하여는 도전적인 과제 부여(Stretch Assignment), 역할의 전환 기회 제공, 기술 학습 및 리더십 프로그램에 우선 배정, Feedback Loop(잠재력을 보이는 행동을 계속 반복 및 강화할 수 있는) 기반의 코칭 및 멘토링을 제공할 필요가 있습니다.
주의할 점은 이들 그룹의 성과 수준이 계속 중간 정도에 머무른다면, 잠재력에 대한 평가가 과대했는지를 조직 차원에서 재검토해야 한다는 점입니다.
⑤ Core Player
[Core Player]는 [Mid Performance × Mid Potential]에 위치합니다. 조직의 안정적인 인력으로서 크게 튀지는 않지만, 조직의 시스템을 지탱하는 그룹을 뜻합니다. 이 그룹의 인력들은 대부분의 조직에서 가장 많은 비중을 차지하는 일반적인 구성원의 모습을 갖고 있습니다.
이들 그룹에 대하여는 조직의 프로그램에 따라 기본적인 성장 기회를 제공하고, 합리적이고 공정한 보상정책을 추구하는 것이 중요합니다. 또한 팀의 일하는 방식 및 좋은 문화를 유지하는 데 중요한 역할을 부여해 줄 필요가 있습니다.
주의할 점은 이 그룹에 대하여 '평범한 구성원'이란 이유로 처우 등에 있어 무시를 하거나 탁월한 성과 창출을 위해 과도한 요구를 할 경우 빠른 속도로 소진된다는 점입니다. 따라서 과도하게 HiPo로 성장하라는 요구를 하거나 과도한 기대를 걸지 않는 것이 중요합니다.
⑥ Role Fit
[Role Fit]은 [Mid Performance × Low Potential]에 위치합니다. 현재 역할에서 그럭저럭 직무를 잘 소화하고 있지만, 직무 영역의 확장이나 리더 역할에는 적합하지 않을 수 있는 그룹을 뜻합니다. 이 그룹의 인력들은 특정한 업무나 포지션에서만 잘 작동하는 다소 제한된 타입의 인력들을 말합니다.
이들 그룹에 대하여는 본인의 역량이나 수준에 맞게 적절한 업무를 설계(Job Crafting)해 줄 필요가 있으며, 본인의 성향에도 잘 맞는 역할로 매칭할 필요가 있습니다.
주의할 점은 이들 그룹에 대하여 조직의 승진 플랜에 끼어 넣는 것이 부적절할 수 있다는 점입니다. 그들을 팀원으로서, 그리고 확장성은 없지만 단위 조직의 일상적인 Operation을 위해 필수불가결한 업무를 더 잘할 수 있도록 지원하는 것이 중요합니다.
⑦ Risk / Review
[Risk / Review]는 [Low Performance × High Potential]에 위치합니다. 잠재력은 높다고 평가되지만, 현재 보이는 성과는 낮은 그룹을 말합니다. 이 그룹의 인력들에 대하여는 '무엇이 이런 결과를 낳았는지' 요인을 분석하는 것이 매우 중요합니다. 잘못된 포지션의 배치, 리더와의 미스매치, 개인적인 사정 등을 꼼꼼히 살펴볼 필요가 있습니다.
이들 그룹에 대하여는 역할 재배치, 리더 변경 매칭, 프로젝트 전환 등 여러 가지 방안을 고민할 필요가 있습니다. 특히 손꼽히는 요인들을 적용하여 빨리 실험을 해보고, 결정하는 과정이 뒤따라야 합니다.
주의할 점은 이들 그룹에 대하여 잠재력이 높다는 이유로 무한정 기다려주거나 버티게 하는 것도 위험하다는 점입니다. 성장 가능성에 대하여 제대로 된 진단이 되었는지 다시 한번 살펴보고, 주요인의 분석과 적용을 반복하면서 이 영역에 해당하는 인력들이 맞는지 검증해 보아야 합니다.
⑧ PIP / Coaching
[PIP / Coaching]은 [Low Performance × Mid Potential]에 위치합니다. 성과는 낮지만, 코칭이나 교육 등으로 성장 가능성이 있는 그룹을 말합니다. 이 그룹의 인력들에 대하여는 PIP(Performance Improvement Plan) 설계, 구체적인 목표/기간/리소스를 기반으로 한 성과 관리, 리더 및 HR과 함께 성과 및 직무 수행 전반에 관한 모니터링 시스템을 마련하는 것이 중요합니다.
주의할 점은 이들 그룹에 대한 PIP가 "퇴사를 압박하는 수단"으로 사용될 경우 노동 분쟁을 초래할 위험이 있다는 점입니다.
⑨ Role Mismatch
[Role Mismatch]는 [Low Performance × Low Potential]에 위치합니다. 현재 보이는 성과도 낮고, 미래의 성장 가능성도 낮다고 평가되는 그룹을 말합니다. 이 그룹의 인력들은 궁극적으로 팀의 사기와 문화에 악영향을 미치고 있거나 그러할 가능성이 높다고 판단합니다. 따라서 Role Fit에 대한 검토 후에도 변화의 실익이 없다고 판단될 경우 Exit 전략, 외부 기회에 대한 전직 지원 등을 통해 적절한 시점에 고용관계를 마무리하는 액션 플랜을 설계해야 합니다.
주의할 점은 노무관리 측면에서 성과관리 프로세스 및 공정한 평가 데이터 확보 등이 뒤따라야 합니다.
CH3. 잠재력(Potential)에 대한 정의와 측정
9-Box Grid에서 인력 운영의 중요한 축으로 삼고 있는 잠재력(Potential)은 "일머리가 좋다.", "지능이 뛰어나다." 라는 단순한 측면이 아니라 "더 높은 복잡도와 영향력을 발휘해야 하는 역할에서 시간이 지난 뒤에도 꾸준히 잘할 수 있는 가능성"을 말합니다.
위와 같은 관점에서 잠재력은 대표적으로 ① 학습 민첩성(Learning Agility), ② 사고의 복잡성 및 처리 능력(Cognitive Complexity), ③ 동기 및 열망(Motivation & Aspiration), ④ 리더십 & 영향력(Leadership & Influence), ⑤ 가치 및 문화 적합성(Values & Culture Fit)을 다면적으로 측정합니다.
① 학습 민첩성은 새로운 상황이나 과제를 빨리 이해하고 적응할 수 있는지, 실패에서 배운 것들을 행동의 변화로 연결할 수 있는지를 측정해야 합니다.
② 사고의 복잡성 및 처리 능력은 복잡한 문제를 구조화하고, 핵심적인 인사이트를 도출하는 능력을 의미하며, 조직과 일과 관련한 시스템 전체를 바라볼 수 있는 시야를 갖췄는지를 측정합니다.
③ 동기 및 열망은 본인 스스로 더 큰 책임과 영향력을 발휘하기를 원하는지, 그리고 단기적인 보상보다 성장, 일의 의미, 직무 수행을 통한 비즈니스 임팩트에 가치를 두는지를 측정합니다.
④ 리더십 및 영향력은 타인을 설득하고 조율하며 자발적인 협력을 이끌어 낼 수 있는지, 그리고 팀의 분위기와 일하는 방식(문화)에 긍정적인 영향을 줄 수 있는지를 측정합니다.
⑤ 가치 및 조직문화 적합성은 조직이 중요하게 여기는 방식과 핵심 가치에 잘 맞는지, 그리고 "성과를 창출하는 방식"이 잇따른 독선이나 갑질 등과 같이 조직에 해가 되는 방식인지를 측정합니다.
잠재력과 관련하여 놓치지 말아야 할 부분은 '어떠한 분야의 잠재력'인지에 관한 것입니다. 즉, 리더 트랙의 잠재력인지 아니면 전문가 트랙의 잠재력인지를 분리할 수 있어야 한다는 점입니다. [리더십 잠재력]은 조직 단위의 차원에서 사람을 이끄는 역할(팀장, 실장, 임원)에 적합한지를 보는 것이고, [전문가 잠재력]은 특정한 기술 또는 도메인에서 그 세계관을 아우르며 리드할 수 있는 깊이로 성장할 수 있는 것인지를 보는 것입니다. 따라서 9-Box Grid의 이상적인 모델 구조는 Leadership Potential과 Expert Potential로 관리하는 것이라고 할 수 있습니다.
CH4. 9-Box Grid 운영 절차 개관
위 자료는 9-Box Grid의 운영 절차를 정리한 것입니다. 전체 프로세스는 네 단계로 이뤄집니다. 첫째는 평가제도의 시행 및 평가 데이터를 준비하는 것입니다. 평가에는 성과평가(Performance Rating), 잠재력 평가(Potential Rating)가 있으며, 이들 평가를 통해 수집한 자료를 3등급(H/M/L)에 따라 매핑합니다.
둘째는 Talent Review Session입니다. 말 그대로 리더들이 모여 팀원들의 각 박스 위치를 논의하고 배치시키는 작업입니다. "왜 이 박스에 포함되는 인력인가?"에 대한 상호 간의 질문과 검증이 이어집니다. Talent Review는 곧 Calibration Session입니다. 즉, 개인의 일방적인 편향을 제거하고, 전사적인 기준과 방향에 따라 공정하게 평가하는 것이 주된 목적입니다. 이를 위해 진행 방식을 세분화합니다. 우선 팀장이 1차적으로 각 박스에 위치할 구성원을 제안하고, 상위 리더와 HR이 함께 검토합니다. 여기서 비슷한 레벨이나 역할을 하는 인력들에 대하여 팀 간 비교 등을 통해 각 박스에 위치할 사람들의 Pool을 조절하는 것입니다.
셋째는 각 박스에 진입한 인력들을 대상으로 구체적인 HR 액션 플랜을 설계하는 것입니다. 교육, 승계, 배치 전환, PIP 등과 연결되며 일정한 기간을 설정하여 중장기적으로 운영합니다. 여기에 개별 IDP(Individual Development Plan)와 연결하여 회사와 구성원 간의 니즈를 살펴보고, 조화를 이루는 방향으로 접근합니다.
마지막으로 Follow-up & Monitoring입니다. 각 박스에 위치한 구성원에 대한 액션 플랜을 실행한 이후 6개월부터 12개월 사이까지의 변화나 특이사항 등을 점검/확인합니다. 이 작업은 박스 간의 이동(상승/하락 등), 승진, 이직 결과 등을 기록하고 관리하는 과정과 병행됩니다.
CH5. 9-Box Grid & HR 데이터 분석
지금부터 9-Box Grid Model에 대한 이해를 바탕으로 몇 가지 통계 검정을 시도해보겠습니다. 여기서 다뤄볼 통계 검정 방법론은 ① 카이제곱 검정, ② ANOVA (분산분석), ③ 회귀분석입니다.
(1) 데이터 샘플 소개
9-Box Grid와 관련한 HR 데이터 분석을 위해 위와 같은 데이터 샘플을 준비했습니다. 총 60개의 표본으로 구성되어 있으며, 각 열은 아래와 같은 정보를 담고 있습니다.
A열: Employee_ID (직원 고유번호)
B열: Performance (High/Mid/Low)
C열: Potential (High/Mid/Low)
D열: Box (HiPo Core Leader, Core Talent, Expert Track ...)
E열: Perf_Score (전년도 성과평가: High=3, Mid=2, Low=1)
F열: Pot_Score (전년도 잠재력 평가: High=3, Mid=2, Low=1)
G열: NextYear_Score (1~4등급, * 올해 달성된 종합 평가등급)
H열: Promotion_12M (1=1개월 내 승진)
I열: Attrition_12M (1=12개월 내 퇴사)
Excel의 [Pivot Table]을 통해 각 박스에 포함된 인원 수를 정리하면 다음과 같습니다.
(2) 카이제곱 검정 (Chi-Square Test)
:: 각 박스에 따라 승진률의 차이가 있는가?
카이제곱 검정은 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정하기 위해 사용되는 검정방법입니다. 자료가 빈도로 주어졌을 때, 특히 명목척도의 자료 분석에 이용됩니다. (위키백과)
** Reference: 김석우, <기초통계학>, 학지사, 2007, p212-216.
카이제곱 검정은 "집단별 승진 비율이 통계적으로 의미가 있을 정도로 차이가 나는가?"를 확인하는 방법입니다. 여기서 '집단'은 9-Box 그룹을 뜻합니다. 이 검정을 통해 꼭 알고자 하는 질문은 "HiPo 그룹의 승진율은 정말 더 높다고 할 수 있는가?"입니다. 이를 숫자로 증명하는 과정이 될 것입니다.
만약 9-Box와 승진이 아무런 상관이 없다면 모든 그룹에서 승진율이 (전체 평균 수준으로) 비슷할 것입니다. 하지만 실제로 관측된 숫자(관측값, Observed)가 "기대되는 값"(Expected)과 너무 다르다면, "이건 정말로 그룹별 승진율이 다르다고 할 수 있겠다."라는 결론을 얻을 수 있습니다.
저는 HiPo Core Leader / Core Talent / Role Mismatch, 이 세 그룹의 승진 비율(0/1)이 통계적으로 다르다고 할 수 있는 것인지를 살펴보겠습니다. 이에 9개 박스 중에서 3개의 그룹을 행으로, 승진을 했는지의 여부를 열로(0/1) 두어 살펴보겠습니다.
(2)-1. 관측도수표(실제 횟수)
위 자료는 3개 그룹의 승진 여부에 대하여 관측된 값을 요약한 표입니다. 저는 아래와 같은 순서로 만들었습니다. 이 글을 보시는 분들은 편하신 방법으로 학습하시면 되겠습니다.
① J1 셀에서 [Box_Summary], K1 셀에 [Prom=0], L1 셀에 [Prom=1]이라고 입력합니다.
② J열에 각 그룹의 이름을 입력합니다. 즉, HiPo Core Leader, Core Talent, Role Mismatch 입니다.
③ 이제 3×2표의 각 칸에 countifs 함수를 적용합니다.
HiPo & Prom=0: =COUNTIFS($D:$D,$K3,$H:$H,0)=4
HiPo & Prom=1: =COUNTIFS($D:$D,$K3,$H:$H,1)=3
Core Talent & Prom=0: =COUNTIFS($D:$D,$K4,$H:$H,0)=6
Core Talent & Prom=1: =COUNTIFS($D:$D,$K4,$H:$H,1)=3
Role Mismatch & Prom=0: =COUNTIFS($D:$D,$K5,$H:$H,0)=2
Role Mismatch & Prom=1: =COUNTIFS($D:$D,$K5,$H:$H,1)=0
④ 위 함수를 모두 적용하면, 위 자료와 같이 각 칸에 입력되는 값들이 나옵니다. 여기서 각 행과 각 열의 합계를 구하면 전체 인원은 17명, 승진을 한 인원은 5명, 승진을 못한 인원은 12명이 됩니다.
(2)-2. 기대도수표
"기대도수"(Expected count)란, 만약 각 그룹과 승진이 아무런 상관이 없다면(즉, 완전히 랜덤하다면) 각 칸에 '얼마나 들어가야 정상인가?'를 계산한 값입니다. 기대도수는 [해당 행의 합]과 [해당 열의 합계]를 곱한 값을 [전체의 합]으로 나눈 값입니다.
저는 O열과 P열을 활용하여 아래와 같은 순서로 기대도수표를 만들어 보겠습니다.
① O1 셀에 [Exp_Prom=0], P1 셀에 [Exp_Prom=1] 이라고 입력합니다.
② 아래와 같이 하나씩 기대도수값을 계산합니다.
HiPo & Prom=0: =N3*$L$6/$N$6=4.235294118
HiPo & Prom=1: =N3*$M$6/$N$6=1.764705882
Core Talent & Prom=0: =N4*$L$6/$N$6=6.352941176
Core Talent & Prom=1: =N4*$M$6/$N$6=2.647058824
Role Mismatch & Prom=0: =N5*$L$6/$N$6=1.411764706
Role Mismatch & Prom=1: =N5*$M$6/$N$6=0.588235294
위 계산된 값들을 보면, 각 그룹에서 실제로 승진된 인원과 각 그룹과 승진이 아무런 상관이 없다면 정상적으로 나올 법한 기대되는 승진 인원의 수가 별로 차이가 나지 않는다는 것을 알 수 있습니다.
HiPo 그룹의 경우 실제로 승진한 인원은 2명이고, 기댓값은 1.76명입니다. Core Talent 그룹의 경우 실제로 승진한 인원은 3명이고, 기댓값은 2.64명입니다. 반면, Role Mismatch 그룹의 경우 실제로 승진한 인원은 0명이고, 기댓값은 0.58명입니다. 그렇다면, 이렇게 관측된 값과 기대되는 값 간의 차이가 얼마 되지 않는다는 관찰된 사실로부터 각 그룹과 승진 간에는 '통계적으로 별반 차이가 나지 않는다.'는 주장의 유효성을 살펴보겠습니다.
(2)-3. 카이제곱 통계량(χ²)
χ² = Σ (관측값(O) − 기대값(E))² / 기대값(E)
위의 식은 카이제곱 통계량(χ²) 계산식입니다. '∑' (시그마)는 "모든 셀을 더한다."라는 뜻입니다. 예를 들어 2×2 테이블에서 4개의 셀 각각에 대해 “(O−E)²/E” 값을 계산해서 전부 더하는 것입니다.
위 식에서 관측값(O)은 실제 데이터를 보고 집계한 숫자입니다. 반면 기댓값(E)은 만약 각 그룹과 승진 사이에 아무런 관계가 없다면, 이 셀에서 기대되는 정상적인(평균적인) 숫자입니다. 예를 들어 전체 승진율이 20% 수준이라면, HiPo 그룹에 10명이 있을 경우 2명 정도가 승진을 할 것으로 기대되는 값입니다.
(O-E)는 "기대한 값과 실제 값의 차이(오차)", (O−E)²는 "오차를 음수든 양수든 구분 없이 차이의 크기 자체만을 보는 것입니다. "(O−E)²/E"는 기댓값 E를 기준으로 볼 때, 차이가 얼마나 큰 것인지 비율로서 측정하는 것입니다. 따라서 카이제곱 통계량은 "각 셀에서 기대한 값과 실제로 관측된 값이 얼마나 다른지"를 전부 합쳐서 나타낸 숫자입니다. χ²이 크다는 것은 관측값과 기댓값의 차이가 "우연"으로 보기에는 너무 크다는 것입니다. 이 말은 곧 두 변수(각 그룹과 승진)가 서로 "독립"이 아니라 관계가 있다는 것입니다.
카이제곱 통계량(χ²)을 계산해 보면, 아래와 같습니다.
위 자료는 카이제곱 통계량을 계산한 결과입니다. ① [Prom=0] 일때, 각 그룹의 관측값과 기댓값의 차이를 제곱한 후 기댓값으로 나눠 비율로 표시한 값, ② [Prom=1] 일때, 각 그룹의 관측값과 기댓값의 차이를 제곱한 후 기댓값으로 나눠 비율로 표시한 값을 모두 더한 값은 0.944444444입니다.
(2)-4. 통계적 유의성 확인 (p-value)
이제 카이제곱 통계량에 대한 최종적인 판단을 내려 보겠습니다. 이를 위해 [=chisq.dist.rt(χ²,자유도)] 함수를 사용합니다. 이 함수가 의미하는 것은 "우리가 계산한 카이제곱 통계량보다 더 크거나 극단적인 값이 '우연히' 나올 확률이 얼마인가?" 입니다. 이 값이 바로 p-value (유의확률) 입니다. 위 식에서 'rt'는 'right tail'을 뜻합니다.
카이제곱 분포는 0에서 시작하여 오른쪽으로만 길게 늘어진 분포입니다. 카이제곱은 항상 '제곱'이기 때문에 음수가 나올 수가 없습니다. 따라서 분포도 0에서 시작해서 오른쪽으로만 꼬리가 긴 형태가 됩니다. 앞서 살펴본 바와 같이 카이제곱 통계량이 클수록 기댓값과 실제 관측값의 차이가 크다는 것을 의미합니다. 따라서 우리가 관심을 가져야 할 부분은 "지금 이 χ²값이 얼마나 큰 값인가?" 입니다.
앞서 우리가 계산한 값들을 아래와 같이 다시 정리해 봅시다.
χ²=0.944444444
df=자유도=2
p-value=chisq.dist.rt(0.944444444,2)=0.623614916
카이제곱 검정에서 어떠한 변수 간의 관계가 통계적으로 의미가 있다고 말할 수 있으려면 p-value가 0.05보다 작아야 합니다. p-value가 5% 보다 낮다면, 어떠한 결과가 우연히 발생할 확률이 5%도 채 되지 않는다는 말입니다. 반면 p-value가 5%보다 크다면, 관찰된 차이가 충분히 우연으로도 발생할 가능성이 있다고 보는 것입니다. 이렇게 p-value가 5%보다 큰 경우, "통계적으로 유의미하지 않다."(not statistically significant) 라는 표현을 씁니다.
아래는 자유도=2인 카이제곱 분포입니다. x축이 카이제곱 통계량이고, y축은 그 값이 나올 가능성의 밀도를 말합니다. x축의 왼쪽에 있는 원점(0) 주변의 경우 관측값과 기댓값이 거의 같기 때문에 이런 경우에는 관측값과 기댓값의 차이가 없다고 말합니다. 반면, x축의 오른쪽으르 갈수록 관측값과 기댓값의 차이가 나는데 이런 경우에는 관측값과 기댓값의 차이가 매우 크다고 말할 수 있습니다.
χ²=0.944444444, 자유도=2인 분포에서 0.944(이하 생략)보다 오른쪽에 있을 확률은 0.62(62%) 였습니다. p-value=0.62란 말은 0.944보다 더 크거나 극단적인 값이 나올 확률이 62%나 된다는 뜻입니다. 따라서 이 정도 차이는 95% 신뢰수준에서 그냥 우연으로도 자주 생기는 차이의 일종으로 판단할 수 있게 됩니다. 결국 우리가 내릴 수 있는 결론은 "각 그룹과 승진은 통계적으로 유의미한 관계를 가진다고 보기 어렵다."라는 것입니다.
(2)-5. Executive Summary
분석 결과 현재 운영 중인 9-Box Model을 통한 인력 운영 방식은 승진 결과와 통계적으로 유의한 연관성을 보이지 않았습니다. 이는 현행 9-Box가 '승진 결정의 핵심 기준'이라기보다는 육성, 리뷰, 기타 인력 관리 목적의 참고 지표로서 주로 활용되고 있음을 시사합니다. 향후 9-Box Model을 승진과 구조적으로 연동할 것인지, 아니면 Learning and Development 목적의 도구로서 재정의를 할 것인지에 대한 전략적인 선택을 고민해야 할 때입니다.
✨여러분의 인사이트는?
지금까지 카이제곱 검정을 통해 3개 Box 그룹과 승진과의 관련성이 통계적으로 있다고 볼 수 있는지 살펴보았습니다. 3개 Box 그룹은 HiPo Core Leader, Core Talent, Role Mismatch 영역이었습니다. 통계 검정 결과를 일반화하면 "이 조직에서 9-Box Model을 통한 인력의 구분 방식은 '승진'이라는 의사결정 결과를 통계적으로 설명하지 못한다."는 것입니다. 이것은 좋고 나쁨의 문제가 아닌 사실입니다. 이 결과를 바탕으로 크게 세 가지 점을 밝히고 마무리하겠습니다.
첫째, 이 조직에서 활용하고 있는 9-Box Model은 '선발 장치'가 아니라 '관리 장치'로서 쓰이고 있다는 점입니다. 위 검정을 통해 각 박스와 승진과의 관련이 없다는 것을 알게 되었습니다. 이는 조직의 인력들이 HiPo, Core, RoleMismatch 그룹에 나눠져 있지만, 승진은 그 분류를 참고하거나 반영하여 결정되지는 않는다는 것입니다. 즉, 9-Box는 조직의 연간 교육훈련 프로그램의 유형과 그 대상을 정할 때 쓰인다든가, 리더들의 성과/잠재력 평가/리뷰 용도로만 활용될 뿐 승진의 '게이트'로 기능하지는 않을 수도 있습니다.
둘째, 이 통계 결과는 9-Box Model을 통한 인력 운영 방식이 틀렸다를 것을 반증하는 것이라기보다, 올바른 권한의 배분이 이뤄지지 못한 것일 수도 있다는 가능성을 남깁니다. 예를 들어 9-Box는 HR에서 주관하는 반면, 승진은 현업의 성과, 임원, TO, 정치적 역학관계가 작동하는 경향이 있습니다. 이렇게 될 경우 구성원의 평가 등급은 리더가 결정하고, 평가 결과에 바탕한 9-Box의 분류는 HR에서 주도권을 가져가고, 승진은 단지 9-Box에 대한 정보 외에도 임원의 영향력, 승진 TO, 조직의 중장기적 사업 전략 등에 좌우될 수 있습니다.
이처럼 평가, 9-Box 운영, 승진의 세 축에서 서로의 권한 체계가 다르거나 적용 기준이 상이할 경우에는 통계적으로 관계가 없다는 결론이 나올 가능성이 높으며, 오히려 이러한 조직적 특성이 있다면 관계가 없는 것이 정상일 수 있습니다. 그렇기 때문에 9-Box를 통한 인력 운영이 무의미하다고 볼 것은 아닙니다. 9-Box가 승진의 결정에 구조적으로 잘 정렬되어 있는지에 대한 원인 분석이 선결되어야 할 것입니다.
셋째, 만약 위 데이터의 결과가 2~3년 연속 반복되는 Trend로 도출되었다면, 그때는 9-Box에 대한 정의나 해당 박스에 인력을 선별하는 일련의 기준이 제대로 되었는지를 살펴보아야 할 것입니다. 현재의 통계 검정은 단 1개의 연도 샘플이기 때문에 샘플 데이터의 기간을 확대할 필요가 있습니다. 2~3년 정도를 분석해 본 결과 이와 같은 결론이 나왔다면, 잠재력에 대한 정의나 평가 기준이 잘못 되었거나, 평가의 방식이 왜곡을 일으켰거나 리더들이 9-Box Model을 '정치적 9-Box' 체계로 운영했을 가능성을 염두해 두어야 합니다.