전략으로 진화하는 인사평가

성과와 보상의 선순환

by 있잖아

서론

인사평가는 더 이상 단순히 점수를 매기고 줄 세우는 절차가 아니다. 오늘날 기업은 평가를 통해 임금과 승진을 결정하는 것을 넘어, 구성원의 성장과 조직 전략을 연결하는 핵심 도구로 활용한다. 이를 위해 직무 분석과 직무평가에서 출발해, 공정성과 수용성을 높이는 평가제도 설계, 시대 변화에 따른 다양한 평가 방식과 AI 기반 도구까지 새로운 시도가 확산되고 있다. 또한 구글·넷플릭스·마이크로소프트 같은 글로벌 기업들의 혁신 사례와 한국적 맥락은, 평가가 곧 조직문화와 성과를 좌우한다는 점을 보여준다. 본 글은 인사평가의 기초부터 최신 트렌드, 그리고 미래 전망까지 살펴보며, 평가가 어떻게 전략으로 진화하고 있는지를 조망하고자 한다.



목 차

1. 직무평가의 개념과 평가의 출발점

2. 평가제도 설계(목적, 구성요소, 평가 항목, 기준 설정)

3. 평가 방식 및 도구(전통적, 현대적, AI기반, 다면평가 등)

4. 평가 절차 및 일정, 운영 방법

5. 평가 결과의 해석 및 분석(평균, 편차, 정규화, 편견 방지 등)

6. 평가와 보상의 연계(성과급, 승진 등)

7. 글로벌 HR평가 트렌드(구글, 넷플릭스, 마이크로소프트 등 사례)

8. 대한민국의 공공/민간 평가 트렌드 및 변화 방향

9. AI기반 성과 관리 시스템(현재 적용 사례, 한계와 기회)

10. 미래의 인사평가: 예측, 변화 요인, 대비 전략






1. 직무평가의 개념과 평가의 출발점


직무평가의 정의: 직무평가란 조직 내 각 직무의 상대적 가치를 체계적으로 평가하는 것을 말한다. 쉽게 말해, 회사에 존재하는 여러 직무(job)들이 어느 정도의 중요성과 난이도를 가지는지 객관적으로 따져보는 과정이다. 이를 통해 직무 간 가치 체계를 만들고, 공정한 임금체계와 인사관리를 위한 기반을 마련한다. 중요한 점은 직무평가는 ‘일 자체’에 대한 평가이지, 그 일을 수행하는 개인에 대한 평가가 아니라는 것이다. 직무평가 결과는 주로 직무급(직무 가치에 따른 급여체계) 설계, 합리적인 직무분류 및 승진 경로 설정 등에 활용된다. 예컨대, 점수법이나 서열법 등의 기법을 사용하여 각 직무에 점수를 매기거나 난이도 순으로 순위를 정하는 방식이 있다.


평가의 출발점으로서 직무분석: 인사평가(성과평가)가 효과적으로 이루어지려면 우선 평가의 기준이 되는 직무를 정확히 이해해야 한다. 즉 평가의 출발점은 철저한 직무분석직무평가라 할 수 있다. 먼저 직무분석을 통해 직무의 주요 책임과 역할, 필요한 역량과 자격 요건을 규명하고 명확히 기술한다. 이를 바탕으로 직무평가를 실시하면, 해당 직무가 조직에 얼마나 기여하는지, 난이도는 어떤지 등이 밝혀지게 된다. 이렇게 도출된 직무의 상대적 가치는 공정한 임금관리뿐 아니라, 성과평가의 공정성에도 기여한다. 왜냐하면 직원의 성과를 평가할 때 반드시 그 직무의 요구사항과 목표에 비추어 평가해야 공정하기 때문이다.


직무적합성과 성과평가: 성과평가에서 '무엇을 평가할 것인가'를 정할 때 가장 먼저 고려해야 할 요소가 바로 직무 적합성이다. 예를 들어 영업직원을 평가한다고 할 때, 평가 항목에는 당연히 영업 실적이나 고객 관리 능력 같은 해당 직무의 핵심 과제가 포함되어야 한다. 만약 영업성과보다 다른 요소(예: 동료평가 결과 등)에 지나치게 높은 비중을 두면, 그 평가는 직무의 본질과 동떨어져 공정성을 잃게 된다. 이는 평가 결과에 대한 직원 수용성도 떨어뜨릴 수 있다. 따라서 직무평가로 확립된 직무 요건과 중요도에 부합하게 성과평가 지표를 설계하는 것이 중요하다. 실제로 한국의 실무에서도 직무 적합성을 고려하지 않은 인사평가 결과로 인사조치를 할 경우, 정당성을 인정받기 어렵다는 법원 판례도 있다. 이처럼 직무평가는 성과평가의 출발점이자 토대이며, '무엇을, 어떤 기준으로 평가할지'를 결정하는 나침반 역할을 한다.


과거 인사평가의 기반: 과거의 인사평가 제도를 돌아보면, 명확한 직무 분석 없이 상사의 주관적 판단이나 연공서열에 의해 이루어지는 경우가 많았다. 성과보다는 근무태도, 충성도, 근속연수 등이 중시되던 시절에는 인사평가가 공정성과 객관성을 확보하기 어려웠다. 그러나 현대 HRM에서는 직무와 성과 중심으로 패러다임이 변화하여, 먼저 직무를 정의하고 기대 성과를 설정한 후 이를 기준으로 개개인을 평가하는 방식이 정착되었다. 즉, 조직이 기대하는 성과의 기준을 직무 단위로 명확히 한 후에야, 그 기준 대비 개인의 달성도를 제대로 판단할 수 있게 된 것이다. 예컨대 MBO(목표관리) 기법도 상사와 부하가 해당 직무의 목표를 함께 설정하고 평가하는 것으로서, 직무에 기반한 평가의 고전적인 예라 할 수 있다.


직무평가와 공정성의 중요성: 오늘날 많은 기업이 직무급과 성과주의를 도입하면서, 공정한 평가제도의 중요성이 더욱 커지고 있다. 특히 한국에서는 2024년 대법원 판결로 상여금 등 일부 임금항목이 통상임금에 산입되자, 기업들이 고정급 비중을 낮추고 성과연동 변동급 비중을 높이는 임금체계 개편을 고민하고 있다. 변동급은 성과평가 결과에 따라 지급되는 것이므로, 성과평가의 공정성과 신뢰성이 담보되지 않으면 인사관리 전반에 큰 문제가 생긴다. 이런 맥락에서 직무평가를 통한 명확한 기준 설정객관적 성과평가는 단순히 HR 운영의 문제가 아니라 법적 정당성과 조직 신뢰 확보를 위한 필수 과제가 되었다. 즉 '직무에 기반한 공정한 평가'가 이루어질 때, 직원들은 평가 결과를 받아들이고 동기부여될 수 있으며, 평가 결과를 토대로 한 보상이나 승진 등 인사조치도 정당성을 인정받을 수 있다.


요약하면, 직무평가는 인사평가의 첫 단추다. 직무의 역할과 가치를 규명함으로써 '무엇을 잘해야 하는가'를 정의하고, 이를 기준으로 성과를 잴 수 있는 틀이 마련된다. 과거에 비해 직무 중심의 평가 문화가 강화된 만큼, 평가의 시작은 늘 직무에서 출발해야 할 것이다.




2. 평가제도 설계(목적, 구성요소, 평가 항목, 기준 설정)


평가제도의 목적: 성과평가 제도를 설계할 때 먼저 생각해야 할 것은 무엇을 위해 평가하는가라는 목적이다. 일반적으로 인사평가의 목적은 두 갈래로 나뉜다:


- 보상/인사 결정 용도: 성과에 따라 성과급 지급, 승진/승격, 보직 결정, 저성과자 관리 등 인사상 의사결정을 하기 위한 자료로 활용한다. 예컨대 연말 인사고과 결과를 토대로 차년도의 급여 인상률을 결정하거나, 최하위 성과자는 개선계획(PIP)에 들어가는 식이다. 이러한 관리적 목적에서 성과평가는 공정성과 객관성이 특히 중요하다. 평가 결과가 곧 불이익이나 혜택과 직결되기 때문이다.


- 개발/성장의 용도: 평가를 통해 직원에게 피드백을 제공하고 역량 개발을 지원하는 데 초점을 둔다. 즉 현재 성과 수준을 진단하여 강점과 약점을 파악하고, 향후 성장 계획을 수립하는 근거로 삼는다. 이러한 개발적 목적에서는 평가 과정 자체가 코칭과 동기부여의 기회가 된다. 구성원이 더 높은 목표에 도전하고 성장하도록 돕는 것이 핵심 목표이며, 단순히 등수를 매기는 것이 아니다.

현대의 인사평가 제도는 이 두 가지 목적을 균형 있게 달성하는 방향으로 진화하고 있다. 과거에는 등급을 매겨 보상을 나누는 기능에 치중한 나머지, 평가가 직원들의 사기를 떨어뜨리는 경우가 많았다. 그러나 최근 트렌드는 '평가를 넘어 성장으로'라는 슬로건처럼, 평가를 조직성과 향상과 개인의 성장을 동시에 추구하는 도구로 보는 시각이 강조되고 있다. 예컨대 글로벌 기업들은 “성과에 대한 책임 추궁(accountability)에서 학습과 성장(learning) 중심으로 평가의 초점을 옮기고 있다”고 하며, 피드백과 코칭을 강화하는 추세다.


평가제도의 구성 요소: 평가제도를 설계할 때는 다음과 같은 구성 요소들을 체계적으로 정해야 한다:


- 평가 대상: 누가 평가를 받는가? 일반적으로 모든 정규직원이 대상이지만, 수습 직원이나 파트타임 직원의 평가 여부, 혹은 관리자에 대한 별도 평가(예: 관리직 대상 리더십 평가) 등을 정한다.


- 평가자(평가 권한자): 누가 평가하는가? 전통적으로는 직속 상사가 1차 평가자가 되지만, 필요에 따라 복수의 평가자를 둘 수 있다. 예를 들어 다면평가의 경우 상사뿐 아니라 동료, 부하, 본인(자기평가)까지 참여시키기도 한다. 중요한 것은 평가자는 피평가자의 업무를 가장 잘 관찰하고 공정하게 평가할 수 있는 사람이어야 한다는 것이다. 한 명의 상사만 평가하면 개인적 편향이나 정치적 영향으로 왜곡될 수 있으므로, 가능하다면 여러 평가자의 의견을 반영하도록 한다. 실제 많은 조직이 1차 상사 평가 + 2차 상사(다음 상위자) 검토 체계를 두거나, 평가위원회/캘리브레이션 회의를 통해 여러 명이 평가 결과를 조정하는 절차를 운영한다.


- 평가 항목과 요소: 무엇을 평가하는가? 이는 평가 요소(criteria)를 정하는 작업으로, 해당 조직과 직무에 적합한 항목들을 선정해야 한다. 보편적으로 업적(성과), 역량(직무수행 능력), 태도(근무 자세) 등이 기본 요소가 된다. 업적은 구체적인 목표 달성도나 업무 실적을 의미하며, 역량은 업무상 필요한 지식과 기술, 문제해결력 등을 말한다. 태도는 협업성, 책임감, 회사 가치의 실천 여부 등 조직문화 측면을 포함한다. 각 기업은 이 기본 요소를 바탕으로 회사 고유의 핵심가치나 전략 과제를 반영해 항목을 구성한다. 예컨대 '도전과 혁신'을 중시하는 기업은 혁신 기여도를 별도 항목으로 넣을 수 있고, 고객 서비스를 중시하는 조직은 고객만족도를 성과 지표로 넣을 수 있다. 중요한 것은 평가항목이 해당 직무의 성공요건과 회사의 목표를 제대로 반영해야 한다는 점이다. 또한 각 항목마다 가중치를 결정해야 하는데, 이 역시 직무 특성에 맞게 균형을 잡아야 한다. (예: 영업직은 실적 항목에 높은 가중치를, 연구직은 전문지식 역량 항목에 높은 가중치를 두는 식으로.)


- 평가 기준(평가기준의 명확화): 어떻게 평가하는가? 평가지표마다 판단 기준과 평정척도를 구체화해야 한다. 평정척도란 평가자가 매길 수 있는 등급이나 점수 체계를 뜻한다. 예를 들어 5등급제 (S, A, B, C, D) 혹은 100점 만점, 1~5점 척도 등이 있다. 중요한 것은 각 등급이나 점수의 의미를 명확히 정의해 두는 것이다. 예컨대 '업무 성과 - S등급'의 기준을 '목표 대비 120% 이상 달성 및 조직에 매우 큰 기여' 등으로 기술해놓고, 'C등급'은 '목표 대비 80~90% 수준 달성, 보통 수준 기여' 등으로 정해두는 식이다. 이렇게 구체적인 가이드가 있으면 평가자가 임의로 판단할 여지가 줄어들어 평가의 일관성이 높아진다. 반대로 '태도가 불량함', '근무 부적응'처럼 모호한 문구만 있을 경우 평가의 객관성을 인정받기 어렵고, 평가자가 자의적으로 활용할 소지가 있다. 따라서 가능하면 BARS(행동기준척도) 기법처럼 구체적인 행동 예시를 등급별로 정해주는 것이 바람직하다. 한편, 정량평가(수치로 측정)와 정성평가(주관적 판단)의 균형도 고려해야 한다. 정량화 어려운 항목도 있기 마련이므로, 정성평가를 포함하되 그 경우 반드시 설명이나 근거를 남겨 두도록 한다. 예를 들어 평가서에 'C등급 부여 사유: 최근 6개월간 고객 클레임 3건 발생하였고 해결 노력 미흡'처럼 구체적 피드백을 기록하게 하면 주관적 평가의 약점을 보완할 수 있다.


- 평가 주기와 시기: 언제 평가하는가? 대부분의 기업은 연 1회 또는 연 2회 정기평가를 실시하며, 연초에 목표를 세우고 연말에 평가하는 MBO 사이클이 전통적이다. 그러나 최근에는 분기별 목표 및 평가, 수시 피드백상시 성과관리로 변화하는 추세다. 이를 제도화한 것이 예컨대 OKR(Objectives and Key Results)의 분기별 운영이나, 분기별 리뷰/피드백 세션들이다. 평가 주기가 짧아질수록 피드백이 즉시성과 민첩성을 가지지만, 관리 부담이 늘 수 있다. 따라서 회사의 업무 특성과 문화에 맞게 주기를 정해야 한다. 또한 평가 대상 기간이 충분히 누적되어야 객관성이 높아진다. 법적 분쟁 소지도 고려하면, 너무 짧은 기간의 관찰로 낮은 평가를 주는 것은 피하는 게 좋다. 예컨대 입사/배치된 지 3개월밖에 안 된 직원에게 최저 등급을 주고 퇴사 압박을 하면 정당성을 인정받기 어렵다. 이상적인 것은 상시 평가를 하되, 데이터는 장기간 축적하여 신뢰도를 확보하는 것이다.


- 피드백 및 이의제기 절차: 평가 후 어떤 절차가 이어지는가? 평가 결과는 반드시 피평가자에게 전달(feedback)되어야 한다. 이를 위해 상사는 평가 결과를 공유하고 피드백 면담을 실시하는 절차를 정해둔다. 또한 직원이 평가에 동의하지 않을 경우를 대비해 이의제기 절차도 마련해야 공정성이 높아진다. 예를 들어 평가 결과 통보 후 일정 기간 내에 이의 신청을 받아 재심의하는 프로세스를 둘 수 있다. 특히 평가 결과가 징계, 계약갱신 거부, 퇴출 등의 불이익으로 이어질 가능성이 있다면 이의제기 절차는 필수적이다. 이러한 절차를 두는 것은 직원 입장에서의 공정성 뿐만 아니라, 평가자 입장에서도 좀 더 신중을 기하게 하는 효과가 있다. '내 평가가 추후 재검토될 수 있다'는 인식이 있으면 평가자가 함부로 주관적 평가를 남발하지 않게 된다.



정당한 평가체계 설계의 포인트: 특히 한국 기업에서는 인사평가 결과를 근거로 한 인사조치의 법적 정당성이 중요하기 때문에, 평가제도 설계 시 다음 사항을 유념해야 한다는 조언이 있다:

- 직원 참여와 사전 공지: 평가기준이나 항목을 정할 때 노사협의회나 직원 대표의 의견수렴 절차를 거치거나, 최소한 평가 항목과 방식을 사전에 공개하는 것이 좋다. 직원들은 자신이 무엇으로 평가받는지 미리 알 권리가 있으며, 그래야 평가를 신뢰하고 수용할 수 있다.

- 목표 설정의 협의: 개별 성과목표를 설정할 때 당사자와 충분한 협의를 거쳐야 한다. 만약 일방적으로 지나치게 달성 곤란한 목표를 강요하면 직원은 나중에 '애초에 불가능한 목표였다'고 이의를 제기할 수 있다. 반대로 직원이 동의하여 세운 도전적 목표라면, 달성 실패에 대한 낮은 평가도 정당성이 인정될 수 있다. 또한 중간점검을 통해 목표를 조정하거나 피드백을 제공하면, 평가의 공정성과 결과 수용성이 더욱 높아진다. 이는 저성과자 관리 측면에서도 중요한데, 중간에 개선 기회를 충분히 주었음에도 나아지지 않는다면 이후 낮은 평가와 인사조치의 정당성을 뒷받침해주기 때문이다.

- 규정 준수: 마련된 평가 규정을 엄격히 준수해야 한다. 운영 과정에서 편의상 절차를 생략하거나 기준을 임의 변경하면 효력이 부정될 수 있다. 예를 들어 회사 규정에 1차·2차 평가 및 평가위원회 단계를 거치도록 했는데 어느 단계를 빼먹었다면, 그 평가를 근거로 한 조치는 무효 판결을 받을 위험이 있다.

- 취업규칙 변경 검토: 평가제도를 새로 도입하거나 크게 변경할 때 그것이 근로조건 불이익 변경에 해당하는지 검토해야 한다. 일반적으로 평가방법 자체는 취업규칙 사항이 아니지만, 평가결과에 따라 임금 삭감, 승진 누락, 해고 등이 가능해진다면 이는 근로자에게 불리한 변경으로 볼 여지가 있다. 이 경우 사전에 노조 또는 직원 과반 동의 등의 절차를 거쳐야 한다. 따라서 성과주의 제도로 개편할 때 이러한 법적 리스크도 고려해야 할 것이다.

요컨대, 평가제도 설계는 조직의 철학과 문화를 반영하면서도, 객관성과 공정성을 담보하는 치밀한 작업이다. 평가 목적을 분명히 하고, 올바른 평가 항목과 기준을 정하며, 절차를 투명하게 운영할 때 비로써 성과평가 제도가 의도한 효과(동기부여, 성과향상)를 낼 수 있다. 한 가지 명심할 점은: '왜 이 목표를 설정했고, 왜 이 행동을 높이 평가하는가'에 대한 메시지가 평가제도를 통해 직원들에게 전달된다는 것이다. 잘 설계된 평가제도는 구성원과 조직을 함께 성장시키지만, 잘못 설계되면 불신과 반발을 초래한다. 평가제도의 설계 단계부터 신중하고 과학적인 접근이 필요한 이유다.



3. 평가 방식 및 도구 (전통적, 현대적, AI 기반, 다면평가 등)


성과평가를 수행하는 방식과 도구는 시대와 기술의 발전에 따라 다양하게 변화해 왔다. 이 장에서는 전통적인 평가 방법부터 현대적인 새로운 방법, 그리고 AI 기술을 활용한 도구까지 주요 평가 방식을 살펴본다. 또한 다면평가(360도 평가)와 같은 특별한 방식도 함께 다룬다.


3.1 전통적인 성과평가 방식

과거 오랫동안 사용되어 온 전통적인 성과평가 방식들은 비교적 일방향적이고 정기적인 특성이 있었다. 주요 전통적 평가 방법들은 다음과 같다:

그래픽 평정척도법 (Graphic Rating Scale): 가장 기본적인 방식으로, 여러 평가 항목에 대해 5점 혹은 7점 척도로 표시된 평가표를 사용하여 상사가 직원을 평가한다. 예를 들어 업무지식, 업무성과, 협동성, 책임감 등의 항목별로 1~5점 또는 A~E 등급을 부여하는 식이다. 사용이 간편하고 대부분 조직에서 채택했으나, 평가자의 주관이 많이 개입되고 피드백이 부족하다는 한계가 있다.


서열법 및 강제 배분법 (Ranking & Forced Distribution): 구성원들을 상대적으로 비교하여 순위를 매기거나 정해진 분포에 따라 등급을 할당하는 방식이다. 예를 들어 한 부서에 직원 10명이 있다면 그들을 1등부터 10등까지 줄 세우는 서열법이 있을 수 있다. 또는 강제 배분은 미리 규정된 비율(예: 상위 20% A, 다음 20% B, … 하위 10% E)을 적용해 성과등급을 억지로 분포시키는 방식이다. GE의 전 CEO 잭 웰치가 도입한 이른바 “랭크 앤드 얍(Rank & Yank)” 시스템이 대표적이며, 한때 많은 기업들이 채택했다. 그러나 이 방식은 하위 등급으로 분류된 직원들의 사기 저하와 지나친 경쟁 유발 등 부작용이 컸다. 실제 마이크로소프트도 2013년까지 강제분포식을 사용하다가, 직원 혁신을 저해하고 협업을 해친다는 비판 속에 폐지했다. “동료와 협력하기보다는 서로 경쟁하게 만든다”는 것이 주된 문제였다. 최근에는 상대평가를 하더라도 엄격한 강제할당을 지양하고, 최하위 등급을 반드시 주지 않아도 되도록 재량을 부여하는 등 보완책을 쓰는 추세다.


MBO (Management by Objectives, 목표관리): 1950년대에 드러커(Peter Drucker)가 주창한 방법으로, 상사와 부하가 함께 구체적인 목표를 설정하고, 일정 기간 후 그 목표 달성 여부로 평가하는 방식이다. 전통적이면서도 아직까지 널리 쓰이는 방법으로, 특히 정량적인 목표를 부여하기 쉬운 영업, 생산 분야 등에서 활용도가 높다. MBO의 장점은 개인의 목표가 조직 목표와 연계되어 전략적 정렬을 이룰 수 있다는 것이나, 단점으로는 수치화하기 어려운 업무에는 적용이 어렵고, 목표 달성 자체에만 치중하여 단기 실적주의가 될 우려가 있다. 또한 목표 설정 및 평가 과정이 시간을 많이 소모할 수 있다. 공공부문의 성과계약제근무성적평정제 등도 MBO의 변형된 형태로 볼 수 있다.


핵심 결과 지표(KPI) 기반 평가: 조직의 핵심 성과지표에 개인 목표를 연계하여 평가하는 방법이다. MBO의 일종이지만 조직 전반에 걸쳐 BSC(Balanced Scorecard) 등의 체계를 통해 중요한 KPI를 도출하고, 이를 부서/개인 단위로 할당하여 측정한다. 민간기업에서는 재무, 고객, 프로세스, 학습&성장의 4대 영역 목표로 BSC를 설정하고 개인 KPI로 쪼개 평가하기도 했다. KPI 달성률은 측정이 용이하나, 숫자로 표현되지 않는 질적 성과 또는 혁신 노력 등을 간과할 위험이 있다.


이러한 전통적 방식들의 공통점은 일년에 한두 번, 상사가 부하를 평가하며, 등급/점수 중심으로 운영된다는 점이다. 과거 인사관리 패러다임에서는 이런 방법들이 공정성과 간편함 때문에 선호되었다. 특히 상대평가의 경우 한정된 보상풀(merit pool)을 나누기 위해 변별력을 확보한다는 명분이 있었다. 그러나 시간이 지나면서 단편적인 점수 경쟁이나 서열화로 인한 부작용이 드러나게 되었다.

예를 들어, 어떤 기업에서는 목표달성도를 평가의 전부로 삼았더니 직원들이 무난히 달성할 수 있는 낮은 목표만 세우는 일이 벌어졌다. '도전적 목표를 세웠다가 달성 못하면 낮은 점수를 받느니, 차라리 쉬운 목표로 좋은 평가를 받자'는 심리가 작동한 것이다. 이처럼 평가 제도에 맞추는 행동이 생기면 조직 차원의 혁신과 도전 문화는 위축된다. 또한 연말 일회성 평가로는 직원들의 성과를 제대로 이끌어내기 어렵고, 피드백 부족으로 평가가 끝난 뒤 성장은 없다는 비판도 있었다. 전통적 방식이 성과 서열화와 보상 분배에는 용이할지 몰라도, 지속적인 성과 개선이나 직원 몰입 측면에서는 한계가 있다는 것이 드러난 것이다.


3.2 현대적 성과평가 방식과 다면평가

최근 10~20년 사이에 많은 기업들이 전통적 평가의 문제를 인식하고, 새로운 평가 방식들을 도입해 왔다. 이러한 현대적 방식들은 대체로 피드백 강화, 연속적인 과정, 다각도의 평가 등에 초점을 맞춘다. 주요 현대적 기법과 특징은 다음과 같다:


다면평가 (360-degree Feedback): 다면평가는 상사뿐만 아니라 동료, 부하, 고객 등 여러 평가자로부터 피드백을 수집하는 방식이다. 일반적으로 상사지향적 평가의 보완으로 도입되며, 관리자의 리더십 평가 등에 특히 활용된다. 예를 들어 한 팀장의 성과를 평가할 때, 그 팀의 팀원들이 팀장의 리더십이나 소통에 대해 익명으로 피드백을 주는 식이다. 다면평가는 직원의 역량과 행동을 여러 관점에서 조명하여 보다 입체적인 평가가 가능하다는 장점이 있다. 또한 피드백의 수용성이 높아져, 한 사람 의견보다는 다수 의견이 제시될 때 피평가자가 발전 방향을 더 잘 받아들이는 경향이 있다. 다만, 익명성에 기댄 부정확한 의견이나, 잘못된 집단 분위기에 영향받을 우려도 있어 적절한 설계가 필요하다. 넷플릭스의 경우 초기에 360도 피드백을 익명으로 실시했다가, 지금은 실명으로 전환하고 직접 대면 피드백도 실시하는 쪽으로 발전시켰다. 익명일 때는 솔직하지만 건설적이지 않은 의견도 나올 수 있고, 책임 소재가 불분명하다는 단점 때문에 넷플릭스는 투명한 문화에 맞게 서로 얼굴을 보고 말하는 360을 추구하게 되었다. 다면평가는 현대적으로 널리 퍼진 기법이지만, 조직 문화에 따라 혼합형으로 활용되기도 한다 (예: 공식 평정은 상사만 하되, 피드백은 360도로 받는다 등).


목표 및 성과 관리의 민첩화 (Agile Performance Management): 전통적 연간 평가 사이클을 탈피하여, 짧은 주기의 목표 설정과 피드백을 반복하는 접근이다. 예를 들어 분기별 OKR 설정 및 리뷰, 월간 원온원(1:1) 미팅 등을 통해 상시로 목표 진행 상황을 점검한다. 구글은 이 방식을 선도한 기업 중 하나인데, 분기별 4~6개의 OKR을 설정하고 매월 체크인 회의를 통해 피드백을 준다. 이런 상시 성과관리에서 연말의 '평가 이벤트'는 중요도가 낮아지고, 지속적인 피드백 문화가 중요해지고 있다. Adobe사는 이미 2012년에 연간 성과평가를 폐지하고 '체크인(Check-in)'이라고 불리는 수시 면담 제도를 도입하여 유명해졌다. 체크인 제도 하에서 매니저는 연중 수시로 직원과 대화하며 기대치를 조율하고 피드백을 주는데, 그 결과 Adobe의 직원 자발적 이직률이 크게 감소했다고 보고되었다. 이처럼 민첩한 성과관리는 빠르게 변화하는 경영 환경에서 각광받고 있으며, 한국에서도 IT기업을 중심으로 확산되는 추세다. 예컨대 네이버, SK텔레콤 같은 IT기업뿐 아니라 현대자동차그룹, 포스코 등 제조업 대기업도 연간평가와 승진연한 틀을 깨고 수시 평가·피드백 체계를 도입하는 사례가 보고되고 있다.


평가 없는 피드백 (Rating-less Review): 일부 선진 기업들은 아예 등급이나 점수 없이 성과대화를 나누는 방식을 채택했다. 대표적인 예가 넷플릭스다. 넷플릭스는 '우리는 공식적인 성과평가나 등급 매기기가 없다'고 밝히고, 대신 수시로 자유로운 피드백을 주고받는 문화에 집중한다. 연간 보상조정도 정해진 시기에 뭉쳐서 하지 않고, 필요시에 시장수준에 맞춰 조정하며 보너스도 지급하지 않는다. 넷플릭스의 전 최고인사책임자 패티 맥코드(Patty McCord)는 'HR들은 이렇게 큰 회사에 공식 리뷰가 없다는 걸 믿지 못한다. 그런데 우리는 정말 안 한다. 사람들과 솔직하게 자주 대화하면, 매년 등급 매기는 회사보다 오히려 더 좋은 결과를 얻는다'고 말했다. 이렇듯 성과평가를 공식 절차가 아닌 일상의 대화로 치환한 것이 넷플릭스 방식이다. 물론 이러한 모델이 모든 조직에 맞는 것은 아니다. 넷플릭스는 탁월한 인재 밀도(high performance culture)와 신뢰 문화를 전제로 하고 있어, 어느 정도 자율경영이 가능한 환경에서나 구현될 수 있다. 하지만 이 흐름에서 알 수 있듯, 현대적 성과관리의 극단은 형식적 평가보다는 실제적인 피드백을 더 중시하는 방향이다.


행동 피드백 중심 기법: 숫자보다는 행동과 발전점에 초점을 맞추는 방법도 널리 쓰인다. Microsoft는 수치화된 등급을 없애고 'Perspectives(퍼스펙티브)'라는 동료 피드백 도구를 도입했다. 동료에게 '계속해서 잘하고 있는 점(Keep Doing)', '다시 생각해볼 점(Rethink)'에 대해 서술형으로 피드백을 받는 것이다. 이 과정은 익명이 아니며, 작성된 피드백은 관리자 검토 없이 곧바로 해당 직원에게 전달된다. 또한 질문들도 체크박스 없이 오직 서술형 답변으로만 구성되어 있어, 등급화나 공식 평가라기보다는 건설적인 제언에 가깝게 설계되었다. 이는 사람의 두뇌가 숫자 평가를 받을 때 방어적으로 반응하는 경향(피드백을 위협으로 느끼는 생리)을 완화하기 위한 신경과학적 접근이었다고 한다. 요컨대 피드백을 비난으로 느끼지 않도록 대화의 형태로 바꾸는 노력이 현대적 성과관리의 한 모습이다.


절대평가 및 맞춤형 평가: 전통적 상대평가의 폐해를 느낀 조직들은 절대평가로 전환하는 추세도 강하다. 절대평가는 모두가 기준만 넘으면 A등급을 받을 수도 있고, 반대로 아무도 기준을 못 넘으면 전원 낮은 등급이 될 수도 있다. 중요한 것은 다른 사람과의 비교가 아니라, 미리 정해둔 성과기준에 비추어 평가하는 것이다. 이는 경쟁보다는 개인의 성장에 초점을 맞추는 문화에 부합한다는 평가를 받는다. 물론 절대평가도 단점은 있다. 평가기준 설정이 어렵고, 평가자 간 관대함 차이 등이 생길 수 있다. 그래서 일부 기업은 절대평가를 도입하되 평가자 교육평가 결과의 모니터링(정규화 작업)을 병행한다. 예컨대 한 평가자가 지나치게 후하게 점수를 준다면 사후에 HR 부서나 평가위원회에서 그 분포를 조정하거나 피드백을 줄 수 있다. 이를 정규화(normalization)라고 하며, 평가자별 평균점수나 표준편차를 활용해 조정하는 통계기법을 쓰기도 한다. 다만 이러한 조정은 투명하게 운영하지 않으면 구성원 신뢰를 떨어뜨릴 수 있어, 최근에는 지나친 기계적 조정은 지양되는 추세다. 대신 평가자들에게 명확한 기준 교육을 하고, 캘리브레이션(평가 조정 회의)을 통해 큰 편차만 수정하는 방식이 권장된다.


3.3 AI 기반 평가 도구와 시스템

AI(인공지능) 기술은 최근 성과관리 분야에도 속속 도입되고 있다. AI 기반 성과평가 시스템은 크게 두 가지 측면에서 활용된다: 평가 프로세스의 자동화/지원, 그리고 데이터 분석을 통한 인사이트 도출이다.


평가 문서 작성 지원: 관리자들이 일일이 평가 코멘트를 작성하는 대신, AI가 미리 평가 초안이나 피드백 문구를 생성해주는 도구들이 등장했다. 예를 들어 어떤 직원이 올 한 해 달성한 업무 기록과 동료 피드백이 시스템에 쌓여 있다면, AI가 이를 요약해 '이 직원은 목표를 110% 달성했고, 협업 프로젝트에서 리더십을 발휘했다'는 식의 코멘트를 작성해준다. 관리자는 이 초안을 참고하여 수정을 가하면 성과평가 서술을 빠뜨리는 부분 없이 완성할 수 있다. Lattice 등 HR 소프트웨어에서는 챗GPT 등의 AI를 연계하여 '성과 리뷰 초안 만들기' 기능을 제공하기 시작했다. 다만 'AI가 써준 텍스트'는 때때로 피상적일 수 있어, 최종 판단과 맥락은 인간 관리자 몫으로 남겨둬야 한다는 조언이 많다.


실시간 성과 모니터링 및 피드백: AI는 대량의 업무 데이터를 실시간으로 처리하여 성과 현황 대시보드를 제공할 수 있다. 예컨대 영업 사원의 통화 횟수, 고객 응대 시간, 계약 성사율 등의 데이터를 AI가 상시 분석해 목표 대비 진행률이나 동료 평균 대비 퍼포먼스를 보여준다. 나아가 이상징후 감지도 가능하다. 일정 기간 성과가 급격히 떨어지는 직원이 있으면 관리자에게 '부하직원의 최근 성과 지표가 20% 하락했습니다. 피드백 면담을 권장합니다'와 같은 알림을 줄 수 있다. 이를 통해 평가가 연말 결과 통보가 아닌, 성과 향상을 돕는 상시 컨설턴트 역할을 할 수 있게 된다. 해외의 일부 서비스형 소프트웨어는 팀 협업 툴과 연동되어, 프로젝트 마감 시점에 AI가 팀원들에게 자동으로 간단한 상호 피드백 요청을 보내는 기능도 있다. 이렇게 모인 데이터를 구조화하여 관리자는 항상 업데이트된 평가 자료를 확보할 수 있다.


데이터 기반 의사결정 및 편향 제거: AI의 가장 큰 장점은 방대한 데이터를 인간보다 빠르고 객관적으로 분석한다는 점이다. 이를 성과평가에 적용하면 평가 편향(bias)을 줄이는데 도움이 될 수 있다. 예를 들어 과거 5년치의 평가 결과와 승진 데이터를 AI로 분석하면, 특정 부서의 특정 상사가 유난히 부하 직원들에게 박한 점수를 주었는지, 혹은 어떤 그룹이 일관되게 낮은 평가를 받았는지 등의 패턴을 찾아낼 수 있다. 만약 이러한 패턴이 성별이나 인종, 나이 등 특정 집단과 상관관계가 있다면 편향 가능성을 의심하고 교정 조치를 취할 수 있다. 실제로 기업들이 성과평가로 인한 급여 격차 문제를 인식하면서, AI를 활용해 시뮬레이션과 데이터를 돌려 성별/인종별 평가 결과 및 보상 차이를 점검하는 사례가 늘고 있다. 예컨대 넷플릭스는 아예 연봉 조정을 성과평가와 분리하는 대신, 시장 데이터에 따라 수시로 조정하면서 성과평가로 인한 pay gap 발생을 최소화한다는 전략을 취한다. AI는 이런 공정성 분석 작업을 신속히 수행함으로써 관리자가 보다 데이터에 기반한 의사결정을 내리도록 돕는다.


피플 애널리틱스와 예측: 성과평가 데이터를 AI로 종합 분석하면 인사 예측 모형도 만들 수 있다. 예를 들어 성과가 계속 저조한 직원의 이직 확률이라든지, 어떤 유형의 인재가 우리 조직에서 고성과자가 되는가 등의 인사이트를 얻는다. IBM은 Watson AI를 활용해 직원들의 성과와 경력 데이터를 분석, 퇴사 가능성이 높은 직원을 예측하여 미리 유지 대책을 세웠다는 사례가 알려져 있다. 또한 AI는 개개인의 강약점을 파악해 맞춤형 학습/코칭을 추천하기도 한다. 성과평가 내용을 바탕으로 '리더십 능력이 필요하다면 이러한 코스에 등록하세요'라거나, '시간 관리에 어려움이 보이니 멘토 ○○를 붙여줍시다'와 같은 제언을 자동화할 수 있다. 이는 HR의 전략적 파트너 역할을 AI가 일부 지원하게 되는 모습이다.


AI 도입의 한계와 고려사항: AI 기반 성과관리에도 분명 제약과 한계가 존재한다. 첫째, 데이터 편향 문제다. AI는 과거 데이터를 학습하기 때문에, 그 데이터에 내재된 편향이 있으면 AI 판단도 이를 답습하거나 심화시킬 수 있다. 예를 들어 과거에 특정 부서가 만년 낮은 평가를 받았다면 AI는 그 부서 성과를 낮게 예측할 수 있는데, 실제로는 그 부서에 대한 편견이나 환경적 요인이 있었을 수 있다. 둘째, 정성적 요소의 판단 어려움이다. 인간의 잠재력, 팀 분위기 기여 등 숫자로 포착하기 어려운 부분까지 AI가 완벽히 이해하긴 어렵다. 셋째, 수용성 문제다. 직원들이 AI의 평가나 피드백을 신뢰하고 받아들일 준비가 되었는지도 중요하다. '내 관리자는 나를 몰라도 AI가 내 업무 이메일과 코드를 다 읽고 평가한다'는 상황이라면, 프라이버시 이슈와 함께 심리적 저항이 클 수 있다. 실제 유럽 등에서는 AI가 인사평가에 직접 관여하는 것에 대한 규제 논의도 진행 중이다(투명성, 설명가능성 요구 등).


따라서 AI는 보조적 도구로 활용하되, 최종 판단은 사람이 내리고 소통도 사람이 하는 것이 바람직하다는 것이 중론이다. 잘 활용하면 AI는 성과관리의 효율성과 공정성을 높여주는 파트너가 될 것이다. 예컨대 AI는 복잡한 수작업(엑셀로 성과집계 등)을 덜어줘 HR 담당자들이 더 전략적 업무에 집중하게 하고, 평가 과정의 객관적 근거를 강화해 줄 수 있다. 중요한 것은 기술 도입 이전에 평가 철학을 분명히 하고, AI의 결과를 해석하고 활용할 HR 역량을 함께 개발하는 것이다.

요약하면, 전통적 방식은 단순 명료하지만 경직성과 한계가 있었고, 현대적 방식은 피드백과 유연성을 높여 성과관리 패러다임을 전환시키고 있다. 여기에 더해 AI 기술은 성과관리를 데이터 중심으로 혁신할 기회를 제공하지만, 동시에 새로운 윤리적·조직문화적 도전도 안겨준다. 각 조직은 자기 상황에 맞는 방식과 도구를 적절히 조합하여 활용하는 지혜가 필요하다.



4. 평가 절차 및 일정, 운영 방법


평가 절차와 일정은 성과평가 제도를 실제로 어떻게 운영할 것인가에 관한 것이다. 잘 설계된 평가제도도 운영이 미흡하면 유의미한 효과를 거두기 어렵다. 여기서는 성과평가의 일반적인 절차와 일정 관리, 그리고 운영상의 주요 포인트를 살펴본다.


4.1

성과평가의 일반 절차

일반적인 성과평가 절차는 목표 설정 → 중간 점검 → 최종 평가 → 피드백/활용의 흐름으로 이루어진다:


목표 설정 (Planning): 평가 기간 시작 시점에 직원, 상사 간에 해당 기간 달성할 성과 목표를 설정한다. MBO 시스템에서는 연초에, OKR 시스템에서는 분기 첫 달에 이 과정을 거친다. 목표는 SMART 원칙(구체적이고 측정가능하며 달성가능하고 관련성 있고 기한이 있는)으로 설정하는 것이 권장된다. 목표 설정 시 상사와 직원이 충분히 합의하는 것이 중요하다. 합의된 목표는 이후 평가의 가장 중요한 기준이 되며, 목표 자체에 대한 공감대가 없으면 평가결과에 대한 수용성도 떨어진다. 때로는 회사의 전략 변경이나 개인 상황 변화로 목표 수정이 필요할 수 있는데, 이 경우 공식적인 목표 조정 절차를 두어 변경된 목표도 기록해 놓는다.


중간 점검 (Monitoring): 평가 기간 중간에 공식/비공식 진행 상황 점검을 한다. 연간 평가라면 보통 중간년평가(half-year review)분기별 리뷰가 해당된다. 이 단계에서는 현재까지의 목표 달성도를 서로 공유하고, 장애 요소는 무엇인지, 목표 달성 전망은 어떠한지 논의한다. 필요 시 목표를 상향 혹은 하향 조정하거나 우선순위를 바꾸는 것도 이 시점에 가능하다. 중간 점검은 또한 피드백 제공의 기회다. 상사는 잘하고 있는 부분을 칭찬/강화하고, 부족한 부분에 대해 개선 코칭을 한다. 이러한 과정이 중요한 이유는, 중간에 피드백을 받으면 남은 기간 성과 향상의 개선 여지가 생기기 때문이다. 만약 피드백 없이 연말에 결과만 통보하면, 피평가자는 '알았으면 더 잘했을 텐데'라는 아쉬움만 남게 된다. 법적 측면에서도 중간에 개선 기회를 부여했는지 여부가 저성과자 조치의 합법성 판단 기준 중 하나다. 따라서 많은 기업들이 상시 피드백 문화를 만들기 위해 관리자의 성과코칭을 장려하고, 일부는 이를 평가의 일부(관리자 평가 항목)로 넣기도 한다. 예컨대 Google은 월례 1:1 체크인을 통해 경력 개발, 코칭, 애로사항 논의를 정례화하여 운영한다.


최종 평가 (Review & Rating): 평가 기간 종료 시점에 상사가 직원의 목표 달성도와 역량 발휘 정도를 종합하여 평가서를 작성한다. 먼저 자기평가를 실시하는 조직도 많다. 직원 스스로 작성한 자신의 성과 요약과 평가는 상사에게 참고자료가 된다. 이후 1차 평가자(보통 직속상사)가 평가등급 및 코멘트를 부여하고, 2차 평가자(상사의 상사)나 평가위원회가 그것을 검토/승인하는 절차를 거친다. 많은 기업들이 이 단계에서 평가등급의 캘리브레이션(calibration)을 실시한다. 캘리브레이션이란 동일 직급 또는 부서 간의 평가결과를 한 데 모아 균형을 맞추는 회의다. 여러 관리자가 모여 각자 팀원의 초안 등급을 설명하고, 타팀과 기준을 맞춰 과도하게 높거나 낮은 평가를 조정한다. Google 등의 기업은 이 과정을 통해 관리자의 관대함 차이를 보정하고, 공정성 인식을 높인다고 한다. 또한 캘리브레이션은 관리자에 대한 교육 효과도 있어서, 다른 리더들의 기준과 비교해보며 평가자 역량이 상향평준화되는 장점이 있다. 최종적으로 조직 단위별 등급 분포가 결정되면 HR부서에서 이를 취합하여 회사 전체의 성과 등급 분포를 산출한다. 그리고 필요에 따라 보상 결정(성과급 예산 배정 등)에 활용한다.


피드백 및 면담 (Feedback): 평가 결과는 반드시 각 피평가자에게 전달되어야 한다. 상사는 사전에 준비를 해서 직원과 평가 피드백 면담을 갖는다. 이 자리에서 최종 등급과 핵심 코멘트를 전달하고, 잘한 점을 칭찬하며 개선이 필요한 부분을 구체적으로 알려준다. 중요한 것은 평가 면담은 일방적 통보가 아니라 대화가 되어야 한다는 점이다. 직원의 의견 진술 기회도 주어 피드백에 대해 질문이나 자신의 관점을 이야기할 수 있도록 한다. Google의 경우 두 번의 미팅으로 나누는데, 첫 미팅에서는 평가 피드백만 주고, 며칠 후 두번째 미팅에서 보상과 승진 얘기를 한다. 이렇게 분리하는 이유는, 한 번에 보상 이야기를 들으면 직원이 방어적으로 변해 피드백을 제대로 받아들이지 않기 때문이라고 한다. 국내 기업들도 평가 피드백 면담을 점차 강조하는 추세다. 평가 결과만 통보하고 끝내는 것이 아니라, '다음에 어떻게 더 성장할 것인가'까지 논의하는 코칭 면담으로 확장시키는 곳도 있다.


이의제기 및 확정: 피드백까지 거친 후 직원이 자신의 평가에 이의를 제기하고 싶다면, 공식 절차에 따라 신청할 수 있다. 기업에 따라서는 이의제기가 들어오면 재평가 위원회를 열어 다른 부서 관리자들이나 HR이 참여한 가운데 해당 사례를 검토한다. 그리고 오해나 오류가 있으면 평가를 수정하거나, 정당하다 판단되면 그대로 확정짓는다. 이러한 절차는 평가에 대한 납득도를 높이고, 혹시 모를 평가자 남용을 견제하는 기능을 한다. 물론 모든 회사가 이런 공식 이의제기를 받는 것은 아니며, 대신 비공식 상담을 통해 해소하는 경우도 있다. 어떤 방식이든, 직원이 자신의 평가에 피드백 이상의 설명을 원할 때 경청하고 대응하는 것이 중요하다.


평가 결과 활용: 최종 확정된 평가 결과는 인사 데이터베이스에 기록되어 향후 인사관리의 기초 자료가 된다. 승진 후보 선정, 교육 대상자 선발, 핵심인재 식별, 저성과자 프로그램 대상 지정 등 여러 방면에 활용될 수 있다. 다만 유의할 것은 평가 결과의 보안과 프라이버시다. 평가 등급과 코멘트는 엄연히 개인 정보이므로, 이를 다루는 사람(관리자, HR)은 보안을 지켜야 한다. 직원 입장에서도 자신의 평가 결과가 부당하게 다른 동료에게 알려지지 않도록 하는 것이 신뢰와 공정의 측면에서 중요하다.


4.2

일정 및 운영상의 고려사항

평가 일정 관리: 성과평가는 연간 HR 캘린더에서 큰 이벤트 중 하나다. 평가와 이어지는 보상 지급 시기 등을 고려해 일정을 촘촘히 관리해야 한다. 대략적인 연간 일정 예시는 다음과 같다:

- 1월: 전년도 평가결과 확정, 피드백 면담 실시, 성과급 및 연봉인상 결정.

- 1~2월: 올해의 개인 목표 설정 (조직 목표 확정 후 cascade-down).

- 상반기 말(6~7월): 중간 평가/피드백 (필요시 목표 조정).

- 12월: 연말 최종 평가 실시, 캘리브레이션 및 등급 확정.

- 이듬해 1월: 평가 결과 피드백 및 보상 반영.

이러한 일정은 회사마다 다르지만, 핵심은 사전에 충분한 시간을 배정하는 것이다. 예를 들어 평가자들이 바쁜 연말에 촉박하게 평가를 하다 보면 오류가 생길 수 있다. 따라서 미리미리 평가 교육을 시행하고, 평가 작성을 위한 시스템 오픈 기간도 여유 있게 주는 것이 좋다. 또한 캘리브레이션 회의 일정은 관련 모든 관리자들이 참석 가능하도록 조율해야 한다.


평가자 훈련: 운영 면에서 종종 간과되지만 매우 중요한 것이 평가자 교육이다. 관리자들이 평가 기준을 제대로 이해하고 공정하게 평가할 수 있도록, 매년 평가 시즌 전에 가이드라인을 배포하거나 워크숍을 열어야 한다. 많은 기업에서 평가 오류(halo, leniency, central tendency 등) 사례를 교육자료로 제공하고, 피드백 작성법을 코칭해준다. 특히 처음 관리자가 된 사람들에게는 실무적 조언이 큰 도움이 된다. 예를 들어 “부하 직원에게 피드백을 줄 때 성격에 대한 공격이 아니라 행동과 결과에 집중하라”, “깜짝 놀랄 통보가 되지 않도록 연중 상시 대화해 둬라” 등의 팁이 있다. 이러한 교육과 커뮤니케이션 노력은 결국 평가 운영의 일관성과 신뢰도를 높인다.


시스템 및 도구 활용: 운영의 효율성을 위해 요즘은 전산 시스템, SaaS 툴을 많이 활용한다. 한국의 많은 공공기관도 예전처럼 엑셀과 종이로 하던 평가를 탈피해, 클라우드 인사평가 시스템을 도입하는 추세다. 이런 시스템은 자동 알림(평가 기간 개시 통보, 피드백 완료 요청 등), 데이터 집계(등급 분포 자동 계산), 이의신청 관리 등 여러 면에서 업무량을 줄여준다. 또한 모바일/웹으로 언제 어디서나 평가 입력과 확인이 가능하여 관리자들의 편의도 높아진다. 특히 공공기관의 경우 규정이 복잡하고 평가 문항이 많은데, SaaS 솔루션이 이를 모듈화하여 지원함으로써 평가 운영의 정확성과 공정성을 높인 사례도 있다. 예컨대 어떤 기관은 200여 페이지에 달하는 인사평가 편람을 소프트웨어에 세밀히 구현하여, 조직별로 다른 평가 문항과 가중치를 모두 반영하도록 했다. 이를 통해 사람이 수작업으로 할 때 생길 수 있는 평가 점수 산출 오류나 기준 적용 누락을 줄이고, 평가 결과의 신뢰성을 제고했다. 민간기업도 퍼포스(Purpose) 등의 스타트업 솔루션이나, 글로벌 솔루션(Workday, Oracle HCM 등)을 도입해 프로세스를 표준화하고 있다.


공정성 유지와 커뮤니케이션: 운영 단계에서 지속적으로 신경써야 할 것은 평가 공정성에 대한 커뮤니케이션이다. 직원들은 자신들의 노력이 어떻게 평가되고 있는지 관심이 크므로, 회사는 평가철마다 CEO 메시지나 HR 안내문 등을 통해 평가가 공정하게 이뤄질 것임을 강조하고, 주요 변경 사항이나 유의사항을 알리는 것이 좋다. 예를 들어 “올해부터 절대평가로 전환하였으니 과거와 등급 분포가 달라질 수 있다”, “다면평가 의견은 익명으로 수렴하지만 인사고과 점수에는 반영되지 않는다” 등의 정보를 미리 주어 혼란을 예방한다. 또한 평가 후 설문조사 등을 통해 직원들의 만족도나 의견을 듣고, 다음 사이클에 개선하는 피드백 루프도 필요하다. 실제로 어떤 기업은 매년 평가 이후 '평가 제도 만족도 조사'를 실시하여, 직원들이 느낀 불만이나 건의사항을 모은다. 이를 바탕으로 평가 기준을 손본다거나, 평가자 교육에 반영하기도 한다. 이런 참여형 개선 노력이 쌓이면 구성원들이 '평가제도가 우리와 함께 발전하고 있다'고 느끼며, 제도에 대한 신뢰가 높아진다.

마지막으로, 평가와 그 이후를 단절된 것으로 보지 말고, 연속적인 인재관리 사이클로 여기는 관점이 중요하다. 평가 결과가 나오면 그걸로 끝이 아니라, 다음 스텝(보상, 육성, 배치 등)으로 이어진다. 예를 들어 우수 평가자는 핵심인재 풀에 넣어 경력 개발 계획을 수립하고, 낮은 평가자는 원인을 분석해 개선계획 또는 지원 대책을 마련해야 한다. 이렇게 평가-피드백-개발이 이어져 갈 때, 성과평가는 비로소 조직 성과를 지속 향상시키는 선순환 고리의 일부가 될 수 있다.



5. 평가 결과의 해석 및 분석 (평균, 편차, 정규화, 편견 방지 등)


성과평가 결과가 산출되고 난 뒤에는 그 의미를 정확히 해석하고 분석하는 작업이 뒤따른다. 단순히 점수와 등급을 매겼다고 끝나는 것이 아니라, 그 결과를 종합적으로 검토하여 공정성을 확인하고 조직 관리에 시사점을 얻는 과정이 필요하다. 이번 장에서는 평가 결과 분포 분석, 통계 기법(평균, 표준편차, 정규화 등)의 활용, 그리고 평가상의 편견(bias)을 방지하는 방법에 대해 살펴본다.


5.1

평가 결과 분포와 통계적 분석

평균과 분포 파악: 최종 평가가 끝나면, 우선 조직 전체 성과분포를 살펴볼 수 있다. 예컨대 5등급제를 사용하는 회사라면 각 등급에 몇 퍼센트의 직원이 속하는지 확인한다. 만약 A등급이 전체의 40%에 달한다면, 해당 평가가 기준에 비해 너무 관대했는지 검토해야 할 수도 있다. 반대로 C등급 이하가 5% 미만이라면, 혹시 관리자의 평가 기피(낮은 등급을 주길 꺼려함) 현상은 아닌지 의심해 볼 수 있다. 평균점수도 참고 지표가 된다. 100점 만점일 때 회사 전체 평균이 90점이라면, 사실상 거의 모든 사람이 목표를 초과 달성했다는 뜻인데, 이것이 현실적으로 타당한지 생각해봐야 한다. 물론 이상적인 상황에서는 모두가 우수한 성과를 낼 수도 있지만, 평가제도의 본래 취지는 우열을 가리고 피드백을 제공하는 것인 만큼, 평가 척도의 유효성을 점검하는 차원에서 이런 데이터를 본다. 많은 기업들이 성과평가 사후보고서를 작성하여 등급 분포표와 평균, 표준편차 등을 경영진에 보고한다.

표준편차와 평가자 간 분산: 표준편차는 평가 점수 분포의 흩어짐 정도를 나타낸다. 표준편차가 너무 작으면 (예: 모두 점수가 4.5±0.2 범위), 평가가 변별력 없이 이루어진 것이고, 너무 크면 (예: 4.5 받는 사람도 있고 2.0 받는 사람도 있음) 편차가 크다는 뜻이다. 특히 평가자(혹은 부서)별로 결과 편차를 보면 흥미로운 인사이트를 얻는다. 예를 들어 A부서 과장들의 평균평점이 4.8이고, B부서 과장들의 평균평점이 3.5라면 두 부서 관리자의 평가 스타일이 상당히 다르다는 의미다. A부서장은 후한 편, B부서장은 깐깐한 편일 수 있다. 이런 경우 HR은 다음 연도 평가 전에 관리자를 모아 기준 정렬을 다시 하거나, 평가 calibration 때 B부서 직원들의 상대적 불이익을 보완해줄 방안을 모색할 수 있다. 실제 다국적 기업들은 평가자 간 일관성을 중요시하여, 평가가 끝나면 부서별 점수 분포를 서로 비교하고 outlier(극단적 분포)를 찾아낸다. 그 다음 해당 평가자에게 피드백을 주거나 추가 조정을 요청한다. 예컨대 Google도 관리자들이 초안 평가 후 모여서 서로의 평가 분포를 공유하며, “당신 팀은 왜 이렇게 모두 높나요?” 혹은 “여긴 왜 이렇게 낮죠?”를 토론한다고 한다. 이를 통해 어느 한쪽으로 쏠리지 않는 공정한 분포를 최종 산출하게 된다.


정규화 (Normalization) 기법: 정규화란 평가자마다 들쑥날쑥한 평균이나 분포를 일정한 기준으로 보정하는 것을 의미한다. 이는 주로 대기업에서 평가 인원 수가 많고 여러 부서에 걸쳐 있을 때 활용된다. 방법은 다양하다:

- 강제 할당 비율 적용: 모든 부서가 동일하게 A:20%, B:30%, C:40%, D:10% 등의 분포를 따르도록 하는 것. 하지만 이 방법은 앞서 논의했듯 부작용이 있어 최근엔 엄격 적용을 피한다.

- 평균 및 표준편차 조정: 평가자별 점수 분포를 표준화하여 합치는 방식이다. 예를 들어 어떤 평가자는 평균 90점, 표준편차 5점으로 줬고, 다른 평가는 평균 70점, 표준편차 10점으로 줬다면, 후자의 부하직원이 과대불이익을 받을 수 있다. 이를 방지하기 위해 각 평가자의 점수를 Z점수(평균 대비 몇 시그마 위인지)로 변환한 뒤 전체를 모아 등급을 매기는 것이다. 이 경우 평가자 간 관대함 차이는 제거되지만, 개개인의 실제 점수가 변환되기 때문에 직원 입장에서는 과정이 불투명하게 느껴질 수 있다.

- 하위 등급 관리 재량 부여: 각 부서장에게 최하위 등급을 반드시 줄 필요는 없게 하거나, 혹은 최하위 등급 대상자에 대한 재검토 기회를 주어, 억울한 사례를 줄이는 방법이다. 예컨대 어떤 팀에 5명밖에 없는데 전원 훌륭한 성과를 냈다면, 굳이 한 명을 꼴찌로 정해 D등급 줄 필요 없다는 것이다. 이때는 그 팀에서는 D등급을 안 주고, 전체 회사 관점에서도 꼭 일정 비율 D를 채우지 않아도 되게 운용한다. 실제 판례에서도 '상대평가에서 최하위를 받았다고 해서 그 사람이 절대적으로 업무능력이 부족한 건 아니다'라는 취지가 있기 때문에, 최근 기업들은 하위 등급을 사람 수만큼 반드시 만들지 않는 쪽으로 가고 있다.

정규화 작업은 공정성과 수용성 사이의 균형이 중요하다. 너무 기계적으로 적용하면 평가자들은 '어차피 내 점수 마음대로 바꿀 텐데' 하며 진지하게 평가하지 않을 수 있다. 반면 아무 교정 없이는 부서 간 형평성 문제가 발생할 수 있다. 그래서 권장되는 것은, 사전적 예방(평가자 교육, 캘리브레이션)으로 편차를 줄이고, 사후에는 최소한의 보정만 하는 것이다. 또한 직원들에게 평가 결과를 설명할 때도, 어떻게 등급이 도출되었는지 투명하게 알려주면 수용성이 높아진다. 일부 기업은 '우리 회사는 절대평가 중심이지만, 동일 직급 간의 일관성을 위해 임원들의 협의를 거친다'는 식으로 가이드 문서를 배포한다. 이처럼 정규화도 절차의 일부임을 밝혀두는 것이 신뢰 형성에 좋다.


5.2

평가상의 편견(bias)과 방지 대책

인간이 하는 모든 평가는 어느 정도 주관의 개입이 불가피하다. 성과평가에서도 평가자의 인식과 판단의 왜곡(bias)이 흔히 나타난다. 이를 완전히 없앨 수는 없지만 최소화하고 인지하는 노력이 필요하다. 대표적인 평가 편견과 그 방지책은 다음과 같다:


할로 효과 (Halo Effect): 피평가자의 한두 가지 두드러진 특성이 전체 평가에 영향을 주는 현상이다. 예를 들어 어떤 직원이 태도가 매우 훌륭하면, 성과 수치가 약간 부족해도 '저 친구는 열심히 하니까 성과도 잘했을 거야' 하며 후하게 줄 수 있다. 반대로 한 번 큰 실수를 한 직원은 그 후 개선했어도 평가자가 계속 낮게 보는 경우도 있다. 할로 효과를 막으려면 평가 항목별로 구분하여 점수를 매기고, 근거를 명시하도록 하는 것이 도움이 된다. 항목별 평가시스템은 어느 한 요소에 끌려 전체를 뭉뚱그려 평가하는 것을 방지한다. 또한 평가서에 구체적 사례를 쓰게 하면, 막연한 인상보다 사실에 근거한 평가가 된다.


관대화/엄격화 경향: 일부 평가는 모두에게 후한 점수를 주고, 일부는 대부분 낮은 점수를 주는 경향이 있다. 전자는 좋은 게 좋은 것 식으로 무난히 넘어가려는 심리이고, 후자는 완벽주의적 기준 때문일 수 있다. 이를 교정하려면 평가자 교육비교 피드백이 중요하다. 평가 시즌 전에 지난번 각 평가자의 분포를 보여주며, '귀하의 평균 점수가 타 평가자 대비 상당히 높습니다' 혹은 '낮습니다'를 알려주면 스스로 조정하려 노력한다. 또한 다수 평가자가 참여하면 한 사람의 극단적 경향이 누그러질 수 있다. 예를 들어 1차 평가자가 지나치게 관대했다면, 2차 평가자나 위원회에서 '이건 너무 높지 않나요?' 하고 조정할 여지가 생긴다.


중심화 경향 (Central Tendency): 모두를 중간 등급에 몰아넣고 극단을 피하는 편향이다. 갈등을 싫어하거나 책임지기 싫어하는 평가자가 'A도 B도 아닌 그냥 다들 보통이야' 식으로 평가하는 경우다. 이러면 성과평가의 변별/인식 기능이 상실된다. 이를 막기 위해 일부 기업은 강제 분포를 썼지만 앞서 논의한 문제로 요즘은 덜 쓰인다. 대신 평가 코멘트 의무화 등이 효과적이다. 이유를 쓰도록 하면 막연히 중간만 주기보다, '왜 중간인지' 생각하게 되고 설득력 없이 모두 똑같은 평가는 피하게 된다. 또한 평가 제도의 목적을 교육할 때 '성과에 차등을 두지 않으면 보상도 공정해질 수 없다'는 점을 주지시키는 것도 필요하다.


최근 사건 효과 (Recency Effect): 평가 기간 전체를 보지 못하고, 평가 직전에 일어난 사건이나 성과에 영향을 크게 받는 편향이다. 예컨대 1년 내내 성과가 평이했는데 12월에 대형 계약을 성사시키면 그 공로만으로 최고점을 준다든지, 반대로 연말에 실수 하나로 나쁜 평가를 받는 경우다. 이를 완화하려면 성과 기록의 상시화가 필요하다. 관리자에게 연중에 수시로 성과 메모를 남기도록 하거나(시스템 활용), 분기별 리뷰를 통해 이미 한 부분은 평가에 반영해 놓으면, 최근 일만으로 좌우되지 않는다. 또한 자기평가서에 본인이 성과를 연간 단위로 요약하게 하면, 상사가 놓친 과거 업적을 떠올리는데 도움이 된다.


유사성/대조 효과: 평가자가 자신과 비슷한 유형의 부하에게 후한 점수를 주는 유사성 편향과, 자신에 없는 뛰어난 강점을 가진 부하를 과하게 높이거나 낮게 보는 대조 효과도 존재한다. 예를 들어 소심한 상사가 적극적인 부하를 볼 때 불편하게 느껴 낮출 수 있고, 반대로 '나랑 닮은 이 친구는 일 잘할 것'이라 막연히 높일 수 있다. 이를 막으려면 명확한 기준객관적 데이터에 의존하도록 하는 것이 최선이다. 가능하면 여러 사람의 평가를 섞는 다면평가도 이 부분의 오류를 줄일 수 있다. 서로 다른 관점이 합쳐지면 한 사람의 주관적 호불호가 결과에 덜 투영된다.


피드백 편향: 평가자가 좋아하는 피드백만 주는 경향이다. 이는 평가 결과 분석 단계라기보다 피드백 운영에서 문제인데, 어떤 상사는 좋은 얘기만 해주고 발전점은 피한다. 반대로 어떤 이는 개선점 지적만 하고 잘한 건 언급 안 한다. 이 역시 교육과 문화의 영역이다. '인정할 건 확실히 인정하고, 개선점은 건설적으로 제시하라'는 원칙을 세우고, 특히 칭찬 인색 문화가 있다면 개선이 필요하다. 평가 결과를 활용해 포상이나 공개적 인정도 함께 병행하면, 긍정 피드백이 활성화된다.


편견 방지 장치: 위의 각 편향별 대책 외에, 조직 차원에서 일반적으로 하는 편견 방지 노력들을 요약하면:

- 평가자 교육: 편향 종류를 인식시키고 사례를 공유. 자신의 무의식적 편견(성 고정관념, 인종/학벌 편견 등)도 돌아보게 함.

- 다수 평가자/캘리브레이션: 여러 사람이 관여하여 개인 편향 희석.

- 데이터 분석 활용: AI/통계 기법으로 평가 결과를 모니터링하여 편향 의심 사례 발견.

- 피평가자 의견 청취: 이의제기 절차 등을 통해 부당한 평가가 보고되면 시정.

- 명확한 기준과 근거 기록: 막연한 주관 대신 근거 기반 평가를 제도화.

- 조직 문화 조성: 성과 평가를 “잘했나 못했나 줄 세우기”가 아닌 “함께 성장하기 위한 과정”으로 여기는 문화 확산. 상호 피드백을 일상화하여 특정 시점 평가에 쏠리지 않도록 함.


특히 성과평가에서의 편견은 곧 보상의 공정성 문제로 직결되기 때문에, 민감한 이슈다. 최근 다양성·포용성 관점에서도, '어쩐지 여성 직원이 낮은 평가받는 비율이 높다'거나 '육아휴직 다녀오면 성과평가에 불리하다' 같은 편향을 찾아 시정하려는 노력이 활발하다. 이러한 맥락에서 HR 부서의 분석 역량(People Analytics)이 강조되고, 필요시 외부 전문가 도움을 받아서라도 편향을 최소화하려 하고 있다.

결론적으로, 평가 결과의 해석 및 분석 단계는 성과평가 사이클의 마무리이자 새로운 시작이다. 여기서 얻은 통찰은 다음 번 평가제도 개선에 쓰이고, 평가 공정성 담보를 통해 직원 신뢰를 유지하며, 더 나아가 조직의 인재관리 전략을 보완하게 된다. 숫자와 등급 뒤에 담긴 의미를 잘 파악함으로써, 성과평가는 단순히 사람을 줄 세우는 도구를 넘어 조직학습과 발전의 계기가 될 수 있다.




6. 평가와 보상의 연계 (성과급, 승진 등)


성과평가 결과는 조직에서 이루어지는 여러 보상과 인사 결정에 직접 활용된다. 특히 직원들이 성과평가에 민감한 이유 중 하나는, 그 결과가 곧 자신의 보상으로 이어지기 때문이다. 이 장에서는 성과평가와 금전적 보상(성과급, 인센티브)의 연계, 비금전적 보상(승진, 경력기회)의 연계, 그리고 평가-보상 연계 시의 유의점에 대해 알아본다.


6.1

성과급 및 인센티브와의 연계

대부분의 기업에서 성과평가 등급은 연말 성과급(보너스)이나 차년도 연봉 인상률을 결정하는 핵심 근거가 된다. 예를 들어 많은 한국 기업들이 S/A/B/C 등급별로 성과급 지급률을 차등한다. S등급 150%, A등급 120%, B등급 100%, C등급 50% 이런 식의 테이블을 미리 정해두고, 각자 해당 등급에 따라 성과급을 받는다. 또는 상대평가를 하는 곳에서는 성과급 예산 풀을 등급에 비례해 나누는 식으로 한다. 이러한 Pay for Performance(성과주의 보상) 원칙은 성과 향상을 위한 중요한 동인으로 받아들여져 왔다. 잘하면 더 많이 보상받고, 못하면 적게 받는 구조를 통해 동기부여를 꾀하는 것이다. 또한 기업 입장에서는 고정 인건비를 늘리지 않고도 변동급으로 인건비 유연성을 확보할 수 있다는 장점이 있다.

연봉 인상에서도 성과평가 결과는 핵심 지표다. 많은 회사가 매년 연봉 조정 시 merit increase라는 이름으로 개인별 인상률을 달리 적용하는데, 이때 지난 성과평가 등급이 직접 영향을 준다. 예를 들어 최고등급자는 연봉 5% 인상, 중간등급자는 3%, 최하등급자는 동결 등 차등 인상을 한다. 이러한 제도는 성과와 보상의 연계를 명확히 하여 직원들에게 '열심히 일하면 승진이나 돈으로 보상받는다'는 메시지를 주기 위한 것이다.

그러나 성과급/인상과 평가를 연계할 때 주의할 점도 많다. 첫째, 연계 비율과 구조가 공정해야 한다. 성과급 규모나 인상폭이 지나치게 차이나면 오히려 역효과가 날 수 있다. 예컨대 S등급과 C등급의 보상 차이가 너무 커서 C등급 직원이 느끼는 박탈감이 크다면, 이는 조직 몰입을 떨어뜨리고 퇴사를 부를 수 있다. 반대로 차등이 거의 없으면 성과주의 취지가 무색해진다. 적절한 균형을 찾아야 한다. 둘째, 성과급을 위한 상대평가가 단기주의를 조장할 수 있다는 점이다. 보상풀이 정해져 있고 동료와 나눠 가져야 한다고 느끼면, 직원들은 협력보다 경쟁에 집중하거나, 단기 성과 극대화에만 몰입할 수 있다. 이러한 우려 때문에 어떤 기업들은 아예 팀 단위 인센티브로 전환하기도 한다. 팀 전체 목표 달성 여부에 따라 보상을 지급하면, 동료를 이기는 것보다 같이 잘하는 것에 집중하게 된다.


또한 경제 상황과 연계의 어려움도 있다. 경기 침체로 회사 실적이 나쁘면, 아무리 개인이 최고 등급이어도 성과급 예산이 줄어들 수밖에 없다. 이럴 때 직원들은 “평가만 잘 받으면 뭐하나, 보너스가 안 나오는데”라는 불만을 가질 수 있다. 그래서 일부 기업은 장기 성과와 연계된 보상 (예: 스톡옵션, 장기인센티브)을 병행하여, 단기 실적에 따른 변동성을 보완하려 한다.

특이한 사례로 넷플릭스를 보면, 이 회사는 성과평가와 연계한 보상이 거의 없다. 연봉과 스톡옵션을 개인별로 최고 수준으로 제공할 뿐, 성과보너스 제도를 두지 않았다. '성과급으로 직원 동기를 유발할 필요 없이, 우리는 이미 최고의 인재들이 본인의 열정으로 뛰게 만든다'는 철학이다. 물론 넷플릭스는 극단적 예이지만, 이 사례는 '꼭 금전적 인센티브만이 동기부여의 방법은 아니다'라는 점을 시사한다. 오히려 적절한 인정(recognition)과 승진 기회 등이 중요할 수 있다는 것이다.


6.2 승진, 배치 등 인사조치와의 연계

성과평가는 금전보상 외에 비금전적 보상 측면에서도 큰 역할을 한다. 직원 경력에 중대한 영향을 미치는 승진, 승급, 핵심인재 선정, 보직 이동 등의 결정에 평가 결과가 활용된다.

승진/승격: 많은 조직에서 승진 요건으로 일정 기간 좋은 성과평가를 받을 것을 요구한다. 예를 들어 과장에서 차장으로 승진하려면 최근 3년간 평균 B등급 이상이어야 한다든지, 또는 직전 연도 성과가 A등급이어야 승진 후보가 된다는 식이다. 이는 승진 대상자의 성과 검증을 위한 장치다. 특히 관리자로 올라갈수록 과거에 본인이 맡은 업무에서 뛰어난 성과를 냈던 사람을 뽑고자 하기 때문이다. 다만 현대 HR에서는 승진 시 역량 요건도 함께 보며, 단순히 성과등급만으로 결정하지는 않는다. 예를 들어 기술전문가 트랙과 관리자 트랙이 나뉘어 있기도 하고, 승진평가센터(Assessment Center) 등을 통해 리더십 자질을 별도로 평가하기도 한다. 하지만 기본 전제는 '성과 우수자에게 성장 기회를 준다'이므로, 성과평가가 나쁜 사람이 승진하는 일은 거의 없다. 반대로 성과가 매우 우수한 인재는 파격 승진이나 조기 승격 등의 혜택을 받기도 한다. 이는 다른 직원들에게도 동기부여 신호가 된다. '나도 저렇게 성과내면 빨리 승진할 수 있구나' 하는 메시지를 주기 때문이다.


직무/보직 배치: 성과평가 결과는 인력 배치 결정에도 참고된다. 예를 들어, 주요 신제품 프로젝트에 투입할 팀원을 선정할 때, 당연히 해당 분야 성과가 좋은 인력이 우선 고려된다. 또 해외 주재원 등 핵심 보직을 맡길 때도 성과기록이 우수한 인재가 뽑힐 확률이 높다. 반대로 성과가 계속 저조한 직원은 업무 적합성을 재검토하여 다른 직무로 이동시키거나, 교육 등의 기회를 제공하기도 한다. 요즘은 한 사람이 여러 경력을 쌓는 순환보직제도 많은데, 이때 누구를 언제 순환시킬지 결정할 때 성과평가와 역량평가 자료가 활용된다. “현재 직무에서 높은 성과를 냈으니, 다른 중요한 직무도 수행할 수 있다”는 판단에 근거해 이동시키는 것이다. 물론 성과만 높다고 무조건 이동이 좋은 것은 아니라서, 본인의 희망과 경력 계획도 함께 고려된다.


교육/육성 기회: 인재 개발 측면에서도 성과평가는 지표가 된다. 예를 들어 차세대 리더 프로그램 선발에 최근 2년 연속 상위등급 받은 자를 우선 고려한다. 반대로 성과 개선 프로그램(PIP)은 연속으로 낮은 등급 받은 직원을 대상으로 실시한다. 이런 식으로 보상과 처벌뿐 아니라 육성과 지원까지 연계된다. 저성과자의 경우 일방적 퇴출보다는 먼저 개선 기회 부여가 원칙이므로, 성과평가 결과를 토대로 코칭, 멘토링, 추가 교육 등의 계획을 세운다. 실제 판례에서도 저성과 해고의 정당성 요건 중 하나로 '사전에 충분한 개선 기회를 줬는가'를 들고 있으므로, 기업들은 이를 충족하기 위해 PIP를 운영한다. PIP에서는 일정 기간 성과 목표를 주고 달성 여부를 관찰하며, 정기 미팅으로 피드백을 제공한다. 이 역시 평가-보상 연계의 연장선이라 할 수 있다.


평가-보상 연계의 고려사항: 성과평가를 보상과 인사에 연계할 때 몇 가지 주의점이 있다.

첫째, 투명성이다. 무엇이 어떻게 연계되는지 기준을 명확히 공지해야 불필요한 오해가 없다. 예컨대 '올해 성과등급이 A인 사람은 내년 연봉인상률 1.5배 적용' 등의 원칙을 알려주면 직원들은 자신이 받은 보상이 이해가 된다. 반대로 기준이 불분명하면 '인사팀이 밀실 결정한다'는 불신이 생길 수 있다.

둘째, 시기 분리 혹은 동시 고려에 대한 결정이다. 앞서 Google 사례처럼 평가 피드백과 보상 통보를 분리할 수도 있고, 대부분 한국 기업처럼 한 번에 통보할 수도 있다. 어느 쪽이든 장단이 있다. 분리하면 피드백을 온전히 학습 기회로 삼을 수 있지만, 직원들은 '결국 돈이랑 승진은 언제 되는데?' 하고 답답해할 수 있다. 동시에 하면 직원이 방어적으로 굴 가능성이 있지만, '내 등급이 이거라 이만큼 받는구나'를 바로 이해한다. 각 조직 문화에 맞게 결정할 문제다.

셋째, 성과와 보상의 균형이다. '성과=보상'이라는 인식이 너무 강해지면, 직원들은 단기 성과만 좇고 협업을 멀리할 위험이 있다. 특히 팀 프로젝트에서는 개인 성과 구분이 어려운데 보상은 개인별로 준다면, 팀원들 사이에 기여도 공방이 생길 수 있다. 이를 막기 위해 어떤 회사들은 팀 인센티브개인 인센티브를 혼합하거나, 질적 평가 요소(협업 점수 등)를 보상 산식에 포함시키기도 한다. 또한 비금전적 보상도 중요하다는 점을 환기해야 한다. 밀레니얼 세대 이후의 직원들은 승진 기회, 일과 삶의 균형, 의미 있는 일 배치 등도 중시한다. 따라서 성과평가 결과가 꼭 금전이 아니어도, '당신의 성과를 인정하여 이런 기회를 드린다'는 식의 보상이 있을 수 있다. 예를 들어 어떤 회사는 최고 성과자들에게 원하는 부서에 지원할 수 있는 사내 공모기회를 우선 부여하기도 했다. 또 다른 예로, 분기별 최우수 직원을 뽑아 CEO와 오찬을 갖게 하거나 포상을 수여하는 식의 인정 프로그램도 있다. 이런 것들은 비용은 적지만 동기부여 효과는 상당히 날 수 있다.


넷플릭스의 사례를 다시 보면, 이 회사는 성과와 금전보상을 거의 탈연계했다. 모든 직원에게 업계 최고 수준 급여를 주고(개인의 시장가치에 맞춰) 성과급이 없으며, 연봉 인상도 정기 이벤트가 아닌 필요 시 시장인상만 한다. 대신 그들은 높은 성과에 대한 보상으로 '계속 우리와 일할 수 있는 것 자체'를 든다. 즉, 계속 성과를 못 내면 바로 퇴사시키지만, 성과를 내는 사람은 업계 최고 대우를 유지하면서 함께 일한다. 또한 추가 보상 대신 넷플릭스는 성과가 뛰어난 직원에게 더 큰 책임과 영향력을 부여한다. 이처럼 극단적 문화도 있지만, 일반적으로는 다수 기업들이 성과를 돈과 승진으로 보상하는 방식을 취한다.


평가와 보상의 분리 움직임: 한편 일부 기업들 사이에서는 평가와 보상을 꼭 1:1로 연결할 필요가 있는가에 대한 고민도 등장했다. 대표적인 것이 딜로이트(Deloitte)와 액센츄어(Accenture) 등의 글로벌 컨설팅 기업 사례다. 이들은 2010년대 중반 성과관리 개편을 하며, '보상결정용 평가'와 개발피드백용 평가'를 분리했다는 점을 발표했다. 예를 들어 딜로이트는 매 프로젝트 종료 시 간단한 4문항의 평가를 실시해 보상 데이터를 수집하고, 별개로 상시 코칭을 했다. 그리고 연말에 보상 데이터만 모아 보상결정을 했다. 이런 접근의 배경에는, 평가 대화가 보상 얘기 때문에 왜곡되는 문제를 없애고 싶다는 목적이 있었다. 그러나 실제 운용의 복잡성 때문에 모든 기업이 이런 방식을 따르진 못하고 있다. 아직도 대부분은 하나의 평가로 두 목적(보상+개발)을 함께 달성하려 한다. 다만 그 부작용을 인지하고 피드백 문화 강화 등의 보완책을 쓰는 것이다.

결론적으로, 성과평가와 보상의 연계는 성과주의 인사관리의 핵심 축이다. '일한 만큼 준다'는 원칙은 직원들에게 공정한 것으로 받아들여지는 한, 긍정적 동기로 작용한다. 하지만 그 연계 방식이 투명하지 않거나 극단으로 치우치면 오히려 성과주의에 대한 불신을 초래할 수 있다. 따라서 명확한 원칙, 균형 잡힌 차등, 다양한 보상수단을 통해 성과와 보상이 선순환하도록 디자인해야 한다. 또한 금전보상 외에 인정과 성장 기회라는 보상도 잊지 말아야, 직원들이 장기적으로 동기부여되고 조직에 몰입할 수 있을 것이다.



7. 글로벌 HR 평가 트렌드 (구글, 넷플릭스, 마이크로소프트 등 사례)


전 세계 유수의 기업들도 성과평가에 대해 끊임없이 실험하고 혁신해왔다. 이 장에서는 글로벌 기업들의 HR 평가 트렌드를 살펴보기 위해, 대표 사례로 자주 언급되는 Google(구글), Netflix(넷플릭스), Microsoft(마이크로소프트)의 사례를 중점적으로 다룬다. 이들 기업은 각기 다른 철학과 접근법으로 성과관리를 운영하고 있으며, 그 성공과 실패 경험은 다른 기업들에게 많은 시사점을 주고 있다. 또한 Google, Netflix, Microsoft 외에도 Adobe, GE, Deloitte 등 여러 글로벌 기업들의 동향도 함께 언급하며, 현재의 글로벌 인사평가 패러다임이 어떻게 변모해왔는지 종합 정리한다.


7.1 구글(Google)의 데이터 중심 성과관리

성과관리 혁신 선도기업: Google은 'People Analytics'라는 말을 유행시킬 정도로, 데이터 기반 인사관리의 대표 주자다. 인사평가도 예외가 아닌데, 구글은 직원 평가에 있어 과학적 접근과 실험정신을 적용해왔다. 전통적으로 구글은 연 2회(중간/연말) 성과리뷰를 실시했고, 여기에 자기평가, 동료평가(360 피드백), 상사평가와 강도 높은 캘리브레이션을 포함한 정교한 프로세스를 운영했다. 구글의 평가 문화 특징은 목표와 연계 및 정량화이다. 구글은 회사 전체 OKR(Objectives & Key Results)을 분기마다 설정하고, 개인도 OKR을 수립한다. 이 OKR 달성률은 완벽하게 하기를 바라지 않고 약 70% 달성을 '도전적 목표를 잘 설정한' 기준으로 보는데, 만일 누군가 100%를 계속 달성하면 '목표를 덜 야심차게 잡은 것'으로 여길 정도다. 즉 실패 없는 성공보다, 도전적인 목표 추구를 중시하는 문화가 반영되어 있다.


평가 절차: 구글의 성과평가는 일반적으로 다음과 같은 절차로 진행된다:

- 자기평가: 직원이 반기/년간 자신의 성과와 기여를 행동 기반 사례와 함께 정리하여 제출한다. 구글의 자기평가 폼은 행동기반 평정척도를 사용하는데, 예를 들면 회사 핵심가치에 대해 '전혀 보여주지 못함' ~ '항상 보여줌' 같은 식으로 체크하고 사례를 쓰게 되어 있다.


- 동료 피드백: 직원과 협업한 동료들에게 피드백을 요청한다. 피드백 제공자는 피평가자가 자기평가서에 적은 주요 프로젝트와 성과를 참고하여, 강점, 보완점, 개발 제안 등을 서술한다. 구글은 이 동료 리뷰어 선정도 공정성을 위해, 직원과 매니저가 협의하여 다양한 관점을 대표할 수 있도록 선정한다. 동료 피드백은 익명성이 보장되며, 구체적 사례에 기반해 작성된다.


- 매니저 평가 및 예비 등급: 관리자는 자기평가와 동료 피드백 내용을 모두 참고하여, 직원의 성과를 등급으로 초안 책정한다. 구글의 등급 체계는 과거에는 5점 척도였으나, 2022년 새로운 시스템(GRAD) 도입 후 5단계 임팩트 중심 등급으로 변경되었다. 새로운 등급들은 상위부터 TI(Transformative Impact), OI(Outstanding Impact), SI(Significant Impact), MI(Moderate Impact), NE(Not Enough Impact)로 정의된다. 즉, 단순히 '기대 이상/이하'가 아니라 그 사람이 끼친 임팩트의 크기로 등급명을 정한 것이다. 관리자들은 이 임팩트 기준에 따라 예비 등급을 매긴다.


- 캘리브레이션 회의: 같은 조직 내 여러 매니저들이 모여 각자의 팀원 예비 등급을 공유하고 토론 및 조정한다. 이 회의에서 매니저들은 부하 직원들의 성과를 서로 설명하며, 타 매니저들의 의견이나 질문을 듣는다. 목표는 공정하고 일관된 평가를 확정하는 것이다. 예를 들어 한 매니저가 '우리 팀 김XA는 OI(우수 임팩트)를 받았는데, 그 이유는..'이라고 설명하면, 다른 매니저들이 '그 정도 성취라면 우리 팀에서 SI 정도로 보고 있는데, 기준을 좀 맞춰보자' 라는 식으로 피드백하여 등급 풀이 적절히 분배되도록 한다. 이러한 캘리브레이션은 관리자들이 직원들로부터 점수 올려달라는 압박에서 자유로워지게 하고, 결과에 대한 직원들의 공정성 인식도 높여준다고 구글은 설명한다.


- 피드백 면담 및 보상 연계: 최종 등급이 결정되면, 관리자는 직원과 면담을 한다. 특이하게 구글은 이 면담을 두 번으로 나눈다. 첫 번째 면담에서는 성과 피드백만 전하고, 등급과 그 이유, 동료 피드백 내용을 공유한다. 며칠 뒤 두 번째 면담에서 보상(연봉인상, 보너스)과 승진에 대한 결과를 통보한다. 이렇게 한 이유는 앞서 언급했듯, 직원이 돈 얘기에 집중하면 정작 중요한 피드백을 흘려듣게 되기 때문이다. 구글은 이를 데이터로도 확인했는데, 보상 얘기와 함께 피드백을 하면 뇌가 방어 모드로 전환되어 학습 효과가 떨어진다는 것이다.


GRAD 시스템 개편: 2022년 구글은 성과관리 제도를 기존의 연 2회 리뷰에서 연 1회 리뷰 + 상시 피드백 체계로 바꾸는 GRAD(Google Reviews and Development) 시스템을 도입했다. 내부 설문에서 47%의 직원이 종전의 반기 리뷰가 비효율적이라고 응답한 것이 계기였다. GRAD 도입 후 구글은 연말에 한 번 정식평가를 하고, 그 외에는 정기 1:1 미팅과 Check-in으로 보완한다. 등급도 앞서 언급한 임팩트 5단계로 바뀌었는데, 이에 따라 분포에도 변화가 생겼다. 보도에 따르면 GRAD 하에서 하위 등급 비율이 6%로 늘었다 (기존엔 2%). 즉, 낮은 임팩트로 분류된 직원이 예전보다 늘어난 것인데, 이는 구글이 성과 관리의 실효성을 높이려 한 조치로 보인다. 일부에서는 이 변화가 직원 사기에 부정적 영향 줄 수 있다고 우려하지만, 구글은 장기적으로 개발 중심 문화를 강화하기 위한 것이라 설명한다. 또한 승진은 여전히 연 2회 기회가 주어진다. GRAD의 핵심은 평가 빈도를 줄이는 대신 상시 개발 대화에 더 집중하겠다는 것이다.


관리자 역량 피드백: 구글에서는 직원이 상사를 평가하는 상향피드백 (Upward Feedback Survey)도 매년 실시된다. 익명으로 진행되며, 관리자들의 코칭능력, 권한부여, 경력개발 지원 등에 대해 팀원들이 점수를 주고 의견을 쓴다. 3명 이상 부하가 있어야만 상사에게 결과가 제공되어 익명성을 보장한다. 이 피드백은 개발 목적으로 활용되며, 관리자가 자기 개선 계획을 세우고 팀과 공유하도록 권장된다. 이는 성과평가와 별개이지만, 구글의 전방위 피드백 문화를 보여주는 한 단면이다.

또한 구글은Googlegeist라는 전사 직원만족도 조사도 실시하여, 조직 건강 지표를 관리한다. 요컨대 구글의 성과관리 철학은 '데이터와 대화를 모두 중시'하는 것이다. 수치와 피드백을 함께 수집·분석하고, 그 결과를 바탕으로 공정하고 투명한 평가를 추구한다.


구글 사례의 시사점: 구글의 접근법에서 배울 수 있는 것은 공정성 확보를 위한 구조적 노력과 지속적 피드백 문화다. 다면평가와 캘리브레이션을 통해 최대한 주관적 편차를 줄이고자 했고, 평가와 피드백/보상을 분리하는 세심함으로 직원 경험을 높였다. 또한 연중 정기 체크인과 같은 장치를 통해 평가가 이벤트에 그치지 않도록 했다. 이러한 노력 덕분에 구글은 오랫동안 일하기 좋은 기업 톱 순위에 자리했고, 인사관리 모범 사례로 자주 언급된다. 다만 구글의 방식이 모든 기업에 맞는 것은 아니며, 그들의 풍부한 자원(우수 인재, 여유 인사예산)과 데이터 중심 문화가 받쳐주었기에 가능한 면도 있다.

요약하면, Google은 성과평가에 360도 피드백과 캘리브레이션을 도입해 홀리스틱(hollistic)한 평가를 지향하고, 상시적 성과관리(OKR과 체크인)를 통해 연말 평가의 부담을 줄였으며, 개발과 보상대화를 분리함으로써 학습 문화를 촉진했다. 이는 글로벌 HR에서 데이터와 인간중심의 균형을 보여주는 사례라 할 수 있다.


7.2 넷플릭스(Netflix)의 자유와 책임 문화

평가 없는 문화: Netflix의 성과관리 철학은 한마디로 'No Rules Rules'로 요약된다. 그들은 전통적인 연례 성과평가 제도 자체를 없애버린 것으로 유명하다. Patty McCord에 따르면, '넷플릭스 규모의 회사에 공식 평가는커녕 연봉 협상도 없다 하면 HR들은 놀라지만, 우리는 실제로 안 한다'고 한다. 그렇다면 넷플릭스는 어떻게 직원들의 성과를 관리할까? 답은 일상 속 피드백과 탁월한 인재 밀도 유지다. 넷플릭스는 관리자와 구성원 간 수시 대화를 통해 필요한 피드백은 그때그때 주고받는다. 정해진 폼 없이, 필요할 때면 언제든 상사가 부하에게, 동료끼리도 피드백을 준다. 실제로 넷플릭스는 연 1~2회 전사 차원에서 360도 피드백 세션을 진행하는데, 여기서 모든 직원이 각 동료에게 'Start, Stop, Continue'라는 형식으로 피드백을 제공한다. Start는 '새롭게 시작했으면 하는 행동', Stop은 '그만 뒀으면 하는 행동', Continue는 '계속 잘하고 있는 행동'을 의미한다. 초창기에는 이 피드백을 익명으로 받았지만, 지금은 실명, 대면 피드백으로 전환했다. 넷플릭스는 투명성을 중시하기 때문에, 얼굴을 보고 직접 말할 수 있어야 진정한 피드백이고 동료로서 신뢰가 쌓인다고 여긴다.


Keeper Test (키퍼 테스트): 넷플릭스 성과문화의 또 다른 축은 'Keeper Test'라고 불리는 개념이다. 간단히 말해, 관리자가 각 팀원에 대해 '이 사람이 지금 퇴사하려 한다면, 잡으려고 싸울 것인가?'를 스스로 자문하는 것이다. 만약 대답이 No라면, 그 직원은 넷플릭스가 원하는 인재가 아니므로 공정하게 빠르게 이별하는 게 낫다고 본다. 이 테스트는 냉혹해 보이지만, 넷플릭스는 이를 '모든 직원이 탁월한 동료들로만 이루어진 드림팀을 만든다'는 인사원칙으로 삼았다. 실제로 넷플릭스는 'Adequate performance gets a generous severance'(평범한 성과는 후한 퇴직금과 함께 퇴사)라는 말을 공개적으로 할 만큼, 평균 이하의 인력은 과감히 내보내고 최고 인재들로 채운다는 전략을 써왔다. 이는 높은 성과 문화(high performance culture)를 유지하기 위한 이들의 방식이다.


보상과 평가의 분리: 넷플릭스의 보상 체계도 특이한데, 개인의 성과등급에 의해 좌우되지 않는다. 대신 채용 시점부터 시장 최고수준의 급여를 책정해주고, 매년 각 직원의 시장가치를 재평가하여 인상 여부를 결정한다. 보너스나 연봉인상 풀이 없고, 인상도 필요한 시점에 수시로 한다. 승진도 정해진 트랙보다는 역할의 변화로 간주한다. 어떤 면에서 넷플릭스는 전통적 의미의 '성과보상'을 포기한 셈이다. 그럼에도 불구하고 성과주의 문화가 약한 것이 아니라 오히려 더 강한데, 이는 금전적 당근이나 채찍 없이도 직원들이 최선을 다하게 만드는 문화적 기재가 있기 때문이다. 그 핵심이 바로 동료 압력(peer pressure)과 고용 안정에 대한 새로운 관점이다. 넷플릭스에서는 누구나 최고의 동료들과 일하고 있다는 자부심을 갖게 되고, 따라서 자신도 그 기준에 못 미치지 않으려 노력한다. 만약 자신의 능력이 부족해 팀에 민폐가 된다면, 본인도 느끼고 동료들도 느낀다. 그 경우 회사는 빠르게 결단해 해당 직원을 내보내고 퇴직 패키지를 준다. 넷플릭스 직원들은 이를 알고 있으며, 그래서 늘 프로 스포츠 팀처럼 경쟁에서 살아남아야 하는 환경이다. 대신 회사는 최고의 선수(직원)들에게 업계 최고 연봉과 자유를 준다. 휴가도 무제한이고, 출장비 같은 경비 규정도 최소화했다. '자율과 책임'이라는 모토 아래, 성과만 내면 간섭하지 않는 대신, 성과 못 내면 미련 없이 작별한다.


피드백 문화: 성과평가가 공식적으로 없긴 하지만, 넷플릭스에 피드백이 없다는 뜻은 아니다. 오히려 그들은 피드백을 훨씬 더 자주, 거침없이 주고받는다. 넷플릭스 공동CEO 리드 헤이스팅스는 '우리는 솔직한 문화로 유명하다. 직원들은 언제든 서로에게 솔직하게 피드백한다'고 말했다. 익명 360을 없앤 것도 이 때문이며, 직설적 커뮤니케이션을 장려한다. 심지어 임원회의에서도 주니어 직원이 자신의 상사에게 대놓고 비판적 피드백을 주는 일도 있다. 이처럼 피드백이 일상화되었기 때문에, 별도로 연말고과를 할 필요성을 느끼지 못하는 것이다. Patty McCord의 말처럼 '솔직하게 자주 얘기하면, 굳이 매년 등급 매길 필요 없이 더 좋은 결과를 얻는다'는 믿음이 현실에서 작동하고 있다.


사례: 익명 피드백에서 실명 피드백으로 – 넷플릭스는 초기에는 연 1~2회 360도 피드백 서베이를 실시하되, 익명으로 진행했다. 당시에는 상호간 불편함을 줄이고 솔직함을 이끌어내기 위한 선택이었다. 그러나 후에 이것을 실명 공개+토론형으로 바꾸었다. 한 예로, 넷플릭스 엔지니어링 부서에서는 각 직원이 자기 주변 10명의 동료에게 피드백을 요청하고, 모두가 그 결과를 돌려본 다음 피드백 회의를 연다. 거기서 각자 받은 피드백에 대해 감사의 말, 해명의 말, 개선 약속 등을 자유롭게 나눈다. 이러한 과정은 힘들 수도 있지만, 넷플릭스 팀들은 이를 통해 신뢰를 구축한다고 한다. '우리는 어차피 뛰어난 인재들이 모였으니 서로 무엇이 더 필요한지 솔직히 말해보자'는 식이다. 이 접근은 쉽지 않기에 다른 회사들이 따라하기 어렵지만, 넷플릭스는 문화적으로 이를 뒷받침한다.


넷플릭스 사례의 시사점: 넷플릭스의 독특한 방식은 '성과평가 제도 없이도, 오히려 더 강도 높은 성과주의를 구현할 수 있다'는 것을 보여준다. 규칙과 절차를 최소화함으로써 생기는 혼란을, 문화적 원칙(자유와 책임)으로 대체하고 있다. 최고 성과자들에게 최고의 대우를 해주는 대신, 평균 이하에겐 가차 없다. 이러한 극단적 성과주의는 모든 조직에 맞지 않을 수 있다. 실제로 넷플릭스 스타일은 '장기간 근속보다는 즉각적인 성과'를 중시하기 때문에 안정성을 중시하는 사람에겐 두려운 곳일 수 있다. 그러나 빠르게 변하는 산업(예: IT, 콘텐츠)에서는 효율적일 수 있다. 또한 넷플릭스 사례는 피드백의 힘을 보여준다. “평가 없애자”는 일부 기업들의 구호가 있었지만, 막상 평가를 없애니 피드백이 실종되어 문제가 된 경우도 있다. 넷플릭스는 그 대안으로 지속적이고 거침없는 피드백 문화를 구축했기에 평가제도가 없어도 돌아가는 것이다.

결국 넷플릭스의 메시지는: '직원들을 성인으로 대하라. 엄격한 규칙 대신 맥락과 솔직함으로 성과를 이끌어라.'일 것이다. 그리고 '탁월한 인재에게 최고의 자유와 보상을 주고, 그렇지 않으면 함께하지 않는다'는 냉혹한 면도 있다. 이러한 넷플릭스 모델이 최근 HR에 준 영향은 상당해서, 많은 스타트업과 IT 기업들이 엄격한 등급 대신 수시 피드백과 높은 인재기준을 표방하고 있다. 물론 실행 난이도는 높지만, 성과평가에 대한 근본적 재고를 촉발한 사례로 넷플릭스는 HR 역사에 남아 있다.


7.3 마이크로소프트(Microsoft)의 협업과 성장 중심 평가

과거의 그림자 – 스택랭킹: 한때 마이크로소프트의 인사평가는 스택랭킹(Stack Ranking)으로 악명높았다. 2000년대 초까지 MS는 연간 성과평가에서 직원들을 1~5 등급으로 나누고, 항상 일정 비율을 최하위로 분류했다. 당시 정책은 '20%는 1(최고), 20%는 2, 나머지 대부분은 3, 그리고 하위 10%는 4나 5'를 주는 것이었다. 이 강제 분포는 조직 내 치열한 경쟁과 정치싸움을 불러왔다고 직원들은 회상한다. 특히 뛰어난 팀이라도 반드시 하위 10%를 만들어야 했기 때문에, 누군가는 희생양이 되어야 하는 불합리가 생겼다. 2013년, 새 CEO 사티아 나델라가 취임하면서 MS는 이 스택 랭킹 제도를 전격 폐지했다. 내부 데이터 분석 결과, 이 제도가 혁신을 저해하고 사내 협업을 망치고 있다는 것을 깨달았기 때문이다. 실제 직원들은 익명게시판 등에서 '동료가 아니라 적들과 일하는 기분', '아이디어를 공유하면 남 잘되게 하는 꼴이니 숨긴다'는 등의 불만을 표시했고, <배니티 페어> 등 외부 매체에서도 MS의 스택랭킹이 '재능 있는 사람도 좌절시키는 제도'라고 비판했다.


One Microsoft와 새 평가: 나델라 체제에서 MS는 'One Microsoft'라는 비전을 내세우며 부서 간 경쟁을 없애고 협업을 강조하는 문화로 전환했다. 이에 맞춰 성과평가 시스템도 협업과 성장에 초점을 맞추도록 개편되었다. 구체적으로, MS는 등급제를 없애고 보다 자유로운 피드백과 코칭 중심으로 바꿨다. 또한 성과평가 항목에 개인 기여뿐 아니라 타인에 대한 기여(협업) 및 팀워크를 명시적으로 포함시켰다. 간단히 말해, '동료를 돕고 조직 성공에 이바지한 점'을 중요하게 본다는 것이다. 예컨대 새 평가체계에서는 성과에 대한 3가지 질문을 묻는다:

1. 당신은 자신의 목표를 얼마나 달성했는가?(개인 임팩트)

2. 당신은 동료와 조직의 성공을 얼마나 도왔는가?(팀 기여도)

3. 당신은 다른 사람들의 아이디어와 작업을 얼마나 활용/협업했는가?(협업을 통한 레버리지)


이러한 세 가지 관점은 MS의 핵심가치인 '하나의 MS' 정신을 반영한다. 단순히 나만 잘해서는 최고 평가를 못 받고, 다른 사람들을 잘 되게 하고, 다른 이들의 지식을 잘 활용해야 좋은 평가를 받는다. 이는 직원들로 하여금 고개를 들고 주변을 보게 만들었다. 예전처럼 머리 숙여 자기 일만 해선 안 되고, “다 함께 승리”를 추구해야 한다.


피드백과 성장 문화: MS는 직원들이 정기적인 피드백을 주고받도록 장려한다. 'Perspectives'(퍼스펙티브)라는 내부 피드백 툴을 도입한 것이 대표적 사례다. 직원들은 동료들에게 언제든 관점 피드백을 요청할 수 있다. 그 포맷은 간단하다: 'Keep Doing(계속 잘하는 점)', 'Rethink(다르게 해볼 점)' 두 카테고리로 피드백을 작성하게 되어 있다. 이는 앞서 언급한 넷플릭스의 Start-Stop-Continue와 유사하지만, 익명이 아니며, 작성된 피드백이 곧바로 당사자에게 전달된다는 점이 특징이다. 관리자 승인이나 중재 없이 동료간 직접 피드백이 오가며, 익명이 아니기에 책임 있는 내용만 적도록 유도된다. 또한 이 툴은 체크박스 형태가 아니라 모두 서술형 질문으로 되어 있어서, 정성적이고 구체적인 관찰을 제공하도록 한다. MS 인사책임자는 이를 '프레임만 제공하고 내용은 사람들의 진솔한 관찰로 채운다'고 표현했다. 이처럼 뇌 친화적 피드백 환경을 구축한 덕에, 직원들이 피드백에 느끼는 두려움도 많이 감소했다고 한다.


포용성과 평가: MS는 2016년부터 성과평가에 포용(Inclusion)을 명시적으로 녹여냈다. 다양성과 포용이 회사 전략에 중요해지자, 모든 직원이 포용 행동을 실천하고 있는지를 평가와 대화의 일부로 포함시켰다. 예컨대 평가 면담 시 '팀 내에서 얼마나 포용적인 문화 조성에 기여했는가?'를 이야기하게 하고, 팀 OKR에도 다양성/포용 목표를 넣었다. 이는 단순 구호가 아니라 행동 변화를 유도하기 위함이다. 평가 때 묻는다는 건, 사람들이 그걸 신경쓰게 만든다는 뜻이기 때문이다.


성과없는 굴욕 대신 성장기회: MS의 새로운 접근에서 눈여겨볼 건, 저성과자에게도 예전처럼 낙인이 찍히기보다는 성장할 여지를 준다는 점이다. 물론 계속 성과가 안 나오면 퇴사 등의 조치가 뒤따르겠지만, 과거처럼 공개적으로 하위 10%를 지정해 망신주는 방식은 완전히 폐기되었다. 그 대신 그들이 왜 어려움을 겪는지 맥락을 살피고, 필요시 직무변경이나 멘토링 등을 제공하려 한다. 이는 넷플릭스와 대조적이다. 넷플릭스는 빨리 퇴출시키지만, MS는 가능하면 개선시키려 노력한다. 이는 두 기업 문화의 차이일 것이다.


데이터에 기반한 개선: MS는 또한 내부 데이터를 많이 활용했다. 스택랭킹 폐지도 직원 만족도 조사나 Glassdoor 리뷰 등을 분석한 결과였다. 그리고 새 피드백 문화 도입도, 2018년 조사에서 '90% 직원이 피드백을 원하지만 25%만 정기적으로 받고 있다', '개선 피드백 받는 사람은 7%에 불과' 같은 통계를 확인한 뒤 추진되었다. 이를 개선하기 위해 MS는 신경과학자(NeuroLeadership Institute) 자문을 받아 뇌의 위협/보상 반응에 대한 교육을 전직원에게 실시하고, 피드백 대신 Perspective(관점 공유)라는 용어를 쓰는 등 용어도 소프트하게 바꿨다. 이처럼 근거에 기반해 제도를 설계한 점도 MS 변화의 성공 요인 중 하나다.


성과 없는 리뷰 – Microsoft는 등급과 점수를 없애자 처음엔 일부 관리자들이 '그럼 어떻게 연봉을 정하지?' 난감해했다고 한다. 하지만 MS는 관리자들이 연봉 인상이나 보너스 풀을 갖고 자율적으로 분배하게 했다. 즉, 등급이 없어도 상대적으로 누가 더 기여했는지 판단할 책임을 현업 관리자에게 준 것이다. 그 대신 HR은 가이드라인과 분석으로 지원한다. 예컨대 각 팀의 결과를 모아 동일 레벨 평균 인상률 등을 보여주고, 한 명에게 몰아주거나 다른 다양성 관점에서 치우침 없도록 체크한다. 이처럼 어느정도 재량권 부여와 사후 모니터링을 병행함으로써, 평가없이지원과 보상공정성을 함께 잡으려 했다.


MS 사례의 결과: 스택랭킹 폐지 이후 MS 직원들 사이에서는 협업 분위기가 상당히 개선되었다는 피드백이 많다. 서로 지식과 도움을 공유하는 데 거리낌이 줄었고, 부서 간 시너지 프로젝트도 늘었다. Glassdoor 등에도 MS의 문화 점수가 개선되었다고 보고되었다. 혁신 측면에서도, 나델라 이후 MS가 부활한 데에 이 문화 혁신이 한몫 했다는 분석이 지배적이다. 물론 MS도 2023년 들어 글로벌 경기침체 속에서 성과 관리 강화 움직임을 보인다는 뉴스가 있었다. 일부 성과 낮은 직원에 대해 조기퇴직을 유도하거나 엄격히 관리한다는 보도인데, 이것이 과거의 강제 순위화로 돌아간 건 아니다. 다만 빅테크 기업들이 2022~2023년 대규모 채용 후 정리에 들어가며, MS도 'Underperformer'에 대한 기준을 조금 조이고 있다는 정도다. 그럼에도 불구하고 기본 철학은 여전히 '성장과 협업 문화'를 유지하려는 것으로 보인다.

요약: Microsoft는 과거의 성과주의 폐해(과도한 경쟁)를 인정하고, 이를 협력적 성과주의로 전환한 대표 사례다. 등수 경쟁 대신 팀 기여와 포용을 평가에 녹여내고, 지속적 피드백 문화(Perspectives 툴 등)로 직원들의 성장지향을 장려했다. 또한 다양성·포용 등 새로운 가치를 평가 과정에 통합하여 현대적 HR 트렌드에 부합했다. MS 사례는 성과평가가 기업 문화 변화의 지렛대가 될 수 있음을 보여준다. 평가제도를 바꾸는 것이 조직의 협업 방식을 근본적으로 바꾸고, 이는 다시 비즈니스 성과에도 긍정 영향을 준 것이다.


7.4 그 외 글로벌 기업들의 동향

GE(General Electric): 한때 고과 하면 떠오르던 GE의 '랭크 앤드 얍'(하위 10% 해고) 정책은 2000년대까지 경영 교과서에 나왔으나, GE도 이미 2010년대에 그걸 버렸다. 2015년 경부터 GE는 연간 성과평가 대신 “PD@GE”라는 모바일 앱 기반 수시 피드백 & 대화 시스템을 도입했다. 목표도 고정적 MBO가 아닌 롤링(rolling) 목표로 바꾸었다. 이 변화는 전통 제조업 기업도 애자일한 성과관리를 도입한 상징적 사건이었다.


IBM: IBM은 역량평가와 성과평가를 병행하는 구조로 유명했다. 또한 'Checkpoint'라는 새로운 평가체계를 2016년 도입하여 연간 목표 대신 쿼터별 목표 조정, 피어 피드백 등을 강화했다. IBM은 Watson AI를 HR에 적극 활용한 기업이기도 해서, 성과평가에도 AI가 추천하는 커리어 개발이나 이직 확률 예측 등을 접목하기도 했다.


Deloitte: 글로벌 컨설팅 회사 딜로이트는 2015년 HBR에 '우리는 성과평가를 다시 생각했다'는 내용의 사례를 기고하여 큰 반향을 일으켰다. 딜로이트는 매년 2백만 시간 이상을 기존 평가에 쏟는다 계산하고, 이를 줄이기 위해 간소화된 평가 질문 4개만 분기마다 매니저에게 하도록 바꿨다. 핵심 질문은 '이 직원을 더 높은 임금으로라도 우리 팀에 계속 있게 하고 싶은가?', '이 직원을 승진 가능자로 추천할 것인가?' 등의 미래지향 문항이었다. 등급이나 랭킹 없이 이런 질문들에 대한 매니저의 YES/NO/평균 정도 답변을 모아 보상/승진 결정 자료로 삼았다. 동시에 프로젝트 끝날 때마다 간단 피드백을 의무화했다. 딜로이트 사례는 전통 평가를 파괴한 대표 사례로 거론되며, 이후 많은 기업들이 따라하거나 참고했다.


Adobe: Adobe는 Annual Review 폐지의 선구자였다. 성과평가 대신 정기 체크인 제도를 도입했는데, 그 효과로 자발적 이직률 30% 감소란 성과를 발표했다. Adobe는 등급을 없애니 관리자들이 처음엔 혼란스러워해서, HR이 가이드 질문 리스트를 제공해 체크인 미팅을 돕고, 계속 코칭했다. Adobe의 성공은 다른 IT기업들의 벤치마크가 되었다.


Amazon: 아마존은 일찍이 데이터와 목표 중심 성과관리를 해왔지만, 직원들에겐 다소 냉혹한 문화로도 유명했다. 한때 'Organization Leveling'이라 하여 일정 비율을 낮은 등급으로 분류하는 시스템이 있었으나, 최근에는 완화되었다는 이야기가 있다. 아마존은 또 자동화 성과관리도 이슈였는데, 물류센터 등 블루칼라 직원들을 대상으로 생산성 소프트웨어가 자동으로 저성과자를 경고/퇴출하는 시스템을 쓴다는 보도가 있었다. 이것은 AI 시대의 새로운 형태의 성과관리라서 논란이 되었다.


SAP: 독일의 대기업 SAP는 Continuous Performance Management (CPM)라는 모듈을 자사 HR 솔루션에 포함시켜 판매할 정도로, 자체적으로도 분기별 성과 코칭을 내재화했다. 문화적으로도 수평적이라, 평가를 그렇게 빡빡하게 하기보다 피드백 & 성장 지원 측면이 강조된다.


스타트업들: 실리콘밸리의 많은 스타트업들은 '우리는 연봉협상도 자유롭게, 성과평가도 안 해' 등의 문화를 팔기도 했다. 하지만 규모가 커지면서 다시 제도화를 고민하는 사례도 많다. 예컨대 Stripe(결제회사)는 한동안 평가지 없이 매니저 재량에 맡겼다가, 공정성 문제가 생겨 현재는 등급제를 도입했다는 얘기도 있다. 즉 혼돈 속의 자유보다는 어느정도 틀과 기준을 마련하는 쪽으로 회귀하는 움직임도 보인다.


종합 글로벌 트렌드: 전체적으로 보면, 2010년대 중반부터 'No ratings, no annual reviews' 물결이 있었고, 최근에는 그것이 정착 및 혼합 단계로 들어섰다. 등급을 없앴던 회사들도 보상의 어려움 때문에 등급 아닌 태그 형태로 구분을 두거나, 최소한 보상결정용 서열은 머릿속에 상정하는 등 현실과 절충하고 있다. 그러나 지속적인 대화와 피드백이라는 방향성은 거의 모든 곳이 동의하여 추진 중이다. 또한 협업, 포용, 성장 같은 키워드가 성과관리의 전면에 등장했다. 이는 개개인의 성과도 중요하지만, 어떻게 성과를 냈는가(과정, 행동)를 더 중시하게 되었다는 뜻이다. 한 설문에 따르면, 글로벌 기업들의 80% 이상이 성과평가를 전통 방식에서 바꾸려는 시도를 했으며, 상당수가 실패와 성공을 반복하고 있다고 한다. 하지만 분명한 것은, 어느 한 가지 모델이 정답인 것은 아니다. 각 기업은 구글, 넷플릭스, MS, Adobe 등의 사례를 참고하되, 자기 문화와 인력 특성에 맞는 맞춤형 시스템을 만들어가고 있다.


현재 글로벌 HR 평가 트렌드는 '유연성, 공정성, 인간중심'으로 요약할 수 있다. 과거처럼 일괄된 규칙으로 줄세우기보다는, 각자의 재능을 발휘하게 하고 적시에 피드백하면서, 결과는 공정하게 인정하고 보상하는 쪽으로 가고 있다. AI 같은 신기술도 이를 지원하는 도구일 뿐, 핵심은 사람을 동기부여하는 환경을 만드는 것이다.



8.

대한민국의 공공/민간 평가 트렌드 및 변화 방향

한국의 성과평가 문화는 오랜 기간 연공서열호봉제의 영향 아래 더디게 변화해왔으나, 2000년대 이후 민간을 중심으로 성과주의 도입이 본격화되었다. 공공부문도 정부 주도로 성과관리 체계를 구축해오고 있다.


8.1

민간기업의 성과평가 트렌드

성과주의 정착과 변천: 한국 민간기업은 90년대 후반 IMF 위기를 겪으면서 능력주의, 성과주의 인사를 가속화했다. 많은 대기업들이 직급체계를 단순화하고 MBO 기반 성과급 제도를 도입했다. 2000~2010년대에는 미국식 강제배분 상대평가도 여러 곳에서 시행되었다. 예컨대 모 대기업은 부서별 상위 5%, 하위 5%를 정해 승진/퇴직 등에 반영했고, 다른 기업들은 평가 결과 하위자는 교육대상 또는 저성과자 프로그램으로 관리했다. 그러나 시간이 지나며 이러한 획일적 상대평가의 부작용(과도한 경쟁, 불만 증가)이 누적되자, 2010년대 후반부터 일부 기업들은 절대평가혼합평가로 선회했다. 대표적으로 LG전자, SK그룹 일부 등에서 Forced Ranking 폐지 소식이 전해졌다. 현대차그룹도 한때 직급별 10% 하위탈락 정책을 폈다가 중단한 바 있다.


절대평가와 등급축소: 최근 상당수 기업은 평가 등급 체계를 단순화하는 추세다. 예컨대 예전엔 S/A/B/C/D 5단계였다면, 이제 상/중/하 3단계로 운영하거나 S/A/B/C 4단계만 쓰는 식이다. 등급이 너무 세분되면 미세한 차이를 억지로 내야 해서 불만만 늘고 실질적 차이는 없다는 판단에서다. 등급 수를 줄이면 관리자들도 한두 등급차이로 이러쿵저러쿵 할 필요 없이 큰 구분만 짓게 되어, 불필요한 경쟁을 줄이는 효과가 있다. 또한 절대평가로 전환한 곳도 있는데, 완전 절대평가는 아니더라도 권고 분포만 제시하고 강제는 하지 않는 경우가 많다. 예를 들어 'A등급은 20% 내외로 하되, 팀 상황에 따라 유연 적용' 등이다. 실제 어떤 대기업 인사담당자의 말에 따르면, '절대평가로 전환하고 나서 직원들의 불만(특히 꼴찌 낙인 공포)이 줄고, 관리자들도 평가 책임감을 더 느낀다'는 피드백이 있었다. 물론 절대평가 시행 시에는 평가자 간 기준 통일이 관건이라, 이점에 많은 교육과 노력을 기울이고 있다.


역량평가와 성과평가 통합: 한국 기업들은 2000년대부터 역량평가 개념을 도입했다. 역량평가는 직무수행능력, 태도 등을 평가하는 것으로, 목표 달성도의 성과평가와 쌍을 이룬다. 과거에는 성과 70 + 역량 30 식으로 점수를 산출하는 기업도 있었다. 그러나 평가항목이 지나치게 많고 복잡해져 운영이 어려운 경우도 발생했다. 최근에는 역량과 성과를 별개 프로세스보다는 통합 평가하는 경향이 늘었다. 즉 평가표 안에 정량목표와 정성역량 항목을 모두 넣고 한 번에 실시한다. 예컨대 상반기 목표달성도와 회사 핵심가치 실천도, 업무역량을 동시에 평가하고, 종합등급을 내는 식이다. 이를 통해 평가에 대한 총체적 관점을 제공하려 한다. 또한 핵심가치/인재상 요소를 평가에 반영하는 비중이 커졌다. 요즘 MZ세대 직원들은 회사의 가치와 문화 적합성을 중시하므로, 기업들도 '어떤 행동을 높이 평가하는가'를 평가제도를 통해 분명히 하고 있다.


상시 피드백과 IT기업 사례: 국내 ICT 기업들은 성과관리 혁신에서 앞서가는 편이다. 네이버는 기존 호봉제와 근속연한 중심 문화를 탈피해 '직무/역할별 레벨제'를 도입했고, 성과평가도 그 레벨에 맞춰 목표 달성 및 역할 기여도를 평가하는 식으로 재편했다. 또한 네이버는 성과 보상에서도 직원들에게 스톡옵션 부여를 확대하는 등 동기부여 방식을 다변화했다. 카카오는 OKR을 적극 도입하고 조직문화셀 등 전담부서가 상시 피드백 문화를 점검하고 있다. SK텔레콤은 '애자일 조직' 전환의 일환으로 목표/평가 주기를 단축하고, 프로젝트 단위 평가를 도입했다. 구성원들이 여러 프로젝트에 동시에 기여하므로, 프로젝트 리더들이 수시로 팀원 피드백을 주고, 이를 종합해 연말에 활용한다. 제조업에서도 포스코가 PI(Performance Improvement) 제도로 성과/역량을 함께 평가하면서, AI 분석을 도입해 평가 공정성을 높였다 발표하기도 했다. 한국타이어 등 전통 제조기업도 MBO를 고도화하고, 다면평가를 간부 승진 등에 적용하며, 인사평가 결과를 경력개발 면담으로 연결하는 시도를 하고 있다.


MZ세대와 공정성 이슈: 최근 한국의 2030 젊은 직원들은 인사평가의 공정성에 민감하다. 익명 직장인 어플리케이션 블라인드에는 평가 불만 글이 자주 올라오며, '사람 차별 없이 투명하게 평가해달라', '낙하산 간부가 자기 사람만 높게 준다' 등의 폭로가 화제가 되기도 한다. 이에 대응해 기업들은 평가 과정 투명성을 높이고자 평가결과 공개 범위 확대, 이의제기 창구 활성화 등을 추진 중이다. 예컨대 과거에는 자기 등급만 알려줬다면, 이제는 본인 상대순위나 분포도 알려주고, 심지어 팀 평균과 비교해 어느 위치인지 보여주는 경우도 있다. 물론 지나친 공개는 또 다른 갈등을 낳을 수 있어 신중해야 하지만, 최소한 '왜 이런 평가를 받았는지' 납득시키려는 노력을 강화하는 추세다. 또한 팀장 한 명의 독단을 견제하기 위해 다면평가에서 나온 동료 의견을 참고자료로 제시하거나, HRBP(HR Business Partner) 등이 참여하는 평가 검증 모임을 운영하기도 한다.


보상체계 변화와 평가: 한국 민간에서는 연봉체계 개편 논의도 평가와 맞물려 있다. 몇몇 기업이 호봉제를 폐지하고 직무급/성과급 비중을 높이는 작업을 했다. 이때 성과평가의 중요성이 커질 수밖에 없다. 호봉제에서는 연차가 쌓이면 자동 상승이지만, 직무성과급에서는 평가결과에 따른 인상/인하가 발생하기 때문이다. 예컨대 은행 등 금융권에서도 직무급제 도입이 화두인데, 성과평가 결과가 임금에 크게 영향을 미칠 것이 예상되어 노사 협의의 핵심 쟁점이 되고 있다. 노조 측은 평가 공정성 담보 없이 성과급만 확대하면 '관리자 마음대로 임금조정' 위험이 있다고 주장한다. 그래서 기업들은 평가 제도 개선(객관지표 확대, 다면평가 도입 등)을 병행하며 신뢰 구축에 힘쓰고 있다.


스타트업/IT 업계: 이 업계는 변화 속도가 빠르다 보니 성과평가에 대한 실험도 다양하다. OKR을 전면 도입한 스타트업이 많고, 주단위 스프린트 리뷰처럼 잦은 피드백을 주기도 한다. 조직이 작을 때는 평가 없이 창업자/리더 판단으로 인사하던 곳들도, 인원이 늘면 정식 평가제도를 만든다. 근래 스타트업계에선 '우리는 넷플릭스 따라한다'며 공식평가를 없앴다가 내부 혼란으로 다시 부활시키는 사례도 있다. 역시 사람이 늘어나면 공정하고 일관된 기준이 필요함을 깨닫는 것이다. 다만 스타트업들은 대기업보다 유연해서, 예컨대 연봉협상을 연1회 일괄 대신 상시 협상제로 운용하는 곳도 있다. 이 경우 특정 시점 평가보다, 그때그때 성과증빙을 직원이 해서 협상한다. 이런 실험들도 계속 누적되며 한국 기업 문화의 한 부분으로 자리잡아가고 있다.


요약하면, 한국 민간기업 성과평가는 전반적으로 글로벌 트렌드와 맥을 같이하고 있다. 과도한 상대평가 완화, 절대평가/혼합평가 도입, 상시 피드백 강화, 평가항목 간소화 및 가치연계 등이 그것이다. 아직 연공적 요소가 완전히 사라진 것은 아니나, MZ 세대의 부상으로 공정성과 투명성 요구가 커져 기업들도 지속 개선을 꾀하고 있다. 또한 HR 테크놀로지 활용도가 높아져, 한국 HR SaaS 기업들이 평가관리 솔루션을 앞다투어 내놓고 공공/중견 기업에 공급하고 있다. 이런 기술 보급은 특히 평가 행정업무를 줄여주고 데이터 분석을 가능케 해, 기업들의 평가 역량을 높이는 데 기여하고 있다.


8.2

공공부문의 성과평가 동향

공공부문의 특수성: 대한민국 공공부문(정부 부처, 지자체, 공공기관 등)은 민간과 달리 공익성과 다원적 목표를 추구하고, 법규의 제약을 많이 받는 특징이 있다. 성과평가 역시 그런 특수성을 띤다. 우선 평가 기준의 모호성 문제가 있다. 민간기업은 이윤이라는 단일 지표가 있지만, 공공부문은 공익, 형평, 효율 등 여러 가치가 얽혀 있어 무엇을 성과로 볼지 합의하기 어렵다. 예컨대 경찰 조직이라면 치안 서비스 성과를 어떻게 측정할지, 단순 범죄율 감소만 볼 것인지 주민 만족도도 볼 것인지 등 복합적이다. 또한 성과 측정의 어려움도 크다. 정책의 효과는 장기간에 걸쳐 나타나고 외부 요인도 커서, 단기 수치만으로 평가하기 곤란하다. 그리고 이해관계자 다양성으로 인해 성과에 대한 시각이 다를 수 있다. 예컨대 한 정책에 대해서 국민, 국회, 언론, 시민단체마다 판단이 다를 수 있다. 마지막으로 법적·제도적 제약으로 인해 평가절차가 경직적이기도 하다. 이런 맥락 때문에, 공공부문의 성과평가는 기술적 개선뿐만 아니라 문화·시스템 전체의 개선이 필요한 적응적 과제로 여겨진다.


정부업무평가와 기관평가: 우리나라 공공부문 성과평가는 크게 두 층위로 나뉜다. 하나는 정부업무평가로, 중앙부처 및 지자체의 정책 수행을 국무총리실 산하 평가단에서 평가하는 것이다. 이는 각 부처의 주요 업무 성과지표를 연말에 점검해 등급화하고, 우수기관 포상이나 정책 피드백에 활용한다. 둘째는 공공기관 경영평가로, 각종 공기업·준정부기관(약 130여개)을 기획재정부 주관으로 평가하는 제도다. 매년 외부 전문가 평가단이 기관 경영실적을 A~E 등급으로 매겨 성과급 지급, 기관장 연임 등에 반영한다. 이 경영평가에는 사회적 가치 실현, 재무성과, 고객만족 등 다각적 지표가 들어간다. 이러한 거시적 평가제도들은 기관 단위의 성과관리 체계를 견인해왔다. 즉 각 부처·기관이 자체적으로 성과관리 시스템을 구축하게 만드는 동인이 되었다.


공무원 개인평가: 한편, 개별 공무원(공직자)에 대한 평가는 근무성적평정이라는 이름으로 오래전부터 운영돼 왔다. 국가공무원법 등에 규정된 이 평가는 과거에는 형식적으로 상사 견책 수단 정도로 인식되었으나, 점차 성과주의 바람을 타고 실효성을 높이려는 노력이 이뤄졌다. 현재 대부분의 공공기관과 공무원 조직은 성과계약 또는 성과목표제 형태로 직원 개개인이 연초 목표를 설정하고 연말 평가받는다. 예컨대 고위공무원단은 장관과 성과계약을 체결하여 주요 정책과제를 정하고 이행을 평가받는다. 일반직 공무원은 근무성적평가를 통해 승진, 성과급 등에 반영되는 점수를 받는다. 그러나 현실적으로 공직사회에서는 평가등급 쏠림과 평가 관대화가 흔하다. 상급자가 부하에게 낮은 등급을 주면 사기 저하 및 마찰이 크고, 승진 적체로 인해 어차피 승진 소요연한 동안 다들 한 번씩은 높은 점수 받아야 해서 돌려가며 S등급을 주는 관행도 있었다. 이를 해결하고자 몇몇 기관은 강제할당제를 시도했으나 노조 반발 등으로 지속되지 못했다. 현재는 부처별로 절대평가+다면보정 정도를 많이 쓴다. 다면평가는 주로 관리자 승진심사 참고로 활용된다. 가령 과장 이상 간부들은 부하직원들이 실시한 상향평가 결과를 승진 후보자 심사 시 참고한다.


성과연봉제와 평가: 공공기관과 공무원 조직에 성과주의 도입을 가장 강하게 추진했던 계기는 성과연봉제였다. 박근혜 정부 시절(2015년경) 공공기관에 성과연봉제를 일괄 도입하려 했고, 이는 노조 반발로 상당한 진통을 겪었다. 핵심 쟁점은 '평가의 신뢰성 없이 성과연봉제 못 받는다'는 것이었다. 노조는 기관장 등 경영진이 평가를 자의적으로 휘둘러 노동자 통제 수단으로 악용할 우려를 제기했다. 결국 정권 교체 후 성과연봉제 확대는 사실상 멈췄고, 기존 도입된 부분도 일부 축소되었다. 다만 일부 공공기관은 현재도 직원 연봉의 20~30%를 성과등급에 따라 차등지급하고 있다. 공직사회(일반 공무원)의 경우 성과상여금 제도가 있어, 개인 근무성적평가 결과 상위자들에게 기본급의 0~50% 범위에서 매년 성과상여금을 준다. 예산문제로 실효성은 크지 않아도, 어쨌든 차등보상이 이뤄지고 있는 것이다. 이러한 보상 연계 때문에라도, 공무원들도 평가결과에 관심이 높아지는 추세다. 예전에는 '어차피 승진 때나 필요'였지만, 이제는 매년 돈과 직결되니 민감성이 커진 것이다.


디지털 성과관리 도입: 공공기관들은 최근 디지털 전환 흐름 속에 성과관리도 IT 솔루션 도입을 활발히 하고 있다. 앞서 언급한 클라우드 SaaS 도입 사례가 그것이다. 한 보고에 따르면 2024년 공공부문 SaaS 계약 중 HR 성과관리 솔루션 비중이 꽤 늘었다고 한다. 이는 공공기관도 복잡한 규정을 시스템으로 처리하여 효율화하고, 데이터 축적으로 관리 수준을 높이려는 의도다. 예를 들어 공공기관은 대부분 순환보직(2~3년마다 보직 이동)을 하기에, 장기적인 개인별 성과이력 관리가 어려웠다. 이를 시스템화하면 한 직원이 여러 부서 옮겨도 성과데이터가 일관되게 따라다니고, 경향을 파악할 수 있다. 또한 공공기관 평가제도는 복잡해서 수작업 시 오류가 잦았는데, 시스템이 계산해주니 공정성 시비도 줄어든다. 예를 들어 앞서 사례의 A기관은 200페이지 평가편람대로 커스터마이징하여 평가를 실시, 관대화/엄격화 경향을 줄이고 평가 공정성을 높였다고 한다. B기관도 노후된 시스템을 최신화하여, 조직도 기반 평가그룹 분리, 조직별 문항/가중치 차등 적용 등 유연성을 확보했다고 한다. 이는 다양한 조직 특성을 반영함으로써 구성원 수용도를 높인 사례다.


공공부문 변화 방향: 미래 지향적으로 볼 때, 공공부문 성과평가는 '단순 통제 도구를 넘어 전략 관리 수단'으로 진화하고 있다. 정부 부처들은 성과관리(BSC 등)를 통해 부처 전략목표와 개인업무를 연계하려 노력 중이고, 책임운영기관 같은 제도를 통해 자율성과 책임성을 높이고 있다. 또한 시민 참여 평가 등이 도입돼, 국민이 체감하는 성과를 측정하려 한다. 일부 지자체는 주민들이 공무원 친절도 등을 평가해 인사에 반영하기도 한다. 다만 이러한 시도는 객관성 확보 문제가 있어 신중히 다뤄진다. 한편, 인공지능 활용도 시작됐다. 예를 들어 행안부는 AI를 활용한 공무원 인사배치 추천 시스템을 개발하고 있다. 성과데이터와 경력 등을 AI가 분석해, 어느 보직이 적합한지 추천하면 인사담당자가 참고하는 식이다. 이는 성과평가 데이터의 2차 활용 사례로 볼 수 있다.


종합하자면, 대한민국 공공부문의 성과평가는 성과중심 행정 기조 하에 꾸준히 개선되고 있지만, 그 복잡한 환경 때문에 민간만큼 급진적 변화는 어렵다. 그러나 디지털 기술 도입, 평가 지표의 정교화, 피드백 문화 장려 등을 통해 서서히 바뀌어가고 있다. 무엇보다 공정성에 대한 강조가 크다. 공직사회는 어떤 인사제도든 공정성이 담보되지 않으면 추진이 힘들다. 최근 MZ세대 공무원들도 성과평가 결과에 민감하여, 이를 납득시키기 위해 부처별로 평가위원회 개최, 이의신청 시 재평가 등 절차를 강화했다.

향후 공공부문 평가의 키워드는 책임성과 유연성의 조화'일 것이다. 엄정한 평가를 통해 책임은 묻되, 지나친 규제로 창의와 협력을 저해하지 않도록 균형 잡는 것. 이는 쉽지 않은 도전이지만, 궁극적으로 국민에게 신뢰받는 성과관리체계를 구축하는 방향으로 나아갈 것으로 전망된다.



9. AI 기반 성과관리 시스템 (현재 적용사례, 한계와 기회)

AI(인공지능)는 HR 분야 전반에 변혁을 일으키고 있으며, 성과관리(Performance Management) 영역도 그 예외가 아니다. 이번 장에서는 AI 기반 성과관리 시스템의 현재 적용 사례들을 살펴보고, 그것이 가져오는 기회와 이점 및 한계와 우려에 대해 논의한다.


9.1 AI의 성과관리 적용 사례

사례 1: AI 코치와 피드백 도우미 – 글로벌 IT기업 A사는 사내 메신저에 AI 코치 봇을 도입했다. 이 봇은 직원들의 업무 기록(예: 완료된 과제, 달성 KPI 등)을 모니터링하고, 주기적으로 '이번주 목표 진행이 70%입니다. 순조롭네요! 혹시 지원 필요한 부분은 없는지 상사에게 공유해보세요.' 같은 메시지를 보낸다. 또한 상사에게도 '부하직원이 3일째 야근 중입니다. 격려 한마디 해주세요'라든지, '팀원의 프로젝트 마감이 다가왔습니다. 피드백 미팅 일정을 잡으시겠습니까?' 같이 타이밍 좋은 알림을 제공한다. 이는 AI가 업무 데이터를 바탕으로 피드백과 코칭의 빈틈을 채워주는 예라 할 수 있다. 실제로 이런 봇을 도입한 팀들은 피드백 빈도가 늘고 직원 만족도 지표가 소폭 개선되었다고 보고되었다.


사례 2: AI 리뷰 요약과 문장 추천 – 글로벌 기업 B사는 연말 성과리뷰 작성에 AI를 활용한다. 직원이 1년간 달성한 KPI, 상사가 적었던 메모, 동료 피드백 등이 한데 모여있으면, AI 툴이 이를 분석해 성과리뷰 초안을 생성한다. 예를 들어 '올해 3개 프로젝트를 성공적으로 완료했고, 목표 대비 평균 110% 성과를 냈습니다. 특히 5월 프로젝트에서 리더십을 발휘하여 팀 목표 달성에 크게 기여했습니다.' 같은 식의 문단을 만들어낸다. 그러면 상사는 이를 검토하며 자신의 어조로 수정보완하여 최종 평가서를 완성한다. 또한 이 AI는 피드백 문구 추천도 해준다. '개선이 필요'를 클릭하면 '문제 해결 속도를 높이기 위해 업무 우선순위 설정에 더 집중하면 좋겠습니다', '동료들의 의견을 더 경청하여 협업 효율을 향상시켜 보세요' 등 여러 문장을 제안한다. 상사는 거기서 적합한 것을 선택하거나 참고하여 자신만의 코멘트를 쓴다. 이를 통해 평가자들이 어떤 얘기를 어떻게 쓸지 막막해하는 어려움을 상당 부분 덜 수 있었다. 실제 B사에서는 관리자의 리뷰 작성 시간이 평균 20% 감소했고, 특히 언어적 표현에 능숙하지 않은 관리자들의 피드백 질이 향상되었다는 내부 평가가 있다.


사례 3: AI 편향감지와 공정성 제고 – 대기업 C사는 수년간 축적된 성과평가 데이터를 AI가 분석하여 편향 패턴을 찾았다. 그 결과 특정 부서장 D는 여성 직원에게 평균 0.5점 낮은 점수를 주는 경향이 통계적으로 유의하게 나타났다. 또 다른 부서에서는 업무상 대면이 적은 재택근무자가 사무실 근무자보다 낮은 평가를 받는 경향이 포착됐다. AI는 이러한 잠재적 편향 지표를 HR에게 보고해주었다. 회사는 이를 바탕으로 D 부서장에게는 무의식적 편향 교육을 추가로 실시하고, 평가 산출 시 재택근무자에 대한 하향 보정이 없도록 평가자 전체 공지를 통해 인지시켰다. 또한 AI는 문장 분석을 통해, 평가 코멘트에서 성 차별적 표현이나 근거 부족 표현('이 사람은 왠지 믿음직스럽지 않음' 등)을 감지해 HR에 알려준다. HR은 그러한 코멘트를 쓴 평가자에게 '이러이러한 표현은 부적절하니 수정 바랍니다'라고 피드백한다. 이처럼 AI를 활용해 평가내용을 실시간 모니터링함으로써, 예전에는 놓치기 쉬웠던 편견 요소를 걸러내고 공정성을 높일 수 있었다.


사례 4: People Analytics – 성과 예측과 인재 식별 – 글로벌 기업 D는 사내 People Analytics 팀이 AI 모델을 개발해, 직원들의 성과와 이직을 예측하고 있다. 이 모델은 성과평가 기록, 승진 이력, 프로젝트 투입량, 교육 수료, 참여도 조사 결과 등 수십 가지 변수를 학습한다. 이를 통해 '다음 평가에서 Top Performer가 될 확률이 높은 직원', '성과 정체로 이탈 위험이 있는 직원' 등을 예측 리스트로 뽑아낸다. 예측 정확도는 완벽하지 않지만, D사는 이를 HRBP와 부서장에게 참고자료로 준다. 예컨대 '영업부 김○○ 과장은 최근 2년간 성과 정체와 낮은 참여도 경향을 보여 이직 위험 있음'이라고 모델이 예측하면, HRBP는 해당 팀장에게 알려 경력 면담이나 코칭을 권고한다. 반대로 'R&D부 박△△ 책임은 빠르게 성과 상승 중이고 학습 능력이 뛰어나 향후 핵심인재로 육성 권장' 같은 인사이트를 주면, 회사는 특별 멘토링이나 승진 기회를 부여하는 식이다. 물론 이 모든 결정은 결국 사람이 내리지만, AI의 데이터 인사이트는 미처 보지 못했던 케이스를 발굴해준다. D사에 따르면 이 모델 도입 후, 고성과자들의 조기 승진율이 올라갔고 의도치 않은 핵심인재 이탈 사례도 줄었다고 한다.


이 외에도 AI 면담 어시스턴트(평가 피드백 면담 시, 직원 표정/언어를 실시간 분석해 감정변화를 관리자에게 알려주는)나, AI 감사봇(슬랙 등에서 동료끼리 주고받은 칭찬 메시지를 모아 인사고과 참고자료로 축적) 등 흥미로운 시도들이 나오고 있다.


9.2 AI 도입의 기회와 이점

위 사례들을 통해 본 AI 성과관리의 장점은 크게 몇 가지로 정리된다:


실시간성 & 상시 관리: AI는 연중 끊임없이 데이터를 수집·분석하여 즉각적인 피드백 루프를 돌릴 수 있다. 이는 기존의 연말 한 번 평가의 한계를 극복하고, 상시 성과관리를 가능케 해준다. 특히 원격근무 상황에서 상사가 놓칠 수 있는 부분을 AI가 캐치해 알려주면, 성과관리의 사각지대가 줄어든다.


객관적 데이터 기반: 사람은 감정이나 편견에 좌우될 수 있지만, AI는 방대한 데이터에서 객관적 패턴을 찾아준다. 이를 통해 의사결정의 근거를 강화하고 공정성을 높일 수 있다. 예컨대 '이 직원은 올해 판매실적 120%, 고객평가 4.8점으로 상위 5%입니다'를 AI 리포트로 제시하면, 승진이나 포상 논의 때 주관적 의견보다 더 신뢰받는다.


편향 및 오류 감소: AI는 특정 그룹에 대한 일관된 편차 등을 감지해 편향 시정을 도와준다. 또 수작업 계산 오류나 평가표 처리 실수를 없애 준다. 결과적으로 평가 정확성을 제고한다. 특히 복잡한 평가 규칙이 있는 조직에서 AI는 룰에 따라 정확히 계산하고, 사람보다 실수를 덜 한다.


시간 효율 증대: 평가서 초안 자동생성, 문구 추천 등은 관리자의 행정 부담을 줄인다. HR 부서도 일일이 편향 사례 찾거나 통계 내는 작업을 AI가 해주니 시간을 전략적으로 쓸 수 있다. 절약된 시간은 코칭과 소통 등 더 부가가치 높은 활동에 쓰일 수 있다.


인사이트와 예측: AI는 인간이 놓치는 숨은 인재를 발견하거나 미래 성과를 예측하여 선제적 조치를 가능케 한다. 이는 인재 유지와 육성 측면에 새로운 기회를 준다. 예를 들어, 전에 스포트라이트 받지 못한 직원이 AI 분석에서 높은 잠재력으로 떠오르면, 회사가 그를 놓치지 않고 개발할 수 있다.


개인화와 맞춤형 지원: AI는 각 개인의 강점/약점 프로필을 그려 맞춤형 피드백과 학습을 제공할 수 있다. 예컨대 'A 씨는 분석력은 뛰어나나 커뮤니케이션 점수가 낮다'를 바탕으로 AI가 관련 코스나 코칭을 추천해주는 식이다. 이는 성과개선 플랜을 보다 개인화하는데 도움이 된다.


요컨대, AI는 성과관리의 효율성, 공정성, 전략성을 한 단계 끌어올릴 잠재력이 있다. 루틴한 부분은 자동화하고, 인간관리자는 인간적인 부분에 집중하게 해준다는 것이다.


9.3 AI 도입의 한계와 우려

그러나 AI 만능론은 금물이다. AI 기반 성과관리에는 다음과 같은 한계와 위험이 존재한다:

데이터 편향과 부정확성: AI도 학습 데이터에 의존하는데, 기존 평가 데이터에 편향이 있었다면 AI는 그것을 답습하거나 심화할 수 있다. 예컨대 과거에 특정 부서 직원들이 낮은 평가를 받았다면, AI는 그 부서에 속했다는 이유만으로 향후 성과도 낮게 예측할지 모른다. 또한 정성적 요소(팀 분위기 기여 등)를 계량화하기 어려워 AI 모델이 이를 제대로 반영 못하면 왜곡된 판단을 할 수 있다. 따라서 AI의 출력은 참고용일 뿐, 전적으로 신뢰해선 안 된다. 항상 인간의 판단과 교차검증이 필요하다.


프라이버시와 감시 논란: AI가 직원의 이메일, 채팅, 업무산출물 등 광범위한 데이터를 모은다면, 직원들은 사생활 침해과도한 감시로 느낄 수 있다. 실제로 일부 기업의 '직원 모니터링 AI'에 노조나 직원들이 반발한 사례가 있다. 성과향상 목적으로 시작했다 해도, 직원 입장에선 '내 일거수일투족이 점수화된다'는 압박감과 스트레스를 받을 수 있다. 이는 신뢰 상실사기 저하로 이어질 수 있다. 그래서 AI 도입 시 데이터 수집 범위와 활용에 대한 투명한 커뮤니케이션과 직원 동의 절차가 중요하다.


인간적 요소 간과: 성과평가에는 감정과 상황이 어우러진 인간적 면이 있다. AI는 맥락을 모두 이해하지 못할 수 있다. 예를 들어 한 직원이 올해 성과가 낮았지만 가족상의 어려움이나 건강문제가 있었다면, 상사는 그것까지 고려해 100점 만점 중 80점을 줄 수 있다. 그러나 AI는 숫자만 보고 50점으로 계산할지 모른다. 또한 동기부여사기진작 측면의 미묘함을 AI는 알기 어렵다. 사람은 때로 부하의 노력을 인정해주기 위해 일부러 좋은 평가를 주기도 하는데, AI는 그 배경을 모른 채 '이 상사는 항상 점수를 높게 줘'라며 조정하려 할 수 있다. 이처럼 맥락 부족이 AI 판단의 한계다.


책임소재 문제: AI의 결정이나 예측을 기반으로 인사조치를 했는데, 나쁜 결과가 나온다면 책임은 누가 지는가? 예를 들어 AI가 저성과자로 찍은 직원을 해고했는데, 알고 보니 데이터 오류거나 편향 때문이었다면, 법적 책임이나 윤리적 문제가 생긴다. 현재로선 AI는 의사결정 보조일 뿐, 최종 결정은 사람이 해야 한다. 하지만 일부 관리자들이 AI에 지나치게 의존해 'AI가 그랬으니...' 식으로 책임을 회피하거나, 반대로 직원이 'AI 평가가 틀렸다'며 이의제기하는 등 새로운 쟁점이 나타날 수 있다.


수용성과 신뢰: HR 분야 조사에 따르면, 직원들은 'AI가 내 상사의 평가를 대신하는 것'에 대해 상당한 거부감을 표한다는 결과도 있다. 상사와 신뢰 관계에서 받는 피드백은 받아들여도, 'AI가 너 별로래' 하면 받아들이기 어렵다는 것이다. 기술 친숙도가 높아지는 MZ세대라도, 인사평가는 공정성과 인간적 배려를 중시하기 때문에 AI에 완전히 맡기길 원치 않을 수 있다. 따라서 AI 도입은 점진적으로 하고, 직원들의 신뢰를 얻는 과정이 병행되어야 한다.


윤리와 법 규제: EU 같은 곳에서는 AI 활용에 엄격한 규제를 논의 중이다. 특히 채용/평가 등 인간의 삶에 큰 영향을 미치는 영역의 AI는 고위험군으로 분류돼 투명성, 설명가능성, 인간 감시 등이 요구될 전망이다. 한국도 관련 논의가 시작되고 있다. 따라서 기업이 AI 평가를 활용하려면 법적 규정 준수와 윤리 가이드라인을 만들어야 한다. 예컨대 AI가 내린 성과평가에 대해 직원이 설명을 요구하면, 이해할 수 있게 설명할 수 있어야 한다든지, AI 모델에 차별적 요소가 없다는 검증을 거쳐야 한다든지 하는 사항들이다.


9.4 앞으로의 전망과 전략

AI 기반 성과관리는 초기 단계이지만 빠르게 발전할 것으로 예상된다. 딥러닝의 고도화로 정성적 데이터 해석 능력이 나아지고, 대화형 AI(예: ChatGPT 같은)로 직원들이 손쉽게 코칭받는 환경이 올 수도 있다. 그러나 기술보다 중요한 것은 HR 전략과 문화다.

앞으로 기업들은 다음을 염두에 두어야 할 것이다:

1) 목적의식 뚜렷한 도입: AI를 도입하는지 명확히 해야 한다. 단순히 유행이니 도입하는 것이 아니라, 우리 조직의 성과관리 문제점 해결이나 효율 향상이라는 목적을 정의하고, 그에 맞는 솔루션을 선택해야 한다. 목적 없이 기술만 들이면 혼란만 가중될 수 있다.


2) 인간 + AI 협업 모델: AI가 모든 걸 대체하진 못한다. 이상적인 것은 AI가 데이터 분석과 반복업무를 맡고, 인간 관리자는 의사결정과 공감, 창의적 코칭에 집중하는 협업 모델이다. 이를 위해 관리자 교육이 필요하다. AI 출력물을 해석하고 적절히 활용하는 'HR 애널리틱스 리터러시'를 키워야 한다. 또한 HR 정책적으로 AI가 함부로 독주하지 않게 인간 관여 (Human-in-the-loop) 프로세스를 설계해야 한다.


3) 데이터 거버넌스 확립: AI의 연료는 데이터다. 그러므로 평가 데이터의 축적, 관리, 품질 개선이 필수다. 공정하고 일관된 데이터가 쌓여야 AI가 의미있는 인사이트를 낸다. 또 사생활 정보 분리, 보안, 익명화 등 윤리적 거버넌스도 마련해야 직원들이 안심하고 참여한다. 예컨대 'AI 평가 위해 이메일 검토' 이런건 민감하니 사전 동의 절차나 비식별화 조치를 명확히 해야 한다.


4) 단계적 도입 및 피드백: 한꺼번에 전사 도입하기보다는 파일럿 운영을 통해 시행착오를 줄이는 게 좋다. 파일럿 그룹에서 AI 성과관리 툴을 써보고, 장단점을 피드백 받아 개선한 뒤 확대하는 방식이다. 이 과정에서 직원들과 충분히 소통하여 심리적 수용을 높이는 것이 성공의 관건이다.


결론적으로, AI는 성과관리의 미래를 바꿀 중요한 열쇠다. 효율성과 통찰 측면에서 커다란 기회를 주지만, 반대로 인간미 상실이나 통제 강화로 흐른다면 역효과가 날 수도 있다. 따라서 AI를 인간을 돕는 도구로 올바르게 위치짓는 것이 중요하다. 기술보다 사람 중심을 놓치지 않는다면, AI는 귀중한 HR 파트너가 될 것이다. 예컨대 AI는 '데이터에 기반한 공정한 코치' 역할을 하고, 최종적인 '결정과 배려는 인간 관리자'가 하는 식의 분업이 그것이다.


AI 시대에도 핵심은 변함없다. 직원들이 동기부여되고 성장할 수 있는 환경을 조성하는 것. AI는 그 목표를 달성하기 위한 새로운 수단일 뿐이다. 잘 활용한다면, AI는 성과관리의 번거로움을 덜고 본질에 집중하게 해줄 것이고, 나아가 모든 직원이 더 공정한 인정과 피드백을 받는 미래를 앞당길 수 있을 것이다.



10. 미래의 인사평가: 예측, 변화 요인, 대비 전략


마지막으로, 앞으로 인사평가의 미래 모습에 대해 전망해보자. 급변하는 경영 환경, 기술 발전, 인재관의 변화 속에서 인사평가도 계속 진화할 것이다. 어떤 변화 요인들이 이러한 진화를 이끌지, 그리고 기업과 HR 담당자들은 어떤 대비 전략을 가져야 할지 정리한다.


10.1

미래 인사평가의 주요 변화 예측

Continuous Performance Management의 표준화: 평가가 언제나 진행 중인 프로세스가 되는 것이 표준이 될 것이다. 연례평가에 얽매이지 않고, 목표 설정-피드백-조정이 수시로 이루어지는 문화가 확산된다. 직원들은 실시간으로 자신의 성과 현황을 모니터링하고, 관리자는 그때그때 코칭하며 장애물을 제거해주는 애자일 성과관리가 일반화될 것으로 보인다. 이로써 성과와 개발 간의 경계도 흐려져, 평가 = 성장대화라는 인식이 자리잡을 것이다.


탈등급화 (Rating-less) 경향 확대: 이미 시작된 등급 없는 평가 흐름이 더 커질 수 있다. '우수/보통/미흡' 정도의 러프한 구분만 남기거나, 아예 서술형 피드백만 제공하고 공식 등급은 폐지하는 조직이 늘어날 수 있다. 특히 크라우드소싱 피드백(동료, 고객 등 다수가 참여)이 활발해지면, 숫자 등급보다는 키워드와 평판으로 개인 성과를 표현하는 방식이 나올 수 있다. 예컨대 어떤 직원 프로필에 'Problem Solver, Team Mentor' 같은 태그가 붙고, 그것이 곧 평가결과를 대체하는 식이다.


협업성과 및 팀평가 강화: 업무의 복잡성이 높아지면서 팀 단위 성과의 중요성이 커지고 있다. 미래에는 개인평가만큼이나 팀평가가 중요해질 것이다. 프로젝트 별로 팀을 평가하고, 팀원 전체가 함께 보상을 받는 사례가 늘 수 있다. 이는 협업 촉진과 사일로(silo) 타파에 기여할 전망이다. 더 나아가, 네트워크 조직에서는 전통적 상사가 없고 과업 리더만 있는 경우도 많아, 동료 집단이 서로를 평가하는 셀프 관리형 평가도 등장할 수 있다. 블록체인 기술 등을 이용해 동료평가를 투명하게 기록하고 모두가 합의하면 인정하는 탈중앙화 평가 시스템도 이론적으로 가능하다.


정서적/사회적 성과의 중시: 기업들이 DE&I(Diversity, Equity & Inclusion), ESG, 조직문화를 중시하게 되면서, 인사평가에도 '얼마나 조직 가치를 실천하는가', '동료를 얼마나 배려하고 긍정 문화에 기여하는가' 같은 항목이 더욱 비중 높아질 것이다. 이미 MS가 포용(Inclusion)을 평가에 넣은 것처럼, 많은 조직들이 성과와 가치의 균형을 평가에 통합할 것으로 보인다. 이는 성과=숫자라는 협소한 개념에서, 성과=성과+행동이라는 넓은 개념으로 이동함을 의미한다.


AI와 자동화의 보편화: 앞 장에서 논의한 AI 도구들이 널리 퍼져, 일상적으로 AI가 평가 업무를 보조하는 게 자연스러워질 것이다. 평가 입력, 데이터 분석, 편향 체크 등은 AI가 알아서 처리하고, HR과 관리자들은 그 결과를 모니터링하는 관리자+AI 공존 모델이 주류가 될 수 있다. 또한 메타버스 등의 발전으로 원격/가상 평가 면담도 더욱 실감나고 자연스럽게 할 수 있을 전망이다. 예컨대 VR 회의실에서 아바타로 상사-직원이 만나 성과 피드백 면담을 하며, AI가 실시간 코칭을 해주는 장면도 가능해질지 모른다.


자기주도 평가(Self-Assessment) 확대: 성과평가가 꼭 상사→부하의 탑다운만이 아니라, 자기 진단 및 성장플랜 수립에 초점을 둔 자기평가 부분이 강화될 것이다. 미래의 인재들은 수평적이고 자율지향이어서, 남이 자신을 재단하는 것보다 스스로 목표 세우고 돌아보는 과정을 중요시한다. 회사들은 이를 지원하기 위해 셀프 리뷰 템플릿, 커리어 자기진단 도구 등을 개발하여, 직원 각자가 자기 인사평가 리포트를 만들고 관리자로부터 피드백 받는 형식이 늘어날 것이다. 이는 직원들이 스스로 커리어 오너십을 갖게 해주는 장점이 있다.


인사평가의 통합적 인재관리화: 성과평가가 학습 개발(L&D), 승계계획, 채용 등 인사관리 다른 영역과 통합되어 전략적 인재관리 시스템으로 진화할 것이다. 예컨대 성과평가 결과와 스킬 데이터베이스가 연동되어, 특정 역량이 뛰어난 고성과자를 자동으로 다음 프로젝트에 매칭하거나, 성과 우수하지만 특정 역량 부족한 사람을 AI가 멘토와 연결해주는 등 인재 개발과 활용을 실시간 최적화하는 방향으로 갈 수 있다. 즉, 평가가 결과 확인 차원을 넘어 인재 운용의 허브 역할을 할 전망이다.


투명성과 피드백 문화의 강화: 현재보다 훨씬 더 평가 과정과 결과의 투명성이 높아질 가능성이 있다. 일부 기업은 이미 팀 내 누구 등급이 뭔지 공유하는 곳도 있는데, 미래에는 완전 오픈 평가 플랫폼도 등장할 수 있다. 예컨대 사내 모든 구성원이 서로의 강점/성과를 볼 수 있는 프로필이 있고, (민감한 부분을 제외한) 동료간 피드백 내역도 공유되어 모두가 참여하는 평가 문화가 될 수도 있다. 이는 신뢰 기반의 조직일수록 가능하다. 물론 이건 극단적인 그림이지만, 방향성은 더 열리고 덜 폐쇄적인 평가로 가리라 본다. 그리고 자연히 일상적 피드백 주고받기는 업무의 일부로 완전히 자리잡을 것이다.


10.2 미래 변화 요인

이런 변화들은 여러 요인이 맞물려 가속될 것이다:

업무 환경 변화: 디지털 전환, 자동화, 재택·하이브리드 근무 확산 등으로 성과 측정 방식이 변하고 있다. 예전처럼 출근 잘 하고 프로세스 따르면 되는 시대가 아니라, 창의성과 지식노동의 성과를 봐야 하는 시대다. 또한 원격근무로 관찰 가능성이 낮아지므로, 신뢰 기반 목표관리와 IT 활용이 필수다. 이런 환경 변화가 평가 혁신의 동인이 된다.


세대 교체: MZ세대(밀레니얼, Z세대)가 조직의 중심으로 떠오르면서 수평적, 피드백 지향적 문화가 요구된다. 이들은 권위적, 일방향 평가를 매우 싫어한다. 대신 코칭, 멘토링, 커뮤니케이션을 원한다. 또한 즉각적인 피드백에 익숙해, 1년 기다렸다 통보받는 건 견디지 못한다. 이들의 성향이 평가방식에 영향을 크게 줄 것이다.


인재 확보 전쟁: 우수 인재의 중요성이 어느 때보다 커지며, 기업들은 퍼포먼스 매니지먼트를 제대로 못 하면 핵심인재를 잃을 위험이 높다. 공정하지 못한 평가, 납득 안 되는 보상은 곧장 퇴사로 이어진다. 반대로 좋은 성과관리 문화(공정한 인정, 성장 기회 제공)는 인재 유인 요소다. 특히 글로벌화된 인재 시장에서 밀리지 않으려면 평가·보상 시스템도 세계적 수준으로 발전시켜야 한다. 이 경쟁압력이 변화 가속 요인이다.


AI와 기술 발전: AI는 하루가 다르게 발전 중이고, 비용도 줄고 있다. HR분야 스타트업들도 평가용 AI툴, 피플애널리틱스 솔루션을 속속 내놓는다. 기술의 접근성 증가는 도입 장벽을 낮추고, 한 기업이 성공하면 다른 곳도 빠르게 따라가 벤치마킹할 것이다. 특히 클라우드 기반 HR 시스템이 중소기업까지 퍼지면 전체 파급효과가 클 것이다.


노동시장의 유연화: 이직과 전직이 잦아지고, 계약·프리랜서 등 다양한 고용형태가 늘면, 전통적 평가(연공, 연례)는 맞지 않게 된다. 짧게 기여하는 인력도 공정히 평가·보상해야 하므로 프로젝트별 평가, 상사 없는 평가 등의 모델이 요구될 것이다. 또한 원청-하청 관계에서도 '공정한 평가와 보상' 이슈가 불거져, 생태계 전체 성과공유형 평가 모델도 논의될 수 있다.


법/제도와 사회적 요구: 공정과 평등에 대한 사회적 요구(예: 공정채용법 등)가 높아지면서, 평가도 공정성 제고 압박을 받는다. 그리고 성차별/연령차별 없애기, 감정노동 보호 등 가치들이 반영되어, 향후 법으로 “인사평가 결과로 차별 발생 시 제재” 같은 조항이 생길 수도 있다. 또한 노동조합도 미래엔 평가과정 참여를 더 요구할지 모른다. 이런 제도적 움직임이 기업들로 하여금 평가 방식을 개선하게 하는 계기가 된다.


10.3 대비 전략과 권고

미래 인사평가의 변화에 대비하여, 기업과 HR담당자는 다음과 같은 전략을 고려해야 한다:

지속적 학습과 벤치마킹: 최신 성과관리 트렌드와 도구에 대해 지속적으로 학습해야 한다. HR 담당자들은 구글, 넷플릭스, MS 사례뿐 아니라, 업계 유사 기업들의 시도도 눈여겨보고 벤치마킹할 필요가 있다. 이를 통해 우리 조직에 맞는 발전 방향을 모색한다. 하지만 남의 사례 맹신은 금물이고, 반드시 우리 조직 문화/전략과의 적합성을 검토하여 커스터마이징해야 한다.


조직 문화 변화 관리: 평가제도 개편은 문화 변화와 맞물린다. 직원들이 새로운 시스템을 신뢰하고 따르게 하려면, 투명한 커뮤니케이션과 변화 관리 프로그램이 중요하다. 예컨대 상대평가→절대평가 전환 시 왜 그렇게 하는지, 모두에게 어떤 이득이 있는지 설명해야 한다. 또 관리자의 역할 변화(통제자→코치)에 대해 교육하고 인식 전환을 도와야 한다. 변화에는 항상 저항이 있기 마련이므로, 점진적 시행과 피드백 청취로 보완해나가야 성공 확률이 높다.


기술 투자와 인재 확보: AI와 HR테크 활용이 필수라면, 이에 대한 투자와 역량 강화가 필연적이다. 적절한 HR 소프트웨어를 도입하고, 내부에 데이터 분석역량을 키우거나 외부 전문가와 협업해야 한다. 예산과 인력을 배정하고 ROI를 측정해가며 추진한다. 또 HR부서에도 디지털 친화적인 인재(데이터 사이언티스트 등)를 영입하여, 미래형 성과관리 체계를 주도하게 할 필요가 있다.


공정성 제일 원칙 유지: 아무리 제도가 바뀌어도, 공정성이라는 원칙은 절대 흔들려선 안 된다. 이는 인사평가의 생명줄이다. 공정성을 위협하는 요소(편견, 밀실운영 등)를 줄이고, 투명성과 절차적 공정(과정 공정)을 높이는 노력을 계속해야 한다. 예컨대 평가기준 사전공개, 다수인의 참여, 이의제기 보장 등이다. 기술이 도와줄 수는 있으나, 최종적으로 윤리적 잣대는 사람이 들이대야 한다. HR은 기술팀과 협업할 때도 항상 “이게 정말 공평한 결과인가?”를 질문하고 확인해야 한다.


개인화된 경력관리 병행: 성과평가와 연계해 경력개발 기회를 제시하는 것이 중요하다. 미래 인재들은 평가 결과 그 자체보다, 그 결과로 '내 커리어에 무엇이 제공되는가'를 중시한다. 예컨대 우수등급자에게 직무순환 기회나 해외연수 기회를 준다든지, 하위등급자에게는 멘토를 붙여 개선계획을 돕는다든지 하는 식이다. 이렇게 평가→피드백→개발액션까지 한 세트로 돌면, 직원들이 평가를 성장의 일부로 받아들이게 된다.


유연한 보상설계: 평가제도가 변하면 보상체계도 유기적으로 조정해야 한다. 예컨대 팀평가 비중을 늘렸다면 단체 인센티브 비율을 높이고, 절대평가로 바꿨다면 등급별 보상폭을 재설정해야 한다. 또한 비금전적 보상(승진, 인정 프로그램 등)도 강화해, 직원들이 금전 외에도 성취감을 얻도록 해야 한다. 특히 젊은 세대는 즉각적 인정(Recognition)을 중시하므로, 분기 MVP 시상이나 사내뉴스포털에 성과 소개 등 소프트한 보상도 챙겨야 한다.


리더십 역할 재정립: 미래 성과관리는 리더들에게 새로운 역할을 요구한다. 평가자에서 코치이자 조력자가 되는 것인데, 이를 위해 리더십 개발이 필요하다. 경영진부터 '우리 회사는 성과평가를 이렇게 활용해 사람을 키운다'는 철학 공유와 롤모델링이 있어야 일선 관리자가 따른다. 또한 리더들의 정서적 지능(EQ)을 키워, 피드백 대화를 잘 이끌고, AI툴도 친근히 쓰게 만들어야 한다. 리더가 변해야 평가문화가 변한다.


미래의 인사평가는 아마도 평가란 말이 무색할 정도로 자연스럽고 일상화된 활동이 될지도 모른다. 평가와 업무, 학습의 경계가 사라지고, 그냥 일을 잘 하는 과정에 피드백과 인정이 녹아들어 있는 모습일 것이다. 그 중심에는 결국 사람이 있다. 아무리 기술이 돕더라도, 사람에 대한 관심과 이해가 바탕에 없으면 성과관리 시스템은 껍데기에 불과하다. 그러므로 HR 담당자와 경영자들은 기술과 트렌드를 공부하되, 항상 '우리 직원들의 성장과 동기부여에 진정으로 도움이 되는가'를 물어야 할 것이다.


현재 우리는 급격한 전환의 초입에 서 있다. 과거의 장단을 배우고, 현재의 혁신을 수용하며, 미래를 내다보는 지혜가 필요한 시점이다. 인사평가는 단순 인사제도를 넘어 조직문화와 성과의 핵심 축이다. 이 거대한 변화를 주도적으로 이끌어가는 자에게, 앞으로의 HR 경쟁력과 조직 성공이 달려있을 것이다. 공정하고 유연하며 사람을 키우는 인사평가, 그것이 우리가 가야 할 방향임은 분명하다.

작가의 이전글AI랑 일 잘하는 법