선발 및 평가 분야에 대한 최종 고찰

[요약]Handbook of Workplace Assessment 24장

Dec 12. 2024

이 장은 선발 및 평가 분야에서 논의되어 온 주요 주제와 현안들을 종합적으로 정리하고, 이 분야의 발전 방향과 실무적 함의를 제시합니다. 저자는 선발 및 평가 절차가 단순한 도구적 활용을 넘어, 맥락적 요인과 윤리적 고려를 포함하여 보다 정교하게 설계되고 실행되어야 함을 강조합니다. 각 주요 논점은 맥락, 성격 측정 도구의 사용, 인지 능력과 불리한 영향의 문제, 직무 분석 및 역량 모델링, 그리고 향후 과제에 걸쳐 논의됩니다.

1. The Role of Context (맥락의 역할)

맥락의 중요성

선발 및 평가 절차는 단순히 평가 도구나 점수의 정확성만을 고려해서는 안 됩니다. 각 절차는 조직과 직무의 고유한 맥락을 반영해야 합니다. 조직의 문화, 운영 방식, 직무의 구체적 요구 사항과 같은 맥락적 요인은 평가 결과의 해석 및 활용에 중대한 영향을 미칩니다.

주요 논점

- 조직적 맥락 : 조직의 전략적 목표와 선발 기준이 일치해야 하며, 평가 도구는 조직의 우선순위와 장기적 목표를 반영해야 합니다. 예를 들어, 혁신을 중시하는 조직은 창의성을 평가하는 도구를 더 비중 있게 사용해야 할 수 있습니다.
- 사회적 맥락 : 평가 결과는 사회적 불평등, 다양성, 공정성에 미치는 영향을 고려해야 합니다. 특정 평가 도구가 특정 집단(예: 여성, 소수 인종)에 불리한 영향을 줄 가능성이 있는 경우, 이를 완화하기 위한 대안적 접근이 필요합니다.
- 개인적 맥락 : 평가 대상자의 개인적 특성과 배경이 평가 결과에 미치는 영향을 고려해야 합니다. 평가 절차가 지나치게 표준화되면, 다양한 배경을 가진 지원자들이 자신의 잠재력을 충분히 발휘하지 못할 가능성이 있습니다.

실무적 함의

선발 및 평가 절차는 단순히 "적합한" 사람을 찾는 데 그치지 않고, 조직의 지속 가능한 성장과 공정성을 보장하는 역할을 해야 합니다. 맥락적 요인을 충분히 반영하지 못하면, 평가 결과가 왜곡되거나 의도하지 않은 부작용을 초래할 수 있습니다. 따라서 평가 설계자는 각 조직의 맥락적 요인을 심층적으로 이해하고 이를 평가 도구와 절차에 통합해야 합니다.

2. Differing Perspectives on the Use of Personality Measures in Selection

(선발에서 성격 측정 사용에 대한 다양한 관점)

성격 측정 도구는 선발 절차에서 널리 사용되지만, 이들의 신뢰성과 타당성에 대해 학계와 실무에서 다양한 의견이 존재합니다. 이 섹션에서는 성격 측정 도구가 가진 장점과 한계를 분석하며, 이를 둘러싼 주요 논점을 정리합니다.

2-1. Lack of a Common Specification for Construct Label (구성 라벨의 공통 명세 부족)

성격 측정 도구의 주요 문제는 구성(construct) 라벨의 명확성 부족입니다. 성격 구성 요소(예: 외향성, 성실성 등)의 정의와 해석이 도구별로 일관되지 않거나, 연구자나 실무자 간 해석이 상이합니다. 동일한 성격 차원을 측정한다고 주장하는 도구 간에도 상관관계가 낮은 경우가 많습니다. 이는 평가 결과의 신뢰성을 떨어뜨리며, 도구의 타당성에 대한 의문을 제기합니다. 예를 들어, 동일한 "성실성"을 측정한다고 주장하는 도구들이 각기 다른 행동 특성을 강조한다면, 결과 해석에 혼란을 초래할 수 있습니다. 실무자는 다양한 성격 도구 중 어떤 도구를 선택할지 혼란을 겪으며, 조직의 직무 요구와 도구 간의 적합성을 평가하기 어렵게 만듭니다.

2-2. Trait-Performance Relationships Vary Across Jobs and Performance Dimensions (직무와 성과 차원에 따른 특성-성과 관계의 차이)

성격 특성과 직무 성과 간의 관계는 직무와 성과의 유형에 따라 달라집니다.

- 특성-성과 관계 : 예를 들어, 외향성은 판매 직무에서 긍정적인 성과와 강한 상관관계를 가지지만, 연구개발(R&D) 직무에서는 성과와 약한 상관관계를 보일 수 있습니다. 성격 특성의 유효성은 특정 직무에서 요구되는 기술이나 행동과의 적합성에 따라 달라집니다.
- 성과 차원의 다양성 : 직무 성과는 양적(예: 매출) 또는 질적(예: 팀워크) 측면으로 평가될 수 있으며, 각 성격 특성이 성과의 다른 차원에 미치는 영향은 상이합니다. 예를 들어, 성실성은 높은 품질의 결과물을 생성하는 데 중요한 반면, 외향성은 고객 관계 관리와 관련된 성과에 더 큰 영향을 미칠 수 있습니다.
- 실무적 시사점 : 성격 측정을 활용하려면, 각 직무에서 중요한 성과 차원을 사전에 정의하고, 이를 예측할 수 있는 성격 특성을 선별해야 합니다. 직무에 따라 성격 특성과 성과 간 관계가 다르므로, 표준화된 도구를 맹목적으로 사용하는 것은 위험할 수 있습니다.

2-3. Lack of Clarity as to the “Right” Personality Dimensions (‘적합한’ 성격 차원에 대한 명확성 부족)

선발 과정에서 어떤 성격 차원이 "적합한"지에 대한 명확한 합의가 부족합니다.

- 성격 특성(Big Five, HEXACO 등)이 성과를 예측하는 데 효과적이라는 주장이 있지만, 특정 직무에서 "적합한" 성격 특성이 무엇인지에 대한 연구는 제한적입니다. 예를 들어, 창의적인 직무에서 "개방성"이 중요한 특성으로 간주되지만, 기술적 직무에서는 덜 중요한 특성으로 간주될 수 있습니다.
- 성과 맥락의 변화 : 조직의 전략적 목표나 직무의 본질적 요구 사항이 바뀌면, "적합한" 성격 특성도 변할 수 있습니다. 예를 들어, 위기 상황에서는 성실성보다 스트레스 관리 능력이나 정서적 안정성이 더 중요할 수 있습니다.
- 실무적 영향 : 성격 측정을 효과적으로 활용하려면, 직무와 조직의 요구 사항에 따라 적합한 성격 차원을 명확히 정의해야 합니다. 이는 직무 분석을 통해 지원자가 필요로 하는 성격 특성을 체계적으로 식별함으로써 가능해집니다.

2-4. The Role of Faking (조작의 역할)

문제 정의

성격 측정 도구의 신뢰성과 타당성을 약화시키는 주요 요인 중 하나는 조작(faking)입니다. 조작은 지원자가 평가 점수를 높이기 위해 자신의 응답을 의도적으로 왜곡하는 행위를 말합니다. 조작은 주로 자기 보고형 성격 평가에서 발생하며, 특히 선발 절차에서 지원자가 자신을 "이상적으로 보이게" 응답하려는 동기가 강할수록 더 빈번하게 나타납니다.

조작의 주요 영향

- 평가 결과 왜곡 : 지원자의 실제 성격이 아닌, "이상적"이라고 여겨지는 특성을 반영하는 결과를 초래합니다. 예를 들어, 외향적이지 않은 지원자가 "외향성" 척도에서 높은 점수를 얻으려 적극적으로 조작할 경우, 결과의 신뢰성이 손상됩니다.
- 타당성 저하 : 조작으로 인해 성격 평가와 실제 직무 성과 간의 상관관계가 약화됩니다. 성격 척도가 직무 적합성을 정확히 평가하지 못하면 선발 과정의 공정성과 효과성이 감소합니다.
- 불리한 영향 : 조작 능력이 높은 지원자가 낮은 조작 능력을 가진 지원자보다 유리한 결과를 얻는 경우, 선발 과정에서 형평성이 훼손될 수 있습니다.

조작에 대한 대응 전략

- 조작 탐지 기술

응답 패턴 분석: 자기 일관성을 평가해 비정상적으로 일관된 응답을 식별

정직 척도(honesty scales): 지원자의 응답 신뢰성을 평가하는 추가적인 질문 활용

- 비교 기준 설정 : 성격 평가 결과를 기존 연구나 직무에서 높은 성과를 보인 직원들의 성격 데이터와 비교하여 조작 여부를 간접적으로 평가.
- 다중 평가 방식 : 자기 보고형 평가 외에, 관찰 기반 평가(예: 상황 판단 테스트)를 병행하여 조작의 영향을 줄임.
- 후속 인터뷰 : 평가 점수에 대해 인터뷰를 통해 심층적으로 검토해 조작 가능성을 평가.

3. The Cognitive Ability–Adverse Impact Dilemma

(인지 능력과 불리한 영향의 딜레마)

딜레마의 정의

인지 능력 검사는 직무 성과를 예측하는 데 있어 가장 신뢰할 수 있는 평가 도구로 간주됩니다. 그러나 이러한 검사는 특정 집단(예: 인종, 성별) 간 점수 차이를 초래할 가능성이 높아 불리한 영향(adverse impact)을 유발할 수 있습니다. 이는 법적, 윤리적, 실무적 문제를 야기하며, 특히 다양성과 형평성을 중시하는 현대 조직에서 민감한 문제로 부각됩니다.

불리한 영향의 원인

- 사회경제적 배경 : 특정 집단의 교육 기회와 자원 접근성이 제한적일 경우, 인지 능력 검사에서 낮은 점수를 받을 가능성이 높습니다.
- 문화적 편향 : 일부 인지 능력 검사는 특정 문화적 맥락에서 개발되어, 다른 문화권의 지원자들에게 불리하게 작용할 수 있습니다.
- 검사의 고유 특성 : 인지 능력 검사는 일반적으로 문제 해결 능력, 논리적 사고 등을 측정하는 데 초점을 맞추며, 이로 인해 특정 직무 성과와의 직접적 연관성이 제한적일 수 있습니다.

해결 방안

- 다차원적 평가 도구 활용 : 인지 능력 검사 외에 대안적 평가 도구(예: 상황 판단 테스트, 작업 샘플 테스트)를 결합하여 불리한 영향을 줄일 수 있습니다. 예를 들어, 팀워크 능력이나 대인관계 기술은 인지 능력 검사로는 충분히 평가되지 않을 수 있습니다.
- 검사 설계 개선 : 문화적 편향을 줄이기 위해, 검사를 설계할 때 다양한 문화적 배경을 반영하거나 언어적 부담을 최소화한 문제를 포함합니다. 예를 들어, 비언어적 문제 풀이 항목의 비율을 높이는 방법입니다.
- 적응형 테스트(adaptive testing) : 지원자의 능력 수준에 따라 문제 난이도를 조정하여 모든 집단이 자신의 최대 능력을 발휘할 수 있도록 설계합니다.
- 법적 준수와 윤리적 고려 : 불리한 영향을 줄이기 위해 평가 도구의 공정성을 정기적으로 검토하고, EEOC(고용평등위원회) 가이드라인을 준수합니다.

사례

한 대형 제조업체에서 인지 능력 검사를 선발의 주요 도구로 사용한 결과, 특정 소수 집단에서 낮은 합격률이 발생한 경우, 작업 샘플 테스트와 상황 판단 테스트를 추가하여 평가 도구를 다각화함으로써 소수 집단의 선발 비율을 높이고, 직무 성과와의 상관성을 유지했습니다.

4. Job Analysis and Competency Modeling (직무 분석 및 역량 모델링)

직무 분석과 역량 모델링은 선발 및 평가 절차에서 중요한 기초를 제공합니다. 두 접근법은 각각 직무의 핵심 요구 사항을 정의하고, 지원자의 성과를 예측하기 위해 필요한 기술과 능력을 식별하는 데 중점을 둡니다. 이 장에서는 두 개념의 차이점과 역할, 실무적 시사점을 다룹니다.

직무 분석(Job Analysis)

- 정의 : 직무 분석은 특정 직무의 과업(Task)과 직무 수행에 필요한 지식, 기술, 능력 및 기타 특성(KSAOs)을 체계적으로 식별하는 과정입니다. 결과적으로 직무 요건과 지원자 평가 기준을 명확히 정의하는 데 사용됩니다.
- 활용 :직무 분석 결과는 선발 절차의 기준을 설정하고, 평가 항목의 타당성을 확보하는 데 사용됩니다. 직무 분석은 직무 기대치를 정의하고, 직원의 성과를 평가하는 기준을 제공합니다.
- 강점 : 세부적이고 구체적인 직무 정보를 제공하며, 법적 방어 가능성을 강화합니다. 예를 들어, 직무 분석을 통해 특정 직무에서 특정 기술(예: 소프트웨어 사용 능력)이 반드시 필요하다는 점을 입증할 수 있습니다.
- 한계 : 직무 분석은 시간이 많이 걸리고, 역동적으로 변화하는 직무 환경을 반영하기 어렵습니다.

역량 모델링(Competency Modeling)

- 정의 : 역량 모델링은 직무 수행에 필요한 기술과 능력을 초월하여, 조직의 전략적 목표를 달성하는 데 필요한 행동과 특성을 정의합니다. 예를 들어, "리더십" 역량은 특정 직무의 기술을 넘어 조직 전반에서 요구되는 일반적인 특성으로 간주될 수 있습니다.
- 활용 : 역량 모델은 여러 직무에 걸쳐 공통적으로 적용할 수 있어, 조직의 선발 및 평가 시스템을 통합적으로 설계할 수 있게 합니다. 역량 모델은 직원의 경력 개발 및 교육 프로그램 설계에 사용됩니다.
- 강점 : 변화하는 조직 요구에 유연하게 대응하며, 직무 간 공통된 역량을 강조합니다. 예를 들어, "혁신적 사고"와 같은 역량은 기술 변화와 상관없이 지속적으로 중요할 수 있습니다.
- 한계 : 개념이 추상적일 수 있으며, 세부적인 직무 요건을 간과할 위험이 있습니다. 예를 들어, 특정 기술적 요구 사항을 포함하지 않을 경우, 기술 중심 직무에서는 적용이 어려울 수 있습니다.

실무적 시사점

- 조합적 활용 : 직무 분석과 역량 모델링은 상호 보완적으로 활용될 때 가장 효과적입니다. 예를 들어, 특정 직무에 필요한 기술적 요구 사항은 직무 분석을 통해 정의하고, 조직의 장기적 목표와 연계된 역량은 역량 모델링을 통해 보완할 수 있습니다.
- 변화 관리 : 빠르게 변화하는 직무 환경에서는 역량 모델링의 유연성을 활용하여 미래 요구 사항을 예측하고, 이를 선발 절차에 반영해야 합니다.
- 법적 방어 : 직무 분석은 평가 기준이 직무와 직접적으로 관련되어 있음을 입증하는 데 필수적이며, 특히 불리한 영향을 방지하거나 법적 문제를 방어하는 데 유용합니다.

사례: 직무 분석과 역량 모델링의 결합

한 글로벌 IT 회사는 고객 서비스 직무를 위해 "문제 해결 능력"을 직무 분석을 통해 정의하고, 역량 모델링을 통해 "고객 중심 사고"와 같은 조직적 역량을 통합했습니다. 이를 통해 세부적인 직무 요건과 조직의 전략적 목표를 모두 충족하는 선발 도구를 설계할 수 있었습니다.

5. Komaki’s Call to Action (Komaki의 행동 촉구)

이 장에서는 Komaki의 연구와 주장을 기반으로, 선발 및 평가 분야에서 실질적이고 효과적인 개선을 이루기 위한 행동 방안을 제시합니다. Komaki는 이 분야의 발전을 위해 윤리적 책임, 연구의 실질적 적용성, 그리고 사회적 영향에 대한 깊은 이해가 필요하다고 강조합니다.

행동 촉구의 핵심 메시지

- 윤리적 책임의 강조 : Komaki는 평가 도구와 선발 절차가 특정 집단에 불리하게 작용할 가능성을 줄이고, 조직의 공정성과 다양성을 증진시켜야 한다고 주장합니다. 예를 들어, 평가 과정에서 발생할 수 있는 불리한 영향을 사전에 식별하고 이를 완화하는 방법을 통합해야 한다는 점을 강조합니다.
- 연구와 실무의 격차 해소 : Komaki는 이론적 연구가 실무에 충분히 반영되지 못하는 문제를 지적하며, 연구 결과가 실질적으로 적용될 수 있도록 실무자와 학계 간 협력을 강화해야 한다고 주장합니다. 실무자는 연구 결과를 선발 및 평가 절차에 적용하는 데 있어 더욱 창의적이고 유연한 접근법을 채택해야 합니다.
- 사회적 책임과 공공성 : 평가 및 선발 절차는 조직의 필요뿐만 아니라 사회적 책임과 공공성을 고려해야 합니다. 예를 들어, 불평등 해소와 같은 사회적 가치를 달성하기 위해 평가 도구를 설계하거나 수정할 필요가 있습니다.

행동 촉구의 구체적 제안

- 데이터 기반 접근 강화 : 선발 및 평가 절차를 설계할 때 충분한 데이터를 기반으로 공정성과 타당성을 입증할 수 있어야 합니다. Komaki는 특히 직무 분석 결과와 조직의 전략적 목표를 체계적으로 결합한 데이터 활용을 권장합니다.
- 평가 도구의 다각화 : Komaki는 평가 도구의 다양성과 복합성을 강조합니다. 예를 들어, 인지 능력 검사뿐만 아니라, 상황 판단 테스트(SJT), 작업 샘플 테스트, 인성 검사 등 여러 평가 방법을 통합적으로 사용하는 방식을 제안합니다.
- 윤리적 기준 강화 : Komaki는 평가 도구와 선발 절차가 직무 성과와 연관성을 유지하면서도 특정 집단에 미칠 수 있는 불리한 영향을 줄이는 데 초점을 맞춰야 한다고 주장합니다. 이를 위해 규제 가이드라인과 연구 결과를 반영한 새로운 평가 프레임워크 개발을 촉구합니다.
- 지속적 개선 : 평가 및 선발 절차는 정기적으로 검토되고, 최신 연구 결과와 기술적 발전을 반영해야 합니다. Komaki는 선발 도구와 절차를 혁신하고, 이를 통해 선발 시스템의 정확성과 공정성을 동시에 높이는 노력이 필요하다고 강조합니다.

사례와 실무적 시사점

- 사례: 다양한 평가 방법의 통합
한 다국적 기업은 Komaki의 권고에 따라, 인지 능력 검사 외에도 작업 샘플 테스트와 상황 판단 테스트를 결합한 선발 시스템을 도입했습니다. 이를 통해 조직의 핵심 가치(팀워크, 문제 해결 능력 등)를 반영하면서도 공정성과 정확성을 높이는 데 성공했습니다.
- 실무적 시사점 : 선발 및 평가 절차에서 윤리적 책임과 데이터 기반 접근을 결합한 종합적 시스템을 개발하는 것이 중요합니다. 실무자는 단기적인 선발 효과뿐만 아니라 장기적으로 조직과 사회에 미칠 영향을 고려해야 합니다.

행동 촉구의 결론

Komaki는 선발 및 평가 분야가 단순히 도구와 절차의 개선을 넘어, 사회적 가치와 윤리적 책임을 고려하는 포괄적인 접근법을 채택해야 한다고 강조합니다. 이는 조직의 성공뿐만 아니라, 사회적 공정성과 다양성을 증진시키는 데 기여할 것입니다.

6. Future Prospects for the Selection and Assessment Field

(선발 및 평가 분야의 미래 전망)

이 장에서는 선발 및 평가 분야의 미래 방향성을 논의하며, 기술 발전, 사회적 변화, 그리고 조직의 전략적 요구를 기반으로 이 분야가 직면할 기회와 도전 과제를 제시합니다.

기술 발전의 영향

- 인공지능(AI)과 머신러닝의 활용 : AI와 머신러닝은 대규모 데이터를 분석하여 더 정교하고 타당한 선발 도구를 개발하는 데 기여할 수 있습니다. 예를 들어, 비디오 면접 데이터를 분석해 지원자의 정서적 안정성과 의사소통 능력을 평가하는 기술이 이미 사용되고 있습니다.
- 자동화된 평가 도구 : 자동화된 평가 도구는 선발 절차를 간소화하고, 지원자의 역량을 신속하게 평가하는 데 도움을 줍니다. 상황 판단 테스트(SJT)와 작업 샘플 테스트가 디지털 플랫폼에서 실행될 수 있으며, 이는 비용과 시간을 줄이는 데 기여합니다.
- 윤리적 고려 필요 : 기술 활용이 확대됨에 따라, 개인 정보 보호와 알고리즘 편향과 같은 윤리적 문제를 해결해야 합니다. AI 기반 평가 도구가 특정 집단에 불리한 영향을 미치지 않도록 설계와 검증 과정에서 공정성을 확보해야 합니다.

사회적 변화와 선발 시스템

- 다양성과 포용성 증진 : 현대 조직은 다양성과 포용성을 중요한 가치로 삼고 있으며, 이는 선발 시스템에도 반영되어야 합니다. 예를 들어, 평가 도구가 특정 집단에 불리하게 작용하지 않도록 지속적으로 검토하고 개선해야 합니다.
- 원격 근무와 글로벌화 : 원격 근무의 확산은 선발 과정에 새로운 도전과 기회를 제공합니다. 원격 근무 환경에 적합한 역량(예: 자기 관리, 디지털 소통 능력)을 평가하는 새로운 기준이 필요합니다.
- 직업의 변화 : 자동화와 기술 발전으로 기존 직업의 성격이 변화하거나 새로운 직업이 등장하고 있습니다. 이는 선발 기준과 평가 도구를 지속적으로 업데이트할 필요성을 제기합니다.

연구와 실무의 통합

- 연구의 실질적 적용 : 연구자와 실무자는 협력하여, 학문적 연구를 실무적 문제 해결에 적용하는 데 중점을 둬야 합니다. 예를 들어, 성격과 직무 성과 간 관계에 대한 최신 연구 결과를 바탕으로 평가 도구를 설계할 수 있습니다.
- 증거 기반 실무 : 데이터와 경험적 증거를 기반으로 선발 및 평가 절차를 설계하고 개선해야 합니다. 이는 선발 도구의 신뢰성을 높이고 법적 방어 가능성을 강화하는 데 기여할 것입니다.

실무자와 조직의 역할

- 지속적 학습과 혁신 : 실무자는 최신 기술과 연구 결과를 학습하고, 이를 선발 절차에 통합해야 합니다. 예를 들어, AI 기반 도구의 활용 방법을 학습하고, 이를 기존 시스템에 통합하는 것이 중요합니다.
- 윤리적 기준 유지 : 선발 시스템이 윤리적 기준을 준수하고, 공정성과 다양성을 증진하도록 지속적으로 관리해야 합니다. 법적 요구사항을 넘어, 사회적 책임을 고려한 선발 시스템이 필요합니다.

결론

선발 및 평가 분야는 기술 발전과 사회적 변화 속에서 중요한 기회를 맞이하고 있습니다. 그러나 이러한 발전을 최대한 활용하기 위해서는 기술적 혁신과 윤리적 책임, 그리고 연구와 실무의 긴밀한 협력이 필요합니다. 이 분야의 미래는 공정성과 효율성을 동시에 달성할 수 있는 시스템을 구축하는 데 달려 있습니다.

keyword

매거진의 이전글타당성 검증 전략