Pulse Survey(비정형데이터)를 활용한 조직구성원 피드백 실시하기
이번주 'HR Analytics 끄적끄적' 매거진 글은 저번주에 이어서 펄스서베이(Pulse Survey)에 대한 글을 이어서 다루어 보고자 합니다. 분량상 문제 및 분석 기법이 서로 상이한 관계로 10월 3일 'Chat GPT를 활용하여 조직구성원과 소통하기 1' 글에서는 객관식 문항 설문지 작성 및 분석 방법에 대해서 살펴보았습니다. 이번 글에서는 주관식 설문 문항 작성 및 분석 방법에 대해서 살펴보도록 하겠습니다.
* 객관식 문항 설문지 작성 및 분석 방법에 대해서 궁금하신 분들께서는 'Chat GPT를 활용하여 조직구성원과 소통하기: Pulse Survey를 활용한 조직구성원 피드백 실시하기'(링크: https://brunch.co.kr/@publichr/77) 글을 읽어 주시기 바랍니다. 해당 글을 읽고 이번 글을 보시면 펄스서베이에 대해서 좀 더 포괄적으로 이해하실 수 있습니다.
조직구성원의 의견과 감정을 분석하기 위한 동일한 펄스서베이(Pulse Survey) 일지라도 개관식 문항과 주관식 문항의 분석기법은 서로 큰 차이가 있습니다. 조직구성원에 대한 원활한 소통을 위해서는 조직구성원의 마음을 정확히 읽는 것이 중요합니다. 따라서 조직구성원의 주관식 문항 조사 설문지 작성 방법과 이를 통해 얻은 데이터를 효과적으로 분석하는 방법을 살펴보도록 하겠습니다. 이와 같은 방법을 통해 조직은 구성원의 목소리를 좀 더 정확하게 파악하고 발전적인 피드백을 수행하실 수 있습니다.
이전 글(Chat GPT를 활용하여 조직구성원과 소통하기: Pulse Survey를 활용한 조직구성원 피드백 실시하기)에서 설명한 바와 같이 펄스서베이(Pulse Survey)란 심장 박동(Pulse)처럼 정기적이고 짧은 주기로 수행하는 설문조사를 의미합니다. 이를 확인하여 조직구성원의 조직몰입, 직무만족 등을 측정할 수 있으며, 주기적인 조사 데이터의 분석을 통해 조직의 생산성을 향상시킬 수 있습니다. 매거진 이전 글에서는 펄스서베이(Pulse Suvey) 중 객관식(리커트 척도) 문항을 활용한 방법에 대해서 살펴봤는데요. 객관식 문항을 통한 펄스서베이는 조직구성원이 어떠한 감정과 의견을 가지고 있는지 보기 쉽게 할 수 있지만 자칫 점수 경쟁으로 변질될 수 있는 위험성 또한 가지고 있습니다. 따라서 펄스서베이(pulse Survey)의 주된 목표인 조직구성원과의 소통을 위해서는 주관식 설문문항을 통해 조직구성원이 어떤 의견과 감정을 가지고 있는지 함께 파악을 하여야 합니다.
펄스서베이(Pulse Survey) 객관식 문항 조사와 주관식 문항 조사에 대해 각각 회차를 나누어 매거진을 발행하였지만 분량상의 문제로 인해 콘텐츠를 나누었을 뿐 실제 펄스서베이(Pulse Survey)를 실시할 때에는 객관식 문항과 주관신 문항을 별도로 나누어서 진행하지 않고 함께 조사를 실시합니다. 설문지를 작성할 시에 객관식 문항을 10개 내외로 주관식 문항을 2~3문항으로 하여 조사를 실시하면 적당합니다.
위에서 안내드린 바와 같이 펄스서베이(Pulse Survey)를 실제 실시할 수 있는 여건이 되지 않아 웹상에 있는 데이터를 활용하여 분석하는 방법을 설명드리고자 합니다. 본 글에서 사용된 데이터는 잡플래닛 기업 평점 중 한 대기업의 '총평'을 크롤링(Crwaling)한 데이터로 감정분석과 의미망분석을 시행해 보았습니다. (Crawling을 하는 방법에 대해서 좀 더 구체적인 내용을 원하신다면 'Chatp GPT로 조직문화 분석하기': https://brunch.co.kr/@publichr/74)편을 참고해 주시기 바랍니다.)
비정형데이터는 데이터 분석의 그 목적에 따라 단어 빈도 분석, 감정 분석, 의미망 분석, 토픽 모델링 등을 수행할 수 있습니다. 빈도 분석과 토픽 모델링 기법은 기존 HR Analytics 매거진 글(Chat GPT로 조직문화 분석하기: https://brunch.co.kr/@publichr/74)에서 이미 다룬 적이 있으므로 이번 글에서는 감정분석(Sentiment Analysis)과 의미망 분석(Semantic Network Analysis)을 다뤄 보도록 하겠습니다.
감정분석(Sentiment Analysis)은 텍스트의 내용을 파악하고 그 텍스트가 긍정적인지, 부정적인지 아니면 중립적인지를 파악하는 분석 방법입니다. 감정분석은 감성분석 또는 의견 마이닝으로도 불리며 현대 조직에서 구성원의 의견을 파악하는데 유용한 분석방법으로 여겨지고 있습니다. 조직은 소셜미디어 모니터링 또는 설문을 통해 데이터를 확보하고 확보한 비정형 데이터에 대해 감정분석을 실시하여 구성원의 감정과 의견을 파악할 수 있습니다. HR 분야에서도 조직은 구성원의 의견을 감정분석을 통해 파악하고 조직문화 및 제도 개선 등에 활용할 수 있습니다. 감정분석 수행은 주로 머신러닝(지도학습)을 통해 수행하거나, 감정사전을 기반으로 수행하는데 이번 글에서는 감정사전 기반으로 분석을 진행해 보겠습니다.
본 글에서는 수집된 데이터를 감성분석 하기 위해서 군산대학교 소프트웨어융합공학과에서 만든 'KNU 한국어 감성사전'을 활용하였습니다. 'KNU 한국어 감성사전'은 군산대학교 소프트웨어융합공학과 Data Intelligence Lab github(https://github.com/park1200656/KnuSentiLex)에서 SentiWord Dict.txt를 다운로드하시거나 'Do it! 쉽게 배우는 R 텍스트 마이닝' github(https://github.com/youngwoos/Doit_textmining/tree/main/Data)에서 knu_sentiment_lexicon.csv를 다운로드하실 수 있습니다. 저는 후자 파일을 다운로드하여 활용하였습니다. 추가로 감정분석을 Chat_GPT Advanced Data Analysis에게 요청할 때 'Do it! 쉽게 배우는 R 텍스트 마이닝' 상'제4장 감정 분석' 코드 자료(https://github.com/youngwoos/Doit_textmining/tree/main/Script)를 Chat GPT에게 탑재한 후 해당 코드를 참고해서 감정분석을 실시해 달라고 요청했습니다.
인터넷상 유용한 Python 또는 R 코드를 찾았다면, Chat GPT에게 해당 코드를 전달하고 해당 코드를 참고해서 코드를 짜달라고 하면 좀 더 사용자 의도에 맞게 코드를 작성해 줍니다.
Chat GPT Adavanced Data Analysis는 작성일 기준으로 하여 연별, 월별 감정평균점수의 추세를 보기 쉽게 그래프로 그려주었습니다. 그래프를 통해서는 직관적으로 조직구성원의 상태를 파악할 수 있습니다. 그렇다면 좀 더 구체적으로 회사에 대해 어떤 점에서 긍정적인 감정을 가지고, 반대로 어떤 점에서 부정적인 감정을 가지는지 분석해 보도록 하겠습니다.
감정분석 실시를 통해 받은 그래프의 한글 단어가 깨진 채로 도출되었습니다. 이에 따라 x축의 범주를 그래프 위에 표시해 달라고 해서 다시 도출하였더니 그래프에 내용이 정상적으로 표시되는 것을 확인할 수 있었습니다.
리뷰 감정 분포를 살펴보면 상대적으로 중립적인 리뷰가 많은 것으로 파악되었습니다. 실제 감정점수가 0이어서 중립인 경우도 있겠지만, 사전에 포함되어 있지 않은 단어 사용으로 감정분석 시 중립으로 분류될 수도 있습니다. 따라서 사전 내 단어 추가 및 수정이나 문장의 세밀한 전처리를 통해서 리뷰 감정 분포의 정확성을 올릴 수 있을 것이라 예상됩니다.
분석 대상 기업의 리뷰에서는 다음과 같은 특징을 발견할 수 있습니다. 긍정적인 측면에서, '최고', '좋음', 그리고 '복지'와 같은 단어들이 주로 사용되었습니다. 이는 조직 구성원들이 회사의 인지도와 복지에 대해 긍정적으로 평가하고 있다는 것을 나타냅니다. 반면, 부정적인 측면에서는 '힘든', '많이', '어려움', 그리고 '힘들다'와 같은 단어들이 눈에 띄게 사용되었습니다. 이는 업무의 강도나 난이도가 높아, 이에 대한 조직 구성원의 부정적인 반응이 나타나고 있다는 것을 의미합니다.
의미연결망분석, 또는 텍스트 네트워크 분석이라고도 불리는 이 방법은 텍스트나 문헌 내의 단어들을 중심으로 그들 사이의 동시출현 관계를 분석하여 네트워크를 형성합니다. Diesner & Carley(2005)에 따르면, 이 방식은 소셜 네트워크 분석 기법에 기반하여 각 단어를 노드로 여기고 단어들 사이의 연결을 그래프로 표현함으로써 텍스트 내부의 단어 간의 관계와 그들의 상대적인 중요도를 드러내게 됩니다. 따라서, 이 분석을 통해 문서 전체의 주요 단어와 그 단어들 사이에서 나타나는 연결 구조를 파악하며, 특정 단어가 텍스트 내에서 어떤 역할을 하는지를 깊이 있게 분석할 수 있습니다. 아래 그래프는 의미망 분석을 시각화한 자료입니다. Chat GPT_Adavanced Data Analysis에서는 한글 깨짐으로 현상이 지속적으로 발생하여 R코드를 Chat GPT에게 요청하여 R를 통해 도출해 낸 시각화 자료입니다.
감정분석을 위한 데이터를 Chat GPT에게 다시 탑재하고 해당 분석을 활용한 HR 전략을 마련해 달라고 요청하였습니다. Chat GPT는 상대적으로 일반적인 HR 전략에 관한 답변을 제시하였습니다.
좀 더 구체적인 답변을 얻기 위해 Chat GPT에게 감정분석을 통해 긍정 감정, 부정 감정의 Top20 리뷰를 각각 도출하고 해당 리뷰를 활용하여 HR전략을 제시해 달라고 다시 요청하였습니다.
긍정 리뷰에서 직원들은 회사의 급여, 복지, 기업문화, 교육 수준에 만족하며, 회사의 브랜드 네임벨류가 좋다는 것을 확인할 수 있었습니다. 따라서 조직은 이와 같은 강점들을 유지하고, 이를 활용하여 우수 인재를 유치하는 전략이 필요합니다. 부정 리뷰에서는 직원들의 업무량 부담감, 갑질 문화, 교대근무의 문제, 그리고 회사의 방향성과 비전 공유 부족 문제가 분석결과 나타났습니다. 조직에서는 이러한 문제들을 해결하기 위한 개선 방안 마련과 조직구성원의 지속적 소통이 필요합니다.
감정분석을 통해 도출된 긍정, 부정 리뷰에 대해서 각각 나누고 각 리뷰에 대해서 의미망 분석(Semantic Network Analysis)을 실시하였습니다. 긍정 리뷰에는 '최고', '연봉', '복지' 등의 키워드가 도출되었습니다. 이는 조직구성원이 해당 기업의 연봉, 복지 등과 네임벨류 등에 만족하고 있다는 것을 보여줍니다. 반면 부정 리뷰에서는 '힘들', '업무 강도', '스트레스' 등의 키워드가 도출되었습니다. 이는 조직구성원들이 업무 강도로 인해 스트레스를 받고 있다는 것을 나타냅니다.
따라서 Chat GPT는 의미망 분석을 통한 HR전략을 다음과 같이 언급하였습니다. 먼저 '복지', '연봉' 등 긍정 리뷰에 나타난 장점을 살리고 지속적으로 홍보해야 함을 제시하였습니다. 이와 함께 부정리뷰에 나타난 '업무 강도', '스트레스', '경쟁' 등에 통해 과중한 업무 강도에 대한 개선 방안 마련, 복지 제도의 개선 및 확대, 경쟁보다 협업을 강조하는 조직문화 마련 등을 제시하였습니다. 마지막으로 Chat GPT는 효과적인 조직 장점 강화 및 단점 감소를 위해 조직구성원과의 커뮤니케이션 강화를 제시하였습니다. 조직은 구체적인 HR 전략 방안 마련을 위하여 Chat GPT와 꼬리 물기 대화를 통해 좀 더 구체적인 대안을 모색해 볼 수 있으며, 그 이후 궁극적으로 이를 기반으로 한 조직구성원과의 소통을 통해 정책대안을 최종적으로 마련할 수 있을 것입니다.
이번 'HR Analytics 끄적끄적' 매거진에서는 이전 글에서 다룬 객관식 문항 설문 작성 및 분석 방법에 이어 주관식 문항 설문 작성 및 분석방법에 대해서 알아보았습니다. 주관식 문항을 통해 얻은 비정형 데이터는 분석의 목적에 따라 단어 빈도 분석, 감정 분석, 의미망 분석, 토픽 모델링 등 다양한 분석을 활용할 수 있습니다. 이와 같은 여러 방법론 중 본 글에서는 조직구성원의 의견과 감정을 분석하기 위해 '감정분석'과 '의미망분석'을 활용해 보았습니다. 모든 작업을 Chat GPT_Advanced Data Analysis를 통해서 진행하려 했으나 '의미망분석' 시각화 등은 한글 폰트 깨짐 현상으로 인해 프로그램 R을 부가적으로 활용하였음을 알려드립니다. 실제 분석을 할 시에도 R, Python 프로그램과 함께 Chat GPT_Adavanced Data Analysis를 활용하면 실무에서도 충분히 다양한 인사이트를 얻을 수 있는 분석을 실시할 수 있습니다.
마지막으로 펄스서베이(Pulse Survey) 글을 마무리하며 다시 한번 강조하고 싶은 점은 펄스서베이(Pulse Survey)는 데이터 분석 자체가 중요한 것이 아니라 리더와 HR부서가 지속적으로 조직구성원의 의견을 살피고 피드백을 주어 조직구성원의 신뢰를 쌓는 것을 중요하다는 것 입니다. 훌륭한 Data와 분석방법이 있다 하더라도 조직구성원과 원활한 소통이 이루어지지 않으면 Data 분석은 그 힘을 발휘할 수 없습니다. 따라서 리더와 HR부서 구성원은 구성원의 목소리에 대해 지속적으로 피드백 하려는 마음가짐 및 그 실천이 가장 중요합니다. 짧은 주기로 조직구성원이 모두 관심을 가지고 있는 사안에 대해서 설문을 진행하고 그 결과에 대한피드백을 지속적으로 제공한다면 조직구성원과 효과적인 소통을 이끌어 낼 수 있을 것입니다. 이와 같은 소통과 피드백이 궁극적으로 조직변화와 발전을 이끌어 낼 수 있음을 다시 한번 강조하며 글을 마치고자 합니다.
김영우. 2021. "Do it! 쉽게 배우는 R 텍스트 마이닝". 이지스 퍼블리싱.
<Do it! 쉽게 배우는 R 텍스트 마이닝> 저장소, https://github.com/youngwoos/Doit_textmining
군산대학교 소프트웨어융합공학과 Data Intelligence Lab Git Hub, https://github.com/park1200656/KnuSentiLex
알렉스 맥팔랜드. 2022. "감성 분석을 위한 최고의 Python 라이브러리 10개". UNITE.AI
유소연, & 임규건. (2021). 텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로. 지능정보연구, 27(1), 47-64.
장찐. 2022. "영화리뷰 감성분석 (Sentiment Analysis)". 벌꿀오소리의 공부 일지. 2022년 5월 15일 작성. 2023년 10월 9일 접속. https://yeong-jin-data-blog.tistory.com/entry/%EC%98%81%ED%99%94%EB%A6%AC%EB%B7%B0-%EA%B0%90%EC%84%B1%EB%B6%84%EC%84%9D-Sentiment-Analysis.
https://www.yes24.com/Product/Goods/129378508