brunch

You can make anything
by writing

C.S.Lewis

by 금융앱빌런 Jun 24. 2020

데이터 분석, 공고는 답을 알고 있다

구인 공고 분석을 통해 취업하기(2)

구인공고는 어떤 사람을 찾을까


 지난글에서는 데이터 분석 공고에 대한 기초적인 분석을 진행했습니다. 하지만 구인공고의 가장 중요한 요소인 '본문'에 대해서는 아직 건들지 않았었는데요. 이번에는 본문에 대해서 분석을 해보겠습니다. 과연 구인 공고는 어떤 사람을 찾고 있을까요?



#역량 #분야 #직무 #해시태그 분석


데이터분석 해시태그 워드클라우드

 본격적으로 공고 본문을 분석하기 전에, 먼저 해시태그를 다시한번 살펴보겠습니다. 구직자들의 검색에 걸리기 위해 담당자들은 키워드를 설정합니다. 이 키워드들을 통해 대략적인 경향성을 알아볼 수 있습니다. 키워드들을 대략적으로 살펴보니 크게 '원하는 역량', '업무 분야', '직무' 그리고 '장소'에 대한 것들이 눈에 띕니다. 항목별로 정리해 봤습니다. 괄호안의 숫자는 빈도 수 입니다.


1. 원하는 역량 : 기업들이 hashtag에 올린 필요 역량은 다음과 같습니다.

- Python(334), java(167), MySQL(155), jsp(150), linux(128)


2. 업무 분야 : 기업들이 hashtag에 올린 주요 분야는 다음과 같습니다. 

- 기획(923), It/인터넷(648), 광고(550), 마케팅(437), 빅데이터(293), 인공지능(192),서버(141), 데이터베이스(120), 프론트앤드(119), 백앤드(115), SI/CRM/ERP(102), 교육(102) 


3. 직무 : 기업들이 hashtag에 올린 주요 직무는 다음과 같습니다. 

- 경영/사무(599), 영업(484), 개발(338), 고객상담(248),  웹기획(213),  웹개발(209), 전략경영(203),  회계(186),  운영(180),  시장조사/분석(164), 디자인(161), 홍보(151),  프로그래머(143), 사무(120), 사무보조·문서작성(108)


 가장 빈번하게 등장하는 것은 역시 데이터 분석, 신경망, 머신러닝 등에 광벙위하게 사용되는 Python입니다. java와 MySQL역시 중요해 보입니다. 데이터 시각화 및 통계분석에 주로 사용되는 R은 아쉽게도 한글자여서 키워드에서 누락되어 있습니다. 분야에서는  데이터를 통해 가치를 창출해 내기 용이한 기획, 광고 및 마케팅이 눈에 띕니다. 흥미로운 것은 데이터분석 공고에서 '개발'이 등장하기 보다는 '경영/사무' 가 많이 보인다는 점입니다. 프로그래밍 스킬보다는 데이터를 바탕으로 어떤 가치를 창출할 것인가에 대해 더 많은 관심을 가지고 있는 것처럼 보입니다.



주요 키워드는 어떻게 연결되어 있을까?


 주요 키워드는 대강 알았지만, 이 키워드들이 어떻게 연결되어 있는지 궁금합니다. Python은 어떤 키워드와 함께 주로 등장할까요? 이런 것들을 알아보기 위해 동시등장성(Coocuerrence)를 기준으로 네트워크를 그려 보았습니다. 일견 복잡해 보이지만, 핵심 클러스터를 중심으로 보면 그렇지만도 않습니다.


구인공고 키워드 동시등장 네트워크

1. 지원 정보

- 이력서, 전형절차, 이메일 등 지원 정보에 대한 키워드들이 모여있는 것을 확인할 수 있습니다.


2. 크리에이티브 마케팅 

- 캠페인, 디지털 콘텐츠  및 (게임) 유저들의 행동 데이터 바탕 전략 수립과 관련된 키워드들이 모여있습니다.


3. 지표관리, 비즈니스 인사이트

- 데이터를 통한 지표 관리 및 비즈니스 인사이트 도출과 관련된 키워드들이 모여있습니다. Python은 이 클러스터 근처에서 등장하는 것을 볼 수 있습니다.


 그 외에도 몇 몇 클러스터들이 등장하지만, 가장 크게는 위의 3가지로 해석해 볼 수 있을 것 같습니다. 지원 정보는 빼고 생각해 봐도 될 듯 합니다. 결국 데이터분석을 통해 하는 일은 '크리에이티브 마케팅'이나 '지표관리, 비즈니스 인사이트'인 것 같습니다. Python, 빅데이터와 동시등장빈도가 높은 것은 지표관리나 비즈니스 인사이트 쪽인 것 처럼 보입니다. 네트워크 상이라 구체적으로 같은 단어가 어떤지 보는게 쉽지 않습니다. 이는 간단한 코드로 해결할 수 있는데, 예를 들어서 Python같은 경우는 아래와 같습니다.


*Python과 동시에 등장한 키워드

데이터(0.28), 분석(0.27), intelligence(0.26), 지표(0.19), 통계(0.19), 개발(0.17), spark(0.17), 통한(0.15), 결과(0.15), 시각화(0.14), 경력(0.14), 발굴(0.13), 활용(0.12), 유저(0.11), 인사이트(0.1)



잠재력이 있는 키워드를 찾아보자


전체 네트워크에서 키워드간의 연결관계를 바탕으로 앞으로 더 중요해 질 수 있는 것을 찾을 수도 있습니다. 단어간의 연결 관계를 바탕으로 중심도(Centrality)라는 것을 계산해 볼 수 있습니다. 여기서 다른 키워드들 사이에서 얼마나 다리 역할을 해 주는 지(사이중심성, Betweeness Centrality)와 얼마나 중요한 친구들과 연결되어 있는지(아이겐벡터중심성, Eigen Vector Centrality)를 통해 키워드를 분석해 볼 수도 있습니다. 한번 그래프를 그려서 살펴보겠습니다.


붉은선이 사이중심성, 푸른색이 아이겐벡터중심성입니다

 상위 키워드들을 중심으로 비교해 봤습니다. 여기서 사이중심성이 높은 것은 지금 중요도가 명백히 높은 단어들일 가능성이 높습니다. 그런데 아이겐벡터 중심성이 비교적 높은 것들은 임의의 키워드가 아닌 중요한 키워드들과만 연결관계를 지니는 알짜배기 단어일 가능성이 높습니다. 위의 그래프에서는 '경력', '운영', '경험자', '프로젝트' 등이 있습니다. 재밌게도 지난번에 조건을 분석해 보았을 때는 '학력무관, 경력무관'이라고 했었는데, 본문에서는 경력이나 경험을 중요하게 보는 것 같습니다. 경력 있는 신입을 구하는 것 같네요.



Comming Next, 토픽 모델링


 데이터 분석으로 취업을 준비하며 공고들을 수집하고 네트워크 분석을 해 보았습니다. 분석을 통해서 :


- 데이터분석은 '마케팅' 또는 '비즈니스 지표관리/ 인사이트' 영역에 기회가 있다.

- 데이터분석을 통해 어떤 가치를 창출할 수 있는가가 핵심이다.

- 공고의 조건에는 '경력/학력 무관'이라고는 하지만 실제로는 경력과 경험을 중요하게 본다.


 위와 같은 것을 알 수 있었습니다. 다음에는 전체 공고에서 어떤 중심 주제들이 있는지를 네트워크가 아닌 토픽 모델링 방식으로 살펴보겠습니다.

작가의 이전글 데이터분석으로 취업할 수 있을까?
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari