2020 현재, 전세계 인공지능 관련 인력의 지형도
엘리먼트 AI는 매년 전세계 인공지능 관련 인력의 분포 변화를 포함한 주요 이슈를 조사하여 보고서를 발간하고 있습니다. 올해도 'Global AI Talent Report 2020'라는 이름으로 인공지능과 관련한 다양한 Skillset의 인력들이 어디서 어떻게 증가하고 있는지, 그 분포는 어떻게 변화하고 있는지 등 인공지능 업계에 관심을 가지고 계신 여러분들이 살펴보실 만한, 그리고 시사점을 제공할 수 있는 보고서를 발표하였습니다. 전체 보고서는 여기서 살펴보실 수 있고, 보고서의 하이라이트 및 개인적인 의견을 중심으로 브런치에 글을 적어봅니다.
먼저, 보고서의 하이라이트를 읽으시기 전에 이 보고서에서 언급할 인공지능 시스템의 개발에 필요한 핵심적인 '역할'에 어떤 것들이 있는지에 대한 정리가 필요합니다.
국가마다, 회사마다 인공지능, 특히 딥러닝 영역의 연구 결과를 실제 기업 현장의 어플리케이션으로 만들고 운영하는데 필요한 역할에 대해 조금씩 다른 뉘앙스로 기술하고는 있지만, 저희 Element AI에서는 대략적으로 아래와 같은 5가지의 역할들이 인공지능 제품 및 서비스를 개발하는 Value Chain을 커버한다고 보고 있습니다:
Research
AI/ML Engineering
Data Engineering/Architecture
AI/ML Productization
Supporting Staff
Research
지금 이 시간에도 딥러닝을 포함한 인공지능 연구의 최전선에서 원천 기술의 개발에 매진하고 있는 수많은 연구자들이 있을 것입니다. 서로 다른 기관에 속해 있는 인공지능 연구자들이라 하더라도, 자유롭고 개방적인 협업을 통해 활발하게 연구 아젠다를 설정하고 새로운 기술과 방법들을 개발하고 있습니다.
인공지능 연구는 전통적인 방식의 저서 출간이나 NeurIPS, ICML 등 대형 컨퍼런스를 통해 그 내용의 면밀한 검토를 거쳐 널리 알려지기도 하지만, 연구 논문을 빠르게 공개할 수 있는 저장소인 아카이브 (arXiv) 덕분에 그 진전이 신속하게 이루어지기도 합니다.
인공지능이 학계를 떠나 하나의 산업으로 자리 잡게 되면서 다른 여러 가지 특수한 역할들이 나타나는 것은 자연스러운 일이지만, '연구자'의 역할은 여전히 강조되어야 할 중요한 역할입니다. 좋은 연구자를 길러내기 위한 투자를 게을리한다면, 이렇게 빠르게 진화하는 인공지능 영역에서 장기적으로 기업이 선도자로서의 위치를 유지할 수 있도록 해 주는 최첨단의 기술을 확보할 수 없을 것입니다. 뿐만 아니라, 꽤 많은 원천기술 연구자들이 응용 연구자로서의 역할을 수행하기 위한 훌륭한 경험이나 Skillset을 가지고 있기도 해서, 'Research'라는 역할은 인공지능 관련 인력 검토 시 핵심적인 출발점이 됩니다.
이 역할에 해당하는 사람들은, 많은 경우 머신러닝, 컴퓨터 사이언스, 인공지능 또는 관련된 학문 영역의 박사 학위 (PhD) 소지자이며 수년간의 연구 경력과 프로그램 개발 경험을 보유하고 있습니다.
AI/ML Engineering
'AI/ML Engineer (인공지능 및 머신러닝 엔지니어)'는 '원천기술'과 실제 환경에서 사용될 '어플리케이션'을 잇는 매우 중요한 다리 역할을 수행합니다. AI/ML Engineer가 여타 다른 소프트웨어 엔지니어와 크게 다른 점이 있다면, 바로 이들은 '데이터를 가지고 코딩을 한다'는 점일 것입니다. 이들이 수행하는 작업의 상당 부분이 비즈니스 환경의 데이터셋을 가지고 최신의 인공지능 모델을 훈련시켜서 특정한 문제 해결에 활용하는 것입니다.
이 역할을 가진 사람들은 때로는 AI/ML Engineer가 아니라 'Applied Research Scientist', 'Data Scientist'라고 불리기도 합니다. 뛰어난 AI/ML Engineer는 오랜 기간 갈고닦아 온 기술적 전문성, 과학적 열정과 창의성을 실제 현장의 문제 해결에 적용하게 되는데, 이 과정에서 확장 가능한 (Scalable) 솔루션을 만들기 위한 적절한 기술 셋을 찾아내거나 연구하는 동시에, 사용자의 니즈를 이해해야 합니다.
AI/ML Engineer들은 인공지능 기술의 '적용' 방법과 관련된 새로운 발견 내용을 arXiv와 같은 공개 저장소에 제출함으로써 인공지능 연구를 위한 협업에 기여하는 핵심 역할을 담당합니다. 이런 이유로, arXiv를 기반으로 한 인공지능 관련 인력의 현황 조사에 'Researcher'와 'AI/ML Engineer'가 주요하게 드러나게 됩니다. 이 두 가지 역할의 경계가 아주 명확하게 구분되지는 않지만, 인공지능 기술을 실제 환경에 확장 가능하게 (Scalable) 적용하는 것이 상당히 도전적인 어려운 문제라는 인식이 점차 일반화되면서, AI/ML Engineer의 역할이 점점 중요해지고 있습니다. 또, arXiv에 제출되는 논문의 수가 2020년 말 기준 86,000건에 이를 것으로 예상되는데, Engineering 역할을 하고 있다고 말하는 사람들의 수는 150,500명으로 훨씬 많다는 점도 특기할 만합니다.
(다른 많은 경우와 마찬가지로) 인공지능 영역에서도 소셜 미디어의 이력 정보나 구인 정보 등은 잡 마켓의 현황을 살펴볼 수 있는 좋은 원천 자료가 됩니다. 이런 곳들에 특히 데이터 사이언티스트나 AI 개발자에 대한 수요가 매우 강하게 드러나기 때문에, 구직을 한 연구자가 정확히는 Research 역할만이 아닌 광범위한 역할을 요구받는 포지션에서 일하게 되는 경우도 많이 보게 됩니다.
이 역할에 해당하는 사람들은, 컴퓨터 사이언스, 수학, OR (Operations Research), 물리학, 전기공학 등 다양한 이공계 학문에서 석사 또는 박사 학위를 가지고 있는 경우가 많고, 학업 또는 직업적 이력을 통해서 딥러닝 및 관련 인공지능 영역의 다양한 이론을 이해하고 있는 사람들입니다. R, 파이썬, MATLAB, 판다스 등의 통계 소프트웨어를 능숙하게 다루고, (때로는 노이즈가 많은) 기업 현장의 데이터를 정리하고 활용하여 적절한 인공지능 모델을 선택, 훈련하고, 데이터의 한계 등을 해결하기 위해서 인공지능 모델을 변경, 수정할 수 있는 기술과 경험을 보유하고 있습니다.
Data Engineering/Architecture
데이터 사이언티스트들이 데이터로 코딩을 하도록 하려면, 실제 데이터의 흐름을 만들어서 확장성 있게 인공지능 모델을 훈련할 수 있도록 하는 작업이 반드시 필요합니다. 'Data Engineer'와 'Data Architect'는 바로 이렇게 인공지능 모델을 만들어내는 데 사용되는 수 기가바이트, 수 테라바이트의 산업용 데이터를 저장하고 이동시키는 현대적인 데이터베이스 구조를 구축합니다. 이들은 최적의 데이터 파이프라인 아키텍처를 구축, 시험, 유지 보수하면서 이 아키텍처가 시스템의 비즈니스 요구사항을 지원할 수 있도록 합니다. 더불어, 데이터의 구조화나 표준화, 버전 관리, 그리고 내외부 조직의 컴플라이언스 기준을 준수하기 위한 베스트 프랙티스를 만들고 유지할 책임을 지게 됩니다.
이 역할을 맡은 사람들이 맞닥뜨리게 될 힘든 점들 중 하나라면, 아마도 기업에 있는 '데이터' 그 자체를 정비하여 원 데이터 (Raw Data)를 또 다른 형태로 전환하거나 매핑하는 작업 - 데이터 랭글링 (Data Wrangling) - 일 것입니다. 인공지능 시장조사기관인 Cognilytica에 따르면, 데이터 클렌징 (Data Cleansing), 레이블링 (Labeling), 그리고 어그멘테이션 (Augmentation) 등의 작업에 일반적인 머신러닝 프로젝트에 투입되는 시간 중 65%가 소요된다고 합니다. 물론 이 데이터 준비 작업은 데이터 엔지니어가 일부 작업을 자동화하는 등의 방법을 통해 효율화할 여지가 있지만, 많은 경우, 특히 새로운 영역의 인공지능 어플리케이션을 개발하는 경우라면 데이터 랭글링 작업에 일정 수준의 전문적 인력이 투입되어야 합니다. 인공지능 시스템은 'Garbage In - Garbage Out'의 원칙 - 데이터를 잘 정리하여 모델을 트레이닝하지 않으면 유효한 시스템이 만들어지지 않는다는 뜻 - 을 충실히 따르는 시스템이므로, 이런 역할의 중요성을 과소평가해서는 안 될 것입니다.
이 역할에 해당하는 사람들은 주로 대학에서의 컴퓨터 사이언스나 여타 IT 영역의 학사 과정을 밟고, Spartk, Kafka, Pulsar, Cassandra, Hadoop, NoSQL 또는 각종 관계형 데이터베이스들을 잘 다룰 수 있는 전문성과 경험을 가지고 있는 분들입니다. 무엇보다 중요한 것은, '능숙하게 데이터를 변환하기 위한 각종 테크닉과 실 환경에서의 강건한 데이터 파이프라인 구축 및 지원', '다양한 소프트웨어 설계 패턴에 대응하기 위한 데이터 아키텍처 설계 및 최적화', '주요 클라우드 플랫폼 상에서의 고품질, 대규모 데이터 운용' 등을 할 수 있는 경험을 보유하고 있느냐 하는 것입니다.
AI/ML Productization
실제로 인공지능 기술을 핵심 요소로 한 제품이나 서비스를 만들기 위해서는 인공지능 기술에 대한 전문성과 기술뿐 아니라 상당히 깊은 수준의 전통적 소프트웨어 관련 경험과 지식, 그리고 최종 사용자의 환경과 맥락에 대한 심도 있는 이해가 필요합니다. 이 'AI/ML Productization' 영역의 역할을 다시 두 가지로 나누어 보았는데, 하나는 '실현 가능한 솔루션을 찾아내고 평가하는' 역할, 다른 하나는 '실제로 솔루션을 구축하는, 보다 기술적인 작업을 하는 역할'입니다. 점점 AI 솔루션 구축을 지원하는 인프라와 도구가 늘어나면서, 'AI Developer'의 역할은 데이터 애널리스트 (Data Analyst)의 업무 영역으로 수렴하면서 다양한 온라인 교육 프로그램을 통해서 필요한 Skillset을 확보할 수 있게 될 것으로 보입니다.
AI Developer
이 사람들은 인공지능 기술을 실제 현장에서 완전하게 작동하는 제품으로 탈바꿈시키기 위한 소프트웨어 환경을 만들어내는 핵심적 역할을 하게 됩니다. 이들은 모델의 정교화, 아키텍처, 설계, 개발, 테스트, 배치, 운영, 유지보수 및 개선 등 인공지능 기술을 제품화하는 전반적인 과정에 개입하고, 특히 주어진 특정한 문제를 인공지능 기술로 해결할 때 필요한 기술 플랫폼, 프레임워크 및 배치 아키텍처를 평가하고 선택하는 작업 및 실 환경에서 인공지능 모델을 관리하는 작업을 지원해야 합니다. 이 역할이 확대된다면 사용자 친화적이고 확장 가능한 API를 설계, 구축, 운영하는 업무, 그리고 심지어 UX (User Experience)와 인터페이스 작업을 지원하게 될 수도 있습니다.
많은 경우 이 역할을 하는 분들은 컴퓨터 사이언스를 전공했거나 그와 상응하는 수준의 Web GUI 프레임워크 및 몇 가지 프로그래밍 언어에 대한 높은 수준의 지식과 경험을 가지고 있는 분들인데, 대규모 개발 프로젝트 - 마이크로 서비스 기반의 솔루션이라면 더 좋겠죠 - 에 참여한 최소 5년 정도의 경력, 그리고 컨테이너 기반의 배치 및 자동화 도구에 대한 적절한 수준의 지식과 경험이 있다면 좋을 것입니다.
Data Analyst
'Data Analyst'는 풀어야 할 비즈니스 문제와 데이터셋을 분석, 이해하고, 솔루션을 설계하기 위한 최적의 접근 방법을 평가, 선정하는 핵심 역할을 수행합니다. 최종 사용자가 처한 업무 환경을 이해하는 것과 더불어, 데이터 분포를 검증하고 데이터와 관련된 이슈나 간극을 찾아내며, 레이블링이 잘 되어 있는지, 데이터의 수집과 변환 및 관련 분석 작업이 잘 구조화되어 있는지 평가하는 등 '솔루션의 실현 가능성'을 효과적으로 판단함으로써, 기술팀에게 이런 내용을 잘 전달하여 시스템을 구축할 수 있게 하거나 또는 업무팀에서 이슈를 해결하도록 할 수 있는 기술적인 배경 지식과 경험, 커뮤니케이션 역량이 필요한 역할입니다.
이 업무를 하는 분들에게 특별한 학위가 요구되는 것은 아니지만, 데이터 분석 및 머신러닝 프로젝트에 관련된 프로그래밍, 데이터 시각화, 통계 및 데이터 조작 도구들 (예를 들어, scikit-learn, pandas DataFrame, NumPy, R, awk, RapidMiner, Tableau, D3.js)을 수월하게 활용할 수 있는 지식, 각종 정형 및 비정형 데이터의 분석 및 처리 경험, 그리고 통계적 및 머신러닝 방법론에 대한 이해를 바탕으로 인공지능 모델을 작동시키고 벤치마킹할 수 있는 전반적인 능력이 필요합니다.
Supporting Staff
컨설턴트, 솔루션 디자이너, 그리고 인공지능 기술에 익숙한 각종 업무 담당자 - 또는 도메인 전문가 - 들 모두 인공지능 기술의 도입에 있어서 중요한 역할로서, 인공지능 기술의 특성에 대한 이해가 필요한 역할들입니다. 다만, 이 그룹이 인공지능의 기술적인 측면에 대한 역량을 필요로 하는 역할은 아니고 상대적으로 빠른 시간에 기존 인력에 대한 교육과 핸즈온 경험을 통해 확충할 수 있기 때문에, 본 보고서에서 이 그룹에 대해 깊이 다루지는 않았습니다. 그렇지만, 다시 한번 강조하건대 인공지능 기술을 도입할 때 그 가치를 충분히 발현하는 데 있어서는 이 그룹의 역할이 다른 역할들 못지않게 중요합니다. 시간이 많이 흘러 인공지능 기술 자체가 지금보다 상당한 수준 Commodity화 된다면, 이 그룹의 역할이 조직을 변화시키면서 인공지능 기술의 가치를 빠르게 실현하는데 매우 큰 역할을 수행하게 되겠고, 그 과정에서 다양한 업무 및 기술에 대한 재교육이 광범위하게 실시되어야 할 것입니다.
본 보고서의 작성에 있어서, 인공지능 솔루션 개발 Value Chain의 다양한 역할을 수행할 인력의 규모와 분포를 파악하기 위해 다양한 소셜 미디어 (예를 들어, 페이스북, 링크드인)의 프로파일 및 잡 포스팅 등 자료를 주요 소스로 활용하였습니다. 그리고 Research를 넘어 AI/ML Engineer, AI/ML Productization 등 확대된 역할을 담당할 수 있는 인력의 변화를 확인하기 위해 대형 컨퍼런스에 발표된 논문 뿐 아니라 아카이브 (arXiv)의 AI/ML 관련 저장소 (cs.AI, cs.LG, stat.ML 등)를 참고하였습니다.
따라서, 최근 몇 년간 한국의 링크드인 액티브 유저가 빠르게 늘어서 2020년 현재 200만 명 이상은 되어 보이지만, 여전히 타 국가 대비 낮은 가입자 수와 활용도 - 특히 IT 영역의 경우 - 를 보이고 있다는 점, 한국 연구자나 개발자 등이 상대적으로 arXiv에 많은 논문을 제출하고 있지는 않다는 점 등을 염두에 두시고, 보고서의 메시지를 전세계적인 관점에서의 추세와 향후 고려할 시사점을 얻는다는 생각으로 이해하시는 것이 바람직하겠습니다.
널리 알려진 국제적인 주간지 'The Economist' 2020년 6월 11일판에 "After years of hype, many people feel AI has failed to deliver (수년간의 하이프가 지난 후에, 많은 사람들은 인공지능이 약속했던 성과를 만들어내는 데는 실패하였다고 느끼고 있다)"는 부제의 Technology Quarterly 기사가 실렸습니다.
해당 기사에서는 1) 필요한 데이터의 충분한 확보와 접근이 어렵다는 문제, 그리고 2) 인공지능 알고리즘의 수준이 아직 기대보다는 그리 (범용적으로) 똑똑하지 않다는 문제, 이 두 가지를 핵심적 이슈로 제시하고 있는데요. 워낙에 수많은 미디어에 노출되어 온 인공지능, 머신러닝 기술에 대한 이미지가 마치 적절한 데이터만 있다면 마법이라도 부릴 수 있을 듯하게 보여 왔기 때문에 그리 놀랄 일도 아닙니다.
그렇지만, 현재 우리가 손에 넣을 수 있는 데이터와 만들 수 있는 알고리즘으로도 달성할 수 있는 매우 큰 잠재력이 여전히 있기 때문에 - 또 다른 희소한 자원, 즉 인력만 있다면 -, 위 주간지의 글에서 지적한 '두 가지 문제에 따른 인공지능의 실패'는 부분적인 진실만을 드러내고 있다고 해야 할 것입니다.
저희 엘리먼트 AI가 작년 2019년 발간했던 보고서에서는 AI Researcher (인공지능 연구자) - 주어진 데이터셋으로 문제를 해결할 인공지능 알고리즘을 만들고 개선하는 역할을 담당하는 사람들 - 에 집중했었습니다. 어쩌면 널리 퍼진 이러한 관점 때문에 '연구자'라는 역할이 인공지능을 도입하고 확산하는데 필요한 전부인 양 잘못 인식되었을지도 모르겠네요.
실제로는, 인공지능 기술 연구의 결과를 실제 산업과 생활에 영향을 주는 제품, 서비스로 연결하는 작업은, 다양한 Skillset과 경험을 가진 그룹이 함께 참여해야 하는 매우 긴 Value Chain입니다. 물론 여러 가지 Skillset 중 일부는 아주 희소하기 때문에, 필요한 역할들 중 하나가 아니라 여러 가지를 수행할 수 있는 사람들이 꽤 있습니다. 그렇지만, 인공지능 솔루션을 구축하고 운영하는데 무엇이 필요한지 더 잘 이해한다는 관점에서, 이 역할들을 잘 구분하고 탐색하는 것, 그리고 이 역할들이 어느 정도 육성되고 있는지 등을 살펴보는 것은 그 자체로 의미가 있다 하겠습니다.
arXiv에 인공지능 관련 논문을 제출하는 연구자, 저자들의 숫자는 지난 2007년 이후 매년 52.7% 정도씩 증가해 왔습니다. 지난해에는 그 숫자가 58,000명에 달했고 2020년 올해 말에는 86,000명에 도달하리라 예상합니다. 앞서 살펴본, 인공지능 솔루션을 개발하고 운영하는데 필요한 5가지 역할 전반에 걸쳐서는 전세계적으로 약 478,000명 정도의 인력이 있는 것으로 판단됩니다.
국가별 인력 규모의 순위가 아래 두 개 그래프에 나타나 있는데, 이 그래프가 만들어진 방법론에 대해서는 주의를 기울일 필요가 있습니다: 회사 또는 학교 등, 어떤 연구자 또는 개발자가 속한 조직이 있을 때, 해당 조직의 본사 (Headquarter)가 위치한 국가를 기준으로 인력의 숫자를 산정하였습니다. 이는 특히 해당 연구자나 개발자가 만들어 낼 지적재산권 (IP: Intellectual Property)이 어느 국가에 속할 것인가에 대해서 유의미한 관찰을 할 수 있게 해 줄 것입니다. 그러나, 이런 추산 방식이 미국과 같이 '(구글, 아마존 등) 매우 큰 인공지능 연구조직을 전세계 여러 곳에 가지고 있는 거대한 IT 기업이 많은' 나라에 아무래도 더 큰 비중을 부여하도록 할 수 있다는 점은 염두에 두어야 합니다.
미국이 특히 실리콘 밸리의 생태계를 중심으로 인공지능 시스템 개발을 위한 인력의 수요, 공급 관점에서 가장 큰 규모를 형성하고 있지만, 많은 기업들이 'Cost of Production'을 최적화하는 관점에서 다른 지역과 해외의 인공지능 Hub로 생태계를 확장하고 있다는 점은 별도로 주목할 만합니다.
수집한 데이터를 가지고 몇 가지 정량적인 분석과 관찰을 통해서 아래와 같은 시사점을 도출할 수 있습니다.
인공지능 인력은 (최소한 코로나-19 판데믹 이전까지는) 전세계적으로 성장하면서 여러 국가로 확산 중
최소한 인공지능 연구자 그룹과 관련해서는, Talent Pool이 전세계적으로 성장 추세에 있다는 것을 확인할 수 있습니다. 서로 다른 국가의 연구자가 공동으로 연구하는 경우도 늘어나고 있는데, 다만 아직 인공지능 관련 생태계가 태동기에 있는 남반구의 경우는 아직까지는 예외라고 하겠습니다. 아일랜드의 경우 인공지능 연구자 당 논문 작성 시 글로벌 협업을 하는 경우가 평균 15건에 달하는데, 이는 전세계적인 평균이 4 ~ 6건 수준인 점을 고려할 때 매우 높은 수준입니다.
연구자들이 국가 간 어느 정도 '이동'하는가 하는 것은, 원격 및 재택근무가 광범위하게 확산되는 코로나-19 이후의 시대에는 뒤떨어진 지표일 수도 있지만, 여전히 어떤 국가가 연구자들을 더 유인하고 어떤 국가가 더 많은 연구자들을 다른 나라에 공급하고 있는지, 또 어떤 나라가 비교적 타 국가들과 고립된 상태에서 인공지능 생태계를 키우고 있는지 등을 확인해 볼 수 있는 방법이 됩니다. 물론, 짐작하시다시피 다른 어떤 나라보다도 미국이 가장 많은 인공지능 연구자들을 끌어들이는 나라인데, 최근 몇 년 간의 미국 정부의 비자 관련 정책 때문에 인접 국가 등에 인공지능 연구자들을 유치할 수 있는 기회가 만들어지고 있습니다. 다만, 이런 흐름도 미국에 본사를 두고 있는 초대형 IT 기업의 '해외 연구소'를 중심으로 한 인공지능 연구자 고용이 증가하면서, 실질적으로 타 기업의 유치 기회가 그리 크다고 보기는 힘들다 하겠습니다.
인공지능 연구 커뮤니티의 성비 불균형은 아직 크게 개선되지 않은 상태임
아카이브 (arXiv)에 제출되는 논문을 기준으로 볼 때, 오히려 컨퍼런스에서 확인할 수 있는 것보다도 더 인공지능 연구자 성비의 불균형이 심한 상태이고, 그런 상황은 2007년 이후 크게 바뀌지 않았습니다 (2007년에는 여성 연구자의 논문 비중이 12%였고, 2019년은 15% 수준일 것으로 예상됨). 물론 이 연구자의 '성비'는 조사 대상 국가마다 큰 차이가 있습니다만, 코로나-19 판데믹 상황이 여성 연구자의 (활동) 확대를 방해하고 있다는 것만은 틀림없어 보입니다.
'산업 (Industry)'에 종사하는 경우 Full-time으로 원천기술을 연구하는 연구자는 거의 없음
링크드인 등 구인, 구직과 밀접하게 관련된 소셜미디어를 잘 살펴보면, 산업(Industry; 학계나 연구소가 아니라 기업에 종사함을 의미)에 종사하는 전문 연구자 (Professional Researcher)로 본인을 설명하는 연구자가 약 4,100명 정도 있는데, 이들이 수행하는 실제 업무의 상당 부분은 엔지니어링을 포함한 기타 역할로서, 연구자로서의 업무는 제한되어 있다고 판단됩니다. 엘리먼트 AI 연구자들의 경우에도 비슷한 패턴이 나타납니다.
구인을 위한 포스팅을 분석해 보면, 역시 전체 포스팅 중 1.7% 정도만이 '순수 연구자'를 찾는 것으로 나타나, '산업'에서 요구하는 인력들 중 순수 연구자의 비중은 그리 크지 않은 것이 확인됩니다. 어찌 보면 이는 당연한 것이기도 합니다. 인공지능 관련 학과를 졸업하는 학생들의 규모, 대학 및 연구소로부터 산업계로의 취업 기록, 그리고 연구자들의 평균적 논문 작성 및 출간 타임라인 등을 생각해 본다면, 산업계가 인공지능 원천기술 연구에 끼치는 영향의 규모가 어느 정도인지 가늠할 수 있을 것입니다.
새로운 역할에 대한 수요는 꾸준히 증가 추세이나, 2020년에는 코로나-19의 영향으로 크게 감소
아쉽게도 인공지능 시스템 개발과 관련된 수요를 확인하기 위한 데이터는 찾기가 어렵지만, 구인 포스팅의 흐름을 중심으로 인사이트를 얻을 수는 있습니다 (다른 보고서에 따르면, 지난 4년간 인공지능 인력에 대한 수요가 매년 70% 이상 증가했다고 합니다). 우리가 발견한 것은, 수요와 공급에 있어서 위에 제시한 5가지 역할 간의 상대적인 비중이 비슷한 상태로 유지되면서 고르게 증가하고 있다는 점으로, 약 AI/ML 기술을 중심으로 소프트웨어를 개발하는 역할이 61%, 연구 논문이나 오픈소스 등을 바탕으로 AI/ML 컴포넌트와 API 등을 개발하는 역할이 38%, 그리고 원천 기술 연구자의 역할이 1% 정도로 보입니다. 수요의 총숫자를 정확히 알 수는 없지만 2019년에는 매월 각 역할 별 수요가 평균 2% ~ 6% 정도 증가해 왔는데, 2020년에는 코로나-19 판데믹에 따른 기업 활동의 위축으로 인해 수요가 20% ~ 30% 정도 감소하였습니다. 그러나 점진적인 경제 환경의 회복과 함께 수요는 다시 증가세를 보일 것으로 예상합니다.
인공지능 산업이 태동기에서 성장기로 나아갈수록, '연구자'가 아닌 실제 시스템 구축과 활용을 둘러싼 Skillset의 중요도나 수요가 올라가는 것은 너무도 자연스러운 일이라고 생각합니다. 인공지능 기술의 잠재력이 현실화될 가능성이 높아지면서 더 많은 연구자가 생기고, 이는 인공지능 시스템의 Value Chain에서 '연구 및 개발' 요소의 'Cost (비용)'가 낮아지도록 작용합니다. 경제학적인 관점에서 Value Chain 내 한 가지 요소의 비용이 낮아지면, 그 요소를 활용할 주변 요소의 '가치 (Value)'가 자연스럽게 올라가게 되므로, 일종의 '스필오버 (Spillover)' 효과가 인공지능 인력 (Skillset)의 영역에서도 나타나는 것으로 개인적으로는 해석하고 있습니다.
개발도상국가 (Emerging Market)의 인공지능 인력이 본격적으로 증가세에 있음
전세계의 많은 국가들 중에 브라질과 인도가 인공지능 관련 인력이 매우 빠르게 증가하는 핫스팟이 되었습니다. 인식의 차원에서 '원천 기술의 연구'에 아주 큰 비중을 두는 인공지능 학계 및 업계의 특성 때문에, 이 두 나라는 주목을 비교적 덜 받고 있지만, 이들을 포함한 많은 개발도상국에서 인공지능 시스템의 실제 구현을 위한 수요와 공급의 증가세가 뚜렷한 것으로 보입니다. 나이지리아, 에티오피아, 르완다 등 아프리카 지역의 국가들에서도 '인공지능을 기반으로 한 디지털화'라는 새로운 흐름을 만들고자 많은 투자를 하고 있습니다.
인공지능 기술 확산의 성공 여부를 가를 핵심 요소는 역시 '탤런트'
우리가 생각하는 인공지능이 가진 엄청난 잠재력이 궁극적으로 실현될지 아니면 하이프로 끝날 것인지는 또 다른 논의의 주제지만, 인공지능 산업의 성장을 위한 전제 조건이, 오로지 '아주 높은 수준의 전문성을 가진 연구자의 확보' 그리고 '인공지능 모델을 위한 데이터'뿐일 수는 없습니다. 아무래도 인공지능 산업의 초기에는, 새로운 영역에서 새로운 기술을 연구하고 실험할 수 있는 '원천기술 연구자'들에게 초점이 있을 수밖에 없었지만, 이제는, 그리고 앞으로는 이 인공지능이라는 새로운 기술을 성공적으로 도입, 확산하려면 모델을 만들 수 있는 사람들 뿐 아니라 이 기술의 특성과 장점을 극대화하는 제품과 서비스를 기획하고 확장성/생산성 있게 모델을 중심으로 시스템을 개발하고 관리하는 역할이 못지않게 중요하다는 인식이 점차 확대될 것입니다.
인공지능은 현실세계의 데이터와 그 변화에 맞게 적응하는 새로운 세대의 소프트웨어를 가능하게 하는 핵심 기술입니다. 인공지능의 개발 언어는 프로그래밍 언어가 아니라 데이터이며, 따라서 개발뿐 아니라 잘 관리할 수 있도록 지원하는 새로운 생태계와 인프라가 필요합니다. 인공지능을 확장성 있게 개발하고 사용하려면, 이 시스템의 엔지니어링, 인프라 구축, 새로운 비즈니스 모델의 개발, 성과 모니터링과 향상 등을 잘할 수 있는 새로운 탤런트가 필요합니다.
유럽위원회 (European Commission)의 한 최근 조사에 따르면, 많은 기업들이 인공지능을 도입하는데 가장 심각한 걸림돌이 바로 '적절한 Skillset을 가진 인력이나 파트너의 부족'이라고 인식하고 있습니다. 이번 Element AI의 Global AI Talent Report는 기업이 인공지능을 성공적으로 도입, 확산하기 위해 필요한 '다양한', 그리고 '구체적인' 역할들에 대한 첫 번째의 관찰과 조사 결과로써, 앞으로 이러한 인력 Pool의 변화를 이끌어내고 그에 맞는 대응을 하기 위해서 더 많은 연구와 조사가 이루어져야 할 것입니다.
인공지능 시스템을 갖추는데 필요한 핵심적인 몇 가지 역할에 대해서만 언급했지만, 궁극적으로는 인공지능이 열어갈 시대를 살아야 하는 우리 모두가 이 새로운 기술의 정체, 특징과 장단점에 대해 각자 위치한 자리에서 필요한 수준의 이해와 응용, 그리고 협업을 할 수 있도록 준비해야 합니다.
이미 일상생활과 비즈니스에서 사용하는 인공지능 기반의 추천 시스템 등을 통해서 우리는 인공지능 시대에 적응해 나가고 있을 뿐 아니라, 때로는 인공지능 알고리즘이 내놓는 결과물에 영향을 주기 위해 우리의 사고방식과 행동을 바꿔나가고 있는 경우도 보게 됩니다. 그렇지만, 현재 시점에서 우리에게 인공지능 시스템을 진정한 우리의 동반자로서 만들어나가는데 필요한 도구와 방법론, 제도 등은 턱없이 부족한 상태입니다. 인공지능 시스템 개발과 활용의 Value Chain에 걸쳐 다양한 도구와 Skillset들이 점차 표준화되어 간다면, 우리들이 인공지능 기술을 활용할 때의 선택지는 그와 함께 증가할 것이고, 지금까지 우리가 만들어 온 수준을 훨씬 뛰어넘는, 그야말로 인공지능 기반의 진정한 혁신을 가능케 하는 토양이 만들어질 것입니다.
이 목표에 도달하기 위해서, 실험실이나 프로토타입 수준과 실제 세상에 인공지능 기술을 활용하기 위한 환경 사이의 간극 (Gap)을 극복해야 하는 과제가 남아 있습니다. 이 간극을 극복하는데 현재 연구자들과 엔지니어가 큰 역할을 하고 있지만, 이것은 그들의 노력만으로는 불가능한 일입니다. 교육기관, 산업계, 그리고 사회 전체가 인공지능의 올바른 확산을 지원할 수 있는 도구, 정책, 인프라 등의 개발을 본격적으로 추진하고 모든 이해관계자의 논의와 협업을 원활하게 진행할 수 있도록 노력을 아끼지 말아야 할 것입니다.
그리고 산업계의 리더들은, 자신이 속한 조직의 인공지능 비전과 전략에 따라 향후 필요한 역할의 종류와 규모를 구체적으로 판단하고, 자체적으로 또 외부의 파트너와 함께 이 역할과 역량을 키워나갈 계획을 신속하게 수립해야 합니다. 특히 인공지능 기술의 협업은 'Global Collaboration'이 필수라는 점을 인식하고 다른 지역의 인공지능 기술 Hub나 생태계와의 교류 방안을 적극적으로 모색해야 합니다. 그리고 실질적인 비즈니스 효과를 빠르게 만들어내고 확장하기 위해서 인공지능 기술 기반의 엔지니어링, 제품/서비스 개발, 사업화 등을 함께 초기부터 시도할 수 있는 인력과 파트너십을 구축해야 할 것입니다.