brunch

You can make anything
by writing

C.S.Lewis

by peter Jun 29. 2021

인공지능 V4 분석기술 어떻게 이용되고 있나.

실제 기업에선 인공지능이 어떻게 사용될까? 기업을 통해 인사이트 얻기

요즘 스타트업 하면 생각하는 단어가 인공지능 일정도로 AI(인공지능)을 서비스에 적용하지 않는 기업을 찾기 힘들다. 사실 진짜 AI 기술이 들어가 있지 않더라도 AI 스럽게 꾸미는 경우도 많이 보았다. 지원사업에 선정되고 투자를 받기 위해 기술적 어필이 필요하다 보니 자연스러운 일인 것 같다. 아마 이 글을 읽는 사람들 중에서는 최신 기술 동향과 기업들이 어떻게 기술을 활용하고 있는지를 보고 인사이트를 얻는 나 같은 사람들도 있을 것이다. 그래서 최근에 분석하고 있는 기술 중 하나인 V4 분석 기술을 정리해봤다.  



인공지능의 V4 분석기술이 뭘까? 


V4 분석기술이란 Visual (표정 분석 기술), Voice(음성 분석 기술), Verbal(언어 분석 기술), Vital(안면 분석 기술)로 이루어진다. Visual(표정 분석 기술)은 표정 변화, 감정 표현, 안구 움직임, 얼굴 움직임을 분석한다. Voice(음성 분석 기술)는 음색, 음높이, 크기 변화, 속도, 휴지 변화, 발음을 분석한다. Verbal(언어 분석 기술)은 STT(음성 인식) 기술을 통해 단어의 의미를 파악하고 어휘 사용 횟수를 파악하는 것을 얘기한다. 



세부 기술별 동향과 기업에선 어떻게 활용하고 있을까?


◦ (Visual_표정 분석 기술 동향) 

표정 분석 기술은 영상 정보를 인식하고 처리할 수 있는 기술을 말한다. 인간의 시각 기능을 모방하여 표정 변화부터 감정 표현, 안구 움직임, 얼굴 움직임 등을 포착해 영상의 특징을 분석한다. 이를 기반으로 정신 진로, 자살 예방 등 다양한 산업에서 활용되고 있다. 예를 들어 인공지능 AI면접 시장에서는 국내를 기준으로 인에어 설루션이 기쁨, 슬픔, 분노, 역겨움, 두려움, 긴장의 6가지 항목으로 지원자의 감정을 파악하고 있으며, 뷰인터 HR은 화, 공포, 혐오, 즐거움, 슬픔, 놀람, 무표정의 7가지 키워드로 이를 분석하고 있다. 이 설루션들은 시선 처리와 머리의 움직임도 함께 측정하기 때문에 시선이 여러 곳으로 분산되지 않고 머리의 움직임도 큰 변화 없이 안정적일 때 평가에 도움이 된다. 



◦ (Voice_음성 분석 기술 동향

음성 분석 기술은 사람의 음성 정보를 인식할 수 있는 기술로 음색, 음높이, 크기 변화, 속도 , 휴지 변화, 발음 등을 분석한다. 발음, 일정한 음성 높낮이와 크기 등이 평가 요소로 작용한다.      

 

(음성인식 기술이란) 음성인식기는 크게 언어 모델과 음향 모델이라는 2가지의 중요한 지식원을 사용해 음성 신호로부터 문자 정보를 출력하게 되는데, 이때 개념적으로 음성 신호를 문자 심벌로 해석한다는 차원에서 음성인식 알고리즘을 디코더라고 부른다. 현재 일반적으로 사용되는 음향 모델은 우리말의 ‘ㄱ’,‘ㄴ’,‘ㄷ’ ,‘ㅏ’,‘ㅑ’,‘ㅓ’등의 소리 단위를 딥러닝 기술로 학습해서 지식화해 노호 디코더에서 사용한다. 언어 모델은 단어나 어휘적 쓰임새를 학습해 지식으로 가지고 있다.      

 

(음성인식 기술 연구 동향) 종래의 음성인식 기술은 아나운서가 국어책을 읽듯이 발성하는 음성을 대상으로 하는 낭독체 음성인식 기술이 주로 연구 대상이었으나, 딥러닝 및 잡음처리 기술의 발전으로 인해 현재는 사람 간의 자연스러운 대화 음성을 대상으로 기술 고도화가 이루어지고 있다. 최근에는 사람이 음성을 인지하는 방식을 모방하여 기술화하고 있으며, 현재 사람 두뇌를 모방한 물리적인 프로세서 중 가장 앞선 기술로는 IBM의 TrueNorth를 들 수 있다. 하지만 여전히 100만 개의 뉴런을 동원해서 5개 정도의 패턴을 80%를 상회하는 인식 정확도로 인지가 가능하다.      



◦ (Verbal _ 언어 분석 기술 동향) 

언어 분석 기술은 사람의 특정 응답 내용을 분석하는 기술이다. 기본적으로 STT(Speech to Text) 기술로 단어 의미와 어휘 사용량 등을 파악하는 기술을 얘기한다. 이때 단어의 의미나 사용량 등을 분석하는 언어처리 기술이 바로 자연어 처리 기술이다.       


 (언어 분석 기술 효과) 최근 구어체 언어분석 기술은 사람의 대화 분석 오류를 최대 41%로 개선했다. ETRI가 개발한 엑소브레인은 현재 한컴오피스에 탑재되는 등 이미 상용화되고 있다. 현재까지 공개된 API는 형태소 분석과 개체명 인식 기술이 각각 96.8%, 89.4 % 의 높은 정확도를 보이고 있다. 



◦ (Vital _ 안면 분석 기술)  

생리적 데이터를 측정하는 기술로 영상 정보 처리 기술을 응용해 얼굴 근육과 색상의 미세한 변화를 탐지해 맥박 정보를 측정해낸다. 이를 통해 지원자의 정서와 감정 변화를 확인하고 답변의 신뢰도를 평가하는데 활용할 수 있다.      


(안면 분석 기술의 범위) 안면 인식 기술은 생체 인식 과학을 이용한 기술로 눈, 눈썹, 코, 입, 턱, 귀의 위치를 포함한 얼굴의 다양한 특성을 감지하고 측정할 수 있다. 



참고자료 

1) 김선희 고려대학교 연구교수, (2020), 인공 감성지능 기술 동향 및 산업 분야별 적용사례, ITFIND 기획시리즈 

2) 전창의., 이효정., & 김기범 , (2020), 음성 AI 시장의 동향과 비즈니스 기회. 삼정 KPMG ISSUE MONTOR  

3) 딥러닝 기반의 음성인식 기술 (2021) 컴퓨터월드 3월호 

4) 코로나 블루와 음성 기반 감정분석 (감정 인식) 기술의 동향 (2021) VoiceCream 

5) 유승의., (2021), 인공지능과 자연어 처리 기술 동향, 주간 기술동향

6) 안면 인식 시장 (2021), 글로벌 시장 동향 보고서

7) 이환우., 이새롬.,&정경철., 채용 전형에서 인공지능 기술 도입이 입사 지원 의도에 미치는 영향, 한국 정보시스템학회

 8) Elmira van., Anastasia.,& Marleen., (2019), Hirring Algorithms: An Ethnography of Fairness in Practice , ICIS

작가의 이전글 메타버스가 지배하는 세상
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari