brunch

매거진 AI

You can make anything
by writing

C.S.Lewis

딥러닝을 이용한 얼굴 인식

[카카오 개발자 콘퍼런스] 발표: 신종주 / 글: 김동현


if kakao 2018 대학(원)생 기자단의 콘퍼런스 취재 글


01. 지식그래프 : 카카오미니와 검색 적용 소개 (발표: 남기훈 / 글: 김동현)

02. 눈으로 듣는 음악 추천 시스템 (발표: 최규민 / 글: 김태훈)

03. 이미지로 이미지 검색하기 (발표: 이주영 / 글: 이가람)

04. 딥러닝을 활용한 뉴스 메타 태깅 (발표: 김기도 / 글: 김규형)

05. 딥러닝을 이용한 실시간 인코딩 효율 최적화 (발표: 여욱형 / 글: 정소영)

06. 카카오 봇 플랫폼 소개 (발표: 황지수 / 글: 이형남)

07. 카카오가 가지고 있는 음성처리 기술 (발표: 노재근 / 글: 이형남)

08. 딥러닝을 이용한 얼굴 인식 (발표: 신종주 / 글: 김동현)

09. TOROS N2 (발표: 김성진 / 글: 김태훈)

10. 텐서플로로 OCR 개발해보기: 문제점과 문제점과 문제점 (발표: 모종훈·오형석 / 글: 이가람)

11. S2Graph와 GraphQL (발표: 윤도영 / 글: 김규형)

12. AI시대에 맞는 서비스 개발(발표: 이석영 / 글: 정소영)





이번 글에서는 ‘if kakao 2018’에서 열린 콘퍼런스 중, 카카오 멀티미디어처리파트의 신종주 님이 발표한 ‘딥러닝을 이용한 얼굴 인식’ 내용을 소개하고자 한다. 



딥러닝으로 얼굴을 인식한다는 것은?


우선 AI가 ‘얼굴을 인식한다’는 것이 무엇을 의미하는지에 대해 명확하게 이해할 필요가 있다. ‘얼굴 인식’이란 ‘사람의 사진을 보여주면, 데이터베이스 속 사진들과 비교하여 이 사람이 누구인지 맞추는 것(이름 등)’으로 이해될 수 있다. 사실 해당 콘퍼런스의 내용을 듣기 전에는 ‘얼굴 인식’을 이보다 더 장황한 것으로 생각하고 있었다. AI가 사람의 표정을 살피고 그 속의 감정을 알아내는 것이 아닐까라고 상상했던 것이다. 이와 달리 본 콘퍼런스에서 ‘얼굴 인식’은 앞서 밝힌 것처럼 특정 사진 속 인물이 누구인지 알려주는 것을 의미한다.  



왜 얼굴 인식이 필요할까?


AI가 사람의 얼굴을 알아 본다니 흥미롭긴 한데, 도대체 이런 기술이 왜 필요한 것일까?  이에 대한 설명을 위해 먼저 AI가 어떤 과정을 거쳐 사람의 얼굴을 인식하는 것인지 기술적인 부분을 소개하고자 한다. 



얼굴 인식의 과정


[ 그림 1 ] 얼굴 인식 과정


AI는 어떤 과정을 거쳐 사람의 얼굴을 인식하게 되는 것일까. 위 [그림 1]에서 볼 수 있듯이 4단계를 거쳐 얼굴을 인식하게 되는데 각 단계를 간략히 설명하자면 다음과 같다. 


1) 검출(detection) : 주어진 사진에서, ‘얼굴’에 해당하는 부분을 찾아 표시하는 것이다. 얼굴이 아닌 목이나 팔을 얼굴로 인식하거나, 전혀 생뚱 맞은 컴퓨터 모니터를 보고 ‘아 얼굴 찾았다!’ 라고 한다면 곤란할 것이다. 따라서 인식의 대상인 얼굴을 사각형의 테두리로 표시하는 것이 첫번째 단계이다. 

2) 정렬(alignment) : 앞서 표시된 얼굴에서 눈, 코, 입, 귀, 턱 등 주요한 특징 부위들을 표시하는 단계이다. 이는 다음 단계에서 얼굴의 각도 등을 조정하기 위한 준비라고 볼 수 있다.

3) 표준화(normalization) : 사진에서 얼굴이 비스듬히 돌아가 있는 경우, 이를 수직의 상태로 돌리는 과정이다. 이는 동일한 인물의 얼굴이더라도, 비스듬한 얼굴과 똑바른 얼굴을 AI가 다른 얼굴로 인식할 수 있기 때문에 표준화 시키는 과정으로 볼 수 있다. 이 과정이 완료되면, 이제 해당 얼굴은 분석이 가능한 표준화된 상태라고 볼 수 있다.  

4) 인식(recognition) : 이 단계에서는 앞서 표준화된 얼굴 사진을 DB 속 얼굴 사진과 비교하여 ‘이 얼굴은 아이유의 얼굴이다!’라는 판단을 하게 된다. 해당 콘퍼런스에서는 주로 이 인식 단계에서 어떠한 기술과 데이터베이스 등을 활용하고 있고, 그 성능이 현재 어느 수준인지 설명하는데 초점이 맞추어 졌다. 



얼굴 인식의 분류


[ 그림 2 ] 얼굴 인식의 분류: Identification vs. Verification


앞서 살핀 인식 단계에서 얼굴을 인식하는 기술을 두 가지로 분류해 볼 수 있다. 첫 째는 ‘식별(identification)’이다. 인식 단계로 전달된 얼굴을 데이터베이스 속 사진들과 비교하여, 누구의 얼굴에 제일 가까운지 알려주는 것이다.  갤러리에 인물이 많아지면 성능이 떨어진다. 또 비교해야 할 인물이 많아지면 구분하기가 쉽지 않아 진다. 


다음으로 ‘검증(verification)’이 있다. 검증은 두 얼굴이 주어졌을 때, 이 얼굴들이 같은 사람의 얼굴인지, 다른 사람의 얼굴인지 구분해 내는 것이다. 글의 서론에 언급한 박보검과 필자의 얼굴 구분이 이 검증에 해당한다. 검증의 정확도는 대표적으로 TAR@FAR=0.001이라는 척도로 평가되는데, 간략히 말하자면 검증의 성능, 정확도가 몇 % 정도인지를 나타내는 척도라고 볼 수 있다. 



AI는 얼마나 인식을 잘할까? 

  

그렇다면 현재 AI의 얼굴 인식 정확도는 얼마나 될까? 사람의 경우 얼굴 인식에서 97.53%의 정확도를 보인다고 한다. 반면, 현재 AI는 약 99.8% 가량의 얼굴 인식 성능을 보이며, 이는 과거 80%보다 훨씬 더 발전된 수치이다. 이처럼 얼굴 인식의 성능이 개선될 수 있었던 것은, 딥러닝 기술을 통해 양질의 얼굴 데이터셋을 학습할 수 있게 되었기 때문이다. 얼굴 데이터셋의 대표적인 예로는 VGGFace2가 소개되었는데, 주목할 점은 서양인의 얼굴이 해당 데이터셋의 주를 이룬다는 점이다. 즉, 앞서 밝힌 AI의 얼굴 인식 성능은, ‘서양인’의 얼굴 인식에 기반한 성능이라고 볼 수 있는 것이다. 실제로 카카오가 해당 데이터셋을 바탕으로 한국인의 얼굴 인식을 실험해보니, AI의 얼굴 인식 성능이 56%로 급격히 하락하는 것을 발견했다. 구글(Google), 페이스북(Facebook) 등 AI 얼굴 인식 기술을 개발하고 있는 기업들 역시 인종과 무관하게 성능을 유지하기 위해 다양한 인종의 얼굴 영상을 확보하여 학습하고 있다. 



동양인의 얼굴 인식,  카카오가 선도한다. 

  

구글 등이 서양인의 얼굴 인식에 초점을 맞췄다면, 카카오는 동양인의 얼굴 인식 성능을 높이기 위해 노력하고 있는 것으로 보인다. 상대적으로 동양인의 얼굴 사진 데이터를 훨씬 더 방대하게 보유하고 있기 때문이다. 카카오가 경쟁 기업들에 비해 잘할 수 있는 것을 파악한 것이라 생각되었다.  카카오는 몇달 간의 노력 끝에 동양인 얼굴 데이터를 모을 수 있었고 이를 ‘카카오 데이터셋’이라고 명명했다. 이 카카오 데이터셋과 기존의 서양인 얼굴 데이터셋을 함께 학습하도록 한 후 실험을 진행한 결과, 한국인의 얼굴 인식 성능이 56%에서 99.7%로 대폭 상승했다. 놀라운 성능의 향상이다. 또한 서양인과 한국인의 얼굴을 모두 인식하도록 했을 때에도, 카카오 데이터셋을 함께 학습한 경우 기존보다 10.5% 성능이 향상되어 99.7%의 성능을 보였다. 이러한 실험 결과를 보았을 때 동양인, 한국인의 얼굴 인식에서는 카카오가 기술을 선도해 나가고 있다고 말할 수 있을 듯 하다.


카카오는 해당 기술들을 활용한 서비스들을 올해 안에 내어 놓을 계획이다. 연예인들의 사진 링크를 넣으면 해당 연예인의 이름을 알려주거나, ‘다음 라이브픽’ 등에서 특정 인물의 사진만을 선별하여 보여주는 기능 등을 포함하고 있다. 얼굴 인식 기술을 활용한 다양한 서비스들을 기대해 볼만하다. 



AI의 얼굴 인식은 ‘왜’ 필요한 것일까?


과연 AI의 얼굴 인식은 무엇을 위해 필요할 것일까? 콘퍼런스의 내용을 보며 간략히 생각해 본 기술의 필요성을 다음과 같이 정리해보았다. 


첫째, 얼굴 인식을 통해 개별화된 서비스 제공이 가능하기 때문이다. AI가 이용자의 얼굴을 파악하는 것이 가능해지면, 해당 이용자의 개별 특성에 맞는 기능을 제공할 수 있다는 것이다. 특정인의 목소리를 구분해 내는 기술*1과 더불어, 얼굴 인식이 개별화 서비스의 기반이 될 것이라 기대해 본다. 


둘째, 사회적 이익을 위해 얼굴 인식 기술을 활용할 수 있을 것이다. 예를 들어, 실종 아동, 실종자를 찾기 위해 얼굴 인식 기술을 사용한다면 기존보다 훨씬 더 빨리 소재를 파악할 수 있을 것이다.*2,3 다만, 이를 국가나 권력기관이 악용하여 개인을 통제하는 수단으로 사용할 가능성에 대해서는 민감하게 대처해야 할 것이다.*4


앞으로 카카오가 얼굴 인식 기술을 바탕으로, 다양한 사람들을 위한 서비스를 만들고 우리 삶을 바꾸어 나가기를 기대해 본다. 



본문에 삽입된 슬라이드 자료는 'if kakao 2018' 개발자 콘퍼런스 발표자료에서 인용하였습니다.
(출처: https://if.kakao.com




콘퍼런스 발표 | 신종주 isaac.shin@kakaocorp.com


글 | 김동현 dobedh@gmail.com

서울대학교에서 교육상담을 전공하였습니다. 사람에게 관심이 많아 학부에서는 심리학을, 대학원에서는 상담을 공부하였습니다. 만드는 것에 대한 열정과 사람에 대한 관심으로 세상에 기여하고자 합니다. 보다 성장하는 기획자가 되기 위해 노력하고 있습니다.





참고문헌

*1 참고 | https://www.technologyreview.com/s/537101/deep-learning-machine-solves-the-cocktail-party-problem/

*2 논문 | 이미희, 지한별, 이주연,  임어진 (2016). 얼굴 유사도 판별 기술을 이용한 미아 찾기. 한국컴퓨터정보학회 학술발표논문집24(2), 219-220.

*3 논문 | 강수영, 신동길, 송하연, 이태현, 홍성준, 김이슬, 정성욱, 임경식 (2017). 딥러닝 기반 CCTV 를 통한 실시간 실종자 얼굴 인식 시스템. 한국정보과학회 학술발표논문집, 1941-1943.

*4 참고 | https://news.joins.com/article/22556103



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari