이번 게임은 '무궁화 꽃이 피었습니다'입니다

술자리에서 아는척하기 좋은 디지털 이야기 - 영상인식

by 베어베어스
무궁화 꽃이 피었습니다

올해 하반기 K-콘텐츠의 대명사는 '오징어 게임'이라고 해도 과언이 아니다. 초반 오징어 게임의 분위기를 이끌고 몰입도를 극대화시킨 부분은 과거 어린이들의 놀이 중 하나였던 '무궁화 꽃이 피었습니다'이다.


실제 게임에서는 술래가 사람이지만, 드라마에서는 로봇 인형이 대체하는 형태로 게임이 진행된다. 인형의 눈에 있는 렌즈에서 형체를 인식하고 움직임을 확인하는데, 이러한 모션/사물 인식 등에 사용된 기술이 '영상 인식' 기술이다. 정말 드라마처럼 실제 영상 인식이 가능할지 이번 기회에 확인해보고 술자리에서 마음껏 아는 척해보자!


01. 영상 인식 기술이란 무엇일까?
- 영상은 이미지의 연속이기에 이미지 인식 기술들이 활용되며, 게임에서 쓰인 기술은 '이미지 영역 분할' 기술이다.

영상은 이미지의 연속이어서 영상 인식은 사실 이미지 인식 기술들이 많이 활용되고 있다. 이미지 인식 기술은 크게 3가지 분류되고 있다. 이 중 드라마에서 쓰인 기술은 세 번째인 이미지 영역 분할 기술이다.


1) 이미지를 특정 카테고리 중 하나로 분류하는 이미지 분류(Image Classification) 기술

2) 이미지 내에서 특정 객체가 어디 있는지 파악하는 객체 탐지(Object Detection) 기술

3) 좀 더 세밀하게 해당 객체의 이미지 경계까지 탐지하는 이미지 영역 분할(Image Segmentation) 기술


이러한 영상/이미지 인식 기술은 꽤 오래전부터 연구된 기술이지만 최신 기술 발전의 기반은 이미지넷(ImageNet)이 만들어 주었다. 이미지넷은 이미지 인식 학습을 위해 필요한 이미지들을 2007년부터 모았으며, 이러한 이미지들을 오픈소스로 공개하고 어떤 물체의 사진인지 맞히는 ILSVRC(ImageNet Large Scale Visual Recognition Challenge) 대회도 진행해왔다.


이러한 기반 덕분에 다양한 이미지 인식 연구가 진행되었고, 2012년 비약적인 발전을 이룬 기술이 나오게 된다. 바로 인간의 뇌 구조를 본뜬 인공 신경망 모델인 CNN(Convolutional Neural Network)을 사용해 심층 신경망(Deep Neural Network)을 구현한 '알렉스넷(Alexnet)'이다.


알렉스 넷은 전 대회보다 10%나 향상된 성능으로 대회를 우승하면서 전 세계에 딥러닝을 알렸고, 이 대회 이후 딥러닝에 GPU까지 활용하면서 이미지 인식 기술은 인간을 넘어서는 수준가지 올라오게 된다.


영상인식 종류.png 이미지 인식 기술의 3가지 종류
02. 영상인식은 그럼 어디에 쓰이고 있을까?
- 최근 우리가 많이 쓰는 얼굴 인식에서부터 자율주행까지 매우 다양하게 활용 중

우리 일상에서 가장 많이 쓰이고 익숙한 영상인식은 얼굴 인식이다. 스마트폰에서 쓰이는 인증 수단 중 하나인 안면 인식이 이러한 얼굴 인식의 대표적인 활용 예시라고 볼 수 있다. 이러한 영상 인식 기술은 꾸준히 발전 중인데, 최근 LG에서 개발한 얼굴 인식은 AI를 활용해 마스크, 안경 등을 쓰고 있더라도 문제없이 얼굴 인식이 가능할 정도로 기술 수준이 향상된 상태이다.


영상 인식 기술을 가장 잘 활용하는 분야 중 하나는 자율주행이다. 자동차 스스로 운전하기 위해서는 주위 환경을 인식하고 상황에 맞추어 운전해야 하는데, 이를 위한 가장 핵심 기능이 사물 인식이기 때문이다. 과거에는 고가의 특화된 센서에서 수집된 정보를 종학적으로 분석해야 명확한 사물 인식이 되었지만, 최근에는 카메라를 통해 인식한 이미지만으로도 딥러닝을 통해 사물을 정확히 인식하는 게 가능해지면서 적은 비용으로 연구 개발이 가능해진 상태이다.


이러한 영상 인식은 범죄자 체포 등에 활용되기도 했다. 2018년 4월, 중국에서 CCTV에 찍힌 얼굴 인식을 통해 수배 중인 범죄자를 체포하는 데 성공했는데, 이러한 범죄자 인식에 얼굴 인식 기술이 활용되었다. 하지만 이러한 소식이 알려지면서 공개된 CCTV에는 영상에 찍힌 모든 사물에 라벨이 붙어있어 범죄 예방을 넘어서 사생활 침해까지 침범하는 것은 아닌지 개인정보 문제가 불거지기도 했다.


nvdia.png 자율 주행을 위한 엔비디아의 영상 인식 기술 (출처: NVIDIA)
03. 영상인식은 앞으로 어떻게 확장될까?
- 실생활을 넘어 교육, 의료 심지어는 금융권까지도 기술이 확대될 예정

영상인식의 미래는 엔비디아의 주가가 말해주듯 매우 밝다고 볼 수 있다. 활용방안이 무궁무진하기 때문인데, 실생활에서 사용하는 수준을 넘어 의료계, 교육계, 심지어 금융권에서도 활용을 시도하고 있다.


MRI 등의 영상을 활용해 폐, 심장, 뇌 질환 등의 진단에 활용하기도 하고, 모르는 문제를 찍어 올리면 같은 문제를 찾아서 해설을 제공하기도 하며, 다양한 AI 기술과 결합해 은행 입구에서 손님을 응대하는 AI 은행원으로 활용하기도 한다.


미국에서는 은행에서 얼굴 인식을 통해 출입하는 고객을 인지하도록 해 보안을 강화하기도 할 정도로 각 분야에서 다양한 목적으로 얼굴 인식 기술을 활용하고 있다. 안면인식, 자율주행 정도로 인지되었던 영상인식이 앞으로 어떠한 분야에서 어떻게 활용이 더 가능할지 살펴보는 것도 재밌는 포인트가 될 수 있을 것이다.


PS21062400963.jpg KB국민은행에서 도입 예정인 AI은행원 (출처: 머니브레인)




참고자료

- Jason Brownlee, 2019. 06. 17, "A Gentle Introduction to Generative Adversarial Networks (GANs)"

- Krizhevsky Alex, Sutskever Ilya, Hinton Geoffrey E. 2017. 05. 24, "ImageNet classification with deep convolutional neural networks" (PDF). Communications of the ACM. 60 (6): 84–90. doi:10.1145/3065386. ISSN 0001-0782. S2CID 195908774.

- LG CNS, 2020. 02. 11, "마스크 써도 알아본다! LG CNS, AI 얼굴인식 출입 게이트 도입"

- LG경제연구원, 2017. 11. 22, "딥러닝 기반의 인공지능, 자율주행 기술 경쟁의 핵심을 바꾼다"

- 이데일리, 2021. 06. 24, "[단독]KB국민은행, ‘AI 은행원’ 내년부터 1000개 전 지점 도입한다"

- 중앙일보, 2018. 04. 21, "13억 얼굴 3초 내 인식…‘빅브라더’ 중국의 무서운 AI 기술"

- 한경비즈니스, 2020. 09. 23, "[AI 이야기]인간을 넘어선 이미지 인식 기술…객체 탐지에서 분류, 영역 분할까지 자유자재"

keyword
작가의 이전글Just Use It: 그냥 쓰기만 하면 돼