자율주행차, 불량 검출 등에 응용되는 가장 실용적인 컴퓨터 비전 기술
컴퓨터 비전(Computer Vision)은 컴퓨터를 이용해서 인간의 시각 기능을 모방하는 방법을 연구하는 분야를 지칭하는 용어입니다.
예를 들어, 자율주행차에서 지나가는 사람을 인식하는 기술이나, 사진에 적힌 글씨가 어떤 내용인지를 인식하는 OCR 기술등이 대표적인 컴퓨터 비전 기술의 예시입니다.
조금더 자세히 들어가면, 컴퓨터 비전의 대표적인 세부 연구 분야는 다음과 같습니다.
Image Classification (이미지 분류)는 컴퓨터 비전의 가장 기본적이고 간단한 연구 주제중 하나입니다. 컴퓨터가 이미지를 입력으로 받으면, 전체 이미지가 미리 정의된 레이블(예를 들어, 개, 고양이, 호랑이) 중에서 어떤 레이블(Label)에 속하는지를 분류하는 문제입니다.
Face Detection (얼굴 검출) 은 이미지 내에 얼굴이 있는 위치 영역의 좌표를 바운딩 박스(Bounding Box)를 통해 찾아내는 문제입니다. 즉, 이미지 내에 얼굴이 있을 경우, 얼굴이 있는 위치를 찾아내는 문제입니다.
Face Recognition (얼굴 인식) 은 이미지 내에 있는 얼굴이 누구인지 신원을 식별하는 문제입니다. 보통 Face Detection (얼굴 검출) 기술과 결합해서 먼저 이미지 내에 얼굴이 있는 위치를 찾고 Face Recognition (얼굴 인식) 기술을 이용해서 해당 위치에 있는 얼굴의 신원이 누구인지를 식별합니다.
이외에도 Text Detection, Text Recognition(OCR), Semantic Image Segmentation 등 다양한 컴퓨터 비전 문제영역이 존재합니다.
Object Detection (물체 검출) 은 이미지 내에 물체가 있는 위치의 좌표값을 바운딩 박스(Bounding box)로 찾고, 해당 위치 영역에 있는 물체가 미리 정의된 레이블(예를 들어, 사람, 자동차, 가로등) 중에 어떤 레이블(Label)에 속하는지를 분류하는 문제입니다.
즉, 이미지 내에 물체의 위치를 찾고, 그 물체가 무엇인지를 식별하는 문제입니다. Object Detection은 다양한 컴퓨터 비전 문제 영역 중에서 가장 실용적이고, 다양한 분야에 응용될 수 있는 문제영역 중 하나입니다.
Object Detection 기술의 대표적인 활용 사례는 다음과 같습니다.
Object Detection 기술을 활용하면 차량내 카메라를 탑재하고 카메라 입력으로 들어온 이미지들에 존재하는 사람, 차량, 신호등 등을 파악하고 이에 기반한 판단을 통해 자율 주행차(AutoPilot)를 구현할 수 있습니다.
Defect Detection (불량 검출)은 공장에서 공정 과정내에 불량이 있는지 판별하는 기술입니다. Object Detection 기술을 이용하면 사람이 판별하기 힘든 미세한 불량도 빠르고 자동화된 형태로 검출해서 공정과정을 효율화 할 수 있습니다.
Object Detection 기술을 이용하면 매장에서 결제를 진행해주는 캐셔를 대체하고, 소비자가 구매한 물건이 무엇이고 해당 물건이 얼마인지를 식별해서 자동으로 비용이 청구되도록하는 무인화된 매장(Self-Checkout)을 구현할 수 있습니다.
Amazon Go, Standard Cognition 등이 무인화된 매장을 위한 솔루션을 구현하고 있는 대표적인 기업들입니다.
Object Detection 기술을 이용하면 위성 영상 분석 (Satellite Image Analysis)을 통해 위성 영상으로 촬영된 이미지를 분석할 수 있습니다.
예를 들어, 주차장 내에 존재하는 차량의 대수를 분석해서 해당 매장의 고객수를 예상하고 해당 매장이 잘 운영되고 있는지를 파악할 수 있습니다.
Object Detection 기술을 이용해서 매장내 고객들을 분석하고, 매장을 방문한 고객들이 나이대별로 성별별로 어떤 물품을 많이 구매하는지, 어떤 경로로 이동하는지를 분석해서 매장내 상품들의 배치를 최적화 할 수 있습니다.
이처럼 Object Detection 기술은 다양한 분야에 실용적으로 활용될 수 있는 컴퓨터 비전 분야의 꽃과 같은 기술입니다.
구체적으로 Object Detection 기술을 구현하기 위해서 Faster R-CNN, YOLO(You Only Look Once), SSD(Single Shot MultiBox Detector), RetinaNet, CenterNet 등의 딥러닝 모델이 주로 활용됩니다.
[1] https://www.tesla.com/ko_KR/autopilot?redirect=no