스노우같은 셀카앱을 만들고 싶다면
오늘 다뤄볼 주제는 컴퓨터 비전이라는 기술입니다.
우리가 흔히 알고있는 스노우, 소다 등과 같은 셀카앱에서 얼굴을 인식, 추적하고 효과를 적용하는 것
또한 컴퓨터 비전 기술 중 하나입니다.
《 컴퓨터 비전이란? 》
➪ 컴퓨터에게 시각(vision) 데이터 처리 능력을 부여하는 기술
➪ 딥러닝을 통해 객체를 식별하고 분류하는 방법을 학습
➪ 사람 또는 사물을 감지하거나 인식하며 움직임까지 추적할 수 있음
즉, 컴퓨터가 시각 데이터에 대한 인지능력을 갖게 하는 것인데요.
가장 많이 다뤄지는 AI 기술 중 하나이며 다양한 분야에 활용이 되고 있습니다.
컴퓨터 비전 시장 규모는 2021년 159억 달러에서 2026년까지 513억 달러로, 연평균 26.3%의 복합성장률을 기록하며 성장할 전망이라고 합니다.
출처 : Google Developers
《컴퓨터 비전 종류》
그럼 컴퓨터 비전 기술 종류에 대해 알아보겠습니다.
◉ 객체 분류
➪이미지 속 객체를 인지, 그 클래스를 분류, 컴퓨터 비전 영역에서 가장 기초적인 응용 분야
◉ 객체 감지/위치 식별
➪이미지 또는 비디오 영상에서 객체를 식별하는 기술
◉ 객체 추적
➪객체의 위치 변화를 추적하는 기술로 포인트 추적, 커널추적, 실루엣 추적 등의 방법을 사용
◉ 객체 분할
➪객체를 따로 분할하여 의미있는 부분만 분석할 수 있게하는 기술
◉ 이미지 캡셔닝
➪이미지의 상황을 텍스트로 설명할 수 있는 기술
◉ 행동분류
➪비디오 영상 내의 객체의 행동을 인식하여 분류하는 기술
◉컨텐츠 기반 이미지 검색
➪연결된 메타데이터 태그가 아닌 이미지의 컨텐츠를 기반으로 대규모 데이터 저장소에서 이미지를 탐색
이러한 컴퓨터 비전의 다양한 기술로 여러가지 분야에 활용할 수 있는데요.
컴퓨터 비전의 활용 분야를 간략히 살펴보도록 하겠습니다.
《컴퓨터비전 활용분야》
• 머신비전(제조업) :
➪ 생산라인에 전용카메라를 설치, 완성된 부품의 이미지를 촬영하여 정상 제품 이미지와 비교하는 방식으로 결함을 실시간으로 확인, 재고관리 개선에 활용
• 리테일 분야
➪ 쇼핑객을 분석, 유통업체가 제품을 어디에 배치해야 하는지 파악, 재고를 보충할 시기를 결정
• 자율주행 자동차
➪ 객체를 감지, 입력받은 시각정보를 처리
➪ 다양한 센서를 활용해 필요한 정보를 융합하여 분석, 처리
• 의료서비스
➪ MRI, CAT 스캔, X-ray 등의 이미즈를 검사, 의사처럼 정확하게 이상징후를 감지
➪ 초음파 같은 3차원 이미지에 신경망을 사용, 심박 등 시각적 차이를 감지
• 보험
➪ 차량 파손 상태를 보다 일괄적이고 정확하게 측정
➪ 이 과정으로 사기를 줄이고 보상금 신청 프로세스 간소화
• 얼굴인식
➪ 스노우, 소다 유라이크 같은 셀카앱에서 얼굴인식, 추적 및 보정 필터
이처럼 다양한 산업에서 활용될 수 있는데요.
사실 이 컴퓨터비전 기술은 과거에 비하면 상당히 많이 발전하였지만 관련 데이터를 가공하고 다루는 일은
여전히 어려운 분야입니다.
하지만 디피니트는 이러한 컴퓨터 비전 기술을 활용한 데이터셋 수집,원천 기술을 개발하고 있습니다.
간단히 관련 사례를 소개해 드리겠습니다.
▪ 의뢰 업체 명: 알밤
▪ 서비스 : 잼재미 AR
▪ 과제: 아동용 재활 치료 게임에 사용할 실시간 손동작 인식 및 인식 결과 분류 프로그램 개발
▪ 기술 및 도구: Python, TensorFlow, Mediapipe, OpenCV
※ 의뢰사항
➪재활 치료 전문가가 치료를 위해 정의해둔 몇 가지 손동작이 존재
➪의뢰업체는 게임을 사용하는 아이들이 실시간으로 카메라 앞에서 이 동작 들을 수행했을 때 해당 동작이 정확한 동작인지 파악하고 성공/실패 여부를 자동으로 분류할 수 있는 프로그램 개발을 필요로 하여 디피니트에 프로젝트를 의뢰
※ Solution
➪ 카메라에서 실시간으로 입력되는 프레임 이미지를 분석하여 손의 키 포인트를 인식
➪ 인식된 키 포인트 좌표 값들의 시계열 분석을 통해 최종적으로 결과를 분류하도록 아래와 같이 workflow를 정의
※ webcam capture → hand detecting → hand keypoints landmark detect → landmarks windowing → time series analysis → neutral / correct / incorrect classification
➪ 분류 모델 학습 데이터를 수집하기 위해 실제 사람의 동작을 직접 촬영하는 것은 자원이 많이 소모
➪ 3D렌더링으로 손 동작 들을 동영상으로 생성하고 각 동작들의 hand keypoints들을 추출하여 학습 데이터 셋을 구축
AI MODEL UPGRADE
➪인식 모델의 성능을 테스트 하는 과정에서 손동작 데이터의 각도와 속도 등을 조절한 데이터를 추가
➪다양한 조건에서도 프로그램이 정상적으로 작동할 수 있도록 튜닝하고, 인식 정확도를 향상
얼굴인식의 경우 대표적인 컴퓨터비전 알고리즘인 Face Landmark Estimation 이 있습니다.
하지만 손동작을 인식하는 기술은 구현이 어려운 분야인데요
이처럼 디피니트는 여러가지 기술들을 활용해 다양한 핵심기술과 알고리즘을 직접 개발하고 있습니다.
디피니트와 함께 시장을 혁신해 게임 체인저가 될 기업들은 무료 컨설팅을 신청하세요!