[8주차 응용과학팀] 4. 인공지능과 컴퓨터 비전
작년부터 인공지능은 매우 핫한 주제로 많은 사람들의 관심을 받아왔습니다. 인공지능의 한 갈래 중에서 딥 러닝(Deep Learning)은 특히나 그 효용성과 효율성에 대해 중요시되고 있습니다. 딥 러닝의 가장 큰 장점은 분류를 통한 예측이라고 할 수 있습니다. 이때, 데이터가 많을수록 예측의 정확도는 올라갑니다.
딥 러닝은 머신 러닝의 한 갈래이며, 정확히는 “컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야(아서 사무엘 1959)”입니다. 딥 러닝을 이용하여 주도 학습, 비주도 학습 그리고 강화 학습을 할 수 있으며, 주어진 데이터와 목적에 맞게 알맞은 학습을 사용하면 원하는 아웃풋을 가질 수 있습니다.
의외로 딥 러닝이라는 분야가 생겨난 지는 생각보다 오래되었습니다. 1943년에 워렌 맥컬론이라는 미국 일리노이 의대 교수가 그의 학생들과 함께 ‘신경 활동에 내재한 개념들의 논리적 계산’이라는 논문을 통해 딥러닝의 핵심인 인공신경망을 개념화했습니다. 이후에 1980년대에 신경망 연구가 등장하였으며, 2004년에는 제프리 힌튼 교수가 과적합 등의 과거의 문제들을 해결한 새로운 딥러닝 학습 알고리즘을 들고 나오면서부터 딥러닝이 각광받기 시작했습니다. 최근에는 발전된 컴퓨터와 방대한 데이터들이 딥러닝에게 날개를 달아주고 있습니다.
앞서 다룬 디지털 신호 처리와 인공지능을 합치면 탄생하는 새로운 분야가 컴퓨터 비전(Computer Vision), 즉 기계의 시각에 해당되는 부분을 연구하는 분야입니다. 이는 인간의 눈과 뇌 대신 카메라 등의 시각매체와 컴퓨터를 통해 유용한 정보를 생성하는 기술이라고 볼 수 있습니다. 벌써부터 사물 인식, 모션 분석, 이미지 복구 등, 다양한 분야에서 컴퓨터 비전은 활약하고 있습니다.
컴퓨터 비전은 크게 3 부분으로 나눌 수 있는데, 데이터 습득, 데이터 처리 그리고 데이터 분석/이해로 나눌 수 있습니다. 먼저, 데이터 습득은 매우 간단합니다. 카메라 등의 시각매체를 통해 입력받은 영상이나 사진들을 인풋 값으로 설정해주는 게 전부입니다.
데이터 처리부터는 조금 복잡해지는데, 이때에는 다양한 알고리즘 등을 통해 입력받은 데이터들을 처리해줍니다. 목적과 상황에 따라 다르게 진행되지만 큰 틀은 비슷합니다. 일단 전처리(pre-processing)를 통해 노이즈 제거, 리샘플링, 스케일링들을 진행해줍니다. 이는 이후에 보다 편하게 다른 프로세스들을 진행하기 위해서입니다. 전처리가 끝난 후에는 feature extraction을 통해 line, edge, ridge 등을 강조하거나, 특정 포인트들을 강조합니다. 그리고 detection/segmentation을 통해 중요하다고 생각되는 이미지의 특정 포인트나 부분들을 골라냅니다. 그 후, high-level processing을 통해 이미지 식별이나 구별등, 확인 절차를 진행합니다.
마지막으로, 데이터 분석/이해에서는 decision making을 통해 결과물에 대한 판단을 내립니다. 이 부분에서는 특정한 목표나 목적을 만족하는 못하는지 등 을 구별해냅니다.
아래에 computer vision을 재미있게 경험해 볼 수 있는 사이트들입니다. 시간이 되신다면 들러 보세요! [코싸인 응용과학팀]
1. 그림을 사진으로, 흑백 사진을 컬러 사진으로
https://affinelayer.com/pixsrv/index.html
2. 사진을 원하는 화풍으로
http://www.ostagram.me/static_pages/lenta?locale=en
3. 감정 분석
https://azure.microsoft.com/en-us/services/cognitive-services/emotion/#detection
4. 영상 조작